Golang多线程排序实现快速高效地处理大规模数据

作者:Luyoungs 时间:2024-04-27 15:32:29 

前言

本案例实现一个多线程排序算法,能够对给定的整数数组进行排序,使用 goroutines 对其进行并发化优化。

随机数生成器

func randProduce(randNums chan []int, wg *sync.WaitGroup) {
for i := 0; i < 100; i++ {
go rand1(randNums, wg)
}
}
func rand1(randNums chan []int, wg *sync.WaitGroup) {
r := rand.New(rand.NewSource(time.Now().Unix()))
int1000 := make([]int, 1000000)
for i := 0; i < 1000000; i++ {
int1000[i] = r.Intn(1000000)
}
randNums <- int1000
wg.Done()
}

使用goroutines并发地对各个子数组进行排序

func sort0(randNums chan []int, sortNums chan []int, wg *sync.WaitGroup) {
for i := 0; i < 100; i++ {
go sort2(randNums, sortNums, wg)
}
}
func sort2(randNums chan []int, sortNums chan []int, wg *sync.WaitGroup) {
int1000_Old := <-randNums
sort.Ints(int1000_Old)
sortNums <- int1000_Old
wg.Done()
}

合并已排序的子数组得到最终排序结果

func mergeAll(sortNums chan []int, wg *sync.WaitGroup) []int {
defer wg.Done()
temp2 := <-sortNums
var temp1 []int
for i := 1; i <= 99; i++ {
temp1 = make([]int, 1000000*i+1000000)
copy(temp1, temp2)
temp1 = merge(temp1, 1000000*i+1000000, <-sortNums, 1000000)
temp2 = make([]int, 1000000*i+1000000)
copy(temp2, temp1)
}
return temp2
}
func merge(nums1 []int, m int, nums2 []int, n int) []int {
temp := make([]int, m)
copy(temp, nums1)
t, j := 0, 0 //t为temp的索引,j为nums2的索引
for i := 0; i < len(nums1); i++ {
if t >= len(temp) {
nums1[i] = nums2[j]
j++
continue
}
if j >= n {
nums1[i] = temp[t]
t++
continue
}
if nums2[j] <= temp[t] {
nums1[i] = nums2[j]
j++
} else {
nums1[i] = temp[t]
t++
}
}
return nums1
}

main 函数控制流程

func main() {
fmt.Println("开始运行!")
start := time.Now() // 获取当前时间
wg := sync.WaitGroup{}
wg.Add(201)
randNums := make(chan []int, 100)
sortNUms := make(chan []int, 100)
go randProduce(randNums, &wg)
go sort0(randNums, sortNUms, &wg)
go mergeAll(sortNUms, &wg)
wg.Wait()
// fmt.Println(l)
elapsed := time.Since(start)
fmt.Println("该函数执行完成耗时:", elapsed)
}

思路

本案例采用了两个 channel,分别存储产生的的随机数slice和排好顺序的 slice,每一个 slice大小为 100 万,一共一百个 slice,也就是一亿个数据。

randNums := make(chan []int, 100)
sortNUms := make(chan []int, 100)

程序一边产生随机数,一边将产生的随机数randNums发送到 sort 函数进行排序,排好顺序后将数据发送到sortNUms。这两个流程可以并行计算,因此:

go randProduce(randNums, &wg)
go sort0(randNums, sortNUms, &wg)

合并也可以参与到并行计算之中,多加一个信号量就好:

go mergeAll(sortNUms, &wg)

运行结果:

(base) luliang@shenjian Sort % go build SortRoutine.go

(base) luliang@shenjian Sort % ./SortRoutine

开始运行!

该函数执行完成耗时: 50.317081625s

性能比较

可以写一个单线程的排序,但是数据产生还是多线程的:

package main
import (
"fmt"
"math/rand"
"sort"
"time"
)
func main() {
fmt.Println("开始运行!")
start := time.Now() // 获取当前时间
randNums := make(chan int, 10000)
go randProduce1(randNums)
randNums1 := make([]int, 100000000)
for i := 0; i < 100000000; i++ {
randNums1[i] = <-randNums
}
sort.Ints(randNums1)
elapsed := time.Since(start)
fmt.Println("该函数执行完成耗时:", elapsed)
}
func randProduce1(randNums chan int) {
for i := 0; i < 10000; i++ {
go rand2(randNums)
}
}
func rand2(randNums chan int) {
r := rand.New(rand.NewSource(time.Now().Unix()))
for i := 0; i < 10000; i++ {
randNums <- r.Intn(10000000)
}
}

运行结果为:

(base) luliang@shenjian Sort % go build SortRoutine1.go

(base) luliang@shenjian Sort % ./SortRoutine1

开始运行!

该函数执行完成耗时: 54.869565792s

可以看到两种方法消耗的时间差不多,这是因为数据量还是太小,多线程生成数据、排序、以及合并开辟了大量的协程,这个会消耗一定的时间。

来源:https://blog.csdn.net/m0_73651896/article/details/130556556

标签:Golang,Go,多线程,排序
0
投稿

猜你喜欢

  • mysql主从库不同步问题解决方法

    2024-01-26 03:57:19
  • 用Python将IP地址在整型和字符串之间轻松转换

    2021-03-31 16:37:16
  • Pytorch中使用ImageFolder读取数据集时忽略特定文件

    2021-08-09 01:18:24
  • python中opencv图像叠加、图像融合、按位操作的具体实现

    2023-11-11 21:39:21
  • 纯JS单页面赛车游戏制作代码分享

    2024-02-23 14:10:17
  • 如何在小空间放置大图片

    2009-08-04 13:04:00
  • 从零开始学YII2框架(五)快速生成代码工具 Gii 的使用

    2024-05-11 09:54:56
  • python实现计算器功能

    2021-02-06 09:45:23
  • Golang如何交叉编译各个平台的二进制文件详解

    2024-05-22 17:48:47
  • 使用Postman测试需要授权的接口问题

    2022-10-18 15:14:23
  • SWFObject2.0: 基于Javascript的Flash媒体版本检测与嵌入模块

    2009-08-19 13:24:00
  • Python中类型检查的详细介绍

    2022-08-18 16:51:47
  • 一文带你熟悉Go语言中的分支结构

    2024-03-07 19:52:49
  • XMLHTTP 使用代理获取数据asp代码

    2010-03-22 14:40:00
  • Python遍历zip文件输出名称时出现乱码问题的解决方法

    2022-04-04 15:40:20
  • Pyqt5 实现窗口缩放,控件在窗口内自动伸缩的操作

    2022-10-16 06:32:09
  • Python自动化测试中yaml文件读取操作

    2021-11-19 11:55:43
  • mysql 8.0.15 winx64解压版安装配置方法图文教程

    2024-01-26 07:11:18
  • Go http client 连接池不复用的问题

    2024-02-03 05:17:15
  • python模型集成知识点总结

    2023-08-03 00:16:16
  • asp之家 网络编程 m.aspxhome.com