Python使用多进程运行含有任意个参数的函数

作者:Jayce~ 时间:2023-10-14 23:22:12 

1. 问题引出

许多时候,我们对程序的速度都是有要求的,速度自然是越快越好。对于Python的话,一般都是使用multiprocessing这个库来实现程序的多进程化,例如:

我们有一个函数my_print,它的作用是打印我们的输入:

def my_print(x):
print(x)

但是我们嫌它的速度太慢了,因此我们要将这个程序多进程化:


from multiprocessing import Pool

def my_print(x):
 print(x)

if __name__ == "__main__":
 x = [1, 2, 3, 4, 5]
 pool = Pool()
 pool.map(my_print, x)
 pool.close()
 pool.join()

很好,现在速度与之前的单进程相比提升非常的快,但是问题来了,如果我们的参数不只有一个x,而是有多个,这样能行吗?比如现在my_print新增一个参数y:

def my_print(x, y):
print(x + y)

查看pool.map的函数说明:


def map(self, func, iterable, chunksize=None):
 '''
 Apply `func` to each element in `iterable`, collecting the results
 in a list that is returned.
 '''
 return self._map_async(func, iterable, mapstar, chunksize).get()

发现函数的参数是作为iter传进去的,但是我们现在有两个参数,自然想到使用zip将参数进行打包:


if __name__ == "__main__":
 x = [1, 2, 3, 4, 5]
 y = [1, 1, 1, 1, 1]
 zip_args = list(zip(x, y))
 pool = Pool()
 pool.map(my_print, zip_args)
 pool.close()
 pool.join()

可是执行后却发现,y参数并没有被传进去:

Python使用多进程运行含有任意个参数的函数

那么如何传入多个参数呢?这也就是本文的重点,接着往下看吧。

2. 解决方案

2.1 使用偏函数(partial)

偏函数有点像数学中的偏导数,可以让我们只关注其中的某一个变量而不考虑其他变量的影响。上面的例子中,Y始终等于1,那么我们在传入参数的时候,只需要考虑X的变化即可。

例如你有一个函数,该函数有两个参数a,b,a是不同路径的下的图片的路径,b是输出的路径。很明显,a是一直在变化的,但是因为我们要将所有图片保存在同一个文件夹下,那么b很可能一直都没变。

具体如下:


if __name__ == '__main__':# 多线程,多参数,partial版本
 x = [1, 2, 3, 4, 5]
 y = 1

partial_func = partial(my_print, y=y)
 pool = Pool()
 pool.map(partial_func, x)
 pool.close()
 pool.join()

2.2 使用可变参数

在Python函数中,函数可以定义可变参数。顾名思义,可变参数就是传入的参数个数是可变的,可以是1个、2个到任意个,这就直接给我们提供了一种思路。具体如下:


def multi_wrapper(args):
 return my_print(*args)

def my_print(x, y):
 print(x + y)
if __name__ == "__main__": # 多线程,多参数,可变参数版本
 x = [1, 2, 3, 4, 5]
 y = [1, 1, 1, 1, 1]
 zip_args = list(zip(x, y))

pool = Pool()
 pool.map(multi_wrapper, zip_args)
 pool.close()
 pool.join()

2.3 使用pathos提供的多进程库


from pathos.multiprocessing import ProcessingPool as newPool

if __name__ == '__main__':# 多线程,多参数,pathos版本
 x = [1, 2, 3, 4, 5]
 y = [1, 1, 1, 1, 1]

pool = newPool()
 pool.map(my_print, x, y)
 pool.close()
 pool.join()

在该库的map函数下,可以看到,它允许多参数输入,其实也就是使用了可变参数:


def map(self, f, *args, **kwds):
 AbstractWorkerPool._AbstractWorkerPool__map(self, f, *args, **kwds)
 _pool = self._serve()
 return _pool.map(star(f), zip(*args)) # chunksize

2.4 使用starmap函数


if __name__ == '__main__': # 多线程,多参数,starmap版本
 x = [1, 2, 3, 4, 5]
 y = [1, 1, 1, 1, 1]

zip_args = list(zip(x, y))
 pool = Pool()
 pool.starmap(my_print, zip_args)
 pool.close()
 pool.join()

3. 总结

其实在以上4种实现方法中 ,第1种方法的限制较多,如果该函数的其它参数都在变化的话,那么它就不能很好地工作,而剩下的方法从体验上来讲是依次递增的,它们都可以接受任意多参数的输入,但是第2种需要额外写一个函数,扣分;第3种方法需要额外安装pathos包,扣分;而最后一种方法不需要任何额外不择就可以完成,所以,推荐大家选择第4种方法!

来源:https://blog.csdn.net/qq_15969343/article/details/84672527

标签:Python,多进程,参数,函数
0
投稿

猜你喜欢

  • Golang中优秀的消息队列NSQ基础安装及使用详解

    2024-05-22 10:17:22
  • js 混淆加密工具代码

    2007-09-22 18:10:00
  • 利用Python Matlab绘制曲线图的简单实例

    2021-05-16 07:21:38
  • Python中支持向量机SVM的使用方法详解

    2021-02-08 00:41:01
  • Javascript实现购物车功能的详细代码

    2024-05-22 10:32:27
  • ASP技巧:Script块不能放在另一个Script 块内

    2009-08-19 17:17:00
  • Mac下PyCharm快捷键分享

    2023-05-31 07:54:38
  • python+PyQT实现系统桌面时钟

    2023-07-21 07:46:33
  • 讲解SQL Server数据库触发器的安全隐患

    2009-02-24 17:46:00
  • Flask框架学习笔记之消息提示与异常处理操作详解

    2021-05-17 15:03:02
  • python原类、类的创建过程与方法详解

    2023-01-26 06:59:27
  • 动态加载JS文件的三种方法

    2024-05-21 10:14:28
  • PHP数据库表操作的封装类及用法实例详解

    2023-11-12 07:41:23
  • OpenCV图像缩放之cv.resize()函数详解

    2021-02-06 12:36:58
  • 显示某日期所在星期的所有日期asp代码

    2008-06-01 16:05:00
  • 查看连接mysql的IP地址的实例方法

    2024-01-27 14:33:49
  • Python安装与卸载流程详细步骤(图解)

    2023-10-05 19:36:21
  • Python Django的安装配置教程图文详解

    2023-06-29 08:17:12
  • 统计热门文章的算法

    2008-03-16 15:40:00
  • vue 项目@change多个参数传值多个事件的操作

    2024-06-07 16:01:08
  • asp之家 网络编程 m.aspxhome.com