Python函数式编程中itertools模块详解

作者:梦想橡皮擦 时间:2022-08-28 20:16:53 

容器与可迭代对象

在正式开始前先补充一些基本概念在 Python 中存在容器 与 可迭代对象

  • 容器:用来存储多个元素的数据结构,例如 列表,元组,字典,集合等内容;

  • 可迭代对象:实现了 __iter__ 方法的对象就叫做可迭代对象。

从可迭代对象中还衍生出 迭代器 与 生成器:

  • 迭代器:既实现了 __iter__,也实现了 __next__ 方法的对象叫做迭代器;

  • 生成器:具有 yield 关键字的函数都是生成器。

这样就比较清楚了,可迭代对象的范围要大于容器。而且可迭代对象只能使用一次,使用完毕再获取值就会提示 StopIteration 异常。

除此之外,可迭代对象还有一些限制:

  • 不能对可迭代对象使用 len 函数;

  • 可以使用 next 方法处理可迭代对象,容器也可以通过 iter 函数转换成迭代器;

  • for 语句会自动调用容器的 iter 函数,所以容器也能被循环迭代。

count() 函数

count 函数一般与 range 函数对比学习,例如 range 函数需要定义生成范围的下限,上限与步长可选,而 count 函数不同,指定下限与步长,上限值不用声明。

函数原型声明如下


count(start=0, step=1) --> count object

测试代码如下,其中必须添加跳出循环的判定条件,否则代码会一直运行下去。


from itertools import count
a = count(5, 10)
for i in a:
   print(i)
   if i > 100:
       break

除此之外,count 函数还接收非整数参数,所以下述代码中定义的也是正确的。


from itertools import count
a = count(0.5, 0.1)
for i in a:
   print(i)
   if i > 100:
       break

cycle 函数

用 cycle 函数可以循环一组值,测试代码如下所示:


from itertools import cycle
x = cycle('梦想橡皮擦abcdf')
for i in range(5):
   print(next(x), end=" ")
print("\n")
print("*" * 100)
for i in range(5):
   print(next(x), end=" ")

代码输出如下内容:

梦 想 橡 皮 擦

****************************************************************************************************
a b c d f

可以看到 cycle 函数与 for 循环非常类似。

repeat 函数

repeat 函数用于重复返回某个值,官方给出的函数描述如下所示:


class repeat(object):
   """
   repeat(object [,times]) -> create an iterator which returns the object
   for the specified number of times.  If not specified, returns the object
   endlessly.

进行一下简单的测试,看一下效果:


from itertools import repeat
x = repeat('橡皮擦')
for i in range(5):
   print(next(x), end=" ")
print("\n")
print("*" * 100)
for i in range(5):
   print(next(x), end=" ")

怎么看这个函数,都好像没有太大用处。

enumerate 函数,添加序号

这个函数在前面的文章中,已经进行过简单介绍,并且该函数在 __builtins__ 包中,所以不再过多说明,基本格式如下所示:


enumerate(sequence, [start=0])

其中 start 参数是下标起始位置。

accumulate 函数

该函数基于给定的函数返回一个可迭代对象,默认是累加效果,即第二个参数为 operator.add,测试代码如下:


from itertools import accumulate
data = [1, 2, 3, 4, 5]
# 计算累积和
print(list(accumulate(data)))  # [1, 3, 6, 10, 15]

针对上述代码,修改为累积。


from itertools import accumulate
import operator
data = [1, 2, 3, 4, 5]
# 计算累积
print(list(accumulate(data, operator.mul)))

除此之外,第二个参数还可以为 max,min 等函数,例如下述代码:


from itertools import accumulate
data = [1, 4, 3, 2, 5]
print(list(accumulate(data, max)))

代码输出如下内容,其实是将 data 里面的任意两个值进行了比较,然后留下最大的值。

[1, 4, 4, 4, 5]

chain 与 groupby 函数

chain 函数用于将多个迭代器组合为单个迭代器,而 groupby 可以将一个迭代器且分为多个子迭代器。

首先展示一下 groupby 函数的应用:


from itertools import groupby
a = list(groupby('橡橡皮皮擦擦'))
print(a)

输出内容如下所示:

[('橡', <itertools._grouper object at 0x0000000001DD9438>),
('皮', <itertools._grouper object at 0x0000000001DD9278>),
('擦', <itertools._grouper object at 0x00000000021FF710>)]

为了使用 groupby 函数,建议先对原列表进行排序,因为它是有点像切片一样,发现不同的就分出一个迭代器。

chain 函数的用法如下,将多个迭代对象进行拼接:


from itertools import groupby, chain
a = list(chain('ABC', 'AAA', range(1,3)))
print(a)

zip_longest 与 zip

zip 函数在之前的博客中已经进行过说明,zip_longest 与 zip 的区别就是,zip 返回的结果以最短的序列为准,而 zip_longest 以最长的为准。

测试代码如下,自行比对结果即可。


from itertools import zip_longest
a = list(zip('ABC', range(5), [10, 20, 30, 40]))
print(a)
a = list(zip_longest('ABC', range(5), [10, 20, 30, 40]))
print(a)

zip_logest 如果碰到长度不一致的序列,缺少部分会填充 None。

tee 函数

tee 函数可以克隆可迭代对象,产出多个生成器,每个生成器都可以产出输入的各个元素。


from itertools import tee
a = list(tee('橡皮擦'))
print(a)

compress 函数

该函数通过**谓词(是否,True/False)**来确定对某个元素的取舍问题,最简单的代码如下所示:


from itertools import compress
a = list(compress('橡皮擦', (0, 1, 1)))
print(a)

islice、dropwhile、takewhile、filterfalse、filter

这几个函数都是从输入的可迭代对象中获取一个子集,而且不修改元素本身。

本部分只罗列各个函数的原型声明,具体用法直接参考使用即可。


islice(iterable, stop) --> islice object
islice(iterable, start, stop[, step]) --> islice object
dropwhile(predicate, iterable) --> dropwhile object
takewhile(predicate, iterable) --> takewhile object
filterfalse(function or None, sequence) --> filterfalse object

其中只有 filterfalse 中的参数是函数在前,序列在后。

测试代码如下,尤其注意第一个参数是 callable 即函数。


from itertools import islice, dropwhile, takewhile, filterfalse
a = list(filterfalse(lambda x: x in ["皮", "擦"], '橡皮擦'))
print(a)

来源:https://blog.csdn.net/hihell/article/details/120181580

标签:Python,编程,itertools
0
投稿

猜你喜欢

  • django创建css文件夹的具体方法

    2021-08-29 06:04:08
  • SQL Server在AlwaysOn中使用内存表的“踩坑”记录

    2024-01-26 03:49:10
  • php fopen()函数案例详解

    2023-07-16 22:21:26
  • 10个超实用jQuery插件资源

    2009-07-17 18:54:00
  • windows 7安装ORACLE 10g客户端的方法分享

    2012-07-11 15:36:18
  • Python 操作SQLite数据库详情

    2024-01-18 04:45:55
  • Django ORM F对象和Q对象查询

    2023-10-23 15:33:04
  • python实现简单文件读写函数

    2023-08-29 04:37:24
  • 深入了解python的函数参数

    2023-07-24 08:19:01
  • 如何应对SQL Server数据库崩溃

    2008-11-24 17:25:00
  • 浅谈vue websocket nodeJS 进行实时通信踩到的坑

    2024-04-10 13:46:38
  • word-wrap同word-break的区别

    2007-10-24 20:08:00
  • Python纯代码通过神经网络实现线性回归的拟合方式

    2022-07-12 23:54:59
  • Python中flask框架跨域问题的解决方法

    2023-10-23 11:10:52
  • Python通用验证码识别OCR库ddddocr的安装使用教程

    2021-11-04 21:21:27
  • Python里的dict和set的背后小秘密

    2023-11-20 01:01:11
  • 经验丰富程序员才知道的8种高级Python技巧

    2022-12-27 03:05:57
  • python中enumerate的用法实例解析

    2023-03-10 19:11:18
  • python实现文件助手中查看微信撤回消息

    2023-09-03 07:23:50
  • Python动态配置管理Dynaconf的实现示例详解

    2021-01-24 19:35:06
  • asp之家 网络编程 m.aspxhome.com