Python协程实践分享

作者:林树楷 时间:2023-09-01 05:50:51 

协程

协程简单来说就是一个更加轻量级的线程,并且不由操作系统内核管理,完全由程序所控制(在用户态执行)。协程在子程序内部是可中断的,然后转而执行其他子程序,在适当的时候返回过来继续执行。

协程的优势?(协程拥有自己的寄存器上下文和栈,调度切换时,寄存器上下文和栈保存到其他地方,在切换回来的时候,恢复先前保存的寄存器上下文和栈,直接操作栈则基本没有内核切换的开销,可以不加锁的访问全局变量,所以上下文非常快。)

yield在协程中的用法

1、协程中的yield通常出现在表达式的右边:

x = yield data

如果yield的右边没有表达式,默认产出的值是None,现在右边有表达式,所以返回的是data这个值。
2、协程可以从调用法接受数据,调用通过send(x)方式将数据提供给协程,同时send方法中包含next方法,所以程序会继续执行。
3、协程可以
中断执行
,去执行另外的协程。

经典示例

代码:

def hello():
   data = "mima"
   while True:
       x = yield data  
       print(x)
a = hello()
next(a)
data = a.send("hello")
print(data)

代码详解:
程序开始执行,函数hello不会真的执行,而是返回一个生成器给a。
当调用到next()方法时,hello函数才开始真正执行,执行print方法,继续进入while循环;
程序遇到yield关键字,程序再次中断,此时执行到a.send(“hello”)时,程序会从yield关键字继续向下执行,然后又再次进入while循环,再次遇到yield关键字,程序再次中断;

协程在运行过程中的四个状态

  • GEN_CREATE:等待开始执行

  • GEN_RUNNING:解释器正在执行

  • GEN_SUSPENDED:在yield表达式处暂停

  • GEN_CLOSED:执行结束

生产者-消费者模式(协程)

import time
def consumer():
   r = ""
   while True:
       res = yield r
       if not res:
           print("Starting.....")
           return
       print("[CONSUMER] Consuming %s...." %res)
       time.sleep(1)
       r = "200 OK"
def produce(c):
   next(c)
   n = 0
   while n<6:
       n+=1
       print("[PRODUCER] Producing %s ...."%n)
       r = c.send(n)
       print("[CONSUMER] Consumer return: %s ...."%r)
   c.close()
c = consumer()
produce(c)

代码分析:

  • 调用next&copy;启动生成器;

  • 消费者一旦生产东西,通过c.send切换到消费者consumer执行;

  • consumer通过yield关键字获取到消息,在通过yield把结果执行;

  • 生产者拿到消费者处理过的结果,继续生成下一条消息;

  • 当跳出循环后,生产者不生产了,通过close关闭消费者,整个过程结束;

gevent第三方库协程支持

原理:gevent基于协程的Python网络库,当一个greenlet遇到IO操作(访问网络)自动切换到其他的greenlet等到IO操作完成后,在适当的时候切换回来继续执行。换而言之就是greenlet通过帮我们自动切换协程,保证有greenlet在运行,而不是一直等待IO操作。

经典代码

由于切换时在发生IO操作时自动完成,所以gevent需要修改Python内置库,这里可以打上猴子补丁(用来在运行时动态修改已有的代码,而不需要原有的代码)monkey.patch_all

#!/usr/bin/python2
# coding=utf8
from gevent import monkey
monkey.patch_all()
import gevent
import requests
def handle_html(url):
   print("Starting %s。。。。" % url)
   response = requests.get(url)
   code = response.status_code
   print("%s: %s" % (url, str(code)))
if __name__ == "__main__":
   urls = ["https://www.baidu.com", "https://www.douban.com", "https://www.qq.com"]
   jobs = [ gevent.spawn(handle_html, url) for url in urls ]
   gevent.joinall(jobs)

运行结果:

Python协程实践分享

结果:3个网络连接并发执行,但是结束的顺序不同。

asyncio内置库协程支持

原理:asyncio的编程模型就是一个消息循环,从asyncio模块中直接获取一个Eventloop(事件循环)的应用,然后把需要执行的协程放入EventLoop中执行,实现异步IO。

经典代码:

import asyncio
import threading
async def hello():
   print("hello, world: %s"%threading.currentThread())
   await asyncio.sleep(1) #
   print('hello, man %s'%threading.currentThread())

if __name__ == "__main__":
   loop = asyncio.get_event_loop()
   loop.run_until_complete(asyncio.wait([hello(), hello()]))
   loop.close()

代码解析:

  • 首先获取一个EventLoop

  • 然后将这个hello的协程放进EventLoop,运行EventLoop,它会运行知道future被完成

  • hello协程内部执行await asyncio.sleep(1)模拟耗时1秒的IO操作,在此期间,主线程并未等待,而是去执行EventLoop中的其他线程,实现并发执行。

代码结果:

Python协程实践分享

异步爬虫实例:

#!/usr/bin/python3
import aiohttp
import asyncio
async def fetch(url, session):
   print("starting: %s" % url)
   async with session.get(url) as response:
       print("%s : %s" % (url,response.status))
       return await response.read()
async def run():
   urls = ["https://www.baidu.com", "https://www.douban.com", "http://www.mi.com"]
   tasks = []
   async with aiohttp.ClientSession() as session:
       tasks = [asyncio.ensure_future(fetch(url, session)) for url in urls] # 创建任务
       response = await asyncio.gather(*tasks) # 并发执行任务

for body in response:
           print(len(response))
if __name__ == "__main__":
   loop = asyncio.get_event_loop()
   loop.run_until_complete(run())
   loop.close()

代码解析:

  • 创建一个事件循环,然后将任务放到时间循环中;

  • run()方法中主要是创建任务,并发执行任务,返回读取到的网页内容;

  • fetch()方法通过aiohttp发出指定的请求,以及返回 可等待对象;

Python协程实践分享

(结束输出网址和list中网址的顺序不同,证明协程中异步I/O操作)

关于aiohttp

asyncio实现类TCP、UDP、SSL等协议,aiohttp则是基于asyncio实现的HTTP框架,由此可以用来编写一个微型的HTTP服务器。

代码:

from aiohttp import web
async def index(request):
   await asyncio.sleep(0.5)
   print(request.path)
   return web.Response(body=' Hello, World')
async def hello(request):
   await asyncio.sleep(0.5)
   text = 'hello, %s'%request.match_info['name']
   print(request.path)
   return web.Response(body=text.encode('utf-8'))

async def init(loop):
   app = web.Application(loop=loop)
   app.router.add_route("GET", "/" , index)
   app.router.add_route("GET","/hello/{name}", hello)
   srv = await loop.create_server(app.make_handler(), '127.0.0.1', 8000)
   print("Server started at http://127.0.0.0.1:8000....")
   return srv

if __name__ == "__main__":
   loop = asyncio.get_event_loop()
   loop.run_until_complete(init(loop))
   loop.run_forever()

代码解析:

  • 创建一个事件循环,传入到init协程中;

  • 创建Application实例,然后添加路由处理指定的请求;

  • 通过loop创建TCP服务,最后启动事件循环;

来源:https://blog.51cto.com/mbb97/2493661

标签:Python,协程
0
投稿

猜你喜欢

  • Python Django路径配置实现过程解析

    2023-11-13 20:50:02
  • Python 任务自动化工具nox 的配置与 API详情

    2022-05-02 20:57:30
  • python爬虫headers设置后无效的解决方法

    2021-09-04 00:55:17
  • Python使用内置函数setattr设置对象的属性值

    2021-10-09 20:32:44
  • mysql对binlog的处理说明

    2024-01-14 18:34:49
  • css清除浮动“clear:both;”的应用

    2008-03-17 12:54:00
  • .Net行为型设计模式之访问者模式(Visitor)

    2024-05-13 09:18:14
  • python3 logging日志封装实例

    2022-05-23 08:27:52
  • 在VSCode中配置PHP开发环境的实战步骤

    2023-06-06 02:13:06
  • Python CNN卷积神经网络实战教程深入讲解

    2023-09-28 19:51:12
  • Python利用前序和中序遍历结果重建二叉树的方法

    2023-03-01 14:56:35
  • pandas数据处理清洗实现中文地址拆分案例

    2023-09-22 11:16:55
  • ASP中如何判断一个字符是不是汉字

    2008-05-04 12:47:00
  • 一个轻量级的XHTML右键菜单[支持IE和firefox]

    2024-04-19 10:58:32
  • Bootstrap table的使用方法

    2023-09-10 13:34:47
  • python使用nibabel和sitk读取保存nii.gz文件实例

    2021-03-11 16:12:53
  • div + ajax + 分页函数

    2009-10-18 11:28:00
  • tensorflow常用函数API介绍

    2022-10-18 17:49:54
  • pytorch下的unsqueeze和squeeze的用法说明

    2023-07-16 14:01:41
  • SQL Server DBA维护常用语句

    2024-01-22 01:47:00
  • asp之家 网络编程 m.aspxhome.com