使用基于Python的Tornado框架的HTTP客户端的教程

作者:C Wong 时间:2023-05-15 06:50:43 

由于tornado内置的AsyncHTTPClient功能过于单一, 所以自己写了一个基于Tornado的HTTP客户端库, 鉴于自己多处使用了这个库, 所以从项目中提取出来, 写成一个单独库 tornadohttpclient

TornadoHTTPClient 是一个基于Tornado的高效的异步HTTP客户端库, 支持Cookie和代理, 目前仅在Python2.7平台上测试过, 不支持Python3

听取了仙子君的意见, 直接对tornado.curl_httpclient.CurlAsyncHTTPClient进行封装
安装

首先从git clone 下代码


git clone https://github.com/coldnight/tornadohttpclient.git

然后安装它


cd tornadohttpclient
python setup.py install

教程
GET

TornadoHTTPClient的get方法可以发起一个get请求


from tornadohttpclient import TornadoHTTPClient

# 实例化
http = TornadoHTTPClient()

# 发出get请求
http.get("http://www.linuxzen.com")

# 开始主事件循环
http.start()

POST

TornadoHTTPClient的post方法可以发起一个post请求
读取响应

上面仅仅发出了请求, 但是我们无法读取GET请求回来的数据, 我们可以使用一个回调来读取响应


from tornadohttpclient import TornadoHTTPClient

http = TornadoHTTPClient()

def callback(response):
 print response.body
 http.stop()

http.get("http://www.linuxzen.com", callback = callback)
http.start()

通过callback关键字参数我们可以传进一个回调函数, 当请求成功时会调用此函数, 并给此函数传递一个与urllib2.urlopen返回一样的reponse实例
上传文件

upload方法可以上传文件, 其接受一个url和文件的field和文件路径, 还有其他post参数


from tornadohttpclient import TornadoHTTPClient

http = TornadoHTTPClient()
def callback(response):
 print("打开图片链接", end = " ")
 print(response.effective_url)
 http.stop()

http.upload("http://paste.linuxzen.com", "img", "img_test.png",
         callback = callback)
http.start()

给callback传递参数

有时候callback可能需要访问局部变量, 可以通过 args和kwargs关键字参数, 将callback的参数传递给get/post方法, args参数将会在response参数之后被传递, args参数类型应当是一个元组, kwargs参数类型应当是一个字典


from tornadohttpclient import TornadoHTTPClient

http = TornadoHTTPClient()

def callback(response, times):
 print response.body
 print times

if times == 9:
   http.stop()

for i in range(10):
 http.get("http://www.linuxzen.com", callback = callback, args = (i, ))

http.start()

发送延迟请求

有时我们需要延迟几秒也发送请求或每隔几秒就发送一个请求, get/post方法的delay关键字参数可以解决, delay参数接受一个单位为秒的数字, 并延迟delay秒后发起请求


from tornadohttpclient import TornadoHTTPClient

http = TornadoHTTPClient()

def callback(response, times):
 print response.body
 if times < 9:
   # 延迟10秒发送此请求
   http.get("http://www.linuxzen.com", callback = callback, args = (times + 1, ), delay = 10)
 else:
   http.stop()

http.get("http://www.linuxzen.com", callback = callback, args = (1, ))
http.start()

给请求传递参数

TornadoHTTPClient 的 get/post方法的第二个参数params可以定义请求时传递的参数params的类型为字典或者((key, value), )类型的元组或列表,例如使用百度搜索TornadoHTTPClient


from tornadohttpclient import TornadoHTTPClient

http = TornadoHTTPClient()

def callback(response):
 print response.body
 http.stop()

http.get("http://www.baidu.com/s", (("wd", "tornado"),), callback = callback)
http.start()

以上也使用与POST方法, 比如登录网站


from tornadohttpclient import TornadoHTTPClient

http = TornadoHTTPClient()

def callback(response):
 print response.body
 http.stop()

http.post("http://ip.or.domain/login", (("username", "cold"), ("password", "pwd")), callback = callback)

http.start()

指定HTTP头

TornadoHTTPClient 的get/post方法的 headers关键字参数可以自定额外的HTTP头信息, 参数类型为一个字典

指定User-Agent头


from tornadohttpclient import TornadoHTTPClient

http = TornadoHTTPClient()

def callback(response):
 print response.body
 http.stop()

headers = dict((("User-Agent",
       "Mozilla/5.0 (X11; Linux x86_64)"\
       " AppleWebKit/537.11 (KHTML, like Gecko)"\
       " Chrome/23.0.1271.97 Safari/537.11"), ))

http.get("http://www.linuxzen.com", headers=headers, callback = callback)

使用代理

TornadoHTTPClient 的set_proxy方法可以设置代理, 其接受两个参数, 分别是代理的 主机名/ip 代理的端口, unset_proxy可以取消代理


from tornadohttpclient import TornadoHTTPClient

http = TornadoHTTPClient()

def callback(response):
 print response.body
 http.unset_proxy()
 http.stop()

http.set_proxy("127.0.0.1", 8087)
http.get("http://shell.appspot.com", callback = callback)
http.start()

Cookie

TornadoHTTPClient会自动记录和装载Cookie, 可以通过 TornadoHTTPClient实例属性 cookie 获取Cookie

标签:Python
0
投稿

猜你喜欢

  • python通过apply使用元祖和列表调用函数实例

    2021-02-18 03:18:32
  • golang接收post和get请求参数处理

    2024-04-25 15:26:54
  • python time模块时间戳 与 结构化时间详解

    2021-04-09 11:06:42
  • mysql误删root用户恢复方法

    2024-01-22 01:44:18
  • 用asp给网站添加rss聚合功能

    2007-11-05 19:08:00
  • Google中国新首页风格再度变脸

    2008-10-27 13:37:00
  • Python-numpy实现灰度图像的分块和合并方式

    2021-06-14 16:24:27
  • AJAX使用get与post模式的区别分析

    2024-04-29 13:58:39
  • 详解基于python的全局与局部序列比对的实现(DNA)

    2021-03-29 13:23:31
  • vite+vue3中使用mock模拟数据问题

    2024-04-28 09:27:56
  • Pygame Draw绘图函数的具体使用

    2021-05-24 12:14:49
  • Django数据库迁移报错InconsistentMigrationHistory

    2024-01-18 16:32:26
  • Christopher Schmitt 谈学习CSS的益处

    2008-07-13 14:15:00
  • FrontPage2003 中网页布局功能的应用

    2007-11-18 14:43:00
  • python_opencv用线段画封闭矩形的实例

    2022-05-04 19:07:59
  • Python区块链Creating Miners教程

    2021-03-25 11:39:27
  • Python数据结构树与算法分析

    2023-10-10 19:30:18
  • python opencv把一张图片嵌入(叠加)到另一张图片上的实现代码

    2021-08-11 12:52:30
  • 下拉列表两级连动的新方法(一)

    2009-06-04 18:18:00
  • 基于pytorch 预训练的词向量用法详解

    2021-04-04 21:35:37
  • asp之家 网络编程 m.aspxhome.com