Python使用scrapy采集时伪装成HTTP/1.1的方法
作者:pythoner 时间:2023-07-07 01:28:40
本文实例讲述了Python使用scrapy采集时伪装成HTTP/1.1的方法。分享给大家供大家参考。具体如下:
添加下面的代码到 settings.py 文件
DOWNLOADER_HTTPCLIENTFACTORY = 'myproject.downloader.HTTPClientFactory'
保存以下代码到单独的.py文件
from scrapy.core.downloader.webclient import ScrapyHTTPClientFactory, ScrapyHTTPPageGetter
class PageGetter(ScrapyHTTPPageGetter):
def sendCommand(self, command, path):
self.transport.write('%s %s HTTP/1.1\r\n' % (command, path))
class HTTPClientFactory(ScrapyHTTPClientFactory):
protocol = PageGetter
希望本文所述对大家的Python程序设计有所帮助。
标签:Python,scrapy,采集
0
投稿
猜你喜欢
跟老齐学Python之有点简约的元组
2022-04-11 10:21:43
Php多进程实现代码
2023-10-11 09:23:14
Python使用微信SDK实现的微信支付功能示例
2022-09-22 00:19:41
Python基础教程之if判断,while循环,循环嵌套
2023-11-05 12:56:07
MySql多表查询 事务及DCL
2024-01-29 04:55:28
mysql使用LOAD语句批量录入数据
2010-03-18 16:19:00
利用Python脚本实现传递参数的三种方式分享
2023-07-11 03:45:44
Python使用scrapy采集数据时为每个请求随机分配user-agent的方法
2023-02-08 15:20:31
jupyter notebook 重装教程
2022-07-20 09:38:02
SQL Server 查询分析器快捷键集合
2007-08-17 09:42:00
如何用Python对数学函数进行求值、求偏导
2023-10-13 04:58:01
Python Pandas 修改表格数据类型 DataFrame 列的顺序案例
2023-02-27 17:47:37
SQLSERVER 2005的ROW_NUMBER、RANK、DENSE_RANK的用法
2024-01-21 02:58:02
通过python改变图片特定区域的颜色详解
2021-09-17 11:01:22
python3连接mysql获取ansible动态inventory脚本
2024-01-19 23:13:54
Mysql 忘记root密码和修改root密码的解决方法(小结)
2024-01-20 09:01:22
在Python中实现字典反转案例
2022-12-17 02:05:46
删除数据库中重复数据的几个方法
2024-01-17 12:56:36
手写Vue2.0 数据劫持的示例
2024-05-22 10:43:17
SQL Server正则表达式 替换函数应用详解
2024-01-28 06:01:16