Python使用scrapy采集时伪装成HTTP/1.1的方法

作者:pythoner 时间:2023-07-07 01:28:40 

本文实例讲述了Python使用scrapy采集时伪装成HTTP/1.1的方法。分享给大家供大家参考。具体如下:

添加下面的代码到 settings.py 文件

DOWNLOADER_HTTPCLIENTFACTORY = 'myproject.downloader.HTTPClientFactory'


保存以下代码到单独的.py文件

from scrapy.core.downloader.webclient import ScrapyHTTPClientFactory, ScrapyHTTPPageGetter
class PageGetter(ScrapyHTTPPageGetter):
    def sendCommand(self, command, path):
        self.transport.write('%s %s HTTP/1.1\r\n' % (command, path))
class HTTPClientFactory(ScrapyHTTPClientFactory):
     protocol = PageGetter

希望本文所述对大家的Python程序设计有所帮助。

标签:Python,scrapy,采集
0
投稿

猜你喜欢

  • 跟老齐学Python之有点简约的元组

    2022-04-11 10:21:43
  • Php多进程实现代码

    2023-10-11 09:23:14
  • Python使用微信SDK实现的微信支付功能示例

    2022-09-22 00:19:41
  • Python基础教程之if判断,while循环,循环嵌套

    2023-11-05 12:56:07
  • MySql多表查询 事务及DCL

    2024-01-29 04:55:28
  • mysql使用LOAD语句批量录入数据

    2010-03-18 16:19:00
  • 利用Python脚本实现传递参数的三种方式分享

    2023-07-11 03:45:44
  • Python使用scrapy采集数据时为每个请求随机分配user-agent的方法

    2023-02-08 15:20:31
  • jupyter notebook 重装教程

    2022-07-20 09:38:02
  • SQL Server 查询分析器快捷键集合

    2007-08-17 09:42:00
  • 如何用Python对数学函数进行求值、求偏导

    2023-10-13 04:58:01
  • Python Pandas 修改表格数据类型 DataFrame 列的顺序案例

    2023-02-27 17:47:37
  • SQLSERVER 2005的ROW_NUMBER、RANK、DENSE_RANK的用法

    2024-01-21 02:58:02
  • 通过python改变图片特定区域的颜色详解

    2021-09-17 11:01:22
  • python3连接mysql获取ansible动态inventory脚本

    2024-01-19 23:13:54
  • Mysql 忘记root密码和修改root密码的解决方法(小结)

    2024-01-20 09:01:22
  • 在Python中实现字典反转案例

    2022-12-17 02:05:46
  • 删除数据库中重复数据的几个方法

    2024-01-17 12:56:36
  • 手写Vue2.0 数据劫持的示例

    2024-05-22 10:43:17
  • SQL Server正则表达式 替换函数应用详解

    2024-01-28 06:01:16
  • asp之家 网络编程 m.aspxhome.com