Python数据抓取爬虫代理防封IP方法

作者:ygjgdcmyzyq 时间:2022-12-18 18:32:32 

爬虫:一段自动抓取互联网信息的程序,从互联网上抓取对于我们有价值的信息,一般来说,Python爬虫程序很多时候都要使用(飞猪IP)代理的IP地址来爬取程序,但是默认的urlopen是无法使用代理的IP的,我就来分享一下Python爬虫怎样使用 * 的经验。(推荐飞猪 * 注册可免费使用,浏览器搜索可找到)

Python数据抓取爬虫代理防封IP方法

1、划重点,小编我用的是Python3哦,所以要导入urllib的request,然后我们调用ProxyHandler,它可以接收 * 的参数。代理可以根据自己需要选择,当然免费的也是有的,但是可用率可想而知的。(飞猪IP)

Python数据抓取爬虫代理防封IP方法

2、接着把IP地址以字典的形式放入其中,这个IP地址是我乱写的,只是用来举例。设置键为http,当然有些是https的,然后后面就是IP地址以及端口号(9000),具体看你的IP地址是什么类型的,不同IP端口号可能不同根据你在飞猪提取的端口为准。

Python数据抓取爬虫代理防封IP方法

3、接着再用build_opener()来构建一个opener对象。

Python数据抓取爬虫代理防封IP方法

4、然后调用构建好的opener对象里面的open方法来发生请求。实际上urlopen也是类似这样使用内部定义好的opener.open(),这里就相当于我们自己重写。

Python数据抓取爬虫代理防封IP方法

5、当然了,如果我们使用install_opener(),就可以把之前自定义的opener设置成全局的。

Python数据抓取爬虫代理防封IP方法

6、设置成全局之后,如果我们再使用urlopen来发送请求,那么发送请求使用的IP地址就是 * ,而不是本机的IP地址了。

Python数据抓取爬虫代理防封IP方法

7、最后再来说说使用代理遇到的错误,提示目标计算机积极拒绝,这就说明可能是 * 无效,或者端口号错误,这就需要使用有效的IP才行哦。(这边现在是乱填写的IP地址)可选择飞猪的 * 。

Python数据抓取爬虫代理防封IP方法

总结:以上就是本次关于Python数据抓取爬虫代理防封IP方法,感谢大家的阅读和对脚本之家的支持。

来源:https://jingyan.baidu.com/article/49711c61b54ac9fa441b7c9c.html

标签:Python,爬虫,IP
0
投稿

猜你喜欢

  • 基于python 二维数组及画图的实例详解

    2021-12-13 08:27:46
  • vue实现自定义"模态弹窗"组件实例代码

    2024-04-30 10:26:05
  • python学习数据结构实例代码

    2023-09-20 22:56:32
  • Vue如何引入远程JS文件

    2023-07-02 16:34:13
  • VuePress使用Algolia实现全文搜索

    2024-04-28 09:29:56
  • 分享5个python提速技巧,速度瞬间提上来了

    2023-11-04 13:04:06
  • python 多线程死锁问题的解决方案

    2023-12-28 03:35:31
  • Python对HTML转义字符进行反转义的实现方法

    2022-07-27 08:44:34
  • Javascript removeChild()删除节点及删除子节点的方法

    2023-07-02 05:30:22
  • Python小白学习爬虫常用请求报头

    2024-01-02 06:39:19
  • Python:format格式化字符串详解

    2021-02-11 19:23:58
  • Python数据结构dict常用操作代码实例

    2022-05-13 02:16:43
  • python 合并多个excel中同名的sheet

    2023-06-06 08:34:27
  • Python教程之类型转换详解

    2021-03-23 02:48:17
  • Python ini文件常用操作方法解析

    2022-01-07 09:52:44
  • python爬取股票最新数据并用excel绘制树状图的示例

    2023-11-23 14:37:24
  • Python读写docx文件的方法

    2023-08-16 21:15:11
  • Gradio机器学习模型快速部署工具接口状态

    2023-08-11 13:36:27
  • python @property的用法及含义全面解析

    2023-04-06 00:42:28
  • vue-cli与webpack处理静态资源的方法及webpack打包的坑

    2024-05-09 09:39:07
  • asp之家 网络编程 m.aspxhome.com