Python爬虫urllib和requests的区别详解
作者:梦子mengy7762 时间:2023-04-24 23:25:27
我们讲了requests的用法以及利用requests简单爬取、保存网页的方法,这节课我们主要讲urllib和requests的区别。
1、获取网页数据
第一步,引入模块。
两者引入的模块是不一样的,这一点显而易见。
第二步,简单网页发起的请求。
urllib是通过urlopen方法获取数据。
requests需要通过网页的响应类型获取数据。
第三步,数据封装。
对于复杂的数据请求,我们只是简单的通过urlopen方法肯定是不行的。最后,如果你的时间不是很紧张,并且又想快速的提高,最重要的是不怕吃苦,建议你可以联系维:762459510 ,那个真的很不错,很多人进步都很快,需要你不怕吃苦哦!大家可以去添加上看一下~
urllib中,我们知道对于有反爬虫机制的网站,我们需要对URL进行封装,以获取到数据。我们可以回顾下前几节课的内容:
requests模块中,就不需要这么复杂的操作,直接在第二步中,加入参数headers即可:
2、解析网页数据
urllib和requests都可以通过bs4和re进行数据的解析,requests还可以通过xpath进行解析。具体解析方法之后会详解
3.保存数据
urllib需要引入xlwt模块进行新建表格、sheet表格写入数据.最后,如果你的时间不是很紧张,并且又想快速的提高,最重要的是不怕吃苦,建议你可以联系维:762459510 ,那个真的很不错,很多人进步都很快,需要你不怕吃苦哦!大家可以去添加上看一下~
requests通过with…as直接虚入数据:
来源:https://blog.csdn.net/ITF_001/article/details/120139406
标签:Python,urllib,requests
0
投稿
猜你喜欢
ASP不允许同一个用户同时登陆两次
2008-06-03 13:45:00
ES6深入理解之“let”能替代”var“吗?
2024-05-28 15:41:33
Python+tkinter使用80行代码实现一个计算器实例
2023-10-11 23:29:31
MySQL范围查询优化的场景实例详解
2024-01-17 01:11:12
Python enumerate遍历数组示例应用
2023-06-10 16:59:26
python里读写excel等数据文件的6种常用方式(小结)
2021-04-09 08:11:52
python中如何使用函数改变list
2022-06-04 13:38:38
交互因视觉设计而更完美
2008-05-31 17:22:00
跟我学习javascript的作用域与作用域链
2024-04-22 12:56:40
python实现凯撒密码、凯撒加解密算法
2023-08-27 17:49:22
分享8个非常流行的 Python 可视化工具包
2022-11-14 08:40:14
Python设计模式之组合模式原理与用法实例分析
2023-04-12 16:15:28
C#操作数据库总结(vs2005+sql2005)
2024-01-20 22:20:29
electron-builder打包配置详解
2024-04-17 10:24:54
ASP.NET与数据库相关技巧
2024-01-26 19:45:23
djang常用查询SQL语句的使用代码
2022-04-27 02:59:51
Python测试框架pytest核心库pluggy详解
2023-11-01 23:02:08
Persits AspJpeg组件图片水印\\缩略图\\图片合并\\图片切割\\实例教程
2008-12-14 10:36:00
Go操作redis与redigo的示例解析
2024-04-28 09:12:38
MySQL Delete 删数据后磁盘空间未释放的原因
2024-01-23 10:56:14