python爬虫获取百度首页内容教学

作者:1002002100a 时间:2022-12-16 07:02:00 

由传智播客教程整理,我们这里使用的是python2.7.x版本,就是2.7之后的版本,因为python3的改动略大,我们这里不用它。现在我们尝试一下url和网络爬虫配合的关系,爬浏览器首页信息。

1、首先我们创建一个urllib2_test01.py,然后输入以下代码:

python爬虫获取百度首页内容教学

2、最简单的获取一个url的信息代码居然只需要4行,执行写的python代码:

python爬虫获取百度首页内容教学

3、之后我们会看到一下的结果

python爬虫获取百度首页内容教学

4、

实际上,如果我们在浏览器上打开网页主页的话,右键选择“查看源代码”,你会发现,跟我们刚打印出来的是一模一样的。也就是说,上面的4行代码就已经帮我们把百度的首页和全部代码爬了下来了 。

5、下面我们介绍一下这四行代码,第一行如下图,这个就是将urllib2组件进入进来,供给我们使用。

python爬虫获取百度首页内容教学

6、图片下面这步骤是调用urllib2库中的urlopen方法,该方法接受一个url地址,然后将请求后的得到的回应封装到一个叫respones对象当中。

python爬虫获取百度首页内容教学

7、最后这里,是调用response对象的read()方法,将请求的回应内容以字符串的形式给html变量。最后的print html就是将字符串打出来,所以说一个基本的url请求是对应的python代码是很简单的。

python爬虫获取百度首页内容教学

总结:以上就是关于利用python爬虫获取百度信息的步骤内容,感谢大家的学习和对脚本之家的支持。

来源:https://jingyan.baidu.com/article/19020a0a4d81ba529d2842a1.html

标签:python,爬虫,百度
0
投稿

猜你喜欢

  • php判断输入不超过mysql的varchar字段的长度范围

    2023-11-14 12:02:10
  • JavaScript对Json的增删改属性详解

    2024-04-18 09:36:27
  • pycharm 使用心得(四)显示行号

    2023-04-28 09:24:54
  • PyQt5 实现字体大小自适应分辨率的方法

    2022-08-25 03:07:44
  • Python3 SSH远程连接服务器的方法示例

    2021-02-15 17:50:05
  • 设计手机端应用时的一些建议

    2011-05-14 16:45:00
  • Python利用Selenium实现网站自动签到功能

    2021-04-22 18:20:02
  • range 标准化之获取

    2023-09-01 05:35:11
  • Mysql基础知识点汇总

    2024-01-23 08:15:40
  • 解决vue watch数据的方法被调用了两次的问题

    2024-05-05 09:10:33
  • 惰性函数定义模式

    2007-09-26 20:56:00
  • 简单了解mysql mycat 中间件

    2024-01-19 18:59:13
  • Python GUI利用tkinter皮肤ttkbootstrap实现好看的窗口

    2022-09-06 19:39:26
  • 跟老齐学Python之永远强大的函数

    2021-12-30 19:41:08
  • 巧用JDBC实现对MySQL的“增删改查”

    2008-12-31 15:12:00
  • LyScript实现Hook改写MessageBox的方法详解

    2023-01-07 03:35:16
  • HTTP Headers 傻瓜教程[译]

    2010-01-25 12:48:00
  • MySQL Union合并查询数据及表别名、字段别名用法分析

    2024-01-16 04:44:27
  • sql2005 安装教程 图文

    2024-01-16 23:47:51
  • Python IDLE清空窗口的实例

    2023-11-22 17:59:23
  • asp之家 网络编程 m.aspxhome.com