Python获取百度热搜的完整代码
作者:国家一级保护咸鱼 时间:2023-09-06 11:33:32
好久没写了,就把上课做的一个小东西拿出来分享一下吧。
百度网页截图如下 ↓↓↓
程序运行输出结果截图 ↓↓↓
上代码 ↓↓↓
from lxml import etree
from lxml import html
import requests
headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36'}
page = requests.get("https://www.baidu.com",headers=headers)
html = page.text
#print(source1)
# 从字符串解析
element = etree.HTML(html)
# 元素列表,获取的方式列出了如下两种
# ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]')
ps = element.xpath('//*[@class="title-content-title"]')
#热搜文本内容
text = []
if len(ps) > 0:
for p in ps:
#输出节点的文本
text1 = p.text
text.append(text1)
else:
print("空")
x = element.xpath('//*[@class="s-hotsearch-content"]/li')
#热搜文本对应的排名
index = []
for x1 in x:
#获取节点的属性
index1 = x1.get("data-index")
index.append(index1)
print(text)
print(index)
#定义一个对文本和排名进行匹配的函数,返回一个字典型数据
def PP(index_array,text_array):
x = {}
i = 0
for index_a in index_array:
#index_a = int(index_a)
x[index_a] = text_array[i]
i = i + 1
return x
re_text = PP(index,text)
#对字典性数据按key进行排序,即key=lambda re:re[0],排序完成后再转换为字典型数据
last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))
来源:https://blog.csdn.net/qq_43225919/article/details/115442300
标签:Python,百度热搜
0
投稿
猜你喜欢
简易的全屏透明遮罩(lightBox)
2010-06-09 20:56:00
文件上传服务器-jupyter 中python解压及压缩方式
2021-06-03 22:32:21
使用php数据缓存技术提高执行效率
2023-05-24 23:14:24
Python实现暴力破解有密码的zip文件的方法
2023-11-22 22:48:40
python opencv 检测移动物体并截图保存实例
2023-11-05 16:10:35
Python实现按当前日期(年、月、日)创建多级目录的方法
2022-05-01 09:22:01
mysql启用skip-name-resolve模式时出现Warning的处理办法
2024-01-20 06:44:58
python编码最佳实践之总结
2023-02-07 21:04:44
mysql 5.7.21 winx64免安装版配置方法图文教程
2024-01-23 17:16:13
Python基于TensorFlow接口实现深度学习神经网络回归
2022-07-17 22:38:28
用Dreamweaver MX实现网站批量更新
2009-09-13 18:39:00
python实现简单银行管理系统
2021-01-24 17:59:28
Java与Python之间使用jython工具类实现数据交互
2023-10-06 18:44:09
关于Python面向对象编程的知识点总结
2021-06-21 18:15:43
C# SQLite数据库入门使用说明
2024-01-25 20:01:20
XML 问题: 超越DOM(轻松使用 DOM 的技巧和诀窍)
2008-09-05 17:12:00
Web标准在中国
2008-11-26 11:27:00
Access函数大全
2009-12-23 19:22:00
mysql按照自定义(指定顺序)排序的方法实例
2024-01-14 12:33:46
Python基于pyCUDA实现GPU加速并行计算功能入门教程
2021-11-01 08:24:58