Python获取百度热搜的完整代码

作者:国家一级保护咸鱼 时间:2023-09-06 11:33:32 

好久没写了,就把上课做的一个小东西拿出来分享一下吧。
百度网页截图如下 ↓↓↓

Python获取百度热搜的完整代码

程序运行输出结果截图 ↓↓↓

Python获取百度热搜的完整代码

上代码 ↓↓↓


from lxml import etree
from lxml import html
import requests

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36'}
page = requests.get("https://www.baidu.com",headers=headers)
html = page.text
#print(source1)
# 从字符串解析
element = etree.HTML(html)

# 元素列表,获取的方式列出了如下两种
# ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]')
ps = element.xpath('//*[@class="title-content-title"]')

#热搜文本内容
text = []
if len(ps) > 0:
 for p in ps:
   #输出节点的文本
   text1 = p.text
   text.append(text1)
else:
 print("空")

x = element.xpath('//*[@class="s-hotsearch-content"]/li')

#热搜文本对应的排名
index = []
for x1 in x:
 #获取节点的属性
 index1 = x1.get("data-index")
 index.append(index1)

print(text)  
print(index)

#定义一个对文本和排名进行匹配的函数,返回一个字典型数据
def PP(index_array,text_array):
 x = {}
 i = 0
 for index_a in index_array:
   #index_a = int(index_a)

x[index_a] = text_array[i]
   i = i + 1
 return x

re_text = PP(index,text)
#对字典性数据按key进行排序,即key=lambda re:re[0],排序完成后再转换为字典型数据
last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))

来源:https://blog.csdn.net/qq_43225919/article/details/115442300

标签:Python,百度热搜
0
投稿

猜你喜欢

  • 简易的全屏透明遮罩(lightBox)

    2010-06-09 20:56:00
  • 文件上传服务器-jupyter 中python解压及压缩方式

    2021-06-03 22:32:21
  • 使用php数据缓存技术提高执行效率

    2023-05-24 23:14:24
  • Python实现暴力破解有密码的zip文件的方法

    2023-11-22 22:48:40
  • python opencv 检测移动物体并截图保存实例

    2023-11-05 16:10:35
  • Python实现按当前日期(年、月、日)创建多级目录的方法

    2022-05-01 09:22:01
  • mysql启用skip-name-resolve模式时出现Warning的处理办法

    2024-01-20 06:44:58
  • python编码最佳实践之总结

    2023-02-07 21:04:44
  • mysql 5.7.21 winx64免安装版配置方法图文教程

    2024-01-23 17:16:13
  • Python基于TensorFlow接口实现深度学习神经网络回归

    2022-07-17 22:38:28
  • 用Dreamweaver MX实现网站批量更新

    2009-09-13 18:39:00
  • python实现简单银行管理系统

    2021-01-24 17:59:28
  • Java与Python之间使用jython工具类实现数据交互

    2023-10-06 18:44:09
  • 关于Python面向对象编程的知识点总结

    2021-06-21 18:15:43
  • C# SQLite数据库入门使用说明

    2024-01-25 20:01:20
  • XML 问题: 超越DOM(轻松使用 DOM 的技巧和诀窍)

    2008-09-05 17:12:00
  • Web标准在中国

    2008-11-26 11:27:00
  • Access函数大全

    2009-12-23 19:22:00
  • mysql按照自定义(指定顺序)排序的方法实例

    2024-01-14 12:33:46
  • Python基于pyCUDA实现GPU加速并行计算功能入门教程

    2021-11-01 08:24:58
  • asp之家 网络编程 m.aspxhome.com