关于python简单的爬虫操作(requests和etree)
作者:IT之一小佬 时间:2022-01-08 02:17:27
虎扑体育-NBA球员得分数据排行 第1页
示例代码:
import requests
from lxml import etree
url = 'https://nba.hupu.com/stats/players'
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36"
}
res = requests.get(url=url, headers=headers)
print(res)
# 处理请求结果
e = etree.HTML(res.text)
# 解析响应的数据
player = e.xpath('//*[@id="data_js"]/div[4]/div/table/tbody/tr/td[2]/a/text()')
team = e.xpath('//*[@id="data_js"]/div[4]/div/table/tbody/tr/td[3]/a/text()')
hit_rate = e.xpath('//*[@id="data_js"]/div[4]/div/table/tbody/tr/td[6]/text()')[1:]
score = e.xpath('//*[@id="data_js"]/div[4]/div/table/tbody/tr/td[4]/text()')[1:]
for p, t, h, s in zip(player, team, hit_rate, score):
print(f"队员:{p},球队:{t},命中率:{h},得分:{s}")
运行结果:
来源:https://blog.csdn.net/weixin_44799217/article/details/129786197
标签:python,爬虫,requests,etree
0
投稿
猜你喜欢
Python中matplotlib库安装失败的经验总结(附pycharm配置anaconda)
2021-01-04 21:42:14
解决golang.org不能访问的问题(推荐)
2024-05-08 10:53:22
mysql主从服务器配置特殊问题
2011-01-04 19:56:00
oracle数据库sql的优化总结
2024-01-23 16:05:11
Python编程OpenCV和Numpy图像处理库实现图片去水印
2023-10-10 15:12:44
Python实现嵌套列表去重方法示例
2021-01-29 03:56:57
Python发送邮件实现基础解析
2022-01-28 10:33:22
微信小程序利用co处理异步流程的方法教程
2024-04-22 12:51:45
Oracle数据库编写有效事务指导方针
2009-03-19 17:41:00
Python字典fromkeys()方法使用代码实例
2021-07-09 09:54:38
php 方便水印和缩略图的图形类
2023-10-15 15:31:28
如何用python插入独创性声明
2021-05-07 04:24:15
最新Linux系统下安装MySql 5.7.17全过程及注意事项
2024-01-17 07:40:56
Python实现视频中添加音频工具详解
2022-06-03 12:32:28
python3 sorted 如何实现自定义排序标准
2022-09-19 21:32:49
讲解SQL Server 2005数据库的同义词Bug
2008-11-28 14:22:00
MySQL中VARCHAR与CHAR格式数据的区别
2024-01-15 01:58:25
mysql 获取规定时间段内的统计数据
2024-01-24 11:25:10
python中dict获取关键字与值的实现
2022-03-11 14:00:42
vue+element-ui+sortable.js实现表格拖拽功能
2024-04-09 11:00:11