使用requests库制作Python爬虫
作者:豆芽菜橙 时间:2023-08-17 21:43:23
使用python爬虫其实就是方便,它会有各种工具类供你来使用,很方便。Java不可以吗?也可以,使用httpclient工具、还有一个大神写的webmagic框架,这些都可以实现爬虫,只不过python集成工具库,使用几行爬取,而Java需要写更多的行来实现,但目的都是一样。
下面介绍requests库简单使用:
#!/usr/local/env python
# coding:utf-8
import requests
#下面开始介绍requests的使用,环境语言是python3,使用下面的网址作为参考
#http://www.sse.com.cn/market/bonddata/data/tb/
request_param = {'jsonCallBack': 'jsonpCallback6588',
'isPagination': 'true',
'sqlId': 'COMMON_BOND_XXPL_ZQXX_L',
'BONDTYPE': '地×××府债券',
'pageHelp.pageSize': '25',
'pageHelp.pageNo': '2',
'pageHelp.beginPage': '2',
'pageHelp.cacheSize': '1',
'pageHelp.endPage': '21'}
user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36'
referer = 'http://www.sse.com.cn/market/bonddata/data/ltb/'
#设置headers
headers = {'User-Agent': user_agent, 'Referer': referer}
#设置代理
proxy = {
"http":"http://113.214.13.1:8000"
}
# 需要请求的URL地址
request_url = 'http://query.sse.com.cn/commonQuery.do?'
#设置请求地址
response = requests.get(request_url, headers=headers, proxies=proxy, params=request_param);
print(response.status_code)
#文本响应内容
print(response.text)
#json格式响应内容
print(response.json())
#二进制响应内容
print(response.content)
#原始格式
print(response.raw)
来源:http://blog.51cto.com/shangdc/2090765
标签:requests库,Python爬虫
0
投稿
猜你喜欢
Pytorch 使用不同版本的cuda的方法步骤
2023-02-06 07:52:23
MySQL数据库root权限丢失解决方案
2008-07-13 13:59:00
浅谈Python的list中的选取范围
2023-06-23 01:58:01
MySql使用skip-name-resolve解决外网链接客户端过慢问题
2024-01-26 16:07:35
栈和队列数据结构的基本概念及其相关的Python实现
2022-03-14 23:18:28
基于python分布式爬虫并解决假死的问题
2021-06-28 03:38:28
JS异步宏队列与微队列原理区别详解
2024-04-22 13:26:36
利用python和百度地图API实现数据地图标注的方法
2023-01-30 11:59:43
ajax的responseText乱码的问题的解决方法
2024-06-05 09:21:28
基于Python实现下载网易音乐代码实例
2023-05-25 01:05:51
VC基于ADO技术访问数据库的方法
2024-01-28 22:25:08
[奇招] JS暴虐查找算法
2008-07-06 21:17:00
python3读取excel文件只提取某些行某些列的值方法
2021-10-19 09:20:09
使用documentElement正确取得当前可见区域的大小
2024-04-18 09:34:06
教你用pyecharts绘制各种图表案例(效果+代码)
2021-07-30 21:56:54
python冒泡排序算法的实现代码
2021-09-08 03:48:27
在Python中os.fork()产生子进程的例子
2022-08-12 18:15:27
ajax框架:ExtJs简介
2008-09-02 16:51:00
Python requests发送post请求的一些疑点
2022-09-09 17:45:03
深入浅析Pytorch中stack()方法
2021-12-26 01:40:08