使用requests库制作Python爬虫

作者:豆芽菜橙 时间:2023-08-17 21:43:23 

使用python爬虫其实就是方便,它会有各种工具类供你来使用,很方便。Java不可以吗?也可以,使用httpclient工具、还有一个大神写的webmagic框架,这些都可以实现爬虫,只不过python集成工具库,使用几行爬取,而Java需要写更多的行来实现,但目的都是一样。

下面介绍requests库简单使用:


#!/usr/local/env python
# coding:utf-8

import requests

#下面开始介绍requests的使用,环境语言是python3,使用下面的网址作为参考
#http://www.sse.com.cn/market/bonddata/data/tb/

request_param = {'jsonCallBack': 'jsonpCallback6588',
  'isPagination': 'true',
  'sqlId': 'COMMON_BOND_XXPL_ZQXX_L',
  'BONDTYPE': '地×××府债券',
  'pageHelp.pageSize': '25',
  'pageHelp.pageNo': '2',
  'pageHelp.beginPage': '2',
  'pageHelp.cacheSize': '1',
  'pageHelp.endPage': '21'}

user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36'
referer = 'http://www.sse.com.cn/market/bonddata/data/ltb/'
#设置headers
headers = {'User-Agent': user_agent, 'Referer': referer}
#设置代理
proxy = {
"http":"http://113.214.13.1:8000"
}

# 需要请求的URL地址
request_url = 'http://query.sse.com.cn/commonQuery.do?'

#设置请求地址
response = requests.get(request_url, headers=headers, proxies=proxy, params=request_param);
print(response.status_code)
#文本响应内容
print(response.text)
#json格式响应内容
print(response.json())
#二进制响应内容
print(response.content)
#原始格式
print(response.raw)

来源:http://blog.51cto.com/shangdc/2090765

标签:requests库,Python爬虫
0
投稿

猜你喜欢

  • Pytorch 使用不同版本的cuda的方法步骤

    2023-02-06 07:52:23
  • MySQL数据库root权限丢失解决方案

    2008-07-13 13:59:00
  • 浅谈Python的list中的选取范围

    2023-06-23 01:58:01
  • MySql使用skip-name-resolve解决外网链接客户端过慢问题

    2024-01-26 16:07:35
  • 栈和队列数据结构的基本概念及其相关的Python实现

    2022-03-14 23:18:28
  • 基于python分布式爬虫并解决假死的问题

    2021-06-28 03:38:28
  • JS异步宏队列与微队列原理区别详解

    2024-04-22 13:26:36
  • 利用python和百度地图API实现数据地图标注的方法

    2023-01-30 11:59:43
  • ajax的responseText乱码的问题的解决方法

    2024-06-05 09:21:28
  • 基于Python实现下载网易音乐代码实例

    2023-05-25 01:05:51
  • VC基于ADO技术访问数据库的方法

    2024-01-28 22:25:08
  • [奇招] JS暴虐查找算法

    2008-07-06 21:17:00
  • python3读取excel文件只提取某些行某些列的值方法

    2021-10-19 09:20:09
  • 使用documentElement正确取得当前可见区域的大小

    2024-04-18 09:34:06
  • 教你用pyecharts绘制各种图表案例(效果+代码)

    2021-07-30 21:56:54
  • python冒泡排序算法的实现代码

    2021-09-08 03:48:27
  • 在Python中os.fork()产生子进程的例子

    2022-08-12 18:15:27
  • ajax框架:ExtJs简介

    2008-09-02 16:51:00
  • Python requests发送post请求的一些疑点

    2022-09-09 17:45:03
  • 深入浅析Pytorch中stack()方法

    2021-12-26 01:40:08
  • asp之家 网络编程 m.aspxhome.com