selenium中get_cookies()和add_cookie()的用法详解
作者:年轻人——001 时间:2023-10-22 14:27:19
在用selenium爬取网页的时候,有时候需要登陆,这时候用selenium获取cookie和携带cookie是很方便的,获取cookie可以通过内置的函数get_cookies(),它得到的是一组cookie,是由cookie组成的列表。单个的cookie是字典组成的,所有get_cookies()返回值是由字典组成的列表。
dictCookies = browser.get_cookies()
jsonCookies = json.dumps(dictCookies)
# print(jsonCookies)
with open('anquan.txt', 'w') as f:
f.write(jsonCookies)
注意:这个jsonCookies是一个列表,是一个完整的cookie。
{'name': 'QCARJSESSIONID', 'value': 'BBmPcsfClCknfQX1cN2MLMgKXZGtFWqsBvjN9mbM9tmbL38hMmw4!1426878101', 'path': '/', 'domain': 'qcar.apiins.com', 'secure': False, 'httpOnly': True}
{'name': 'BIGipServercar_qcar_poool', 'value': '1191316140.16671.0000', 'path': '/', 'domain': 'qcar.apiins.com', 'secure': False, 'httpOnly': False}
{'name': 'chinainsuranceJSESSIONID', 'value': 'rkgncsfG8pnrhh8x1CvNy46zHplyLkTjyv1LL2hk4wDrkD9Mjz9Y!2078734058', 'path': '/', 'domain': 'qcar.apiins.com', 'secure': False, 'httpOnly': True}
{'name': 'BIGipServercar_core_pool', 'value': '1191316140.17951.0000', 'path': '/', 'domain': 'qcar.apiins.com', 'secure': False, 'httpOnly': False}
这样就获取到了cookie,那么如何使用呢,我们让浏览器对象携带cookies就行了,这时候用另外一个函数add_cookie()
with open('anquan.txt', 'r', encoding='utf8') as f:
listCookies = json.loads(f.read())
print('%%%%%%%%%%%%%%%%%', listCookies)
for cookie in listCookies:
obj.add_cookie(cookie)
obj.get('https://qcar.apiins.com/qcar')
# 读取完cookie刷新页面
obj.refresh()
这样,我们就可以携带cookie,实现免登陆。有人说,你直接登陆不就完事了吗?有些应用场景还是用的到的,比如说验证码识别率不高,比如监视爬虫,定时爬虫,要求五分钟爬一次,两分钟爬一次,每次登陆会很麻烦。这个时候我们可以分开,一个专门登陆抓取cookie,30分钟更新一次cookie文件。另外一个读取cookie文件就ok了。
来源:https://www.cnblogs.com/chaojiyingxiong/p/10210707.html
标签:selenium,get,cookies,add,cookie
0
投稿
猜你喜欢
PHP类的特性实例分析
2024-05-03 15:49:46
python中pygame安装过程(超级详细)
2022-08-05 04:26:15
使用模板实现ASP代码与页面分离
2008-09-12 16:07:00
Python实现合并同一个文件夹下所有txt文件的方法示例
2023-10-11 00:24:22
Vuejs学习笔记之使用指令v-model完成表单的数据双向绑定
2023-07-02 16:28:13
基于Vue+Openlayer实现动态加载geojson的方法
2024-04-27 16:12:22
javascript 获取select下拉列表值的代码
2024-04-19 09:50:04
php实现转换html格式为文本格式的方法
2024-06-07 15:44:57
Python实现读取文件的方法总结
2021-05-04 00:56:26
python全面解析接口返回数据
2023-09-15 17:02:28
python定义类self用法实例解析
2022-01-08 14:11:01
GoJs分组绘图模板go.Group使用示例详解
2024-04-19 11:02:24
SQL Server 安全检查列表全攻略
2008-01-29 13:31:00
Vue实现数字时钟效果
2024-05-13 09:13:47
python嵌套函数使用外部函数变量的方法(Python2和Python3)
2022-05-16 20:29:25
Python使用爬虫抓取美女图片并保存到本地的方法【测试可用】
2023-11-04 19:44:17
详解selenium + chromedriver 被反爬的解决方法
2022-03-20 18:40:46
go语言实现并发网络爬虫的示例代码
2024-01-31 07:45:35
SQL Server重温 事务
2012-08-21 10:48:15
python opencv摄像头的简单应用
2023-01-17 14:25:56