浅析Python3爬虫登录模拟
作者:WhiteBlackCat 时间:2023-10-10 18:15:02
使用Python爬虫登录系统之后,能够实现的操作就多了很多,下面大致介绍下如何使用Python模拟登录。
我们都知道,在前端的加密验证,只要把将加密环境还原出来,便能够很轻易地登录。
首先分析登录的步骤,通过审查元素得知
<input type="button" id="login" name="login" class="login" onclick="Logon();" value="登录">
点击按钮触发Logon()函数,然后查找Logon()函数定义
function Logon() {
}
函数定义内容各有不同,一般里面包含一些加密的操作,一般是使用写好的js加密。我们所需要做的便是重复这些步骤,加密数据。
对于加密,有三种方法:
如果加密方法是base64之类的,可以直接用Python3的base64库加密;
手动模仿;
直接调用js加密,需要先下载PyExecJS,有的电脑需要先安装js的运行环境,比如Node.js。使用方法如下:
newusername = execjs.compile(content).call('base64encode', username)
其中content是js内容,base64encode是方法,username是参数,newusername是加密后的数据。
对于验证码的问题,先介绍下一般的图片验证码,可以请求获取验证码的地址,session之类的数据自己搞定,一般便可以请求成功,可以存到本地手动输入,也可以使用识别的第三方模块,但这个识别效果并不是很好。
然后,便是查看session,cookie。
接下来的操作就是构造请求头headers,这个可以自行去控制台查看或者使用wireshark, fiddler之类的抓包软件查看。
最后便可以请求数据:
使用
s = requests.Session()
s.headers.update(headers)
r = s.post(url, data = params)
或者:
r = requests.get(url, headers = headers, data = params)
headers是你构造的请求头,url是你请求的网站,params是加密的数据。
来源:https://www.cnblogs.com/FZfangzheng/p/7581537.html
标签:Python3,爬虫,登录模拟
0
投稿
猜你喜欢
小程序自定义弹出框效果
2023-07-02 03:47:33
sql2005开发版 没有任何功能可以安装
2024-01-16 20:48:18
解析MYSQL显示表信息的方法
2024-01-15 12:17:49
在Python中处理日期和时间的基本知识点整理汇总
2021-05-13 07:12:14
Python Socket 编程知识点详细介绍
2021-10-28 16:31:29
Golang通脉之数据类型详情
2023-07-14 05:37:03
MySQL sql_mode修改不生效的原因及解决
2024-01-25 03:32:48
将pytorch转成longtensor的简单方法
2021-10-25 02:42:56
在Mac中PyCharm配置python Anaconda环境过程图解
2023-10-19 01:22:53
Python识别快递条形码及Tesseract-OCR使用详解
2022-10-20 01:32:32
Python tkinter实现的图片移动碰撞动画效果【附源码下载】
2022-03-19 03:05:26
请问[\\u4E00-\\u9FA5]是什么正则表达式码
2009-07-10 13:10:00
JavaScript事件详细讲解
2023-08-24 04:51:48
python随机模块random的22种函数(小结)
2022-08-11 18:09:03
制作主页的独门功夫五十招
2010-09-05 21:15:00
保障MySQL数据安全的一些建议
2024-01-27 16:08:07
ASP+AJAX做类似google的搜索提示
2008-10-24 13:49:00
快速掌握ASP+Access数据库的18条安全法则
2008-11-28 15:08:00
详解PHP中的mb_detect_encoding函数使用方法
2023-11-14 19:48:45
Mysql中Insert into xxx on duplicate key update问题
2024-01-23 22:32:36