python结合selenium获取XX省交通违章数据的实现思路及代码

作者:hxs2660 时间:2022-04-15 21:30:57 

前言:

目前在研究易信公众号,想给公众号增加一个获取个人交通违章的查询菜单,通过点击返回查询数据。以下是实施过程。

一、首先,用火狐浏览器打开XX省交管网,分析页面信息:

python结合selenium获取XX省交通违章数据的实现思路及代码

可以看到共有4种查询种类,我只要查询违章数据,所以分析第一个电子警察信息查询就好了,用firebug分别查看车牌号码、车辆识别码、验证码输入框,可以得到id属性,分别为:carNum1、carAuthCode1、captcha1。

到这里,我们可以用selenium根据获取的id,自动填入车牌号码、车辆识别码、验证码,但验证码如何获取呢?。

二、获取验证码

第一次、通过Tesseract识别

经过测试,识别率太低了,不可行。

第二次、通过cookies查找验证码

通过查看服务器返回的cookies,发现里面竟然有验证码。。。

python结合selenium获取XX省交通违章数据的实现思路及代码

三、编写程序测试

1、流程图和测试结果

python结合selenium获取XX省交通违章数据的实现思路及代码python结合selenium获取XX省交通违章数据的实现思路及代码

2、源代码


from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
class JTWZ():
def __init__(self,carAuthCode,carNum):
"""
carAuthCode:车辆识别码
carNum:车牌号
"""
self.driver = webdriver.Chrome()
self.url = 'http://xxcx.hbsjg.gov.cn:8087/hbjj/'
self.carAuthCode=carAuthCode
self.carNum=carNum
def get_content(self):
self.driver.get(self.url)
try:
element = WebDriverWait(self.driver, 10).until(EC.presence_of_element_located((By.ID, "checkCode1")))
print(u'开始登录...')
except Exception as e:
print(e)
self.carNum1 = self.driver.find_element_by_id('carNum1')
self.carNum1.send_keys(self.carNum)
self.carAuthCode1 = self.driver.find_element_by_id('carAuthCode1')
self.carAuthCode1.send_keys(self.carAuthCode)
captcha1=self.driver.find_element_by_id('captcha1')
#从cookies找寻验证码
for n in self.driver.get_cookies():
if n.get('name')!=None and n['name']=='RANDOMVALIDATECODEKEY1':
checkCode1=n['value']
captcha1.send_keys(checkCode1)
sub=self.driver.find_element_by_xpath("//input[@value='开始查询']")
sub.click()
try:
element = WebDriverWait(self.driver, 10).until(EC.presence_of_element_located((By.CLASS_NAME, "fsmiddle")))
print(u'获取违章内容成功,保存为:wz.jpg...')
self.driver.save_screenshot('wz.jpg')
return 0
except:
print(u'获取失败...')
return 1
finally:
self.driver.quit()
if __name__ == '__main__':
jtwz=JTWZ(carAuthCode=000,carNum='')
jtwz.get_content()
标签:python,selenium
0
投稿

猜你喜欢

  • 在Django中实现添加user到group并查看

    2021-12-08 21:47:07
  • asp函数解决SQL注入漏洞

    2008-10-12 19:53:00
  • ASP申请单动态添加实现方法及代码

    2008-11-04 11:09:00
  • 删除数据库中重复数据的两个方法

    2008-01-01 19:16:00
  • Web设计中的黄金分割[译]

    2009-02-20 13:41:00
  • 我的css样式写法总结

    2009-01-18 13:04:00
  • python数学建模是加深Numpy和Pandas学习

    2021-04-28 17:21:12
  • python三元运算符实现方法

    2022-08-19 23:11:34
  • Excute后都需要返回一个RecordSet对象吗?

    2009-10-28 18:28:00
  • 质量更好的tags标签效果

    2008-06-04 12:24:00
  • 详解PHP实现HTTP服务器过程

    2023-05-26 20:17:12
  • 从Web查询数据库之PHP与MySQL篇

    2009-09-19 16:58:00
  • js三维正方体(兼容ie/ff)

    2008-04-12 14:38:00
  • Pytorch中的 torch.distributions库详解

    2021-05-17 22:26:47
  • css样式表实现首写字母大写

    2007-10-08 12:11:00
  • 网站分析方法系列二——分析页面区块价值

    2011-01-06 12:32:00
  • 如何了解SQL的执行频率

    2009-08-26 15:17:00
  • PyHacker编写指南引用Nmap模块实现端口扫描器

    2023-07-15 14:15:40
  • Python中的流程控制详解

    2023-07-22 20:31:54
  • 设计良好网页的4项原则

    2009-04-24 12:48:00
  • asp之家 网络编程 m.aspxhome.com