Python 识别12306图片验证码物品的实现示例

作者:Smile_Mr 时间:2021-04-03 22:17:24 

1、PIL介绍以及图片分割

Python 3 安装:  pip3 install Pillow

1.1 image 模块

Image模块是在Python PIL图像处理中常见的模块,主要是用于对这个图像的基本处理,它配合open、save、convert、show…等功能使用。


from PIL import Image
#打开文件代表打开pycharm中的文件
im = Image.open('1.jpg')
#展示图片
im.show()

1、Crop类

拷贝这个图像。如果用户想粘贴一些数据到这张图,可以使用这个方法,但是原始图像不会受到影响。

im.crop(box) ⇒ image

从当前的图像中返回一个矩形区域的拷贝。变量box是一个四元组,定义了左、上、右和下的像素坐标。用来表示在原始图像中截取的位置坐标,如box(100,100,200,200)就表示在原始图像中以左上角为坐标原点,截取一个100*100(像素为单位)的图像。


from PIL import Image
im = Image.open("pic1.jpg")
##确定拷贝区域大小
box = (5, 41, 72, 108)
##将im表示的图片对象拷贝到region中,大小为box
region = im.crop(box)
region.show()

Python 识别12306图片验证码物品的实现示例

实战一:12306图像分割并保存


from PIL import Image
#切割图像,由于下载的图片都是有固定的位置,所以直接控制像素进行切割就行了
def cut_img(im, x, y):
 assert 0 <= x <= 3
 assert 0 <= y <= 2
 left = 5 + (67 + 5) * x
 top = 41 + (67 + 5) * y
 right = left + 67
 bottom = top + 67
 return im.crop((left, top, right, bottom))

if __name__ == '__main__':
 im = Image.open("./pic1.jpg")
 #控制y轴
 for y in range(2):
   #控制x轴
   for x in range(4):
     im2 = cut_img(im, x, y)
     im2.save('./images/%s_%s.png'%(y,x))

Python 识别12306图片验证码物品的实现示例

2、百度平台接口实现

2.1.平台接入:

1.打开https://ai.baidu.com/进入控制台,选择文字识别服务。

Python 识别12306图片验证码物品的实现示例

2.创建应用,如图示:

Python 识别12306图片验证码物品的实现示例

3.输入应用名称、描述,并选择应用类型,之后点击“立即创建”按钮。

Python 识别12306图片验证码物品的实现示例

 4.创建完毕,点击“返回应用列表”。

Python 识别12306图片验证码物品的实现示例

5.此处显示AK,SK,后面程序中会用到

Python 识别12306图片验证码物品的实现示例

3. 官方文档的读取

1.打开https://ai.baidu.com/docs#/OCR-API/top 文档说明

Python 识别12306图片验证码物品的实现示例

Python 识别12306图片验证码物品的实现示例

需要用到的信息有:

(1)图像识别URL: https://aip.baidubce.com/rest/2.0/image-classify/v2/advanced_general

(2)Header格式:Content-Type:application/x-www-form-urlencoded

(3) 请求参数:image和multi_detect两个参数,image为图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M。

(4)返回参数:车牌颜色Color、车牌号码number等。


#!/usr/bin/python
# -*- coding: utf-8 -*-
import base64
import requests
import os
import time
#todo:获取百度权限验证码access_token
def get_token():
 get_token_url = "https://aip.baidubce.com/oauth/2.0/token"
 params = {
   "grant_type": "client_credentials",
   "client_id": "7ax98QuWU5l2zTbaOkzvKgxE",
   "client_secret": "INugQTM2DAfNFgfxtvgR7eF8AHPFGP5t",
 }
 res = requests.get(get_token_url, params).json()
 return res["access_token"]
#todo:通过权限验证码和图片进行识别物品
def get_result(access_token,image):
 url = "https://aip.baidubce.com/rest/2.0/image-classify/v2/advanced_general"
 #打开文件并进行编码
 with open(image, 'rb')as f:
   image = base64.b64encode(f.read())
 # image =
 #头部信息
 headers = {
   'Content-Type': 'application/x-www-form-urlencoded'
 }
 #发送数据
 data = {
   "access_token": access_token,
   "image": image
 }
 #发送请求,并返回识别数据
 res = requests.post(url, headers=headers, data=data).json()
 if res:
   result = res['result']
   return result
#todo:获取图片关键物品
def get_keywords(result):
 #按照最大匹配率进行排序,并获取左最后一个
 max_score = sorted(result,key=lambda x:x['score'])[-1]
 # print(max_score['keyword'])
 keyword = max_score['keyword']
 return keyword

if __name__ == '__main__':
 access_token = get_token()
 get_result(access_token,'pic1.jpg')
 datas = []
 for root,dir,files in os.walk('images'):
   for file in files:
     image = os.path.join(root,file)
     result = get_result(access_token,image)
     keyword = get_keywords(result)
     print(keyword)
     time.sleep(1)
     datas.append(keyword)
 print(datas)

Python 识别12306图片验证码物品的实现示例

总结:

  • PIL介绍以及图片分割

  • 百度AI图像识别实例搭建

  • 识别12306类别码

来源:https://blog.csdn.net/Smile_Mr/article/details/104020465

标签:Python,识别,12306,验证码
0
投稿

猜你喜欢

  • Python数据结构与算法之图的广度优先与深度优先搜索算法示例

    2022-05-05 07:34:53
  • MySql完整卸载的四个步骤详解

    2024-01-18 00:30:52
  • 详解Python不同版本之间的切换方法

    2023-12-28 05:22:06
  • PHP实现多文件上传的方法

    2023-11-23 03:42:04
  • python顺序的读取文件夹下名称有序的文件方法

    2021-03-10 08:23:37
  • sql函数:去掉html代码

    2008-04-07 12:44:00
  • 用pip给python安装matplotlib库的详细教程

    2021-02-02 00:02:45
  • python 百度aip实现文字识别的实现示例

    2023-12-15 19:53:47
  • 用Flash来作浏览历史功能

    2009-08-11 14:47:00
  • Python中迭代器与生成器的用法

    2021-08-30 00:53:18
  • JS实现简洁、全兼容的拖动层实例

    2024-04-19 09:49:08
  • python清除字符串里非字母字符的方法

    2022-08-27 16:04:02
  • python中argparse模块基础及使用步骤

    2023-01-26 19:21:59
  • Python+PyQT5实现手绘图片生成器

    2022-03-11 11:57:21
  • Python socket实现简单聊天室

    2022-06-20 02:13:27
  • Golang语言如何高效拼接字符串详解

    2023-07-11 03:46:57
  • 监测站点使用多少session和application的asp程序

    2007-09-12 19:40:00
  • pycharm设置鼠标悬停查看方法设置

    2022-12-25 16:04:31
  • 十分钟搞定pandas(入门教程)

    2023-08-09 01:00:15
  • Python使用Cv2模块识别验证码的操作方法

    2022-07-03 14:37:19
  • asp之家 网络编程 m.aspxhome.com