Python基于百度AI实现OCR文字识别

作者:徐海建 时间:2023-09-26 22:14:29 

百度AI功能还是很强大的,百度AI开放平台真的是测试接口的天堂,免费接口很多,当然有量的限制,但个人使用是完全够用的,什么人脸识别、MQTT服务器、语音识别等等,应有尽有。

Python基于百度AI实现OCR文字识别

Python基于百度AI实现OCR文字识别

看看OCR识别免费的量

Python基于百度AI实现OCR文字识别

Python基于百度AI实现OCR文字识别

快速安装:执行pip install baidu-aip即可

新建一个AipOcr:


from aip import AipOcr

""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

通用文字识别


""" 读取图片 """
def get_file_content(filePath):
 with open(filePath, 'rb') as fp:
   return fp.read()

image = get_file_content('example.jpg')

""" 调用通用文字识别, 图片参数为本地图片 """
client.basicGeneral(image);

""" 如果有可选参数 """
options = {}
options["language_type"] = "CHN_ENG"
options["detect_direction"] = "true"
options["detect_language"] = "true"
options["probability"] = "true"

""" 带参数调用通用文字识别, 图片参数为本地图片 """
client.basicGeneral(image, options)

url = "http//www.x.com/sample.jpg"

""" 调用通用文字识别, 图片参数为远程url图片 """
client.basicGeneralUrl(url);

""" 如果有可选参数 """
options = {}
options["language_type"] = "CHN_ENG"
options["detect_direction"] = "true"
options["detect_language"] = "true"
options["probability"] = "true"

""" 带参数调用通用文字识别, 图片参数为远程url图片 """
client.basicGeneralUrl(url, options)

通用文字识别 请求参数详情

Python基于百度AI实现OCR文字识别

通用文字识别 返回数据参数详情

Python基于百度AI实现OCR文字识别

通用文字识别


from aip import AipOcr

#更换为自己的注册信息
APP_ID = '---'
API_KEY = '---'
SECRET_KEY = '---'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)#创建连接
fp=open("tu2.png","rb").read()#打开并读取文件内容
res=client.basicGeneral(fp)#普通
#print(res)

#将所有的文字都合并到一起
strx=""
for tex in res["words_result"]:#遍历结果
 strx+=tex["words"]#每一行
print(strx)#输出内容

最终代码


from aip import AipOcr

# 定义常量
APP_ID = '14544448'
API_KEY = 'yRZGUXAlCd0c9vQj1kAjBEfY'
SECRET_KEY = 'sc0DKGy7wZ9MeWFGZnbscbRyoDB2IQlj'

# 初始化AipFace对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

# 读取图片
def get_file_content(filePath):
 with open(filePath, 'rb') as fp:
   return fp.read()

image = get_file_content('binary_best.jpg')
# 调用通用文字识别, 图片为本地图片
res=client.general(image)
print(res)

for item in res['words_result']:
 print(item['words'])

例:


from aip import AipOcr
import re
APP_ID='17010327'
API_KEY='X2MWCU1LG1PX5H6GAXgdlWD7'
SECRET_KEY='vz6GZ6TkhSFvY3quqcuC3EG8oEW3kThB'
client=AipOcr(APP_ID,API_KEY,SECRET_KEY)

i=open(r'C:\Users\Administrator\Desktop\example.png','rb')
image = i.read()

result=client.basicGeneral(image)

#将所有的文字都合并到一起
for item in result['words_result']:
 print(item['words'])

Python基于百度AI实现OCR文字识别

通用文字识别client.basicGeneral(image)

通用文字识别(高精度版)client.basicAccurate(image);

通用文字识别(含位置信息版)client.general(image);

通用文字识别(含位置高精度版)client.accurate(image);

通用文字识别(含生僻字版)client.enhancedGeneral(image);

网络图片文字识别client.webImage(image);

来源:https://www.cnblogs.com/adam012019/p/11440353.html

标签:Python,百度,AI,OCR,文字,识别
0
投稿

猜你喜欢

  • 数据库高并发情况下重复值写入的避免 字段组合约束

    2024-01-21 00:13:31
  • python如何实时获取tcpdump输出

    2021-05-05 14:41:36
  • Python中列表(List) 的三种遍历(序号和值)方法小结

    2022-08-24 23:17:39
  • WEB页面工具语言XML带来的好处

    2008-05-29 11:01:00
  • Python中pip安装非PyPI官网第三方库的方法

    2021-01-20 15:51:18
  • 避免Adodb.Stream输出UTF-8时自动写入的BOM(asp)

    2011-08-24 20:32:56
  • 判断Threading.start新线程是否执行完毕的实例

    2023-06-18 16:43:25
  • python中multiprosessing模块的Pool类中的apply函数和apply_async函数的区别

    2023-03-21 20:23:37
  • python进阶之协程你了解吗

    2022-11-04 19:04:48
  • python批量翻译excel表格中的英文

    2022-11-16 08:09:07
  • 纯CSS在Firefox模拟text-overflow: ellipsis效果

    2009-03-17 12:49:00
  • layer ui 导入文件之前传入数据的实例

    2023-08-15 11:39:17
  • python3.5 tkinter实现页面跳转

    2022-08-03 22:23:46
  • python 矢量数据转栅格数据代码实例

    2022-06-12 03:40:14
  • PHP中非常有用却鲜有人知的函数集锦

    2023-11-24 14:29:47
  • Python3基于sax解析xml操作示例

    2022-06-07 10:18:52
  • Matlab如何实现矩阵复制扩充

    2023-10-13 15:46:52
  • python lxml中etree的简单应用

    2022-01-11 09:34:15
  • asp加载access数据库并生成XML文件范例

    2008-07-22 12:41:00
  • Python几种常见算法汇总

    2023-05-15 21:11:41
  • asp之家 网络编程 m.aspxhome.com