Python3一行代码实现图片文字识别的示例

作者:邱石1990 时间:2021-11-22 06:45:51 

自学Python3第5天,今天突发奇想,想用Python识别图片里的文字。没想到Python实现图片文字识别这么简单,只需要一行代码就能搞定


from PIL import Image
import pytesseract
#上面都是导包,只需要下面这一行就能实现图片文字识别
text=pytesseract.image_to_string(Image.open('denggao.jpeg'),lang='chi_sim')
print(text)

我们以识别诗词为例

下面是我们要识别的图片

Python3一行代码实现图片文字识别的示例

先看下效果图

Python3一行代码实现图片文字识别的示例 

我们运行代码后识别的结果,有几个字没有正确识别,但是大多数字都能识别出来。


风急天高猿啸哀 渚芸胄芳少白鸟飞凤
无边落木萧萧下, 不尽长量工盲衮宕衮来
万里悲秋常1乍窨, 百年多病独登氤
艰难苦恨擎霜量 漂倒新停澍酉帆

一行代码就能识别图片,我们背后要做些准备工作的

  1. 这里我们需要用到两个库:pytesseract和PIL

  2. 同时我们还需要安装识别引擎tesseract-ocr

下面就来讲讲这几个库的安装,因为只有这几个库安装好以后Python才能实现一行代码实现图片文字识别

一,pytesseract和PIL的安装

安装这两个包可以借助pip

- 1,命令行安装


pip install PIL
pip install pytesseract

- 2,如果你用的pycharm编辑器,就可以直接借助pycharm实现快速安装。

在pycharm的Settings设置页按照下面步骤操作

Python3一行代码实现图片文字识别的示例 

这样就能成功安装pytesseract,安装PIL只需要在上面第三步里搜索PIL并点击安装即可

Python3一行代码实现图片文字识别的示例

这时我们安转好了库,运行下面代码


from PIL import Image
import pytesseract
text=pytesseract.image_to_string(Image.open('denggao.jpeg'),lang='chi_sim')
print(text)

会报下面错误,错误原因是:没有安装识别引擎tesseract-ocr

Python3一行代码实现图片文字识别的示例

二,安装识别引擎tesseract-ocr

1.下载下面的安装包,然后直接点击安装即可
tesseract-ocr安装包和中文语言包

解压安装tesseract-ocr后做如下操作,就可以支持中文识别了。因为tesseract-ocr默认不支持中文识别。

Python3一行代码实现图片文字识别的示例

2,安装完成tesseract-ocr后,我们还需要做一下配置

在C:\Users\huxiu\AppData\Local\Programs\Python\Python35\Lib\site-packages\pytesseract找到pytesseract.py打开后做如下操作


# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
#tesseract_cmd = 'tesseract'
tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

也可以通过pycharm快速打开pytesseract.py

Python3一行代码实现图片文字识别的示例

Python3一行代码实现图片文字识别的示例

Python3一行代码实现图片文字识别的示例

至此我们所有的配置就完成了,运行下面代码就可以把杜甫的登高这首图片诗解析成文字了

Python3一行代码实现图片文字识别的示例

来源:http://blog.csdn.net/qiushi_1990/article/details/78041375

标签:Python3,图片,文字,识别
0
投稿

猜你喜欢

  • Golang利用自定义模板发送邮件的方法详解

    2023-06-29 07:07:16
  • python 统计代码耗时的几种方法分享

    2023-11-03 19:51:06
  • Python绘制百分比堆叠柱状图并填充图案

    2023-01-25 00:49:06
  • 网页设计标准尺寸

    2008-06-15 15:21:00
  • Keras搭建M2Det目标检测平台示例

    2023-11-10 10:49:01
  • 这可能是最好玩的python GUI入门实例(推荐)

    2021-02-01 15:33:42
  • Python3监控疫情的完整代码

    2023-09-24 09:53:19
  • Django media static外部访问Django中的图片设置教程

    2023-03-05 03:51:15
  • Python实现迭代时使用索引的方法示例

    2022-12-15 11:08:48
  • 如何使用FSO修改文件夹的名称

    2008-10-11 14:24:00
  • 保姆级python教程写个贪吃蛇大冒险

    2022-06-23 17:12:39
  • ASP常见的保留字整理(变量与表名注意不能用)

    2013-06-01 19:58:01
  • 利于python脚本编写可视化nmap和masscan的方法

    2021-04-14 11:19:52
  • 使用python遍历指定城市的一周气温

    2022-01-01 18:25:26
  • Python封装成可带参数的EXE安装包实例

    2023-05-19 04:50:17
  • 详解Django解决ajax跨域访问问题

    2021-10-14 15:34:10
  • python轻松过滤处理脏话与特殊敏感词汇

    2022-02-07 15:53:28
  • Python实现进程同步和通信的方法

    2023-08-30 04:21:45
  • SQL Server 2005 Express混合模式登录设置

    2009-02-23 13:55:00
  • Python列表list的详细用法介绍

    2021-04-17 06:56:15
  • asp之家 网络编程 m.aspxhome.com