Python3实现获取图片文字里中文的方法分析

作者:huxiangen 时间:2023-09-19 09:31:34 

本文实例讲述了Python3实现获取图片文字里中文的方法。分享给大家供大家参考,具体如下:

一、运行环境

(1) win10

(2) pycharm

(3) python 3.5

(4) pillow与pytesseract库安装:


pip3 install pillow
pip3 install pytesseract

(5)  识别引擎tesseract-ocr ,下载之后解压安装,下载地址:https://www.jb51.net/softs/538925.html

二、 运行代码


# -*- coding: utf-8 -*-
from PIL import Image
import pytesseract
#上面都是导包,只需要下面这一行就能实现图片文字识别
text=pytesseract.image_to_string(Image.open('show.jpg'),lang='chi_sim') #设置为中文文字的识别
#text=pytesseract.image_to_string(Image.open('test.png'),lang='eng')  #设置为英文或阿拉伯字母的识别
print(text)

三、报错解决

1.FileNotFoundError:[WinError 2]系统找不到指定文件。

解决办法:

打开文件pytesseract.py,找到如下代码,将tesseract_cmd的值修改为全路径,再次使用就不会报这个错了。

tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'

2.pytesseract.pytesseract.TesseractError:(1,'Error opening data file\\Progr

解决办法:

打开文件pytesseract.py,找到image_to_string,指定config的参数,如下:

tessdata_dir_config = '--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'
def image_to_string(image, lang=None, boxes=False, config=tessdata_dir_config):

希望本文所述对大家Python程序设计有所帮助。

来源:https://blog.csdn.net/huxiangen/article/details/78877444

标签:Python3,图片,中文
0
投稿

猜你喜欢

  • 使用豆瓣源来安装python中的第三方库方法

    2023-10-09 08:53:42
  • python模型集成知识点总结

    2023-08-03 00:16:16
  • 使用网际数据库浏览器在线维护Access数据库

    2008-05-23 13:05:00
  • 谈点关于checkbox的事情

    2010-09-28 14:49:00
  • Mootools 1.2教程(15)——滚动条(Slider)

    2008-12-09 17:35:00
  • 攻击者是如何将PHP Phar包伪装成图像以绕过文件类型检测的(推荐)

    2023-09-05 19:29:06
  • PHP使用缓存即时输出内容(output buffering)的方法

    2023-11-23 20:12:11
  • Python使用xlrd读取Excel格式文件的方法

    2022-12-27 16:54:51
  • 在系统崩溃的时候如何恢复原有的数据

    2009-01-08 13:26:00
  • Microsoft SQL Server 2008 正式发布

    2008-08-07 12:32:00
  • PHP实现对图片的反色处理功能【测试可用】

    2023-11-03 19:41:28
  • Python代码调试的几种方法总结

    2022-06-14 18:21:27
  • 用Mysql查询语句记录

    2011-02-16 12:29:00
  • python数据结构leetcode338比特位计数算法

    2023-05-06 21:24:33
  • Python基于OpenCV实现人脸检测并保存

    2023-10-07 00:43:37
  • 多个版本的python共存时使用pip的正确做法

    2021-06-24 10:41:17
  • 关于shopex同步ucenter的redirect问题,导致script不运行

    2023-07-13 05:20:53
  • python微信跳一跳系列之自动计算跳一跳距离

    2021-08-01 14:18:36
  • 列表模块是否需要标题

    2009-06-25 14:11:00
  • Python编程mac下使用pycharm小技巧

    2022-10-21 19:23:52
  • asp之家 网络编程 m.aspxhome.com