python利用 pytesseract快速识别提取图片中的文字((图片识别)

作者:广龙宇 时间:2023-06-16 08:00:18 

python利用 pytesseract快速识别提取图片中的文字((图片识别)

提示:本文多图,请手机端注意流量。

前言

利用python做图片识别,识别提取图片中的文字会有很多方法,但是想要简单一点怎么办,那就可以使用tesseract识别引擎来实现,一行代码就可以做到提取图片文本。

一、配置环境

1. 安装python依赖

本程序用到了两个python库,pytesseract和PIL,所以先来安装。

运行以下命令

pip install Pillow
pip install pytesseract

如果在python中没有报错,说明程序安装成功,

python利用 pytesseract快速识别提取图片中的文字((图片识别)

2. 安装识别引擎

安装完以上两个依赖还需要对应的识别引擎。点击去下载

咱们直接使用5月10号构建的最新版本。

python利用 pytesseract快速识别提取图片中的文字((图片识别)

安装tesseract识别引擎(可跳过)

下载完成后打开程序进行安装,先选择语言,这里选择英语English就行,然后点ok

python利用 pytesseract快速识别提取图片中的文字((图片识别)

接下来就是next,完了点击I Agree同意协议,

python利用 pytesseract快速识别提取图片中的文字((图片识别)

python利用 pytesseract快速识别提取图片中的文字((图片识别)

为所有用户安装,然后点next,如图,

python利用 pytesseract快速识别提取图片中的文字((图片识别)

接下来安装中文的语言包用来识别中文,需要滑到下面,选择中文,我这里横排简体中文和竖排简体中文都选择了,完成后点击next,

python利用 pytesseract快速识别提取图片中的文字((图片识别)

python利用 pytesseract快速识别提取图片中的文字((图片识别)

选择安装路径,建议安装到C盘以外,然后点击next

python利用 pytesseract快速识别提取图片中的文字((图片识别)

这里点击安装install

python利用 pytesseract快速识别提取图片中的文字((图片识别)

等待安装完成

python利用 pytesseract快速识别提取图片中的文字((图片识别)

安装完成后,点击next,再点击finish完成安装,

python利用 pytesseract快速识别提取图片中的文字((图片识别)

python利用 pytesseract快速识别提取图片中的文字((图片识别)

验证是否安装成功

添加环境变量,就是你安装到的那个文件夹路径,直接加到path里面,

python利用 pytesseract快速识别提取图片中的文字((图片识别)

然后在命令行运行tesseract -v,如果和下图一样,说明你已经安装成功了,

python利用 pytesseract快速识别提取图片中的文字((图片识别)

二、使用步骤

1.引入库

from PIL import Image
import pytesseract

2.提取图片文字

将读取图片的一行代码封装为一个函数,

def read_image(name):
   print(pytesseract.image_to_string(Image.open(name), lang='chi_sim'))

main函数中直接调用即可,

def main():
   read_image('1657158527412.jpg')

3.运行效果

以以下图片为例,

python利用 pytesseract快速识别提取图片中的文字((图片识别)

运行效果如下,

python利用 pytesseract快速识别提取图片中的文字((图片识别)

from PIL import Image
import pytesseract
def read_image(name):
   print(pytesseract.image_to_string(Image.open(name), lang='chi_sim'))
def main():
   read_image('img.png')
if __name__ == '__main__':
   main()

来源:https://blog.csdn.net/weixin_47754149/article/details/125651707

标签:python,pytesseract,图片文字
0
投稿

猜你喜欢

  • php while循环控制的简单实例

    2024-05-11 10:03:54
  • PHP实现PDF转图片的详细过程(使用imagick)

    2023-09-07 13:27:34
  • Python爬虫小例子——爬取51job发布的工作职位

    2022-04-30 23:17:18
  • http状态码一览表以及HTTP响应的返回头信息

    2010-03-31 14:45:00
  • 修改MYSQL最大连接数的3种方法分享

    2024-01-21 10:33:44
  • python_tkinter弹出对话框创建2

    2023-10-17 06:27:29
  • 深度解析MySQL 5.7之中文全文检索

    2024-01-20 22:36:55
  • Tableau连接mysql数据库的实现步骤

    2024-01-21 20:50:41
  • 基于Python实现本地音乐播放器的制作

    2022-05-11 16:37:46
  • layui-table表复选框勾选的所有行数据获取的例子

    2024-04-28 10:19:05
  • Python爬取阿拉丁统计信息过程图解

    2022-04-02 06:23:22
  • 使用Fabric自动化部署Django项目的实现

    2022-09-05 22:00:33
  • 删除目录下相同文件的python代码(逐级优化)

    2023-08-02 17:25:10
  • golang设置http response响应头与填坑记录

    2024-05-21 10:22:24
  • thinkphp5.1 框架钩子和行为用法实例分析

    2024-05-03 15:48:29
  • 使用Python获取爱奇艺电视剧弹幕数据的示例代码

    2022-08-09 08:38:29
  • 如何正确使用开源项目?

    2023-01-29 22:14:57
  • javascript数组取交集

    2010-07-15 12:14:00
  • Go语言实现定时器的方法

    2024-02-09 04:55:21
  • Vuex的安装、搭建及案例详解

    2024-05-29 22:20:22
  • asp之家 网络编程 m.aspxhome.com