Java使用Tess4J实现图像识别方式

作者:占位符号 时间:2022-10-07 19:24:11 

Java Tess4J实现图像识别

最近需要用Java做一个图像识别的东西,查了一些资料,在此写一个基于Tess4J的教程,方便其他人参考和使用。

其实做图像识别,也可以使用TESSERACT-OCR来实现,但是该方式需要下载软件,在电脑上安装环境,移植性不高,使用Tess4J只需要下载相关Jar包,导入项目,再把项目封装好就可以处处运行了。

首先,下载Tess4J的相关资源(一个压缩包)

官网:http://tess4j.sourceforge.net/codesample.html

解压,其中的目录结构如下:

Java使用Tess4J实现图像识别方式

需要用到其中圈起来的三个文件夹中的东西。lib文件夹下放的是需要用到的Jar包,tessdata下放的是语言库,默认的有英语库,中文库需要另外下载,下载地址:https://github.com/tesseract-ocr/tessdata/blob/master/chi_sim.traineddata。

新建一个Java项目,将lib文件夹和tessdata文件夹复制到项目的根目录下,找到dist文件夹下的tess4j.jar(名字可能有版本号),将该文件也复制到项目根目录下的lib文件夹下。

项目的的目录如下

Java使用Tess4J实现图像识别方式

lib中的文件如下(tess4J.jar也在该目录下)

Java使用Tess4J实现图像识别方式

再在eclipse中打开项目

在项目中导入lib文件夹中所有的jar包(Build path --> configure build path),导入后的结果如下:

Java使用Tess4J实现图像识别方式

这样前期准备工作就完成了,下面就剩下代码了。

Tess4J的代码比较简洁

如下:

Tess4JTest.java


package ocr;
import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;
import net.sourceforge.tess4j.util.LoadLibs;
import java.io.File;
import java.io.IOException;

/**
* Tess4J测试类
*/
public class Tess4JTest {
   public static void main(String[] args){
   String path = "D://Java//Tess4J";//我的项目存放路径    
   File file = new File(path + "//photo.jpg");
       ITesseract instance = new Tesseract();

/**
        *  获取项目根路径,例如: D:\IDEAWorkSpace\tess4J
        */
       File directory = new File(path);
       String courseFile = null;
       try {
           courseFile = directory.getCanonicalPath();
       } catch (IOException e) {
           e.printStackTrace();
       }

//设置训练库的位置
       instance.setDatapath(courseFile + "//tessdata");
       instance.setLanguage("eng");//chi_sim :简体中文, eng根据需求选择语言库
       String result = null;
       try {
           long startTime = System.currentTimeMillis();
            result =  instance.doOCR(file);
           long endTime = System.currentTimeMillis();
           System.out.println("Time is:" + (endTime - startTime) + " 毫秒");
       } catch (TesseractException e) {
           e.printStackTrace();
       }

System.out.println("result: ");
       System.out.println(result);
   }
}

这样就搞定了。

效果如下

原图:

Java使用Tess4J实现图像识别方式

读取结果:

Java使用Tess4J实现图像识别方式

从结果来看准确率还有待提高,l 和 1分不清,0 和 O 也没有分清,汉字的准确率还要低一些,大家可以自行训练字体库优化。

来源:https://blog.csdn.net/zai_xia/article/details/80003778

标签:Java,Tess4J,图像识别
0
投稿

猜你喜欢

  • Android实现音量调节的方法

    2023-01-01 20:23:45
  • Android编程之绘图canvas基本用法示例

    2022-08-21 15:02:23
  • Android实现手势滑动多点触摸放大缩小图片效果

    2022-02-13 09:26:28
  • Android上传文件到服务端并显示进度条

    2023-06-23 07:48:33
  • c#分页读取GB文本文件实例

    2021-09-13 10:18:39
  • java应用占用内存过高排查的解决方案

    2023-09-21 12:47:30
  • android主线程和子线程之间消息传递详解

    2021-11-06 05:06:23
  • Intellij IDEA创建spring-boot项目的图文教程

    2022-06-15 01:09:59
  • springboot openfeign从JSON文件读取数据问题

    2023-11-09 15:55:55
  • 基于Java实现的图的广度优先遍历算法

    2021-06-02 06:51:20
  • android使用PullToRefresh框架实现ListView下拉刷新上拉加载更多

    2023-05-23 05:29:16
  • javaweb前端向后端传值的几种方式总结(附代码)

    2022-04-28 09:21:29
  • Android NDK开发(C语言字符串)

    2023-06-18 10:21:28
  • C#使用WebClient实现上传下载

    2022-04-22 21:46:31
  • springboot多环境配置文件及自定义配置文件路径详解

    2021-09-30 03:55:54
  • Springboot引用外部配置文件的方法步骤

    2022-06-14 13:29:35
  • Java基础教程之数组的定义与使用

    2022-04-24 10:24:12
  • C++ 实现求最大公约数和最小公倍数

    2023-10-30 10:49:23
  • C# 下载文件 删除文件 写入文本的实例

    2022-11-27 18:34:25
  • MyBatis的9种动态标签详解

    2021-06-21 19:03:40
  • asp之家 软件编程 m.aspxhome.com