博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
利用Tess4J实现图片识别
阅读量:6641 次
发布时间:2019-06-25

本文共 972 字,大约阅读时间需要 3 分钟。

 

一、下载

1.进入官网下载页面

 

2.点击download

 

3.下载后解压,目录如下,圈出的三个文件夹是需要用到的

 

二、使用Tess4J

1.将dist和lib下的包导入java项目

 

2.将 tessdata 文件夹复制进项目的根目录

 

3.示范代码如下

public class OCRDemo {    public static void main(String[] args) {        try {            double start=System.currentTimeMillis();            File imageFile = new File("C:\\Users\\dan\\Desktop\\12345.png");//图片位置            ITesseract instance = new Tesseract();            //instance.setDatapath("");//设置tessdata位置            instance.setLanguage("chi_sim");//选择字库文件            String result = instance.doOCR(imageFile);//开始识别            double end=System.currentTimeMillis();            System.out.println(result);//打印图片内容            System.out.println("耗时"+(end-start)/1000+" s");        } catch (TesseractException e) {            e.printStackTrace();        }    }}

注意事项:

①如果tessdata没有放入根目录,务必设置teedata的位置

instance.setDatapath("");//设置tessdata位置

②选择字库文件不需要写上后缀,默认 tessdata 包中可能没有 chi_sim 这个中文包,需要自己下载

 

三、运行结果

 

官方字库识别率还是偏低的,如果对精度要求高的话需要自己训练字库了

转载地址:http://provo.baihongyu.com/

你可能感兴趣的文章
B00014 C++实现的AC自动机
查看>>
687C: The values you can make
查看>>
HDU2502 月之数(解法三)
查看>>
设计模式-命令模式
查看>>
C#的几个基本概念
查看>>
JavaScript对象的几种创建方式
查看>>
Linux进程间通信——使用信号量
查看>>
xpath提取多个html标签text
查看>>
android中webservce获取soapObject数据的解析问题
查看>>
[120_移动开发Android]004_android开发之单元测试
查看>>
Java加密算法(二)——对称加密算法DES&AES
查看>>
最少换乘
查看>>
centos 7 安装MySql
查看>>
LeetCode: Adding two numbers (by list)
查看>>
Hibernate查询 内连接和外连接区别
查看>>
1068. [SCOI2007]压缩【区间DP】
查看>>
下载远程(第三方服务器)文件、图片,保存到本地(服务器)的方法、保存抓取远程文件、图片...
查看>>
Docker四种网络模式
查看>>
c:url标签
查看>>
Silverlight-Validation服务器端异步数据验证
查看>>