APP下载

关于Android平台的OCR文字识别

2017-09-09刘琪李鑫

数字技术与应用 2017年7期

刘琪+李鑫

摘要:基于Android环境开发,介绍了OCR图片获取、识别及文件管理技术,阐述OCR文字识别app在手机平台上的优越性。设计主要分为两大系统:图片识别和文件管理。主要从图片的灰度化处理、二值化处理、外部接口采用百度OCR这3个各方面进行研究,经过对系统软件功能的测试,最终完成了OCR识图取字的的功能。

关键词:Andriod;OCR;灰度化处理;二值化处理;外部接口

中图分类号:TP317.4 文献标识码:A 文章编号:1007-9416(2017)07-0229-01

(OpticalCharacterRecognition,OCR)指电子设备利用文字识别将形状翻译成计算机文字的过程。Android是Google公司于2007年l1月5日推出全新软件平台. OCR识图取字app,平台的开放性、平等性等优点,OCR图片文字识别技术,避免繁琐输入\存储操作;真正解决数据快速有效记忆的效果。

1 系统需求与设计

1.1 需求分析

制作OCR文字识别app,中英文在线识别或离线识别分享至qq、微博功能。

1.2 功能模块设计

两个子系统:图片识别、文件管理;6个子模块:图片获取\处理\识别,I/O操作,文件本地管理。

2 OCR文字识别原理与分析

2.1 基于Android平台的OCR相机

从10%增至50%以上,成为智能手机OS之一。

2.2 图片处理

2.2.1 图片灰度化处理

彩色图像转化灰度过程为灰度化处理。其中R、G、B三个取值范围:0~255,像素颜色有16777216(256*256*256)种可能。通过MATLAB分析:

方法一:像素的RGB三个分量求均值,存于对应的矩阵,构建灰度图;

方法二:转化为YUV颜色模型,Y=0.3R+0.59G+0.11B。构建灰度图>> figure;>> imshow(I);%

2.2.2 图片二值化处理

方法一:值小于127像素值设为0(黑色),大于等于127为255(白色),速度快。缺点阈值为127具有的局限性.小于127则变为0,否则变为255,建二值图>> figure;>> imshow(I);%

方法二:值大于K值设为255(白色),值小于等于K像素设为0(黑色)。阈值选取精度更高。若平均值为阈值会导致部分像素丢失。>> Sum=0;%定义变量>> K=Sum/533/294;%求得平均灰度值K,小于K则变为0;

方法三:直方图在阈值取值在两个峰之间的峰谷最低处,更加精准。

2.3 图片识别

开放OCR接口,云脉文档识别接口。 图片离线识别:提供的tesseract-android-tools,编译平台Tesseract,jar。

(1)选择jTessBoxEditor。(2)样本越多,效果越好。(3)运行后生成num.font.exp0,.tif文件。(4)命名為num.font.exp0.box,Tessercat识别文字。(5)用jTessBoxEditor,手动修稿。(6)定义特征文件。tif和box文件名,应在文件中写入“font 0 0 0 0 0 ”。(7)创建一个批处理文件,最终生成的语言文件。

3 系统测试

3.1 测试环境

硬件环境 :Android智能机,处理器:CPU频率在1.7GHz以上,内存2GB外存8GB摄像头数量>=1软件环境软件:Android 4.1以上版本。

3.2 系统功能测试

(1)打开软件得到待测试图片,点击“取图”按钮,没有取图就直接识别,(2)选择识别方式,选择在线识别,不用确定是中文还是英文。(3)在线识别功能测试分别对系统进行测试。无网络:请求超时,开关掉往复:请求超时。(4)离线识别功能测试一种是普通预处理,另一种是“二值化处理”,效果上差异。离线识别时,语言类型与所选的翻译类型不统一,出现乱码。

4 结语

OCR软件不受地域、空间限制,准确、高效。便利生活。离线测试模块仍存在缺陷,中文英文文字混合的图片,识别率不高,出现乱码。随着研究不断深入,对此模块进行针对性的改进。

参考文献

[1]Kukich K. Techniques for automatically correcting words in text. ACM Computing Surveys,1992,24(4):377-438.

[2]Peterson James L. Computer programs for detecting and correcting spelling errors. Communications of the ACM,1980,23(12): 676-687.

[3]Hisao N, Kazuhiro K, Yasuham S. Post processing for character recognition using keyword information//Proceedings of the IAPR Workshop on Machine Vision Applications. Tokyo, Japan, 1992: 7-9.

[4]Liu L M, Babad Y M, Sun W, Chan K K. Adaptive post processing of OCR text via knowledge acquisition//Proceedings of the 19th Annual Conference on Computer Science. New York, USA, 1991: 558-569.

[5]Wang Q F, Yin F, Liu C L. Handwritten Chinese text recognition by integrating multiple contexts. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012,34(8):1469-1481.endprint