关于Android平台的OCR文字识别

2017-09-09刘琪李鑫

数字技术与应用 2017年7期

刘琪+李鑫

摘要：基于Android环境开发，介绍了OCR图片获取、识别及文件管理技术，阐述OCR文字识别app在手机平台上的优越性。设计主要分为两大系统：图片识别和文件管理。主要从图片的灰度化处理、二值化处理、外部接口采用百度OCR这3个各方面进行研究，经过对系统软件功能的测试，最终完成了OCR识图取字的的功能。

关键词：Andriod；OCR；灰度化处理；二值化处理；外部接口

中图分类号：TP317.4 文献标识码：A 文章编号：1007-9416（2017）07-0229-01

（OpticalCharacterRecognition，OCR）指电子设备利用文字识别将形状翻译成计算机文字的过程。Android是Google公司于2007年l1月5日推出全新软件平台. OCR识图取字app，平台的开放性、平等性等优点，OCR图片文字识别技术，避免繁琐输入＼存储操作；真正解决数据快速有效记忆的效果。

1 系统需求与设计

1.1 需求分析

制作OCR文字识别app，中英文在线识别或离线识别分享至qq、微博功能。

1.2 功能模块设计

两个子系统：图片识别、文件管理；6个子模块：图片获取＼处理＼识别，I/O操作，文件本地管理。

2 OCR文字识别原理与分析

2.1 基于Android平台的OCR相机

从10%增至50%以上，成为智能手机OS之一。

2.2 图片处理

2.2.1 图片灰度化处理

彩色图像转化灰度过程为灰度化处理。其中R、G、B三个取值范围：0～255，像素颜色有16777216（256*256*256）种可能。通过MATLAB分析：

方法一：像素的RGB三个分量求均值，存于对应的矩阵，构建灰度图；

方法二：转化为YUV颜色模型，Y=0.3R+0.59G+0.11B。构建灰度图>> figure；>> imshow（I）；%

2.2.2 图片二值化处理

方法一：值小于127像素值设为0（黑色），大于等于127为255（白色），速度快。缺点阈值为127具有的局限性.小于127则变为0，否则变为255，建二值图>> figure；>> imshow（I）；%

方法二：值大于K值设为255（白色），值小于等于K像素设为0（黑色）。阈值选取精度更高。若平均值为阈值会导致部分像素丢失。>> Sum=0；%定义变量>> K=Sum/533/294；%求得平均灰度值K，小于K则变为0；

方法三：直方图在阈值取值在两个峰之间的峰谷最低处，更加精准。

2.3 图片识别

开放OCR接口，云脉文档识别接口。图片离线识别：提供的tesseract-android-tools，编译平台Tesseract，jar。

（1）选择jTessBoxEditor。（2）样本越多，效果越好。（3）运行后生成num.font.exp0，.tif文件。（4）命名為num.font.exp0.box，Tessercat识别文字。（5）用jTessBoxEditor，手动修稿。（6）定义特征文件。tif和box文件名，应在文件中写入“font 0 0 0 0 0 ”。（7）创建一个批处理文件，最终生成的语言文件。

3 系统测试

3.1 测试环境

硬件环境：Android智能机，处理器：CPU频率在1.7GHz以上，内存2GB外存8GB摄像头数量>=1软件环境软件：Android 4.1以上版本。

3.2 系统功能测试

（1）打开软件得到待测试图片，点击“取图”按钮，没有取图就直接识别，（2）选择识别方式，选择在线识别，不用确定是中文还是英文。（3）在线识别功能测试分别对系统进行测试。无网络：请求超时，开关掉往复：请求超时。（4）离线识别功能测试一种是普通预处理，另一种是“二值化处理”，效果上差异。离线识别时，语言类型与所选的翻译类型不统一，出现乱码。

4 结语

OCR软件不受地域、空间限制，准确、高效。便利生活。离线测试模块仍存在缺陷，中文英文文字混合的图片，识别率不高，出现乱码。随着研究不断深入，对此模块进行针对性的改进。

参考文献

[1]Kukich K. Techniques for automatically correcting words in text. ACM Computing Surveys，1992，24（4）：377-438.

[2]Peterson James L. Computer programs for detecting and correcting spelling errors. Communications of the ACM，1980，23（12）： 676-687.

[3]Hisao N， Kazuhiro K， Yasuham S. Post processing for character recognition using keyword information//Proceedings of the IAPR Workshop on Machine Vision Applications. Tokyo， Japan， 1992： 7-9.

[4]Liu L M， Babad Y M， Sun W， Chan K K. Adaptive post processing of OCR text via knowledge acquisition//Proceedings of the 19th Annual Conference on Computer Science. New York， USA， 1991： 558-569.

[5]Wang Q F， Yin F， Liu C L. Handwritten Chinese text recognition by integrating multiple contexts. IEEE Transactions on Pattern Analysis and Machine Intelligence， 2012，34（8）：1469-1481.endprint

数字技术与应用

2017年7期

关于Android平台的OCR文字识别

杂志排行

数字技术与应用的其它文章