关于Android平台的OCR文字识别
2017-09-09刘琪李鑫
刘琪+李鑫
摘要:基于Android环境开发,介绍了OCR图片获取、识别及文件管理技术,阐述OCR文字识别app在手机平台上的优越性。设计主要分为两大系统:图片识别和文件管理。主要从图片的灰度化处理、二值化处理、外部接口采用百度OCR这3个各方面进行研究,经过对系统软件功能的测试,最终完成了OCR识图取字的的功能。
关键词:Andriod;OCR;灰度化处理;二值化处理;外部接口
中图分类号:TP317.4 文献标识码:A 文章编号:1007-9416(2017)07-0229-01
(OpticalCharacterRecognition,OCR)指电子设备利用文字识别将形状翻译成计算机文字的过程。Android是Google公司于2007年l1月5日推出全新软件平台. OCR识图取字app,平台的开放性、平等性等优点,OCR图片文字识别技术,避免繁琐输入\存储操作;真正解决数据快速有效记忆的效果。
1 系统需求与设计
1.1 需求分析
制作OCR文字识别app,中英文在线识别或离线识别分享至qq、微博功能。
1.2 功能模块设计
两个子系统:图片识别、文件管理;6个子模块:图片获取\处理\识别,I/O操作,文件本地管理。
2 OCR文字识别原理与分析
2.1 基于Android平台的OCR相机
从10%增至50%以上,成为智能手机OS之一。
2.2 图片处理
2.2.1 图片灰度化处理
彩色图像转化灰度过程为灰度化处理。其中R、G、B三个取值范围:0~255,像素颜色有16777216(256*256*256)种可能。通过MATLAB分析:
方法一:像素的RGB三个分量求均值,存于对应的矩阵,构建灰度图;
方法二:转化为YUV颜色模型,Y=0.3R+0.59G+0.11B。构建灰度图>> figure;>> imshow(I);%
2.2.2 图片二值化处理
方法一:值小于127像素值设为0(黑色),大于等于127为255(白色),速度快。缺点阈值为127具有的局限性.小于127则变为0,否则变为255,建二值图>> figure;>> imshow(I);%
方法二:值大于K值设为255(白色),值小于等于K像素设为0(黑色)。阈值选取精度更高。若平均值为阈值会导致部分像素丢失。>> Sum=0;%定义变量>> K=Sum/533/294;%求得平均灰度值K,小于K则变为0;
方法三:直方图在阈值取值在两个峰之间的峰谷最低处,更加精准。
2.3 图片识别
开放OCR接口,云脉文档识别接口。 图片离线识别:提供的tesseract-android-tools,编译平台Tesseract,jar。
(1)选择jTessBoxEditor。(2)样本越多,效果越好。(3)运行后生成num.font.exp0,.tif文件。(4)命名為num.font.exp0.box,Tessercat识别文字。(5)用jTessBoxEditor,手动修稿。(6)定义特征文件。tif和box文件名,应在文件中写入“font 0 0 0 0 0 ”。(7)创建一个批处理文件,最终生成的语言文件。
3 系统测试
3.1 测试环境
硬件环境 :Android智能机,处理器:CPU频率在1.7GHz以上,内存2GB外存8GB摄像头数量>=1软件环境软件:Android 4.1以上版本。
3.2 系统功能测试
(1)打开软件得到待测试图片,点击“取图”按钮,没有取图就直接识别,(2)选择识别方式,选择在线识别,不用确定是中文还是英文。(3)在线识别功能测试分别对系统进行测试。无网络:请求超时,开关掉往复:请求超时。(4)离线识别功能测试一种是普通预处理,另一种是“二值化处理”,效果上差异。离线识别时,语言类型与所选的翻译类型不统一,出现乱码。
4 结语
OCR软件不受地域、空间限制,准确、高效。便利生活。离线测试模块仍存在缺陷,中文英文文字混合的图片,识别率不高,出现乱码。随着研究不断深入,对此模块进行针对性的改进。
参考文献
[1]Kukich K. Techniques for automatically correcting words in text. ACM Computing Surveys,1992,24(4):377-438.
[2]Peterson James L. Computer programs for detecting and correcting spelling errors. Communications of the ACM,1980,23(12): 676-687.
[3]Hisao N, Kazuhiro K, Yasuham S. Post processing for character recognition using keyword information//Proceedings of the IAPR Workshop on Machine Vision Applications. Tokyo, Japan, 1992: 7-9.
[4]Liu L M, Babad Y M, Sun W, Chan K K. Adaptive post processing of OCR text via knowledge acquisition//Proceedings of the 19th Annual Conference on Computer Science. New York, USA, 1991: 558-569.
[5]Wang Q F, Yin F, Liu C L. Handwritten Chinese text recognition by integrating multiple contexts. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012,34(8):1469-1481.endprint