基于MATLAB的超分辨率字符识别算法实现
2016-03-08莆田学院信息工程学院张荔
莆田学院信息工程学院 张荔
基于MATLAB的超分辨率字符识别算法实现
莆田学院信息工程学院 张荔
字符识别的超分辨率重建已经在图像处理领域成了一个研究热点,其不仅在理论上具有重要意义,在实用中也有迫切需求。论文主要通过对字符识别的超分辨率重建算法进行研究,并应用一种算法加以实现。最终通过MATLAB软件进行仿真,对给出的模糊文本图像进行超分辨率重建,并得出最后重建图像。让人们了解这种方法的实用性。
字符识别;超分辨率重建;MATLAB
1 绪论
在数字图像的采集与处理过程中,不同精度和类型的传感器、光学器件引起的图像模糊以及运动物体采集时的运动模糊,同时自然界中大量存在起伏噪声、单频噪声等,这些会使实际获得的图像产生模糊、噪声乃至变形的情况,其最为在直接的表现就是使整个图像的分辨率较低。除此之外,在数字化信息采集的过程之中也会对图像的分辨率产生影响,最为主要的原因就在于采样速率偏低,使得采样后信号的频谱出现混叠现象,从而不能简单用低通滤波器重建信号[1]。
从上述分析可以看出,想要对图像的分辨率进行改善,最为直接的方法就是使用性能优良的硬件设备。但是性能越好的图像采集器价格也越昂贵,通常用于高精度系统中,不适合于一般应用中。因此,实际中普遍采取的方法是使用建立在信号处理基础上的算法来改善图像的分辨率,也就是超分辨率(SR:Super-Resolution)图像重建。这一方法的优点在于不会涉及硬件,成本较为低廉,并且还可以使用现有的图像系统,这种方案较为经济实用。
2 超分辨率字符识别算法
对于字符的识别,当前最为主流的方法是基于模板匹配的OCR算法以及基于人工神经网络的OCR算法。在本设计之中使用的是基于模板匹配的OCR算法。该算法的主要原理是,首先对待识别图像预处理(如二值化、中值滤波、图像分割等,并将其尺寸大小缩放到与字符数据库中模板的大小相同),然后与所有的模板图像一一进行计算比对,最后选择相关度最高的或者误差最小的图像作为结果[2]。
因此完整的字符识别的算法步骤如下:
(1)字符图像预处理
标准模板库必须在字符识别操作开始前建立好的。一般的文本图像,包含汉字和英文等大量的字符,计算量过大。为了实验方便,只建立5个字母模型,用画图工具先画出s、e、c、t、i等5个字符的图像。并分别保存为moban1.jpg,moban2.jpg,moban3.jpg,moban4.jpg,moban5.jpg。模板库中原图大小设定为,以利于后面的处理。所得到的字符统一为黑字白底。字体为宋体,大小保持一致。
实际中的图像在形成、传输或变换过程中,受多种因素的影响,会与原始图像之间产生某种差异,这种差异会对后续的信号处理产生影响。所以在识别前需要对待识别图像做预处理,包括去除噪声,边界增强,增加亮度等等。
通常采集到的图片由若干个字母或数字等组成,因此还需要将每个字符分离开来,便于下一步进行相关度计算。分割图像可以先采用边缘检测将背景区域和目标图像分离开来。再利用阀值分割,将连续字符分割为单个的字符图像。为了方便最后的识别,论文将得到的分割图像反色后填充,得到在白色背景前的图像。
(2)与模板库中的字母逐一进行相关运算,寻找相关度最大值所对应的模板;
在字符识别中对于实现离散输入模式分类最为有效的方法采用模板匹配,其实质内容就是度量输入和样本之间所存在的某种相似性,取相似性最大者为输入模式所属类别,它根据字符的直观形象抽取特征,用相关匹配原理进行识别,即将输入字符与标准字符在一个分类器中进行匹配。字符相关匹配算法如下:
将分割好的字符作为输入字符和标准模版函数的大小均调整为640×480,用MATLAB中的corr2函数直接一一计算两个字符图像间的相似度和相关系数。然后寻找出拥有最大相关值的模板。
(3)输出与此相关度最大的模板。
3 结束语
超分辨率重建有着越来越广泛的应用场合:(1)将从视频信号中采集的图像重建位高分辨率图片;(2)有线电视系统中将标清电视转换为高清电视;(3)在医学成像系统中(如CT、超声波仪器等)、车牌识别等实际应用中也具有很重要的意义。
[1]杨浩.一种基于实例的文本图像超分辨率重建算法[J].东南大学学报,2008.
[2]朱翚.利用MATLAB进行图像重建的算法研究[D].苏州:苏州大学,2003,(12)
[3]王慧琴.数字图像处理[M].北京:北京邮电大学出版社,2006.
[4]阮秋琦.数字图像处理学[M].北京:电子工业出版社,2007.2:382.
[5]贾永红.数字图像处理 [M].武汉:武汉大学出版社,2003.9:197-198.
[6]高成.MATLAB图像处理与应用[M].北京:国防工业出版社,2007.4.