重轨生产线钢坯字符识别方法
2012-06-11杨义军洪汉玉章秀华王逸文俞喆俊
杨义军,洪汉玉*,章秀华,王逸文,俞喆俊
(1.武汉工程大学图像处理与智能控制实验室,湖北 武汉 430205;2.北京科技大学数理学院,北京 100083)
0 引 言
国内的钢铁集团和大型轧钢厂主要靠人工检测识别钢坯端面的字符,并没有形成对钢坯字符进行计算机自动识别的成熟技术.因此急需钢坯字符识别方法,以满足高速重轨生产线钢坯从炼钢到轧钢的支支跟踪需求,提高生产率.但由于武钢高速重轨生产线场景复杂,以及钢坯号字符复杂多变没有固定的模式,如图1所示,使得重轨生产线钢坯字符识别在理论和方法上存在着以下难点[1]:1)复杂环境:生产线复杂的外部环境严重影响着钢坯字符的正确识别,如生产线高温、高热,光照不均、白天和晚上不同的背景光、光照角度等.2)字符缺陷:钢坯字符存在字体变异、污损、字符信息微弱、字迹模糊、断字、粘连等现象,这都增加了钢坯字符切分的难度,最终对钢坯字符的正确识别提出了挑战.3)在线识别:为了满足生产线时实性的需要,对钢坯字符识别速度以及识别算法的鲁棒性、准确性与适应性提出了很高的要求.
对于字符的识别,国内外相关学者对相关理论和方法都进行了广泛而充分的研究,并且已初步用于一些工业和生产领域,如集装箱号识别、车牌识别、在线IC卡码号识别、轮胎型号字符识别[2-5]等实际应用环境中.但由于上述生产线复杂因素的影响,这些实际应用的识别理论和方法就会表现出一定的针对性和局限性,使得最终的识别结果并不十分理想,很难有效地解决和处理重轨生产线钢坯字符识别这一难题.
图1 重轨生产线采集复杂场景钢坯字符图像Fig.1 Captured image in the heavy rail production line
1 识别系统简介
重轨生产线钢坯字符识别是针对重轨生产线钢坯支支跟踪的需求而提出的应用开发,它的工作原理是:炼钢钢坯通过辊道以一排排的方式传输至轧钢生产线,在入炉前通过红外光电传感器发出触发信号给高精度相机,触发采集钢坯字符图像,然后通过千兆网线传输给工业控制计算机,通过识别软件识别出钢坯号字符信息,从而达到对钢坯支支跟踪的目的.其工作原理如图2所示.
图2 重轨生产线钢坯字符识别系统工作原理Fig.2 Working principle diagram of billet character recognition system
2 钢坯字符识别过程
钢坯字符识别作为一种特殊的光学字符识别技术,是重轨生产线钢坯字符识别系统的重要组成部分.钢坯字符识别流程同光学字符识别技术一样,主要经过钢坯端面字符定位、切分、识别三个步骤来实现钢坯字符信息的自动识别,如图3所示.
图3 钢坯字符识别过程Fig.3 Recognition process of billet character
2.1 钢坯字符定位
字符定位就是找出钢坯图像中字符所处的位置,是字符识别中非常关键的第一步,直接影响着识别系统的识别率.但由于现场环境恶劣、光照复杂、钢坯运动导致字符区域变化较大等因素的影响,都加大了钢坯字符精确定位的难度,影响了钢坯字符识别率,因此精确定位出复杂场景中的钢坯字符是非常必要的.
拟采用的定位方法是基于二值图像的投影定位,要精确定位钢坯字符其二值图像就要完整地突出钢坯字符.针对复杂场景中精确定位钢坯字符这一难题,采用基于最大类间方差的递归二值化方法来获得钢坯字符二值图,采用逐级滤波方法来抑制背景信息,并采用字符聚类方法自适应区分目标字符区域和非目标字符区域,最终精确提取出钢坯号字符[6].研究结果表明,定位方法在生产线场景中有着更好的稳定性和准确性,解决了复杂条件下字符定位的自适应性、鲁棒性、实时性与可应用性等关键科学技术问题.
2.2 钢坯字符切分
字符切分就是将一连串的钢坯字符串分离成单个的字符图像,字符切分是字符识别的前提,也是提高字符识别率的关键技术之一.常用字符切分方法有:基于图像分析切分法(静态投影)、基于识别切分法、整体切分法及前三种方法结合的方法[7-9].上述方法虽各有优点,但由于钢坯号字符的多样性,使得字符的切分过程不易定量,则上述方法会有一定的局限性而达不到预期的切分效果.针对重轨生产线钢坯字符切分这一难题,将多代理者技术[10]应用其中,提出一种基于智能多代理者的字符切分处理方法.其中,将字符区域分割与切分、区域合并、区域分裂、特征计算等功能子程序作为个体代理者.
首先主控代理者调用字符分割与切分代理者,对定位出的钢坯字符图像进行二值化处理,并对其垂直投影初步切分;接着调用特征计算代理者搜集各切分区域的性质和特征,如字符区域宽度、高度、中心距等特征,并对切分后的各个区域的性质特征进行判断,主控代理者将调用相应的区域分裂或区域合并代理者对粘连或断裂字符区域进行分裂或合并;然后再次调用特征计算代理者,对切分结果进行校正;若经校正已经没有字符发生粘连或断裂情况,则终止算法,反之,则调用相应代理者进一步精确切分,直到完成钢坯字符的正确切分,这样形成了钢坯字符“判断—切分—校正”的智能切分.研究结果表明切分方法对生产线钢坯字符信息微弱、粘连与断裂等情况下有着更好的适应性与准确性,解决了重轨生产线复杂场景中的钢坯字符准确切分的问题.
2.3 钢坯字符识别
字符识别是识别系统的关键环节,经过精确切分后的单个字符图像,经过字符识别的处理,就可以转化为便于计算机处理和存储的信息.常用字符识别算法主要有特征统计匹配识别法、基于模板匹配识别法和基于神经网络识别法[11-15]等.这些方法虽各有优点,但在钢坯号字符模糊、字符变异、字符倾斜、字符污染、残缺等情况的实际复杂场景中,则会有一定的局限性而得不到正确的识别效果.针对生产线场景下钢坯字符形态的多样性,仅依靠单一字符模板匹配可能不能适应复杂多变的钢坯字符.因此在模板匹配算法的基础上,提出了字符结构特征识别来弥补单独采用模板匹配算法的不足,将模板匹配与字符结构特征识别相结合来实现钢坯字符的多级识别,解决在线复杂场景下钢坯号字符识别这一难题.
2.3.1 模板匹配 模板匹配方法的实质是度量待识别钢坯字符图像与模板图像之间的某种相似性,取相似性最大者为待识别字符图像识别结果.它依据待识别钢坯字符的直观形象抽取特征,用相关匹配原理进行识别,即将输入待识别钢坯字符与标准模板字符在一个匹配测度下进行匹配,待识别钢坯字符与模板字符匹配的测度如式(1)所示.
R(i,j)=
(1)
式(1)中,T(x,y)为M×N模板图像,Fi,j(x,y)为待识别子图像.
当模板与图像进行匹配时,测度R(i,j)的值越大,模板图像和待识别图像越匹配,当取最大值时,便指出了模板图像和待识别图像的最佳匹配结果,便得到了识别结果.
2.3.2 字符特征识别 字符特征识别的关键在于特征的提取,就是提取字符图像中用户感兴趣的特征用于区分相似度很高的字符.考虑到人眼对字符的识别,主要是凭着对字符的结构、轮廓等直观的结构特征进行的,因此,若能够精确表征和提取字符的结构特征,识别系统便能快速准确的区分不同字符.由于钢坯字符的多样性,没有固定的特征,需要构造一系列特征,如字符宽高比、字符边界特征、闭合曲线和开口方向特征、字符端点数与位置特征、高度/宽度变化特征、投影特征、笔划密度特征、字符占空比等特征.并将上述特征进行归类,分为主特征,次特征和辅助特征.首先对于模板匹配失败的字符,提取其主特征和次特征,并根据其特征的判断准则进行识别,若能通过主特征与次特征将该字符与其他字符区分出来,得到可靠的识别结果,则终止识别算法;若该字符与模板库中多个字符有着相同的主特征与次特征,则继续提取待识别字符的辅助特征进行识别,直到区分出该待识别字符、正确识别出该待识别字符为止.
3 实验结果与分析
为了验证所提出钢坯字符识别算法的可靠性与适应性,在线采集了复杂场景下的钢坯号字符图像进行了实验,其中包括:钢坯倾斜、钢坯腐蚀、字符残缺、字迹模糊及粘连等复杂情况.提出的算法均是在VC++6.0的环境下实现的,进行了钢坯号字符定位、复杂钢坯端面字符切分、以及复杂场景下钢坯字符识别等实验,如图4至图6所示,实验结果表明的钢坯字符识别方法有着较高的识别率,能适应各种复杂多变的复杂场景中,具有一定的适应性,能够满足重轨生产线实验钢坯检测的需求.
图4 钢坯号字符图像定位Fig.4 Location of billet character
图5 复杂钢坯字符切分(钢坯端面腐蚀、字符粘连)Fig.5 Segmentation of billet character (The connected characters and the corrosive billet ends)
图6 字符识别结果(钢坯倾斜、字符残缺)Fig.6 Recognition results (The slanting billet, the missing character)
4 结 语
以上针对重轨生产线钢坯字符识别这一技术难题,提出了钢坯字符定位、切分、识别等算法.对于钢坯字符的定位,采用基于最大类间方差的多级分割滤波与聚类处理突出并找出字符目标区域,从而精准定位出钢坯字符.对于钢坯字符的切分,采用基于智能多代理者的切分算法,解决了钢坯字符精确切分这一难题.对于钢坯字符的识别,在模板匹配的基础上,采用结构特征与之结合的多级识别算法来提高钢坯字符识别率,满足了重轨生产线实时性的需求.从实验结果可知,识别算法能够较好地适应复杂多变的环境,具有一定的稳定性和适应性,能够满足重轨生产线钢坯支支跟踪的需求.
参考文献:
[1] 洪汉玉. 现代图像图形处理与分析[M]. 武汉: 中国地质大学出版社,2011.
[2] 阚伟, 朱秋煜. 一种新的用于集装箱字符的识别方法[J]. 东北师大学报:自然科学版, 2000, 32(4): 20-24.
[3] 柴治, 陶青川, 余艳梅,等. 一种快速实用的车牌字符识别方法[J]. 四川大学学报:自然科学版, 2002, 39(3): 465-468.
[4] 郑胜林, 潘保昌, 徐杜, 等. IC卡在线检测的码号定位分割方法研究[J]. 中国图象图形学报, 2004, 9(12): 1430-1436.
[5] 何明霞, 李萌, 宁福星. 基于字符识别的轮胎型号识别系统[J]. 橡胶工业, 2009, 4(56): 237-241.
[6] 俞喆俊, 洪汉玉, 章秀华, 等. 生产线复杂场景钢坯检测识别的定位方法研究[J]. 光电工程, 2012, 39(1): 54-61.
[7] Chen T S, Chen M C. A New Search Engine for Chinese Document Image Retrieval Based on Chinese Char-
acter Segmentation Features[J]. International Journalof Computer Processing of Oriental Languages, 2002, 15(4): 417-431.
[8] Keunhwi K, SungHoo C, Pil Y J, et al. Character segmentation and recognition algorithm for various text region images[J]. Transactions of the Korean Institute of Electrical Engineers, 2009, 58(4): 806-816.
[9] Jung C, Liu Q, Kim J. A new approach for text segmentation using a stroke filter[J]. Signal Processing, 2008, 88(7): 1907-1916.
[10] Wooldridge M, Jennings N R, Kinny D. The Gaia Methodology for Agent-Oriented Analysis and Design[J]. Autonomous Agents and Multi-Agent Systems, 2000, 3(3): 285-312.
[11] Wang D P, Li J Z, Fang S Q. Research and realization of print form character recognition system based on characteristic value[J]. Procedia Engineering, 2011(15):2196-2200.
[12] Takahashi Y, Tanaka H, Suzuki A, et al. License plate recognition using gray image template matching with noise reduction filters and character alignment[J]. Systems and Computers in Japan, 2007, 38(3): 49-61.
[13] Sternby J, Morwing J, Andersson J, et al. On-line Arabic handwriting recognition with templates[J]. Pattern Recognition, 2009, 42(12): 3278-3286.
[14] Namane A, Guessoum A, Djebari M, et al. Hopfield-multilayer-perceptron serial combination for accurate degraded printed character recognition[J]. Optical Engineering, 2006, 45(8):087,201.
[15] Shelke S, Apte S. A multistage handwritten Marathi compound character recognition scheme using neural networks and wavelet features[J]. International Journal of Signal Processing:Image Processing and Pattern Recognition, 2011, 4(1): 81-94.