APP下载

汽车里程表读数自动识别系统的研究与实现

2016-06-12李健龙永红石伟杨丹君张禹

新型工业化 2016年4期
关键词:机器视觉支持向量机特征提取

李健,龙永红,石伟,杨丹君,张禹

(湖南工业大学 电气与信息工程学院,湖南株洲 412007)



汽车里程表读数自动识别系统的研究与实现

李健,龙永红,石伟,杨丹君,张禹

(湖南工业大学 电气与信息工程学院,湖南株洲 412007)

摘要:为了能够自动、准确的识别出汽车里程表的读数,设计了一种基于机器视觉汽车数显式里程表读数自动识别系统。首先对获取的彩色仪表图像提取R通道图,采用最大类间方差算法获取二值化图像,利用基于最大连通域的方法分割出LCD数显式里程表,然后利用双向投影法分割字符、递归细分法字符特征提取,最后设计一种核函数为RBF的支持向量机(SVM)分类器进行数字识别。系统在VC6.0编程环境下运行,大量的试验表明,本算法耗时低、识别率较高。

关键词:机器视觉;特征提取;支持向量机;数字识别

0 引言

近年来,机器视觉技术在仪表读数辨识中扮演了十分重要的角色,也顺应了当前智能制造的大趋势。传统的校验过程中受人眼易疲劳和分辨能力有限等主观因素的影响,造成随机误差甚多、不易实现有效的信息集成等弊端,而基于机器视觉的读数识别[9]技术是一种获取仪表数据的新途径,用图像处理与模式识别的综合技术来智能读取被测仪表的读数,具有高稳定性、实时性较好等优点,明显地提高了工业自动化生产水平。

国外的Miguel RODRIGUEZ et al.(2012)设计了一种基于Hausdorff距离(HD_MR)的数字识别新算法,该算法利用有向距离为测量手段,判断图像中两个点之间的最短距离,最后针对显示器最后一位、最后三位滚动及全滚动时产生半字符的情况下,利用字符和空白区域所占比例大小有效的判别出半字符数字。2013年,P A Belan等人针对于测压计显示的数字提出用模板匹配法进行了数字判别,首先提取数字目标所在区域(ROI),利用归一化互相关方法有效消除了光照不均匀等变化而带来的不利影响,在匹配度最高时反映最为强烈,相关性越高,最后识别率可达99.7%以上。但是,算法运行速度很慢。晁阳等提出一种识别表盘刻度数字的方案,他充分利用数字在刻度线分上布的规律性,无论是指针式仪表读数识别还是数字仪表的字符识别,在图像处理中都使用Hough变换及其改进算法,最后采用BP神经网络对数字字符进行识别。崔行臣等设计了一个用户图形化界面对字符显示区域定位,通过一个自由伸缩的矩形框来定位字符串所在位置,提出了一种基于拓扑结构的数字字符识别方法,该方法可以忽略两种字符类型结构的差异而对字符正确识别。

但是,目前仍存在字符区域自动分割困难、字符识别率低等缺点,基于对这些问题的研究,针对于汽车组合仪表中数显式里程表读数的识别而言,设计了一种机器视觉汽车数显式里程表字符识别系统,该系统能高效、准确的识别出里程表显示的数值。

1 系统方案

汽车仪表LCD显示区域具有如下特点:(1)位于表盘下方中部且形状近似为矩形;(2)呈现明显的高亮度信息;(3)显示字符为印刷体英文字符、阿拉伯数字以及小数点。系统研究实例对象如图1所示。

系统实现方案包括三大模块,第一部分是图像采集模块,第二部分是图像分割模块,第三部分是字符分类识别模块。图像采集模块的实现包括图像的采集、量化,分割模块的实现包括图像增强、灰度化、区域分割、形态学处理、连通域提取,识别模块包括倾斜校正、字符分割、特征提取、分类器识别等。

为了能够自动识别汽车里程表显示的读数数值,首先将采集到的汽车仪表表盘图像使用图像分量法提取R通道把RGB图像灰度化,随之利用图像分割技术进行感兴趣LCD区域[2](ROI)提取,减少了数据存储量,抑制了非必要信息的干扰,再将处理后的二值图像经过图像校正、图像求补、图像字符定位与分割、字符特征提取等一系列的处理,最后把提取的字符特征送入预先设计的字符分类学习器进行读数字分类,从而有效的辨识了读数。如图2所示为本系统整体方案图,从整体方案框图中可以明显的看出基于机器视觉汽车组合仪表中LCD里程表读数自动识别系统的算法设计思想及处理流程。

图1 原始图像Fig.1 Original image

图2 系统整体方案图Fig.2 System total schematic diagram

2 ROI提取

通常,一幅图像数据信息量很多,但多数情况下只需要分析感兴趣ROI区域以减少数据量,感兴趣区域提取技术涉及到图像分割。目前国内外有很多人对图像分割方法进行了大量的研究,主要有基于像素的方法、基于区域的方法、基于边缘的方法、基于特定理论模型的方法等,而在实际运用中常会使用它们的改进型或组合技术。SHOJAII等人[8]利用图像梯度信息和分水岭技术寻找到CT图像中肺部所在位置,但是抗噪能力很弱,尤其是光照不均下图像梯度大幅度改变而导致分割十分困难。系统采用基于最大连通域方法提取LCD目标区域。感兴趣区域分割算法的流程如下图3所示。

图3 LCD区域分割算法Fig.3 LCD region segmentation algorithm

2.1灰度化

彩色图像RGB模型中,如果R=G=B,则彩色表示为一种灰度颜色,其中这个值叫灰度值。一般有2种常用的方法对彩色图像进行灰度化:

(1)加权平均值法。根据3个分量的重要性及相关指标,将3个分量以不同的权值进行加权平均运算,即

(2)分量法。用RGB三个分量的某一个分量的亮度值[1]作为该点的灰度值,即

采用以上两种不同的方法对RGB图像灰度化的效果对比如图4所示。

2.2二值化

二值化分割就是提取某一阈值T,用T将图像的数据分成两个大部分:大于T的像素群和小于T的像素群。

本算法中采用的二值化方法是基于像素点的自适应大津算法(Otsu),该算法对直方图用某一灰度值分割成两组,当被分割成的两组目标类间方差最大时,此灰度值就作为图像二值化的阈值。根据仪表特点采用自适应Otsu算法,分别对以上两种灰度化图像进行二值化处理,结果对比如图5所示。

图4 两种灰度化方法对比图Fig.4 Comparison of two methods of gray scale

图5 大津算法对两种灰度图像二值分割效果Fig.5 Otsu algorithm for two kinds of gray image two value segmentation results

从图5中可以看出,Otsu算法对加权平均法灰度化图像进行二值分割后得到大面积白色连通区域,对后续提取LCD区域干扰较大。相反,对R通道进行自适应Otsu算法的分割效果较好,因此,系统采用Otsu算法对原始RGB图像的R通道灰度图像进行二值化。

2.3最大连通区域提取

本算法采用基于最大连通域的方法提取LCD二值区域,其实现步骤为:

(1)遍历R通道二值图像所有点,依次寻找8连接分量的所有连通区域,把每个连通域内所有值以序号n(1,2,…)代替,建立标记矩阵L存储数据;

(2)依次循环i=1:n,计算每一个标记矩阵L内像素总数S(i);

(3)求S(i)中最大值Smax,令Smax连通区域内的所有值置1,其余连通域置0;

(4)完成最大连通域提取。

如图6所示,是基于最大连通域的方法提取的LCD二值区域效果图。

2.4彩色空间显示提取的LCD区域

在RGB向量空间中显示被分割的感兴趣LCD区域如图7所示,可以方便直观的看出分割结果,具体算法如下:

(1)选用已提取的最大连通域图像作为待提取彩色区域样本,记作二值掩模图像;

(2)依次提取原彩色图像的R、G、B三通道图;

(3)用该二值掩模图分别与R、G、B通道进行图像乘法[9]操作,结果记为red、green、blue;

(4)将red、green、blue三幅图像作向量级联,构造3维新矩阵图像即为被提取出的LCD区域。

图6 最大连通区域提取的二值效果Fig.6 Two value effect of maximum connected region extraction

图7 RGB向量空间提取的LCD区域Fig. 7 LCD region of RGB vector space extraction

3 字符识别

字符识别的方法有基于统计特征[10]的识别方法、基于几何特征的识别方法,此外还有基于学习的相关方法,这些方法各有优缺点,适用于不同情况下的字符识别。Krez yakhe和 Le Cun采用BP神经网络竞争监督学习策略去除字符冗余矛盾信息、强化类间差异,可识别模糊破损的字符,但学习效率和算法收敛性等有待于改进。Paunwala等(2010)采用形态学和连通成分滤波的方法提取了印度交通监控中混合车牌中的字符。

针对于系统中LCD显示的字符及其结构特征,在平衡速度的前提下采用了SVM分类器进行识别字符,设计了一种有效的字符识别算法如图8所示。

为了得到每一个目标字符信息,分割出单个字符是必要的,因此,识别之前需要进行字符分割。但是,大多数情况下得到的图像不是水平的,具有一定的倾斜角度,因此,在字符定位之前需要倾斜校正。本算法重点描述字符分割的主要原理和和字符识别的方法。

图8 字符识别算法Fig.8 Character recognition algorithm

3.1字符分割

字符分割在数字识别系统中起着举足轻重的地位,它是后续字符特征提取和识别的前提条件。投影法[3]分割是分别向纵坐标和横坐标进行扫描,求得相应的一列和一行的灰度累计之和,根据灰度累计分布,采用门限法或峰谷值寻找法获得单个字符。本文采用双向投影法对二值图像进行单个字符切分。公式(3)是垂直投影灰度累计,公式(4)水平投影灰度累计。

垂直投影法具体步骤如下:

(1)遍历图像求竖直方向上每一列的像素总和,并建立一维数组C保存数据;

(2)依次搜索数组C中的元素,if C(k)-C(k+1)〉0&&C(k+1)==0,则原图像中的第k列(右端)标记为白色;if C(k+1)-C(k)〉0&&C(k)==0,则原图像中的第k+1列(左端)标记为白色;扫描被竖直标记的图像第一行,用一位数组D保存;

(3)寻找D中非零像素的坐标并求出非零像素的个数n;

(4)依次循环计算i=0:n/2-1,利用等差数列通向公式j=i*2+1提取上一步非零元素纵坐标的第j+1:(j+1)-1列像素;

(5)完成单个字符分割。

双向扫描标记效果图如图9所示,字符分割时不能超越上、下标记线的边界,以保证分割后字符的完整性。双向投影曲线图如图10所示,从图中可以明显看出双向投影的总灰度值及字符间隔的大小,最终的字符切割效果如图11所示。

图9 双向扫描标记效果图Fig.9 Two way scanning mark effect chart

图10 双向投影曲线图Fig.10 Bi-directional projection curve

图11 最终分割效果图Fig.11 Final segmentation effect chart

3.2特征提取和分类

3.2.1字符特征提取

特征提取的目的是描述一个对象在同一类事物中与其他物体相似度的程度,但在不同类别的情况下提取非常困难。在分类辨识系统中,正确选择有识别力的特征是任何一种模式识别的关键因素。本算法针对于字符图像采用基于递归细分[6]的特征提取方法,把二进制图像递归细分,用固定长度的坐标向量表示特征向量。坐标计算采用以下步骤:以固定大小的输入图像中心(一阶矩)的横坐标为x为对称轴,图像被x轴分为两个子图像,它们转置后相对于原始图像的坐标都要被重新计算,然后得到的两个新子图继续被细分。字符图像递归分割如图12所示,输出向量的大小为2d-1,其中d为细分的深度。由于这个细分总是沿一个轴把图像分为两个部分,在转置图像中为了平衡特征输出向量的计算,原始图像向量和转置图像向量都连接到输出向量中。本算法是针对26个英文字符、小数点、10个数字字符在递归深度为6时实现特征提取。

图12 字符图像递归分割Fig.12 Character image recursive segmentation

3.2.2分类器

支持向量机[7](SVM)是一种不做任何假设而潜在观测数据的一种监督机制分类学习方法,因此系统采用SVM对仪表字符分类识别。最初的SVM用于二分类,但现在也能解决多种类问题,即把一个多种类问题分解为许多二类问题。SVM是用超平面分离不同的类,但每一个类只有一个最优的超平面,因为构造的超平面是基于最大类间的“边缘”特性的原因,因此,一个新的数据样本根据超平面的边界决策而被正确归类(Zheng and He,2006)。

系统采用多种类SVM分类器(SVM库),其核函数一般有:线性核函数、多项式核函数、高斯径向基函数[4-5](RBF)和S型函数,SVM有效的分类取决于核函数选择、核参数、软边缘和惩罚因子常数C。本字符识别系统是针对于37个字符(26个英文字符,10个阿拉伯数字字符,一个小数点)而设计,由于RBF核函数的高精度特性,因此本算法选择RBF核函数(单一参数),其数学公式为:

分类器的最佳组合是通过交叉验证参数C和r而逐次提高精度标准来选择。

4 实验结果

为了验证本系统算法的有效性,系统所研究的试验样本全部是在自然环境下采集的比亚迪F3系列汽车仪表表盘图像,采用VC6.0为试验平台,样本容量为50。样本试验结果统计情况如表1所示。

由表1可以看出,系统对于三种字符的识别率基本都在94%以上,且最低拒识率为2%,识别率较高,算法运行时间为1100ms,因此,整个系统的运行时耗比较低。

5 总结

系统设计了一种基于机器视觉汽车组合仪表中里程表读数自动识别的系统,首先对采集到的仪表表盘彩色图像提取R通道图,使用基于最大连通域提取感兴趣LCD区域,然后利用双向投影法对校正之后的字符区域进行单个字符分割、递归细分法字符特征提取,最后设计SVM分类器有效的识别出字符种类,从而辨识了读数。当然,算法中也涉及到数学形态学、去噪滤波等技术。大量的试验表明,本算法具有识别速度快、识别率高、稳定性好等优点,但是也存在一定的不足,比如在光照不均下LCD区域分割困难、字符细分精度越高则耗时越长等,这就需要在长期的应用过程中加以优化和改进。

表1 样本实验结果Tab.1 Sample test results

参考文献

[1]Ghugardare R P,Narote S P,Mukherji P,et al.Optical Character Recognition System for Seven Segment Display Image of Measuring Instruments[C]// 2009 IEEE Region 10 Conference.[S.1.]:IEEE,2009:1-6.

[2]C.Y.Suen.Character recognition by computer and applications.In T.Y.Young and K.S.Fu,editors,Handbook of Pattern Recognition and Image Processing.New York,Academic Press.1986,569-586.

[3]C.M.Bishop.Neural Network for Pattern Recognition.England:Oxford University Press,1995.

[4]Shen Huiying,Coughlan J.Reading LCD/LED Displays with a Camera Cell Phone[C]//2006 Conference on Computer Vision and Pattern Recognition Workshop.[S.1.]:IEEE.2006:1-6.

[5]Liang Chao,Yang Wenming,Liao Qingmin.An Automatic Interpretation Method for LCD Images of Digital Measuring Instruments[C]//2011 4th International Congress on Image and Signal Processing.[S.1.]:IEEE,2011: 1826-1829.

[6]肖晓,徐启华.基于SVM与BP的分类与回归比较研究[J].新型工业化,2014.4(5):48-53. XIAO Xiao,Xu Qi-hua.A Comparative Reseach on the Classification and Regreesion Based on SVM and BP[J].The Journal of New Industrialization,2014,4(5):48-53.

[7]Mori S.Historical Review of OCR Research and Development.Proceedings of IEEE,1992,80(7):1028-1057.

[8]李晓东,李志强,雷晓平,等.彩色数字仪表图像二值化技术研究[J].计算机技术与发展,2010,20(4):120-123. Li Xiao-dong,LI Zhi-qiang,LEI Xiao-ping,et al.A Research of Thresholding Technology for Color Image of Digital Instrument[J]. Computer Technology and Development,2010,20(4):120-123.

[9]SHOJAII R,ALIEREZAIE J,BABYIV P.Automatic lung segmentation in CT images using watershed transform [C]//Proceedings of the 8th IEEE International Symposium on Computers and Communicaion. Italy,2005:II-1270-3.

[10]黄莅辰,张剑,周游,等.基于非均匀光照下文本图像二值化改进算法[J].湖南工业大学学报,2013,27 (6):40-45. HUANG Li-chen,ZHANG Jian,ZHOU You,et al.An Improved Image and Text Binarization Algorithm Based on NonUniform Illumination[J].Journal of Hunan University ofTechnology,2013,27(6):40-45.

[11]Katsuyama Y,Minagawa A,Hotta Y,et al.A Study on Caption Recognition for MultiColor Characters on Complex Background[C]//2012 IEEE International Symposium on Multimedia.[S.1.]:IEEE,2012:401-408.

[12]常金凤,李成,李荧.光声成像技术在生物医学中的研究进展[J].新型工业化,2014,4(9):1-10. CHANG Jin-feng,LI Cheng,LI Ying,Development of Photo acoustic Imaging Technology in Biomedical Applications [J].The Journal of New industrialization,2014,4(9) :1-10.

本文引用格式:李健,龙永红,石伟,等.汽车里程表读数自动识别系统的研究与实现[J]. 新型工业化,2016,6(4):1-7.

Citation: LI Jian, LONG Yong-hong, SHI Wei, et al. Research and Implementation of Automatic Recognition System of Automobile Odometer[J]. The Journal of New Industrialization,2016,6(4): 1-7.

Research and Implementation of Automatic Recognition System of Automobile Odometer

LI Jian, LONG Yong-hong, SHI Wei, YANG Dan-jun, ZHANG Yu
(College of Electrical and Information, Hunan University of Technology, Hunan Zhuzhou 412007, China)

ABSTRACT:In order to be able to automatically and accurately identify a car odometer readings, a kind of automatic identification system based on machine vision and car digital odometer readings. First to obtain color meter image extraction R channel graph, by means of maximum between class variance algorithm to get a binary image, and use based on the Dalian region of the segmented LCD digital display odometer. Then the two-way projection character segmentation, recursive subdivision method for character feature extraction, finally design a kernel function for RBF support vector machine (SVM) classifier for digit recognition. System in the VC6.0 programming environment, a large number of tests show that the algorithm is timeconsuming, low recognition rate.

KEYWORDS:Machine vision; Feature extraction; Support Vector Machine; Digital recognition

DOI:10.19335/j.cnki.2095-6649.2016.04.001

*基金项目:国家自然科学基金项目(61503131),湖南工业大学研究生创新基金项目(CX1502)

作者简介:李健(1987-),男,研究生,研究方向:图像处理与智能识别;龙永红(1968-),男,博士,教授,研究方向:模式识别与人工智能、智能仪器;石伟(1990-),男,研究生,研究方向:图像处理与机器视觉,智能检测;杨丹君(1993-),女,研究生,研究方向:图像处理与控制工程;张禹(1991-),男,研究生,研究方向:智能检测

猜你喜欢

机器视觉支持向量机特征提取
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于Daubechies(dbN)的飞行器音频特征提取
Bagging RCSP脑电特征提取算法
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
大场景三维激光扫描仪在研究生实践教学培养中的应用
基于熵技术的公共事业费最优组合预测
基于机器视觉的工件锯片缺陷检测系统设计
基于支持向量机的金融数据分析研究
基于机器视觉技术的动态“白带”常规检测系统的开发