基于幅值谱和神经网络的交通标志识别算法研究
2015-12-17魏艳艳
魏艳艳
摘要:在交通标志实时识别过程中,由于参考图像与实测图像不是同时获取的,因此摄像机与被摄交通标志之间的位置难以保证完全相同。于是,所获取的参考交通标志图像与实测交通标志图像之间就可能产生几何失真。几何失真将对于图像识别的结果带来很大的影响。因此,需要寻找一种具有旋转和比例不变性的图像识别方法,以满足实际应用中的需要。针对上述问题,提出了一种基于幅值谱和神经网络的交通标志识别算法。實验结果表明,所提出的识别算法具有很好地识别能力。
关键词:交通标志识别;神经网络;幅值谱
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2015)27-0156-03
Abstract: in the process of real time recognition of traffic signs, the reference image and real image are not acquired simultaneously, so the position of the camera and the traffic signs are difficult to be guaranteed. Thus, the obtained reference traffic signs and traffic signs can produce geometric distortion. Geometric distortion will have great influence on the result of image recognition. Therefore, it is needed to find a method of image recognition with rotation and scale invariance to meet the needs of practical application. In view of the above problems, a traffic sign recognition algorithm based on amplitude spectrum and neural network is proposed. Experimental results show that the proposed algorithm has good recognition ability.
Key words: traffic sign recognition; neural network; amplitude spectrum
道路交通符号识别是利用计算机视觉技术自动地从图像中检测出交通符号并对交通符号进行识别的研究领域。为了安全驾驶和高效运输,交通部门在公路道路上设置了各类重要的交通符号,作为道路交通的有关信息提供给司机。在智能运输系统(ITS)中,如何实现交通符号的自动识别,对于自动驾驶或驾驶辅助系统来说,都是非常重要的。
自主导航系统要识别的交通标志图像是车辆在运动过程中通过车载摄像机获取,致使所获取的标志图像与实际交通标志之间可能产生几何失真,这种失真将对图像识别的结果带来很大的影响。因此,需要寻找一种具有平移、旋转及比例变换不变性的图像识别方法,以满足实际应用的需要。针对上述问题,本文提出了一种基于幅值谱和神经网络的交通标志识别算法。
1 基于幅值谱和不变矩的图像特征提取
对图象特征提取的算法进行研究分析后得知,常用的图象特片提取算法有四种,分别是灰度共生矩阵征提取算法、主分量分析用于特征提取算法、Hu不变矩特征提取算法、幅值谱二次特征提取算法,在本次实验中使用这四种方法做了结果对比,最终将采用基于幅值谱和不变矩的图像二次特征提取的算法。
矩在文字识别或其他图像识别中作为有效的统计特征而被广泛使用。它之所以能被用来表征一幅二维图像是基于帕普里斯(Papoulis)唯一性定理。不变矩法最初由Hu提出,后又被许多学者加以改进,使不变矩特征的描述能力得到不断的提高。Hu矩组是图像中心矩[ηpq]前7个矩的函数,它们分别为:
上述7个Hu不变矩可被用作图像特征向量,Hu矩组反映了图像的本质属性,并且具有平移、旋转、镜像和尺度不变性。此方法的主要缺点是高阶矩对噪声敏感。一般情况下,噪声被认为是高频分量,而图像的低中频区域反映了图像的整体轮廓,所以可以首先对图像进行傅立叶变换,将图像从空域变换到频域,从而得到能量主要集中在低频区域的图像的幅值谱。但是幅值谱不具有旋转和尺度不变性,于是就需要对幅值谱进行二次特征提取。由上文可知,Hu矩组提取出的7个特征具有平移、旋转和尺度不变性,所以选择通过Hu矩组对图像的幅值谱进行第二次特征提取。这样经过两次特征提取,从理论上分析,提取出的特征向量应该不仅具有平移、旋转和尺度不变性,同时还具有抗噪和抑制图像光照不均的优点。
基于幅值谱的二次图像特征提取算法流程如下:
本次实验选择理想的交通符号图像及其经过变形或添加适量噪声后的图像作为实验样本,验证上述4种图像定位算法的几何不变性和抗噪干扰能力。实验结果如表1所示。
由上面实验数据发现,基于Hu不变矩的特征提取以及基于幅值谱的二次特征提取所提取出的特征向量基本满足旋转、尺度不变性,同时对于添加噪声的图像也基本可以实现正确辨识。鉴于基于幅值谱的二次特征提取对噪声的抑制能力好一点,所以最终确定通过对图像幅值谱进行二次特征提取来提取图像特征。
2 交通符号的预处理
本次实验选取标准交通符号图库中的4种指示标志、5种禁止标志和4种警告标志13幅不同的真彩色指示交通标志图像,如图2所示。首先将真彩色的指示交通标志图像样本进行数字化处理,将其转换为256级的灰度图像,并以BMP文件格式存储,图像大小以32×32像素为例。
3 网络训练及结果分析
对上面三类交通符号图像经二值化处理后,分别采用基于幅值谱的特征提取算法提取其特征向量,并以此作为BP网络的训练集。本文选择的是双层识别网络结构,这种双层识别网络结构中有4个BP网络,即1个粗分BP网络和3个细分BP网络。BP网络部分完成公路交通符号的粗分,将公路交通符号分为指示标志(01)、禁止标志(10)和警告标志(11),接下来的BP网络1、BP网络2和BP网络3分别完成对三种粗分结果的细分。
3.1 粗分BP网络
此时网络输入为经过图像特征提取后的7个图像特征,所以确定输入层神经元个数为7,网络输出是三种粗分类别,指示标志、禁止指标和警告标志分别对应二进制编码01、10和11,所以确定输出层神经元个数为2。由于隐含层神经元个数的确定没有理论指导,根据经验公式,隐含层神经元个数应在[4~17]个之间,所以此处采用隐含层神经元个数可变的BP网络,通过对比网络误差,选择最优的隐含层神经元个数。网络训练误差如表2所示。
表2表明,经过6000次训练后,隐含层神经元个数为8的BP网络误差res=0.065403最小,而且经过11次训练就达到了目标误差。
3.2 细分BP网络
细分网络完成交通符号的细分,包括三个子网络:指示标志细分网络、禁止标志细分网络和警告标志细分网络。三个子网络网络结构类似,输入层神经元个数均为7,由于细分网络输入图像最多是5个,二进制编码即101,所以此处选择输出层神经元个数为3,同样采用隐含层神经元个数可变的BP网络,选择使最终网络误差最小的最优隐含层经元个数。这里以指示标志为例说明细分网络的组成和工作原理。
对于指示标志细分网络,输入神经元个数仍然为7个,输出神经元个数为3个,所以通过经验公式确定隐含层数目应该在[4~17]个之间。通过隐含层神经元个数可变的BP网络训练后,网络误差如表3所示。
观察表3,发现隐含层神经元个数为7的BP网络误差最小,且只需要训练2次就达到目标误差要求。同样对于禁止标志和警告标志也进行和上面类似的训练后,就能够确定解决此交通符号分类问题的4个BP网络结构。
3.3 网络测试
网络测试的目的是为了确定网络是否满足实际应用的要求。这里测试数据与训练用的样本数据应该不一致,否则,测试出的结果永远都是满意的。
本次网络测试选择标准交通符号图像库中的4幅理想指示标志图像、5幅禁止标志图像和3幅警告标志图像,如图3所示,将测试样本同样规格化为32×32大小,对它们进行二值化处理后提取特征,并把特征向量送入识别网络进行识别。
将上述的12幅已二值化处理的标准交通符号图像的特征向量作为粗分BP分类器的测试集输入到输入层,网络测试结果如表4所示。
观察上表发现,网络共有测试样本12个,经过适当的阈值处理,正确识别12个,错误识别0个,网络识别率为100%。
4 结论
1)实验结果表明,采用幅值谱提取Hu不变矩,可以有效地抑制噪聲和光照不均的影响。
2)和传统BP神经网络识别方法相比,本文采用的双层识别网络结构,由于消除了重复训练的缺陷,这种网络结构在训练速度上明显提高,同时识别率更高。
参考文献:
[1] 朱双东,陆晓峰.道路交通标志识别的研究现状及展望[J].计算机工程与科学,2006(12).
[2] 吕瑾文.基于不变矩和小波神经网络交通标志识别研究[D].武汉:武汉理工大学,2009.
[3] 徐科,李文峰,杨朝霖. 基于幅值谱与不变矩的特征提取方法及应用[J].北京科技大学自动化学报. 2006(3).
[4] 秦香英,黄亚飞,刘伟铭.基于不变矩和小波神经网络的标志识别方法[J].长沙交通学院学报,2005(2).