基于卷积神经网络的车标识别
2015-09-18吴锐文厦门大学通信工程系厦门361005
孙 晔,吴锐文(厦门大学通信工程系,厦门361005)
基于卷积神经网络的车标识别
孙晔,吴锐文
(厦门大学通信工程系,厦门361005)
提出一种基于卷积神经网络(CNN)的车标识别方法,通过多层的特征学习,能够直接从训练样本中提取特征,最后送入神经网络分类器进行分类。验证集采用5000个从属于10类车标并附有各类变化的车标数据库,该应用算法达到98.28%的平均准确率和每张少于3ms的识别速度(在MATLAB环境下),实验表明,该方法对于车标识别问题具有优异的准确率和鲁棒性,且对于计算资源要求很低。
智能交通;车标识别;深度学习;卷积神经网络
0 引言
近年来很多基于视觉的智能交通系统应运而生,它们多是用于车辆信息的检测、追踪和识别,尤其是用于城市交通监控和高速管理系统。也正因为智能交通系统的广泛普及,车标识别问题在这些年来也受到了越来越多的关注。
大多数关注车标识别问题的方法采用尺度不变特征变换(Scale-Invariant Feature Transform,简称SIFT)和图像匹配。Dlagnekov and Belongie[1]采用SIFT特征在远景车辆图片上获得了89.5%的准确率,Conos[2]在近景图像上采用SIFT特征达到了90%的准确率,但其共同缺点是处理运算量大,无法做到实时。
卷积神经网络(CNN)是一种含有多层次结构的神经网络[3],每层由包含有独立神经元的一个二维平面组成,通过局部感受野策略和池化方法,CNN可以提高其提取的特征对于旋转平移等变化的鲁棒性并降低计算规模。CNN方法在手写字符识别和人脸识别领域已投入应用并有着优良的识别效果[4~5]。
受到CNN层次结构特征学习上的启发,本文中提出了一种基于CNN的车标识别系统。有别于手工设计的特征,CNN结构的特征可以从原始图像中自动提取。我们采用BP神经网络作为分类器,在一个含有5000个各类变化的车标数据集上达到了98.28%的识别率,并且在28×28大小的车标图上每张处理的时间在未经任何优化的情况下只有3ms,这也说明该方法是十分高效的。
1 算法
1.1车标定位和分割
在本文中,识别任务是在分割好的只含有车标的图像条件下完成的,这就需要我们将车标的定位和分割作为预处理环节,如图1所示,由于该环节非本文的主要工作目标,本文这部分紧跟着Psyllos[7]的工作:
一张含有车辆的监控图片首先被转为灰度图像,再送入车牌定位(License Plate Location,LPL)系统,LPL系统将输出车牌的角点坐标,根据这四个坐标我们就可以得到其上方含有车标的一个大致区域。在该区域上我们采用相位一致性特征图(Phase Congruency Feature Map(PCFM)Calculation[6]),由此,我们即将一副监控含有车辆的图片裁剪为了只含有车标的图片(图1)。
图1
1.2CNN车标识别
在车标定位之后,我们获得了一个只含有车标的小尺寸图片,如图2所示,本文提出的基于CNN的识别系统是一种有监督学习的识别方法,它包含有特征提取和分类器设计两个部分。对于车标识别问题,由于其拍摄光照、视角、背景等因素的多变性,我们需要提取的特征具有很好的表征能力,CNN包含有的三种结构特性恰好能满足旋转、尺度和多类型形变的场景需求,这三种构架分别是:局部感受野、权值共享、池化下采样。
CNN的特征提取环节是由多次交替的卷积层和池化层实现的,其思想是模仿人的视网膜感受神经。如图2所示,我们输入28×28的剪切后车标图像,经过对卷积核的有监督训练我们获得了Ci层:
其中x是原始输入图像,⊗代表卷积运算,i代表了第i个卷积核,sigmoid运算的定义为:sigmoid(x)=1/(1+e-x),在卷积层后紧跟的池化层定义为:
其中C是我们之前获取的卷积层,Ω是一个2×2的方形区域。池化层的作用是在用来减小特征图尺寸规模的同时,增强了特征对于旋转和变形的鲁棒性。在有了卷积层和池化层定义的基础上,前一层的输出作为后一层的输入,最终的特征提取环节由交替地进行(1)式(2)式得到。在本文提出的方法中一共交替进行了两次,也就是说我们含有C1、S2、C3、S4四层。其中的参数设置在表1中提供。
表1
由于自然图像的特性,在一个局部提取特征可能在图中的另一部分仍然有效,因此CNN的卷积层采取了权重共享策略,通过共享权重CNN还做到了旋转不变的特性,因此可以在多变的识别检测领域取得优良的效果,关于多层卷积神经网络的更多细节可以参见文献[4~5]。
对于车标识别任务,我们首先获取了输入车标图像的局部特征,再将这些特征层层迭代处理以获取更高级特征,这样最后的特征被拉成一个一维向量,该向量就是此车标图像的表征,我们也正是用此特征来有监督的训练BP神经网络分类器。
2 实验
本文提出的识别系统是在2100张由监控设备拍下的包含有车辆的室外图像上验证的。首先经过车标定位获取只含有车标的图片(如1.1节所讲),为了模仿不同的拍摄条件变化,我们对截取好的车标加入了:旋转(-10~10度)、平移(四个方向3像素距离)、尺度变换、噪声(高斯噪声、椒盐噪声、泊松噪声),最终获取了十类共30,000张的图片。一些样例图在图3中展示。所有的图片被归一化到28×28大小,对于这30,000张图片,我们取25,000张作为训练,5,000张作为测试。
图2
图3
对于十类不同车标的识别准确率汇总在表2中,平均的准确率为98.28%,因为我们模拟了不同的场景变化,所以结果表明该方法具有优良的鲁棒性。在未经任何优化的情况下本方法的识别速率为3ms每张,这说明了该方法的高效性并完全有能力满足实时应用的需求。
在表3中我们列出了与其他算法的比较,可以看到本文提出的方法具有优异的准确率和极低的运算资源需求,并且本文提出的特征提取环节完全不需要手工设计特征的参与,特征完全从原始图像中自动自适应学习,做到了对于不同环境变化的鲁棒性。
3 结语
在本文中提出了一种基于卷积神经网络(CNN)的车标识别系统,该系统能够准确地识别在定位和截取后获取的车标图片。多层的卷积神经网络能够自动和自适应地从原始图像中获取特征并最后通过BP神经网络进行分类。在十类含有不同类型形变和噪声的测试集上,证明了本文提出的算法有效、准确、鲁棒性优良并不需要人工设计特征的参与,该方案可以有效地应用于智能交通系统的实时识别中。
表2
表3
[1]Dlagnekov L,Belongie S J.Recognizing Cars[M].Department of Computer Science and Engineering,University of California,San Diego,2005
[2]Conos M.Recognition of Vehicle Make from a Frontal View[J].Master,Czech Tech.Univ.,Prague,Czech Republic,2006
[3]Hubel D H,Wiesel T N.Receptive Fields of Single Neurones in the Cat's Striate Cortex[J].The Journal of Physiology,1959,148(3): 574~591
[4]LeCun Y,Bottou L,Bengio Y,et al.Gradient-Based Learning Applied to Document Recognition[J].Proceedings of the IEEE,1998,86(11):2278~2324
[5]Lawrence S,Giles C L,Tsoi A C,et al.Face Recognition:A Convolutional Neural-Network Approach[J].Neural Networks,IEEE Transactions on,1997,8(1):98~113
[6]Anagnostopoulos C N E,Anagnostopoulos I E,Loumos V,et al.A License Plate-Recognition Algorithm for Intelligent Transportation System Applications[J].Intelligent Transportation Systems,IEEE Transactions on,2006,7(3):377~392
[7]Psyllos A P,Anagnostopoulos C N E,Kayafas E.Vehicle Logo Recognition Using a Sift-Based Enhanced Matching Scheme[J].Intelligent Transportation Systems,IEEE Transactions on,2010,11(2):322~328
[8]Yunqiong W,Zhifang L,Fei X.A Fast Coarse-to-Fine Vehicle Logo Detection and Recognition Method[C].Robotics and Biomimetics,2007.ROBIO 2007.IEEE International Conference on.IEEE,2007:691~696
[9]Sam K T,Tian X L.Vehicle Logo Recognition Using Modest Adaboost and Radial Tchebichef Moments[C].International Conference on Machine Learning and Computing(ICMLC 2012),2012
[10]Psyllos A,Anagnostopoulos C N,Kayafas E.M-SIFT:A New Method for Vehicle Logo Recognition[C].Vehicular Electronics and Safety(ICVES),2012 IEEE International Conference on.IEEE,2012:261~266
[11]Yu S,Zheng S,Yang H,et al.Vehicle Logo Recognition Based on Bag-of-Words[C].Advanced Video and Signal Based Surveillance(AVSS),2013 10th IEEE International Conference on.IEEE,2013:353~358
Intelligent Transportation Systems;Vehicle Logo Recognition;Deep Learning;Convolutional Neural Networks
Vehicle Logo Recognition Based on Convolutional Neural Networks
SUN Ye,WU Rui-wen
(Department of Communication Engineering,Xiamen University,Xiamen 361005)
Proposes a vehicle logo recognition based on Convolutional Neural Networks.With a deep hierarchical feature learning process,the proposed method extracts the features from the training samples directly,and trains the classier based on neural network.Applies 5,000 logos belonging to 10 vehicle manufactures for validation.The average accuracy 98.28%for ten classes and fast implementation(less than 3ms for each logo in MATLAB)has demonstrated that the proposed method outperforms than state-of-art with higher accuracy,stronger robustness,and less computational cost.
1007-1423(2015)11-0084-04
10.3969/j.issn.1007-1423.2015.11.017
孙晔(1990-),男,吉林吉林人,硕士研究生,研究方向为机器学习和深度学习
吴锐文(1990-),男,四川成都人,在读硕士研究生,研究方向为机器学习和图像分割
2015-03-12
2015-03-26