APP下载

深层卷积神经网络在车标分类上的应用

2017-07-18张素雯张永辉

关键词:车标卷积准确率

张素雯,张永辉

(海南大学 信息科学技术学院 海南 海口 570228;南海海洋资源利用国家重点实验室,海南 海口 570228 )

深层卷积神经网络在车标分类上的应用

张素雯,张永辉

(海南大学 信息科学技术学院 海南 海口 570228;
南海海洋资源利用国家重点实验室,海南 海口 570228 )

在目标不够清晰的视频中采集车标样本,通过加噪的方式扩充了样本量,设计3层卷积神经网络,寻求合适的参数,从训练样本中提取特征,充分利用了训练样本提供的信息进行模型训练和分类.实验结果证明该方法在光照变化和噪声污染的情况下仍能保持较高的准确率,能适应恶劣环境,在自有数据集上分类准确率高达99.06%.

视频监控; 深度学习; 深层卷积神经网络; 车标识别

在现代智能交通监控中,目标的识别涉及许多多分类问题,如车牌字符识别、车标识别等,这些分类问题也是准确获取车辆信息和辅助交通管理的关键,笔者以车标分类为例对这种多分类问题进行了研究.

车标分类多利用机器学习的方法[1-5].在机器学习的方法中分为人工选定特征和利用神经网络自动提取特征2个大类.在人工选定特征和分类器的方法中,常被用到的特征有方向梯度直方图( Histogram of Oriented Gradient,HOG)、尺度不变特征转换(Scale-Invariant Feature Transform ,SIFT)和随机稀疏矩阵(Statistical Random Sparse Distribution, SRSD).文献[1]对车标图像提取梯度直方图特征值,用支持向量机(Support Vector Machine,SVM)训练分类器,实现一对一的方式对车标进行多分类,平均准确率为92.59%.文献[2]通过改进SIFT特征使车标分类准确率为97%.文献[3]利用统计学的随机分布稀疏(SRSD)特征来表示车标,并利用多尺度扫描同时对车标进行定位和识别,整体准确率可达97.21%.虽然人工选取特征的方法已经有了相对较高的准确率,但是基于卷积神经网络(Convolution Neural Network ,CNN)的方法普遍能够达到更高的准确率.文献[4]采用2层卷积神经网络对车标进行分类,引入预训练的概念来提高训练速率和准确率.文献[5-6]先通过卷积神经网络对车标进行初次分类,再利用SVM分类器进行二次校准,从而达到较高的准确率.文献[7]采用2层CNN网络并将第一层和第二层特征联合起来,最后得到的特征复杂.文献[8]只采用2层网络结构而无其他辅助操作,与复杂操作相比,效果不理想.利用传统分类器的方法需要人工选取特征,特征的选择至关重要,卷积神经网络分类不需人工选择特征且准确率更高,但步骤普遍复杂,2层网络结构需要辅助其他操作才能达到较高准确率.

综上所述,卷积神经网络分类方法不需要人工选择特征,相较于传统分类方法有较大优势,但利用2层网络想要达到较高准确率需要有辅助操作,且对样本图片数量和质量要求高,不能适应恶劣环境.针对2层CNN网络需要辅助操作才能达到较高准确率的问题,笔者采用深层卷积神经网络实现车标识别,此网络结构使得从输入数据中获得的特征更加鲜明,有效提高了准确率,在自有的质量较差的样本上分类准确率高达99.06%.

1 卷积神经网络

在机器深度学习中,卷积神经网络(CNN)是一种前馈人工神经网络,其神经元之间的连接模式是受动物视觉皮层组织启发.动物皮质的单个神经元的分布方式使其能够对重叠的平铺视野区域做出响应,此响应方式可以在数学上通过卷积运算来描述[9].卷积神经网络作为一种多层感知机,在机器学习、图像和视频识别领域有着广泛的应用.

由于CNN的特征检测层通过训练数据进行学习,所以在训练模型时,不用人工提取特征,而是自动隐式地从训练数据中进行学习.卷积网络中同一特征映射面上的神经元共享权值,从而使网络自由参数的个数减少,降低了网络的复杂性,使得网络可以并行学习,是卷积网络区别于神经元彼此相连网络的一大优势.

CNN是一种有监督学习方法[10],采用反向传播的方法进行训练 .在一个卷积层中,前层的特征映射图先与卷积核进行运算,然后经过激活函数得到特征映射图作为输出.每个输出图由许多个图的卷积结果组合而成,计算公式

其中,f表示激活函数,*表示卷积操作,bn,j表示第n层Xn,j中特征映射图所加的偏置值,Wn,j表示卷积图Xn,j的权值,M表示特征映射图Xn,j的集合.

通过反传的残差来进行参数调节过程便是CNN的学习过程,其中残差的表示方法

其中,η表示 CNN 训练设定的学习速率.

网络训练的最终目标是使最后得到的误差函数的值尽可能的小,通过反向传播的误差来调整权值矩阵的过程是循环进行的,直到残差最小,此时传播函数收敛.

2 深层卷积神经网络设计及应用

CNN应用中,一般认为人对外界的认知是从局部到全局的,而图像的空间联系也是局部的像素联系较为紧密,距离较远的像素相关性则较弱.因此,从底层开始只对图片局部进行感知,然后在更高层将局部的信息综合起来就得到了全局的信息[11].文献[11]提出了一个反卷积的方法,对比每一层卷积神经网络反卷积的图片可看出,从网络最底层开始,每一层提取的特征从基础的边缘开始不断上升到突出的特征,也就是说底层提取的特征通常比顶层提取的特征简单,越是到顶层,越能将图片独特的特征凸显出来.

在对样本图片进行特征提取之前,需要对图片进行灰度化和归一化处理.在网络结构和参数一定的情况下,输入到神经网络的图片越小,提取到的特征维度越小,需要的时间也会相对少,但图片被压缩后会丢失部分信息,从而对分类准确率有所影响,考虑到样本图片的大小约为38×38像素,故将样本图片归一化到38×38像素,设计深层CNN网络结构如图1所示.

每层网络都包括了卷积层、激活层、归一化层和下采样层,用ReLU作为激活函数来加速收敛,避免梯度消失.图1中的矩形方块表示训练过程中提取的特征,特征图的大小和数量已在图1中标出,线条箭头表示网络的走向.

3 实验及结果分析

3.1 车标样本选择及模型训练 选取国内常见的十大品牌车标作为实验对象:尼桑、奥迪、奔驰、本田、别克、大众、丰田、马自达、五菱和雪铁龙.首先从交通监测视频中截取车标训练和测试的样本,然后对截取的原始样本做加噪处理,得到更多的样本,并且使得分类器更能适应恶劣环境.3列图片分别为从视频中获得的原图、改变亮度之后的图片、加噪点之后的图片(如图2所示).在实际视频监控中,摄像头距离被监测的车辆较远,且镜头中的车辆是运动的.因此,来自于真实视频中的车标样本原图已经不清晰,经过加噪后样本更加模糊.

图2 模型训练所用部分车标样本

除了车标样本之外,还加入了非车标样本作为第十一类训练样本,部分非车标样本如图3所示.

图3 模型训练所用部分非车标样本

在训练模型之前,先对样本进行预处理,即将样本灰度化并归一化到38×38像素,再输入到深层 CNN进行训练,训练样本每类2 500张,测试样本每类600张.

3.2 分类结果与分析 根据现有的基于车牌位置的方法定位车标用于分类训练和测试.利用深层CNN训练的模型对测试集进行测试,测试集中11 类车标每类各 600 张,共6 600张,具体结果如表1所示.

由实验结果可得,将车标和非车标共11类样本作为输入,经过网络分类后,每类车标和非车标样本的检测准确率都在98.00%以上,最高达到99.67%,输出结果的平均准确率为99.06%,实验结果较为理想.

为了验证深层网络的优越性,笔者还将文献[8]中2层网络的方法应用在本文样本上,得到分类的平均准确率为97.54%.对比可知,本文分类方法有较高的准确率,能够适应图片模糊、噪声复杂和光照较弱的现实场景并且有效剔除错误定位的车标.

表1 自有样本分类结果对照表

4 小 结

采用3层卷积神经网络,从训练样本中提取特征,利用了原始数据提供的信息进行车标分类.实验结果表明,对于图片模糊、噪声复杂和光照较弱的现实场景,该深层网络具有99.06%准确率,且能够适应恶劣环境,可以有效地剔除错误定位的车标.与2层网络的对比中可以发现,本文3层深度网络能够获得更高的准确率,可为实际应用提供更加准确的辅助交通管理方法技术.

[1] Llorca D F, Arroyo R, Sotelo M A. Vehicle logo recognition in traffic images using HOG features and SVM: proceedings of the 16th International IEEE Conference on Intelligent Transportation Systems (ITSC 2013), Hague, October 6-9, 2013[C]. [S.l.]:IEEE, 2013.

[2] Psyllos A P, Anagnostopoulos C N E, Kayafas E. Vehicle logo recognition using a sift-based enhanced matching scheme[J]. IEEE transactions on intelligent transportation systems, 2010, 11(2): 322-328.

[3] Peng H, Wang X, Wang H, et al. Recognition of low-resolution logos in vehicle images based on statistical random sparse distribution[J]. IEEE Transactions on Intelligent Transportation Systems, 2015, 16(2): 681-691.

[4] Hugng Y, Wu R, Sun Y, et al. Vehicle logo recognition system based on convolutional neural networks with a pretraining strategy[J]. IEEE Transactions on Intelligent Transportation Systems, 2015, 16(4): 1 951-1 960.

[5] Thubsaeng W, Kawewong A, Patanukhom K. Vehicle logo detection using convolutional neural network and pyramid of histogram of oriented gradients: proceedings of the 11th International Joint Conference on Computer Science and Software Engineering (JCSSE), Si Racha, May 14-16, 2014[C].[S.l.]:IEEE, 2014.

[6] 彭博,臧笛.基于深度学习的车标识别方法研究[J].计算机科学, 2015, 42(4):268-273.

[7] 张力,张洞明,郑宏.基于联合层特征的卷积神经网络在车标识别中的应用[J].计算机应用,2016,36(2):444-448.

[8] 孙晔,吴锐文. 基于卷积神经网络的车标识别[J].现代计算机:专业版, 2015(11):86-89.

[9] Lecun Y. LeNet-5, convolutional neural networks [EB/OL]. [2016-10-05]. http://yann.lecun.com/exdb/lenet.

[10] Bouvrie J. Notes on convolutional neural networks [EB/OL]. [2016-10-05]. http://cogprints.org/5869/1/cnn_tutorial.pdf..

[11] Zeiler M D, Fergus R. Visualizing and understanding convolutional networks: proceedings of 13th European Conference on Computer Vision, ECCV 2014, Zurich, September 6-12,2014[C].[S.l.]: Springer Verlag, 2014.

[12]Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks [J].Advances in neural information processing systems. 2012, 25(2):1 097-1 105.

Application of Deep Convolution Neural Network for Vehicle-logo Classification

Zhang Suwen, Zhang Yonghui

(College of Information Science and Technology, Hainan University,Haikou 570228,China;State Key Laboratory of Marine Resource Utilization in the South China Sea, Hainan University, Haikou 570228, China)

In the report, some vehicle-logo samples were collected from the video which is not clear enough, and the amount of the sample was expanded by adding noise to the samples. A three layer convolution neural network was designed to find the suitable parameter and extract the characteristics from the training samples. The information from the training samples was used for the model training and classification. The results indicated that under the condition of illumination change and noise pollution, the accuracy of the method was still high, and the accuracy rate of classification was as high as 99.06% on its own dataset.

video surveillance; deep learning; Convolutional Neural Network (CNN); vehicle-logo recognition

2016-12-23

海南省应用技术开发项目(ZDXM2015103)

张素雯(1989-),女,湖北随州人,海南大学2014级硕士研究生,研究方向:多媒体信息处理,E-mail: suwenzhang361@163.com

张永辉(1974-),男,山东宁津人,教授,博士,研究方向:智能检测技术、数字信号处理,E-mail: 45146989@qq.com

1004-1729(2017)02-0119-05

TP 391.4

A DOl:10.15886/j.cnki.hdxbzkb.2017.0021

猜你喜欢

车标卷积准确率
劳斯莱斯“欢庆女神”车标换代升级
基于3D-Winograd的快速卷积算法设计及FPGA实现
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
卷积神经网络的分析与设计
从滤波器理解卷积
有趣的车标
高速公路车牌识别标识站准确率验证法
基于傅里叶域卷积表示的目标跟踪算法