试论基于深度神经网络的汽车车型识别问题

2017-07-24汪晓青

科教导刊·电子版 2017年13期

关键词：图像分类预测

汪晓青

摘要在分析深度学习作用的基础上，利用先进的深度神经网络，以及功能强大的计算机工作站，对于四类汽车进行识别实验研究。实验表明，VGG16网络具有最好的分类效果，传统的经典分类算法往往仅为其准确率的一半左右。

关键词深度神经网络图像分类车型识别预测

中图分类号：TP317.4 文献标识码：A

0 引言

所谓的深度学习是根据具有多层结构的人工神经网络所提出。在具体的深度学习中，主要借助模拟神经系统中的层次结构，来进行数据结构特征的反映，一般来说，细节用低层次进行表示，抽象数据结构则用高层次来表示，利用这种方式，能够进行数据挖掘学习，满足学习要求。在传统的车型识别发展中，主要涉及到的技术包括模式识别、特征选择和提取以及检测分割等方面内容，在技术发展中，存在的难点主要涉及到如何将完整的目标车辆区域进行分割，这是项基础工作，也是难点所在。这结合实际需求，对于不同拍摄角度下的汽车图片，包括皮卡车、SUV、面包车以及小轿车进行车型识别，其目标质量分割质量则是最为关键的技术，直接影响到最后的判断效果。所以，应该重视进行具有代表性特征的选择处理，并相应转化成有效的参数过程。在获取特征参数后，则应该结合项目要求来选择合理的分类器，这样才能保障识别的准确率。结合汽车车型识别问题的要求，这里网络输入则是原始图像，利用神经网络优势，原始数据经过卷积层、完全连接层以及Softmax 层的培训学习，通过这种深度神经网络来进行分析处理，免于上述存在难度的图像分割、手工提取等过程。

1数据集

这里的车型识别目标的数据集主要包括皮卡车、SUV、面包车以及小轿车等四种类型。其中，训练集和测试集分别包括1025张和368张原始图片。此数据集中，包括不同摄像角度中的汽车图像照片，具有背景复杂、图像大小不统一，车辆在图片中所占比例具有较大差异性等方面问题，这些都在一定程度上造成车型识别的难度上升。

在预处理中，为了保证网络输入的一致性，对于原始图像进行调整处理为256€？56€？尺寸。在此基础上，对于图像RGB三个通道的均值进行计算，并进行均值标准化的处理。在具体的网络训练测试的过程中，主要则是选取224€？24€？的样本作为输入。

2网络结构探讨

结合文献所提出的深度神经网络VGG16的优势，我们将其应用在汽车车型识别问题中。VGG16网络具有较强的优势，主要包括5个堆栈式的卷积神经网络ConvNet，以及3个完全连接层以及1个Softmax层，由此可见，其属于“网络中的网络”架构。在每个每个ConvNet中，还有多个卷积层所构成，然后紧跟随着Max-Pooling层。在进行卷积以及池化处理的基础上，进行三层完全连接处理，同时，Softmax层的输入则是最后一个完全连接曾的输出，在这基础上，实现车型分类的要求。结合实际需求，将非线性的ReLU层加入该网络中，这样就会让ReLU来处理卷积层和完全连接层的输出，保证训练时间有效降低。另外，还将一种正则化Dropout方式应用在网络中，避免出现完全连接层中的过拟合问题。

另一个神经网络Alexnet，结构稍微简单一些，主要包括5個卷积层、3个完全连接层、Softmax层等几部分，在进行部分卷积层处理后，在进行Max- Pooling层处理。在此网络中，同样采用非线性的ReLU层，所采用难度重叠池化方式，也能有效保证尽量降低过拟合的问题。

3实验结果分析

结合上述分析的深度神经网络VGG16和AlexNet的基础上，进行Gaffe框架的搭设，为了保证运算效率，建立在GeForce GTX TITAN X CPU的工作站中。经过统计，单一网路训练大约为2小时，一张图片测试大约为0.2秒。在应用上述网络测试、训练之外，在分类过程中，还应用了经典的分类算法KNN。经过实验分析，可以看出，VGG16网络能够具有比较好的分类结果，能够实现准确率为97.3%，而AlexNet网络准确率达到为93.0%，KNN算法不能有效处理较为复杂背景的图片，分类准确率仅为52.3%。在具体的案例中，分析VGG16网络错误分类的情况，面包车具有完全正确的分类效果。在错误分类的SUV车型中，究其原因，主要包括：车颜色有两部分组成，红色部分则和皮卡车车型相同；车型结构太类似于皮卡车；背景中加入其他车型，这样会造成分类结果不准确。如果图片中仅仅包括车头的情况，在进行车型识别中也存在较大的难度，不同车型从前面角度进行观察，并没有太大的差异化，这点应该明确指出。

4结语

这里采用深度学习方法，结合先进的深度神经网络，以及功能强大的计算机工作站，对于四类汽车进行识别实验研究。经过试验表明，VGG16网络具有最好的分类效果，传统的经典分类算法往往仅为其准确率的一半左右。所以，可以看出深度神经网络具有强大的学习能力，能够在图像分类问题中表现出很大优势，应该不断优化深度神经网络的结构，以便其适用于更多的图像分类要求。

参考文献

[1] Hinton G E， Osindero S， Teh Y W.A Fast Learning Algorithm For Deep Belief Nets[J]. Neural Computation， 2006， 18（7）：1527-1554.

[2] Krizhevsky A， Sutskever I， Hinton G E. ImageNet Classification with Deep Convolutional Neural Networks[J]. Advances in Neural Information Processing Systems， 2012， 25：2012.

[3] Simonyan K， Zisserman A， Simonyan K， et al. Very Deep Convolutional Networks for Large-Scale Image Recognition[J]. Eprint Arxiv， 2014.