基于深度学习的工程机械厂家自动识别系统的研究
2020-09-22魏建昊靳浩伟王祥澳傅隽翰叶敏
魏建昊,靳浩伟,王祥澳,傅隽翰,叶敏
(长安大学工程机械学院,陕西 西安 710064)
工程机械行业的产业升级对国家基础建设的发展至关重要。但是,现在存在的问题就是现在有的工程项目在施工时,当参与建设的施工设备过多时,就会产生设备调度和管理无序的情况。因此,设计一套用于工程机械厂家的图像识别系统,对于实现我国工程机械的施工统一管理具有重要的意义。对此,本文选定alexnet 深度学习网络进行训练,通过不断调试深度学习模型的层次、丢失层丢失率、学习率、训练步数等参数,探讨不同深度的特征提取网络对识别效果的影响。
1 图像识别网络模型的选用
合适的识别网络对于系统的构建极为重要,由于本文所使用的工程机械的图像数据集规模较小,所以要求网络具有良好的特征学习能力。对此针对实验的实际的情况和识别算法的可行性在经过对现有主流的图像分类方法分析后,发现Alexnet 和vgg16 网络在训练速度和精度方面都有着不俗的效果。本文主要以Alexnet 作为实验的基础框架,并将其与层次较深的vgg16 网络进行了简单对比。
2 图像样本数据集建立
良好的图像样本数据库对于图像识别网络的分析极为重要,在进行数据库构建时,其中主要有数据集的构建、图像数据集的标签化处理、图像数据集归一化、图像数据集扩充、图像数据集的划分。
(1)数据集构建。数据集共含有18 家工程机械厂家,共计900 张,基本涵盖了目前市面上的常见主流工程机械厂家。为了保证识别的精度,每个图像中仅有一或两辆工程机械,并且图像中的厂家特征没有重叠或损坏。
(2)图像数据集的标签化处理。由于深度学习算法需要采用有标签的样本图片进行训练,而本文采集的工程机械图像是无标签的,因此,需要对样本图像进行打标签处理。使用matlab 内置的app“imagelabeler”对厂家图像进行人工标定,将标定完的含有标签信息的mat 文件保存在特定的文件夹,随后批量将mat 文件导出为.jpg 标签图片,保存训练样本图片用于厂家识别网络的训练。
(3)图像数据集归一化。在深度学习模型中的输入样本来自imagelabeler 裁剪出来的图像,因此,存在裁剪的图像大小不一致的问题,而因为AlexNet 模型要求图像的输入尺寸为227×227×3,VGG16 的要求为224×224×3,所以需要进行归一化处理,将数据集的图像尺寸统一。
(4)图像数据集扩充。为了获得更好的训练效果,提高识别精度,应使数据集的规模尽可能地大,这样网络能学习到更多的特征,训练出的模型效果更好,因此,数据增强成为一种非常便捷的数据集扩充途径。本文采取的数据增强途径有旋转、镜像、添加噪声,以此通过较小的人工采集工作量获得大量的数据样本。
(5)图像数据集的划分。按照网络的训练步骤,在训练开始前,需要将样本数据集划分为训练集和测试集两部分,由于样本数据集较小,为了保证训练效果将训练集的比例增大,测试集的比例减小,将训练集和测试集按照4:1的比例进行划分,规定每种厂家的样本图片中4/5 为训练集,1/5 为测试集。其中,训练集作为网络的训练提供数据支持,测试集用于在训练完成后对模型的识别精度进行检测和自我评估。
2 模型训练以及数据对比
(1)模型的训练结果。对模型的训练选择使用迁移学习,采用ImageNet 数据集上进行过预训练的AlexNet 网络模型,将自建的样本数据集输入网络的最后三层,新模型预训练后其收敛速度得到了极大提升。采用迁移学习方法训练得到网络模型的识别精度更高,训练效果更好。
表1
通过对alexnet 迁移学习后的网络进行主要参数的不断对比调试,得到了11 组不同参数下的网络模型,第一组为训练网络的最佳结果,准确率为87.89%。具体如表1 所示。
(2)使用不同网络模型的对比实验,本节中分别使用alexnet 和vgg16 模型进行训练,为防止训练参数变化以及不同数据集对训练结果的影响,在对比实验中,两次的训练学习使用了相同的参数和数据集,训练结果如图1 所示。
图1
由实验结果可知,使用相同网络和参数的情况下,使用alexnet 模型训练的网络识别精度为87.89%, 训练时间为23min10s, 使用vgg16 模型训练网络的识别精度为86.11%,训练时长为160min53s。alexnet 模型的层数较少,训练速度较快,且识别效果较好,vgg16 模型的层数较多,训练速度明显减慢,且识别精度未有明显提升。实验结果表明, alexnet 模型的训练速度更快,且训练效果与更深层次的vgg16 相似,因此,本文选用alexnet 模型进行训练更加合适。
(3)样本集扩充效果对比实验。本节中分别在原始数据集和扩充数据集上进行网络的训练,原始数据集为未经过数据扩充的图像,扩充数据集为经过加噪声、镜像、翻转处理后扩大五倍的样本集,使用相同的测试集比例,验证数据集扩充对网络模型识别精度的影响。为防止训练参数变化对训练结果的影响,在对比实验中,两次的训练学习使用了相同的参数,由实验结果可知,使用相同网络和参数的情况下,使用扩充的数据集训练网络模型可以得到87.89%的识别精度,训练时间为23min10s,使用未扩充的数据集训练网络得到的识别效果大打折扣,只有60.56%的准确率,训练时长为2min31s。虽然数据集的扩充使得训练时长有所增加,但是在分类较多而样本数据集较小的情况下,使用数据集扩充的方法,可以极大地提高网络的识别效果。实验结果表明,数据集的扩充会增加训练时长,但可以有效提高网络准确率,弥补样本数据集较小的不足。
3 结语
本文主要介绍了工程机械识别系统建立的每个过程,从数据集的收集整理,到工程机械图像数据集的扩充、打标签处理,以及网络模型的建立结果对比。详细地阐述了基于alexnet 网络实现工程机械厂家识别任务的整个流程。从网络对工程机械厂家的识别率和实时性来看,本算法能满足实际工程生产时的准确率和实时性要求。