基于深度学习网络的煤矸石分类研究
2021-10-23王国新陈思羽张冬妮
王国新,陈思羽,张冬妮
(黑龙江科技大学 电气与控制工程学院,黑龙江哈尔滨,150022)
0 引言
煤矸石图像的检测和定位主要分为人工辅助特征提取与浅层机器学习相结合的方法和大量数据样本结合深度学习两类方法[1],第一种方法是通过对图像进行预处理、边缘检测、物体分类和物体定位的流程来实现的[2];第二种方法是利用深度学习强大的特征提取能力,通过大量的训练样本自动提取煤矸石特征,将图像直接输出得到煤与煤矸石的种类和位置信息[3]。
近年来深度学习网络不断发展,Vgg 是其中应用比较广泛的一种深度学习网络,有学者将其应用于煤矸石图像分类,但是经过对比测试,发现Vgg 网络训练相对比较缓慢,使用其它轻量化网络可以加快网络训练速度,本文通过使用3种不同种类的深度学习网络对煤矸石图像进行分类,从煤矸石图像分类的准确度和训练时间两方面进行对比,以测试不同深度学习网络对煤矸石图像分类的表现。
1 深度学习网络
(1)VggNET:该深度学习网络是由牛津大学学者提出的带有卷积运算的神经网络模型。该网络说明了模型深度对预测精度的意义。VggNET 网络在ImageNet 测试中达到了92.7%的准确率。ImageNet 数据集有超过1400 万幅图像1000 个类别。VggNET 随着网络结构不同分为不同版本,例如Vgg16 和Vgg19。Vgg19 网络的深度大于Vgg16 的网络深度,对于Vgg 网络来说,一般深层的Vgg 网络适用于较复杂的任务,网络层数较少的网络适用于任务相对简单的情况。
(2)Res18 网络:随着卷积神经网络的发展和普及[4],网络深度和架构研究早已经成为人们常见的问题,所以现在卷积神经网络的发展趋势是训练速度快、普适性强。这意味着卷积神经网络不能简单通过固定尺度解决问题,而应该是充分利用多尺度信息,即multi-scale。但是随着网络层数的增加,梯度弥散和梯度爆炸等问题也随之出现。这两种问题都是由神经网络的特殊结构和求参数方法造成,也就是链式求导的间接产物。残差神经网络利用残差块完美的解决了这两个问题[5]。
(3)Mobile 网络:MobileNet 是由谷歌在2017 年提出,是专注于移动端或者嵌入式设备中的轻量级CNN 网络,并提出了深度可分离卷积的概念。深度可分离卷积将传统卷积分解为两个操作[6],即分为depthwise 和pointwise。深度可分离卷积首先按照通道进行按位相乘的计算,此时通道数不改变;然后使用1*1 的卷积核进行传统的卷积运算,此时通道数可以进行改变。使用了深度可分离卷积,其计算量比传统卷积的计算量下降了 1/N+1/DK2,其中N 为特征图的维度,DK为卷积核的大小,当DK=3 时,深度可分离卷积比传统卷积少8 到9 倍计算量。
综上所述,VGG 网络是现在广泛应用的一种网络,而残差网络的模型可以足够大,防止因欠拟合而引起的分类误差过大的问题,而Mobile 网络计算速度快,相比其他深度学习网络在同样运行煤矸石检测任务的情况下可以检测更大的范围,计算量的降低也可使运行环境的性能要求降低,能在类似于NVDIA Jetson 的开发板上运行,使系统轻量化,通过简化硬件环境增强运行稳定性。这三种网络结构各具特点,因此选用这三种网络来处理煤矸石分类任务,通过试验对比三种网络对于煤矸石分类任务的性能效果。
2 迁移学习
迁移学习就是以现有的神经网络模型参数为基础,用来训练另一种类似的识别目标的一种技术。由于深度学习网络的规模往往比较大,深度学习网络参数的数量往往在千万以上,动辄达到上亿的规模。因此深度学习网络在训练迭代过程中所需要计算的数据的数量也是十分巨大,训练时间可能需要几天甚至数周。
在煤矸石检测任务中,对于数据收集困难、计算缓慢等问题,可以通过迁移学习的方式来改善,在现有相似模型的基础上训练煤矸石分类模型可以加快训练速度,提高训练精度,并且在一定程度上对过拟合的问题具有抑制作用。总之使用迁移学习往往可以提高模型训练的速度和训练后模型的预测精度。迁移学习的分类依据有以下两种方法。
(1)按照已有网络(源域)和待训练的网络(目标域)的异同进行分类。
(2)根据方法的不同进行分类。
3 建立煤矸石图像数据集
数据是深度学习研究中一个非常重要的因素。由于现有的公开数据集不包括煤矸石图像,所以需要人工拍摄图像并制作标签。和许多公开数据集不同,煤矸石图像样本不要求以日常生活场景作为背景图,因为洗煤厂中煤矸石背景图片较为单一,因此在采集图像样本的过程中分别用黑白灰多种背景拍摄样本。
为保证煤矸石图像数据集的质量,需对原始图像样本进行一些必要的预处理操作。本文对原始图像的预处理操作包括筛选图像、样本扩充、统一图像格式与尺寸以及打乱顺序并统一命名。
得到煤及煤矸石图像样本后,建立对应的标签文件,标签文件为txt 格式,文本内容排列顺序为文件名、样本种类。
4 煤矸石分类试验
为了验证Vgg-16、Mobile、Res18 对煤矸石图像的分类性能,在Pytorch 框架下用上述三种网络结合迁移学习,使用煤矸石图像样本及分类标签进行训练并测试。深度学习的训练过程使用服务器进行,试验的软硬件系统配置如表1 所示。
表1 煤矸石目标检测试验软硬件环境
在8053 张样本图像中将数据集和测试集设置比例为7:3,BATCH_SIZE(批处理尺寸)设置为128、LR(学习率)设置为0.0001、EPOCH(遍历数据集次数)设置为3 进行训练后,其训练结果如图4-1 所示。最终训练集分类准确率在Vgg-16网络下精度为89.17%;Res18 网络下精度为98.81%;Mobile网络下精度为98.56%。试验证明使用深度学习图像分类模型能够对煤矸石和煤进行区分,并且准确率较高。
图1 Vgg-16、Res18、Mobile 精度变化曲线
训练过程中每个循环的训练时间见表2 所示。
表2 各网络训练速度
通过精度和速度对比,Res18 在训练速度的表现上最好,相比Vgg-16 网络训练时间下降84%。从训练精度上看,Res网络和Mobile 网络精度最高,并且差别较小,但是相比Vgg网络精度大幅度领先,综合考虑Res18 网络在煤矸石图像分类上最适用。
5 结语
对现有的深度学习网络进行筛选,得到三种有代表性的深度学习网络,并建立煤矸石数据集和样本标签,通过模型训练测试,将三种网络的精度和速度进行对比,选出性能更优的深度学习网络。
通过使用Vgg-16 网络、Mobile 网络和Res18 网络对煤矸石进行分类,试验表明Res18 网络在训练准确度和训练速度方面表现更优。