基于卷积神经网络的煤矸石图像识别
2020-08-21孙立新
摘要:煤矸石筛选是煤矿生产中一个重要的环节,目前的人工捡矸法、机械湿选法以及射线分选法无法兼顾选矸过程中的高效性、清洁性和无害性。针对上述选矸过程中存在的问题,提出了一种基于卷积神经网络的煤矸石识别方法,以颜色和纹理作为煤和矸石图像的类别特征,结合迁移学习方法,构建了VGG-16深度学习模型。实验结果表明,其识别准确率可以达到99.18%,可以有效地实现对煤和矸石的识别。
关键词:煤矸石识别;卷积神经网络;图像分类;迁移学习
中图分类号:TP391 文献标识码:A
文章编号:1009-3044(2020)21-0016-03
开放科学(资源服务)标识码(OSID):
煤炭在我国能源中占有举足轻重的地位,其能源量占化石能源储量的94%,远远超过石油和天然气;其消费约占总能源消费量的64%左右[1-2]。但是产出的原煤中会包含大量的矸石,矸石含量占原煤产量的15%-20%c3],如果不对矸石加以剔除,不仅会降低煤炭的燃烧率,而且其燃烧产物还会造成环境污染。因此,在煤炭使用之前实现对矸石的分拣成为一个必不可少的环节。目前,常用的矸石分拣技术包括人工捡矸法、机械湿选法和射线分选法[4-6]。人工选矸存在着劳动强度大、工作环境差、选矸效率低的问题;机械湿选法存在水资源浪费,其产生的污水容易对环境造成污染等问题;射线筛选法容易对工作者的身体造成危害。因此,寻找一种高效、清洁且对人体无害的选矸方法有重要意义。
近年来,随着深度学习中的卷积神经网络的迅速发展,其在计算机视觉领域已有广泛应用。相较于传统的计算机视觉技术,卷积神经网络不需要对图像做预处理、图像分割和人工设计图像特征等方面工作,不仅减少了图像预处理的复杂度同时也降低了人为因素对特征提取的影响。目前已有不少学者将卷积神经网络应用于图像识别中。吕军等设计了一种基于AlexNet卷积神经网络模型,将其应用于茶叶嫩芽状态识别[7];白林等通过采集6种不同类型的岩石薄片,结合VGG模型进行识别[8],均取得了较好的识别率。因此,本文通过搭建VGG-16模型[9],对采集的煤矸石图像上进行识别,从而达到煤矸分选的效果。
1 相关理论分析
典型的卷积神经网络一般由卷积层、池化层、扁平层和全连接层构成,具体结构如图1所示。卷积层主要由卷积核组成,其作用就是提取图像局部特征,常用的卷积核大小有3x3、SX5、7x7和11X1I。池化层一般设置于卷积层之后,常见的池化层一般有最大池化和平均池化两种,具体池化过程如图2所示。池化操作在降低特征图维度减少了计算量的同时,可以保证特征图的平移不变性和旋转不变性。扁平层在所有卷积层和池化层之后,把经过卷积和池化之后的矩阵向量转化成长向量,主要作用是从卷积层到全连接层的过渡。全连接层一般由三个全连接操作构成,最后一个采用softmax激活函数,来实现目标的分类。
1.1 VGG卷积神经网络
VGG是目前较为经典的卷积神经网络之一,其是在AlexNet[10]网络的基础上改进而来,在2014年的ILSVRC (Ima-geNet Large Scale Visual Recognition Challenge)取得分类项目第2名和定位项目第1名的成绩。相较于AlexNet模型,VGG使用了更多的小卷积核代替了其原来的大卷积核,在加深了网络的同时,保证了感受野不变,而且多个小的卷积核比一个大的卷积核有更少的参数。随着卷积核的增多,其使用的激活函数的次数也相应增加,这使其学习能力进一步增强。VGG总共有6个不同结构的网络模型,本文选用稳定且性能较高的VGG-16作为煤矸石图像识别实验的模型。
VGG-16模型由13个卷积层、5个池化层和3个全连接层构成。其中13个卷积层被分为5组且每组的卷积层参数不尽相同,在每组卷积层后连接一个最大池化层。通过5组卷积层和池化层最终将224x224x3大小的图像压缩至7x7x512的特征矩阵。而后通过扁平层将压缩后的多维特征矩阵转化成一维向量。最后将生成的一维向量进行全连接操作,前两层全连接含有4096个隐含节点,最后一层的全连接隐藏节点个数为要识别的图像类别数C,并采用softmax激活函数完成分类。
1.2基于迁移学习的VGG-16模型
采集和标注样本图像是一件极其费时费力的事情,而且煤矸石图像目前还没有公开的数据集,故采用迁移学习可以解决样本不足的问题。迁移学习是基于一个已经在大数据集上训练过的模型,在其基础上进行参数和知识的迁移。迁移学习不仅可以有效的解决样本缺乏的问题,同时也降低了深度学习模型对硬件的需求以及模型的训练时间。本文采用基于ImageN-et预训练的VGG-16模型参数(不包含全连接层部分参数)进行初始化,并结合微调技术对模型进行调整使其可以更好地应用在煤矸石图像的分类任务中。基于迁移学习的VGG-16模型的煤矸石特征提取过程如表1所示。
2 识别实验与结果分析
2.1 样本采集
本实验使用佳能800D相机按照煤和矸石1:1的比例采集1300多張煤矸石图像,剔除部分不合适图像,使用1200多张进行实验。按照通常80%/10%/10%的训练集、测试集和验证集比例对采集的图像进行划分。图3为煤和矸石样本图像。
2.2 样本预处理和样本扩充
采集到的图像样本是三通道且长宽不尽相同。因此,首先需要对样本进行预处理,将其缩放为224x224大小的图像,并且对图像矩阵进行归一化处理,将样本中像素值调整为0-1的浮点数。
在深度学习中通常会需要充足的样本用于训练。一般来说,样本越是充足训练的模型效果越好,其泛化能力也就越强。为了进一步扩充样本,本实验对采集的图像数据集进行了数据增强,且增强后的数据并不会影响样本的类别。常用的增强方法有水平和垂直翻转、平移、缩放、旋转等,本文使用Keras自带的方法ImageDataGenerator对样本进行增强,且按照通常做法只对训练集样本进行增强。增强参数如下:水平和垂直翻转为True,水平和垂直方向上移动0.25个图像长度和宽度,缩放比例为0.2,随机旋转角度为40度。图4为对样本进行增强后的效果。
2.3 模型超参数
模型的优劣不单单取决于模型通过自身学习得到的权重和偏差参数,还取决于人为设定的超参数。卷积层和全连接层的激活函数设置为目前较为优秀的Relu函数,分类层使用soft-max激活函数实现对煤和矸石图像的分类,批尺寸为32。学习率初始化为0.001并且设置迭代学习率衰减系数decay为0.00001。对模型进行两次实验,一次采用迁移学习,另一次不采用进行对比实验。
2.4 结果分析
通过绘制训练过程的损失函数和准确率折线图可以得知,随着迭代次数的增加训练集的准确率不断提高,验证集的准确率虽然在训练的过程中不断震荡,但是最后趋于稳定,未采用迁移学习模型准确率达到95.93%,采用迁移学习之后模型准确率可以达到99. 18%。分析图5和图6实验结果,可以明显看出采用迁移学习之后,模型可以实现快速收敛,且模型更加稳定识别率更高。由于在训练过程中对只对训练集使用了数据增强,此时验证集样本相较于训练集来说是简单样本,所以在模型训练初期验证集识别率会偶尔略高于训练集。
3 结束语
本文针对煤矸石识别问题,提出了一种基于卷积神经网络的方法,并采用迁移学习的策略实现了对煤矸石图像的识别。对采集的图像进行归一化和扩充处理后,采用VGG-16模型进行训练学习,未采用的模型准确率达到了95.93%,采用迁移学习策略之后的模型准确率可以达到99.18%,有效地实现了对煤和矸石图像的识别。为进一步提高网络模型的泛化能力和准确率,还需要做以下两方面工作:1、采集更多实际生产状态下的煤和矸石图像,使样本更具代表性;2、对VGG-16模型进行进一步的改进和优化,为煤矸石分拣提供有效的理论基础。
参考文献:
[1]谢和平,王金华.煤炭革命新理念与煤炭科技发展构想[Jl.煤炭学报,2018,43(5):1187-1197.
[2]石焕,程宏志,刘万超.我国选煤技术现状及发展趋势[J].煤炭科学技术,2016,44(06):169-174.
[3]张佳佳,姜浩,胡正伟.煤矸石井下分选研究[J].机电工程技术,2011,40(8):61-63,202.
[4]朱喜玲.选煤厂人工手选输送机集控系统设计应用[J].煤矿机电,2019,40(2):82-84.
[5]张勇.选煤工艺现状及发展趋势浅析[J].科技经济导刊,2018, 26(21):107.
[6]冯岸岸.智能分选过程中煤矸X射线识别技术的研究[D].淮南:安徽理工大学,2019.
[7]吕军,夏华鹍,方梦瑞,等.基于AlexNet的茶叶嫩芽状态智能识别研究[J].黑龙江八一农垦大学学报,2019,31(2):72-78.
[8白林,魏昕,刘禹等。基于VGG模型的岩石薄片图像识别[J].地质通报,2019,38(12):2053-2058.
[9] Simonyan K, Zisserman A.Very Deep Convolutional Net-works for Large-Scale Image Recognition[J]. Computer ence,2014.
[10] Krizhevsky A,Sutskever I,Hinton G.ImageNet Classifi-cation with Deep Convolutional Neural Networks[Jl. Advancesin neural information processing systems, 2012, 25(2).
【通聯编辑:梁书】
作者简介:孙立新(1993-),男,河北工程大学信息与电气工程学院硕士研究生,研究方向为煤矸石图像识别。