基于深度学习的矿岩图像识别技术研究
2019-01-02徐校竹
徐校竹
(鞍山市第八中学,辽宁 鞍山 111039)
0 前 言
中国矿产资源的储量和开采量都居世界前列。新中国成立前,中国矿物加工设备不足,技术落伍,矿物加工产业相比于其他国家极为落后,造成了大量矿产资源的浪费,从而极大制约了中国国防、基础设施建设等与矿产资源密切相关的事业的发展[1]。建国以来,特别是改革开发之后,中国越来越重视矿产资源开发利用。矿产资源开采及其加工技术的快速发展为中国国民经济的建设提供了强大的物质基础,但是中国的矿物原材料加工技术相比于发达国家还有一定差距,而矿物开采后矿石与废石的分选是矿物加工的第一道工序,深刻影响着矿物加工的效率和效果。
矿石与废石预先分选在矿物加工工艺中占有重要位置,尤其是在中国矿产资源日益贫化、市场竞争日益激烈以及环境问题愈发突出的情况下,如何充分利用有限资源,提高企业市场竞争力,降低对环境的破坏程度成为矿企首要考虑的问题。目前中国选矿企业采取的矿石与废石分选的方式主要有重介质分选、干式磁选、X荧光选矿等。这些选矿技术都需要人工控制,属于人工检测,稳定性差,精度和效率较低等缺点尤为突出。因此研究自动化程度较高的矿石废石分选技术刻不容缓。基于深度学习的图像识别是人工智能领域当中的热门话题,本文旨在于研究利用深度学习图像识别技术进行矿石与废石的识别分选,深入研究了卷积神经网络深度学习模型。
1 深度学习理论及图像识别技术
深度学习在人工智能领域中备受青睐。从人工神经网络的研究中,学者们提出深度学习概念,人的大脑分V1区、V2区,视觉图像首先进入大脑的V1区,通过视网膜学习到物体的低层边缘特征,然后再传入V2区识别物体轮廓,通过不断传递,不断抽象出更高层的特征。所以人工神经网络的层数越多,越能学习到更高层的特征,越利于图像的识别[2]。深度学习应用在图像识别中的主要过程是:把图像输入深度神经网络模型,利用前向传播和后向传播算法使得损失函数最小化,来不断更新偏向和权重,反复迭代训练得到较优的参数,最后用学习好的模型进行图像识别。深度学习具有自动学习的特征,其优点是将图像的特征提取和分类相结合,通过相互反馈调节发挥性能,而传统方法则是分开的。深度学习很好的解决了传统图像识别中识别度低,算法训练时间长等瓶颈问题,其很好的利用互联网的海量图像数据,而且计算机硬件和软件的快速发展足以满足算法的复杂计算。通过近几年人工智能的飞速发展,在图像识别中深度学习取得了重大成果,并且已经部分应用到了人们日常生活中。
2 卷积神经网络模型
卷积神经网络(Convolutional Neural Networks,简称:CNN)是一个多层深度网络,他的结构比较特殊,是首次真正训练出来的深层网络[3]。其训练过程与BP神经网络类似,首先采用前向传播计算输出值,然后通过最小化误差,反向传播调整参数。他使用其特殊结构减少参数数量,很好的弥补了BP算法效率低下的不足。CNN提出感受野、下采样、权值共享的3个全新概念。感受野即卷积网络低层输入。权值共享即通过共用参数,以此来减少整体参数数量。下采样即将卷积得来的特征进行降维处理。
CNN网络在图像识别领域上的效率和准确率大大超过其他图像识别方法,图像通过感受野传入网络模型当中通过卷积运算逐层获取典型特征,当进入较深网络结构当中时,网络便可自动抽象出图元特征并且对其分析并获取。与此同时,CNN通过权值共享很好的解决了输入图元平移或缩放时产生的重要特征缺失的难题。
卷积神经网络主要是由卷积层和池化层组成,其层数可以为一层也可为多层,而且一般情况下卷积层与池化层是交替设置的,除此之外网络最上层是由全连接层组成。CNN网络中包含大量神经元,主要分为C和S神经元。抵抗形变的为C元,获取学习特征的为S元。图1中,整个卷积神经网络由一个输入层,C1、C2两个卷积层,S1、S2两个下采样层以及1个全连接层组成。图中网络具有3个卷积核,输入数据通过3个卷积核进行卷积运算训练可以得到3个特征图,每个特征图都代表一种特征。在C1层中的3个特征图中,对每一种特征图进行下采样形成S1层,将S1层得到的特征图进行滤波处理形成C2层,紧接着进行下采样形成S2层,最终待学习完毕,将最后下采样层的特征转换成特征向量并且输入至全连接层从而进行分类识别。
图1 CNN网络图
3 矿岩识别模型训练
本文以锰矿矿岩作为实验对象,通过互联网搜索以及搜集部分现场照片收集锰矿石与废石照片,将收集照片进行标签处理作为训练数据集,训练数据集见图2。整个训练网络由3部分组成,分别为:数据输入与预处理模块、卷积神经网络构建模块、训练与保存训练模型模块。具体训练过程为训练数据集通过数据输入与预处理模块将图片信息转化为矩阵信息并且输入至卷积神经网络模型当中,由输入层进入网络,通过卷积层和下采样层,逐步学习获得矿石和岩石特征,主要是矿岩在R、G、B三基色方面特征,并且通过反向传播不断与标签对比调整从而减少误差,最终精确度逐步收敛,设定MAX_STEP为10 000,每隔2 000步保存训练模型。训练过程精度收敛曲线如图3。
图2 训练数据集部分照片
图3 模型训练精度收敛曲线
4 矿岩识别过程
通过在现场取矿石和岩石样品,并将其用清水冲洗,干燥并拍照,用此照片当做测试数据。调用已经训练完毕的矿岩识别模型,逐一对照片进行识别,并且记录每张照片识别的正误,最终通过识别正确的照片数目与总的数目进行比对得出识别准确率超过90%。而且识别速度较快,可将摄像机摄影画面每帧当做检测数据利用训练模型进行识别,从而实现动态识别。部分识别过程见图4、图5。
图4 矿石检测结果
5 结 语
利用卷积神经网络对矿岩数字图像进行深度学习训练,得出矿岩识别模型。此过程不需要人工提取矿岩数字图像特征,因此此模型智能化程度较高,训练过程较为简单。通过验证,模型对矿岩识别的准确率可达90%,而且识别速度较快。将本模型应用于矿山选矿流程当中,可以很大程度的增加选矿流程的自动化程度,减少选矿初期人工拣选的工作量。最重要的是此技术将有效减少矿物流失,增加矿山开采率和矿石回收率,同时延长矿山开采年限,提高矿产资源开发和利用效率,为解决中国矿产资源日益减少和贫化的难题提供助力。
图5 岩石检测结果