APP下载

基于支持向量机与多种特征的煤矸石识别

2021-05-06陈乃建黄玉林张来伟李映君

济南大学学报(自然科学版) 2021年3期
关键词:灰度级煤尘煤矸石

范 振, 陈乃建, 黄玉林, 张来伟, 李映君

(济南大学 机械工程学院, 山东 济南 250022)

我国拥有丰富的煤炭资源,其资源量约占我国化石能源资源的基础储量的94%。由于开采过程经常混杂有煤矸石,严重影响煤的质量,因此煤与煤矸石的分拣是煤炭生产过程中不可或缺的环节[1]。

煤与煤矸石的分拣通常采用传统的人工分选法,不仅工作环境差,劳动强度大,而且效率非常低。随着科学技术的进步,自动化分拣技术逐渐取代传统的人工方法,其中的煤矸石识别技术是非常重要的环节。目前,国内外已有多种识别技术,根据煤与煤矸石密度的不同,Wang等[2]提出基于激光三角法和重量法,采用三维激光扫描技术根据煤矸石体积计算出所测物体的密度,与已知的煤与煤矸石密度对比,实现煤矸石的分拣。杨慧刚等[3]通过X射线与图像处理技术相结合,提取煤与煤矸石图像的灰度信息,分析差异确定分离阈值。Liu等[4]用多重分形去趋势波动分析方法来提取煤和煤矸石的几何特征,并与图像的灰度和纹理特征相结合,提高了煤矸石识别率。

近年来,随着机器视觉与机器学习的发展,煤矸石分拣也出现了多种新技术。Pu等[5]提出了利用卷积神经网络图像识别的典型工作流程和模型参数更新策略,基于功能强大的训练图像识别模型VGG16,引入传递学习的思想,建立了一个自定义的卷积神经网络模型,解决了从头开始建立全新模型所带来的可训练参数大、计算能力有限的问题。根据煤与煤矸石图像灰度特征与纹理特征的不同,兰添才等[6]设计了一种纹理特征提取算法,与神经网络分类器相结合实现煤与煤矸石分离。王家臣等[7]提出在不同照度下提取并分析煤与煤矸石图像的灰度特征与纹理特征,得出了不同照度下基于不同特征的煤矸石分离结果。何敏等[8]提取煤与煤矸石样本的灰度特征和灰度共生矩阵,分析特征值差异,并基于支持向量机(support vector machine,SVM)进行分类。

上述方法对于表面干净无尘的煤与煤矸石有较高的识别准确率,但是,在煤的开采过程中,部分煤矸石表面附着有煤渣或煤尘,使其特征趋向于煤,给识别带来一定困难。同时,煤炭带式输送中运行速度较快,如果识别速度太慢,就无法有效配合机械手抓取。针对煤尘覆盖与识别速度较慢等问题,本文中基于煤块表面常常有少量反光区域特征,结合煤矸石表面覆盖有煤尘的特征,将煤与煤矸石样本细分为无煤尘覆盖的煤矸石、有煤尘覆盖的煤矸石、无反光区域的煤及有反光区域的煤共4个类别,分析煤与煤矸石的灰度特征、纹理特征、灰度分布直方图与不同阈值下二值化后的图像分布,结合灰度特征与纹理特征,基于SVM对煤与煤矸石进行识别分离,以提高识别效率,满足机械手实时抓取的要求。

1 图像预处理

本文中选取了同一分选车间、自然光照强度下拍摄采集的34幅煤与34幅煤矸石共68幅图像。为了保证实验数据的客观性,从煤与煤矸石样本中各随机抽取16幅样本共32幅作为本文中的数据分析样本。

由于拍摄图像为红绿蓝(RGB)三通道的彩色图像,而包含红、绿、蓝三原色的彩图不能反映出图像的特征与纹理,因此依据加权平均法由OpenCV软件将其处理为灰度图[9],如图1(a)所示。然后采用二值化算法对灰度图进行初步的目标与背景分离,如图1(b)所示; 由于二值化后目标图像有诸多孔洞,因此采用形态学运算中的开运算以及闭运算对二值化图像加以处理,得到图1(c); 最后将处理后的二值化图像与灰度化后的原图像进行匹配,如图1(d)所示。

为了减少背景环境引起的误差,计算匹配图像的最大内接正矩形(见图1(e)),并将其处理为大小为1 000像素×1 000像素的样本图像,如图1(f)所示。由于环境因素图像会存在不同程度的噪声信息,因此采用OpenCV软件中的高斯滤波对图像加以处理,处理后的部分煤与煤矸石样本图像如图2所示。本文中所有数据均由QT5.8.0与OpenCV 3.2.0通过C++编程运算而得。

2 灰度特征与纹理特征

2.1 灰度特征

灰度图像中的每个像素是由0~255的灰度级表示,灰度级越小图像越黑,反之则图像越白。通过分析图2灰度特征可以发现,在本实验环境下煤与煤矸石在灰度特征方面存在明显差异。

2.1.1 灰度特征指标

通过分析每幅煤与煤矸石图像的灰度分布情况,提取了以下6个特征指标[7]。

1)灰度均值M为灰度图像各像素点灰度级的平均值,

(1)

(2)

式中:P(i)为灰度级出现的频率;i像素点的灰度级;ni为灰度级i的像素点个数;N为总像素点个数。

2)灰度方差V为灰度图像对比度的大小,

(3)

式中σ为灰度图像的标准差。

3)灰度歪斜度S为灰度图像灰度级分布偏斜程度的数字特征,

(a)灰度图原图(b)二值化图像(c)形态学运算图像(d)匹配图像(e)最大内接正矩形(f)框选区域图1 图像预处理过程

(a)煤1(b)煤2(c)煤3(d)煤矸石1(e)煤矸石2(f)煤矸石3图2 煤与煤矸石样本图像

(4)

4)灰度峰态K表征图像灰度级分布曲线在灰度均值处峰值高低的程度,

(5)

5)灰度能量E表征图像灰度级分布是否均匀,能量越大分布越均匀,

(6)

6)灰度熵Eg表征灰度分布的不均匀与复杂程度[10],

(7)

2.1.2 灰度特征数据分析

基于上述灰度均值、灰度方差、灰度歪斜度、灰度峰态、灰度能量与灰度熵等6个特征指标,对随机抽取的煤与煤矸石各16幅共32幅样本分别计算特征数值,并且对每组数据绘制箱型图,如图3所示,以便更准确地表现出样本数据的客观完整性。由图可以明确观察到,煤与煤矸石的灰度能量与灰度熵有明显的差异,而灰度均值、灰度方差、灰度歪斜度以及灰度峰态都存在不同程度的交叉区域,因此选取灰度能量与灰度熵为有效特征作为灰度特征的指标。

(a)灰度均值(b)灰度方差(c)灰度歪斜度(d)灰度峰态(e)灰度能量(f)灰度熵值图3 煤与煤矸石灰度特征箱型图

2.2 纹理特征

纹理特征是全局特征的一种,可以反映图像像素灰度级分布的规律。本文中使用的纹理特征描述方法为统计方法中的灰度共生矩阵(GLCM)[11]。对比煤与煤矸石图像(图2)可见,煤的表面纹理更加繁琐,煤矸石表面纹理略微平整,因此需要对它们的纹理特征进行分析。

2.2.1 纹理特征指标

GLCM是由Haralick等[12]提出的,描述的是同一方向上间隔相同距离的一对像素点的频率。通常选用以下4个指标来表示其特征。

1)对比度C表征图像是否清晰以及其表面纹理深浅的程度,

(8)

式中:n为0~255灰度级;P(i,j,l,α)为像素点(x,y)的所有α方向相邻间隔为l的像素对中一个取i值、另一个取j值的相邻像素对出现的次数,此处l取值为1,α分别取值为0°、45°、90°、135°。

2)熵Et表征灰度图像中纹理的复杂程度,

(9)

3)能量A表征图像纹理粗细的程度,

(10)

4)逆差矩I表征图像局部纹理变化的大小,

(11)

2.2.2 纹理特征数据分析

由于煤与煤矸石的4个纹理特征指标值在4个不同方向上变化趋势基本一致,因此求取4个不同方向的特征指标的平均值作为最终数据。基于上述C、Et、A与I这4个纹理特征指标,分别计算随机抽取的32幅样本的纹理特征值,结果如图4所示。

(a)对比度(c)能量(b)熵(d)逆差矩图4 煤与煤矸石纹理特征箱型图

由图可以看出:煤矸石与煤的纹理能量存在明显差异;煤矸石的纹理熵在[4.530 27, 5.983 4]区域内,煤的纹理熵在[6.188 37, 7.275 04]区域内,煤矸石与煤的纹理熵差值约为0.2。由于煤与煤矸石的纹理对比度与纹理逆差矩存在交叉区域,因此选择纹理能量与纹理熵作为纹理指标的有效特征。

2.3 基于SVM的煤矸石分离实验结果

SVM依据有限的训练样本,可以建立超平面作为决策面,若样本线性不可分,则通过非线性映射,将样本映射到高维特征空间进行分类[13]。SVM参数较多,手动选取合适的参数将耗费大量时间,因此本文中采用OpenCV软件中的自动训练函数,并依据上述所选的4个有效特征指标C、Et、A与I作为训练参数,将煤矸石设定为0,煤设定为1,选择煤与煤矸石各20幅共40幅图像作为训练样本,各14幅共28幅图像作为测试样本。实验结果显示,煤矸石识别率最大值为89.3%。

3 灰度分布直方图

灰度分布直方图是图像灰度图中灰度分布的直观表示,描述了不同灰度级出现的频率。根据式(1)计算得到的灰度分布直方图如图5所示。由图可以看出:煤矸石1与煤矸石2有较为明显的2个峰,附着有煤尘的煤矸石3直方图略趋向于煤,但是其灰度值较为集中,且最高频率值较大;煤1与煤2直方图主体部分较为宽泛,而煤3灰度分布直方图有较高的对称性,原因是表面存在明显的反光区域(见图6红色圈内)。由此可见,煤矸石3与煤3和其他的煤与煤矸石有所区别,因此将原本的煤与煤矸石分为4类:无煤尘覆盖的煤矸石、有煤尘覆盖的煤矸石、无反光区域的煤和有反光区域的煤,并且将灰度分布直方图即灰度级频率作为特征向量用于训练参数。

(a)煤矸石1(b)煤矸石2(c)煤矸石3(d)煤1(e)煤2(f)煤3图5 煤与煤矸石灰度分布直方图

图6 煤块表面图像

4 图像反光区特征

图像二值化常用于边缘检测,将物体与背景分离[14]。上述4类煤与煤矸石的灰度级峰值侧重区域不同,尤其煤3,其灰度级多分布于50左右,且在灰度级大于100时依旧有部分灰度级分布;煤3表面有明显的反光区域,致使其灰度值分布比煤矸石广,且直方图不能明确表达其高光特征,因此采用图像二值化来表达高光区域。从68幅样本图像里随机选取无煤尘覆盖的煤矸石、有煤尘覆盖的煤矸石、无反光区域的煤及有反光区域的煤样本图像各1幅进行不同阈值下灰度级为255时的频率对比,阈值对比结果如图7所示。从图中可以看出,当阈值在[53,100]区间时,4类煤与煤矸石的灰度级为255的频率值有较明显的差距,抽取多组样本提取数据,分析其未交叉区域且大小顺序一致的阈值区间,可确定阈值在[55, 70]区间内灰度级为255的频率为有效特征。

5 实验

5.1 数据预处理

选择上述4组特征作为训练参数,分别为灰度特征的灰度能量、灰度熵,纹理特征的能量、熵,灰度分布直方图特征以及阈值在[55, 70]区间内灰度级为255时的频率,实验共包含煤与煤矸石各20幅训练样本、各14幅测试样本。将样本图像复制一份,在设定标签时分为2类: 一类将40幅训练样本分为煤矸石与煤,分别设定为0和1,将测试样本分为煤与煤矸石2类; 另一类将样本分为无煤尘覆盖的煤矸石、有煤尘覆盖的煤矸石、无反光区域的煤及有反光区域的煤分别设定为0、1、2、3,测试样本分为4类。采用SVM的自动训练模式,自主选择合适参数。

图7 煤与煤矸石样本阈值对比

5.2 实验结果分析

将4组特征分别组合为灰度特征与纹理特征(GG),灰度分布直方图特征与反光区域特征(HR),灰度特征、纹理特征与灰度分布直方图特征(GGH),灰度特征、纹理特征与反光区域特征(GGR),灰度特征、纹理特征、灰度分布直方图特征与反光区域特征(GGHR)。由于以识别煤与煤矸石为最终目的,因此在煤与煤矸石的4类样本中,将测试结果中无煤尘覆盖的煤矸石与有煤尘覆盖的煤矸石相互误识别的情形归结为识别正确,将无反光区域的煤与有反光区域的煤相互误识别的情形归结为识别正确。训练结果如图8所示。由图可以明显看出:在样本共分4类的情况下,当加入灰度直方图特征与反光区域特征时,识别率明显提高,最大值可达96.4%;在以GGHR为训练参数测试28幅图像时,共用时2.258 s,平均每幅用时为80.64 ms,满足分拣工作的实时要求。

实验采用SVM自动训练模式,由编程输出其自主选择的最合适参数。SVM有2个重要参数,分别是核函数与惩罚系数[15],其中核函数的选择关系到分类的结果。本文中SVM自主选用径向基函数(RBF)核,它可以将样本数据非线性地映射到高维空间,且能将复杂数据简单化,是一个较为理想的核函数[16]。惩罚系数反映对误差的敏感度,数值越大,拟合非线性能力越强,默认值为1.0,本文中SVM自主选择惩罚系数为62.5,具有较高精度[17]。

GG—灰度特征与纹理特征组合;HR—灰度分布直方图特征与反光区域特征组合;GGH—灰度特征、纹理特征与灰度分布直方图特征组合;GGR—灰度特征、纹理特征与反光区域特征组合;GGHR—灰度特征、纹理特征、灰度分布直方图特征与反光区域特征组合。图8 基于不同特征组合与支持向量机(SVM)分类器结合的煤矸石识别结果

6 结论

针对煤与煤矸石分拣过程中煤矸石表面可能覆盖煤尘影响识别准确率及识别效率问题,本文中提出了以反光区域特征与灰度特征纹理特征相结合并基于SVM的煤与煤矸石的分离方法,分析了煤与煤矸石的4种特征,提取其中存在差异性的灰度特征中的灰度能量、灰度熵,纹理特征的能量、熵,灰度分布直方图特征以及阈值在[55, 70]区间内灰度级为255的频率作为有效特征,且将以上4种特征分成5种特征组合作为不同训练参数进行实验对比。选择SVM构建分类模型,在数据样本有限的情况下能够具有较高的识别性能。

实验结果表明,以灰度特征、纹理特征、灰度分布直方图特征与反光区域特征为训练参数,基于SVM分类器时,识别率最高可达96.4%。如果只将煤与煤矸石分为2类,以灰度特征与纹理特征进行识别,则识别率提高7.1%,在2.258 s时间内可识别28幅图像,平均每幅图像用时80.64 ms,极大地提高了识别效率,满足了煤矸石实时分拣的要求。

猜你喜欢

灰度级煤尘煤矸石
温度对煤尘水分蒸发特性的影响规律研究
浅谈煤矸石在固废混凝土中的应用
煤尘云着火敏感性影响因素的实验研究
人眼可感知最多相邻像素灰度差的全局图像优化方法*
煤矸石的综合利用
基于灰度直方图的单一图像噪声类型识别研究
火力发电厂输煤系统煤尘综合治理探讨
基于混沌加密的DCT域灰度级盲水印算法
基于实测校正因子的实时伽马校正算法
改性煤矸石对污水中油的吸附作用