APP下载

基于多核学习的煤岩图像特征融合与识别方法

2019-06-11李望发

电子技术与软件工程 2019年7期
关键词:煤岩级联识别率

文/李望发

煤矿井下的人员安全问题一直是煤炭科学关注的焦点,随着科技的发展,采掘自动化和无人化是煤炭开采技术的方向。目前有基于物理的雷达、射线和红外探测等方法,但是这类方法识别不稳定,识别率低。基于视觉的煤岩识别技术具有实时监控、非接触式、易于实施等优点,引起众多学者关注。文献[1]通过提取煤岩图像的不同尺度下的小波系数的均值、方差和角二阶矩等信息进行级联,然后采用SVM分类器进行分类,但是计算量大;文献[2]提取煤岩图像曲波变换的不同层的系数进行级联,然后采用SVM分类器进行识别,但是识别率不高;文献[3]采用自学习字典结合局部约束线性编码进行特征提取,然后用SVM分类器进行识别,提高了识别率,但是耗时较长。SVM分类器是煤岩识别中常用的分类器,但是SVM分类器存在鲁棒性差的问题,特别是在多种特征融合的识别中如果只进行特征的平行拼接,会造成煤岩特征表达不够充分。

近年来,多核学习是机器学习领域研究的热点问题之一,在模式识别、目标检测等有着广泛的应用。特别是当训练样本数据异构、样本分布不均时,用单个核函数构建的支持向量机不能有效地解决分类问题,而多核学习能有效结合多种核函数种类和参数的优点,提高泛化分类能力。

笔者提出基于多核学习的煤岩图像特征融合与识别方法,采用不同的核组合对不同的特征进行多核学习,从而进行特征融合,而不是原来的特征直接级联,对于每个特征,训练出最佳的SVM核组合以及各自的核权重,构成每个特征的核矩阵,最后将每个核矩阵组合起来再进行多核权重学习,得到二级权重,最后将学习得到的权重与对应的核矩阵相乘再求和,构成最终的核矩阵,对测试样本的特征进行多核SVM分类。如图1所示。

图1:所提出方法的总体框架

1 多核支持向量机方法

1.1 多核学习原理

多核学习(multiple kernel learning)是支持向量机的的扩展,是鲁棒性和灵活性更强的基于核的学习模型,将数据投影到不同的核空间进行映射,能使数据在新的合成的空间进行更好的表达,从而提高分类精度。多核学习的重点是如何学习到各个核的权重系数,一般模型为优化分类器中核的线性组合:

其中主要算法有:基于半定规划(SPD)的多核学习算法、基于二次约束型二次规划(QCQP)的多核学习算法、基于半无限线性规划(SILP)的多核学习算法、基于超核(Hyperkernels)的多核学习算法、简单的多核学习算法(Simple MKL)、基于分组Lasso多核学习算法。本文采用简单的多核学习算法(Simple MKL),因为其收敛快,计算复杂度低和相对成熟。简单的多核学习(Simple MKL)将多核学习问题转化为光滑且凸的优化问题,然后采用迭代的方法先固定dm然后结合支持向量机训练算法构建分类超平面,根据梯度下降方向更新dm。Simple MKL将多核学习问题转化为如下优化问题:

图2:煤岩样本图像

式(4)的拉格朗日函数为:

表1:不同的特征融合方法的正确识别率

表2:不同煤岩识别方法的正确识别率

图3:传统MKL方法与传统SVM方法比较

将(6)代入(5),则对偶问题为:

将(7)代入(2),最终得到的优化公式如下:

1.2 多特征融合多核学习

上面的优化问题只是针对单组数据进行的多核学习,在多种特征的图像中,通过简单的级联不能充分表达煤岩图像特征,针对上述问题,本文提出基于多核学习的煤岩图像特征融合方法,在第一种特征中用一组核学习,得到对应的一组权重参数,在第二种特征值用一组核学习,得到另一组权重参数,然后将两种参数分别代入到对应的核矩阵组成新的矩阵,再进行多核学习,从而得到第三组权重,在测试阶段,三组权重组合成新的多核SVM分类器,进行识别。

其中T为特征种类数,λt为对应特征的核矩阵的权重,kt为特征t的核矩阵,K*为总的多特征多核SVM的核矩阵。将(1)代入(9),得到:

在训练时,先求出相应的dm,使然后令训练出λt, 将dtm、λt代入(10),最后得到多特征融合的多核矩阵K。则由传统的SVM得到的最后的判决函数如下:

一般的多核学习方法在初始化阶段每个权重dm的值相等,为保证收敛速度,在开始我们随机产生和为1的权重dm,使收敛速度加快。

2 实验结果与分析

为验证所提出方法的有效性,以井下常见的烟煤、无烟煤和页岩、砂岩为研究对象进行仿真实验。本文涉及的方法均在MATLAB R2014a平台上进行实验验证,并在配置为Intel Core i5-3210M 、2.50 GHz CPU,4 GB RAM的PC机下运行。

2.1 样本集

实验样本选取不同光照、不同角度的烟煤、无烟煤、页岩和砂岩灰度图像各60幅,共240幅,分为煤(烟煤、无烟煤)和岩(页岩、砂岩)两类,图像大小为180×200,灰度级为256,图像格式为jpg格式。部分煤岩样本图像如图2所示。

2.2 特征表示

为了验证本文提出的多核学习算法的泛化能力,实验中采用以下3种底层纹理特征描述子对煤岩图像进行特征表示:

2.2.1 LBP特征

基本LBP算子特征提取。在3×3窗口内,以窗口中心像素灰度值为阈值,将相邻八个像素的灰度值与其进行比较,若某像素的灰度值大于阈值,则将该像素的位置标记为1,否则为0。这样3×3邻域内的8个像素经比较可产生8位二进制数,可提取到256维的LBP特征向量。

2.2.2 Gabor特征

Gabor特征是一种可以描述图像纹理信息的一种图像特征,选取5个尺度,6个方向进行特征计算,得到30维特征向量。

2.2.3 灰度共生矩阵(GLCM)特征原始图像灰度级数256级,为了减少计算量,压缩图像灰度级到16。步距d=1,分别计算0°、45°、90°、135°四个方向上的灰度共生矩阵,求每个方向灰度共生矩阵的能量、熵、惯性矩和相关,得到最终16维纹理特征。

2.2 参数设置

对于rbf核与poly核,找到最佳的参数为σ=0.75和d=2,本次实验取该两种核函数进行实验。

取煤岩样本的GLCM特征和LBP特征,取一半样本做训练集,剩下的做测试集,重复十次,取结果的平均值,得到结果如下:

由图3可看出,传统MKL的识别率优于传统的SVM方法。

传统的MKL只是SVM的多核扩展,本文提出的多特征多核支持向量机(feature fusion multiple kernel support vector machine)能对不同特征进行加权融合。然后我们对GLCM特征+SVM、LBP特征+SVM、本文提出的多特征融合多核SVM进行实验,并且两种特征都用最佳参数的核系数(GLCM特征的高斯核系数σ=[0.75,2],多项式核系数d=2,LBP特征的高斯核σ=[0.5,2],多项式核d=2),取煤和岩样本各120张,每次实验中每种样本的数目依次为50、60、70、80、90,并从两种样本中取剩下图片中的30张作为测试样本。

从图4可以看出,在测试样本在70之前,多核多特征融合的学习方法明显优于单核的SVM方法,在测试样本为60个,也就是50%的样本数时识别率最高,达到98.33%。随着测试样本的增多,后期可能存在过拟合的风险,因此要控制测试样本的比例。

2.3 与其他特征融合方法的比较

通过2.1的方式构建训练集和测试集,做了10组实验,对实验结果取平均值。参与比较的是通过级联的特征融合与分类器融合,图像特征选择GLCM、Gabor、LBP。如表1所示。

通过与简单的空间级联方法的比较发现,多特征融合的多核学习方法的煤岩识别率高于通过级联的方法,表明从煤岩图像中提取来的不同特征,经过多核方法的融合,更能从图像中提取各种异构的特征,多核融合发掘图像的特征表达能力更强,从而提高识别率。基于不同特征组合的识别率分别提高了11.66%、7.50%、4.17%,说明简单的级联还不够充分挖掘煤岩的特征信息,若利用样本的类别的异构信息,则能更好地挖掘特征。

2.4 不同煤岩识别方法识别效果的比较

参与比较的其他方法有小波变换各层特征系数级联SVM识别方法和基于曲波变换各层特征系数级联SVM识别方法。综合考虑煤岩正确识别率和时间复杂度,LBP+GLCM组合特征的表现最好,在比较时采用的是基于LBP+GLCM的特征融合的识别方法。不同煤岩识别方法的正确识别率如表2所示。

从表2中数据得出,本文提出的多特征融合多核学习方法的煤岩识别率高于其他两种方法,说明了从特征加权与多核学习角度来改善煤岩图像的识别性能是今后提高煤岩正确识别率的又一条重要的途径。

图4:本文提出的多核学习方法和传统的SVM方法比较

3 结论

(1)本文提出的多特征多核学习方法,充分利用单特征的异构信息和多类别特征信息进行融合,提高了区分煤岩图像的能力,使得不同类别的特征能用不同的核表示,提高泛化能力,优于传统的SVM分类,从而达到更好的分类识别效果。

(2)与其它特征融合方法相比较,提出的多核学习方法具有更高的煤岩正确识别率,验证了所提出方法的有效性。

(3)另外从多核学习和多特征融合角度提高煤岩图像识别正确率,为进一步研究煤岩界面的自动检测提供了一种新的思路。

猜你喜欢

煤岩级联识别率
煤岩显微组分分选研究进展
基于类图像处理与向量化的大数据脚本攻击智能检测
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
提升高速公路MTC二次抓拍车牌识别率方案研究
级联LDPC码的STBC-OFDM系统
高速公路机电日常维护中车牌识别率分析系统的应用
基于级联MUSIC的面阵中的二维DOA估计算法
半煤岩巷金属支架锚杆联合支护在白源矿应用
综掘机在大坡度半煤岩巷中的应用
基于测井响应评价煤岩结构特征