基于SVM和纹理的煤和煤矸石自动识别
2012-07-25王培培蒋慧慧
何 敏,王培培,蒋慧慧
(上海海事大学 电气自动化系,上海200135)
0 引 言
煤炭是我国的主要能源,资源极为丰富,对国民经济的发展起着非常重要的作用。但是开采结果中除了煤还伴随有大量的煤矸石。煤矸石的主要成分是岩石,其密度大、灰分高、发热量小,如果工业生产用煤中混合煤矸石,将严重影响燃烧质量及效率。因此,煤矸石分选是煤生产过程中不可缺少的环节[1]。
传统的煤和煤矸石分选主要有人工和机械分选法。人工手选由工人将煤矸石从煤块中挑选出来,该方法效率低下,且工人劳动强度比较大,工作环境恶劣。机械选择则一般采用重介法,跳汰等方法,但缺点是设备庞大,复杂,环境污染严重[2]。国内外都对煤矸石分选做了大量研究工作,如人工γ射线、机械振动、无线电探测、红外反射等方法,尽管这些方法可靠,但需要专业知识和设备,不易实现。
计算机和高性能成像设备的普及使基于图像的分选方法变得简单易实现。通常煤块的颜色比较黑,而矸石的颜色比较淡,因此煤和矸石的灰度分布和峰值也有所不同。可见,煤和煤矸石的灰度和纹理分析将有助于它们的识别,例如,可将样品煤和煤矸石的灰度和纹理值作为标准存在计算机中,识别时将实际值与之比较,就可以将煤和矸石区分出来。但灰度和纹理分析能提供多个特征参数,哪些特征参数有助于提高识别成功率,以及如何整合这些特征参数以完成图像的自动识别过程,正是作者的研究重点。
1 图像处理
1.1 图像获取
实验样本来自山西,包括两种煤 (分别称之为有光泽煤和无光泽煤)和一种煤矸石样本,如图1所示。图像采集在自然光照条件下使用DH-HN2000FC获取。
图1 煤和矸石原始图像
1.2 图像预处理[3-5]
彩色图像分别包含了图像的R,G,B颜色的信息,因此,在图像处理之前需要将原始图像转化成灰度图像。
本文采用Otsu法获自动获取图像的阈值,实现图像的分割和二值化。由于二值图像中有小颗粒杂质以及一些孔洞存在,因此还需要对二值图像进行数学形态运算。通过膨胀、腐蚀、开启,闭合等运算,可以把图像的小缺口,孔填上,把比结构元素小的突刺滤掉。图2(a)为煤矸石的原始图像,图 (b)为运用Otus法获得的二值图像,图(c)为处理后的二值图像,图 (d)为将原图与二值图像匹配后的图像。下文中的图像灰度分析和纹理分析主要是基于图 (d)来进行的。
图2 图像预处理
2 图像分析
2.1 灰度分析[7-8]
灰度直方图反映图像中各灰度级与各灰度级像素出现频率之间的关系。它是图像的重要特征之一,能给出该幅图像的概貌描述。在实际获取的图像中,无光泽煤看起来比较黑,灰度值比较低,有光泽煤块由于在光的照射下会反光,图像中会有发光点,而发光点的灰度值比较高,而煤矸石的灰度值一般比较高。因此煤和煤矸石的灰度直方图可以直观的反映它们的灰度范围和频率分布。其中,均值和方差是两个常用的与灰度有关的特征参数。假设煤或煤矸石图像为L级灰度图,灰度为b的像素点有hb个,图像区域包含的总像素,则煤或矸石图像的均值μ和方差σ2为:
均值
方差
2.2 纹理分析[9-11]
纹理是一种反映一个区域中像素灰度级的空间分布的属性。分析过程主要采用由Haralick定义的灰度共生矩阵(CM),它是描述纹理的一种常用的统计方法。灰度共生矩阵P(i,j,δ,θ)包含了图像关于方向、相邻间隔、变化幅度的综合信息。由煤和矸石的灰度共生矩阵,可以提取出二阶矩、对比度、相关、熵、逆矩差等特征参数值来定量描述图像纹理特性[12-14]。如:二阶矩反映了图像灰度分布均匀程度和纹理粗细程度,对比度可以理解为图像的清晰度。相关是用来衡量灰度共生矩阵在行或列方向上的相似度。熵反映图像中纹理的复杂程度和非均匀度。其计算公式如下:
二阶矩
对比度
相关
熵
逆矩差
其中
由于灰度共生矩阵反映的是灰度概率,因此图2(d)所示的图像中煤矸石周围的背景图像会对灰度共生矩阵产生影响。为了减小影响,直接截取图2(d)中的煤或煤矸石图像进行灰度共生矩阵分析。对一幅图像可以计算出0°、45°、90°、135°的灰度共生矩阵,因此,也可以计算出来4个方向的二阶矩、对比度等特性。此外,为消除方向的影响,作者将计算出的各个方向下的同一特征的平均值作为这幅图像此特性的值。
2.3 图像分析结果
如图3所示分别为无光泽煤、有光泽煤和煤矸石的灰度直方图。从图中可以看出无光泽煤的灰度全部集中在20-50之间,煤矸石集中在40-100之间,而有光泽的煤灰度分布在40-255之间,并在灰度为90时达到峰值。由此可见,我们可以通过观察灰度直方图直接对两种煤和煤矸石识别,但这种识别方法还不能被称为自动识别。
图3 煤和矸石直方图
图4 为两种煤和矸石灰度平均值和均方差的分布图。从图中可以看出,有光泽煤的灰度均值范围为80-110,无光泽煤为40-60,煤矸石为:60-80。而有光泽煤的灰色均方差范围为38-50,无光泽煤为30-40,矸石为20-30。可见煤和矸石的灰度均值的差距范围比灰度方差大。所以灰度均值更能反映出煤和两种煤矸石的灰度特性。
图4 图像灰度均值和均方差
图5为图像的灰度共生矩阵最大值、特征能量、逆矩差的对比图。图6为特征相关、熵、惯性矩的对比图。从图中可以看出,有光泽的煤的逆矩差近似0.83,而无光泽煤和煤矸石的逆矩差近似0.97,差距范围很小,不能反映煤和两种煤矸石的不同点。而图中其它5种特征值均范围区分较大。如:有光泽煤的相关的范围为0.05-0.15,无光泽煤的范围为3.5-5.5,煤矸石为1.0-2.0。
因此,灰度均值、灰度共生矩阵的最大值、能量、相关、熵和惯性矩的范围差距较大,可以利用这些特征值之间的显著差异可以识别出有光泽煤、无光泽煤和煤矸石。而无光泽煤和煤矸石的灰度均方差、逆矩差的值差距较小,所以利用逆矩差识别将会引起误差。
灰度均值、灰度共生矩阵的最大值等特征值虽然能被用来识别出煤或矸石,但考虑到实际情况中煤以及煤矸石往往种类众多,不同种类图像的特征值也有较大的差别,如果在识别过程中仅仅采用一个特征参数,往往识别成功率不高,而如果采用上文中的某几个特征参数,识别成功率提高了,但同时识别所需时间增加了,且需要较多的人为操作和判断。
因此为了在实际生产过程中为提高识别率以及实现自动识别,有必要采取新的方法融合有效特征参数。
3 基于支持向量机的自动识别[15-16]
支持向量机 (support vector machine,SVM)是Cortes和Vapnik与1995年首先提出的。它是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性 (即对待定训练样本的学习精度)和学习能力 (即无错误的识别任意样本的能力)之间寻求最佳折中,以期获得最好的推广能力[17-18]。由于支持向量机主要是正对有限样本,且本文中的实验样本种类较少,所以作者选择利用支持向量机来完成图像分类,以期得到在有限的图像样本条件下实现煤和矸石自动识别的目的。支持向量机分类器的实现利用了LIBSVM工具包,数据处理和训练方法如下。
3.1 数据预处理
在本文的第二部分中,经过灰度和纹理分析,作者已发现煤和矸石的灰度平均值、灰度共生矩阵最大值、能量、相关、熵和惯性矩值可以作为煤和矸石识别的特征参数,因此这里也就被选择作为训练的参数。由于各特征值的范围不同,为不免大数值引起的计算问题,训练SVM前首先须将特征数据映射到0-1范围内。
3.2 参数选择
训练时将煤矸石、无光泽煤、有光泽煤的标号设定为[0,1,2]。训练时最重要的就是确定核函数,核函数选择直接关系到分类的效果。RBF核能非线性地将样本数据映射到高维空间,且参数少,复杂度低,计算容易,因此本文选用RBF核。
3.3 训练结果
实验中选择两种煤和矸石共36张图像作为样本来训练SVM,用30张图像作为测试样本,训练结果显示支持向量机能正确识别29张图片,识别正确率为96.7%。由此可见,作者选取的6个特征参数以及在这些参数基础上建立起来的支持向量机能较好地完成实验样本图像的自动识别。
4 结束语
近年来,基于视觉的物体识别需求急剧增长,并能够提高效率,保护环境。本文以煤矸石识别为应用背景,首先在通过对获取的图像进行一定顺序的图像预处理后,研究出能有效识别的各种特征,最后利用SVM和有效的特征实现了煤矸石图像的快速准确识别。但同时也因注意到,本文所取的实验样本种类及数量均有限,故作者的实验结果未必适用于所有的煤和矸石识别情况。增加样本图像的数量和样本来源的种类,以此来提高支持向量机自动识别的准确率以及普遍性,这也将是作者今后的工作方向之一。
[1]ZHOU Shaolei,SHAN Zhongjian,DENG Xiaoyang.Status of coal preparation in China and trend of development [J].China Coal,2006,32 (11):11-14 (in Chinese). [周少雷,单忠健,邓晓阳.中国选煤业现状与发展趋势 [J].中国煤炭,2006,32 (11):11-14.]
[2]YAN Junxu,LI Ye.Application of digital image processing technology in the separation of coal and gangue [J].Sichuan Ordnance Journal,2009,30 (11):16-20 (in Chinese). [闰俊旭,李晔.图像处理在煤矸石识别系统中的应用 [J].四川兵工学报,2009,30 (11):16-20.]
[3]MA Xianmin,JIANG yong.Digital image processing method of coal gangues [J].Colliery Mechanical and Trial Technology,2004,31 (5):9-11 (in Chinese).[马宪民,蒋勇.煤与矸石识别的数字图像处理方法探讨 [J].煤矿机电,2004,31(5):9-11.]
[4]YAO min.Digital image processing [M].Beijing:China Machine Press,2006:78-96 (in Chinese). [姚敏.数字图像处理 [M].北京:机械工业出版社,2006:78-96.]
[5]SONG Jinling.Study on automatic separation of coal and gangue based on image processing techniques [J].Journal of China Coal Society,2004,41 (10):142-145 (in Chinese).[宋金玲.基于图像处理技术的煤和矸石自动分选研究 [J].煤炭学报,2004,41 (10):142-145.]
[6]WU Dongyang,YE Ning,SU Xiaoqing.Wood defect recognition based on GLCM and clustering algorithm [J].Computer and Digital Engineering,2005,37 (11):38-41 (in Chinese).[吴东洋,业宁,苏小青.基于灰度共生矩阵和聚类方法的木材缺陷识 别 [J].计算机与数 字工程,2005,37 (11):38-41.]
[7]CAI Yunxiang,XUE Shiqiang,ZHUO Zhiyong,et al.A method based on image processing for background classifying[J].Electro-Optic Technology Application,2010,25 (4):81-84(in Chinese).[蔡云骧,薛士强,周志勇,等.一种基于图像处理的背景分类方法 [J].光电技术应用,2010,25(4):81-84.]
[8]Chris Ebey Honeycutt,Roy Plotnick.Image analysis techniques and gray-level co-occurrence matrices(GLCM)for calculating Bioturbation indices and characterizing biogenic sedimentary structures [J].Computers and Geosciences,2008,34(11):1461-1472.
[9]Hobson M,Carter R M,YAN Y.Characterisation and identification of rice grains through digital image analysis [C].IEEEInstrumentation Measurement and Technology Conference,2007:1-3.
[10]FAN Lihong,FU Li,YANG Yong.Analysis of texture feature extracted by gray level co-occurrence matrix [J].Computer Application,2009,29 (4):1018-1021 (in Chinese).[范丽红,付丽,杨勇.灰度共生矩阵提取纹理特征的实验结果分析 [J].计算机应用,2009,29 (4):1018-1021.]
[11]RUAN Jiuzhong,ZHOU Chenbo,YANG Guohua.Image texture based on co-occurrence matrix for non-planar surface roughness[J].Optics and Optoelectronic Technology,2008,6 (6):36-40 (in Chinese). [阮九忠,周晨波,杨国华.基于灰度共生矩阵的非平面表面粗糙的图像纹理研究 [J].光学与光电技术,2008,6 (6):36-40.]
[12]BAI Xuebing,WANG Keqi,WANG hui.Research on the classification of wood texture based on gray level co-occurrence matrix [J].Journal of Harbin Institute of Technology,2005,37 (12):1667-1670 (in Chinese).[白雪冰,王克奇,王辉.基于灰度共生矩阵的木材纹理分类方法的研究 [J].哈尔滨工业大学学报,2005,37 (12):1667-1670.]
[13]David M Hobson,Robert M Carter,Yong Yanl,et al.Differentiation between coal and stone through image analysis of texture features[C].IEEE International Workshop on Imaging Systems and Techniques,2007:1-4.
[14]CHEN Quansheng,ZHAO Jiewen,FANG C H,et al.Feasibility study on identification of green,black and oolong teas using near-infrared reflectance spectroscopy based on support vector machine(SVM)[J].Spectrochimica Acta Part A,2007,66 (3):568-574.
[15]QI Hengnian.Support vector machines and application research overview [J].Computer Engineering,2004,30 (4):6-9(in Chinese).[祁享年.支持向量机及其应用研究综述[J].计算机工程,2004,30 (4):6-9.]
[16]MA Huaizhi,WU Qingxiao,HAO Yingming.Steelmaking materials recognition based on lifting wavelet transform and SVM classification [J].Computer Engineering and Design,2010,31 (18):4093-4096 (in Chinese).[马怀志,吴清潇,郝颖明.基于提升小波和SVM分类的炼钢物料识别 [J].计算机工程与设计,2010,31 (18):4093-4096.]
[17]Monica Marcuzzo,Pedro Quelhas,Ana Campilho.Automated Arabidopsis plant root cell segmentation based on SVM classification and region merging [J].Computers In Biology and Medicine,2009,39 (9):785-793.
[18]JIANG yuan.Research on target recognition for SAR image based on Contourlet transform and SVM [J].Information technology,2010,34 (11):105-110 (in Chinese). [蒋媛.基于Contourlet变换和SVM的SAR图像目标识别 [J].信息技术,2010,34 (11):105-110.]