基于主成分分析的织物瑕疵检测特征选取研究
2016-03-15马彦白俊
马彦 白俊
摘要:为了提取到能够反映织物瑕疵的关键特征,文章对织物瑕疵图像从多个角度分别提取了基于分形维的空隙特征、多重分形特征、傅里叶变换特征、小波变换特征共计19维特征;高维特征会造成运算成本的增加,为此利用主成分分析法,从原始特征空间中得出了8个主要特征;运用模糊C均值聚类算法(FCM)对正常织物图像和瑕疵图像进行了聚类分析。
关键词:织物瑕疵检测;特征选取;主成分分析;模糊C均值聚类算法;瑕疵图像;高维特征 文献标识码:A
中图分类号:TP391 文章编号:1009-2374(2016)09-0029-02 DOI:10.13535/j.cnki.11-4406/n.2016.09.013
特征提取和特征选择是图像检测的关键问题,它直接影响到后续处理中分类器的设计以及整个算法结果的性能。特征提取和特征选择是从原始特征中找出最有效(同类样本的不变性、不同样本的鉴别性、对噪声的鲁棒性)的特征。特征提取过程的实质是通过映射或变换的方法,将高维空间中的特征描述用低维空间的特征来描述。特征选择则是从众多特征中找出那些最有效的特征来实现降维。
Yoshio等人在对织物进行疵点检测时,把灰度共生矩阵作为图像的特征值,通过Bayes决策对疵点进行分类和评判;Cohen等人采用了基于模型的特征提取方法,他采用高斯马尔科夫随机场(GMRF)纹理模型作为织物疵点检测的特征值,然后进一步进行疵点的判别和分类,然而GMRF模型的计算量往往很大,而且实现起来较为复杂,检测的实时性不高,尤其对于在线检测尤为困难;步红刚等人对织物纹理估计了4个分形参数组成特征向量,并采用欧式检测器完成了织物瑕疵检测;张卉在参考文献[5]中将分形和小波理论相结合提取了织物瑕疵的纹理特征;步红刚在参考文献[6]中为了更细致地描述瑕疵纹理、降低检测错误率,提出了一种兼顾纹理概貌与细节信息、经向和纬向信息的混合特征向量提取思想,并采用单类模糊聚类检测器完成了织物瑕疵的检测。本文研究织物瑕疵检测过程中的特征提取与选择时,基于主成分分析方法,选择具有代表意义的特征,对特征空间降维,减少运算成本,以图提高检测速度和检测结果的准确率。
1 主成分分析原理
1.1 主成分分析的思想
主成分分析是采取一种数学降维的思想,找出几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关。具体做法就是找到少数几种线性组合,用这些组合来代替原来较多的变量,并且尽最大努力保留原来所有变量所包含的信息,这些组合指标就是主
成分。
1.2 主成分分析步骤
(1)对原始数据标准化处理;(2)计算相关系数矩阵R;(3)求出相关系数矩阵R的特征根,得到特征值λ1≥λ2≥…≥λp≥0和相应的特征向量μi=(μi1,μi2,…,μip),i=1,2,…,p;(4)计算主成分贡献率和累积贡献率,本实验取累积贡献率为95%的特征值对应的主成分;(5)计算主成分得分,根据标准化后的原始数据,分别带入主成分表达式,就可以得到各主成分下的各个样本的新数据即主成分得分。
2 织物图像特征提取
为了能够提取到尽可能全面地反映织物瑕疵的关键特征,本文基于织物瑕疵图像的特点,从多角度入手,分别提取了基于分形维的空隙特征、多重分形特征、傅里叶变换特征、小波变换特征共计19维特征,作为原始的织物瑕疵图像的特征空间。
2.1 空隙特征
分形在计算机视觉领域最为成功的应用是在纹理识别领域。分形维数作为纹理信号的一种特征,具有光照、几何形变不变性等优点,所以这种特征在不同情况下对纹理的识别率都很高。Mandelbrot引入空隙(lacunarity)这个术语去描述具有不同外表或纹理的分形及具有相同的分形维这一性质。
2.2 多重分形特征
多重分形特征可用广义维数谱曲线q-D(q)来描述,广义维数谱比简单分形维数携带了更丰富的图像特征信息,多重分形广义维数谱的宽度对应了场中数值的差异性程度。当应用到织物图像检测时,正常织物图像的灰度梯度的差异性较均匀,而出现瑕疵时的灰度梯度的差异性分布则比较奇异,便可以利用广义维数谱的宽度来区别瑕疵点。本文通过3个不同的q值对应的D(q)作为3个特征值。
2.3 傅里叶变换特征
傅里叶变换是把图像从空间域变换到频域的常用方法,傅里叶功率谱数值的大小反映不同频率成分的强度。提取傅里叶变换特征,其依据是不同的特征反映着样本不同的方向、纱线密度、亮度或纹理周期的规律
性等。
本文采用通过长方环周向谱能量百分比法提取的8个方形能量环各个百分比作为8个特征。
2.4 小波变换特征
由于本文实验选取的样本是128×128像素的图像,为了提取得到更多的信息,进行了二阶小波分解(分解阶数过多后得到的子图像过小不适合作为特征选用),因此采取对原本织物图像样本进行一阶和二阶小波变换的后水平和垂直细节图像共7个子图像灰度值作为7个
特征。
3 模糊C均值聚类(FCM)聚类算法
对运用主成分分析选取的主成分特征组合数据,用FCM算法进行聚类划分。
模糊C均值算法的基本思想是使目标函数迭代最小化,目标函数为:
(1)
式中:U=[uik]为隶属度矩阵;uik是第k个样本对于第i类的隶属度;m是加权指数;V是类中心矩阵;dik2=||xk-vi||2是样本xk与聚类中心vi的欧氏距离;J(U,V)值越小说明聚类效果越好。约束条件:某一个样本对于各个聚类的隶属度之和为1。
在约束条件下计算式(1)的极小值,用偏导数为0得到极小值必要条件:
(2)
(3)
根据式(2)和式(3)可循环迭代得到满足要求的聚类中心和隶属度矩阵结果,具体步骤如下:(1)设定算法的相关参数,如聚类类别数c、加权指数m、最大迭代数tmax、各个初始聚类中心vi、迭代次数t、迭代结束误差e;(2)基于当前的聚类中心利用式(3)计算隶属函数;(3)基于当前隶属函数根据式(2)更新织物图像各个类别的聚类中心;(4)选用适宜的矩阵范数e,若||Uk+1-Uk||≤e或t≥tmax,则停止迭代,结束运算,否则t=t+1,返回步骤2。
4 实验结果与分析
本实验选取的织物瑕疵样本种类是双纬瑕疵,样本图片均为128×128像素,取正常样本100幅,瑕疵样本50幅进行实验。首先对织物图片样本进行了直方图均衡化处理,有效抑制了噪声的影响;随后按照第2部分选取的特征分别提取到了相应的特征,并分别对特征进行归一化处理,于是得到了原始的19维织物图像特征;然后通过主成分分析算法后得到8个新特征;最后采用FCM聚类算法对特征空间进行聚类,得到正常和瑕疵两类,实验结果如下所示:
对于原始19个特征,正常样本分类正确率为85.52%,瑕疵类正确率为83.11%,平均正确率为84.31%,平均聚类时间为14.1~17.7s。
主成分8个新特征,正常样本分类正确率为91.61%,瑕疵类正确率为87.08%,平均正确率为89.35%,平均聚类时间为8.3~11.5s。
从实验结果可以看出,经过主成分分析后得到的新特征,比原始选取的19个特征,在聚类正确率和聚类消耗时间上均有显著提升。
5 结语
本文提出了较多织物图像特征,然后用主成分分析对这些特征进行了筛选,得到贡献率比较高且重叠效果较少的特征,对原始较多的特征实现了降维,减少了后续聚类算法所需时间,提高了性能。从实验结果可以提取的织物图像特征是有效的,采用的主成分分析对织物瑕疵特征进一步选取后在准确性和算法时间消耗上更进一步提高,这对于织物瑕疵检测在实际生产中的应用有重大意义。
参考文献
[1] Yoshio Shimizu.Expert system to inspect fabric defects by Pattern recognition [J].Sen-I Gakkaish,2000,46(1).
[2] F S Cohen,Z Fan,S Attali.Automatexl inspection of textile using text mal models[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2001,13(8).
[3] 徐贵力,毛罕平.利用傅里叶变换提取图像纹理特征新方法[J].光电工程,2004,(11).
[4] 步红刚,黄秀宝,汪军.基于多分形特征参数的织物瑕疵检测[J].计算机工程与应用,2007,43(36).
[5] 张卉.基于分形与小波理论的特征提取方法研究与应用[D].武汉理工大学,2008.
[6] 步红刚.基于混合特征向量和单分类检测器的织物瑕疵自动检测研究[D].东华大学,2010.
[7] B.B.Mandelbrot.The Fractal Geometry of Nature[M].San Francisco:Freeman,1983.
作者简介:马彦(1992-),男(土家族),湖北恩施人,武汉纺织大学硕士研究生,研究方向:机器学习。
(责任编辑:黄银芳)