基于ReliefF和PSO-SVM的木质材料超声无损分类技术
2016-10-11袁琪朗周真祥杨克己
袁琪朗,周真祥,杨克己
(1. 宁波城市职业技术学院,浙江 宁波 315100;2. 浙江大学 流体动力与机电系统国家重点实验室,浙江 杭州 310027)
基于ReliefF和PSO-SVM的木质材料超声无损分类技术
袁琪朗1,周真祥2,杨克己2
(1. 宁波城市职业技术学院,浙江 宁波 315100;2. 浙江大学 流体动力与机电系统国家重点实验室,浙江 杭州 310027)
指出了木质材料是一种广泛使用的可再生原料,对其进行正确分类可提高原料的利用率并防止在交易时欺诈行为的发生。鉴于常用木质材料分类方法的不足和支持向量机参数选择困难导致分类准确率低的问题,以超声无损检测手段为基础,提出了一种基于ReliefF特征选择和PSO-SVM分类器的木质材料分类新方法。该方法根据接收到的木材超声信号,通过ReliefF算法选取出最有代表的特征,然后使用粒子群优化算法对支持向量机的参数进行优化,提高了木质材料的分类效率和准确率。实验表明,基于ReliefF和PSO-SVM的方法能有效解决木质材料的在线分类问题。
木质材料;超声检测;ReliefF算法;粒子群;支持向量机
1 引言
木质材料在建筑、家具和乐器等众多行业中应用广泛[1,2],实现木质材料的有效分类,可以合理使用木材资源,提高其利用率,并确保相关产品真材实料、流通过程按质论价,防止交易欺诈行为。目前,木质材料的分类主要是在对待分类木材取样的基础上,凭借肉眼或采用显微镜[3]和机器视觉[4,5]等工具,根据木材样件表面的颜色及其结构与纹理特征,通过观察、分析和比较而予以实现[6]。这些方法的有效性取决于木质材料取样的合理性和完备性,并属于破坏性分类手段。因此,存在适用性差、分类效率低以及难以在木制成品材质检定中应用等问题,严重制约它们的应用范围。而超声无损检测技术由于超声波强大的穿透能力、在介质中传播后能携带出内部丰富的信息以及其安全性和易于与信息技术相互结合等优点,已成为材料定征应用最多及最具发展潜力的技术手段。如果利用该技术将超声波入射到待分类木材内部,通过超声波与其传播声程上织构相互作用后,可将待分类木材内部特征信息携带出来,定能结合模式识别技术达到木材有效分类的目的。由于超声无损检测技术能够提取全面反映木质材料内部组织和结构特性的特征参数,该技术的应用必将赋予相关方法准确高效、强适用性、低成本和非破坏性等的木材分类能力[7],解决传统方法依赖于取样及其表面特征实现分类的弊端。因此,利用超声无损检测开展木质材料自动分类技术的研究具有重要的理论意义和实用价值。
基于超声无损检测的木质材料自动分类技术是在通过超声无损检测获取木质材料内部组织和结构特征参数的基础上,利用模式识别技术实现木质材料的自动分类,牵涉到特征参数提取及模式识别两个基本过程。对于前者,由于超声无损检测技术具有声速、衰减以及相关信号的时域、频域和时频域等多种特征参数,如果直接利用这些参数实施分类,必然降低分类的效率,可能还影响分类的精确度。因此,如何从这些众多的特征参数中选取出最具代表性的分类特征,是提高木质材料分类效率和精度的关键。ReliefF算法是由Relief算法[8]经Kononenko[9]扩展而得到的一种适合于处理多类别数据的特征选择算法,与基于搜索策略和信息论的特征选择算法相比,具有简单、通用和效率高等特点,适合解决本文木材模式识别中特征选择的问题[10,11]。而对于后者,支持向量机(Support Vector Machine, SVM)利用结构风险最小化原理来提高其泛化能力,较好地解决了小样本、非线性、高维度和局部极小等问题[12],在木材识别和分类中具有良好的应用前景。但是,由于SVM相关参数的选择决定了其学习性能和泛化能力,进而影响其分类的精度,因而SVM相关参数的合理选取与优化确定是其有效识别和分类的关键。目前常用于SVM参数优化的方法有梯度下降法、遗传算法和粒子群算法等,但梯度下降法不仅稳定性差且效率较低,遗传算法也存在收敛速度慢和容易陷入局部最优值的问题。而粒子群优化(PSO)是一种模拟鸟类捕食行为的群智能搜索方法[13],与前两种方法相比,其不仅收敛速度快,而且易于实现,在神经网络参数优化和函数优化等方面已得到了成功地应用[14]。
基于以上背景,提出一种基于ReliefF和PSO-SVM的木质材料超声无损分类技术。该技术以超声无损检测手段为基础,采用透射的检测方式,将发射与接收换能器分置于待分类木材的两边,在确保良好耦合的前提下,由发射换能器向木质材料发射超声脉冲信号,该信号在木质材料内部传播过程中与其织构相互作用后透射到达接收换能器,经其转换为电信号以及通过调理和数字化后,利用数字信号处理手段获得接收信号的时域、频域和时频域等多种特征参数,并应用ReliefF算法对这些特征参数进行分析处理,选择其中最具代表性的量作为木质材料分类器的输入。同时,利用PSO算法对SVM的结构参数进行优化,构造出一种基于PSO-SVM的木质材料分类器,以达到对木质材料实现无损、高精和高效分类的目的,为自动化分类木质材料奠定必要的技术基础。
2 基于ReliefF算法的木材特征参数选择
透射法检测和分类木材原理如图1所示,发射与接收换能器通过耦合剂分别与待检木质材料的上表面和下表面接触,两换能器轴线保持重合。检测时,超声信号柔性激励模块产生预设幅值和脉宽的方波信号Pin作为输入,激励发射换能器产生超声波。超声波透过上层耦合剂,垂直于待检木质材料表面透射进入材料内部,并在木质材料内部沿材料的弹性对称轴传播,在材料内部经历一系列的透射和反射后,一部分超声波透射出待分类木质材料,经过下层耦合剂后进入接收换能器,得到输出信号Eout。同时,将发射和接收换能器通过一层耦合剂对心贴紧,测取参考信号Er。通过Er自相关以及Eout与Er互相关,分别得到自相关和互相关函数最大值所对应的时间T1和T2,可得超声脉冲信号在木质材料中的渡越时间为:
T0=T2-T1
(1)
图1 木材超声透射检测原理
若已知待检木材厚度为d,则木材的声波传播速度为:
(2)
可得单位厚度衰减(dB/mm)为:
(3)
式中Enout和Enr分别是输出信号与参考信号的能量。
为保证分类的准确性和稳定性,除了提取具有明显物理意义的声速和衰减系数等声学特征外,还应当充分利用超声透射信号Eout,从时域、频域和时频域的角度,提取不同的特征参数。研究表明,时域波形的峰值电压、均方根电压、振铃系数脉冲长度和包络的上升时间、包络上升斜率等特征,频域中的平均中心频率、带宽、功率谱熵等特征和时频域中小波分解各频段的能量及小波能谱熵等特征,均可以描述超声波在木材中传播的不同特征和作为木材超声分类的特征参数[15,16]。
ReliefF算法是目前公认的性能较好的一种特征选择评估算法,具有运行效率高,适用性强,对特征间关系不敏感等优点。算法从训练集D中随机选择一个样本R,然后从和R同类样本中找出k个最邻近样本(NearHit),从每个R的不同类的样本中均寻找k个最近邻样本(NearMiss),然后根据以下规则更新每个特征的权重:如果R和NearHit在某个特征上的距离小于R和NearMiss上的距离,则说明该特征有利于区分同类和不同类的最邻近样本,应增加该特征的权重;反之,如果R和NearHit在某个特征的距离大于R和NearMiss上的距离,说明该特征对区分同类和不同类的最近邻样本起负面作用,则降低该特征的权重,如式(4)所示:
(4)
在公式(4)中,diff(A,R,Hj)表示样本R和Hj在特征A上的差,计算如式(5)所示;Mj(C)表示类别C中的第j个最邻近样本;p(C)表示第C类的目标概率,由公式(6)给出,当各类样本数目大致相同时,有p(C)=1/C。
(5)
(6)
ReliefF特征选择算法的具体步骤如下:
输入:训练数据集D,样本抽样次数m,阈值(目标维数)d,最近邻样本个数k。
输出:特征权重最大的前d(d 步骤1:置所有特征权重为 0,T为空集。 步骤2:fori=1tomdo: ①从D中随机选择一个样本R; ②从R的同类样本集中找到R的k个最近邻样本Hj(j=1,2,…,k),从每一个不同类样本集中均找出 k 个最近邻Mj(C); ③forA=1toN; 按照公式(4)更新权重值W(A)。 步骤3:根据各个特征的权值大小,将其依次降序排列,选择出权值最大的前d个特征构成特征子集T。 3.1木质材料的SVM分类器及其参数 支持向量机是一种寻找最优分类超平面的方法,它通过最大化分类间隔来保证最好的推广能力,并定义核函数的内积函数来间接地实现对特征的线性变换,把低维空间线性不可分的问题在高维空间实现线性可分[17]。设提取的木质材料训练样本为{(x1,y1),…,(xi,yi),…,(XN,yN)},xi为输入特征向量,yi为类别标志。对二分类问题,令yi∈{1,-1},则存在分类超平面 g(x)=(w·x)+b=0 (7) 把所有N个木质材料的样本都没有错误地分开,其中w∈Rd是线性判别函数的权值。 图2 规范化的最优分类超平面 如图2所示,对于某一个分类超平面g(x),设两类木质材料样本中离超平面最近样本点的函数距离|g(xj)|=1,那么所有训练样本都满足 yi[(w·xi)+b]≥1,i=1,2,…,N (8) (9) 式(9)是一个典型的二次规划模型,将其转化成相应对偶模型,即 (10) (11) 即那些落在两类样本点的边界上的点为需要求解的支持向量。则所得到的分类决策函数为: (12) 对应的最优解为: (13) 对于非线性情况,通过某一个函数φ(x),将样本映射到更高维度,使样本之间稀疏化,满足在高维空间线性可分,然后再构建支持向量机,这时式(12)的决策函数变为 (14) 设k(xi,x)=(φ(xi)·φ(x)),则k(xi,x)称之为核函数。SVM中较常用的核函数有多项式核函数、径向基(RadialBasisFunction,RBF)核函数和Sigmoid核函数,本文选择最为常用RBF核函数作为SVM函数,其表达式为: (15) 其中g为核参数,它与学习样本的输人空间范围或宽度相关,样本输人空间范围越大,取值越小,反之,样本输人空间范围小,取值越大。 实际上SVM不能将木质材料的训练样本集完全分离,因此需要引入松弛变量ξi,以忽略错分样本的影响,求出能够对大多数样本进行分类的超平面。这样求解超平面的问题变为 (16) 3.2基于PSO的SVM参数选择 参数c和g的选择决定了SVM的学习能力和泛化能力,从而影响木质材料的分类精度。粒子群优化算法 (particleswarmoptimization,PSO)是由Eberhart博士和Kennedy博士于1995年提出的一种通过模拟鸟群觅食行为而发展起来的随机搜索算法,它能快速选择出合适的核参数g和惩罚因子c,因此有效提高木质材料的分类精度。 在PSO中,把g和c的潜在最优解看作是二维搜索空间上一个没有体积和重量的点,称为“粒子”(Particle)。设Pi=(pi,1,pi,2)是粒子i的当前位置,Vi=(vi,1,vi,2)是微粒i当前的飞行速度,对g和c进行优化选择的粒子群算法迭代方程如下: vi,j(t+1)=ωvi,j(t)+c1rand1()[pbesti,j(t)-pi,j(t)]+c2rand2()[gbestj(t)-pi,j(t)] (17) pi,j(t+1)=pi,j(t)+vi,j(t+1) (18) 式中,t表示迭代次数;pbesti,j(t)表示微粒i第j维度迄今为止经历的历史最好位置;gbestj(t)是当前粒子群搜索到的第j维度的最好位置,即种群最好位置;c1、c2分别为认知学习因子和社会学习因子;rand1()、rand2()是在[0,1]上两个相互独立的随机数;为惯性权重,取值区间一般为[0.7,1.2],并采用随迭代次数线性递减的策略。迭代过程中取能够直接反映SVM对木质材料的分类性能的均方误差(meansquareerror,MSE)作为粒子的适应度值,MSE的定义为: (19) 式中y是预测值,yi是实际值。 图3为基于PSO的SVM参数优化过程,具体算法的步骤描述如下。 图3 粒子群优化SVM参数流程 第1步,初始化。给定PSO算法的群体规模、学习因子c1和c2、惯性权重、最大迭代次数、粒子的初始位置和速度等; 第2步,评估每个粒子的函数适应值。采用均方误差评价函数MSE计算出每个粒子的适应度,将每个粒子的个体当前适应值与经历过的最优目标适应度值相比较,如果更优,则将其作为当前最优目标适应度值;取适应度最好的粒子所对应的个体极值作为最初的全局极值; 第3步,根据适应度值更新cbest和gbest; 第4步,更新粒子的惯性权重值,利用式(17)、(18)进行迭代运算,更新每个粒子的速度和位置值; 第5步,判断是否满足迭代终止的条件(达到最大迭代次数或预设的精度),若满足条件则终止搜索,输出最优参数c和g的值及最佳分类精度,否则返回第二步,进行下一轮的迭代搜索,直到满足迭代终止条件为止。 本文采用一套便携式木质材料超声分类系统,其实物照片如图4所示。 为了验证基于ReliefF和PSO-SVM的超声木材分类方法的有效性,本文使用100kHz的超声换能器,以凡士林作为耦合剂,对家具中常见的8类木质材料(刨花板、胶合板、密度板、白腊木、黑胡桃、花梨木、杉木和橡胶木)进行超声检测和数据采集,采样频率为10MHz。对刨花板、胶合板和密度板这些非实木薄板材料,分别从正反面不同位置采集50组数据;对白腊木、黑胡桃、花梨木、杉木和橡胶木这些实木材料,分别从其径向和弦向4个不同面不同位置采集50组数据,一共采集400组样本数据。数据采集界面如图5所示。 图4 木质材料超声分类系统实物照片 图5木质材料超声检测数据采集界面 对采集到的400组木质材料样本信号分别从时域、频域和小波分解时频域进行特征提取,共得到25个特征,分别为声速、单位厚度能量衰减、均方根值、时间形心、脉冲长度、偏度系数、峭度系数、振铃系数、包络持续时间、包络上升时间、包络下降时间、包络上升斜率、包络下降斜率、波形峰值、平均中心频率、平均带宽、80~120kHz频带能量值、频率形心、功率谱熵、6层小波包分解重构信号前5个频带的能量百分比和小波包能谱熵。通过ReliefF算法(抽样次数m=600,邻近样本数k=5),对400组样本产生的25个特征进行评价,评价结果如图6所示。 图6 ReliefF算法计算的各特征分类能力的权值 利用图6的结果,按分类能力的权值进行排序,其中排在前10位的特征如表1所示。 从表1中可以看出,评价后的声速和单位厚度能量衰减特征具有非常强的分类能力,且远大于其他特征的分类能力。实际上,通过式(1)~(3)计算声速和单位厚度能量衰减需要参考信号和取样厚度信息,消除厚度对特征的影响,从而具有更强的分类能力;其余特征的计算只需用到超声透射信号,分类能力相对较差。声速和单位厚度能量衰减的特征分布如图7所示,其中横坐标是样本编号,每50个样本归为一类共8类。 表1 提取特征按分类能力权值大小排序 图7 不同类别木质材料的特征分布 采用8类共400组木质材料样本数据,选择分类能力强的前几个特征,比较BP神经网络、SVM和PSO-SVM对木质材料的分类结果,其中200组样本用于训练,另200组用于测试。采用3层的BP网络结构(隐含层15个节点,输出层8个节点),设置最大训练次数为10000次,最小均方误差为10-6;设置SVM默认参数为g=0.2,c=1;PSO-SVM中,粒子群规模为20,最大进化代数为100,学习因子c1=c2=2,ωini=1.0,ωend=0.8,参数g和c的搜索范围都设置为[0.1,100]。按分类能力从大到小选取不同特征个数时8类木质材料200个检验样本的分类准确率和训练后识别单个测试样本所需时间如表2所示;当随机选取3个特征时,PSO-SVM的优化参数、分类准确率和识别单个样本所需时间如表3所示。 表2的实验结果表明,使用粒子群优化的支持向量机模型对木质材料进行分类,分类准确率明显高于BP神经网络和普通SVM,且单个样本所需识别时间较短,能满足木质材料在线分类的需求;但随着使用特征数的增加,分类所需时间明显增加,而选择特征数大于3个时PSO-SVM的分类精度增加非常有限,故选择声速、单位厚度能量衰减和平均中心频率这3个特征的PSO-SVM分类方法,能取得比较满意的结果。 通过随机选取3个特征且使用PSO-SVM分类的结果与ReliefF算法选择3特征且使用PSO-SVM分类的结果对比分析,从表2及表3可以看出使用ReliefF算法选择相同个数的分类能力较强的特征,有利于显著提高木质材料分类的精度。 表2 不同特征数目时BP、SVM和PSO-SVM分类结果 表3 随机选取3个特征使用PSO-SVM的分类结果 对木质材料进行无损、准确、快速的分类,关键在于分类技术手段选择、特征的选取及分类器的设计。本文利用超声脉冲波透射法对木质材料进行检测,克服了常用木材分类方法的不足,实现木质材料无损、快速的分类。通过ReliefF算法选取出最有代表性的分类能力较强木材超声信号特征,降低使用特征的维数,实现保证分类准确率同时又减少分类工作量,从而提高在线分类的效率。采用粒子群优化算法对支持向量机进行优化,解决了支持向量机参数选择的难题,明显提高了木质材料的分类准确率。最后以家具中常见8类木质材料的400组超声检测数据作为研究对象,验证了ReliefF算法和PSO-SVM分类模型的性能。实验结果表明,基于ReliefF和PSO-SVM的超声木质材料分类方法能有效提高木质材料的分类精度和分类效率。 [1]刘振波,刘一星,沈隽,等. 乐器共鸣板用木材的声学特性研究进展[J].西北林学院学报,2006,21(3):124~129. [2]李无为.木结构建筑工程中生态建筑材料的应用[J].林产工业,2013. [3]李敏华,谭必明,黄志同,等.古家具木材无损鉴定方法研究[J].西北林学院学报,2012,27(6),165~167. [4]DIAO X M,FURUNO T,FUJITA M. Digital image analysisofcross-sectional tracheid shapes in Japanese softwoods using the circularity index and aspect ratio[J].J Wood Sci,1999,45(2):98~105. [5]王克奇,王业琴 ,白雪冰,等.板材图像识别中颜色特征参数的提取[J].东北林业大学学报,2006,34(3),104~105. [6]汪杭军,张广群,祁亨年,等.木材识别方法研究综述[J].浙江林学院学报,2009,26(6):896~902. [7]尤超勤.木质材料超声无损定征与分类技术的研究[D].杭州:浙江大学,2014 [8]Kira K,Rendell L.A.The feature selection problem: Traditional methods and a newalgorithm[J]. Proceedings of Ninth National Conference on Artificial Intelligence,1992(1):129~134. [9]Kononenko I. Estimation attributes: analysis and extensions of RELIEF[J]. Proceedings of the 1994 European Conference on Machine Learning, 1994(1):171~182. [10]蒋玉娇,王晓丹,王文军,等.一种基于PCA和ReliefF的特征选择方法[J].计算机工程与应用,2010,46(26):170~172. [11]杨志新,段美君.ReliefF算法在雷达辐射源信号识别中的应用[J].成都大学学报(自然科学版),2012,31(2). [12]AzarAT,El-SaidSA.Performance analysis of support vector machines classifiers in breast cancer mammography recognition[J]. Neural computing &Applications,2014,24(5). [13]POLI R, KENNEDY J,BLACKWELL T. Particle swarmoptimization [J]. Swarmintelligence, 2007, 1(1): 33~57. [14]BlasiL,BarbatoS,MatteiM. A particle swarm approach for flight path optimization in a constrained environment [J]. Aerospace science and technology,2013,26(1):128~137. [15]张家凡. 振动信号的包络解调分析方法研究及应用 [D]. 武汉: 武汉理工大学, 2008. [16]张训亚. 兴安落叶松木材性质的声—超声技术预测[D]. 北京:中国林业科学研究院, 2011. [17]张学工. 模式识别[M].3版. 北京:清华大学出版社, 2010: 116~117. Ultrasonic Non-destructiveClassification for Wood Materials Based on ReliefF and PSO-SVM Yuan Qilang1, Zhou Zhenxiang2, Yang Keji2 (1.NingboCityCollegeofVocationalTechnology,Ningbo,Zhejiang315100;2.TheStateKeyLaboratoryofFluidPowerTransmissionandControl,ZhejiangUniversity,Hangzhou,Zhejiang310027,China) Wood material is a widely used and renewable raw materials, which needs to be classified correctly in order to improve its utilization and avoid fraud in trading activities. Given the lack of traditional wood classification methods and the low classification accuracy resulted from difficulties of choosing suitable parameters in the Support Vector Machine, a new wood classification method was proposed in this paper combining the Ultrasonic Non-destructive Testing , ReliefF feature selection algorithm and PSO-SVM classifier.By using the ReliefF algorithm to select the most representative features from the received wood ultrasonic signal and optimizing the parameters in the Support Vector Machine with Particle Swarm Optimization algorithm, the proposed method improved the efficiency and accuracy of the classification of wood materials. The experimental results showed that, the proposed method based onReliefF and PSO-SVM could effectively solve the problem of online classification of wood materials. wood materials; ultrasonic testing; ReliefF algorithm; particle swarm optimization (PSO); support vector machine (SVM) 2016-06-06 国家自然科学基金项目(编号:51175465) 袁琪朗(1965—),男,高级工程师,从事测试技术教学与应用研究。 杨克己(1963—),男,博士,教授,从事机电一体化理论与技术的教学和科研。 TP273;TN911.7 A 1674-9944(2016)14-0262-063 基于PSO-SVM的木质材料分类器模型
4 实验分析
5 结论