APP下载

基于提升小波与SVDD的非线性profile监控*

2019-09-18李虹灿田光杰

组合机床与自动化加工技术 2019年9期
关键词:原始数据球体小波

李虹灿,田光杰

(郑州大学 商学院,郑州 450001)

0 引言

随着现代制造工艺复杂程度的提高,人们发现某些质量特性可由一个或多个解释变量用函数关系表示,这种表示质量特性与解释变量之间的函数关系被称为轮廓(Profile)[1]。通过建立轮廓监控图,能及时发现生产过程的异常波动,实现对产品质量的监控,从而达到控制产品质量、降低企业成本、提升企业经济效益的目的。在实际生产制造过程中,存在更多的是非线性函数关系,因此对于非线性轮廓的研究,市场需求更大,更具有现实意义。

目前国内外学者对于非线性轮廓监控的研究大致可以分为两类:第一类是参数方法。如T2控制图[2]、EWMA控制图[3]和χ2控制图[4]。第二类是非参数方法。利用历史受控数据的均值建立基准轮廓,将样本数据轮廓和基准轮廓之间的差异作为统计量,建立联合控制图。如EWMA-S控制图[5]、单值移动极差非线性轮廓控制图等[6]。基于机器学习的分类算法用于轮廓监控也逐渐成为研究热点。Guh[7]提出了基于神经网络的监控方法。在实际应用中,由于产品工艺复杂程度高、异常数据类型多等特点,获取并且标记足够多的异常样本需要耗费大量精力。因此如何利用相对较少的负样本进行非线性轮廓监控成为问题的关键。

支持向量数据描述(Support vector data description,SVDD)由Tax和Duin[8-9]提出,该方法以支持向量机(Support Vector Machine,SVM)思想为基础,有很强的单值数据处理能力,适合实际生产过程中异常样本难以获取的情况。同时通过核映射的处理过程,又具有较好的非线性处理能力。其在图像分类、模式识别等领域[10]已经得到有效应用,也有学者将此方法应用到质量过程监控领域[11-12]。尽管支持向量数据描述有上述优点,但是由于受到数据采集设备、外界环境等多种因素影响,原始数据中难免包含大量噪音。为了克服该缺点同时提高模型的有效性,可以对原始数据进行预处理。小波变换已成为数据压缩、去噪、特征提取等领域[13-14]的有力工具。然而,这种方法在检测信号奇异性时会耗费大量时间[15]。Sweldens[16]首次提出了一种构造双正交小波滤波器的方法,也称为提升小波或第二代小波变换。许多研究者[17-18]对提升小波理论及其应用进行了研究。

根据以上研究成果,针对异常样本难以获取且函数关系复杂的非线性profile监控问题,提出一种基于提升小波去噪与SVDD的非线性profile监控方法。通过提升小波去噪剔除原始数据中的噪音,加强正常轮廓和异常轮廓的区分度,并使用SVDD一分类方法实现对非线性profile的监控。仿真对比分析结果证明本文所提方法的有效性。

1 理论知识与监控模型构建

1.1 提升小波变换重构特征

提升小波变换(Lifting Wavelet Transform,LWT)继承了传统小波多分辨率的优良特性,不依赖于傅里叶变换,将小波变换分解为预测和更新两个阶段。并使预测和更新滤波器适应信号属性,构建期望的自适应小波变换。其所需要的存储空间少且运行速度快[19]。在不减少原始数据量的前提下,保留关键信息,显示出原始数据的变化特征。提升算法分为分裂(Split)、预测(Predict)和更新(Update)3个阶段。

(1)分裂:该步骤将输入的原始数据序列Xi分裂成奇数序列Xo和偶数序列Xe,两个互不相交的子集,即:

Xi={Xe,Xo}

(1)

(2)预测:根据相邻数据之间的相关性,用一个子集预测另一个子集,通常用偶数子集预测奇数子集。定义预测偏差为细节信号D,也称为原始数据的高频信号。其中P表示预测器:

D=Xo-p

(2)

由于相邻数据具有很强的相关性,通过选择合适的预测器,可以使高频信号D的值远小于原始数据奇数序列Xo的值。我们就可以用Xe和D代替原始数据,达到压缩效果。

(3)更新:由于分裂后的偶数序列与原始数据中的某些整体特征不一致,为了保留原始数据的整体特征,需要一个更新过程。通过更新器对偶数序列Xe进行更新,更新后的Xe含有原始数据中的低频信号L。其中U是更新器:

L=Xe+U

(3)

图1 提升小波重构示意图

经过K次提升小波分解,数据的整体特征主要集中在低频信号中,噪音主要集中在高频信号中。提升小波去噪的原理就是保留低频信号以及经过阈值处理后的高频信号,然后进行提升小波重构,得到去噪后的重构数据。

1.2 支持向量据描述

支持向量数据描述(SVDD)是一种一分类器,使用核函数将低维空间中线性不可分的数据映射到高维特征空间,在特征空间里寻求一个最优超球体边界。通过求解凸优化问题得到支持向量,在最小化超球体体积的同时,最大限度的包裹目标类样本,用以区分目标样本和异常样本。SVDD的最大优点就是在训练模型时只需要目标样本,适用于难以收集足够多异常样本的生产情形。且和其他分类方法相比,SVDD算法计算速度快、鲁棒性好、分类效果优良。

假设Xi(i=1,2...n)为训练样本,R是超球体半径,ξi(i=1,2...n)为松弛变量。D2代表映射到高维空间后,超球体边界之外的点到球心的距离。C是大于0的惩罚系数,代表操作者对于异常样本的接受程度。建模过程如下:

(4)

约束条件:

(5)

ξi≥0,i=1,2...nR≥0

对于上述二次规划问题,可以使用拉格朗日方法进行求解。引入对偶系数∂和γ,将约束条件加入到目标函数中,得到拉格朗日函数:

L(R,a,∂i,γi,ξi)=

(6)

其中,∂i> 0、γi> 0是拉格朗日乘子。

在计算时可以利用核技巧实现低维空间的非线性问题到高维空间的转化。本文中我们选择使用高斯核函数:

(14)

其中,参数σ可以改变,用以调节超球体边界的复杂性。σ值越大,SVDD边界越平滑;σ值越小,SVDD边界就越复杂。

图2 SVDD不同参数值示意图

为了确定新样本Z是否为异常样本,令Z与超球体中心a之间的距离为D2,如果D2>R2,则新样本位于超球体外,认为新样本是异常样本。

(15)

根据以上推导可知,通过比较D2和R2的大小,即可判断新样本是否在构建的超球体内,从而实现区分正常样本和异常样本的目的。通过上述方法处理之后,原始数据就转化成高维空间的超球体。

1.3 模型提出与假设

假设在某一生产过程中,有n个样本,每个样本都有位置相同的m个观测点,对于受控的非线性轮廓,可用如下模型进行描述:

yij=f(xij,βi)+εij

(16)

i=1,2...n,j=1,2...m,εij~N(0,σ2)

其中,f是已知的非线性函数,βi是第i个轮廓的参数值,εij是均值为0方差为σ2的独立同分布正态随机误差。本文中我们假设观测点位置固定。

图3 基于LWT-SVDD的非线性profile监控模型

针对第i个profile,收集在监测点处的质量特性值,对收集到的数据进行提升小波去噪之后,将其作为训练样本进行SVDD训练。其中训练SVDD参数的依据是控制图平均运行链长ARL(Average run length),即控制图发出警报的平均运行长度,当新样本落在控制线之外时,监控系统就会发出报警。其中ARL0表示受控过程平均运行链长,即从用控制图监控受控生产过程开始,到发现首个超出控制线的点为止,控制图的平均描点个数;ARL1表示失控过程平均运行链长,即从监控过程中出现首个偏移点开始,到出现第一个超出控制线的点为止,控制图的平均描点个数[20]。显然,在失控生产过程中,ARL1越小表示控制图的漏发报警概率β越小,监控性能越好。设计控制图时,控制限的确定和ARL紧密相关,控制限h的调整会影响到ARL0和ARL1的大小,例如在增大ARL0的同时,也会使得ARL1增加。所以在研究中常假定控制图平均运行链长ARL0=200,通过比较失控过程ARL1大小,讨论控制图监控效果好坏。

2 非线性轮廓监控仿真实验分析

2.1 仿真模型描述

假设在某一生产过程中,对第i个产品进行取样,得到的输出结果为yij=[yi1,yi2...yim]。其中m代表样本观测点个数。非线性轮廓模型如下所示:

(17)

j=1,2...m,εi~N(0,σ2)

其中,g0(x)表示受控轮廓模型,g0(x)+δ(x)表示失控轮廓模型,εij是服从独立同分布的随机误差项,假定σ=0.1。受控轮廓模型具体表达式如下:

(18)

每个样本yi代表一个非线性profile,选择监控点个数m=20,则监控点位置xj=0.05j,j=1,2…20。失控模型的表达式如下所示:

g1(xj)=g0(xj)+θ(r(0.9xj+0.1)+

(1-r)sin(4π(xj-0.5)))

(19)

其中,(0.9xj+0.1)表示模型的整体偏移量,该部分的变动会导致受控模型产生整体性的前后偏移,θ表示偏移幅度;sin(4π(xj-0.5))表示模型的周期性偏移量,该部分的变动会导致受控轮廓模型产生上下波动。这两种偏移在实际生产过程中都有可能存在,且不同情况下所占比例也不同,因此选用权重因子r代表两种偏移量在整体偏移中各占的比例,其中r∈(0,1)。本文研究中选取r=0.2,0.5,0.8,结合偏移幅度θ对非线性轮廓进行监控研究。

2.2 SVDD模型建立

根据上述假设模型,随机产生出2400组样本规模为20的仿真数据,共2400×20组仿真数据,随机选择400组为训练样本,剩余2000组为测试样本。采用提升小波对数据进行小波分解得到提升小波系数,然后进行去噪。目前在小波分析中常用的阈值有:固定阈值估计、极值阈值估计、无偏似然估计和启发式估计等。基于LWT-SVDD的非线性profile监控模型见图3。

本文采用固定阈值的方法,对高频系数设阈值限,公式如下:

(20)

其中,σ表示噪音的方差,具体的估计值等于每层小波高频系数绝对值按照从小到大顺序排列后的中值/0.6745。N是每层小波高频系数的长度值。信号噪声的最大限在很大概率上低于λ,所以可以用该阈值公式得到的阈值来区别噪声和信号分量,将二者分离后,得到去噪后的信号。

确定白噪音在小波系数的阈值限之后,需要有阈值函数对含有噪音的小波系数进行过滤,去除噪音系数。常用的阈值函数有软阈值和硬阈值两种。本文采用软阈值的方法对高频小波系数进行处理,公式如下,其中,λ为阈值;c为高频小波系数。

(21)

(22)

最后根据阈值处理后的小波系数对各组数据进行重构。对产生的2400组数据进行提升小波去噪,随机选择400组受控轮廓数据对SVDD模型进行训练,得到超球体半径R2,用训练好的模型对剩余2000组受控轮廓数据进行一分类。经计算,如果某组数据到超球体中心的距离D2>R2,则表示该模型对此样本错误分类。剩余2000组数据的错误分类率ER(Error Rate)表示SVDD模型的泛化能力,因为每组数据计算出的控制变量D2之间相互独立,所以有ARL=1/ER。因此可以通过网格搜索法找到使ER=0.005即ARL=200的参数组合,获得所需控制限h=R2,对非线性轮廓监控问题进行研究。然而改变SVDD的参数会导致支持向量的变化,因此通过网格搜寻的方法调整模型参数使其达到理想状态的效率较低。当无法找到理想参数组合时,可以通过Bootstrap重采样[21]的方法确定控制限,或者采用蒙特卡洛(Monte Carlo)的方法,不断调整h使ARL0近似等于200。具体步骤如下:

(1)对2000组测试数据采用有放回的方法进行抽取,抽取的个数与原始数据容量保持一致,共n个样本数据集。

(2)用训练好的SVDD模型,计算每个样本集中2000组数据的统计量D2,按照从小到大的方式进行排列,取第2000(1-ER)个D2值当做阈值。

(3)计算n个样本数据集的平均阈值,将其作为控制限h。

2.3 实验结果分析

本文采用MATLAB仿真数据,训练SVDD模型参数,进行非线性轮廓监控研究。首先通过1000次仿真实验,得到平均运行链长近似等于200时的模型参数。采用此模型对异常波动进行监控性能研究,ARL1越小,说明模型越能提早发现异常,监控性能越好。在给定ARL0=200的情况下,将本文提出的方法与χ2控制图、未使用提升小波重构的SVDD方法以及基于差异度[22]的方法进行对比研究。监控结果如图4~图6所示。

从图4、图5可以看出,在θ取0.08和0.1时本文所提方法略微次于SVDD的方法。但从整体来看本文所提方法效果较好,能在生产运行过程失控的状况下及时发现异常情况。

图4 r=0.2时不同监控方法ARL1比较图

图5 r=0.5时不同监控方法ARL1比较图

图6 r=0.8时不同监控方法ARL1比较图

从以上仿真实验结果可知,随着r逐渐增大,本文所提方法的监控效果越来越好,说明在检测有整体偏移的异常轮廓时,本文所提方法有较大优势。且当θ在0.02~0.25之间时,LWT-SVDD的方法较SVDD方法好,说明通过提升小波去噪对数据进行预处理后,可以提升SVDD异常轮廓区分能力,且这两种方法皆优于其余4种方法。同时从图表可以看出,剩余4种方法中,χ2控制图、M3控制图和M5控制图有相近的监控性能,M4控制图的监控效果最差。当θ>0.25,除M4控制图外剩余五种监控方法效果相当。最后在振幅相同的情况下,混合两种异常状态的ARL1要大于包含单一异常状况的情况,说明当失控模型混合两种异常状态时会增加监控的难度。

3 总结及展望

针对函数式复杂且观测点位置固定的非线性profile监控问题,提出了基于提升小波去噪与SVDD的非线性异常轮廓监控方法。该方法主要包括基于提升小波去噪、基于去噪重构数据进行SVDD参数估计及异常轮廓的监控。最后通过计算机仿真实验将本文提出方法与其他多种方法进行ARL1对比分析,结果表明本文所提基于提升小波去噪与SVDD的非线性profile监控方法能及时发现生产过程的异常状况。然而在检测微小偏移时,效果较SVDD的方法不明显,今后可以考虑在检测微小偏移方面提升LWT-SVDD的监控效果。另外提升小波重构函数的选择及分解层数的确定会直接影响异常轮廓的监控效果,如何解决上诉问题仍需进一步研究。

DOI:10.1088/1742-2140/aacf63.

猜你喜欢

原始数据球体小波
基于多小波变换和奇异值分解的声发射信号降噪方法
构造Daubechies小波的一些注记
越来越圆的足球
受特定变化趋势限制的传感器数据处理方法研究
计算机生成均值随机点推理三、四维球体公式和表面积公式
基于MATLAB的小波降噪研究
膜态沸腾球体水下运动减阻特性
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断
全新Mentor DRS360 平台借助集中式原始数据融合及直接实时传感技术实现5 级自动驾驶
对物理实验测量仪器读数的思考