基于混合模型与改进多分类马田系统的控制图模式识别
2019-12-02程龙生彭宅铭胡多海
詹 君 程龙生 彭宅铭 胡多海
1.南京理工大学经济管理学院,南京,2100942.南京科瑞达电子装备有限责任公司,南京,211100
0 引言
控制图作为统计过程控制最基本的工具,在产品生产的质量监控中起着重要的作用。基于统计假设检验的原理,控制图用于记录和监测某一关键部件质量特性的波动情况[1]。当一个点或多个点超过控制图的限制或者控制图呈现出非正常的控制图模式(control chart pattern,CCP)时,通常认为监控过程失控。随着研究的深入,一些研究者发现仅仅通过观察波动来判断控制图是否失控是很困难的[2]。1958年美国西部电气公司发现有15种常见类型的控制图模式,其中包含了6种最基本的控制图模式[3],分别为正常模式(NOR),周期模式(CYC),上升、下降趋势模式(UT/DT),向上、向下阶跃模式(US/DS)。识别非正常模式可以有助于早期发现失控过程,有针对性地缩小故障搜索范围[4]。例如,趋势模式可能与刀具磨损有关;循环模式可能意味着电源电压发生了波动[5]。精确的控制图模式识别不仅可以带来较低的报误率,更可以有效地实施控制图,而且对异常波动、变异来源的鉴定以及对质量保证与改进也至关重要[6]。近年来,随着自动化制造、实时采集与监控等技术手段的高速发展,控制图从人工控制图识别、计算机质量控制软件识别发展到以人工智能与机器学习为主导的智能控制图模式识别[7]。
研究学者对控制图模式识别已尝试了众多的算法模型,其中一个关键步骤即是特征提取。特征提取的目的是获取能反映数据特性的特征组合,为分类器提供识别参数,从而实现各模式的分类识别,例如文献中常选用的统计特征[8]、形状特征[9]及融合特征[10]等。通过特征提取,能够有效提高分类器的训练效率,然而特征提取的不足会损失原始数据的部分特征信息,造成分类器模式识别精度降低。如果可以针对控制图中各模式具有的典型特点,对控制图的输出信号构建数学模型,则模型中的参数就可表征该输出信号,即作为该信号的特征变量参与分类器的训练及识别,这是本文研究的一个出发点。
算法模型方面,从20世纪90年代开始,人工神经网络(artificial neural network,ANN)被广泛应用于控制图模式识别中[2,11-15]。ANN优点在于处理噪声数据时,不需要假设监控数据的统计分布及良好的自适应学习特性,但它也存在一些不足,它制约了神经网络模型的识别能力,例如模型需要大量的训练数据,容易陷入局部最小值,此外,过拟合、收敛速度慢等问题也会对算法产生负面影响[16]。另一方面,支持向量机(support vector machine, SVM)在分类领域有着较高的分类精度,也有不少研究学者将SVM应用于控制图模式识别中[6,16-17]。但SVM分类精度依赖于核函数和参数(成本参数、松弛变量及超平面)的选择,且识别过程消耗成本过大,并不适用于生产过程中的实时监测[2]。同时,虽然有学者开始使用其他方法对参与模型训练的初始特征集合进行筛选,提取有利特征再带入分类器中进行训练和识别,但这两类方法本身并没有在训练过程中对特征进行筛选,多余特征会大大增加算法的时间复杂度甚至影响分类效果,这是本文研究的另一个方向。
马田系统(Mahalanobis-Taguchi system, MTS)是日本著名质量工程学家田口玄一博士提出的多元模式识别方法[18],系统中田口式信噪比实验设计方法可以有效地进行变量约减,并通过构建正常样品的基准空间,对未知样品进行高效率的分类识别。近年来,马田系统在模式识别领域有着广泛的应用[19-20]。本文基于马田系统在特征约减和分类识别中优势,将马田系统应用于控制图模式的识别问题中。马田系统解决的是二分类问题,已有学者将马田系统应用于多类识别领域[21-22]。但是基于二叉树多类识别时,在某个节点处发生的分类错误将会延伸到下一级节点上,后续分类的错误率将会越来越高。如果仅仅依据马氏距离的区间进行多类识别往往效果很不理想,会存在大量重叠区域。控制图模式识别是多类识别问题,如何建立适合的多类判别准则,使得MTS更加有效精确地识别各模式,也是本文需要解决的问题。
田口博士提出的基于质量损失函数(quadratic loss function,QLF)确定阈值的方法,由于损失值的定义过于主观且不易权衡,从提出之后极少有学者使用。本文选用训练数据时的错误率重新定义了QLF中的损失值,使得损失不再主观定义,从而通过改进系统阈值,提高算法的识别精度。
综合以上分析,本文提出一种时间序列混合模型,用于识别控制图模式中的典型特征。利用MTS在特征约减和分类识别中的优势,采用多分类MTS(multi-classification MTS,MMTS)方法对控制图模式进行识别,并在算法中对阈值计算方法进行改进。将该算法应用于UCI数据集Synthetic Control Chart Time Series(SCCTS)及生产案例中,实验结果表明所提出的算法具有更好的识别效果。
1 时间序列混合模型及参数估计
(s(t)a)+(μ+r(t)σ)
(1)
其中,q为余弦周期函数线性叠加的个数;ωj为第j个余弦周期函数的角频率;Aj为对应角频率ωj的振幅;φj为对应角频率ωj的初始相位,φj∈(-π,π);k为斜率;b为截距;s(t)为用来判断t时刻是否发生阶跃的函数;a为阶跃幅值;μ为剔除周期项、趋势项及阶跃项后的均值;σ为标准差;r(t)为无法避免的随机波动函数。
参数估计包括以下4个阶段。
1.1 基于周期图法的周期项参数估计
xt=5+6cos(2π×10t-20π/180)+3cos(2π×30t-40π/180)
对xt添加随机噪声,通过MATLAB软件产生模拟数据集,绘制出加噪声的信号图像,利用周期图法绘制幅值频谱图及相位频谱图,见图1。
图1 幅值和相位的识别Fig.1 Identification of amplitude and phase
1.2 基于最小二乘法的趋势项参数估计
1.3 基于判定准则的阶跃项参数估计
通过判定准则,基于控制图的实时数据,对式(1)的阶跃项参数进行估计,以此表征控制图的阶跃特征。
1.4 随机项参数估计
式(1)剔除了周期项、趋势项、阶跃项后得到平稳的时间序列x′t。选用均值和标准差用于表征该平稳的时间序列。参数估计方法如下:
综上所述,确定了各项参数估计方法后将参数用于MTS特征空间的构建,进行控制图模式识别。
2 改进多分类马田系统(MMTS)
2.1 马田系统(MTS)
马田系统实施步骤如下。
(1)构建基准空间。定义用于识别多元系统的特征变量,收集正常样本特征数据。计算特征变量的均值、标准差,并对数据标准化,计算相关系数矩阵,从而计算各正常样品的马氏距离。
(2)基准空间有效性验证。收集异常样本数据。对异常样本的数据使用正常样本的均值和标准差进行标准化处理,再使用正常样本相关系数矩阵,计算异常的马氏距离。若正常样本马氏距离均在1附近,且异常样本马氏距离远大于正常样本马氏距离,说明基准空间构建有效。
(3)正交表及信噪比识别有效指标。通过正交表设计正交试验,基于正交表每次试验所选的特征变量,重新计算异常样本的马氏距离,从而计算用于代表每次实验运行响应的望大型信噪比。计算各特征参与实验时的信噪比均值与未参与实验时的信噪比均值,从而计算信噪比增量。若增量为正,则该特征被选用,否则将其剔除。
(4)未知样品的识别。根据优化后的特征,对正常样本重新构建基准空间。对未知样品,分别使用优化特征后的正常样本各特征均值,标准差及相关系数矩阵进行标准化处理和计算马氏距离。最后将未知样品的马氏距离与阈值比较,从而实现马田系统的识别。
2.2 基于改进质量损失函数的阈值计算方法
马田系统在优化指标后,需要计算阈值从而进行下一步的未知样品识别。田口博士选用QLF方法来确定阈值,本文用训练集中的错误率替代损失值,使其损失值不再主观,从而改进阈值的计算方法。
图2 正常样品的位置情况Fig.2 The position of the normal samples
田口博士认为系统的初始损失L0是与功能界限Λ0相关的损失,因此有如下定义。
因此,得到阈值计算模型:
(2)
2.3 改进多分类马田系统算法
参照马田系统的基本步骤,MMTS算法打破了只构建一个马氏空间的限制,为每个类别都建立了一个独立的马氏空间构建马田系统。对于未知样本,计算该样本在各马氏空间中的马氏距离,再根据建立的多类判别准则实现多类识别。具体实施步骤如下:
(1)构建多个马氏空间。多类识别中有p个类别,收集所属类别的样本数据,以各类别分别建立马氏空间。
(2)多个马氏空间有效性验证。以具体类别的样本而言,其余类别的样本均为异常样本,计算所有异常样本的马氏距离。若每个类别的马氏空间中,正常样本的马氏距离基本都在1附近,而异常样本的马氏距离远大于该类别的马氏距离,说明构建的多个马氏空间性能均良好。否则,需重新挑选各类别正常样本构建有效的马氏空间。
(3)多个马氏空间优化。按照2.1节步骤(3),对各类别的马氏空间通过正交表和信噪比筛选特征变量,从而对每个马氏空间实现优化。
(4)阈值的设定及多类判别准则。对各类别使用优化的特征重新构建马氏空间,基于2.2节改进的阈值计算方法计算第k个空间的阈值T(k),k=1,2,…,p。根据各马氏空间的特征优化结果对未知样本执行2.1节步骤(4),计算未知样品在第k个空间的马氏距离D(k),最后基于多类判别准则进行识别,识别准则如下:①若D(k)
综上所述,识别算法的完整流程图见图3。
图3 算法流程图Fig.3 The flow chart of algorithm
3 数据库实验分析
为了验证时间序列混合模型及MMTS在控制图模式识别中的有效性,采用了UCI数据库的控制图数据集SCCTS。其中NOR模式样本编号为1~100,CYC模式样本编号为101~200,UT模式为201~300,DT模式为301~400,US模式为401~500,DS模式为501~600。图4为数据集中各模式某一样品的控制图。
3.1 特征提取
(a) 正常模式
(b) 周期模式
(c) 上升趋势模式
(d) 下降趋势模式
(e)向上阶跃模式
(f)向下阶跃模式图4 各模式控制图Fig.4 Patterns of control chart
表1 周期项特征Tab.1 The periodic term features
表2 趋势项、阶跃项、随机项特征Tab.2 The trend, shift and random term features
3.2 MMTS算法构建与识别
本文采用五折交叉验证法进行算法验证,即将数据集600个样品随机分成5份,取其中4份共计480个样品作为训练集,1份共计120个样品作为测试集,共进行5次算法验证。以一次验证结果来说明。
(1)构建多个马氏空间。首先,收集各模式的样本特征数据,计算各模式下各特征的均值、标准差并标准化处理;接着使用标准化数据计算相关系数矩阵;最后计算各模式中的正常样品所在马氏空间的马氏距离。
(2)多个马氏空间有效性验证。当控制图模式中某个模式的样本作为正常样本时,其余模式便作为异常样本用于空间有效性验证。图5是6种模式正常样本和异常样本的马氏距离示意图,圆圈内的点表示以该模式为正常样本时的马氏距离。
(a) 正常模式为基准
(b) 周期模式为基准
(c) 上升趋势模式为基准
(d) 下降趋势模式为基准
(e) 向上阶跃模式为基准
(f) 向下阶跃模式为基准图5 6种模式样品在不同空间的马氏距离Fig.5 The MD of six pattern samples in different spaces
由图5可知,正常样品马氏距离均在1附近,而其他类别的马氏距离相比正常样本马氏距离差异较大,说明以各模式建立的马氏空间性能良好。
(3)多个马氏空间优化。通过正交表和信噪比,对训练样本中各模式样品12个指标进行筛选,从而优化特征空间。同时根据式(2)计算各模式马氏空间的阈值,筛选结果及阈值见表3。
由筛选结果可知,正常模式中,周期项、趋势项、阶跃项及随机项特征参数均有选取,能更好地刻画该模式下各项的平稳性;周期模式中,算法更多地选取了刻画周期项的特征,以区分周期与其他模式;上升、下降模式中,系统保留了趋势项的关键特征;向上及向下阶跃模式则筛选出刻画阶跃项的关键特征。由结果可知,通过MMTS中正交表和信噪比筛选的结果符合各模式实际情况,能更好地刻画这些模式特点。同时,将筛选后的指标代入MMTS中计算正常和异常样品的马氏距离,发现马氏距离差异更大,说明训练效果较好。
表3 特征筛选结果及阈值Tab.3 The results of selected features and thresholds
(4)测试集模式识别。计算测试集各样品到各模式的马氏距离并与各模式马氏空间的阈值比较,以一次实验结果说明。①测试集中共有12个样品均不属于任何一类。由多类判别准则可知,需比较各样品到各模式的马氏距离,最小马氏距离即识别为该模式。以样品编号83、184、491、582为例(表4)。由表4可知,虽然这些测试样品在各自模式判定时超过设定的阈值,但与其他模式的马氏距离相比差异较大,说明特征空间的构建良好,能较好地刻画各模式的特征。除列举的样品外,其余样品根据多类判别准则,均落入各自所属的模式中。②未出现同一样品判定为多类情况。③剩余样品均划分为正确的类别。
表4 样品在各模式中的马氏距离Tab.4 The MD of samples in different patterns
综上所述,6种模式共120个测试样品,通过建立的多类判别准则,各类别的识别准确率均为100%,且五次交叉验证结果均为100%。
3.3 讨论
本文经过五折交叉验证,控制图模式识别的结果均未出现误判,识别精度为100%。实验结果表明,基于时间序列混合模型及MMTS的控制图模式识别方法是有效的且识别精度高。
基于时间序列混合模型对控制图提取的12个典型特征,在参与MMTS算法训练时,正常样本和异常样本的马氏距离差异较大,说明这些典型特征可以有效表征控制图的各模式特点,且参与分类器识别时,使得分类器的辨识度更高。同时,在控制图模式模式中,经常会出现控制图的混合模式,例如阶跃趋势上升模式、阶跃趋势下降模式。此时,由于时间序列混合模型既可以对趋势项参数进行估计,又可以对阶跃项参数进行估计,因此对于这种混合模式,时间序列混合模型可以有效识别出趋势项和阶跃项特征。所以,当MMTS对混合模式进行识别时,也会因为趋势项和阶跃项的参数都较为显著而将混合模式从各种模式中识别出来。
在以往文献中,特征约减与分类器是作为两个独立模块共同参与模式识别的,而MMTS将特征约减与分类器作为一个整体。通过正交表和信噪比,将各模式特征从12个约减为5~8个,实现了基于训练过程的特征约减,从而筛选出的有效特征能更好地辅助后续识别工作。
为了进一步验证时间序列混合模型特征提取结合基于多类判别准则MMTS的有效性,选用了统计特征提取结合MMTS算法、分段线性模型特征提取结合MMTS算法、时间序列混合模型特征提取结合多分类支持向量机(MSVM)算法以及基于二叉树算法的MMTS,比较降维前后特征数量及识别精度,识别效果见表5。
表5 识别精度对比Tab.5 The comparison of identification accuracy
由表5可知,统计特征及分段线性特征提取不仅提取特征较多,且并不能较好地刻画典型特征,分类器识别精度低。基于时间序列混合模型与MSVM分类器结合,虽然识别精度较高,但MSVM并没有剔除冗余特征。基于二叉树算法的MMTS多类识别,效果也不如基于多类判别准则的识别效果好。对比结果说明,基于时间序列混合模型及MMTS算法相对于其他算法而言,特征约减有效,多类识别精度更高,这也说明本文的方法改进具有实践意义。
4 案例研究
某汽车制造商的发动机组装工艺中,凸轮轴的长度必须为(600±2)mm。如果凸轮轴长度超出规格会引起生产线下道工序组装失配,导致很高的废品率和返工率。采用单值控制图进行在线监测以发现过程异常波动,从而判定异常类型。收集一个月内每个班次5个凸轮轴长度数据,用于评估该产品的生产质量。系统监控运行时,以宽度为30的窗口在控制图上移动取值。控制图上每插入一个值,便以窗口内的控制图序列执行特征提取及模式识别,从而对异常模式报警并识别模式类型。
在某时段系统共监测了该长度的80次测量值,如图6所示。系统在过程中出现以下问题:①当插入第70个数据点时发出报警,有向下趋势模式出现,系统中一直处于向下模式预警;②当插入第76个数据点时发出报警,有向下阶跃模式出现。从控制图的数据图可以看出,系统反映情况与实际情况基本相符。同时根据异常模式类型分析原因且逐一排查,最终发现异常是由于刀具磨损所致。
图6 凸轮轴单值控制图Fig.6 Single-valued control chart of camshaft
上述案例说明了本文提供的特征提取模型及分类器能够有效识别实际加工中产品质量波动情况,说明该方法在实际生产中有应用价值。
5 结论
(1)本文通过时间序列混合模型特征提取,强化了控制图各模式的特征表达,使得各模式的信息得到了完整的描述。
(2)运用多分类马田系统方法进行特征降维,不仅有效剔除各模式中的冗余特征,降低分类模型复杂度,还提高了分类器的识别精度。
(3)改进的阈值和多类判别准则使得控制图的多类模式均得以识别,实现了真正意义的智能识别。