一种线性轮廓数据的在线监控方法
2022-11-15齐德全陈实
齐德全,陈实
(长春理工大学 数学与统计学院,长春 130022)
统计过程控制(Statistical process control,SPC)是保证产品与服务符合规定要求的一种质量管理技术,可以为“优质”提供质量技术上的指导与帮助。SPC的理论研究始于对一元连续点数据的监控,目前已由一元丰富到多元及高维数据流,由连续数据丰富到离散数据,由点数据丰富到线数据及面数据,其理论研究结果已十分丰富。SPC现已广泛用于工业质量控制[1]、医学诊断[2]、交通流[3]和网络安全[4]等诸多领域。
线性轮廓数据在实际生产中常常用到,例如,在半导体制造业,气体的流动取决于流量控制器的压力;在电气工程领域,电容器的电荷取决于电容水平。关于线性轮廓数据的在线监控问题,许多学者给出了监控效果非常好的方法。2000年Kang等人[6]提出两种控制图在线监控线性轮廓数据,一种是多元T2控制图,另一种是指数加权滑动平均(EWMA)控制图与R控制图的结合。Kim等人[7]于2003年提出将自变量x中心化,使自变量的平均值等于0,并通过三个独立的EWMA控制图分别监控截距、斜率和标准差,称为KMW控制图。但上述控制图参数估计过于繁琐、效率太低、控制图不易构建。针对这些问题,2007年Zou等人[8]提出多元指数加权移动平均(MEWMA)控制图来监控线性轮廓数据的截距、斜率和标准差。模拟结果表明MEWMA控制图对中小漂移的监控性能要好于KMW控制图。么彩莲等人[9]在2020年提出一种基于加权似然比检验(WLRT)的方法用于在线监控线性轮廓数据。在监控截距和斜率漂移时,WLRT控制图与KMW和MEWMA控制图性能很接近。但在监控标准差漂移时,WLRT控制图性能较好。
WLRT、MEWMA和KMW控制图的监控效果都受到光滑参数的影响,较大的光滑参数对大漂移较有效,较小的光滑参数对小漂移较有效。当实际漂移大小不是所设计的光滑参数所考虑的情况时,控制图会有很糟糕的表现。但是在监控生产过程中,很难准确地知道漂移大小。为了提高线性轮廓数据的监控效果,提出一种自适应的多元EWMA(AMEWMA)控制图的方法。AMEWMA控制图与Zou等人提出的MEWMA控制图的区别在于是自适应的,光滑参数是监控时间的函数,这样使得对不同大小的漂移都具有更有效的监控性能。为了说明AMEWMA控制图监控线性轮廓数据的有效性,通过蒙特卡洛模拟和化学工业气体传感器案例的实际数据,对所提出方法进行检验,AMEWMA控制图的监控性能比现有的控制图更有效。
1 基于自适应的多元EWMA图
假设在任意时刻t得到的随机样本为(xi,yit),i=1,2,…,n,t=1,2,…,n。对于第 t条曲线,设响应变量yit与解释变量xi之间的关系如下:
假设式(1)在第τ时刻,发生了未知的漂移。为了监控该变点模型,考虑检验如下假设:
1.1 MEWMA图
根 据 Lowry[10]和 Prabhu[11]的 研 究 ,Zou 等人[8]提出了使用如下的MEWMA控制图来监控线性轮廓数据。假设Zt=[Z1t,Z2t,…,Zpt]'是一个p×1的向量,服从多元标准正态分布,即Zt~Np(0,I),其中0是p×1的零向量和I是p×p的单位矩阵。
设{At}是基于{Zt}的MEWMA序列,定义如下:
当 t=1 时,则Al-1=A0。A0=0;λ ∈ (0,1]。当监控过程受控时,At的平均向量是0,渐近协方差矩阵是的情况下报警,其中L>0是控制限,λ是光滑参数。
1.2 AMEWMA图
MEWMA控制图的监控效果受到光滑参数的影响,因此本节提出了如下的自适应的EWMA(AMEWMA)控制图。将光滑参数定义为监控时间的函数,让光滑参数λ随着监控的时刻发生变化,在每个时刻可以根据模型的漂移大小选择合适的λ,这样同时兼顾了对大中小漂移的监控效果。
首先求序列Ut=Z'tZt的均值u,将光滑参数定义为如下监控时间t的函数:。MEWMA 控 制 图 在
在监控过程中的每个时刻都可以通过定义的函数g(t)在较大漂移时选择较大的光滑参数;在较小漂移时选择较小的光滑参数。因此当模型发生漂移的时候,控制图能够快速发出报警信号。
然后计算基于g(t)和Zt的AMEWMA序列{Jt}:
当t=1时,则Jt-1=J0。其中,J0=0;g(t) ∈ (0,1]。当J'tJt超过控制限h时,AMEWMA控制图发出失控的警告。
监控过程的流程图如图1所示。
图1 监控过程的流程图
2 数值模拟与实证分析
先通过数值模拟将所提出的AMEWMA控制图与WLRT、MEWMA和KMW控制图进行性能比较,再通过化学工业气体传感器的数据集进行实证分析。
2.1 数值模拟
参考么彩莲等人[9]的线性受控模型,设yit=A0+ A1xi+ εit= 3+ 2xi+ εit,εit~N(0,1),其 中t为任意时刻,x(ii=1,2,3,4)取固定值2、4、6、8。将xi中心化,得到模型为
在控制图的比较中,平均运行长度(ARL)是非常重要且常用的评价指标。当过程受控时,ARL越大的控制图比其他控制图的误报率越低。当过程失控时,ARL越小的控制图监控过程漂移的效果越好。为了公平,本节中将所有控制图的参数λ取为0.2,并将受控时的ARL(记为ARL0)取为200,然后比较失控时的ARL(记为ARL1)。本节后面的所有结果都基于100 000次模拟。
为了研究AMEWMA控制图检测模型漂移时的性能,设截距、斜率和标准差漂移的形式为:A0'=A0+ α,A1'=A1+ β,σ'= γσ。当截距A0发生漂移时,控制图的ARL1结果如表1和表2所示。
表1 截距漂移时(0.1~0.5),控制图的ARL1
表2 截距发生漂移时(0.6~2.0),控制图的ARL1
根据表1和表2的ARL1对比可以看出:当截距发生小漂移或发生中大漂移的时候,AMEWMA控制图的ARL1都小于WLRT、MEWMA和KMW控制图的ARL1。由此可见,AMEWMA控制图监控截距漂移的效果较好,KMW、WLRT和MEWMA控制图的效果相近。例如,在α=0.1时,AMEW-MA、WLRT、MEWMA和KMW控制图的ARL1分别为112.4、131.2、131.5、133.7。斜率和标准差发生漂移时,控制图的ARL1结果如图2和图3所示。
图2 斜率漂移时(0~0.25),控制图的ARL1
图3 标准差漂移时(1.0~3.0),控制图的ARL1
由图2和图3可知,斜率漂移时,AMEWMA控制图的ARL1曲线在WLRT、MEWMA和KMW控制图的ARL1曲线下方。AMEWMA控制图具有较好的检测能力,能较快地发现过程变化,WLRT、MEWMA和KMW控制图的性能相近;标准差漂移时,AMEWMA的ARL1曲线几乎与WLRT、MEWMA和KMW控制图的ARL1曲线重合。AMEWMA控制图与WLRT、MEWMA和KMW控制图的性能相近。
为了进一步说明AMEWMA控制图监控线性轮廓数据的有效性,研究了中心化模型系数B0和 B1同时漂移时,AMEWMA、WLRT、KMW 和MEWMA控制图的ARL1结果比较。设漂移形式为 B'0=B0+ θ1,B'1=B1+ θ2。结果如图 4 所示。
由图4可知,当截距和斜率同时发生小漂移或同时发生中大漂移的时候,AMEWMA控制图的性能一致好于WLRT、MEWMA和KMW控制图。
图4 斜率和截距同时漂移时,控制图的ARL1
2.2 实证分析
选取UC Irvine机器学习中的化学工业气体传感器的数据集进行实证分析。MOX传感器TGS2612(5 V)对一氧化碳(CO)浓度水平取值为25、100、125、150 ppm 的电阻(R)。其中,电阻(R)为响应变量,一氧化碳(CO)的浓度为解释变量。
数据集共有900个观测值,3个列变量。其中第一列是检测出的电阻(R),第二列是一氧化碳(CO)浓度水平,分别为25、100、125、150 ppm,第三列是每个观测值所对应的标签,其中0为合格品,共800组;1为不合格品,共100组。
为了验证所提控制图在实际应用中的效果,选取标签为0的观测值作为可控数据集。第一步将800组合格品分成训练集和测试集,其中训练集有600组合格品,测试集有200组合格品;第二步通过训练集的样本使用最小二乘估计对模型进行估计,得到电阻(R)和一氧化碳(CO)的线性模型:R=71.712 33-0.01371354CO。计算各个控制图的控制限h,其中ARL0取为200。第三步从测试集中随机抽取20组合格品作为受控据集,再抽取标签为1的10组不合格品作为异常数据集进行监控,计算过程监控统计量,当统计量超过了控制限,就发出失控的报警信号。各控制图的监控效果如图5所示,图5中黑线代表每个控制图的控制限h。
图5 实例结果对比
由图5可知,AMEWMA控制图在第1个失控样本出现时发生了警报;WLRT控制图在第4个失控样本出现时发生了警报;MEWMA和KMW控制图都是在第3个失控样本发生了警报;KMW控制图在第5个失控样本没有发生报警。过程失控时,报警越早的控制图表现越好。由此可见,AMEWMA控制图对过程的监控效果优于其他三个控制图。
3 结论
在线监控线性轮廓数据时,实际漂移的大小不是光滑参数所考虑的情况时,控制图可能会有很糟糕的表现。为了解决这一问题,提出一种自适应的多元EWMA(AMEWMA)控制图,用于监控线性轮廓数据的截距、斜率和标准差。通过模拟结果可知,当截距和斜率发生小漂移或发生中大漂移的时候,AMEWMA控制图的性能一致好于WLRT、MEWMA和KMW控制图;标准差发生漂移时,AMEWMA控制图与WLRT、MEWMA和KMW控制图性能相近。利用化学工业气体传感器案例的实际数据对所提出方法进行了实证分析,AMEWMA控制图能够较快地发出失控的警报。