多元自相关的Hotelling T2控制图研究
2019-10-06方晨宁
方晨宁
摘 要:为了解决传统统计过程控制中统计量之间不满足相互独立的现象,利用Hotelling T2统计量构造残差控制图,建立了多元自相关模型,研究了在多元自相关情况下控制图的控制效果,并在参数已知的前提下构造统计量,引出了过程偏移量的概念。通过蒙特卡洛随机模拟的试验方法并引入平滑系数得出在不同偏移量λ下的平均运行链长,拟合出平均运行链长ARL和偏移量λ之间的函数关系,最后用算例验证了T2统计量的残差控制图对出现偏移的多元自相关过程有管控作用。
关键词:统计过程控制;多元自相关;Hotelling T2控制图
中图分类号:TB 文献标识码:Adoi:10.19311/j.cnki.1672-3198.2019.27.098
1 引言
统计过程控制(SPC,Statistical Process Control)在现代工业中的应用十分广泛,它在实施过程监控、提高产品质量中起到了十分重要的作用。此外,统计过程控制理论提供了多种控制图来监测过程的集中趋势和离散趋势。但是,传统的统计过程控制理论全部基于过程观测数据独立这一基本假设,而在实际工作中,过程数据并不是总能满足这一假设前提,如化工、制药等连续型生产等,多数数据会存在自相关现象。当存在这一现象时,传统的理论不能有效、恰当地控制和改进过程质量,在某些情况下,甚至会出现大量的虚发警报现象,给质量管理、质量控制工作带来严重误导,使控制图的应用效果大为降低,甚至丧失监控作用。
近年来,随着生产力的提高,数据自相关现象逐步引起学术界的重视。一种解决方法是降低过程平稳时的抽样频率,但这一方法却使信息遗失的概率大大增加。另一种是使用时间序列模型,通过建立时序模型对过程观测值进行拟合,再利用数据残差构造残差控制图。即使这样,大多学术界的成果还是局限于一元过程,多元问题相当于多元的随机过程,它在原有的基础上增加了时间轴,而数据的自相关性更加增大了难度。但是,从质量控制的实际应用角度来考虑,多元自相关理论具有重大的应用价值。目前,已有学者研究出对于多元自相关过程的控制方法,如多元的CUSUM控制图,主成分分析法,多元EWMA控制图,具有诊断功能的Z图,卡尔曼滤波法等。清华大学的孙静和杨穆尔教授提出了二元自相关过程的残差T2控制图,并对其进行了效果分析,在此基础上分析了多元自相关的残差T2控制图,研究出对多元自相关过程中均值偏移程度的描述方法。
本文首先介绍了p 阶自回归的VAR模型,然后设计Hotelling T2控制图,探讨了平均运行链长ARL隨着偏移量而变化的曲线,并给出相对应的函数关系,最后通过一个多元自相关的模型算例验证了这一关系,残差控制图可以很好地控制当多元自相关过程出现偏移时的情况。
2 多元自相关的模型建立
我们用Xt表示一个d元自相关过程,它服从平稳的p阶VAR(p)模型,观测值序列为:
3 残差控制图的设计与偏移量分析
承接上文,由于观测值序列Xt是多元自相关的,所以Xt不符合HotellingT2统计量的独立性假设,但是随机误差矩阵εt是一个白噪声序列,符合独立性假设,有
当分布参数λ发生变化时,则相应的卡方分布也会发生改变,统计量T2的均值由d变为d+λ0,方差由2d变为2d+4λ0,其中λ0为偏移后的分布参数。所以,λ0越大,分布的差异越大,偏移程度越显著。
由λ的表达式可知,λ的计算涉及自回归系数矩阵Ai,协方差矩阵Σ和均值偏移向量Δ,所以可以认为用λ作为本文的偏移量来测算多元自相关过程的控制偏差是合理的。
4 残差控制图的效果分析
平均运行链长ARL是作为判断统计过程控制图控制效果好坏的一种常用评判工具,在多元自相关过程中,同样可以通过计算ARL来评价控制图的控制效果。
当已知偏移量λ和虚发警报概率时,我们可以计算出平均运行链长ARL的数值,但由于首先需要知道上控制限UCL以及相对应的卡方分布通过不定积分才能求出触发警报的概率P,再通过公式ARL=1P得出结果。但这种传统方法不仅计算过于繁杂,且往往很难给出正确结果,所以,本文将不采取这一方法。
不失一般性地,本文将采取蒙特卡洛随机模拟的方法进行对多元自相关过程残差控制图在不同的分布参数λ下的平均运行链长ARL的分析。为了方便计算描述,我们令一个二元自相关过程服从平稳的VAR(1)模型,均值μ=0,则表达式为:
引入平滑系数α,利用MATLAB进行多次模拟计算,当α取不同数值时,发现未发生偏移时的平均运行链长ARL0总是徘徊在200左右,见表2。因此本文选取ARL0=200,T=0.005,利用偏移量公式λ=I-AiΣΔTΣ-1I-AiΣΔ,计算出λ的取值范围可从0到700。
ARL随λ变化的模拟曲线如图1所示。
由图1可知,平均运行链长ARL随着偏移量λ的增大呈指数型递减,最终逐渐收敛于1,拟合的函数关系式为ARL=exp(-1.82λ+5.523)+1。显然,当λ>0.34时,相对应的ARL的取值远小于未发生偏移的平均运行链长ARL0,且ARLλ 5 算例分析 为了便于验证,下面用一个二元自相关过程作为算例来证明Hotelling T2控制图的监控情况。假设单变量自相关过程可以用VAR(1)模型表示,则由公式(1)可知: 6 结论 近年来,随着生产力水平的提高、产品质量的迅速提升、质量控制的日益严格,自相关问题渐渐引起国际上质量专家们的重视。本文根据多元自相关过程在统计质量控制中无法满足独立性假设的情况,建立了VAR(p)模型,其残差εt服从正态分布,满足独立性质,利用统计量T2构造了残差控制图,并给出了过程偏移量λ的定义。利用蒙特卡洛随机模拟,引入平滑系数,结合一个简单的二元自相关例子得出控制图的平均运行链长ARL随偏移量λ的变化曲线,拟合出ARL与λ的函数关系,得出平均运行链长ARL随着偏移量λ的增大而呈指数型递减,且结果收敛于1。随机试验表明,Hotelling T2的残差控制图可以有效管控出现较大偏移的多元自相关统计过程,然而,对于出现小偏移的多元自相关过程则监控效果较差。