根据假设的成立可以得到以下的结论:
(i)假设H0和(A1),(A2)成立时,当p,N→∞时,Sp的期望和方差如下:
这里ΔT=[b(T-1)]-[a(T-1)]+1.
(ii)假设(A3)成立,当p,N→∞时
证明如下.
证明(i)
可以将Lτ写成(5)式的形式:
(5)
这样,在零假设下将Lτ改写下式(6)的形式:
(6)
因此,就可以得到
(7)
(8)
在假设(A2)下:
在假设(A1)下,var[Sp,2]/var[Sp,1]→0,最终得到
(9)
证明(ii)
(10)
并且存在γ∈(0,∞),使得
(11)
因此可以得到,当p,N→∞时,
(12)
我们先来证明(12)式,记El-1(·)=E[·|FN,l-1],有:
因此可以看到:
也就是说γ=1/4,
(13)
(14)
通常,可以写成如下(15)式形式:
(15)
式中:
由假设(A1)和(A2)和一范数的概念可知:
在假设(A3)下,可以得到:
同理B3=o(1).至此(11)式证明完毕.
(16)
应用证明(12)式相似的方法在(10)式的证明中,可以得到:
4 数据模拟
表1 p=1 000,N=1 000,T=100时,数值
根据以上产生的数据,利用统计软件R画出其密度函数图像,如图1所示.
X
下面建立常规的控制图,将数据中的变点一一找到,控制图如图2所示:
X
从图2可以看出所得到的100个数据中有12个超出了控制线,分别是第33,37,38,55,59,70,76,78,80,85,98,100个.并且返回到变点的估计值分为9 574.480,9 560.900,9 571.593,9 617.917,9 576.615,8 625.516,8 744.992,8 754.763,8 670.260,8 718.625,9 544.144,9 712.753.
5 结束语
本文针对于一种实际生产出现最多但研究却很少的多项分布数据,将变点模型与数据特征值很好的结合起来,构造优良统计量并用统计软件编写相应的统计程序通过数据模拟,验证了该方法的正确性与稳健性.
[1]王毓芳,肖诗唐.统计过程控制的策划与实施[M].北京:中国经济出版社,2006:70-71.
[2]徐会作.质量控制图经济设计研究[D]. 上海:华东师范大学,2008.
[3]吴喜之.复杂数据统计方法-基于R的应用[M].北京:中国人民大学出版社,2012:176-183.
[4]肖枝洪,朱强.统计模拟及其R实现[M].武汉:武汉大学出版社,2010:83-88.
[5]Shewhart,W.A..The application of statistics as an aid in maintaining Quality of a manufactured production[J].JASA,1925,20:546-548.
[6]Robert,S.W..Control Chart Test Based on Geometric Moving Averages[J]. Technometrics,1959,1(3):239-250.
[9]谭长春.变点问题的统计推断及其在金融中的应用[D].合肥:中国科学技术大学,2007.
[10]朱婴子.统计过程控制在流程化工生产中的应用[D].南京:南京理工大学,2003.
[11]Hunter,J.S..The exponentially weighted moving average[J].Joumal of Quality Technology,1986,18:239-250.
Application of Change Point Method in the Multinomial Distribution Data
BAI Yan-li, ZI Xue-min
(School of Science, Tianjin University of Technology and Education,Tianjin 300222, China)
This paper uses the change point method to establish the monitoring model of the complex data based on the multinomial distribution data. Through the numerical simulation, it is proved that the test statistic is excellent. The change point model can accurately find the position of the change point and the estimate of the change point, which can provide a strong basis for more practical application.
multinomial distribution data; change point method; asymptotic normality; homogeneity test
1673-2103(2016)05-0011-07
2016-04-20
国家自然科学基金面上项目(11271205)
白艳丽(1990-),女,山西晋中人,硕士研究生,研究方向:统计过程控制.
訾雪旻(1977-),女,安徽亳州人,教授,博士,研究方向:统计过程控制.
O213.1
A