射程的系统误差对检验统计量的干扰分析
2019-03-27梁秉中
梁秉中
(中国兵器工业试验测试研究院,陕西 渭南 714200)
在应用数理统计理论的假设检验方法进行火炮射程检验的实践中,往往会因为检验统计量的计算结果出乎意料而引发产品方与检验方的争议,甚至常常怀疑假设检验方法的科学性。在样本量较小时,检验统计量计算结果数值小,能通过检验;当样本量较大时,检验统计量数值大,不能通过检验。
对数学期望的检验方法,在已知母体均方差时,有如下描述[1-2]:正态母体X,其均方差σ已知。根据子样(Xi,i=1,…,n)检验假设H0:ξ=ξ0,其中,ξ是总体X的数学期望,ξ0是已知常数。作统计量U:
(1)
在假设H0成立的情况下,统计量U为标准正态分布,即U~N(0,1),也就是说U的数值通常处于-1.645~+1.645数值区间(主分布区的事件概率为0.90)。
1 子样数据误差
从母体X进行抽样,抽样结果是以数值表述的,而数值总是以某种测量过程获取的。以测量器具对样本进行测量并记录,形成抽样结果。
测量总是有误差的。在射程试验中,测量误差是客观存在的,无法消除。误差的来源有多种途径,包括刻度分辨率、计量能力、测试条件偏差、操作人员业务素养等环节,都会引起相应的误差。
在测量中,一方面存在系统误差Δ,另一方面还存在随机误差ε。
对抽样得到的多个个体进行测量,获得了抽样结果Hi(i=1,…,n),其中不仅包含了各个样本的真值Xi(i=1,…,n),还包含了测量的系统误差Δ、各次测量的随机误差εi(i=1,…,n)。因此测量结果与真值之间存在如下关系:
Hi=Xi+Δ+εi,i=1,…,n。
2 误差在统计量中的作用
抽样结果是包含误差的抽样数据Hi,i=1,…,n。
在检验计算过程中,实际上通常无法感知误差的存在,也无法分辨系统误差和随机误差。因此会直接对测量结果进行如式(1)的检验计算。这样,误差会对统计量的计算结果形成干扰。有些情况下,已知抽样数据中包含有误差,为了操作简便,仍以式(1)进行检验。
通常以测量数据计算统计量,而测量数据中包含误差。在没有获得真值的情况下,误差是无法感知的,通常都习惯性地认为测量值就是真值。因此,以测量值按式(1)计算检验统计量,这样的做法从来都没有受到过质疑。
在包含系统误差Δ和随机误差εi(i=1,…,n)的情况下,对Hi(i=1,…,n)以式(1)进行计算,可以得到系统误差及随机误差对统计量的干扰规律。
延用统计量的思路,计算Hi(i=1,…,n)的统计量,分析其是否服从标准正态分布。对抽样测量结果求均值:
(2)
记以Hi(i=1,…,n)求得的统计量为K。统计量的演算过程如下。
系统误差Δ在每一个抽样数据中都发挥作用,因此可以提取到均值算式之外。随机误差εi(i=1,…,n)在各个抽样数据中数据大小在变,有正值也有负值,在n值很大时,随机误差几乎可以相互抵消,即
(3)
在n值不是很大的情况下,εi(i=1,…,n)求得的平均值通常不能为0,是一个较小的值,接近于0。为了表现其在统计量中发挥的作用,将其记为εe,即随机误差的残差。
(4)
3 误差的干扰强度与样本量的关系
在数理统计中,以式(1)的方式进行对总体抽样的统计量计算,并得到U~N(0,1)[3-4]。但是在实际的检验操作中,抽样的结果一定包含有系统误差和随机误差,则实际得到式(4)的统计量计算。
3.1 系统误差Δ的影响规律
在式(4)中,在假设H0成立的情况下有统计量U~N(0,1)。均方差σ已知,通过针对性的检查可以获得系统误差Δ的实际值。记SΔ为系统误差干扰检验统计量的干扰强度:
(5)
则系统误差的干扰强度SΔ与样本量n的平方根成正比。
在假设检验的应用中,需要特别关注系统误差对检验统计量的干扰强度,并做相应的计算分析。
3.2 随机误差的残差εe的影响规律
在式(4)中,记Sε为随机误差的残差对检验统计量的干扰强度:
(6)
当样本量n较小时,残差εe的数值可能比较可观,其作用机理与系统误差的作用机理相同,采用式(6)计算随机误差的残差对统计量的干扰强度。
随着样本量n的增加,残差εe的绝对值趋向于0。一般来说,n>6即可认为残差εe趋向于0,这时式(4)中的εe项可以取消以便简化算式。
4 系统误差对检验统计量的干扰规律示例
某型火炮在某状态的射程是正态总体X,X~N(15.0,0.12)。通常射程抽样试验结果有0.4%左右的系统误差[5]。本型炮在此状态的射程抽样的系统误差可以达到0.06 km。具体的一次射程试验情况下,不能得出本次试验射程的系统误差值,但是根据射程试验的技术分析,本射程试验的系统误差基本上不会超出0.06 km。
下面以多种样本量的射程抽样试验结果进行统计量计算,观察统计量K的规律。
取抽样试验系统误差分别为20 km,40 km,60 km,样本量分别为7,15,25,50,100,900,10 000,分别进行计算。计算结果见表1。本例中有ξ0=15.0 km,σ=0.1 km。
表1 系统误差对统计量的干扰强度计算表
根据表1,统计量U的值在-0.938~+0.585的范围内,这样的统计量计算结果在标准正态分布N(0,1)变量的正常分布区域,符合标准正态分布的规律。利用表1的数据绘制检验统计量U结果分布图,并与标准正态分布函数进行对比,见图1。
图1 统计量U与标准正态分布函数的对比
表1中K为存在系统误差时实际计算的检验统计量。当存在20 m系统误差时,样本量为7的统计量K=0.358,尚在N(0,1)的变量分布范围内;当样本量为100时,受干扰的统计量K=2.479,这已经超出了N(0,1)的正常分布范围;样本量更大的情况下,受干扰的统计量都是在N(0,1)的正常分布范围之外。将Δ=20 m,40 m时不同样本量下求得的统计量K绘图,并与标准分布函数进行对比,如图2所示。
(a)Δ=20 m
(b)Δ=40 m图2 统计量K与标准正态分布函数的对比
表1中对于存在60 m的系统误差情况,当样本量为15时,受干扰的统计量K的值已经达到2.843,这已经超出了N(0,1)的正常分布范围;样本量更大时,计算的受干扰的统计量数值都是远远超出了N(0,1)的正常分布范围。
因此,在利用假设检验理论进行产品检验时,系统误差对统计量有严重的干扰。
5 假设检验理论在应用中的困扰与分析
射程试验抽样的误差来源比较多,如射角误差、初速误差、弹形误差、弹径误差、弹质量误差、测距误差、空气密度误差、风速误差、空气温度误差、测时误差、弹道计算误差等,这些误差最终形成了弹道试验抽样的系统误差。射程抽样试验形成的系统误差幅值是比较可观的,专业论著总结了历史数据并进行误差分析,形成的结论是系统误差到达射程的千分之四左右[5]。射程抽样的系统误差比较大,使用假设检验进行数学期望检验正好揭示了系统误差对统计量的干扰效果。较大的系统误差形成了对射程检验统计量的严重干扰,促使研究者对检验方法做深入研究,发现系统误差所产生的强烈干扰。
射程抽样的系统误差大,对射程检验的统计量形成了很强的干扰,这在靶场试验中形成了弹道一致性检验的老问题, 即认为弹道一致性检验的方法
不合理,实际上其根源在于射程抽样的系统误差对检验统计量形成了太强的干扰。
6 结论
在抽样试验中,测量的数据都含有系统误差。系统误差对检验统计量的干扰强度应该在计算检验统计量时一并计算,并注意其对检验结论的影响。在假设检验理论的教学中,统计量的计算也应该引入系统误差所产生的干扰的相关内容。
在有些情况下,系统误差产生的干扰严重地影响了检验统计量的计算结果,使其超出了标准正态分布的正常分布范围。在这样的情况下,应该研究改进假设检验的判据,使之能适当消除系统误差项的干扰。