APP下载

显著性假设检验中原假设的建立

2010-04-13詹晓琳沈薇薇

上海第二工业大学学报 2010年2期
关键词:假设检验单侧结论

詹晓琳,沈薇薇

显著性假设检验中原假设的建立

詹晓琳,沈薇薇

(上海第二工业大学理学院,上海 201209)

从假设检验的基本原理出发,从双侧检验入手,得到了双侧检验原假设的两个建立原则,并将该原则用于单侧检验,从而解决了单侧假设检验中原假设的建立问题。

假设检验;原假设;单侧假设;双侧假设

0 引言

假设检验是统计推断的重要内容。关于参数的假设检验是一种应用非常广泛的统计推断方法。它是对总体参数的取值给出某种假设,然后根据样本的信息来判断所做假设是否成立,最后作出决策的一种推断方法。目前,该方法应用广泛。国内外各种科学领域,如生物、医学、化学、数学等都需要进行适当的假设检验来证明得到的结论。各种产品检验、地质探测、抽样调查等也都离不开假设检验。

假设检验的步骤一般分四步:(1) 根据实际问题的要求提出原假设H0和备择假设H1;(2) 根据问题条件构造检验统计量;(3) 选取适当的显著性水平,也就是α值,确定H0的拒绝域;(4) 根据样本观测值进行判断是否拒绝H0。在实际工作中,建立原假设H0和备择假设H1是第一步。在样本容量和显著性水平α一定的情况下,原假设会对结论产生影响,在某些情况下甚至会得到完全相反的结论,因此,原假设和备择假设的建立尤为重要,特别对于单侧假设检验,问题显得更为明显。

不可否认,假设检验的基本思想就是要寻找充分的证据来推翻原假设,因此原假设的建立本身带有一种主观色彩,往往是基于研究者本人的某种信念和偏爱。所以,在面对同一问题时,由于不同的研究者有不同的研究目的,即使针对同一问题也可能提出截然相反的原假设和备择假设。但这里仍需要一些原则来帮助研究者如何根据研究目的来正确地建立原假设。关于原假设的建立原则,在很多文献中都有过讨论[1-4],但本文认为在这些文献中所提原则不够深刻,不够全面,缺乏操作性。

因此,本文对该问题进行了分析,探讨了假设检验中原假设的建立问题。同时,本文得到的原假设的建立原则,同样适用于没有任何先验经验,完全客观的情况下原假设的选取。

1 假设检验的基本原理[5]

小概率事件原理应用广泛,是统计学中假设检验的理论依据,也是统计学存在和发展的理论基础。所谓小概率原理,究其本质就是“小概率事件在一次实验中几乎不可能发生”。假设检验的原理就是基于小概率原理的“概率性质的反证法”,即假设H0为检验中的原假设,是正确的,在此条件下构造事件A,该事件是一个小概率事件,现在进行一次试验,如果实验结果是小概率事件A发生了,那么这与小概率事件原理“小概率事件在一次试验中几乎不可能发生”相矛盾,因此这就表明“原假设H0正确”是错误的,有理由拒绝H0,反之则只能接受H0。为什么我们可以有理由拒绝H0,是因为如果H0是对的,则A一定是小概率事件,既然A是小概率事件,在做一次试验时它就不该发生,现在仅做一次试验,事件A就发生了,这与小概率事件原理相矛盾,从而拒绝H0。

利用小概率事件原理解决问题,我们可能会犯错误。在原假设H0为真的情况下,统计量落入拒绝域从而得到了拒绝H0的结果,这就是假设检验中可能犯的第一类错误,称为“弃真错误”。显而易见,犯该错误的概率就是统计量落在拒绝域的概率α。另一类,在原假设H0错误时,而统计量落在接受域从而得到了接受H0的结果,这时犯了第二类错误,称作“取伪错误”。设犯这一错误的概率为β。需要注意的是,当H1成立时,普遍情况下并不知道检验统计量的确切分布是什么,即使知道分布类型,也不知道分布中的参数到底取什么值,因此很难简单地计算β的值到底有多大。

解决问题时,我们当然希望α,β越小越好,这样结论不容易出错。但经过一系列的深入计算研究,表明在固定的样本容量下,当α增加时,β减小;而α减小时,β却增大。只有在无限增大样本容量的情况下,才有可能实现α,β同时变小,而这在实际操作中是不可能的,同时这样做也已经失去了假设检验的意义。NEYMAN和PEARSON提出的原则(简称奈曼皮尔逊原则)使得解决问题得到了简化,即控制犯第一类错误的最大概率α,在此条件下,尽量使犯第二类错误的概率β减小。进行假设检验时,只对可以人为控制的第一类错误概率α加以限制,而忽略无法控制的第二错误概率β。称这种统计假设检验问题为显著性检验,并将犯第一类错误的最大概率α称为假设检验的显著性水平。本文讨论的原则均在显著性假设检验的范围内。

2 双侧检验原假设的建立原则

双侧检验的假设形式:一般根据实际问题提出原假设H0和备择假设H1,参数θ的假设检验原假设H0用参数θ的等式表示,相应的备择假设用θ的不等式表示。比如一个正态总体均值的检验H0:θ=θ0,H1:θ≠θ0;两个正态总体均值差的检验H0:θ1−θ2=θ0,H1:θ1−θ2≠θ0。为什么我们要把带有等号的参数形式作为原假设H0,为什么H0不能取θ≠θ0和θ1−θ2≠θ0呢?从表面上看这个提法无可非议,因为两种提法实质上看起来只是表述方式不同而已,但事实上,对于原假设我们是需要根据某些原则建立的。本文将原则总结为两个:保护原则和拒绝原则。以下通过实例具体说明这两个原则。

例1 甲、乙两厂生产同一种产品,其质量指标分别服从正态分布N(μ1,σ2)和N(μ2, σ2),现在从该厂分别抽出若干件产品测得其指标值如下(α=0.05):

甲厂 2.74 ,2.75 ,2.72 ,2.69(X1,⋅⋅⋅,X4)

乙厂 2.75 ,2.78 ,2.74 ,2.76 ,2.72(Y1,⋅⋅⋅,Y5)

问两厂的产品质量是否存在显著差异。

分析:代入样本数据得X=2.725,Y=2.75。因计算得到Y>X,从抽样样本看两厂产品质量确实存在一定差异,但这还不能令人信服,因为这个差距也可以是因为抽样的随机性带来的随机误差,因此它并不能作为有力的证据。一方面,统计推断的任务就是去判断这个差异到底是随机误差还是两个总体确实存在差异而带来的不同。只有甲乙两厂之间的样本差异超出某一个范围时,我们才相信他们之间确实存在不是随机误差带来的差异。另一方面,从假设检验的原理来看,否定原假设的概率只有α大小,接受原假设的概率有1−α,所以不会轻易否定原假设。结合以上两方面,本例中,因为不能轻易否定的是甲乙两厂无差异,所以原假设应该是H0:μ1=μ2。将以上分析总结为一个原则,可以称之为“保护原则”:根据研究问题的目的,将需要被保护的结论作为原假设即可。

同时,可以换一个角度考虑这个问题。NEYMAN和PEARSON提出的“在控制犯第一类错误的最大概率α的条件下,尽量使犯第二类错误的概率β减小”原则在解决问题时只限制α的大小而忽略β,这实际上隐含了一个原则:在假设检验时更倾向拒绝H0而不是接受。这是因为如果拒绝了H0,就有1-α把握相信H0为伪,即只有α的概率大小犯错误。另一方面,从某种意义上说,任何一个检验都可以理解为显著性检验,但显著性检验这个名词最常用于有关某种效应或者差异是否存在的那种问题,且主观上是希望该效应存在的,从实际上说就是因为事先已经对H0产生了怀疑而纯粹为了推翻或拒绝它。所以,可以简单地把“显著性检验”理解为“希望原假设被否定的那种检验”。如果将这一思想总结为一个原则,可以简称“拒绝原则”。根据这一原则,一般“将希望得到的结果的对立面作为原假设”建立原假设。本例中,因为所抽样本均值并不等,因此,我们已经对两厂产品质量相等产生怀疑,希望看到“两厂质量存在显著差异”这个结果,于是将“两厂质量存在显著差异”的对立面“两厂产品质量并无显著差异”(μ1=μ2)作为原假设H0。

3 单侧检验原假设的建立原则

不同于双侧检验,由于单侧假设检验的形式是大于等于号或者小于等于号,这就决定了它的一个特点,不确定性。同样的问题,可以有两种不同的假设,而其结论也会因此不同。

因为假设检验中双侧检验和单侧检验在原理上是一致的,所以可以将上文总结的两个原则同样应用于单侧检验。下面通过具体实例详细分析。

例2:已知某农场生产的豌豆籽粒重量(mg)服从正态分布N(μ,42),μ≤377.2 mg。为了提高豌豆产量,农场采用了新的栽培方法,并从中随机地抽取了9粒,测得样本平均值μ=379.2 mg,假设在新方法下总体标准差仍为4,问用新的栽培方法生产的豌豆籽粒重量是否有显著提高(取显著性水平α=0.05)?

分析:这是一个关于单个正态总体均值的单侧检验问题,可以设立的两种假设分别是1)H0:μ≤377.2;2)H0:μ≥377.2。

首先,可根据保护原则,原假设应该是过去经验与已获得的信息的总结,是一个需要加以保护的假设,没有充足的理由就不能轻易否定它。只有当新栽培方法种的豌豆的质量与过去质量之差高过计算得出的随机误差区间,才能承认它确实有显著提高,否则只能认为是改变栽培方法后的质量提高是不可避免的误差带来的。因此,基于这一点应将“μ≤377.2”作为原假设。经过计算可以得到X−377.2≤μα⋅σ/n=1.645⋅ 4/3=2.19,此数据表明,新栽培方法的重量与原方法的重量之间的误差范围为(-∞,2.19],只有新旧的重量之差高于原重量超过2.19,才能承认新方法是有效的。

如果根据拒绝原则,我们可以简单的把“显著性检验”理解为“希望原假设被否定的那种检验”。这里采用新的栽培方法是为了提高豌豆籽粒重量,“μ>377.2”是我们通过检验希望得到的结论,那么相对的就把“μ>377.2”这个结论的对立面“μ≤377.2”(希望看到它被否定)作为原假设。

单侧检验较之双侧检验在运用建立原则时需要考虑问题的背景,即根据不同背景建立原假设才能得到正确的结论。有时保护原则可以更方便地建立原假设;有时拒绝原则可以更有利于解释原假设的建立。通过以下两例具体说明:例3采用保护原则建立原假设;例4采用拒绝原则建立原假设。

例3:假定某工厂生产的一种产品,其质量指标服从正态分布N(θ, σ2),且假定σ2已知。θ为平均质量指标,设θ越大质量越好,而θ0为达到优级的界限。某商店经常从该厂进货,那么商店应该如何选择原假设进行检验呢?

分析:显然该题可建立这样两种原假设:1)H0:θ≥θ0;2)H0:θ≤θ0。遇到此类问题,为了确保结论的可靠性,详细地了解背景是非常有必要的。

首先分析第一种原假设:如果过去较长一段时期的记录,商店相信该厂产品质量总的说是好的,当然这不排斥偶而也出现较差的货批,那么可以根据保护原则把θ≥θ0作为原假设并选定一定较低的检验水平α,例如α=0.05或者0.01。这样做对工厂有利,保证了优质的货批(即θ≥θ0的批)只以很低的概率α被拒收,而非优质的货批仍能以不是很小的概率被接受。从商店角度考虑,这样设立也并非不利,因为该厂产品质量一贯表现好,故检验可放宽些,即要有很强的证据才能否定θ≥θ0。反之第二种原假设:若以往一段时期的记录表明,工厂产品质量并不很好,根据保护原则,这样商店就应该坚持以θ≤θ0作为原假设,并选定较低的检验水平α。这样做表明,商店要求有较强的证据(反应在具体数据上)才能相信这批产品质量为优,好比一个人一向表现不好,就必须有较为显著的好表现才能让人相信他确实有进步。这样做就达到了至少把100(1−α)%的非优货批拒之门外的目的。

例4 某工厂生产金属丝,产品指标为折断力。折断力的方差被用作工厂精度的表征:方差越小,表明精度越高。以往工厂一直把方差保持在64及以下。最近从一批产品中抽取10根做折断力试验,测得的结果(单位:千克)如下:578, 572, 570, 568, 572, 570, 572, 596, 584, 570。由上述样本数据算得:x=572.2,S2=75.74(α=0.05)。

为此,厂方怀疑金属丝折断力的方差是否变大了,如确实增大了,表明生产精度不如以前了,于是就需要对生产流程做一番检查,以发现生产环节中存在的问题。

分析:初步观题会认为这题与前一题类似也是单侧产品检验问题,但仔细读完全题就会发现最后一段话给我们解题带来了一些启示。对于这类问题,本文建议使用拒绝原则来考虑原假设。从题中不难发现,检验结果非常重要,一旦做出确实变大的结论就必须对生产流程做检查,防止精度降低,而因为检测的数据(方差)确实大于了标准,因此不得不怀疑生产精度不如从前,而作为厂方看到检测结果自然是担心的,希望找出方差变大的原因。所以将“希望拒绝的结果”作为原假设在此题中就理解为将“方差并未变大”作为原假设,转化成假设检验的数学符号可建立原假设:H:σ2≤64。

0

4 结论

本文总结得到的保护原则和拒绝原则使得假设检验中原假设的建立问题变得简单、清晰、易于操作。这两个原则只是考虑的出发点不同,但所得结论相同,所以两个原则并不矛盾,而是互为补充。基本上所有的假设检验都可以用原假设建立的保护原则,但运用拒绝原则时,对题目背景条件要求较高。对于双侧假设检验,其原假设的建立相对明确;对于单侧假设检验,其原假设的建立必须基于题目的背景和正确的原则才能做出符合研究目的的假设的检验。

同时,对于假设检验的结果,我们应该知道,统计上的显著差异并不一定有现实的重要性[5]。因为统计上的显著差异是指:在给定的水平上,差异已不能用随机误差解释,所以,统计上显著的差异不一定意味着数据的差异确实很大。

[1] 徐大申,李国东, 臧鸿雁.假设检验中的保护原则[J]. 北华大学学报:自然科学版, 2004,5(5):395-397.

[2] 任永泰.关于假设检验中原假设的提出[J]. 大学数学, 2005, 21(5):121-124.

[3] 吕亚芹.对假设检验的几点思考[J]. 北京建筑工程学院学报, 2006, 22(2):60-62.

[4] 李晓红.假设检验中原假设的选取问题[J]. 平原大学学报, 2006, 23(6):122-124.

[5] 陈希孺.概率论与数理统计[M]. 合肥:中国科学技术大学出版社,1996.

The Establishing of the Original Hypothesis in Significant Hypothesis Test

ZHAN Xiao-lin,SHEN Wei-wei
(School of Science, Shanghai Second Polytechnic University, Shanghai 201209, P. R.China)

The basic theory of hypothesis testing is introduced and two-sided hypothesis testing is discussed. Two principles to build original hypothesis are obtained. By being applied with these two principles, the problem of how to set up a one-sided hypothesis testing is addressed.

hypothesis test; original hypothesis; one-sided original hypothesis;two-sided original hypothesis

O212

A

1001-4543(2010)02-0156-04

2009-10-27;

2010-01-14

詹晓琳(1978- ),女,安徽蚌埠人,讲师,主要研究领域是概率统计,电子邮件:xlzhan@sf.sspu.cn

猜你喜欢

假设检验单侧结论
由一个简单结论联想到的数论题
立体几何中的一个有用结论
关于单侧布顶内侧安装减速顶的日常养护及维修工作的思考
统计推断的研究
双幂变换下正态线性回归模型参数的假设检验
Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials
统计学教学中关于假设检验问题探讨
结论
中间入路与外侧入路行单侧甲状腺叶全切除术的对比
同期双髋,单侧全髋关节置换治疗严重髋部疾病的临床比较