APP下载

试验设计对假设检验的影响

2021-04-29

关键词:成组假设检验反应时间

刘 倩

(西安电子科技大学 数学与统计学院,陕西 西安 710071)

0 引言

假设检验是统计推断的重要内容之一。本文以参数假设检验为研究对象,探讨试验设计对假设检验的影响。所谓试验的统计设计,就是设计试验的过程,使得收集的数据适合于用统计方法分析,得出有效的和客观的结论。当问题涉及受试验误差影响的数据时,只有统计方法才是客观的分析方法。这样一来,任一试验问题就存在两个方面:试验的设计和数据的统计分析。

在假设检验的试验设计阶段,需要重点解决以下两个问题:①如何正确地建立原假设和备择假设,对同样一个检验模型,原假设和备择假设可以互换吗?特别是对单侧假设检验,这个问题似乎尤为明显,是否有必要给出原假设和备择假设的建立原则?②以成对数据比较与成组数据比较问题为例,说明如何正确选择检验统计量,此时分析清楚条件是关键。为了更好地解决这两个问题,我们根据两个具体的假设检验案例分别进行讨论。

1 假设检验的立场问题

案例1[1]一位中学校长在报纸上看到一则报道:这一城市的初中学生平均每周看8 h电视。她认为她所领导的学校,学生看电视时间明显小于该数字。为此,随机调查了该校的100名初中学生,得知平均每周看电视的时间6.5 h,样本标准差为2 h。假定学生每周看电视的时间服从正态分布,根据调查结果,在0.05的显著性水平下,能否支持这位校长的看法。

分析由于学生每周看电视的时间服从正态分布,总体方差未知,所以采用t检验统计量。本题关键是如何建立原假设和备择假设,究竟是左侧检验还是右侧检验呢?原假设和备择假设能否进行互换呢?

解法1建立左侧假设检验

H0:μ≥μ0;H1:μ<μ0。

(1)

(2)

显然,统计量的观测值落在拒绝域中,故拒绝H0,即在0.05的显著性水平下,支持这位校长的看法。

解法2建立右侧假设检验

H0:μ≤μ0;H1:μ>μ0。

(3)

(4)

显然,统计量的观测值没有落在拒绝域中,故不能拒绝原假设H0。但是要注意“不拒绝”并不表示要“接受”, 但在一些教材上却描述为接受原假设。事实上,这种描述是不准确的,原因就在于在现有的显著性水平下,根据现有样本数据没有充分理由拒绝原假设H0,并非肯定H0是对的,此时,这是一种“被动”接受。所以根据解法2,结论为根据现有样本数据,无法作出判断。即在0.05的显著性水平下,无法得到支持这位校长的看法的结论。

这两种不同的解法究竟哪一个正确呢?

如果稍不留神,就会认为这两种做法的结论一致,认为无论是左侧检验还是右侧检验,都是支持这位校长的看法。但是方法2的“接受”并不能肯定原假设一定是对的,这样的结论是含糊不清的。而解法1的结论明确且有效,所以对本例,推荐使用解法1。

由本例引入对假设检验立场问题的讨论。我们是站在保护原假设的立场,为什么是保护原假设?根据Neyman与Pearson的思想,在假设检验理论中,首先要控制犯第一类错误,即“弃真”错误的概率不能大于给定的显著性水平,这就表明原假设是被保护的。因此“把什么放在原假设”是个非常重要的问题。

这里,需要把握两个原则:原则1,把经过长期考验或者验证认为是正确的结论放在原假设;原则2,把希望得到的结论放在备择假设,希望通过拒绝原假设来得到希望要的结论。

从数学的角度分析,原假设和备择假设的地位应该是平等的。原假设和备择假设无论怎样提出都可以,因为它们的检验结论都是相容而不会相互矛盾[2]。但值得注意的是,对于给定的样本数据,统计假设的不同设定方法会导致表述的结论不同,有的表述更明确而且有效,而有的则显得含糊不清。因此,在实践中,提出原假设和备择假设的几点建立原则是很有必要的。这样看来,从实际的假设检验过程中可以看出原假设和备择假设是不平等的。因为拒绝原假设,说明有充分的理由证明原假设不对,而接受原假设仅是由于没有充分的理由拒绝它,从保护原假设的立场我们接受了,但是“接受”是“含糊的”,“拒绝”是“明确的”。也就是说,要推翻原假设需要充分的证据,如果得到拒绝原假设的结论, 那么这个结论是很有说服力的; 反之,仅仅表明样本数据与原假设没有矛盾, 但并不意味着原假设是应该被接受的,不拒绝不等于接受,在这种情形下接受原假设不是很有说服力。

此刻,发现本案例中的解法1正是依据原则2建立了原假设和备择假设。笔者建议本题先确定备择假设,再确定原假设,把我们想要得到的结论放在备择假设,把希望拒绝的结论放在原假设。

更进一步,更新样本数据,比如样本均值取7.8,或者更新样本均值使得该检验统计量的观测值介于-1.65和+1.65之间,答案会有怎样的变化?我们发现,无论左侧检验还是右侧检验,每一个决策都没有很好的说服力。既不能拒绝初中学生平均每周看电视的时间至少是8 h的说法,也不能拒绝初中学生平均每周看电视的时间最多是8 h的说法,即此时校长的说法既不能接受也不能拒绝。导致出现上述结果的原因在于,这两种做法的结论都是不能拒绝原假设,接受原假设,并不代表它是对的,备择假设是错的,只是说在现有显著性水平下,根据现有样本数据没有充足的理由拒绝原假设,因此,“对于同样一个检验模型,交换原假设和备择假设可以得到完全相反的结论”的提法本身就是错误的,至少是不准确的。这种提法极易给初学者带来误区[3]。造成这种状况的原因是题目给定的样本容量太小,不足以形成统计学上的证据。此时,如果不改变样本容量,则可以借助假设检验中常用的另一种决策准则:p值准则[4]。

2 成对数据比较与成组数据比较问题

案例2做以下的试验以比较人对红光或绿光的反应时间(以s(秒)计),试验在点亮红光或者绿光的同时,启动计时器,要求受试者见到红光或绿光点亮时,就按下按钮,切断计时器,这就能测得反应时间,测量的结果如表1。在0.05的显著性水平下,问能否认为人对红光的反应时间小于对绿光的反应时间。

解法1本题中的数据是成对的,即对同一个测试者测出一对数据,因此,它们不是两个独立的随机变量的观测值。也就是说,表中第一行不能看成一个样本的样本值,同样,表中第二行也不能看成是一个样本的样本值。

H0:μD≥0; H1:μD<0。 (5)

(6)

故拒绝H0,认为μD<0,即有95%的把握认为人对红光的反应时间小于对绿光的反应时间,也就是人对红光的反应要比绿光快。

解法2如果用成组比较来处理,即误将表格中第一行数据看成随机变量X的样本值,而将第二行数据看成另一个独立随机变量Y的样本值,并基于这两个样本检验如下假设

H0:μX≥μY;H1:μX<μY。

(7)

(8)

故不能拒绝原假设H0,结论为根据现有样本数据,无法作出判断。即在0.05的显著性水平下,无法得到人对红光的反应时间小于对绿光的反应时间的结论。

这两种不同的解法究竟哪一个正确呢? 以下引入成对数据比较与成组数据比较问题。

有时为了比较两种产品、两种仪器、两种方法等的差异,我们常在相同条件下做对比试验,得到一批成对的观察值,然后分析观察数据作出推断,这种方法常称作成对比较法。这些成对的数据是一对对获得的,对于每一对数据而言,它们是同一研究对象对不同产品、仪器或者方法测得的结果,因此,它们不是两个独立的随机变量的观测值,我们不能采用成组数据(两个独立样本比较)的方法对其进行检验。这是成对数据所采用的检验方法与成组数据(两样本比较)最本质的区别。

无论是成对数据比较,还是成组数据的差异比较问题,在总体方差未知的场合下,都可以通过构造恰当的t检验统计量进行假设检验。所以如果误将成对比较理解为成组比较,那就会导致错误的结论。

显然,在本案例中,同一对中两个数据的差异则可看成是仅由两种不同仪器的差异所引起的,这样,局限于各对中两个数据来比较就能排除种种其他因素,而只考虑单独由不同仪器所产生的影响,从而能比较不同仪器的测量结果是否有显著的差异。因此,本案例将成对比较问题转化为单个样本问题进行检验,解法1是正确的。教师在授课过程中,应该强调成对数据和成组数据在获取方法和条件上的差异,并采用相应的方法。

3 结论

本文以参数假设检验为研究对象,探讨了试验设计对假设检验的影响。重点分析了假设检验问题在试验设计阶段存在的两个重要方面并引发了一些思考。由案例1引入对假设检验立场问题的讨论并给出2条实用的建立原则。我们是站在保护原假设的立场,依据是Neyman与Pearson的思想,即首先要控制犯第一类错误即“弃真”错误的概率不能大于给定的显著性水平。因此在实践中,要掌握原假设和备择假设的两个建立原则,给出明确且有效的结论;由案例2本文引入对成对数据和成组数据比较问题,分析清楚题目条件,正确选择检验统计量,才可能作出正确的判断。

猜你喜欢

成组假设检验反应时间
硫脲浓度及反应时间对氢化物发生-原子荧光法测砷影响
文房雅士
假设检验结果的对立性分析
浅谈既有线成组更换道岔
使用NIC Teaming实现网卡冗余
用反应时间研究氛围灯颜色亮度对安全驾驶的影响
统计推断的研究
凤爪重量质量管理报告
基于改进隐马尔科夫模型的畜禽全基因组关联分析中的多重检验方法
利用脱硫石膏制备硫酸钙晶须的研究