APP下载

以t检验为例说明影响假设检验功效和P值的因素

2016-07-26秦国友赵耐青

卫生职业教育 2016年12期
关键词:假设检验功效

秦国友,赵耐青

(复旦大学公共卫生学院,上海 200032)



以t检验为例说明影响假设检验功效和P值的因素

秦国友,赵耐青

(复旦大学公共卫生学院,上海 200032)

摘要:以单样本t检验为例,对医学统计教学重点和难点“假设检验中的重要概念功效和P值的影响因素”进行讨论,为进行假设检验的课堂教学提供参考。

关键词:假设检验;t检验;功效;P值

假设检验是统计推断的一个重要内容,也是医学统计课堂教学的重点和难点之一,其中涉及统计的重要思想和众多概念。在讲授这部分内容时,很多学生即使是对相关的知识点有很好的记忆,但是在理解和实际应用上也可能会出现较多问题和偏差。对于假设检验问题,有很多文献从不同的角度进行了讨论[1-9]。本文将从基本的t检验入手,借助t分布统计量和t检验统计量之间的联系对影响假设检验功效(Power)和P值大小的因素进行讨论,这有助于对功效和P值的含义做出清晰的解释。

1 假设检验中功效和P值

假设检验是用来判断样本与总体或样本与样本间的差异是由抽样误差引起还是由总体差别所造成的统计推断方法。假设检验中有两个非常重要的概念——功效与P值。功效的定义是在备择假设H1成立的条件下拒绝原假设H0的概率,而P值的含义为在原假设成立的总体中抽样出现比当前样本还要极端情况的概率[1-4]。一个检验方法功效的高低说明该方法区分原假设与备择假设能力的强弱。通常我们通过P值来做出拒绝还是不拒绝原假设的结论。在第一类错误给定0.05时,P<0.05,则拒绝;否则,不拒绝。当拒绝原假设时,我们通常说差异有统计学意义。但是学生在学习这些概念后,包括很多科研工作者在实际使用中,对功效和P值的理解还存在一些误区。比如:认为P值越小总体间差别越大,这个理解一般是不正确的。如何清晰地说明这些问题并且让学生能够理解对于假设检验的教学和实际中的应用都是非常重要的。在本文中我们将结合课堂教学经验,以单样本的t检验为例,结合t分布统计量和t检验统计量来阐述这些问题。

2 功效和P值的影响因素

假设检验的基本步骤在很多教科书和文献中都有论述,在这里就不再阐述了。我们直接以单样本的单侧t检验为例来说明我们在课堂教学中如何简单阐明功效和P值的影响因素。对影响因素的分析将有助于更加清晰地理解这两个概念。单样本的单侧t检验是用来检验某个样本来自一个未知总体的总体均数μ是否等于一个给定已知总体的总体均数μ0。研究问题是样本所在的总体均数是否大于一个已知总体的总体均数。我们可以基于研究问题归结为下列检验假设:建立原假设H0∶μ=μ0,备择假设H2∶μ≥μ0。

对于上述一个单样本均数比较问题,在满足样本来自正态总体的前提下,可以采用单样本的t检验来分析。检验统计量为其中x表示样本均数,s表示样本标准差,n表示样本量。我们可以把检验统计量进一步写成

图1 统计量t在μ=μ0和μ>μ0时的分布情况

首先,我们通过图1说明影响假设检验功效的因素,然后可以讨论出影响P值的因素。显然,图1中所有阴影部分的面积表示对应备择假设下检验的功效。

当原假设成立时,即μ=μ0,则上式中的第二项为0,检验统计量T自然服从自由度为n-1的t分布。

当备择假设成立时,即μ>μ0,显然检验统计量不再服从t分布。我们分3种情况来讨论对检验功效的影响。

(1)由于标准差s是总体σ的点估计,与总体均数μ取值无关,因此在同样的样本量n和同样的样本标准差s的情况下,μ偏离μ0越远,则备择假设成立下检验统计量分布的中心偏离零点越远,于是图1中所有阴影部分的面积增加,即检验功效越大。

(2)在样本量n和样本所来自的总体均数μ不变的条件下,样本标准差s与σ的差异是随机抽样误差,总体标准差越小,样本标准差s可能越小,则偏离零点的距离可能越远,同样造成检验功效越大。

(3)在样本所来自的总体均数μ和总体标准差σ不变的条件下,样本标准差s与σ的差异是随机抽样误差,因此可以认为s应该变化不大,当样本量n越大,则偏离零点越远的可能性越大,也会造成检验功效越大。

根据上述讨论,通过对T检验统计量做一个简单的分解,我们可以清晰地分析出造成总体均数假设检验问题功效变化的3个原因分别是样本所来自总体的均数、标准差以及样本量。注意到图1中深色阴影部分面积为假设检验的P值。通过分析,我们可以发现这3个因素也是影响总体均数比较的假设检验问题中P值变化的3个原因,假设检验的P值越小,说明差异之间越有可能存在统计学意义,但是无法说明是差异之间的绝对大小,因为这只是造成P值小的原因之一。样本数据的波动性和样本量同样会影响P值大小。如果我们想确切地了解差异的大小,区间估计是一个有效的方法。

3 结语

假设检验中的相关概念,特别是检验功效和P值一直是医学统计教学中的重点和难点。本文以单样本t检验为例,把t检验统计量分解为一个t分布统计量与之和的形式,通过对的分析,清晰地说明了影响检验功效和P值大小的因素,从而可以避免对检验功效与P值理解和认识上的偏差,科学合理地利用P值对实际问题进行解释。在卫生统计学的课堂教学上,我们广泛采用这种方式讲授,取得了良好的教学效果。学生普遍反映,通过这种方式更加容易理解和掌握相关的知识点。

参考文献:

[1]颜虹.医学统计学[M].2版.北京:人民卫生出版社,2010.

[2]赵耐青,陈峰.卫生统计学[M].北京:高等教育出版社,2008.

[3]李康,贺佳,杨土保.医学统计学[M].6版.北京:人民卫生出版社,2013.

[4]方积乾,徐勇勇,陈峰.卫生统计学[M].7版.北京:人民卫生出版社,2013.

[5]茆诗松,程依明,濮晓龙.概率论与数理统计教程[M].北京:高等教育出版社,2004.

[6]郑捷.如何在假设检验中设立原假设[J].统计教育,2005(12):30-31.

[7]吴启富,张玉春.统计假设检验中小概率原理的辨析[J].统计与决策,2012(17):70-71.

[8]陈秀虎,杨敏,白厚义.单尾假设检验假设设置的探讨[J].统计教育,2007(2):8-9.

[9]李福民.论卫生统计学中的假设检验[J].卫生职业教育,2003,21(3):48.■

中图分类号:G420

文献标识码:B

文章编号:1671-1246(2016)12-0153-02

猜你喜欢

假设检验功效
红景天的神奇功效及作用
被扔掉的葱须大有功效
“碧邦”液肥的功效就是这么显著!
假设检验结果的对立性分析
秋天吃莲藕的七大保健功效
如何让你的化妆品发挥更大的功效
统计推断的研究
双幂变换下正态线性回归模型参数的假设检验
统计学教学中关于假设检验问题探讨
凤爪重量质量管理报告