APP下载

论P值的统计学意义

2019-09-10阮征孔德飞

理科爱好者(教育教学版) 2019年6期
关键词:假设检验正态分布

阮征 孔德飞

【摘 要】本文基于P值在统计学中的特殊意义,从假设检验、正态分布、P值的含义、统计显著性四个维度出发,结合某个披萨店平均配送时间是否会大于30分钟的具体案例,对P值的统计学意义进行分析阐述,最后指出P值还在SPSS软件分析问卷数据等方面发挥着的不可替代的作用,它所蕴含的重要价值值得广大研究者对其进行更多角度的深度挖掘。

【关键词】假设检验;正态分布;P值;统计显著性

【中图分类号】G633.6  【文献标识码】A  【文章编号】1671-8437(2019)34-0021-02

在统计学P中,P值具有特殊的意义,在解析几何乃至某些实验中,P值同样成为决策工具的一部分,如当超过的阈值时,意味着P值为0.0000003才能确认发现了希格斯玻色子。下面将分别从假设检验、正态分布、P值的含义、统计显著性这四个方面解释P值的意义以及如何在统计学中使用P值。

1  假设检验

在假设检验中,通常采用P值来确定结果的统计显著性[1]。由于最终目标是确定结果的统计显著性,统计显著性需要建立在假设检验、正态分布、P值这三个简单概念之上。所以,假设检验是通过一组数据检验零假设的有效性,倘若零假设不成立,此时就会相信备择假设。换句话说,就是需要提出零假设,并用样本数据来检验声明是否有效。倘若零假设无效,则选择备择假设。而要想确定零假设是否有效,就要运用P值来衡量证据的强度,从而了解它是否有统计显著性。如果证据支持备择假设,那么就会拒绝零假设并接受备择假设。

举个典型的例子:假设某个披萨店声称他们的平均配送时间小于或等于30分钟,但这里认为他们的配送时间不止30分钟,所以做了假设检验,对配送时间采用随机采样来检验这一说法:零假设——平均配送时间小于等于30分钟;备择假设——平均配送时间大于30分鐘。这里的目标是确定样本数据中的证据能更好地支持哪种假设(零假设还是备择假设)。本例中使用的是单尾检验,这里只想知道平均配送时间是否多于30分钟,因为配送时间小于或等于30分钟都是可以接受的,因此可忽略另一个方向的可能性,换句话说就是想弄清楚披萨店是否在某种角度上欺骗了消费者。

2  正态分布

正态分布是一种用来观察数据分布的概率密度函数,它包含两个参数——平均值μ和标准差σ。其中,平均值代表着数据分布的集中趋势,决定了正态分布峰值的位置;标准差则是衡量可变性的标准,决定了均值的下降幅度。正态分布通常68-95-99.7和规则相关:68%的数据在平均值μ±1个标准差σ内;95%的数据在平均值μ±2个标准差σ内;99.7%的数据在平均值μ±3个标准差σ内。

Z分数越高,结果就越不可能偶然发生;Z分数越低,结果就越可能有意义。但多高或多低才足以说明结果是有意义的呢?这就是解决这个难题的最后一片拼图——P值,需要根据实验开始前设定的显著水平检验结果是否具有统计学意义。

3   P值的含义

对披萨配送时间随机采样的目的是检查平均配送时间是否大于30分钟,如果最终的结果支持披萨店的说法,即平均配送时间小于或等于30分钟,那就表示接受零假设,否则就是拒绝零假设。假如生活在披萨配送时间小于或等于30分钟,即零假设成立的世界中,那在真实世界中得到的证据有多令人惊讶?P值用数字(概率)回答了这一问题:P值越低,证据越令人惊讶、零假设越荒谬。当零假设很荒谬的时候还能做什么?可以拒绝零假设并选择备择假设,如果P值低于之前定义的显著水平,那么它属于荒谬阈值,可以拒绝零假设。

如现在已经抽样得到了一些配送时间,计算后发现平均配送时间要多10分钟,P值为0.03,这意味着在比萨配送时间小于或等于30分钟的世界中,由于随机噪声的影响,有3%的概率会看到比萨配送时间延长了至少10分钟。由于P值越低,结果越有意义,所以它不太可能是由噪声引起的。很多人对P值存在误解:P值为0.03意味着有3%的概率是偶然决定的——这是错误的,因为P值不能证明任何事,它只是一种根据惊讶程度做出合理决策的基础方法。那么利用0.03的P值来做出合理决策则需要以下几步:①想象生活在平均配送时间小于或等于30分钟的世界。②分析收集的配送时间样本后,P值为0.03,低于0.05的置信水平,因此可以说结果是具有统计显著性的。③因为一直相信比萨店可以在30分钟内配送比萨,现在需要考虑的是这一信念是否仍然有意义,因为结果说明了比萨店没能兑现承诺,而且结果是具有统计学意义的。④这时先试着用各种方法使初始信念成立,但由于比萨店的口碑越来越差,因此决定拒绝零假设。⑤最终做出不再从这家比萨店买比萨的合理决定。

不难发现在上面的例子中,P值不能证明或决定任何事。当结果有统计学意义时,P值可以作为挑战初始信念的工具。假设P值表明结果具有统计显著性,在认为信念荒谬的那一刻就放弃了自己的初始信念,即拒绝零假设,并做出了更合理的决定。

4   统计显著性

通过对上述假设检验、正态分布、P值含义、统计显著性四个维度的分析可知P值在统计学中具有非凡的意义,更是SPSS软件分析问卷数据时的重要指标,值得广大研究者对其进行深入探究。

【参考文献】

[1]阮征.影响初中生数学运算能力提升的因素调查研究[D].合肥:合肥师范学院,2018.

[2]卫德彬,阮征,陈方勇,等.智慧学校环境下习题课教学与初中生数学成绩关联性实验研究[J].中小学电教,2019(6).

【作者简介】

阮征(1992~),女,汉族,学历:硕士研究生,研究方向:数学课程与教学论。

孔德飞(1977~),男,汉族,中学一级教师,研究方向:初中数学教学。

猜你喜欢

假设检验正态分布
假设检验结果的对立性分析
生活常态模式
浅谈高斯分布的原理和应用
统计推断的研究
沈阳市民使用理财APP的调查研究报告
凤爪重量质量管理报告
通俗简单地解释数理统计的思想方法
基于改进隐马尔科夫模型的畜禽全基因组关联分析中的多重检验方法
二项分布及其应用、正态分布
高考正态分布问题例析