对假设检验的教学探讨
2011-10-20蒲冰
蒲 冰
对假设检验的教学探讨
蒲 冰
著名的统计学家Fisher曾经指出经典的数理统计学就主要包括三个方面的内容:抽样分布、参数估计和假设检验,而假设检验的学习一向是数理统计的重点和难点。针对众多学生在学习的过程中总是机械性地去记忆检验统计量和拒绝域的具体表达式这一现状,本文就假设检验教学过程中的一些心得体会进行了总结并探讨了在教学过程中培养学生的创新思维和独立思考能力的途径。
显著性检验;拒绝域;小概率事件原理;检验统计量
随着社会的进步以及科技的发展,数理统计知识得到了广泛地应用,参数估计与假设检验是统计推断中两大基本问题,特别是假设检验问题,一向是统计学习的重点和难点,大多数学生在学习过程中总是机械性地去记忆和背诵各类检验统计量和拒绝域的具体形式,却忽略了统计思想的培养与统计方法的掌握,从而导致了“举一不能反三”的学习效果。实际上,假设检验是建立在实际推断原理的基础上并根据样本对总体做出判断的一类统计方法,教学大纲中对假设检验教学目的的阐述是:使学生了解显著性检验中的基本概念,如原假设与备择假设、检验统计量、临界值、拒绝域、两类错误、显著水平等,理解其基本的统计思想,掌握构造拒绝域的基本方法以及假设检验的基本步骤。因此,在本文结合假设检验教学过程中笔者的一些心得体会来分析如何通过启发式教学方法去帮助学生树立主动思维与统计思想的途径。
一、原假设与备择假设
假设检验问题在现实生活中有着广泛的应用,考虑如下实际问题:
例一:某面粉厂用一台包装机包装所生产的面粉,所包得的面粉重量为一随机变量且服从正态分布,当机器工作正常时,其均值μ为0.5公斤,标准差σ为0.015公斤。某天开工后为检验机器是否正常,随机地抽取了9袋面粉,称得净重如下:
0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512
问当日机器工作是否正常?
在该问题中,根据题意可知面粉重量这个随机变量服从的分布是正态分布,即 X~N(μ,σ2),而由我们的长期经验可知分布中的标准差σ是一个比较稳定的量,即不管机器工作正常与否,其标准差σ都可视为0.015。于是,面粉袋重量上的差异则主要是由总体均值μ所引起的,因此,判断当日机器工作正常与否就等价于判断其均值μ是否等于0.5,若均值μ等于0.5,则认为当日机器工作正常,否则认为机器工作不正常。在此基础上,提出如下相互对立的假设:
H0:μ=μ0=0.5(原假设) H1:μ≠μ0(备择假设)
值得注意的是,在习惯上我们总是将预期出现的结果或影响较大的结果置于原假设的位置上,而备择假设的含义是当原假设被拒绝后还可供我们选择的假设,原假设与备择假设是一对相互矛盾的关系,它们构成了样本空间的一个划分。于是,我们下面的任务就是根据样本判断是否接受原假设。
二、两类错误与显著性检验
接下来,教师应引导学生思考如下问题:如何利用上述例子中的样本去衡量均值μ的大小并在此基础上判断当日机器工作是否正常呢?我们知道得到样本的均值总是在总体的均值附近波动,回顾估计量的评判标准可知,样本均值X是总体均值μ的一个无偏估计,因此,其中一个很自然的想法便是用观察值x去衡量μ的大小,即考虑差异|x-0.5|,若当日机器工作正常,则|x-0.5|就不能太大;反之,|x-0.5|过大,则我们认为当日机器工作不正常,μ已经不再是0.5了。基于上述分析,问题的关键便是找到一个常数k,使得当(|x-0.5)|〉k时,就否定原假设;而当(|x-0.5)|〉k时,就接受原假设。
此时,教师应引导学生思考法则中k的取值的问题,由于常数k是事先给定的一个标准,若k取得过大,则总是趋于接受原假设,反之,若k取得过小,则总是趋于拒绝原假设,即k的取值没有一个一成不变的通用标准。因此,如何合理确定法则中k的取值大小并考虑上述法则判断失误的概率大小是本文所要解决的核心问题。经过上述的初步分析,学生将会带着问题与思考进入下一环节的学习。
为了帮助学生理解假设检验中的两个重要概念:两类错误与显著性检验,考虑如下例子:
例二:某同学体质较弱,若淋雨则易患感冒,因此相对于天晴而言,该同学更关注下雨的情形,因为下雨所带来的后果更为严重。由第一部分的分析可知,下雨是本例的原假设。此外,对于该同学而言,难免会出现天晴带伞与下雨不带伞的情况。分析到此,教师应向学生提问,请从统计角度思考天晴带伞与下雨不带伞是否是同一类错误,如若不是,请指出其中的区别。
这样一来,自然就引出了两类错误的概念,由于我们总是依据样本来做出决策,因此总有决策失误的可能,而这样的错误分成两类,分别是第一类错误:当原假设为真时拒绝原假设(下雨不带伞)与第二类错误:当原假设不真时接受原假设(天晴带伞)。此时,教师需向学生提出问题:这人如何减少犯第一类错误和第二类错误的概率呢?
显然,为了尽量不被雨淋,此同学可随身带伞,但这样一来就增加了犯第二类错误的概率;同样,为了方便起见,此同学也可不带伞,但这样又增加了犯第一类错误的概率。这也就说明,当样本量固定的时候,减少犯一类错误的概率往往以增加犯另一类错误的概率为代价。此时,教师应进一步设问:如何解决这样的矛盾呢?在此基础上就自然的引出了显著性检验的定义:在实际中,我们总是选择控制犯第一类错误的概率,使其小于等于α,而对犯第二类错误的概率不加以考虑,称这样的检验称为显著性检验,而α被称为显著性水平。
教师需向学生强调如下几点:首先,显著性水平α是用来控制犯第一类错误的概率的,其取值根据实际问题而定,α通常取为0.01、0.05等;其次,显著性检验的理论依据是 “小概率事件原理”,当α取为0.01时表明事件在100次实验中仅能够发生一次,原则上在一次实验中事件是不可能发生的,但如若真的发生了,则我们有理由怀疑原假设的正确性从而拒绝原假设;再次,由于原假设总是我们预期出现的结果,因此,拒绝原假设要谨慎,所以α的取值通常很小。
三、检验统计量与拒绝域的导出
四、总结
针对传统的统计教学总是教师单反面灌输,学生总是被动接受的实际,本文以假设检验的启发式教学为例并结合日常生活中的实际例子,不仅向学生介绍了显著性检验中的基本概念,还重点阐述了假设检验问题背后的统计思想。“教为不教,学为创造”,这也就是说,教师的教学不仅要向学生传授学科知识,更为重要的是培养学生主动学习、思考的学习方式。学生是学习的主体,但教师却是学习的主导,在实际教学环节中,这就要求授课教师要做到充分备课并熟练掌握教材中的内容,能够准确的把握重点和难点,对重难点内容既要能够扩展引申,也要能够深入剖析。此外,授课教师还必须对重点问题做好总结归纳,将理论与实际问题相结合,结合案例教学的方式,最大程度上调动学生的学习积极性,培养学生创新思维。
[1]盛骤等.概率论与数理统计[M].北京:高等教育出版社,2008.
[2]茆诗松,王静龙.数理统计[M].上海:华东师范大学出版社,1986.
[3]茆诗松等.高等数理统计[M].北京:高等教育出版社,2000.
G710
A
1673-1999(2011)02-0193-02
蒲冰(1963-),重庆工业职业技术学院(重庆401120)工商贸易系讲师,研究方向为经济管理。
2010-11-04
2010年度重庆市高等教育教学改革研究项目 “会计电算化专业课程体系与教学内容整体优化研究与实践”(项目编号 103475)。