经管类专业统计学假设检验教学研究
2014-07-28叶鸿烈
叶鸿烈
【摘要】以具体工作中的假设检验的两个例子,尝试回答假设检验教学中经常碰到的几个问题,如果某事件在一次实验中发生了,就有足够的理由认为这个事件不是小概率事件,在参数估计中,根据样本所提供的信息,求出总体参数置信区间,就能以一定的置信水平保证总体参数落在该置信区间内。在假设检验中,如果原假设为真,样本对应的统计量值落在置信区间外的可能性是很小的,而假如一旦落在置信区间内,就可以拒绝原假设。对于如何建立原假设,本文提出两个原则,拒绝原则和弃真成本比较原则,对具有方向性的并且统计量值在置信区间内的假设检验具有实践指导作用。
【关键词】假设检验参数估计小概率原理
【基金项目】2013年广西高等教育教学改革工程立项项目(编号:2013JGA427)资助。
【中图分类号】G64 【文献标识码】A 【文章编号】2095-3089(2014)05-0248-02
《统计学》是教育部规定的经管类专业必须开设的核心课程,为决策者提供数量依据的一门方法论学科。该课程在本科经管类专业的内容主要分三大块,描述统计、推断统计,统计应用部分,其中统计应用部分主要是讲述基于推断统计基础上特别是应用假设检验方法解决具体问题。因此推断统计中的假设检验是一个重点内容,但这部分内容学生以前没有接触过,特别是经管类专业招生时为文理兼招,数学的基础不是特别理想,学生在学习的很多时候,知其然而不知其所以然。如何讲清楚假设检验内容是一个难题,本文尝试在疏理传统教材的前提下,提出一些的新的讲述方法。
1.假设检验授课的困惑
传统的教学顺序是,从小概率原理出发,说明假设检验的基本思想,介绍假设检验的两类错误,建立假设检验的基本步骤。但存在下面几个问题,试以下面例子说明。某灯泡生产企业欲向某超市提供一批灯泡,按合同规定,灯泡的使用寿命平均不能低于2000小时。假定灯泡使用寿命服从正态分布,且标准差为250小时。灯泡生产企业为确认这批灯泡的使用寿命,随机测试了30只灯泡,并算得样本均值为1998小时。现在来研究超市是否应该接受这批灯泡?(α=0.05)。首先,使用区间估计方法,这里,■■=1998,n=30 , Z■=1.96 , σ=250 ,■±Z■×■=1998±1.96×■=1998±89.42 即,(1908.58,2087.42),这里包含了2000,显然超市是应该接受这批灯泡的。但是,学生的困惑是,这里面不是也有很多的数据处在2000以下吗?现试用假设检验,这是一个关于单个正态总体均值的具有方向性的单边检验问题,可以设立两种原假设,原假设一,H0:μ≥2000,H1:μ<2000,Z=■=■=-0.044,大于-Z0.05=-1.645因此结论是没有证据表明能够拒绝原假设,超市是应该接受这批灯泡。另外原假设二,H0:μ≤2000,H1:μ>2000,Z=■=■=-0.044 ,小于Z0.05=1.645,因此,结论是没有证据表明能够拒绝原假设,超市是不应该接受这批灯泡。学生在此又有一个困惑,原假设不同,得到的结论却是不同的。其实,关键的地方应该给学生讲清楚下面几个问题,第一,有了教材前面的区间估计方法,为什么还要讲述假设检验?假设检验和区间估计有什么异同?它们各自的适用范围。第二,显著性水平的含义α=0.05是什么?第三,原假定的建立有什么原则吗?采用不同的原假设,得出相反的两个结论原因是什么。第四,两类错误的关系如何理解?在传统假设检验的教学中,老师重点放在让学生对在给定的原假设基础上如何选择合适的检验统计量并进行计算,让学生判断样本数据是否落入拒绝域从而做出拒绝或接受原假设,结果是大部分学生在学习假设检验过程中总是死记硬背各类检验统计量和拒绝域的具体形式,忽略假设检验的统计思想的培养与统计方法的掌握,没能达到“举一反三”的学习效果。
2.问题的解决
首先,我们要讲清楚小概率事件原理,小概率事件在一次试验中几乎不可能发生。小概率事件没有发生不奇怪,我们感兴趣的是奇怪的事情,小概率事件发生了,这说明原设定的小概率事件不是小概率事件,另外还要明确假设检验中到底什么是小概率事件。上面的例子计算的Z值对应的概率换算为0.4825,比0.05大多了,显然不是一个小概率事件。区间估计和假设检验有什么异同?置信区间可以回答假设检验的问题,算得的置信区间如不包含原假设,则拒绝原假设。如包含了原假设,则不拒绝原假设,但可信区间不能代替假设检验, 可信区间只能在预先规定的α水准下计算, 而假设检验能计算较为确切的 P 值。参数估计解决的是范围问题,假设检验则判断结论是否成立。另外 ,两者对问题的了解程度各不相同。进行区间估计之前不了解未知参数的有关信息。而假设检验对未知参数的信息有所了解,但作出某种判断无确切把握。现实工作中更多的是使用假设检验,比如,上例的灯泡案例用参数估计计算出来的范围尽管包含了2000,但也包含了太多的2000以下的数据,给管理者作出决策带来太多的风险。但假设检验就能定性地给出结论,并告诉管理者有多大的把握。那么,如何建立原假设?上面的例子,由于采用不同的原假设,得出绝然相反的两个结论。根据NEYMAN和 PEARSON提出的“在控制犯第一类错误的概率α的条件下,尽量使犯第二类错误的概率β减小”原则,在解决具体问题时只限制α的大小而忽略β ,在假設检验时更倾向拒绝原假设而不是接受。因为假如拒绝了原假设,我们就有1-α信心相信原假设为伪,即只有α的概率大小犯错误,从实际上说就是因为事先已经对原假设产生了怀疑而纯粹为了推翻或拒绝它。基本原则是从检验者本身的目的出发,将希望推翻或拒绝的结论设为原假设,这一原则或者叫拒绝原则。另外,从可能犯错成本角度来看,否定原假设的概率是α,假如原假设是对的,我们拒绝了,拒真错误概率就是α,如果拒真造成的犯错成本很高,说明这时设定的原假设就设对了,因为要有更多更严格的证据才能拒绝原假设。具体到上面的灯泡例子。使用拒绝原则,我们认为该批产品不合格,原假设H0:μ≥ 2000.,H1:μ<2000,原假设是我们拒绝的。如果我们认为该批产品合格,H0:μ≤2000,H1:μ>2000,原假设是我们拒绝的。具体到实际工作中,我们找证据证实产品合格比证实不合格要困难得多。使用拒真成本最高原则分析,产品实际上是好的,被我们拒绝了:H0:μ≥ 2000.,H1:μ<2000,造成的损失,和这批产品是差的但我们没有拒绝H0:μ≤2000,H1:μ>2000,造成的损失相比那个更大?现实工作中,使用不合格产品比不使用合格产品造成的损失要大得多。所以,对于具有方向性的统计量的假设检验分析,假如计算出来的统计量值在(-1.65,1.65.α=0.05)或者(-1.96,1.96.α=0.01)之间,或者转换概率P值大于0.05或者0.01,则建议加大样本量,或者根据拒真成本最高原则来设定原假设,比如上述灯泡例子,建议取H0:μ≤2000,H1:μ>2000,结论是超市不应该接受这批灯泡。再者,显著性水平的含义是什么?小概率事件在一次实验中居然发生了, 说明原假设显著的不成立,此时我们拒绝原假设犯错误的概率为α,因为α很小,一般是0.05, 0.01等, α也称为显著性水平,也就是拒真的概率,也就是说,样本证明要拒绝原假设,但毕竟是样本,要冒概率α犯错误的风险。这就是所谓的第一类错误,如果样本证明没能拒绝原假设,只能说明观测值与零假设不矛盾,但并不能肯定原假设为真,此时接受原假设会以概率β冒取伪的风险,这就是第二类错误,在一定的样本量条件下,犯第一类错误概率小,则犯第二类错误概率就大。
以下面的例子结束我们的讨论。 咖啡生产厂商在其产品标签上声称,其出品的咖啡罐头平均重量为1.5千克或者以上,监督部门对其咖啡罐头产品进行质量检查,根据以往的数据得知,咖啡罐头重量标准差为0.05千克。今随机抽取了49听咖啡罐头,测量其重量,平均重量为1.49千克。要求在0.05的显著性水平下,检验咖啡罐头重量的总体均值是否与标签上声称的内容相符?
这是一个具有方向性的检验问题。这里也有两个原假设。如果使用上述的拒绝原则,原假设是H0:μ≥1.5,Z=■=■=-1.4>-1.645,没有证据表明能够拒绝原假定,但从犯拒真的成本的大小来分析,使用了不合格的产品的风险成本比不使用合格的产品的风险成本要大,所以,原假定应该是:H0:μ≤1.5, Z=■=■=-1.4<1.65,没有证据表明能够拒绝原假设。实际检验工作中,对于方向性明确的问题,一定要从风险成本出发确定原假设,否则,增大样本量,或者做出让步。
本文以具体工作中的假设检验的两个例子,尝试回答假设检验教学中经常碰到的几个问题,主要是要求学生正确理解小概率事件原理,显著性水平的含义等概念,要求学生掌握如果某事件发生的概率很小,在一次实验中,是可以忽略它的,也就是说明在一次实验中该事件是不会发生的,如果某事件在一次实验中就发生了,就有足够的理由认为这个事件不是小概率事件,也就不能忽略它等基本思想。回答了参数估计与假设检查的异同,在参数估计中,我们是根据样本所提供的信息,求出总体参数置信区间,以一定的置信水平保证总体参数落在该置信区间内。在假设检验中,由临界值围成的区域就是以总体均值为中心的置信区间。如果原假设为真,样本对应的统计量值落在置信区间外的可能性是很小的,而假如一旦落在外面,利用“小概率原理”就可以拒绝原假设。对于如何建立原假设,本文提出两个原则,拒绝原则和弃真成本原则,特别是对具有方向性的并且统计量值在置信区间内假设检验具有实践指导作用,教师的教学不仅要向学生传授学科知识,更为重要的是培养学生主动学习、思考的学习方式。在实际教学环节中,这就要求授课教师要做到能够准确的把握重点和难点,对重难点内容既要能够扩展引申,也要能够深入剖析。 此外,教师还必须对重点问题做好总结归纳,将实际问题与理论相结合,通过案例教学的方式,最大程度上调动学生的学习积极性,培养学生创新思维,特别是统计学教学尤其是这样,激发学生学习热情,提高学习效果,实现有效学习与有效教学,解决学生对该课程学习的难学难记的问题,培养他们利用《统计学》知识分析、解决实际问题的能力,使学生具有较强的理论与实践应用能力、独立分析与解决问题能力、交流与合作能力等,为学生学习相关课程以及今后实际工作中打下扎实的统計学基础,提高学生的就业能力。
参考文献:
[1]蒲冰.对假设检验的教学探讨[J].重庆科技学院学报(社会科学版)2011年第2期:193-194.
[2]王艺明. 假设检验教学和应用中的几个问题探讨[J].厦门广播电视大学学报,2007年第1 期:57-59.
[3]曹远红. 体育统计教学中假设检验的教学方法建议[J].湖北经济学院学报(人文社会科学版),2011年第2期:203-204.
[4]郭宝才,孙利荣.关于假设检验中的几个问题的探讨[J]. 统计与决策,2010年第6期(总第 306 期):10-11.
[5]刘群锋. 假设检验中的三个问题及其思考[J].大学数学,2008年10月第24卷第5期:190-193.
[6]詹晓琳,沈薇薇. 显著性假设检验中原假设的建立[J].上海第二工业大学学报,2010年6月第 27卷第 2 期:156-159.
[7]冯力.统计学[J].东北财经大学出版社,2011年1月第1版.