对体育统计中假设检验有关问题的诠释
2011-08-15曹远红
曹远红
(湖南师范大学体育学院,湖南 长沙 410012)
对体育统计中假设检验有关问题的诠释
曹远红
(湖南师范大学体育学院,湖南 长沙 410012)
目前我国体育院校常用的体育统计教材对假设检验问题论述存在笼统性和论述不清的问题,针对这一问题,对假设检验中单双侧检验的应用、原假设的确立、检验统计量的确定等问题进行了较深入的阐述,为了增加可读性,文中采用较通俗而不是数学化语言进行了论述。
体育统计;假设检验;单双侧检验;统计量
统计学一个重要的任务就是以样本特征推断总体特征,假设检验,尤其是参数假设检验是统计推断中重要组成部分,在体育科研中有着广泛的应用,基于此,本文对参数检验中有关问题的原理和方法进行了阐述。所谓假设检验就是对总体分布的参数或总体分布的性质提出某种假设,然后根据样本信息对提出的假设进行检验,判断该假设是否成立。[1]假设检验分为参数检验和非参数检验,前者是对总体分布的某个参数提出某种假设,利用来自总体的样本检验假设是否成立;后者是总体分布的性质提出假设,用来自总体的样本检验该假设是否成立。参数检验主要有U检验(也叫Z检验)、T检验、检验等,非参数检验主要有秩和检验、符号检验等。
1 检验统计量的确定
2 单、双侧检验的确定
在参数检验中,单、双侧检验的称呼主要是依据其拒绝域的形式来命名的,把拒绝域分布两侧的检验叫双侧检验,把拒绝域分布一侧的检验叫单侧检验。在实际应用中到底用单侧检验还是用双侧检验,需要根据研究目的确定,如果要检验某统计量是否来自某一总体,或者检验某一值是否等于已知值,这时的任务只需检验是否等于,>或<都将拒绝原假设,所以双侧检验的拒绝域分布在两侧。至于谁大谁小我们是不需要考虑的,这种情况通常用双侧检验。在另外一些情况,我们要检验的问题带有方向性,即要检验某一值是大于还是小于已知的值,这时需要采用单侧检验。单侧检验又分为左单侧检验和右单侧检验。至于究竟是左单侧还右单侧检验,这需要根据原假设确定,因为原假设一旦设立,则拒绝域就确定了,这个问题在下文中论述。
在体育科研的实践中,往往是用单侧检验较多,比如说采用了某种新的训练方法成绩是否有提高,某地区青少年的平均身高是否有所增长,通过实验条件的改变,某指标是否变低还是变高等,诸如此类的问题都是带有方向性,需要采用单侧检验。不管是单侧还是双侧检验,至于值都是不知道的,而是根据已有的样本信息对进行检验。
3 参数检验中原假设的确立
例[2],已知普通成年人安静时的心率服从正态分布,其平均心率是72次/min。现从某体院随机抽测36名男生,测得安静时心率平均数为68 次/min,标准差为6.6次/min。试问该体院男生安静时心率与普通成年人的心率有无差异(a= 0.05)
原解法:该问题采用单侧检验,如果原假设不同,则会出现两种不同的结果。第一种情况,原假设72,备择假设拒绝原假设,接受备择假设,则认为该体院男生安静时平均心率低于普通成年人安静时平均心率。第二种情况,原假设备择假设拒绝原假设,接受备择假设,则认为某体院男生安静时平均心率高于普通成年人安静时平均心率,得出了截然相反的结论。
在上述例题中,这种解法存在什么问题,为什么会得出截然相反的结论?其实这个例题属于双侧检验,因为问题是“两者有无差异”,如果问题是“能否认为该体院男生的心率低于普通成年人心率”则用单侧检验。这个例题用单侧检验也不会得出相反结论的,题中之所以得出了相反结论,是其判断标准有问题,具体说是拒绝域界定不清,其依据是有些体育统计教材中给出的判断标准,即则拒绝北京体育大学祁国鹰教授在《体育统计简明教程》一书中对单侧检验拒绝域的界定是这样的的否定域为的否定域为t≥这是正确的,但没有说明为什么,不便于读者理解。那么拒绝域是怎么确定?在双侧检验中很容易理解,原假设备择假设U检验拒绝域为:T检验的拒绝域为:和在上面的例题中,如果原假设备择假设则可以确定其拒绝域为:属于左单侧检验。原理如下:在正态分布和t分布的图形中,我们知道左侧是小于平均值的区间,右侧是大于平均值的区间,那么,如果原假设成立的话,在一次抽样中,样本均值落入左侧小数值区间的概率是很小的,具体说是落入小于的区间概率很小,如果落入这个区间,则发生了小概率事件,就拒绝,正如说A公司宣称职工的平均工资比B公司高,如果从A公司随机抽取部分职工作为样本,其平均工资比B公司最低工资水平都还低的话,我们就自然认为A公司的宣称是不属实的。同理,如果原假设备择假设其拒绝域为属于右单侧检验,原理同左单侧检验一样。从中我们看出,原假设实际上是一种作为让步的假设,所以左单侧检验和右单侧检验也分别叫下限检验和上限检验[5]。
对于这个例题,拒绝域界定清楚了,虽然得出一样的结论,但事实上还是有差别的,对有些问题进行检验时有可能由于原假设不同而得出相反结论,这与假设检验中的两类错误有关。在上文中我们谈到假设检验的逻辑是概率反证法,但做检验时是根据抽样得到的样本值作出拒绝还是接受的决定,由于样本具有随机性,假设检验有可能犯错误,这种错误分为“弃真”错误和“取伪”错误,也即“第一类错误”和“第二类错误”。假设检验中显著性水平α就是犯“弃真”错误的概率,“取伪”错误的概率用β表示。我们都希望在假设检验中这两类错误的概率越小越好,但对于一定的样本量,当α增加时,β减小,反之当α减小时,将导致β的增加。就像在区间估计中,要想增大估计的可靠性,就会使区间变宽而降低精度;要想提高精度就会要求估计区间变窄,从而使可靠性下降。也就是说,我们在实际操作中根本无法找到一个能使α与β同时减小的临界域,除非增大抽样容量,但是无限增大样本容量并非抽样的本意。
在检验中,α的概率是可以人为控制的,通过控制α而改变β,α的含义是当原假设正确时却被拒绝的概率或风险,α通常取值0.05或0.01,但在使用时究竟取多大,应视具体情况和根据专业知识判断。“一般来说,哪一类错误所带来的后果越严重、危害越大就把哪一类错误作为首要的控制目标。[6]”需要衡量两类错误所付出代价的大小,如果“取伪”代价大,则取较大α。如“弃真”代价大, 则取较小α,容忍较大β。从假设检验的过程和两类错误来看,当拒绝原假设时,我就有1-α的把握认为原假设为伪,如果接受原假设时,则只表明没有充足的理由证明原假设是错的,只能接受原假设;反过来也就是说要拒绝原假设则需要较充足的理由,接受原假设则是“被迫”接受。可见,原假设往往是处于受保护地位的,一般是根据已有的知识和经验把不能轻易否定的东西作为原假设,比如在检验某产品的质量时,商家希望把“质量合格”作为原假设,因为这样容易得出接受原假设的结论,而要拒绝原假设是需要充足理由的。
在体育科研的实践中往往将希望证实的反面作为原假设,将希望证实的问题作为备择假设,这样一旦拒绝原假设,不仅具有充足的理由,而且往往意味科研成功,符合科学研究要严谨的习惯。比如说要检验一种新的训练方法是否有效,就把新的训练方法无效作为原假设。于是,文中的例题应该把作为原假设。由此可见第一种解法更准确,有足够的理由认为该体院男生安静时平均心率低于普通成年人安静时平均心率。
4 假设检验中的临界值和P值
现有的体育统计教材里参数检验中的判断结论还存在不规范的问题,一般都是这种模式:某统计量≥某临界值,P≤α,拒绝原假设,接受备择假设;某统计量≤某临界值,P≥α,接受原假设,拒绝备择假设。这种表达模式存在的问题是把临界值和P值没有区分开来,实际上把统计量与临界值比较是一种检验方法,而P值检验又是另一种方法,两种方法原理一样,但检验所提供的信息是有差别的。在统计软件能方便地计算出P值以前,一般用临界值检验方法,这时无需描述P值与α的大小。当然,借助现代统计软件,我们能快捷地计算出统计量,也能具体地体现P值的大小。“P值就是当原假设为真时,所得样本观察结果或更为极端结果的概率。”[7]P值越小则拒绝原假设的理由越充分。利用P值进行检验的决策准则是:确定小概率的标准即α,在双侧检验中,P≤,拒绝原假设,P>,则不能拒绝原假设;在单侧检验中,P≤α,拒绝原假设,P>α,则不能拒绝原假设。在检验中,P值将犯弃真错误的概率予以具体的显示,这就给我们提供了更多的信息,有助于我们在检验中作出更恰当、更精细的决策。
假设检验是统计推断的重要内容,正确理解、掌握其原理和方法对体育统计的教学、体育科研都有着重要作用,希望能对体育统计教师和在体育科研中应用假设检验的同仁提供有益的参考。
[1]丛湖平.体育统计学[M].北京:高等教育出版社,2007.
[2]权德庆.体育统计学科现状与发展趋势[J].西安体育学院学报,2008(1).
[3]费宇.应用数理统计[M].北京:科学出版社,2007.
[4]金晓峰.体育统计假设检验中几个问题的探讨[J].北京体育大学学报,2004(9).
[5]陈及治.体育统计[M].北京:人民体育出版社,2002.
[6]祁国鹰.体育统计简明教程[M].北京:北京体育大学出版社,2004.
[7]贾俊平.统计学[M].北京:中国人民大学出版社,2004.
G80-3
A
1674-151X(2011)02-108-03
投稿日期:2010-11-15
曹远红(1977~),讲师,博士。研究方向:体育统计的原理和应用、体育人文。
10.3969/j.issn.1674-151x.2011.02.055