APP下载

显著性检验中“边缘显著”的教学思路与要点初探

2020-08-16黄成毅周海霞

西部论丛 2020年5期
关键词:假设检验显著性边缘

黄成毅 周海霞

摘 要:初涉研究的大学生容易沦为追“星”族,在毕业论文中过分强调统计学意义上的显著性,常使用“边缘显著”来掩盖研究中的所谓不完美。本文力求从教学的角度,分析其教学逻辑、提炼教学要点,为研究方法类课程的老师提供教学参考,以帮助学生理清“边缘显著”的实质,树立正确的假设检验观。

关键词:边缘显著;假设检验;α值

引 言

假设检验对犯I型错误的概率α取值标准历来争议很大。为什么α不能是0.06而选择了0.05,两者有质的差别么?Rosnow(1989)就曾指出,其实上帝爱0.06就像爱0.05一样多。在一次判断中α的标准显然只能有一个,学界公认的0.05为拒绝H0的临界值,为什么现在大量研究又将其宽限到0.10甚至更大值?这可谓实践中“游动的α”(Goodman, 1993)。随着“边缘显著”说法的兴起,学术新人更容易标准游离。因此,这需要我们去了解α的0.05和0.10取值的前世今生,在教学中理清思路和要点,以帮助学生在研究中显著性水平的合理选择和表达。

一、理清显著性检验中P和α的关系

首先,学生容易将P和α两者混淆,因为二者在假设检验中有等价的功效,而它们最终又都与是否拒绝H0相关,所以二者含义应该一致。其实,Fisher的p<0.05和Neyman-Pearson的α=0.05中的共同数值0.05,二者的理论来源相异,含义不同。数α称为显著性水平,而p值是显著性概率。从理论来源来看,α與N-P的假设检验理论相关联,p则与Fisher的显著性检验理论相联系(鲍贵,席雁,2010)。因此,教学中应先澄清两者的关系。

二、简述0.05显著标准的历史由来

Fisher被认为是正式提出这一统计显著性标准的人。他在1925年《研究者的统计方法》一书中首次将0.05作为具有统计显著意义的最大可接受值,但他在1926年《田间试验的安排》一文中又承认确实可用其它值来判断显著性。他也曾指出,没有一个科研工作者拥有一个年复一年,在所有情况下用来拒绝虚无假设的固定显著性水平,更应关注现实的证据和自己的想法。所以,这种规定和划分并没有一种绝对的算法和理论,甚至还带有一定的主观估计性,但一个合适的概率值被大家认可为是“不太可能发生”事件,且有一位权威的数学家正式地提出,那么这种值更容易被接受、延用而成为惯例。但这种“非绝对唯一性”就隐含着日后出现另一“合理范围取值”的可能性。正如越来越多研究者在接受的“边缘显著”这一说法。

三、引发边缘显著“合理性”的质疑

α=0.05仍是最被认可的临界值,但研究者很容易被这一值所困扰,特别是所得P值只是略大于它时。其实P值很容易受到样本量、标准差的影响,但通常研究者又不愿意再耗精力去扩大样本或多次研究。这种爱恨交加下,“边缘显著”的出现似乎有它的必然性。虽然研究者不应该迷信和固守于惯例中的显著性水平,但有学者也指出,严格意义上讲,统计中只有显著和不显著两种结果,加上极其或边缘这样的修饰语是不合适的,即使0.05这个值显得有些武断,但这个值还是相对宽松的(Dawn Iacobucci, 2005)。即便允许有高于0.05的水平设置,但也不应该出现“边缘显著”这样的概念。若将这种决断权部分移交给研究者,必然会引来新的麻烦。如果接受这一发展趋势,其容忍的度跟0.05这一标准一样,也会引发争议。

四、明确当前“边缘显著”的容忍度

最早对于0.10这一标准可上溯到20世纪初。Kendall(1914)曾指出:“想像一下如果我们接受了P=0.01,无论在什么情况下我们都可以采用这条分界线么?这一概率多大程度会对研究者的决断产生影响更多取决于研究者的谨慎程度了。有些人会认为这个概率已足以说明问题,其他人则可能更保守而需要更小的值,这是一种个人的取向。

目前边缘显著通常用在P值大于0.05,但其值又不超过0.10时。例如,通过对中国知网期刊和学位数据库(2000年后)的搜索,共汇集80篇(国内)心理学论文。其中共有7篇论文对“边缘显著”的划定不在0.05至0.10的范围(最小为0.048,最大为0.11)。但国外有报告指出有一例研究的P值达到0.24,但仍将两组差异归为边缘显著(Dar, etal., 1994)。显然,研究者的这种宽容态度不可取。

五、增强P值大于0.05时的理智感

出现“边缘显著”的字样,不管他的α取值是如何的“边缘”,都应该视他拒绝了H0。而读者则更要关注研究者是否结合效应量来辅助说明他的最终结论,尤其不能将“边缘显著”理解为变量间的关联或差异“有些显著”或者“快要显著了”。这种“边缘”本就是相对于传统的α最大可接受值0.05而言的。

不管用边缘、趋向,还是接近、几乎显著,都应该报告P值、样本量等,并对为什么在此研究中接受边缘显著作出说明,尤其要报告效应量进行合理分析。在讨论结果时还可以考虑作方向性的描述,不简单跟从统计的冰冷数字作“全或无”的判断,为读者传达出更有启示性的建议,并有后续研究的改进措施,推动达成更可靠的结论。这些是老师在作为学生研究引路人之初,以“边缘”显著为契机,理应筑牢的科学态度。

参考文献

[1] Rosnow, Ralph L. Robert Rosenthal, Statistical Procedures and the Justification of Knowledge in Psychological Science[J]. American Psychologist, 1989,44(10): 1276-1284.

[2] Goodman, S.N.p values, hypothesis tests, and likelihood: Implications for epidemiology of a neglected historical debate[J].American Journal of Epidemiology, 1993, 137, 485-496.

[3] 鲍贵,席雁.统计显著性检验:问题与思考[J].南京工程学院学报(社会科学版),2010,10(04):27-32.

[4] Fisher R A . Theory of Statistical Estimation[J]. Mathematical Proceedings of the Cambridge Philosophical Society, 1925, 22:700-725.

[5] Kendall, & Maurice G. (0). An introduction to the theory of statistics[M]. Charles Griffin,1914.

[6] Dar R , Serlin R C , Omer H . Misuse of statistical test in three decades of psychotherapy research[J]. Journal of Consulting & Clinical Psychology, 1994, 62(1):75-82.

基金项目:重庆三峡学院高等教育教学改革研究项目(JGYB2008)。

猜你喜欢

假设检验显著性边缘
假设检验结果的对立性分析
欧盟法院判决明确欧盟商标通过使用获得显著性的地域认定标准
浅谈商标的显著性对于商标应用的影响
商标显著性的司法判断(一)
统计推断的研究
一张图看懂边缘计算
基于视觉显著性的红外与可见光图像融合
凤爪重量质量管理报告
基于改进隐马尔科夫模型的畜禽全基因组关联分析中的多重检验方法
在边缘寻找自我