APP下载

统计学的基本思想及在医学应用中的误区

2019-07-19段康静

财讯 2019年16期
关键词:假设检验统计学

段康静

摘 要:统计学是一门研究随机现象,以推断为特征的方法论科学,“由部分推及全体”的思想贯穿于统计学的始终。从一开始的研究设计到最后的数据分析,都是统计学的研究范畴。统计学不仅是数据分析,前期的科研设计其实更为重要。在应用到医学统计中,需注意一些思路和错误辨析。本文主要阐述统计分析的基本思路,并说明一下当前统计学应用的一些注意事项。

关键词:统计学;参数;假设检验

一、统计学的基本思想

统计学分析的主要内容就是参数估计和假设检验,几乎所有的统计方法都离不开这两个内容。所谓参数,就是描述总体特征的一些指标,如总体中的率、均值等都是参数。这些指标在样本中则称为统计量。由于各种原因,实际中只能获得样本数据而非总体数据。因此统计学的主要目的就是利用样本统计量去推断总体参数,也就是参数估计。

参数估计只是利用样本数据估计总体情况,但这一估计值是否反映了总体的真实情况,则需要假设检验来验证,其涵盖了统计学从数据到结论的基本思想,它是证明验证后是“接受”还是“拒绝”。例如,某药厂研发了一种新的降压药,想证明这种药比常规药的降压效果好。这里药厂的假设就是新药可能比常规药疗效好,利用样本数据计算一定的统计量,得到相应的P值,做出结论,这样一个过程,就是假设检验。

我们来通过一个例子阐述从样本数据到结论的一个过程。假设根据样本数据,计算新药和常规药的血压降低值平均分别是5.5mmHg和3mmHg,差值为2.5mmHg。计算的2.5mmHg就是参数估计,这一参数估计值是否反映了总体的真实情况呢?换句话说,总体中是否两种药物的差值也是2.5mmHg呢?

首先需要明白,即使总体中两种药物没有差异(差值为0),由于抽样误差的存在,样本中两种药物仍可能存在差异,仍然可能出现2.5mmHg甚至更大的差异。要想判断2.5mmHg这样大的值是否超出了样本变化所能造成的差异范围,首先得知道在总体均值相等的条件下(差值为0),样本均值会有什么样的变化。

在统计学中,回答这一问题称为零假设,又称原假设,指进行统计检验时预先建立的假设。零假设成立时,有关统计量应服从已知的某种概率分布。当统计量的计算值落入否定域时,可知发生了小概率事件,应否定原假设。备择假设就是和原假设相反的假设也就是说,假定总体中两种药物的疗效是完全相等的。在这种假设下,我们可以计算样本数据中出现的差异大小是否超出了抽样误差所能解释的范围。与零假设对立的假设称为备择假设,它假定总体中两种药物的疗效不相等。由于二者完全对立,所以如果能否定零假设,就可以肯定备择假设。通常情况下,备择假设是我们想证明的观点,而零假设使我们想要推翻的观点。

在这一例子中,我们想验证的是新药物-降压药的疗效比常规药好,所以先做出一个零假设,假设两种药物在总体中是没有差异的。即使这一假设是真实的,但由于抽样误差的存在,我们获得的样本中的差值也不一定正好为0,可以有很多情况存在。我们可以计算出各种情况出现的概率,在这里我们想了解的是,如果在总体中两种药物差值为0这一前提条件下,出现样本中差值为2.5mmHg(甚至比2.5mmHg还要大),这种概率有多大?这个概率就是P值。

如果这一概率很小,比如P=0.001,那我们就可以说,如果两种药物真的没有差别(差值为0),那么在样本中出现了差值为2.5mmHg(以及比2.5mmHg还大,如差值为3mmHg),这种概率最多只有千分之一。对于这么低的概率,我们认为理论上很难在一次样本中就出现。既然不大可能出现,那我们就要回过头来质疑一开始的前提假设条件,换句话说,我们怀疑原假设是错误的,而更倾向于接受原假设的对立面——备择假设。所以我们才会下结论说,总体中两种药物的差值不为0,下这一结论至少有99.9%的信心

参数估计是假设检验的第一步,没有参数估计,也就无法完成假设检验。-但应注意以下问题:

(1)做假设检验之前,应注意资料本身是否有可比性。

(2)当差别有统计学意义时应注意这样的差别在实际应用中有无意义。

(3)根据资料类型和特点选用正确的假设检验方法。。

(4)判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。

(5)报告结论时是应注意说明所用的统计量。

二、统计分析中的误区

(1)加强对基础统计分析方法的重视,应掌握各种基础方法的应用条件,避免再次发生类似错误。

(2)避免统计学方法的盲目套用,采用与别人同样的方法进行分析。实际上,统计学分析最重要的一个原则就是具体问题具体分析,即使同样的研究目的,在不同的数据类型、数据分布中都应采用不同的方法。

(3)为突出文章的质量和特色,一些临床人员不可一味追求方法的新颖,采用复杂的方法去说明。事实上,统计分析方法并无任何高低之分,只有合适与否。统计方法的应用,需要结合研究目的、数据类型、数据结构等多个条件,选择最适合自己数据的方法。复杂的方法得出的结论未必可靠,简单的方法同样可以得到合理的结果。

(4)加强对科研设计的重視不少临床人员轻视前期的科研设计,对如何选择设计方法、如何抽样、样本量计算等随意设计,直到最终数据收集上来之后才去找统计学家分析处理。这种情况无异于忽视预防,直到有病才去找医生。此时统计学家只能告诉你错误在什么地方,却无法去弥补前面犯下的错误。

参考文献

[1]梁冯珍,关静.统计学(五版)[M].北京:机械工业出版社,2009.

[2]冯国双,罗凤基.医学案例统计分析与SAS应用(2版)[M].北京:北京大学医学出版社,2015.

猜你喜欢

假设检验统计学
假设检验结果的对立性分析
大数据的统计学基础分析
大数据时代下的统计学
统计学教学与实验实践的一体化整合初探
统计学发展趋势
统计推断的研究
省属地方高校应用统计学专业人才培养模式研究
沈阳市民使用理财APP的调查研究报告
凤爪重量质量管理报告
通俗简单地解释数理统计的思想方法