医学统计学中假设检验的应用和注意事项
2018-04-19王建强李云
王建强 李云
【摘要】医学统计学是应用数理统计的原理和方法研究有变异的医学事件数量特征的一门应用科学,是认识社会和自然现象客观规律数量特征和医学科研中不可缺少的重要工具。它涉及医学数据资料的搜集、整理、分析和推断,而统计推断的核心内容就是假设检验,是医学统计学教学中的重点和难点。在实践中,由于通常难以完全知道所关心的总体的某些数量特征及其变化情况,因而对总体进行比较研究时,常常需要通过假设检验对总体做出推断。
【关键词】医学统计学;假设检验;应用;注意事项
引言
在醫学科研中,一般只能用样本来进行各种试验,最后通过样本得出的结论推断到总体结论,这就必然需要假设检验,通过已知的样本对未知的总体做出推断。然而,由于假设检验的方法不一、条件不同,它的基本思想、运算过程和结果分析有时难以理解,易造成误解甚至错误。
一、医学统计资料中假设检验的意义
假设检验又称显著性检验,是指判断样本统计量与总体参数或样本统计量与样本统计量之间的差异有无显著性意义的一种统计方法。在计量资料分析中,常常遇到一个样本均数与某一总体均数有差别,或两个或多个样本均数间有差别,此时就需要判断这种差别的性质和意义。例如,根据大量调查资料,健康成年男子脉搏均数为72次/min,可视此为总体均数。某医生抽查了山区25名健康成年男子,得其脉搏均数均数为74.2次/min,与已知总体均数相差2.2次/min。引起这种差别的原因为:第一,总体均数与该样本均数本来是相等的,但由于抽样误差的影响,导致二者出现差别,统计学上认为此差别无统计学意义;第二,总体均数与该样本均数存在本质差别,其差别不能用抽样误差来解释,统计学上认为这种差别有统计学意义。因此,判断样本均数与总体均数差别的性质(即判断差别是抽样误差所致还是存在本质差别)需用假设检验。
二、医学统计资料中假设检验的基本步骤与方法
假设检验的方法很多,但其基本步骤是一致的。
首先,假设被比较的数据或指标均来自同一个总体(即假设其差别由抽样误差所致),这种假设称为无效假设或零假设;再根据原始资料计算由抽样误差引起差别的概率一值,如果P值≤0.05,则其差别有显著性;若P值>0.05,则其差别无显著性。选择假设检验方法应注意以下几点:第一,资料性质:不同性质的资料分析指标往往不同,如计量资料常做均数间的比较,可采用t检验或方差分析;计数资料常做率或构成比的比较,可采用u检验或X2检验;等级资料可采用秩和检验或Ridit分析。第二,资料分布类型:正态分布资料常用参数检验法,如t检验、u检验和方差分析等;偏态分布资料常用非参数检验法,如秩和检验、游程检验等。第三,两组或多组比较:在完全随机设计中,两样本均数比较常用t检验,多样本均数比较多用F检验,多样本均数的两两比较用q检验,两样本率的比较用u检验,多样本率的比较用X2(卡方)检验等。第四,单侧或双侧检验:临床上常对两药或两种疗法的有效率进行比较,若要判断两组总体率有无差别,应该用双侧检验;但对已明确甲组有效率不会低于乙组,而又要求判断甲组有效率是否高于乙组时,则应该用单侧检验。一般以采用双侧检验为宜。选用双侧还是单侧检验,在实验设计时即已确定,切不可先采用双侧检验,当结论无显著性时再改用单侧检验。
三、医学统计资料中假设检验需注意的事项
假设检验涉及的问题很多,主要应注意以下几点:第一,统计结论是有概率性的,不能绝对化。假设检验需要事先确定检验水准,检验水准不同,统计结论可能不同。当得出P<0.05或<0.01,差别有统计学意义时,不能认为其差别是绝对存在的,此时仍有5%或1%的假阳性率。同样,当得出P>0.05差别无统计学意义时,也不能认为其差别是肯定不存在的。第二,统计学上是否有统计学意义不代表指标问实际差别的大小。事实上,P值的大小,其与被比较的指标间的实际差别无内在联系。因此,不能将P<0.05认为是指标间差别大或有实用价值,或将P<0.01认为是指标间差别非常大或有极大实用价值。第三,多组比较时的显著性水准。在实际工作中,经常遇到对多组资料的比较,如多个均数的两两比较采用t检验,多个率的两两比较采用X2(卡方)检验,这都是错误的。其理由是:当有m个试验组共用一个对照组时,需进行m次假设检验;当有k个试验组进行任意两组比较时,则需进行m=k(k-1),2次假设检验。若每次假设检验以A=0.05为检验水准时,其假阳性错误可大大增加。因此,应采用适当的方法,使总的检验水准不超过预定的检验水准。