科研论文中误用t检验的典型案例分析
2013-04-19唐欣然王杨李卫
唐欣然,王杨,李卫
·学习园地·
科研论文中误用t检验的典型案例分析
唐欣然,王杨,李卫
t 检验
t检验使用较广,常用于评价两组间的基线均衡性和治疗有效性。t检验适用于服从正态分布的定量资料分析,若对两组均数进行比较,还要求两样本相互独立,并且满足组间方差齐性[1]。然而,不少研究者在未确定适用条件下,盲目的进行t检验,严重影响科研工作的科学性及论文的质量。我们将分析科研论文中误用t检验的典型案例。
例一:不考虑试验设计类型
某医院欲研究肾动脉形成术前后血流动力学改变,观察了10例患者手术前后舒张压的变化情况,见表1。
表1 手术前后舒张压变化情况(kPa)
该研究者用独立样本t检验得P>0.05,认为舒张压改变无统计学意义。然而,若用配对t检验得P<0.05,可认为手术前后患者舒张压改变有统计学意义。哪种结论是正确的呢?
分析该类数据时,应首先通过正态性检验证明资料服从正态分布,然后从以下两种方法中做选择:①若两组数据是同组受试者在不同时间点上被重复测量的同一个指标的数值,则两样本并不是相互独立的,应采用配对设计t检验。②若两组数据出自不同受试者,即为相互独立的样本,则应采用独立样本t检验。在该例中,两组数据均来自同一组患者,并不相互独立,因此,我们采用配对t检验得到的结论才是合理的。
例二:不满足正态性或方差齐性
某研究者欲比较肝炎组和无症状组患儿的巨细胞病毒抗体(CMVIgG)亚群值指标有无差异,见表2。
表2 巨细胞病毒抗体亚群值比较结果 (A 492nm)
研究者采用独立样本t检验比较两组患儿的抗CMVIgG 亚群值。但表2 中多个指标的标准差是均值的 2倍以上,此时资料不服从正态分布[2],且不同组间的标准差也相差悬殊,不满足方差齐性,不适合用t检验。此时应选用适合分析偏态分布资料的非参数检验,如秩和检验,或对数据进行对数变换,转换成正态分布数据后,再用t检验进行分析。
例三:进行多组间的比较
某研究者欲比较缺氧缺血性脑病(HIE)患儿(轻度、中度、重度)和健康新生儿心肌损伤标志物浓度。四组新生儿的心肌损伤标志物检测结果,见表3。
表3 心肌损伤标志物检测结果比较
研究者采用独立t检验进行多组的比较显然是不合理的,因为应用t检验进行多组间比较时,会使I类错误膨胀,导致得到假阳性结果的可能性增大。此时的阳性结果并不可信。
对于满足正态性和方差齐性条件多组比较,应采用多水平方差分析进行多组间均值的比较,如方差分析LSD、Tukey检验等。
根据以上典型案例可见,t检验并不是分析定量资料的“万能工具”。医学科研工作者在分析定量资料之前,必须首先考虑试验设计类型、资料的类型和资料的分布特征等因素,只有正确地辨析试验设计类型并检查资料所具备的前提条件,才有可能做到合理选用统计分析方法,从而有效地减少误用t检验的现象。
[1]孙振球.医学统计学 [M]. 第 2 版.北京:人民卫生出版社,2007:48-51.
[2]毛宗福,陈捷 . 临床论著中常见的统计分析缺陷 . 中华儿科杂志,1998,36:444-445.
2013-05-08)
(编辑:汪碧蓉)
100037 北京市,中国医学科学院 北京协和医学院 心血管病研究所 阜外心血管病医院 心血管疾病国家重点实验室
唐欣然 统计师 主要从事生物统计学研究 Email: tangxinran@mrbc-nccd.com 通讯作者:李卫 Email: Liwei@mrbc-nccd.com
R54
C
1000-3614(2013)03-0236-01
10.3969/j.issn.1000-3614.2013.03.022
本栏目由国家心血管病中心 医学研究统计中心协办