常见χ2检验误用案例解析
2013-11-16陈利王杨李卫
陈利,王杨,李卫
在分析定性资料时, χ2检验是一种常用的统计方法。χ2检验多用于比较两个及两个以上样本的率(构成比)或两个分类变量的关联性分析,如比较两种药物治疗的有效率,比较两种诊断试剂的灵敏度和特异度等。χ2检验用途虽广,但并非所有定性资料都可选用χ2检验,而且不同的研究目的计算χ2值的公式也不完全相同。若不考虑资料类型、使用条件和检验目的而盲目套用χ2公式就会有统计学错误,甚至得到相反结论。本文通过分析常见χ2检验误用实例,来说明如何正确使用χ2检验。
1 未正确判断资料类型
例1:某医院有疑似心肌梗死病例112人,现通过甲、乙两种方法对同一份血清标本的心肌酶进行检测判断是否为心肌梗死,结果如表1,比较两种检测方法的阳性率有无差别?[1]
表1 甲乙两种方法测定结果比较
研究者用独立样本χ2检验进行分析,得P>0.05。结论为两种检测方法的阳性率差异无统计学意义。
解析:分析定性资料前,首先应明确资料是独立样本还是配对样本。若为同一样本一分为二分别接受两种检验,即为配对设计的列联表资料,应选择配对设计的χ2检验;若为两组不同的样本分别接受处理,则为独立列联表资料,此时可用独立样本χ2检验。
本例为配对设计资料,分析配对设计比较两样本率有无差异时应选用配对设计两样本率比较的McNemanr 检验,但应注意当b+c<40时,须计算校正的χ2值[2]。例中b+c=30<40,所以应选用校正公式进行分析。计算得χ2=5.633,P=0.018,结论为两种方法检测的阳性率差异有统计学意义。
2 未考虑卡方检验的适用条件
例2:某研究欲比较两种治疗方法的病死率。将43例急性心肌梗死患者分为复方丹参注射液治疗组和非复方丹参注射液治疗组。治疗后24小时死亡情况见表2。[3]
表2 急性心肌梗死患者治疗后24小时死亡情况
研究者选用一般χ2检验,得χ2=4.329,P<0.05。认为两组病死率差异有统计学意义。
解析:对于可用χ2检验分析的资料,首先应对资料进行检验,然后选择合适的分析方法:①当总样本量n≥40且所有格子的理论频数T≥5时,选择四格表χ2;②当总样本量n≥40且所有格子的理论频数满足1≤T<5时,选择校正的四格表χ2;③当总样本量n<40或T<1时,应选择Fisher确切检验。
经分析,该资料满足条件(2),故应选择校正的四格表χ2公式。计算得χ2=2.938,P>0.05。结论为两组病死率差异无统计学意义。
3 误用于结局指标为有序变量的资料分析
例3:某医院为研究阿托伐他汀与辛伐他汀降血脂的疗效。将223例高血脂患者分为阿托伐他汀治疗组和辛伐他汀治疗组。治疗4周后疗效见表3。
表3 高血脂患者治疗4周后疗效(例)
研究者用χ2检验计算得χ2=6.69,P>0.1。认为两种药物降血脂效果差异无统计学意义。
解析:资料中组别(分组变量)是二分类变量,疗效(结局变量)为有序变量,因此属单向有序列联表资料(结局变量有序)。因χ2检验不考虑结局变量的有序性,得到的结论只能说明两组病人在5个疗效等级上的频数分布是否有差异,而不能说明两组的疗效是否有差异。
因此资料应选用适合单向有序列联表资料(结局变量有序)的分析方法,如Wilcoxon秩和检验。计算得Uc=2.49,0.01<P<0.02,。结论为两种药物降血脂的疗效差异有统计学意义。
根据上述案例分析可知, χ2检验并非适用于所有定性资料的分析,临床研究中,应充分考虑资料类型及分析目的,以选择合理的分析方法。
[1] 李明,贾秀琴,陈嫚茵,等. 医学研究中定性资料假设检验方法误用分析 . 深圳中西医结合杂志 , 2007, 17: 95-97.
[2] 潘兴仪 . 卡方检验在医学科研中的应用 . 广西医学 , 2001, 23: 1396-1401.
[3] 方积乾主编 . 卫生统计学 . 第 6 版 . 北京 : 人民卫生出版社 , 2007. 161.