如何正确运用χ2检验——高维表资料相对危险度分析与SAS实现
2021-07-20胡纯严胡良平
胡纯严 ,胡良平 ,2*
(1.军事科学院研究生院,北京 100850;2.世界中医药学会联合会临床科研统计学专业委员会,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
为了分析来自队列研究设计的g×2×2表资料,需要完成以下3项主要任务:其一,检验各层2×2表资料相对危险度是否满足齐性;其二,当资料满足齐性要求时,估计共同相对危险度及其95%置信区间;其三,当资料不满足齐性要求时,估计共同相对危险度及其95%置信区间。本文将首先介绍有关的计算方法,然后,结合实例并基于SAS软件完成前述提及的3项主要任务。
1 高维表资料共同相对危险度分析的概念
1.1 高维表g×2×2表的表达模式
设高维表g×2×2表的表达模式如下,见表1。
表1 队列研究设计下g×2×2表的第h层2×2表资料的表达模式
1.2 高维表资料共同相对危险度的含义
在分析“队列研究设计”的二维表资料时,可以很方便地依据公式“RR=a(c+d)/c(a+b)”计算出相对危险度RR的数值。然而,面对“g×2×2表资料”,却无法直接计算出RR的数值。从概念上来说,似乎可以采取某种举措,将“g×2×2表资料”降维或压缩成一个“2×2表资料”。但事实上,这种理想的“2×2表资料”是无法直接呈现出来的。于是,统计学家通过统计学方法来体现出各层“2×2表资料”之间的“微小差别”,这就是求出各层“2×2表资料”的“权重系数wh”。通过它将各层“2×2表资料”进行加权平均,从而间接获得合并后的相对危险度RR的数值。在SAS/STAT的FREQ过程中,将“合并后的结果”称为“common relative risk[1]”,常译成“共同或普通或合并相对危险度(以下统称为‘共同相对危险度’)”。
【说明】基于“g×2×2表资料”估计共同相对危险度的前提条件是高维表资料应满足齐性。针对“相对危险度”的齐性检验(也称为异质性检验)的具体方法参见本期“科研方法专题”中的《如何正确运用χ2检验——高维表资料齐性检验与SAS实现》,此处从略。
1.3 SAS中FREQ过程估计共同相对危险度及其置信区间的方法概述
SAS/STAT中的FREQ过程[1]采用2种方法估计校正的共同相对危险度及其置信区间,它们分别是:①校正的计算方法,Mantel-Haenszel估计法;②校正的计算方法,logit估计法。严格地说,这两种方法仅适用于“资料满足齐性要求”的场合。
2 高维表资料相对危险度分析及SAS实现
2.1 高维表资料相对危险度分析的具体算法
2.1.1 高维表资料相对危险度分析的具体内容
高维表资料相对危险度分析的具体内容包括以下4项:其一,检验资料是否满足齐性要求;其二,估计共同相对危险度;其三,估计共同相对危险度的置信区间;其四,检验共同相对危险度是否等于1。其中,第4项任务可以通过第3项任务间接完成。也就是说,当置信区间不包含1时,就等于接受“H1:共同相对危险度RR≠1”这个备择假设。
2.1.2 高维表资料共同相对危险度的点估计及置信区间估计
2.1.2.1 Mantel-Haenszel估计量
基于Mantel-Haenszel估计量(简称MH估计量)估计高维表资料共同相对危险度[1],见式(1):
2.1.2.2 Logit估计量
式(6)中分母的定义由式(3)给出。
如果nh11或nh21为 0,在计算RRh和wh之前,需要给第h层的2×2表所有格加上0.5。
2.1.3 高维表资料共同相对危险度是否等于1的检验
2.1.3.1 概述
文献[3-4]介绍了高维表资料共同相对危险度是否等于1的检验方法。根据资料齐性检验结果,可采用“Z检验(满足齐性)”和“χ2检验(不满足齐性)”两种方法。
2.1.3.2Z检验
当g×2×2表资料满足齐性时,高维表资料共同相对危险度是否等于1的检验可采用以下Z检验(即基于固定效应模型推导出的公式),见式(7):
在式(7)中,Z为服从N(0,1)的标准正态分布的检验统计量。其中,分子与分母中的部分统计量分别见下式:
式(10)中分子与分母的部分统计量分别见下式:
2.1.3.3χ2检验
当g×2×2表资料不满足齐性时,高维表资料共同相对危险度是否等于1的检验可采用下面的χ2检验[基于随机效应模型推导出的公式,即基于DerSimonian-Laird法(简称DL法)],见式(14):
在式(14)中,χ2为服从自由度为df=1的χ2分布的检验统计量;分子与分母中的部分统计量分别见下式:
在式(16)中,τ2的定义见下式:
在式(17)中,Q为齐性检验的检验统计量;q为高维表的层数。
RRDL的 100(1-α/2)%置信区间计算方法见下式:
2.2 高维表资料共同相对危险度分析的SAS实现
2.2.1 问题与数据
【例1】文献[5]提供了如下资料,试对7项研究的共同相对危险度进行分析。见表2。
表2 阿司匹林预防心肌梗死后患者死亡与否的7项随机对照研究结果
【例2】文献[6]提供了如下资料,试对13项研究的共同相对危险度进行分析。见表3。
表3 BCG疫苗与对照疫苗预防结核病疗效的随机对照研究结果
2.2.2 对例1资料共同相对危险度分析的SAS实现
【例3】沿用例1中的“问题与数据”,试对7项研究的共同相对危险度进行分析。
【分析与解答】设所需要的SAS程序如下:
【SAS输出结果及解释】
以上输出的是“普通优比和相对风险”的计算结果,其中,“普通”也叫做“共同或合并”。实际上,就是基于“Mantel-Haenszel法”和“logit法”计算出来的校正“共同相对危险度”的估计值及其95%置信区间。在本例中,应看“相对风险(第1列)”的两种方法计算的结果(因为第1列上的结果为“死亡”,是研究者特别关注的结局)。RRMH=0.9143,其95%置信区间为[0.8664,0.9649];RRL=0.9145,其95%置信区间为[0.8665,0.9651]。
以上是基于“优比的齐性检验”结果,可作为基于“相对危险度的齐性检验”结果的参考。结果显示:资料满足齐性要求。
【统计与专业结论】在本例中,因95%置信区间不包含1,说明共同相对危险度与1之间的差别具有统计学意义。由于RR=0.9145<1,说明阿司匹林组的死亡率低于安慰剂组的死亡率。也就是说,相对于采用安慰剂而言,采用阿司匹林预防心肌梗死可明显降低心肌梗死患者的死亡率。
2.2.3 对例2资料共同相对危险度分析的SAS实现
2.2.3.1 基于固定效应模型推导出公式进行计算
【例4】沿用例2中的“问题与数据”,试对13项研究的共同相对危险度进行分析。
【分析与解答】设所需要的SAS程序如下:
【说明】因FREQ过程只能基于“优比OR”进行齐性检验,且检验结果显示此资料不满足齐性,可将其视为基于“相对危险度RR”的齐性检验的近似结果,说明由此SAS程序输出的关于“共同相对危险度”的点估计及其置信区间估计结果不可用,故此处不呈现SAS输出结果。
2.2.3.2 基于随机效应模型推导出公式进行计算
【例5】沿用例2的“问题与资料”,重新对13项研究的共同相对危险度进行分析。
【分析与解答】因SAS/STAT的FREQ过程不能直接对各层2×2表资料的“相对危险度”进行齐性检验,而且,在资料不满足齐性的条件下,也没有基于随机效应模型推导出公式来估计“共同相对危险度及其置信区间”,故需要改用SAS语言编程来间接实现[7]。
采用SAS语言编程所需要的程序语句较多,因篇幅所限,此处从略,读者只需要对文献[7]P392-394上的SAS程序略加修改即可。
【SAS输出结果及解释】
以上分别为满足齐性条件下MH方法计算的结果、满足齐性条件下logit方法计算的结果和不满足齐性条件下DL方法计算的结果。输出的结果中各项含义如下:
齐性检验结果:各层2×2表资料的“相对危险度齐性检验”结果为:Q=152.229,df=12,P<0.0001,表明该资料不满足齐性;I2=92.12%>50.00%,此统计量也表明资料不满足齐性。
满足齐性条件下的分析结果之一:基于MH法估计共同相对危险度RRMH及其95%置信区间分别为:RRMH=0.63528,[0.58814,0.68619]。注意:本例资料不满足齐性要求,故不适合保留这部分计算结果。
满足齐性条件下的分析结果之二:基于logit法估计共同相对危险度RRL及其95%置信区间分别为:RRL=0.65033,[0.60070,0.70405]。注意:本例资料不满足齐性要求,故不适合保留这部分计算结果。
不满足齐性条件下的分析结果:基于DL法估计共同相对危险度RRDL及其95%置信区间分别为:RRDL=0.48966,[0.34495,0.69508]。注意:本例资料不满足齐性要求,故可以基于这部分计算结果来下统计结论和专业结论。
【统计结论与专业结论】因RRDL=0.48966<1,并且,95%置信区间[0.34495,0.69508]不包含1,说明共同相对危险度与1之间的差别具有统计学意义。结合题目中的临床问题可知,BCG疫苗的死亡率低于对照疫苗的死亡率。
3 讨论与小结
3.1 讨论
在SAS/STAT的FREQ过程中,只给出了针对“优比”的齐性检验,未给出针对“相对危险度”的齐性检验(一般来说,对同一个资料而言,前述提及的两种齐性检验结果基本接近,故在要求不高的前提下,可以将“优比的齐性检验结果”作为“相对危险度的齐性检验结果”的近似解);当资料满足齐性时,SAS给出了基于“MH法”与“logit法”校正的共同相对危险度及其置信区间的估计(等价于“基于固定效应模型进行Meta分析”的结果);而当资料不满足齐性时,SAS未给出基于“DL法”的共同相对危险度及其置信区间的估计(这就是所谓的“基于随机效应模型进行Meta分析”的结果)。解决的办法有两种,其一,基于相应的公式和 SAS 语言编程[1,7]实现计算;其二,使用专门用于Meta分析的RevMan软件[6,8-9]实现计算。
3.2 小结
本文对g×2×2表资料进行了相对危险度分析,其内容包括“针对相对危险度的齐性检验”,资料满足齐性条件和不满足齐性条件下的“共同相对危险度的点估计和区间估计”;还介绍了资料满足与不满足齐性条件下的“共同相对危险度是否等于1的假设检验方法”。通过两个实例并基于SAS软件实现了相对危险度分析,并对SAS输出结果进行了解释,做出了统计结论和专业结论。