如何正确运用χ2检验——高维表资料相对危险度分析与SAS实现<br/>

如何正确运用χ2检验——高维表资料相对危险度分析与SAS实现

2021-07-20胡纯严胡良平

四川精神卫生 2021年3期

胡纯严，胡良平，2*

（1.军事科学院研究生院，北京 100850；2.世界中医药学会联合会临床科研统计学专业委员会，北京 100029*通信作者：胡良平，E-mail：lphu927@163.com）

为了分析来自队列研究设计的g×2×2表资料，需要完成以下3项主要任务：其一，检验各层2×2表资料相对危险度是否满足齐性；其二，当资料满足齐性要求时，估计共同相对危险度及其95%置信区间；其三，当资料不满足齐性要求时，估计共同相对危险度及其95%置信区间。本文将首先介绍有关的计算方法，然后，结合实例并基于SAS软件完成前述提及的3项主要任务。

1 高维表资料共同相对危险度分析的概念

1.1 高维表g×2×2表的表达模式

设高维表g×2×2表的表达模式如下，见表1。

表1 队列研究设计下g×2×2表的第h层2×2表资料的表达模式

1.2 高维表资料共同相对危险度的含义

在分析“队列研究设计”的二维表资料时，可以很方便地依据公式“RR=a（c+d）/c（a+b）”计算出相对危险度RR的数值。然而，面对“g×2×2表资料”，却无法直接计算出RR的数值。从概念上来说，似乎可以采取某种举措，将“g×2×2表资料”降维或压缩成一个“2×2表资料”。但事实上，这种理想的“2×2表资料”是无法直接呈现出来的。于是，统计学家通过统计学方法来体现出各层“2×2表资料”之间的“微小差别”，这就是求出各层“2×2表资料”的“权重系数wh”。通过它将各层“2×2表资料”进行加权平均，从而间接获得合并后的相对危险度RR的数值。在SAS/STAT的FREQ过程中，将“合并后的结果”称为“common relative risk［1］”，常译成“共同或普通或合并相对危险度（以下统称为‘共同相对危险度’）”。

【说明】基于“g×2×2表资料”估计共同相对危险度的前提条件是高维表资料应满足齐性。针对“相对危险度”的齐性检验（也称为异质性检验）的具体方法参见本期“科研方法专题”中的《如何正确运用χ2检验——高维表资料齐性检验与SAS实现》，此处从略。

1.3 SAS中FREQ过程估计共同相对危险度及其置信区间的方法概述

SAS/STAT中的FREQ过程［1］采用2种方法估计校正的共同相对危险度及其置信区间，它们分别是：①校正的计算方法，Mantel-Haenszel估计法；②校正的计算方法，logit估计法。严格地说，这两种方法仅适用于“资料满足齐性要求”的场合。

2 高维表资料相对危险度分析及SAS实现

2.1 高维表资料相对危险度分析的具体算法

2.1.1 高维表资料相对危险度分析的具体内容

高维表资料相对危险度分析的具体内容包括以下4项：其一，检验资料是否满足齐性要求；其二，估计共同相对危险度；其三，估计共同相对危险度的置信区间；其四，检验共同相对危险度是否等于1。其中，第4项任务可以通过第3项任务间接完成。也就是说，当置信区间不包含1时，就等于接受“H1：共同相对危险度RR≠1”这个备择假设。

2.1.2 高维表资料共同相对危险度的点估计及置信区间估计

2.1.2.1 Mantel-Haenszel估计量

基于Mantel-Haenszel估计量（简称MH估计量）估计高维表资料共同相对危险度［1］，见式（1）：

2.1.2.2 Logit估计量

式（6）中分母的定义由式（3）给出。

如果nh11或nh21为 0，在计算RRh和wh之前，需要给第h层的2×2表所有格加上0.5。

2.1.3 高维表资料共同相对危险度是否等于1的检验

2.1.3.1 概述

文献［3-4］介绍了高维表资料共同相对危险度是否等于1的检验方法。根据资料齐性检验结果，可采用“Z检验（满足齐性）”和“χ2检验（不满足齐性）”两种方法。

2.1.3.2Z检验

当g×2×2表资料满足齐性时，高维表资料共同相对危险度是否等于1的检验可采用以下Z检验（即基于固定效应模型推导出的公式），见式（7）：

在式（7）中，Z为服从N（0，1）的标准正态分布的检验统计量。其中，分子与分母中的部分统计量分别见下式：

式（10）中分子与分母的部分统计量分别见下式：

2.1.3.3χ2检验

当g×2×2表资料不满足齐性时，高维表资料共同相对危险度是否等于1的检验可采用下面的χ2检验［基于随机效应模型推导出的公式，即基于DerSimonian-Laird法（简称DL法）］，见式（14）：

在式（14）中，χ2为服从自由度为df=1的χ2分布的检验统计量；分子与分母中的部分统计量分别见下式：

在式（16）中，τ2的定义见下式：

在式（17）中，Q为齐性检验的检验统计量；q为高维表的层数。

RRDL的 100（1-α/2）%置信区间计算方法见下式：

2.2 高维表资料共同相对危险度分析的SAS实现

2.2.1 问题与数据

【例1】文献［5］提供了如下资料，试对7项研究的共同相对危险度进行分析。见表2。

表2 阿司匹林预防心肌梗死后患者死亡与否的7项随机对照研究结果

【例2】文献［6］提供了如下资料，试对13项研究的共同相对危险度进行分析。见表3。

表3 BCG疫苗与对照疫苗预防结核病疗效的随机对照研究结果

2.2.2 对例1资料共同相对危险度分析的SAS实现

【例3】沿用例1中的“问题与数据”，试对7项研究的共同相对危险度进行分析。

【分析与解答】设所需要的SAS程序如下：

【SAS输出结果及解释】

以上输出的是“普通优比和相对风险”的计算结果，其中，“普通”也叫做“共同或合并”。实际上，就是基于“Mantel-Haenszel法”和“logit法”计算出来的校正“共同相对危险度”的估计值及其95%置信区间。在本例中，应看“相对风险（第1列）”的两种方法计算的结果（因为第1列上的结果为“死亡”，是研究者特别关注的结局）。RRMH=0.9143，其95%置信区间为［0.8664，0.9649］；RRL=0.9145，其95%置信区间为［0.8665，0.9651］。

以上是基于“优比的齐性检验”结果，可作为基于“相对危险度的齐性检验”结果的参考。结果显示：资料满足齐性要求。

【统计与专业结论】在本例中，因95%置信区间不包含1，说明共同相对危险度与1之间的差别具有统计学意义。由于RR=0.9145＜1，说明阿司匹林组的死亡率低于安慰剂组的死亡率。也就是说，相对于采用安慰剂而言，采用阿司匹林预防心肌梗死可明显降低心肌梗死患者的死亡率。

2.2.3 对例2资料共同相对危险度分析的SAS实现

2.2.3.1 基于固定效应模型推导出公式进行计算

【例4】沿用例2中的“问题与数据”，试对13项研究的共同相对危险度进行分析。

【分析与解答】设所需要的SAS程序如下：

【说明】因FREQ过程只能基于“优比OR”进行齐性检验，且检验结果显示此资料不满足齐性，可将其视为基于“相对危险度RR”的齐性检验的近似结果，说明由此SAS程序输出的关于“共同相对危险度”的点估计及其置信区间估计结果不可用，故此处不呈现SAS输出结果。

2.2.3.2 基于随机效应模型推导出公式进行计算

【例5】沿用例2的“问题与资料”，重新对13项研究的共同相对危险度进行分析。

【分析与解答】因SAS/STAT的FREQ过程不能直接对各层2×2表资料的“相对危险度”进行齐性检验，而且，在资料不满足齐性的条件下，也没有基于随机效应模型推导出公式来估计“共同相对危险度及其置信区间”，故需要改用SAS语言编程来间接实现［7］。

采用SAS语言编程所需要的程序语句较多，因篇幅所限，此处从略，读者只需要对文献［7］P392-394上的SAS程序略加修改即可。

【SAS输出结果及解释】

以上分别为满足齐性条件下MH方法计算的结果、满足齐性条件下logit方法计算的结果和不满足齐性条件下DL方法计算的结果。输出的结果中各项含义如下：

齐性检验结果：各层2×2表资料的“相对危险度齐性检验”结果为：Q=152.229，df=12，P＜0.0001，表明该资料不满足齐性；I2=92.12%＞50.00%，此统计量也表明资料不满足齐性。

满足齐性条件下的分析结果之一：基于MH法估计共同相对危险度RRMH及其95%置信区间分别为：RRMH=0.63528，［0.58814，0.68619］。注意：本例资料不满足齐性要求，故不适合保留这部分计算结果。

满足齐性条件下的分析结果之二：基于logit法估计共同相对危险度RRL及其95%置信区间分别为：RRL=0.65033，［0.60070，0.70405］。注意：本例资料不满足齐性要求，故不适合保留这部分计算结果。

不满足齐性条件下的分析结果：基于DL法估计共同相对危险度RRDL及其95%置信区间分别为：RRDL=0.48966，［0.34495，0.69508］。注意：本例资料不满足齐性要求，故可以基于这部分计算结果来下统计结论和专业结论。

【统计结论与专业结论】因RRDL=0.48966＜1，并且，95%置信区间［0.34495，0.69508］不包含1，说明共同相对危险度与1之间的差别具有统计学意义。结合题目中的临床问题可知，BCG疫苗的死亡率低于对照疫苗的死亡率。

3 讨论与小结

3.1 讨论

在SAS/STAT的FREQ过程中，只给出了针对“优比”的齐性检验，未给出针对“相对危险度”的齐性检验（一般来说，对同一个资料而言，前述提及的两种齐性检验结果基本接近，故在要求不高的前提下，可以将“优比的齐性检验结果”作为“相对危险度的齐性检验结果”的近似解）；当资料满足齐性时，SAS给出了基于“MH法”与“logit法”校正的共同相对危险度及其置信区间的估计（等价于“基于固定效应模型进行Meta分析”的结果）；而当资料不满足齐性时，SAS未给出基于“DL法”的共同相对危险度及其置信区间的估计（这就是所谓的“基于随机效应模型进行Meta分析”的结果）。解决的办法有两种，其一，基于相应的公式和 SAS 语言编程［1，7］实现计算；其二，使用专门用于Meta分析的RevMan软件［6，8-9］实现计算。

3.2 小结

本文对g×2×2表资料进行了相对危险度分析，其内容包括“针对相对危险度的齐性检验”，资料满足齐性条件和不满足齐性条件下的“共同相对危险度的点估计和区间估计”；还介绍了资料满足与不满足齐性条件下的“共同相对危险度是否等于1的假设检验方法”。通过两个实例并基于SAS软件实现了相对危险度分析，并对SAS输出结果进行了解释，做出了统计结论和专业结论。