《如何在指南证据总结表和证据概要表中计算事件-时间结果的绝对效应值》文献解读
2021-03-27姚晓梅
姚晓梅
1 主要内容介绍
1.1 时间-事件计算绝对效应值的理论依据和方法 时间-事件结局在临床研究时常遇到,特别是在肿瘤学领域。对于癌症患者,最关注的结果之一是总生存期(OS)。无进展生存期(PFS)、无病生存期(DFS)和无事件生存期(EFS)也是经常被报道的结果,为OS提供了补充信息。此外,事件-时间分析可以描述除生存之外的结果,例如入院时间、输尿管结石排出时间、发生特定不良事件的时间。
时间-事件分析方法的一个显著特点是,纳入了因为各种原因离开研究的受试者在离开前的信息。为了比较不同干预对两组时间-事件结果的影响,如果通过Cox回归模型计算风险比(HR)及其置信区间作为相对效应值。然而,由于绝对效应值(即风险差异、需要治疗的病患数量)考虑了对照组中事件的潜在基线风险,因此绝对效应值的估计比相对效应值的估计更不容易受到夸大效应解释的影响[1]。
对于系统评价和医学指南的制作者来说,绝对效应值计算的方法可分为直接法和间接法。①直接法:某特定结局,个体受试者的数据可以从所有纳入的原始研究中获得,且风险差可从Meta分析中算出。②间接法:在应用汇总HR间接计算绝对效应值时,选择的基线风险率要适用于应用群体及其特征。间接计算绝对效应值的关键在于如何确定适当的对照组的基线风险率,主要方法有2种。第一种是使用外源基线风险率,在医学文献中找寻低偏倚风险的大型、有代表性的观察性研究,提供适当的基线风险率。第二种是使用该系统评价中纳入文献中对照组的基线风险率,建议选择低偏倚风险文献中的对照组。为了代表人群中的多个风险组,不论是使用外源的,还是使用该系统评价中低风险文献的对照组,都需要从临床角度考虑不同基线风险的人群分组(即高、中和低风险组)来计算干预组的绝对效应值。
在计算绝对效应值时,对照组的基线风险率确定时,一般仅考虑汇总HR的不确定性,而不考虑Kaplan-Meier曲线生存时间点和相应的基线风险率的不确定性。在某些情况下,基线风险率的不确定性可能会比较重要,甚至是总不确定性的来源之一[2],PropImp的方法有助于帮助估算绝对效应值[3],但先决条件是基线风险率的估计来自于Meta分析之外的文献提取数据,并且基线风险率和汇总HR有足够的点估计和置信区间可用。PropImp计算方法和MS Excel表格可参见文献[3]。在应用间接法获得对照组基线风险率时,基线风险的不确定性和相对效果有关,只有包括重新采样在内的复杂方法才能将对照组的基线风险率的不确定性考虑在内,以构建绝对效应值的有效置信区间[4]。然而,并非总要考虑对照组基线风险率的不确定性,如果其估计的标准误差较小,且汇总HR的标准误差不是总不确定性的主要来源,此时可忽略不计。特别是考虑不同基线风险的人群分组(即高、中和低风险组)来计算干预组的绝对效应值时,仅考虑汇总HR的不确定性就足够。
无论采用哪种方法,透明地报告基线风险率数据的来源非常重要[5],清楚地描述对照组的基线风险率来源和选择的时间结点(不是一段时间,不同时间结点会有很大差异),绝对效应值应在结果总结表和摘要中报告[6,7]。
1.2 举例 首先明确研究的结局事件是死亡还是无事件生存(存活),也就是说,在计算HR时明确分子与分母人群。比如在GRADEpro医学指南制作软件中[8],当选择结局为时间事件时,软件就会提供如下2个选择,即结局是事件还是无事件生存。
1.2.1 计算EFS的绝对效应值(例如,OS、PFS) 绝对效应值的计算基于Tierney等[1]描述的方法,即基于生存风险成比例的假设,并在此研究中始终保持一致。HR是在研究时间结点之前,任一时刻干预组与对照组中无事件患者风险的比例。其计算公式为:
例如,如果汇总HR为0.42(95%CI:0.25~0.72),表示死亡风险在干预组低于对照组。假设对照组患者无事件生存率在随访2年时为0.9,根据上述公式干预组患者无事件生存率为0.96(95%CI:0.93~0.97)。
1.2.2 计算事件生存期的绝对效应值(例如死亡率) 同样以上述汇总HR为0.42(95%CI:0.25~0.72)为例,表示死亡风险在干预组低于对照组。假设对照组患者死亡率在随访2年时为0.1,根据下述公式干预组患者死亡率为0.04(95%CI:0.03~0.07)。
r1=1-exp(ln(1-r0)×HR)=1-(1-r0)HR
1.2.3 图形演示 GRADEpro软件提供了在结果表格中以图像方式呈现系统评价中绝对效应值[8]。这种格式呈现了可视化的绝对效果量,以便于干预组与控制组的每个结局进行比较。
1.2.4 根据事件或无事件生存计算需要治疗的人数(NNT) NNT等于干预组和对照组之间风险差的倒数[9]。
对照组风险率-干预组风险率=风险差异[95%CI(对照组风险率-干预组风险率95%CI的上限;对照组风险率-干预组风险率95%CI的下限)]
例如,Ⅱ期肺癌患者2年死亡率在对照组为45/100,在干预组为41/100(95%CI:37/100~44/100),则两组的风险差异=45/100-41/100=4/100(95%CI:1/100~8/100),NNT=1/风险差异=25(95%CI:12.5~100)。这意味着25(95%CI:13~100)例Ⅱ期肺癌患者接受此干预治疗可避免1例患者在2年内死亡。
1.2.5 中位生存时间的计算 在应用HR计算中位(无事件)生存时间可能对患者、临床工作者和利益相关者的临床决策有意义。对照组达到中位生存时间意味着50%处于危险中的患者已经死亡。可以使用以下公式(基于MST0固定的假设),从对照组的中位生存时间(MST0)和汇总的HR中获得干预组的中位生存时间(MST1):
MST1=MST0/HR
例如,假设汇总HR为0.42(95%CI:0.25~0.72),对照组的中位生存时间为80个月,干预组的中位生存时间为190.5个月(95%CI:111.1~320)。
2 解读
时间事件结局以及生存分析在临床研究时常遇到,特别是在肿瘤研究方面,但并不仅限于肿瘤研究领域。凡是涉及到对特定事件在何时发生的问题,都可以通过时间事件结局来评估干预措施的疗效。例如发热患者何时退烧,消化道出血患者何时复发等。在这类原始研究文章中,通常报道两种结局,①在某一特定时间结点的干预组与对照组的生存率或死亡率及其HR(95%CI)或P值;②干预组和对照组分别达到50%死亡人数的时间及其HR(95%CI)或P值。HR与RR和OR相似,都是相对效应量值,对临床工作者和患者来说,从HR数值表面不能直观地判断出干预组与对照组在临床实践中的区别有多大。因此,从HR值转化为绝对效应值具有重要临床意义。从HR值计算绝对效应值时,需注意以下几点。
2.1 确定对照组基线风险率是关键 对于系统评价和医学指南的制作者来说,能够获得所有纳入文献的个体患者数据,从而直接计算绝对效应值是最佳选择。但是绝大多数情况下,会从纳入的文献中偏倚风险低的研究中选择特定时间结点的对照组基线风险率。如果对系统评价中纳入文献的对照组基线风险率的代表性不是十分有信心,可以在系统评价外进行文献检索,以寻找低偏倚风险的大型、有代表性的观察性研究中在特定时间结点的对照组基线风险率。同时考虑是否需要将患者按不同风险分成亚组(即分为高、中和低风险组)以计算干预组中相应的绝对效应值。在极少数情况下,如果确定或高度怀疑对照组基线风险率存在着不稳定性,PropImp统计学方法[3]可以用来帮助重新计算对照组基线风险率,然而根据提供的参考文献,其统计学方法是否适合于各种对照组基线风险率不稳的情况,有待进一步探讨。因此,如果遇到这种情况时,建议咨询有相关经验的统计学家。
值得强调的是,对照组基线风险率不是指对照组在开始研究时的风险率,而是研究结束时的风险率。例如治疗2年或者3年后的对照组风险率。
2.2 在系统评价计算汇总HR时,要注意纳入文献中计算HR时分子与分母的一致性 一般来说,原始研究计算HR时,在某一时间结点干预组的生存率或死亡率为分子,对照组的生存率或死亡率为分母。如果有些原始研究以对照组的生存率或死亡率为分子计算HR,则需要对其进行转换。例如,a情境:Ⅲ期卵巢癌患者手术治疗后免疫抑制剂维持治疗组与安慰剂维持治疗组相比较,2年后HR=0.90(95%CI:0.75~1.10)。b情境:患者手术治疗2年后安慰剂组与免疫抑制剂维持治疗组相比较,HR=0.97(95%CI:0.85~1.15)。b情境的HR转化为HR=1/0.97,其95%CI也要进行相应的转化,HR=1.03(95%CI:0.87~1.18),与a情景的HR值进行汇总。这与明确研究的结局是事件还是无事件生存不同,在同一个研究中,无论研究结局是事件还是无事件生存,只要分子与分母保持一致,即干预组为分子,对照组为分母,其HR值就是相同的。
2.3 不应该假设原始研究时间结点前和后的HR值可能保持一致 绝对效应值的估计值会因选择的时间点不同而有很大差异。在同一亚组人群中,患者接受治疗后3年的绝对效应值与5年后的绝对效应值是不同的。例如,如果系统评价的目的需要汇总HR在治疗2年后的结局,就不应该将1年后和2年后的HR结局进行汇总。报道HR在治疗1年后的原始研究只能假设HR在1年之内是不变的,而不能外推到2年后HR。可以将治疗3年后的HR结局的研究与治疗2年后的HR的研究进行汇总,作为治疗2年后的HR结局的评估,因为治疗3年后的HR结局的研究的假设是在治疗3年之内任何时间结点的HR都是一样的。
2.4 很多情况下中位生存时间的计算方法不能直观地反映两组治疗效果的不同 例如,在非小细胞肺癌Ⅲ期临床试验中,干预组与对照组的PFS的生存中位时间分别为12.3和11.1周,两组相差约8 d,然而HR=0.71(95%CI:0.62~0.82;P<0.000 1)[10],根据研究提供的数据,计算绝对效应值。绝对效应值更直接地反映两组治疗效果的不同。虽然有些作者在原文及摘要中只报告了中位生存时间及HR,但是在Kaplan-Meier曲线图表中经常呈现出有价值的数据,给出时间结点的生存率等,可以根据这些数据及HR计算出绝对效应值。例如报告了两组的中位生存时间(22.1和16.6个月)及HR=0.33(95%CI:0.25~0.45),但在Kaplan-Meier曲线图表中报告了干预组与对照组在治疗2年后无进展生存率分别为46%与28%[11]。
2.5 计算绝对效应值的另外一个益处在GRADE guidelines27文章中未提及 绝对效应值的计算有助于决策判断。在医学指南的制作过程中,制定推荐意见时需要考量多方向因素设置干预措施的阈值。干预组的绝对效应值及其95%CI是否跨过预先设定的阈值,直接影响对现有证据质量的评估和推荐意见强弱的判断。
3 讨论和展望
从系统评价和医学指南制作者的角度,在报告时间事件结局的研究中,绝对效应量较相对效应值更重要。绝对效应值的计算为系统评价及医学指南制作者在证据体质量评价过程中准确性领域的评估以及制定推荐意见时,如何判断患者结局的效应值与事先设定的有效阈值之间的关系提供了有价值的依据。在时间事件结局的Meta分析和证据主体的确定性分级方面还有许多未解决的问题。①含有删减机制的证据的确定性即删减并非独立于导致潜在偏倚风险的结局,可见文献[12]。②治疗转换现象在癌症试验中很常见,如何在治疗转换的情况下对证据的确定性进行分级将在以后GRADE文章中探讨。③在存在竞争风险事件的环境中,有时会进行Kaplan-Meier生存分析,这可能会高估潜在干预治疗效果[13]。④在生存风险成比例的假设无效的情况下,可以使用HR的替代结局,例如组间受限平均生存时间的差异[14]。此时,系统评价和医学指南制作者仍可根据纳入的原始研究所提供的数据及信息,进行适当的风险偏倚评估和数据分析。