APP下载

临床试验解读常见误区

2017-12-21李静

中国循环杂志 2017年12期
关键词:危险度亚组临床试验

李静

临床研究系列讲座

临床试验解读常见误区

李静

正确解读临床试验结果是临床合理决策的重要基础。作为疗效与安全性评价的金标准,随机对照临床试验在临床实践中发挥的作用日益广泛。个体化医疗要求医生根据具体患者的特征情况,以及已有的循证医学证据(最主要的是临床试验的结果),做出合理的治疗决策。临床医生在解读临床试验结果时有三个常见误区。一是混淆相对危险度和绝对危险度这两个概念;二是用亚组分析的结果指导临床实践;三是把大规模临床试验和新药注册试验这两组试验混为一谈。在此,简单阐述针对这三个误区,所对应的概念原则。

1 相对危险度和绝对危险度

临床试验结果通常有两种表现形式:一是事件曲线或生存曲线,反映组间绝对危险度差异;二是森林图,反映组间相对危险度差异。以PLATO[1]研究结果为例,图1是事件曲线,比较直观,横坐标是随访时间长,纵坐标是累计发生的事件数量。氯吡格雷组1年事件发生率为11.7%,替格瑞洛组1年事件发生率为9.8%。因此,替格瑞洛与氯吡格雷相比,事件率减少1.9%,也就是绝对危险度下降1.9%。图2是森林图,中间的竖线对应横轴尺度为1,称为无效线。每个组别的危险比(hazard ratio, HR或risk ratio, RR)都是用一个方块加一条横穿方块的横线表示。方块中心点所对应的横轴坐标就是HR的点估计值,横线的左右两端对应的横轴坐标分别是HR的95%可信区间(confidence interval, CI)的下限和上限。因此横线长短直观地表示可信区间的范围大小。方块大小反映样本量的大小。汇总的结果用菱形块来表示,菱形块中心点所对应的横轴坐标就是HR的点估计值,菱形块的左右两端对应的横轴坐标分别是HR的95%可信区间的下限和上限。HR值是治疗组的事件率比上对照组的事件率,因此,当HR<1时,表示治疗组事件发生风险小于对照组,可以认为治疗组疗效更好。反之,当HR>1时,认为对照组疗效更好。但只有当横线不与无效线相交时,也就是HR的95% CI不跨越1时,才认为两组的差异具有统计学意义,也就是我们通常说的P值<0.05。PLATO[1]研究中,HR值是9.8%比11.7%,等于0.84,就意味着治疗组与对照组相比,事件风险下降16%,即1~0.84。16%就是相对危险度的下降幅度。

通常临床试验的结论讲到某治疗与对照相比,是终点事件风险降低或升高百分之多少,都是指的相对危险度的降低或升高。相对危险度反映的是治疗组与对照组之间的差异的相对大小,而非绝对大小。而临床医生最关心的还是两组间绝对差异有多大。因此,临床试验结果报告时,通常会用更直观的方式报告绝对危险度。例如每治疗1000例患者,可以减少多少例事件,或者每减少1例事件,需要治疗多少例患者。以PLATO[1]研究结果为例,绝对危险度下降1.9%,就意味着每治疗1000例患者,约可以减少19例事件,或者每减少1例事件,约需要治疗53例患者。

图1 替格瑞洛与氯吡格雷疗效比较生存曲线[1]

图2 替格瑞洛与氯吡格雷疗效比较森林图[1]

2 亚组分析的结果不是结论性的,不能直接指导临床实践

很多医生会根据亚组分析的结果决定是否采用某种治疗。这是一个很大的误区。实际上,亚组分析的结果只是探索性的,并不是可靠的证据,不能依据其进行临床决策。在阅读临床试验研究结果时,我们可能会碰到以下情况:总研究结果无效,但对某些亚组患者有效;或者反之,总研究结果有效,但对某些亚组患者无效。这种情况并不能确切证明特定亚组的患者与其他组别的不同。

为了证明亚组分析不可靠,容易受到偶然误差的影响,牛津大学的研究者曾经做过一个非常特别的亚组分析。他们对著名的ISIS-2[2]研究进行亚组分析。ISIS-2证实了阿司匹林能够显著降低急性心肌梗死患者的1个月内死亡率。研究者按照星座把受试者分到12个亚组。结果显示在天秤座或双子座中,阿司匹林组和对照组的死亡率分别为11.1%和10.2%,差异无统计学意义(表1)。大家一定不会相信星座与人的生理病理及药物代谢反应机制有关,从而影响阿司匹林的疗效。但如果是按照性别、年龄、病史等常见因素分组,大家通常就不会怀疑结果的可靠性。其实道理是一样的,无论根据何种因素,亚组分析都不可靠,容易受到偶然误差的影响,得出错误结论。

表1 ISIS-2研究星座亚组分析结果

为什么这样说呢?从统计学而言,通常假设检验设定P<0.05,是说明得出错误结论的概率<5%,由于这个概率很小,我们就认为这样的情况不大可能发生。尽管每一次犯错误的概率都很小,但分析做得越多,错误结果的累加数量就会越多。如果研究者带有某种倾向性,很容易从大量分析中找出一些符合这种倾向性的结果。亚组分析做得越多,由于偶然误差得到错误结果的可能性就越大。

这个例子非常清楚地显示,即使在ISIS-2这样样本量超过17 000例的大型研究中,亚组分析的结果也未必反映真实的效果。因此,在指导临床实践时,一定要以研究总结果为准,而亚组分析结果是探索性的,可为进一步研究提供线索,但切不可将它当作明确的结论。亚组的设定不宜过多,且须在研究设计阶段确定,并在临床试验注册信息中清楚报告。

3 以临床结局为评价终点的临床试验和新药注册临床试验

新药上市之前须完成临床试验。这种为满足法规的要求而开展的试验被称为注册临床试验。注册临床试验的首要目标是能够让药物尽快上市,往往只是满足法规的最低要求。在重要学术期刊上发表的临床试验很多是以回答科学问题为驱动而开展的,其中产生最重要影响的就是以临床结局为评价终点的临床试验。这两类临床试验的研究目的、规模以及影响力等方面都存在较大的差别,总结见表2,不应混为一谈。

表2 替代终点研究和临床结局终点研究比较

[1] Wallentin L, Becker RC, Budaj A, et al. Ticagrelor versus clopidogrel in patients with acute coronary syndromes. N Engl J Med, 2009, 361:1045-1057.

[2] Collins R, MacMahon S. Reliable assessment of the effects of treatment on mortality and major morbidity, I: clinical trials. Lancet, 2001, 357:373-380.

100037 北京市,中国医学科学院 北京协和医学院 国家心血管病中心 国家心血管疾病临床医学研究中心 心血管疾病国家重点实验室中国牛津国际医学研究中心

李静 教授 博士研究生导师 主要从事心血管领域大规模随机对照临床试验和医疗结果评价研究 Email:jing.li@fwoxford.org

R54

C

1000-3614(2017)12-1235-02

10.3969/j.issn.1000-3614.2017.12.024

2017-10-16)

(编辑:宁田海)

猜你喜欢

危险度亚组临床试验
胃间质瘤超声双重造影的时间-强度曲线与病理危险度分级的相关性研究
美国特战司令部参与抗衰药临床试验 合成一百余种新型NAD+增强剂
如何正确运用χ2检验——高维表资料相对危险度分析与SAS实现
品管圈在持续改进医疗器械临床试验全周期质量控制中的应用
参加临床试验,也要“顺道”
艾灸神阙穴对不同程度力竭运动大鼠海马区单胺类神经递质的影响❋
冠心病患者肠道菌群变化的研究 (正文见第45 页)
做事如做药
不同年龄阿尔茨海默病患者脑核团ADC值与年龄的相关性
胃肠道间质瘤的MRI征象与不同危险度的相关性