APP下载

医疗器械临床试验贝叶斯统计应用指导原则简介*

2015-03-09南京医科大学公共卫生学院流行病与卫生统计学系210029刘丽亚

中国卫生统计 2015年1期
关键词:先验贝叶斯临床试验

南京医科大学公共卫生学院流行病与卫生统计学系(210029) 刘 晋 于 浩 刘丽亚 陈 峰

医疗器械临床试验贝叶斯统计应用指导原则简介*

南京医科大学公共卫生学院流行病与卫生统计学系(210029) 刘 晋 于 浩 刘丽亚 陈 峰△

美国FDA器械与辐射防护中心(center for devices and radiological health,CDRH)于2010年2月5日发布了《医疗器械临床试验贝叶斯统计应用指导原则》[1]。这是继2006年5月23日FDA发布该《指导原则》草案后[2],经过近3年的征求意见和深入研讨后所形成的官方指导性文件。《指导原则》不仅对贝叶斯临床试验设计、数据分析、上市后监测等统计学问题进行了全面论述,而且对贝叶斯统计的应用条件和技术细节进行了详尽描述,其观点和方法值得引起我国卫生统计界的重视。

《指导原则》出台背景

美国FDA发起贝叶斯统计在医疗器械临床试验中的应用始于20世纪90年代末[3]。其动因是,在医疗器械临床试验中有大量可供利用的先验信息,而贝叶斯统计在利用先验信息上比经典统计有明显优势[4]。另外,医学技术的进步使得医疗器械的发明过程和更新换代明显加快,这对医疗器械的评价提出了新的和更高的要求,因此寻求高效的临床评价方法成为必然。起初申办方(医疗器械生产厂家)意识到贝叶斯方法通过利用良好的先验信息可以导致更小和/或更短的试验;而管理者(FDA)则认为贝叶斯方法可帮助FDA利用更短的时间和更少的病人达到同等的决策能力[5]。这样在10余年前的起始阶段,应用者(申办方)和监管者(FDA)从各自肩负责任的不同角度就贝叶斯统计的应用达成了共识,正是这种早期就存在的共识为后来贝叶斯统计在医疗器械临床试验中的成功应用乃至《指导原则》的形成铺平了道路。

在《指导原则》的方向酝酿、框架拟定、草案形成和最终发布过程中有些重要事件值得回顾。一是在1998年受美国卫生工业制造协会(health industry manufacturers association,HIMA)赞助,FDA举办了一次贝叶斯统计研讨会。这次研讨会的成果体现在两个方面:一是解释了这一新方法可能带来的益处和应用这一方法的要求;二是向申办方发出了明确信号:CDRH愿意接受基于贝叶斯方法的申请项目[3]。到2004年已有许多基于贝叶斯方法的成功案例和获批产品,在此背景下,由约翰霍普金斯大学生物统计学系(department of biostatistics at johns hopkins university)和美国FDA三个人类产品中心(CDRH,CDER(Center for Drug Evaluation and Research),CBER(Center for Biologic Evaluation and Research))联合赞助在美国国立卫生研究院(national institutes of health,NIH)举办了一次专题研讨会,这次研讨会的主题是:应用贝叶斯方法评价新疗法能改进管理决策吗?这次会议的主要论文发表在临床试验杂志(Clinic Trials)2005年8月期。在这次高级别研讨会上,有关各方所达成的共识直接导致FDA于2006年5月发布了《医疗器械临床试验贝叶斯统计应用指导原则,(草案)》。因此这次会议被认为是推进贝叶斯统计在医疗器械临床试验应用的最为关键的事件之一[3]。

在《指导原则,(草案)》公布后的官方评议期,FDA接到了大量深刻而有见地的反馈意见,这些意见经专家讨论后于2010年2月形成了最终的指导文件[1]。与2006年的“草案”相比,2010年的“最终文件”有两个显著的扩展。一是对可交换研究定义的进一步明确以及如何通过贝叶斯层次模型将可交换研究整合到先验分布;二是强调了统计模拟在贝叶斯设计中的重要性以及给出了开展此类模拟研究的技术细节。

由上述分析不难看出,《指导原则》的出台是基于医疗器械临床试验信息特点及贝叶斯统计优势,在管理者、大学生物统计研究者以及医疗器械申办者共同努力下,历经十余年而形成,故其实用性、科学性和权威性不言而喻。

《指导原则》基本内容

《指导原则》全文共分为8章38节,内容可归纳为以下5个方面。

1.贝叶斯临床试验基本概念

在《指导原则》前三章,FDA主要以问答形式表述了与医疗器械临床试验有关的贝叶斯统计基本概念。如为什么要在医疗器械临床试验中使用贝叶斯统计?为什么贝叶斯统计在当前使用的更普遍?使用贝叶斯方法的潜在效益和挑战有哪些?另外对先验分布、似然函数、后验分布、预测概率、可交换性等重要统计学概念也作了简要介绍。

在回答为什么要在医疗器械临床试验中使用贝叶斯统计时,FDA针对有先验信息、无先验信息以及能否减轻FDA审批负担三种情况进行了解答。①有信息先验:医疗器械临床试验往往具有良好的先验信息,贝叶斯方法能够将这些信息整合到统计分析中从而提高其统计效能,在这种情况下,贝叶斯方法可利用一个更小和/或更短期的临床试验即可使FDA作出决定[1]。②无信息先验:在缺乏先验信息时,贝叶斯方法也常常是有用的[1]。首先,贝叶斯方法非常适合适应性设计(例如,期中分析、样本量调整、随机化方案变更),甚至也可用于一些事先未计划但必须要修改的试验。第二,贝叶斯方法可用于复杂条件下的建模,而经典方法却很难完成或根本不能完成。第三,其它的应用包括缺失数据填补、试验灵敏度分析、多重比较和最优化决策。③审批负担:当贝叶斯方法被正确使用时,FDA的审批工作负担较频率方法轻,这符合联邦食品、药品和化妆品法规(FFDCA)第513节a款第3条对FDA的要求[1]。

2.贝叶斯临床试验设计

贝叶斯临床试验设计的基本原则和内容与经典统计相同。但在样本含量的确定和试验设计的具体操作上两者却有明显差别。经典统计通常需要事先确定样本含量,但贝叶斯方法(和一些现代的频率学派方法)不是事先制定一个固定的样本量,而是指定一个停止试验的标准。需要注意的是,为了防止样本含量确定时的随意性,FDA要求,必须在事先根据安全性和有效性等参数确定最小样本含量,同时从经济、伦理和规范要求等方面确定一个最大样本量[1]。在先验信息选取上,FDA建议采用量化的客观性先验,如一种新器械的先验信息可来自新器械自身的信息,对照组的信息或两者兼之。不建议采用专家意见产生的主观先验,这与贝叶斯统计在其它领域中的应用有着明显不同。在试验设计的操作上,贝叶斯设计往往涉及大量的统计模拟。虽然这种在不同临床环境下、不同先验分布下对统计效能和Ⅰ型误差的模拟对设计合理的贝叶斯试验方案具有重要价值,但工作量是巨大的。事实上,在贝叶斯试验中,试验设计的计算工作量比后期的数据分析要大得多,这在经典统计中是难以想象的。FDA要求提供有关试验设计详尽的模拟实验结果[1]。

3.贝叶斯临床试验分析

同经典统计一样,贝叶斯统计推断包括假设检验和区间估计。不同的是,贝叶斯分析的结果全部依赖于后验分布。贝叶斯假设检验是以后验分布计算出某个特定假设(如原假设)是真的概率。若原假设为真的概率大于备择假设,则接受原假设,反之亦然;若原假设和备择假设为真的概率相接近时,则不宜作结论,建议进一步收集先验信息和/或样本信息[6]。贝叶斯区间估计仅以后验分布为基础,因此贝叶斯可信区间(bayes credible interval,BCI)仅基于先验信息和当前数据,并不涉及重复抽样,因此在结果解释上和经典统计的置信区间(confidence interval,CI)意义不同[7]。

在贝叶斯统计分析中,FDA建议采用期望值概率分析。所谓期望值概率,是指给定结局在未来是否发生的概率,是一种特殊类型的后验概率,可用于决定何时停止试验、预测当前病人的临床结局、调整有缺失数据的试验结果和模型检验等。在制定临床试验方案时,可将期望值概率作为停止试验的标准。若以迄今结果为基础,试验成功的期望值概率足够高,则可以停止试验并宣布成功。反之概率足够低时,也可以因器械不满足要求而停止试验并减少损失。这一特点显示了贝叶斯临床试验的灵活性,具有重要的实际意义。

4.贝叶斯上市后监测

FDA认为贝叶斯方法非常适合医疗器械的上市后监测。“今天的后验是明天的先验”这一重要概念使得研究者能够将上市前研究数据的后验分布作为上市后监测的先验分布[1]。随着更多上市后监测数据的收集,不断更新先验以提高贝叶斯统计推断的质量,从而可有效利用上市后监测数据所蕴含的宝贵信息。

5.技术细节

《指导原则》以一章篇幅描述了贝叶斯方法的技术细节。包括研究方案应包含的信息,模拟实验方法,模型选择方法,可交换性检查以及计算方法等。了解这些方法,对在医疗器械临床试验中正确应用贝叶斯统计方法以及向FDA上报规范的临床试验技术资料都具有重要的参考价值。

启示及发展方向

经过十余年的发展,贝叶斯统计在医疗器械临床试验上的成功已被美国FDA、国际生物统计界和国外医疗器械工业界广泛认可[3]。总体说来,我国医疗器械临床试验现状表现为起点低,临床试验质量不高[8]。加之我国新型医疗器械有相当一部分为国外进口,这些器械在安全性和有效性上往往已经具备良好的先验信息。这启示我们,及时引进国外先进的贝叶斯方法不仅具有现实性,而且具有可行性。

另外一个值得注意的动向是,贝叶斯统计除了在国外医疗器械临床试验上已站稳脚跟外,目前正在向临床试验的其它方向(如药物临床试验、疫苗临床试验等)迅速拓展[9]。具体表现为:在主要发表临床试验统计方法论文的Statistics in Medicine,Clinic Trials,Journal of Biopharmaceutical Statistics等杂志上,近年来出现了许多贝叶斯临床试验研究论文,特别是在国际顶尖杂志Lancet和JAMA(Journal of the American Medical Association)上也发表了贝叶斯临床试验的研究论文[10-11]。这与十年前在生物医学文献中几乎没有贝叶斯临床试验论文的情况形成了鲜明对比[9]。另外在国际权威癌症研究机构,美国德州大学安德森癌症研究中心(University of Texas M.D.Anderson Cancer Center),贝叶斯方法在癌症临床试验中的研究发展迅速,并已形成了该中心标准的临床试验设计方法之一。据统计,在该中心近年开展的954项临床试验中有195项(20%)为贝叶斯设计和分析,其中I期临床试验为贝叶斯方法的占其总数的13%,I/II期临床试验占47%,II期临床试验占38%,II/III期临床试验占17%,III期临床试验占1%,IV期临床试验占14%[9]。目前已有一项在该中心进行的基于完整贝叶斯方法(指采用贝叶斯试验设计和贝叶斯数据分析)的药物临床试验获得了美国FDA批准[9]。

在药物临床试验方向,贝叶斯方法的研究热点目前主要集中在适应性设计、中期分析、样本量调整、多重比较等方面,而这也正是目前频率统计临床试验统计方法的研究热点[9]。一个令人欣慰的现象是,在目前国外的贝叶斯临床试验研究论文中,很少见到早期两派激烈争辩的言辞,更多见的是相互接纳和客观比较。甚至有人建议,在频率统计的临床试验设计中可借鉴贝叶斯统计的思想和方法[12]。正如著名生物统计学家Efron教授(美国斯坦福大学生物统计学系的频率学派)指出的那样“我强烈地感到统计学正处于新一轮理论和方法爆发的时代,而这个爆发将以贝叶斯学派与频率学派合并为特色”[13]。相比于频率统计,贝叶斯统计在我国临床试验中的研究较弱,相信加强贝叶斯统计研究必将促进我国临床试验统计方法的发展。

1.US.Food and Drug Administration,Center for Devices and Radiological Health.Guidance for the Use of Bayesian Statistics in Medical Device Clinical Trials.2010,http://www.fda.gov/Medical Devices/Device-RegulationandGuidance/GuidanceDocuments/ucm071072.htm.

2.US.Food and Drug Administration,Center for Devices and Radiological Health.Guidance for the use of Bayesian statistics in medical device clinical trials-draft guidance for industry and FDA staff.2006,http://www.fda.gov/cdrh/osb/guidance/1601.htm.

3.Campbell G.Bayesian statistics in medical devices:innovation sparked by the FDA.J Biopharm Stat,2011,21(5):871-887.

4.Youn JH,Lord J,Hemming K,et al.Bayesian meta-analysis on medical devices:application to implantable cardioverter defibrillators.Int J Technol Assess Health Care,2012,28(2):115-124.

5.Berry DA.Bayesian clinical trials.Nat Rev Drug Discov,2006,5(1):27-36.

6.Ashby D.Bayesian statistics in medicine:A 25 year review.Statistics in Medicine,2006:25.

7.Ntzoufras I.Bayesain modeling using WinBUGS.New Jersey,USA:John Wiley&Sons,Inc,2009.

8.肖忠革,周礼明,田卓平,等.我国医疗器械临床试验现状与思考.中国医疗器械杂志,2009(5):369-371.

9.Biswas S,Liu D,Lee J,et al.Bayesian clinical trials at the University of Texas M.D.Anderson Cancer Center.Clin Trials,2009,6(3):205-216.

10.Holmes D,Reddy V,Turi ZG,et al.Percutaneous closure of the left atrial appendage versus warfarin therapy for prevention of stroke in patients with atrial firillation:A randomised non-inferiority trial.Lancet,2009,374:534-542.

11.Wilber D,Pappone C,Daoud E,et al.Comparison of antiarrhythmic drug therapy and radiofrequency catheter ablation in patients with paroxysmal atrial firillation:A randomized controlled trial.Journal of the A-merican Medical Association,2010,303:333-340.

12.Berry DA.Adaptive clinical trials in oncology.Nat Rev Clin Oncol,2012,9(4):199-207.

13.Efron B.Bayesians,frequentists,and scientists.J.Am.Stat.Assoc,2005,100:1-5.

(责任编辑:刘壮)

参 考 文 献

1.Robins JM,Herna′n MA,Brumback B.Marginal structural models and causal inference in epidemiology.Epidemiology,2000,11(5):550-560.

2.Arah OA,Sudan M,Olsen J,et al.Marginal structural models,doubly robust estimation,and bias analysis in perinatal and paediatric epidemiology.Paediatr Perinat Epidemiol,2013,27(3):263-265.

3.Robins JM.Marginal structural models.In:1997 Proceedings of the Section on Bayesian Statistical Science,Alexandria,VA:American Statistical Association,1998:1-10.

4.朱敏.逆概率加权方法在医学研究中的应用.复旦大学,2012.

5.Cupples LA,D′Agostino RB,Anderson K,et al.Comparison of baseline and repeated measure covariate techniques in the Framingham Heart Study.Stat Med,1988,7(1-2):205-222.

6.Hernan MA,Brumback B,Robins JM.Marginal stractural models to estimate the cansal effect of zidovudine on the survival of HIV-positive men.Epidemiology,2000,11(5):561-570.

7.Suarez D,Borràs R,Basagan~a X.Differences between marginal structural models and conventional models in their exposure effect estimates:a systematic review.Epidemiology,2011,22(4):586-588.

8.Ali RA,Ali MA,Wei Z.On computing standard errors for marginal structural Cox models.Lifetime Data Anal,2013:1-26.

(责任编辑:丁海龙)

*:国家自然科学基金资助(81273184)

△通信作者:陈峰,E-mail:Fengchen@njmu.edu.cn

猜你喜欢

先验贝叶斯临床试验
BOP2试验设计方法的先验敏感性分析研究*
美国特战司令部参与抗衰药临床试验 合成一百余种新型NAD+增强剂
品管圈在持续改进医疗器械临床试验全周期质量控制中的应用
基于贝叶斯解释回应被告人讲述的故事
参加临床试验,也要“顺道”
基于动态贝叶斯估计的疲劳驾驶识别研究
基于自适应块组割先验的噪声图像超分辨率重建
先验的风
基于互信息的贝叶斯网络结构学习
基于平滑先验法的被动声信号趋势项消除