桥接研究与多区域临床试验的主要特征和一致性评价方法比较
2024-05-24李新旭
李新旭
博济医药科技股份有限公司
博济数据科技(北京)有限公司
桥接研究(bridging study)和多区域临床试验(multiregional clinical trial,MRCT)是药物研发全球化背景下衍生出的不同概念,两者在减少全球重复研究以及缩短全球上市时间等方面发挥了不同程度的积极作用。早在1998 年ICH 就发布了E5,后编码更新为E5(R1),为了在接受国外临床试验数据时评估种族因素影响,提出国外临床试验数据桥接研究的概念[1];2003年ICH 发布了E5 问答,后编码更新为E5 问答(R1),首次提及MRCT 的概念[2]。然 而,直到2017 年ICH 才发布 了E17,提出MRCT 计划与设计的一般原则,正式确定MRCT 的概念[3]。我国已经在2019 年11 月开始适 用ICH E5(R1)、E5 问 答(R1)和E17[4]。虽然桥接研究和MRCT 均有各自的ICH 指南,但两者在方法学上仍处于百家争鸣的状态,而且在实践中两者的方法学经常被混淆。为了帮助申办者正确理解和合理应用确证药物有效性的桥接研究和MRCT,本文从统计学角度对两者进行了系统性比较,并阐述了在方法学上的不同考虑。如无特别说明,本文中“区域”可指地理区域、国家或监管区域[3]。
1 桥接研究和MRCT 的定义
1.1 桥接研究的定义
当在国外已经完成全部临床研发过程的药物在新目标区域申请注册审批时,如果国外临床试验数据符合新目标区域监管机构的注册要求,基于尽可能减少重复的临床研究并尽快为患者提供可获益的药物的目的,推荐接受国外临床资料;如果认为种族因素可能改变药物在新目标区域人群中的安全性或有效性,则可能需要在新目标区域获得额外临床数据,从而能将国外临床数据外推到新目标区域,以满足新目标区域的监管要求。这些为了在新目标区域获得额外临床数据而开展的临床研究被称为桥接研究[1]。在ICH E5/E5(R1)中,桥接研究包括临床药理学终点、临床终点和安全性的桥接研究等[1]。如无特别说明,本文主要指临床终点的桥接研究。
1.2 MRCT 的定义
为了推进药物在全球同步研发和同步上市,在满足各目标区域监管机构的注册要求的前提下,可按照同一个方案在多个目标区域同步实施临床试验,其数据可以用于同步提交至多个目标区域监管机构申请药物的注册审批或用于满足这些监管机构所要求的上市后研究,以实现减少各目标区域单独实施临床研究的数量,从而尽可能减少不必要的重复研究和提高药物研发效率的目的。这些按照同一个方案在多个目标区域同步实施的临床试验被称为MRCT[3]。ICH E17 提及了早期的(如探索性阶段)MRCT 和确证性MRCT[3],本文主要指确证药物有效性的MRCT。
2 桥接研究和MRCT的主要特征比较
2.1 相同点
2.1.1 其目的都是减少重复研究
在新目标区域开展桥接研究,以少量的额外临床数据作为补充,促进新目标区域接受国外临床试验数据,即允许将国外临床试验数据外推到新目标区域,以实现尽可能减少重复的临床研究且能支持药品在新目标区域注册的目的[1]。MRCT 可以推进药物在全球同步研发,从而减少各目标区域单独实施临床研究的数量,以实现尽可能减少不必要的重复研究和提高药物研发效率的目的[3]。
2.1.2 都需要满足各目标区域的监管要求
国外临床试验数据必须符合新目标区域的研究设计和实施标准,遵循新目标区域的监管要求。当种族因素可能改变药物在新目标区域人群中的安全性或有效性时,通过桥接研究,以少量的额外临床数据作为补充,促进国外临床试验数据满足新目标区域的监管要求[1]。在MRCT 计划阶段,鼓励申办者与各目标区域监管机构进行有效沟通,目的是获得这些监管机构对全球研究设计方法的认可[3]。
2.1.3 都需要评价区域间治疗效应一致性
如果桥接研究证实,在新目标区域的量效关系、安全性和有效性与国外相似,或者在新目标区域不同剂量下的安全性和有效性结果与原区域没有较大差异,通常可将国外临床试验数据外推到新目标区域[1]。MRCT 的统计分析策略包括评价各目标区域或各亚群治疗效应一致性,治疗效应的一致性定义为不同目标区域或亚群中的治疗效应无临床相关差异[3]。
2.1.4 其定义存在相互交叉的情况
可以在全球研发计划开始时、进行中或结束时开展桥接研究,即可以在计划全球同步注册的研发方案中实施出于桥接目的的MRCT[2]。如果MRCT 是作为桥接策略的数据来源,则MRCT可提供比单区域试验更可靠的证据用于研究结果的外推[3]。为了便于区别,在本文后述内容中,将出于桥接目的的MRCT 归入“MRCT”,不归入“桥接研究”。
2.2 不同点
2.2.1 实施的前提条件不同
相对的种族敏感性有助于决定是否进行桥接研究以及进行何种类型的桥接研究。对于种族因素敏感的药物,如果两个目标区域人群有差异,如药效学数据提示治疗效应有差异,药动学数据显示代谢方式存在本质区别,医学实践在联合用药方面存在显著差异,或者辅助治疗可能改变药物的安全性或有效性,通常需要开展桥接研究。对于没有使用国外临床试验数据进行药品注册经验的目标区域,即使该药物无种族敏感性,该监管机构仍可要求开展桥接研究[1]。
MRCT 是在假设治疗效应对整个目标人群均适用的基础上,基于所有目标区域受试者的数据评价整体治疗效应。但是,内在因素和外在因素在不同目标区域对药物反应的影响可能会不同,因此在计划MRCT 时应予以考虑。在设计确证性MRCT 前,可在探索阶段考察对药物研发项目有重要影响的内在因素和外在因素,仔细考虑区域差异影响研究结果可解释性的可能性,以确定MRCT 在药物研发策略中可以发挥的作用。如果预期治疗效应存在重大差异,则应评价现有数据,决定开展MRCT 是否合适且可行;或者,在预期治疗效应存在重大差异的情况下,可剔除部分目标区域或同一目标区域内的既定亚组,也可按目标区域分层,以增大开展MRCT 的可能性[3]。
2.2.2 实施的先后顺序不同
新目标区域的监管机构将评估包括国外临床数据的临床数据集,以确定该数据的性质和质量是否符合该区域所有的监管标准。临床数据集中的国外临床数据是否被接受,取决于它能否外推到新目标区域人群中。当国外临床数据不符合新目标区域的监管要求时,该监管机构可能会要求增加临床试验,即开展桥接研究[1]。因此,新目标区域的桥接研究一般在国外临床试验完成之后才开始实施。
MRCT 可以使不同目标区域的药物研发时间同步,推动在多个目标区域同步递交上市许可申请,促进新药能够及早在世界各地上市,从而避免在部分目标区域上市明显滞后[3]。因此,MRCT 强调的是药物在不同目标区域的同步研发和同步上市。
2.2.3 临床试验的设计思路不同
虽然桥接数据集需要与国外临床数据集一起组成完整临床数据集用于满足新目标区域的监管要求,但是新目标区域桥接研究本身是独立于国外临床试验的平行研究。在药物对种族因素敏感的情况下,桥接研究的设计思路是为了满足新目标区域监管机构所要求的额外临床数据。种族敏感性的相对程度决定着桥接研究的类型。例如,在药效学数据提示区域间治疗效应有差异、药动学数据显示代谢方式存在本质区别、医学实践在联合用药方面存在显著差异,或者辅助治疗可能改变药物的安全性或有效性时,桥接研究应设计为一项对照临床试验,可以重复国外临床试验,或采用标准的临床终点进行短期研究,或采用经过验证的替代终点等[1]。
MRCT 可用来考察一种处理对不同人群的适用性,允许探索在同一个研究方案框架下治疗效应在不同目标区域和不同人群间的差异,以及这种差异如何由内在因素和外在因素进行解释,并计划一个用于假设检验和整体治疗效应估计的主要分析方法,以便所有目标区域监管机构都可以接受试验结束后同步递交上市许可申请。此外,在疾病/疾病状态罕见或特殊人群或需要的受试者数量庞大的情况下,MRCT 可作为一种在合理时间内招募到足够受试者的有效方法[3]。
2.2.4 对主要研究终点的考虑不同
桥接研究是在尽可能减少重复研究的前提下满足新目标区域监管机构所要求的额外临床数据,因此根据种族敏感性的不同程度,可以采用与国外临床试验相同的主要研究终点,也可以采用标准的临床终点进行短期研究,或采用经过验证的替代终点,如血压或胆固醇(国外Ⅲ期临床试验中可能已采用更长时间的研究和其他研究终点)[1]。
对于MRCT,主要研究终点均应为所有目标区域监管机构所接受,以确保对MRCT 成功或失败的解释能够在这些监管机构间保持一致。另外,各目标区域监管机构对主要研究终点的一致意见能够确保基于统一的研究终点来确定MRCT 的总样本量和检验效能。如果经过充分论证仍无法在各目标区域间达成一致,应在MRCT 方案中增加关于主要研究终点的相关(亚)章节,阐述不同目标区域监管机构的相应要求[3]。
2.2.5 对样本量的考虑不同
ICH E5/E5(R1)未阐述 对于桥接研究样本量的考虑[1]。根据统计学的一般原则,样本量与研究类型和研究假设紧密相关,桥接研究的样本量也应与其研究类型和假设相关。而对桥接研究的类型和假设的考虑是为了满足新目标区域监管机构所要求的额外临床数据。因此,桥接研究的样本量受新目标区域监管要求的影响,与国外临床试验的样本量无直接关联。
MRCT 总样本量的关键考虑是确保总样本量足以评价MRCT所有目标区域全部受试者的平均治疗效应(估计和检验)。MRCT可以评价各目标区域间治疗效应的一致性,目标区域样本量分配应在科学基础(而不是任意目标)上支持治疗效应的一致性评价,提供目标区域监管机构所需信息。区域样本量分配应考虑各目标区域疾病的患病情况,各目标区域规模及预期入组率,已知(或假设)影响治疗效应的内在因素和外在因素,各目标区域上述因素的发生率,以及认为影响入组率的其他操作层面的考虑。一个平衡好上述考察因素的目标区域样本量分配策略,将有助于确保及时完成入组,并达成MRCT 的主要目的。在对MRCT 总样本量进行各目标区域间分配时,必须注意确保不存在单个或多个目标区域样本量占主导地位,从而主导试验结果的情况。各目标区域样本量分配应事先与各目标区域监管机构达成一致意见[3]。
2.2.6 区域间治疗效应一致性评价方法不同
为了将国外临床试验数据外推到新目标区域,需要比较新目标区域桥接研究结果与国外临床试验有无较大差异,但ICH E5/E5(R1)未阐述对于区域间治疗效应一致性评价方法的考虑[1]。考虑到一般情况下实施桥接研究的前提条件是药物的种族敏感性在区域间存在某个方面某种程度的差异,而且新目标区域的桥接研究与原区域的国外临床试验是相互平行和独立的,观察时间和研究终点也可能不一致,因此无法要求新目标区域与原区域的研究结果在数值上保持某种程度上的一致。新目标区域和原区域的一致性评价应该以研究结论是否一致为标准。
MRCT 主要分析对应的是对治疗效应的假设检验以及估计,考虑的数据来自试验中所有目标区域和亚群。各目标区域和各亚群治疗效应的一致性评价也是MRCT 统计分析策略的重要方面。治疗效应的一致性定义为不同目标区域或亚群中的治疗效应无临床相关差异。该评价的各种分析方法(可能联合使用)包括但不限于描述性总结、图示(如森林图)、包括协变量校正分析在内的基于模型的估计,以及区域与处理交互作用的检验。上述任何方法都有优点和局限性(例如,交互作用检验往往具有极低的检验效能)[3]。
考虑到MRCT 总样本量是由各目标区域样本量组成,MRCT整体研究结论基于所有目标区域所有受试者的平均治疗效应,各目标区域样本量的检验效能一般不足以推断出各自可靠的研究结论,因此无法要求对各目标区域间的研究结论进行比较,更无法要求对各目标区域的研究结论与MRCT 整体研究结论进行比较。ICH E17 提供的一些治疗效应一致性评价方法,如描述性总结、图示法,主要是从研究结果的数值上对各目标区域间以及各目标区域与MRCT 整体的治疗效应一致性进行直接或直观比较[3],但尚无公认的一致性评价标准。
3 桥接研究和MRCT的区域间治疗效应一致性评价方法比较
3.1 桥接研究的一致性评价方法
对于桥接研究,ICH E5/E5(R1)未阐述对于区域间治疗效应一致性评价方法的考虑[1]。为了解决这个问题,很多学者围绕桥接研究的“相似性”“一致性”评价对桥接策略进行深入探讨,刘晋等[5]和刘泽宇等[6]对这些研究进行了综述。目前,尚无监管机构宣称其认可某个或某些方法。
Shih[7]将所有在原区域已完成的临床试验当作是一个多中心试验,把新目标区域的临床试验当作是多中心试验中的一个新中心,以检验研究中心间的治疗效应一致性。假设临床试验由试验药组与安慰剂组构成,试验效应为标准样本均差(standardized sample mean difference,SSMD),服从正 态分布N(μ,1),构造SSMD 的预测密度函数。如果新目标区域试验的SSMD预测似然值不比原区域中最小的SSMD 预测似然值小,则认为新目标区域与原区域的治疗效应具有一致性,以此判断是否可以将原区域数据桥接至新目标区域。
有学者提出重建概率和概括概率的概念[8-10]。所谓重建概率是指在新区域重复原区域的临床试验结果的概率,当无明显证据表明两区域间的种族差异对药物治疗效应产生影响时,通过计算重建概率判断是否需要进行桥接研究;概括概率则为在已有信息表明新区域和原区域药物治疗效应可能存在差异的条件下,新区域得到治疗效应存在的概率。具体地说,根据效应信息量估计新目标区域的重建概率,如果能够达到事先规定的具有“可重复性”的概率,则可以停止新目标区域的桥接研究,将原区域的临床试验数据借用至新目标区域。
Lan 等[11]提出加 权Z检 验方法。在进行新目标区域的桥接研究时,对原区域的效应信息量“打折”,赋予权重。其基本思想是将原区域和新区域的近似正态性Z检验统计量(ZForeign,ZBridging),按照预先指定的权重(w)相加,得到新统计量Zw,对Zw进行假设检验,若小于预定检验水准α,则认为桥接成功。
Huang 等[12-13]提出由 国际MRCT 附加一个局部区域临床试 验(local clinical trial,LCT)的药物全球同步研发项 目(simultaneous global drug development program,SGDDP)试验设 计。其基本设计如下:假设已有独立的Ⅲ期MRCT,根据注册区域的目标种族将MRCT 分为目标种族(targeted ethic,TE)人群和非目标种族(non-targeted ethic,NTE)人群,同步或序贯地开展针 对TE 人群的LCT,则TE 人群包括MRCT 和LCT 中 的TE人 群。对NTE 和TE 人群效 应信息量赋予权重,适当降低NTE人群的权重,采用加权Z统计量合 并TE 和NTE 人群的治疗效应(其中ZTE、ZNTE为标准正态分布检验统计量,w为NTE 人群对整体试验效应的信息贡献比例)。
Hsiao 等[14-15]将桥接研究视为在统一框架下分两阶段(原区域阶段和新区域阶段)进行的临床试验。在此基础上,将两阶段设计和成组序贯设计引入桥接研究的设计与分析中。该方法的主要步骤为:第一阶段对原区域获得的试验结果进行t检验,若检验统计量T0大于预定界值C0则试验进入第二阶段(新区域试验),否则试验中止。当第二阶段(桥接阶段)完成后,对第一、二阶段的累计数据进行最终分析。若检验统计量TN大于预定界值CN,认为可以将第一阶段原区域结果外推至第二阶段的新区域。
也有一些学者考虑到上述方法存在某些局限性,在此基础上提出了一些改进方法[16-18]。还有许多学者对各种贝叶斯统计方法在桥接研究设计与分析中的应用进行了大量研究,其代表性方法有贝叶斯最合理预测法[7]、经验贝叶斯法[19-20]、混合先验法[21]、幂次先验法[22]、公度幂次先验法[23]和贝叶斯动态借用法[24]。
3.2 MRCT 的一致性评价方法
对 于MRCT,ICH E17 提 供了一些治疗效应一致性评价方法,如描述性总结、图示法,但未阐述一致性评价标准[3]。2007 年日本厚生劳动省通过问答的形式阐述了全球临床试验的基本原则,基于使用定量终点的安慰剂对照研究,推荐了两种一致性评价方法,目的是期望通过考虑纳入的目标区域数量、试验规模、目标疾病以及研究总人群与日本亚组人群之间的相关比例等因素,确定合适的日本亚组样本量,以平衡研究总人群与日本亚组人群之间获得一致性结果的可能性[25]。
日本方法1:假设安慰剂组和试验组之间的差值为D,则研究总人群的跨区域差值为Dall,日本亚组人群内的差值为DJapan。确定日本受试者的数量,使DJapan/Dall>π的发生概率≥80%。π应设为适当的值,一般建议取0.5以上。使用此方法时,将观察到以下关系:尝试最小化日本样本量将增加总样本量,尝试最小化总样本量将增加日本样本量。
日本方法2:假设安慰剂组和试验组在研究总人群中跨区域差值为Dall,如果假设试验包括3个目标区域,则安慰剂组和试验组在每个目标区域的差值分别为D1、D2和D3。确定样本量大小,使D1、D2和D3中的每一个都显示出相似的趋势。例如,在D>0的情况下,确定受试者数量,使得D1、D2和D3中的每一个大于0 的概率≥80%。如果每个目标区域的受试者数量相等,这种可能性就会增加。该方法允许在不改变总样本量的情况下考虑日本样本量。然而,应该注意的是,在这种方法中,当日本成分比率很小且受试者人数很少时,可能无法进行充分的目标区域间比较。
除了日本监管机构推荐的方法之外,很多学者也从不同方面探讨了MRCT 的治疗效应一致性评价方法。Liu 等[26]使用离散分布的随机效应模型评估跨区域治疗效应的异质性。Quan 等[27-28]讨论了经验收缩估计量和James-Stein 型收缩估计量在评价跨区域治疗效应一致性上的应用。也有学者推荐使用图形法评价MRCT的目标区域间治疗效应一致性,如漏斗图和正态概率图[29-30]。
Chen 等[29]对MRCT 的 治疗效应一致性评价方法进行了系统综述,归纳为三类方法:①全局方法:基于一个单一的全局统计量评价所有目标区域的数据,如采用类似于Meta 分析的异质性评价方法。②多元定量方法:评价目标区域之间的所有成对差异是否在预先指定范围内,如果多个区域之间治疗效应的所有成对比较在名义检验水准上均无统计学显著性,则接受区域之间治疗效应无差异的无效假设。③多元定性方法:评价各个目标区域的所有点估计值是否都优于相应的阈值,如日本方法1 和方法2,或者评价预先指定的目标保留效应是否被所有单个区域的置信区间所覆盖。所归纳的三类方法的共同点都是要求所有目标区域均达到相同标准才能认为具有一致性。
但在实践中,目标区域的监管机构更关心该区域的治疗效应是否与MRCT 整体具有一致性。Guo 等[31]根据国家之间某些特征如人类发展指数的相似性来建立树状图(即层次聚类),用分支或分叉来表示国家之间治疗效应的关系;为了估计某个感兴趣的国家的治疗效应,可以从在同一分支或分叉上的相邻国家借用信息。Huang 等[32]提出用混合先验信息的经验贝叶斯方法来综合目标区域和其他区域的数据,以评价目标区域的治疗效应与整体的一致性。
除此之外,部分学者提出了检验水准调整和区间估计的思路对目标区域与整体的治疗效应一致性进行评价。Tsong 等[33]建议基于MRCT 的检验效能,根据目标区域样本量反过来调整该区域可接受的I 类错误率,来评估该区域的治疗效应的统计学显著性。Tanaka 等[34]对Gail-Simon 和Sasabuchi 单侧多元似然比检验进行扩展,评估这些方法用于定性评价治疗效应一致性的特性,并探讨对于给定数量的目标区域设置检验水准和一致性界限的准则。Chen 等[35]提出在目标区域选择不同(增大)的检验水准α′,采用与MRCT 相同的假设检验进行统计推断,并比较了该方法与日本方法1 之间的相互关系,认为目标区域样本量在MRCT 中所占比例固定的情况下,该方法的α′与日本方法1 的π被满足的概率相互匹配。Teng 等[36]进一步提出了一个统一的一致性条件,该条件中同时包括两个参数,即日本方法1 的π和目标区域的检验水准α′。Chiang 等[37]使用区间估计法设计和评估MRCT,认为该方法能够正确地确定所需样本量,并把Ⅰ类错误率控制在名义水平。
4 讨论
在实践中,桥接研究和MRCT 经常被混淆,尤其是两者的目标区域间治疗效应一致性评价方法。申办者经常把评价MRCT 区域间治疗效应一致性的日本方法1 和方法2 用于桥接研究的设计和评价。产生这种混淆的主要原因是未分析桥接研究和MRCT 之间的联系和区别。因此,本文系统梳理了桥接研究和MRCT 的异同点。相同点包括都是以减少重复研究为目的、都需要满足各目标区域的监管要求、都需要评价区域间治疗效应一致性,而且两者的定义存在相互交叉的情况。不同点包括实施的前提条件不同、实施的先后顺序不同、临床试验的设计思路不同、对主要研究终点的考虑不同、对样本量的考虑不同,以及区域间治疗效应一致性评价方法不同。桥接研究和MRCT 的诸多不同点决定了两者在方法学上的设计和评价不能混用。
4.1 桥接研究应该是独立于国外临床试验的完整研究
学者提出了不少针对桥接研究的目标区域间治疗效应一致性评价方法,这些方法的共同点都是把新目标区域的桥接研究视为国外临床试验的附属研究,仅纳入较少样本量,通过构建或转变某些统计量从而避开对Ⅰ类错误率的评价,以达到获得区域间治疗效应一致性的结论的目的[7-24]。小样本量桥接研究中新目标区域的治疗效应与大型国外临床试验中整体治疗效应之间的一致性评价的统计指标一直存在争议,因为它们的样本量极不相称[38]。事实上,ICH E5/E5(R1)强调桥接研究的目的是减少重复研究,但这并不意味着桥接研究应该是非独立、小样本量的。
广义的桥接研究包括临床药理学终点的、临床终点的和安全性的桥接研究等[1]。如果国外临床试验数据符合新目标区域监管机构的注册要求,则可以不开展桥接研究;如果新目标区域监管机构评估国外临床试验数据后认为存在区域间的种族差异,则应开展临床药理学终点的桥接研究;如果临床药理学终点的桥接研究提示区域间的治疗效应差异,则需开展临床终点的桥接研究即对照临床试验[1]。因此,桥接研究是逐步递进的,如果前序桥接研究可以满足新目标区域监管要求,则无需开展后序桥接研究;只有前序桥接研究提示存在区域间差异时,才需开展后序桥接研究进一步验证。这可能是ICH E5/E5(R1)强调的减少重复研究的初衷。
此 外,ICH E5/E5(R1)指出临床终点的桥接研究即对照临床试验可以重复国外临床试验,可以缩短研究周期,可以采用替代终点[1],但从这些要求中并不能引申出“临床终点的桥接研究应作为国外临床试验的附属部分而仅需纳入较少样本量”的结论。况且当需要开展临床终点的桥接研究时,意味着前序桥接研究提示存在区域间的治疗效应差异,此时若采用非独立、小样本量的临床试验获得区域间治疗效应一致性的结论,则将面临较大的Ⅰ类错误率膨胀的风险。因此,上述分析说明,为了进一步验证区域间是否存在治疗效应差异,临床终点的桥接研究应该独立于国外临床试验,其样本量应该有足够的检验效能,在进行研究设计时可以适当调整某些设计要素,这可能更符合ICH E5/E5(R1)的要求。如果独立的桥接研究与国外临床试验的统计结论一致,则可认为具有一致性。
4.2 可通过调整目标区域的名义检验水准评价其与MRCT 整体的一致性
对MRCT 区域间治疗效应一致性评价产生较为深远影响的是日本方法1 和方法2,因为这是全球首个由监管机构提出的评价方法[25]。从2007 年至2017年,即从日本监管机构推荐的治疗效应一致性评价方法实施至ICH E17 实施前,日本监管机构通过MRCT 共批准了130 个药品,涉及167 个研究(138 个全球MRCT,29 个亚洲MRCT)[39]。虽然日本方法影响深远,但存在诸多局限性。①未考虑区域特征,如人口数量、患病率。②主观性较强,如方法1 中效应保留比例(参数π)的设定。③无明确的统计学理论支持,如采用点估计值进行统计推断,忽略了对Ⅰ类错误率膨胀的考虑。④仅适用于定量终点的优效检验,能否适用于定性终点或非劣效检验(非劣效界值也具有一定程度的主观性)等尚无定论。ICH E17 在MRCT区域样本量分配方法和各目标区域治疗效应一致性评价方法等方面并未推荐日本方法,虽然提及了效应保留的方法(日本方法1),但也指出,在试验中多个目标区域均要求保留一定比例整体治疗效应时,效应保留的分配不切实际[3]。
在MRCT 框架下,如果目标区域基于较少样本量所测量的治疗效应在检验水准α=0.05 时无统计学显著差异,但却得出其与MRCT 整体治 疗效应(α=0.05时有统计学显著差异)具有一致性的结论,则将面临较大的Ⅰ类错误率膨胀的风险。因此,目标区域监管机构在作出一致性结论时需关注Ⅰ类错误率膨胀程度以及可接受程度。虽然有学者对MRCT 区域间治疗效应一致性评价方法进行了诸多探讨,但大多数方法是通过构建或转变某些统计量从而避开对Ⅰ类错误率的评价,并着重探讨在不同参数设置情况下达到一致性的成功概率或保证概 率[26-32]。ICH E17 仅 推荐了一些描述性方法用于治疗效应一致性评价[3],这些方法同样具有较强的主观性且避开了对Ⅰ类错误率膨胀的考虑。因此,以上方法均未能找准监管机构评价MRCT 区域间治疗效应一致性的关注点。
此外,ICH E17 并未将区域样本量分配方法和区域间治疗效应一致性评价方法放在一起考虑[3]。但是,从统计学理论的角度,临床试验的样本量估算应该与用于统计推断的假设检验保持一致,这同样适用于MRCT 各目标区域。因此,目标区域监管机构应结合治疗效应一致性评价方法来考虑该区域样本量在总样本量中所占比例的合理性。
基于以上分析,借鉴前述的检验水准调整和区间估计的思路[33-37],把MRCT 中目标区域的名义检验水准、样本量、区间估计与治疗效应一致性评价结合起来考虑,可以较好地抓住监管机构的关注点。即,目标区域监管机构可考虑其所能接受的Ⅰ类错误率膨胀程度(可接受的名义检验水准α′),采用与MRCT 一致的样本量估算参数(预估疗效、检验效能)估算该区域样本量,并基于α′建立该区域的统计学假设,优效界值、非劣效界值或等效界值与MRCT 保持一致,如果目标区域的100(1-α′)%置信区间与MRCT 的100(1-α)%置信区间的统计结论一致,则可认为具有一致性。
该方法与ICH E17 并不矛盾,只是将目标区域监管机构根据ICH E17 区域样本量分配方法所能接受的样本量,在除α之外的其他估算参数与MRCT 总样本量估算参数保持一致的情况下,转化为对该区域Ⅰ类错误率膨胀的可接受程度,即调整名义检验水准α′。该方法的主要优点是在认可MRCT 研究设计的前提下,目标区域监管机构在与申办者讨论样本量分配时只需考虑对Ⅰ类错误率膨胀的可接受程度,有明确的治疗效应一致性评价标准,而且在作出一致性结论时可以清楚地量化Ⅰ类错误率膨胀程度。
综上所述,本文基于ICH 指导原则比较了桥接研究和MRCT的定义和异同点,并结合相关文献比较了两者常用的目标区域间治疗效应一致性评价方法,分析了两者在认识上可能存在的一些误区,并从统计学角度提出了在方法学上的不同考虑。其目的是,鼓励申办者将中国纳入到全球研发体系中,根据对桥接研究和MRCT 的不同考虑评估研发成本,以制定更加科学合理的全球研发策略。但囿于经验,本文所述观点可能存在偏颇之处,有待与学术界、工业界和监管机构专家进一步交流和探讨。