APP下载

特许药械真实世界研究中外部对照的研究设计要点和统计分析方法

2023-11-10曹寒

中国食品药品监管 2023年10期
关键词:乐城药械倾向性

曹寒

清华大学附属北京清华长庚医院

清华大学临床医学院

北京大学第一医院

王锴

北京大学第一医院

姚晨*

北京大学第一医院

北京大学临床研究所

海南省真实世界数据研究院

海南博鳌乐城国际医疗旅游先行区(以下简称乐城先行区)是我国海南自由贸易港战略之一。2018 年,国务院赋予海南省政府对乐城先行区临床急需进口医疗器械和药品特许使用的独特政策,使乐城先行区成为目前我国唯一可以使用国外已批准上市、国内未经注册的特许药械的地区。2019 年,国家发展改革委等四部门联合发布《关于支持建设博鳌乐城国际医疗旅游先行区的实施方案》,允许把在乐城先行区收集的特许药械真实世界数据(real world data,RWD)作为特许药械在国内申请注册的依据[1]。由于特许药械在乐城先行区的使用对象为急需此类药械诊疗的就医患者,难以进行随机分组和设立同期内部对照(internal control,IC),因此研究方案常常以单臂研究设计为主。但由于单臂研究设计缺乏对照,研究结果的解释性有限,且不能有效控制偏倚。

《美国联邦法规》(Code of Federal Regulations)规定美国食品药品监督管理局(Food and Drug Administration,FDA)在新药上市审批中必须依据高质量临床证据,设置良好的对照[2]。国际人用药品注册技术协调会(International Council for Harmonisation of Technical Requirements for Pharmaceuticals for Human Use,ICH)E10 中也强调了临床研究中对照组的选择[3]。国家药品监督管理局于2020 年发布的《真实世界数据用于医疗器械临床评价技术指导原则(试行)》[4]和国家药品监督管理局药品审评中心于2023 年发布的《药物真实世界研究设计与方案框架指导原则(试行)》[5]中,均将基于外部对照(external control,EC)的单臂研究推荐为药械真实世界研究(real world study,RWS)的研究设计类型。因此,在乐城先行区特许药械RWS 的背景下,监管部门通常建议在特许药械单臂研究的基础上增加EC,以加强研究结果的解释性并提高研究质量。FDA 于2023 年2 月正式发布了《药物和生物制品外部对照试验设计与实施的考虑因素》(Considerations for the Design and Conduct of Externally Controlled Trials for Drug and Biological Products)[6],明确了临床试验中EC 的定义和使用条件。本文将以上述国内外指导原则为依据,按照研究设计和统计分析两个阶段,分别介绍针对乐城先行区特许药械RWS 场景下EC 的研究设计要点和统计分析方法,旨在为开展特许药械的高质量临床研究、加快国内注册审批提供参考依据。

1 特许药械RWS 中EC的研究设计要点

1.1 EC 的概念和类型

随机对照试验(randomized controlled trial,RCT)是评价药械有效性和安全性的金标准。RCT 可以设置安慰剂对照、阳性对照、不同剂量对照等,这些对照组与试验组来自同一目标总体,接受同期干预,称为IC。当RCT 的IC 研究对象数量不足或缺乏时(如单臂研究),可以从其他试验或历史研究中找一组特征相似的研究对象,即在该研究之外合成一个接受不同干预措施的对照组,称为EC[7]。在乐城先行区特许药械单臂研究的场景下,需要根据具体的研究目的进行EC的选择和设定:可以考虑将在乐城先行区外的国内医疗机构中接受常规诊疗的人群设为EC,评价特许药械相对于常规诊疗的安全性和有效性;也可以考虑将特许药械国外临床研究数据作为EC评估特许药械在乐城先行区的国内人群的疗效是否与国外相当[8]。

根据EC 与单臂研究组在时间轴上的关系,可以将EC 分为平行EC、历史EC 和混合EC在此基础上,进一步根据EC 的数据收集方式(即回顾性收集和前瞻性收集)可以更具体进行分类:回顾性平行EC、前瞻性平行EC、历史EC、历史性混合EC 和前瞻性混合EC(图1)[9-11]。

图1 根据EC 与单臂研究组在时间轴上的关系及数据收集方式进行的EC 分类(参考李戈等[12]的研究并进行了乐城先行区特许药械场景的转化)

1.2 EC 的数据来源

EC 的数据来源可以是疾病登记队列、专病队列和自然人群队列等所形成的数据库。这类数据库的特点包括:均为结构化数据,易于提取和利用;数据收集相对完整,数据质量高;样本量大,且疾病诊断和病情判断信息准确,通常已具备较长随访期的多种结局指标[7]。对于乐城先行区特许药械单臂研究,这类数据库可以形成国内常规治疗EC(阴性EC);若数据库来源于国外,涉及特许药械国外临床使用数据,则可以形成国外特许药械EC(阳性EC)。但是,可能存在结局指标测量不同和缺少所需协变量等问题。若是已经结束随访的数据库,EC 可以进行回顾性数据收集;若是正在随访的数据库,可以考虑增加所需的协变量,EC 可以同时进行回顾性和前瞻性数据收集。

EC 的数据来源也可以是临床试验。这类临床试验数据也均是结构化数据,数据质量高,易于提取和利用;且相较队列形成的数据库,通常具有相似的暴露因素和协变量[7]。对于乐城先行区特许药械单臂,这类临床试验数据也可以形成国内常规治疗EC(阴性EC)。此外,特许药械在国外已经审批上市,国外临床试验注册数据是国外特许药械EC(阳性EC)的优质来源。但是,临床试验数据样本量有限,且有严格的纳入排除标准和结局指标定义,常常存在与乐城先行区研究对象不匹配的情况。与队列数据库相似,来源于临床试验数据的EC 也可以同时进行回顾性和前瞻性数据收集。

EC 的数据来源还可以是医疗和(或)商业保险记录。这类数据干预和协变量信息完整,数据质量较高,但是仍存在结局指标测量不同的问题,数据滞后性严重[7],且这类数据由于使用权限而导致其在国内实际操作的可行性有限。此外,EC 的数据来源也可以是电子病历和病例回顾。但此类数据缺失严重,数据质量相对较差,且通常未经过数据结构化处理,存在非结构化数据,在使用时需要进行数据治理。

一般地,根据研究目的,首先需确定选择阳性EC 还是阴性EC,然后根据乐城先行区特许药械单臂研究中相关人群特征、结局变量和重要协变量,确定需要从EC 提取的全部变量并进行EC 数据源的筛选。EC 数据源的筛选需要考虑以下内容[9]:①数据质量。实施完好RCT 的数据质量优于高质量前瞻性队列并优于其他。②目标人群。临床场景和基本特征(年龄、性别、疾病分期、治疗史等)与乐城先行区特许药械单臂研究基本一致。③结局指标。结局指标定义、测量方法和质量与乐城先行区特许药械单臂研究相近。④数据收集。回顾性收集的数据混杂变量收集充分且样本量充足,前瞻性收集的数据能够满足变量和样本量需求。⑤局限性。各种来源数据局限性进行综合比较。

1.3 EC 的数据治理

根据研究方案中需要从EC提取的全部变量,研究者或医学专员定义数据标注指南,技术公司利用自然语言处理等技术从外部数据源提取信息形成EC 临床研究源数据库,即EC 患者所有数据的核证副本。在EC 临床研究源数据库的基础上,对数据进行脱敏、结构化、标准化、质控等处理,建设EC 研究专用数据库,用于受试者筛选、变量提取、数据溯源、统计分析等研究数据补充、支持和交叉核对的工作。数据治理完成后,项目申办单位和数据所有单位签订脱敏研究数据传输协议,并通过临床数据采集管理系统,如电子数据捕获(electric data capture,EDC)系统,导出脱敏和标准化后的EC研究数据。

其中,对于数据提取和标准化,结构化数据可进行直接提取,非结构化数据运用自动化技术进行提取。对于非结构化的文本数据和影像数据,较常见的文本格式数据采集方式是自然语言处理技术。自然语言处理过程主要包括3 方面,即命名实体识别、实体关系采集和模板构建。其中,命名实体识别是指识别文本中具有特定意义的实体,例如疾病、症状、药品、手术名称等;实体关系采集是指确认不同实体之间的关联,例如将特定疾病与其症状和用药关联起来;模板构建是将标注的实体及实体之间的关系形成结构化数据。实现自然语言处理的方法主要有机器学习技术和规则制定法等,两者组合使用可以改善信息采集效果,是当下使用较多的处理方式。

1.4 EC 的设置

1.4.1 完全增强对照臂设计

完全增强对照臂设计是指在乐城先行区特许药械单臂之外设立对照臂,且对照臂完全来源于外部数据[13],可根据研究目的选择EC(图2)。如果需要评价特许药械相对于常规诊疗的安全性和有效性,可以考虑将在乐城先行区外的国内医疗机构的常规诊疗人群设为EC;如果需要验证特许药械在乐城先行区国内人群的疗效与国外相当,可以考虑将特许药械国外临床研究数据作为EC[8]。此外,可根据EC 的数据源情况以及内外部数据异质性情况进一步考虑设置同期EC 或历史EC,考虑回顾性EC 或前瞻性EC。但是,无论是何种来源和类型的EC,与乐城先行区患者均不是同一个总体,偏倚控制仍然是影响研究结果的关键问题。因此,在选择EC 时应尽可能选择基本特征具有同质性的人群,统计分析阶段也需要通过适当的统计分析方法进行偏倚的控制。

图2 完全增强对照臂设计

1.4.2 类三臂设计

上述完全增强对照臂设计中,阳性或阴性EC 臂的设置无法在同一个研究设计框架下兼顾乐城先行区特许药械的定性和定量评价,即无法同时兼顾验证特许药械在我国人群中是否有效且非劣效于国外临床研究。基于非劣效检验和桥接思想,可以将完全增强对照臂设计拓展为类三臂设计(图3)[8]:将国外和国内2 个常规治疗组合成为类阴性对照臂,对特许药械是否有效进行定性判断;将乐城先行区特许药械组设置为试验臂,将国外临床研究中的特许药械组设置为阳性对照臂,对特许药械的有效性进行定量度量。基于该框架,假设特许药械在乐城先行区应用的临床疗效非劣效于国外临床研究结果,并以国外临床研究中特许药械与常规治疗疗效差(即有效性指标的差值)的百分比作为非劣效界值,通过非劣效检验来确证试验器械在乐城先行区应用的临床疗效。类三臂研究设计框架下可以同时检验:①特许药械相对于常规治疗的有效性(定性检验);②保留了特许药械在国外疗效的百分比(定量检验:大小);③非劣效于特许药械在国外的疗效(定量检验:方向)。此种研究设计中的阴性对照和阳性对照均属于EC,偏倚仍然不可避免。因此,在乐城先行区开展特许药械RWS 时,偏倚控制是所有研究类型均需要慎重考虑的关键环节。

图3 类三臂设计

1.5 EC 的常见偏倚

FDA 发布的《药物和生物制品外部对照试验设计与实施的考虑因素》[6]对可能影响内外部研究间可比性的因素进行了总结,包括时间差异(临床治疗相关标准可能会随着时间推移发生变化)、地域差异(不同的地理区域和卫生保健系统)、诊断差异、预后差异、治疗差异(既往治疗、合并治疗、生物标志物等)、随访期(观察开始日期)、伴发事件(对于发生影响疗效评价的补救治疗、因为无法耐受而终止治疗等)、终点差异、缺失数据等。

目 前,Li 等[14]对EC 组 设计中常见的偏倚进行了总结,可能出现的偏倚类型包括但不限于:①由于EC 组与当前研究间受试者基线协变量特征的不可比而导致选择偏倚,例如人口学因素、地域因素、预后因素和治疗因素等。②由于EC 组没有对一些重要的、与结局相关的基线协变量进行收集,从而导致未测量的混杂偏倚。③在数据采集质量方面,对于基线协变量以及其他临床检查和检测的具体评估方式、工具和时间在研究间不一致,从而导致基线测量偏倚和错分偏倚。④从研究开展的时间上看,当使用历史对照组时,不同研究所处于的医疗背景不同,疾病的护理标准、治疗类型、支持性护理方案以及确定疾病反应或进展的标准等很可能随着时间的推移而发生改变,从而导致时间趋势偏倚。⑤对于终点指标而言,当EC 组中终点指标的定义和测量与当前研究不一致时,将导致终点测量偏倚和错分偏倚。此外,《药物和生物制品外部对照试验设计与实施的考虑因素》[6]还提到了永恒时间偏倚,具体是由临床研究开始、结束和中间随访的时间点定义不一致所导致,例如观察开始时间存在差异导致EC 组的生存时间更长。

乐城先行区特许药械单臂研究设置的EC 多来源于观察性RWD,可以采用非随机干预性研究偏倚评估工具(risk of bias in non-randomized study of interventions,ROBINS-I)[15]进行整体偏倚风险评估。ROBINS-I 涉及7 个领域的偏倚,包括混杂偏倚、研究对象选择偏倚、干预分类偏倚、偏离既定干预的偏倚、缺失数据偏倚、结局测量偏倚和结果选择性报告偏倚。通过偏倚风险评估工具,研究者和监管机构可以根据偏倚程度和方向评价研究质量并进行循证决策。

2 特许药械RWS 中EC的统计分析方法

2.1 频率学派

在统计分析阶段,选取合适的统计模型进行偏倚控制是特许药械RWS 中设置EC 的关键环节。常用的多变量分析方法包括多重线性回归模型、Logistic 回归模型、Cox 比例风险回归模型以及相应多水平模型等。此外,基于因果推断的模型也被广泛用于疗效评价的统计分析中,如倾向性评分、工具变量、边际结构模型和结构方程模型[16]。

基于倾向性评分的频率学派方法最为常用。倾向性评分最初 由Rosenbaum 和Rubin 提出[17]。对于双臂研究而言,倾向性评分是指具有某种基线协变量特征X的受试者被分配到试验组(W=1)的条件概率,即e(X)=Pr(W=1|X)。基于强可忽视性假设,倾向性评分是一种平衡得分,即对于倾向性得分相同的受试者,其基线协变量特征的分布是相同的[17]。但在EC 组设计背景下,倾向性评分的定义有所改变,此时倾向性评分是指具有某种基线协变量特征X的受试者被纳入当前研究(S=1)的条件概率[18-20],即e*(X)=Pr(S=1|X)。但不变的是,当EC 受试者与当前研究受试者具有相同的倾向性评分时,他们的基线协变量分布理论上是一致的。基于倾向性评分,可以通过匹配、分层、逆概率加权等方法处理EC,得到一个与当前研究人群基线特征相近的外对照伪人群,从而减少混杂和偏倚的影响[21]。为了满足前瞻性设计的原则以及相关指导原则中关于挑选EC 组需要避免依赖结局信息的要求,需要将基线协变量信息与结局信息区分开来[20,22-23]。因此,倾向性评分的估计以及基于倾向性评分所进行的匹配等操作需要在盲态下或在设计阶段进行[20]。如何准确估计倾向性评分对于结果准确性十分重要。倾向性评分一般通过基于模型的方法进行估计,既有参数法,如Logistic 回归模型;也有其他非参数方法,如广义Boosted 模型[24]。在研究设计阶段,需要对疾病的发生、发展以及适应症的特点进行深入研究,对可能存在的偏倚和混杂重点分析,最终确定倾向性评分估计所需要的协变量[25]。相关指导原则也建议在方案中明确协变量的属性,如效应修正因素、危险因素、混杂因素(包括时依混杂因素)等[25]。

2.2 贝叶斯学派

基于贝叶斯分析方法在处理不确定性和多源异质数据汇总问题上的灵活性及其自身具有的数据更新思想,其十分适用于处理EC 组的信息借用问题。使用贝叶斯方法借用EC 组信息主要依赖可交换性假设[26]。基于以下5种不同程度的可交换性假设,衍生出不同的贝叶斯外对照借用方法[27]。

假设1:内外部对照组完全相等。内外部对照组的结局服从同一个分布,可将两者直接合并后进行分析。

假设2:内外部对照组相等但需进行折扣。内外部对照组的结局服从同一个分布,但由于样本量以及抽样误差等原因可能导致内外部参数存在差异,因此在利用EC 组数据的过程中会对其进行折扣或降权处理。

假设3:内外部对照组相似。该关系假设针对的不是个体水平的可交换性,而是聚焦于研究水平的可交换性,这与Meta 分析随机效应模型的思想一致,一般在贝叶斯分析的框架下采用层次先验。

假设4:内外部对照组有偏。该关系假设内外部对照组的结局存在差异,在统计分析中需要对差异参数进行估计。

假设5:内外部对照组完全无关。在该关系假设下,内外部对照组的结局完全不可比,此时无法利用EC 组的数据支持当前研究的统计分析。

基于内外部对照组完全相等进行假设时,IC 组与EC 组分别记为D1和D0,θ为目标参数,L(θ|D)为相应似然函数,目标后验分布为p(θ|D0,D1),由贝叶斯公式可知:

其中,π(θ|D0)为由EC 产生的先验分布。先验分布为p(θ|D0),利用贝叶斯公式可得:

其中,π(θ)为参数的初始先验,一般选取无信息先验。

基于相等但需进行折扣进行假设时,不同的贝叶斯外对照借用方法对L(θ|D0)π(θ)的处理不同。幂先验(power prior,PP)最初由Ibrahim 和Chen提出[28-29]。该方法引入了一个折扣系数δ(0 ≤δ≤1)对EC 组的似然函数L(θ|D0)进行降权处理,由于似然函数值可以认为是代表了EC 组的信息量,对其进行降权处理实际上就是对借用EC 组信息量的控制。PP 法的表达式为:

折扣系数作为EC 组似然函数的幂,其值在0~1 范围内。当δ=0 时意味着可交换性假设不成立,没有借用任何EC组的信息;而当δ=1 时则意味着可交换性假设成立,相当于完全借用EC 组的信息;折扣系数大小的选择与可交换性假设相关联。

基于相似性关系进行假设,相应的贝叶斯外对照借用方法有Meta 分析预测先验(Meta analytical prior,MAP)[27]、稳健MAP[30]以及层次先验[30]等。此外,Hobbs 等[31-32]还提出了相称性先验法(commensurate prior,CP),其具体表达式为:

其 中,θc0为IC 参数,θh为EC 参数,参数τ称作异质性参数,π(τ)为其初始先验。π(θc0|θh,τ)被称作为CP,一般选取正态分布,即N(θc0|θh,1-τ)。此时,参数τ成为唯一调节EC 组信息借用程度的参数。当参数τ趋向0 时意味着θh与θc0差异很大,不借用EC 组数据;当参数τ趋向∞时,代表θh与θc0差异很小,EC 组数据将被全部借用。

如何确定EC 组的信息借用程度是使用EC 组设计时需要重点解决的问题[18]。贝叶斯外对照借用方法主要基于内外部对照组间可交换性的满足程度来确定EC组的信息借用量。例如PP 需要根据可交换性程度确定其折扣系数[28-29,33]、CP 需要估计反应可交换性程度的异质性参数[31]等。值得注意的是,对于这些衡量可交换性程度的参数,部分方法采取了“动态借用”[34],即根据内外部对照组边际结局的实际差异程度,通过数据驱动的方式客观地确定参数,而不是基于既往经验认识在观察到结局发生前主观地确定[35]。

目前主要的贝叶斯外对照借用方法中,具有动态借用性质的有:改 良PP[33]、校 正PP[36]、CP[31]、弹性先验及其衍生先验[37]、多源可交换模型(multisource exchangeability models,MEMs)[35]、层次先验以及MAP 及其衍生先验[27,30]等。

2.3 倾向性评分与贝叶斯相结合的统计分析方法

EC 设计中,保证当前研究与EC 组的受试者在基线协变量上的可比性非常重要。ICH E10指出,保证研究间受试者的可比性是选择EC 组需要满足的条件之一,可以减少由缺少随机化带来的选择偏倚影响[38-39]。从时序关系上看,保证组间基线协变量均衡可比也是事先保证边际结局可交换性假设的唯一途径[26]。然而单独使用贝叶斯外对照借用方法并未考虑到基线协变量特征分布的可比性问题,容易引入选择偏倚。

为了解决上述问题,有学者提出了倾向性评分方法学与贝叶斯外对照借用方法学相结合的策略,主要为序贯两阶段法,即设计阶段和分析阶段[20]。具体而言,设计阶段主要包含倾向性评分的估计以及利用匹配、分层、加权的方法构建协变量可比的伪人群,此时不涉及任何结局信息;分析阶段主要涉及贝叶斯外对照借用方法的使用,主要是先验分布形式的确定等。

以PP 为例,Lin 等[24]将倾向性评分匹配与 PP 相结合。在设计阶段使用倾向性评分匹配的目的是在EC 组中找到与当前研究基线协变量分布可比的受试者;在分析阶段,Lin等则是直接使用匹配后EC 组受试者的倾向性评分估计值,这样得到的目标参数θ幂先验分布表达式为:

其中NCH代表匹配后EC 组受试者样本量,参数δ j代表匹配后EC 组受试者的倾向性评分估计值。

除PP 外,其他贝叶斯外对照借用方法学也可以与倾向性评分相结合。例如,CP 结合倾向性评分匹配、分层和加权[40],倾向性评分分层与MAP[41]、层次先验、混合先验以及弹性幂先验相结合[42]等。

3 小结和展望

在乐城先行区特许药械单臂RWS 中,增加EC 可进一步加强研究结果的解释性,进而提高证据质量。在新时代临床研究背景下,前瞻性队列数据和临床试验数据的积累、保险记录和电子病历的存储等均为EC 提供了丰富多样的数据来源。在研究设计阶段,通过符合监管要求的数据治理形成高质量研究型数据库,通过严谨的研究设计为特许药械有效性和安全性证据链条的搭建以及偏倚控制提供框架;在统计分析阶段,需要根据内外部研究的可交换性,针对性地选择合适的统计分析方法,有效控制偏倚,产生高质量的循证决策证据。

目前,在乐城先行区特许药械RWS 中设置EC 相关创新型研究设计(如类三臂研究设计)和统计分析方法(贝叶斯学派统计分析方法以及贝叶斯与频率学派相结合的统计分析方法)均处于框架构建和统计模拟等理论阶段,尚需要大量在不同场景下的实例研究以评价可行性。乐城先行区进口特许药械品种逐年增多,通过乐城先行区RWS 进行注册上市的需求也日益扩大,为相关方法学研究提供了大量实践机会。因此,建议进一步鼓励和加速推进设置EC 的RWS 方法学及实证研究,以期为特许药械注册上市提供高质量研究证据,扩大特许药械在我国人群中的可及性和惠及面。

猜你喜欢

乐城药械倾向性
基于模糊数学法的阿舍勒铜矿深部岩体岩爆倾向性预测
坚韧前行路自宽——记烟台计生药械有限公司
乐城先行区实现“两个100例”突破
乐城全球特药险推出的背后
乐城社区太极队推广普及太极拳为广外街道全民健身奉献力量
坚韧前行路自宽——记烟台计生药械有限公司
药械采购的“浙江之路”
关于医患冲突报道的倾向性分析——以“湘潭产妇死亡案”为例
“没准儿”“不一定”“不见得”和“说不定”的语义倾向性和主观性差异
永旺梦乐城北京丰台开业