临床试验统计分析计划及统计分析报告的考虑
2015-01-27CCTS工作组执笔
CCTS工作组 贺 佳(执笔)
·CCTS共识·
临床试验统计分析计划及统计分析报告的考虑
CCTS工作组 贺 佳(执笔)
统计分析计划(statistical analysis plan,SAP)是对临床试验的统计学考虑及拟对数据进行统计分析的清晰描述。统计分析计划可以是独立的文件,其内容涵盖试验中所涉及的所有统计学考虑,且具有技术性和可操作性,包括了设计的类型、比较的类型、随机化与盲法、主要指标和次要指标的定义与测量、检验假设、数据集的定义、疗效及安全性评价和统计分析的详细计划。另外,临床试验方案中也包括统计分析计划或统计学考虑部分,其内容是独立的统计分析计划的主要部分。统计分析报告(statistical analysis report,SAR)是依据统计分析计划,对试验数据进行统计分析后形成的报告,是临床试验结果的重要呈现手段,是撰写临床研究报告(clinical study report,CSR)的关键依据。针对统计分析计划和统计分析报告所涉及的内涵,中国临床试验生物统计学工作小组(CCTS)经过充分讨论,形成如下共识。
一、意义
为了有效地控制分析偏倚,保证试验结论的科学性,应在试验设计阶段计划最终的统计分析策略,数据锁定前应确定统计分析计划,数据锁定后按计划进行统计分析。统计分析报告是提供给主要研究者撰写临床试验总结报告的关键文件,是科学、完整、准确、合理地撰写临床试验报告的依据。本文主要针对药物临床试验的要求进行阐述,相关内容也可以作为医疗器械等临床试验的参考。
二、统计分析计划的制定时间
试验方案中的统计分析计划应与试验方案同时完成,是统计分析的核心内容。作为独立文件的统计分析计划初稿应形成于试验方案和病例报告表确定之后,是方案中的统计分析计划的扩展,在临床试验进行过程中以及数据盲态审核时,可以进行修改、补充和完善,不同时点的统计分析计划应标注版本,正式文件在数据锁定之前完成并予以确认。如果试验过程中试验方案有调整,则统计分析计划也应作相应的调整。如果涉及期中分析,则相应的统计分析计划应在期中分析前确定。
三、统计分析计划的基本内容
临床试验的统计分析有其特殊性,统计分析计划应当由具有参与临床试验经验的统计学专业人员起草,并与主要研究者商定后完成,要求全面而详细地陈述临床试验数据的分析方法和表达方式,以及对统计分析结果的解释。
统计分析计划包括的基本内容:(1)试验概述; (2)统计分析;(3)统计分析图表模板。
1.试验概述
研究方案中与统计学相关的部分,常可直接摘录自方案。试验概况一般包括以下主要内容:
(1)研究目的:临床试验的主要目的和次要目的。
(2)设计类型:如平行组设计、交叉设计、析因设计、成组序贯设计等。
(3)对照的类型:如安慰剂对照、阳性对照、剂量组对照等,若采用无对照试验设计,需说明理由。
(4)随机化方法及其实施:明确随机化方法,如区组随机、分层随机及其分层因素、中央随机化及其所控制的基线因素等。
(5)盲法及设盲措施:说明盲法是单盲还是双盲,设盲措施是双盲单模拟、双盲双模拟等,以及保持盲态下执行统计分析的措施。
(6)主要评价指标和次要评价指标的定义:清晰描述主要指标和次要指标的定义,包括具体观察和测量的方法、观察时点、指标属性。如果主要指标需要计算得到,则需给出相应的计算公式。明确主要指标数据缺失的填补方法及理由。
(7)比较类型及检验假设:明确临床试验的比较类型,如优效性检验、非劣效性/等效性检验及其界值等。明确写出主要指标进行统计学检验的原假设和备择假设、I类错误率、II类错误率等。
(8)样本量:摘录方案中的计划入组的受试者数量及其计算依据。
(9)分析数据集的定义:一般情况下,临床试验的分析数据集包括全分析集(full analysis set,FAS)、符合方案集(per protocol set,PPS)和安全性数据集(safety set,SS),或其他的数据集(如抗感染试验中细菌学检查的数据集)等。根据不同研究目的,在统计分析计划中需明确描述数据集的定义。在定义分析数据集时,需遵循两个原则:①尽可能地减小偏倚;②防止I类错误的增加。明确不同数据集在有效性和安全性评价中的地位。对主要指标缺失值的填补方法需要明确说明。当涉及亚组分析时,需要对亚组给出明确定义。
(10)协变量:主要指标分析模型中是否需要纳入协变量,纳入协变量的理由需要事先明确说明。
(11)依从性分析:包括研究时间、药物暴露时间、药物使用量以及方案偏离发生率的组间比较。试验期间的未禁止使用的合并用药、合并治疗的分析方法应明确。
(12)敏感性分析:对于非事先规定的缺失数据的填补、亚组分析、不同数据集分析、不同协变量的调整等,可进行敏感性分析,考察对试验结果的影响。将所分析的结果作为参考,与事先确定分析的结果进行比较,分析所得结论的一致性,考察结果的稳定性。敏感性分析可以作为主要分析的附加支持,但不能作为结论的主要依据。
2.统计分析
统计分析计划中,应当说明统计分析所用的方法、检验假设及检验水准,所用统计软件及其版本信息等内容。临床试验的统计分析应当采用国内外公认的、可靠的统计分析软件。
(1)统计分析方法
临床试验数据分析应采用国内外公认的统计分析方法,应根据研究目的、试验方案和不同指标明确所选择的统计分析方法。
①描述性统计分析
一般多用于病例筛选情况、人口学资料、受试者分布、基线资料、依从性和安全性资料,包括对主要指标和次要指标的统计描述。
②参数估计和假设检验
参数估计和假设检验是对主要指标及次要指标进行评价的必不可少的手段。统计分析计划中,应当说明要检验的假设和待估计的处理效应、以及相应的统计分析方法和/或统计模型。处理效应的估计应同时给出置信区间,并说明估计方法。假设检验应说明所采用的是单侧还是双侧检验。
③协变量分析
对主要指标进行分析时,若需考虑某些协变量的影响,如受试者的基线情况、分层因素、中心效应等,应在统计分析计划中明确哪些因素作为协变量,明确相应的统计模型。
对于多中心临床试验,在分析主要指标时,通常要考虑中心效应,需描述各中心不同组别的疗效。此外,还需检验中心与处理组别的交互作用,用于分析中心间处理效应的异质性。如果不存在中心与组别的交互作用,可认为各中心的处理效应同质,估计处理效应的统计模型中不应包含中心与组别的交互作用项;反之,则说明各中心处理效应异质,应进行相应的敏感性分析,遵从保守的原则解释效应异质性对试验的统计学结论的影响。
④安全性分析
安全性指标的分析方法需在统计分析计划中指明。
安全性评价常用统计指标包括各种不良事件发生率、不良反应发生率、重要不良事件发生率、严重不良事件发生率,以及实验室检查指标由基线时的正常变为随访时的异常率。
在大多数试验中,对安全性指标的分析常采用描述性统计分析方法,所有的不良事件均需列出。当样本量足够时,可用χ2检验、Fisher精确概率法、Poisson模型等方法进行组间比较,必要时辅以置信区间。
⑤缺失数据和离群值的处理
缺失数据是临床试验中偏倚的潜在来源之一。在统计分析计划中需要事先说明对缺失数据的处理方法。目前对缺失数据的处理没有统一的标准,一般需要考虑所采用的缺失数据处理方法对统计分析结果的影响,并进行敏感性分析。如果在方案中没有事先说明对缺失数据的处理方法,则需要同时对未填补和填补后数据进行分析,并比较两者的结果。
离群值问题的处理,应当从医学和统计学专业两方面去判断,尤其应当从医学专业知识判断。探索离群值对结果的影响,需要注意的问题与缺失数据的处理类似。
⑥其他问题
如果试验有衍生变量,需要在统计分析计划中对衍生变量的计算方法,所涉及的变量进行详细描述。
(2)检验水准
统计分析采用单侧检验还是双侧检验以及检验水准应当具体说明。传统差异性检验通常为双侧检验,α常不大于0.05;非劣效性试验或优效性试验通常为单侧检验,α常取0.025;等效性试验为双单侧检验(two one-sided tests),两次检验的α通常都统一取单侧0.025(也即双侧的0.05)。生物等效性试验的α取单侧0.05(即双侧的0.10)。
(3)期中分析
如果要进行期中分析,则需要在统计分析计划中对期中分析的事件数、信息时间、次数、α调整方法、具体的假设检验或参数估计方法、提前终止临床试验的标准等做出详细说明。
(4)亚组分析
如果临床试验需要进行亚组分析,需要在统计分析计划中详细定义亚组,并说明分析的指标、分析方法等,说明亚组分析结果与结论的关系。如果亚组分析的结果是试验的主要结论,则样本量估计时需要考虑亚组的样本量,以保证有足够的检验把握度。
(5)多重性问题
如果临床试验涉及多重性问题,需要在统计分析计划中详细说明分析方法、检验水准的调整等。
3.统计分析图表模板
统计分析结果通常以统计分析表或图的形式呈现。统计分析表格应该以简明的格式、精炼的文字描述所有相关信息。在统计分析计划中,应该对统计分析结果呈现的相关表格的内容、格式和布局进行设计,利用统计分析图表模板对统计分析报告中结果的形式轮廓进行描述。
统计分析计划中的所有分析考虑都应清楚地标出分析所用数据集、分析的指标(包括单位)、访视时间、处理组别、分析方法等。为了便于阅读、更新和管理,在统计分析计划上注明版本、产生日期、页码和参考文献等。
统计表格的设计应明确主谓,分清层次,简明扼要,统一格式,方便阅读。统计表格应避免过长、过大、过于拥挤。内容较多时,可拆分成几个表格。
表格应按照指标重要性依次排列,将最重要的表格放在最前面。
四、统计分析报告
数据锁定后,程序员根据统计分析计划完成编程和计算,统计分析专业人员根据统计分析计划和计算得到的结果完成统计分析报告,然后提供给临床研究的主要研究者用以撰写临床试验报告。统计分析报告中应写明具体的统计分析人员、程序员,并签字。
1.统计分析报告的基本内容
统计分析报告是对临床试验的统计设计、分析、结果的总结,是临床试验报告的基础和依据,其基本内容应包括:(1)试验概述;(2)统计分析方法;(3)统计分析的结果与结论:一般采用统计表、统计图表示。统计分析报告中的所有结论应采用准确的统计学术语阐述。
统计分析报告中的试验概述、统计分析方法应与统计分析计划一致。
2.统计分析报告中的统计图表
统计分析报告中的统计图表一般应包括以下八部分。
(1)受试者的分布
统计分析报告中应写明所有入组的受试者的分布情况,包括筛查人数、剔除人数及原因、参与随机化的人数、各组脱落/剔除受试者的例数、百分比等。除文字、表格描述外,应采用流程图的方式描述受试者的分布情况。参见图1。
(2)脱落/剔除的受试者
脱落(drop out)是指临床试验过程中受试者由于各种原因不能完成试验规定的全部流程而提前退出。脱落的原因可以是不良事件、缺乏疗效、失访、主动撤回知情同意书等。剔除(removal)是指在试验过程中或数据盲态审核时,试验者发现受试者严重违背入选标准、未接受试验药物治疗等原因而停止对该受试者进行临床试验或剔除在分析集以外。
(3)各分析数据集的分布
在盲态数据审核时,需要明确每位受试者进入的分析数据集,列表说明各分析数据集的分布,详细描述每一位因脱落/剔除等原因未进入各分析数据集的受试者的情况,如受试者编号、中心、入组时间、脱落/剔除原因及时间等。
(4)依从性情况
根据依从性定义,明确各受试者完成试验的情况,列表描述依从性差的受试者、依从性差的具体原因及进入分析数据集情况。
(5)基线可比性分析
对于人口学资料、既往病史、家族史、药物过敏史以及疗效指标的基线值等数据常采用统计描述的方式进行可比性分析。计量资料一般用均数、中位数、标准差、四分位数、最大值和最小值等进行描述;计数及等级资料一般用频数和百分比描述。
(6)疗效分析
对于反映疗效的主要和次要指标,需根据事先确定的统计分析方法进行统计描述和统计推断,包括指标基线情况、治疗后各访视点的测量值及前后变化情况,以及变化值组间差异的描述性统计量、置信区间和组间比较的检验统计量及P值等。对于主要指标,还需要根据事前确定的模型进行综合分析,采用控制基线协变量、中心效应等因素的模型比较组间差异,根据事先确定的标准,从统计学角度,判断主要指标的优效性/非劣效性/等效性的假设是否成立。
(7) 安全性分析
安全性评价的资料主要来源于受试者的主诉、症状、体征以及实验室检查结果等。所有的安全性指标在评价中都需要高度重视。
对不良事件发生的分析,常按照严重程度分为不良事件、重要不良事件和严重不良事件,并按照是否与试验药物有关分为肯定有关、可能有关、可能无关、无关、无法判定5个等级,将肯定有关、可能有关、无法判定的不良事件列为不良反应。常用事件发生的频数、频次和发生率描述,并进行组间发生率的比较,需要分类列出各种不良事件、不良反应的发生率并进行组间比较。列表描述每位受试者每项不良事件/不良反应发生的详细情况,包括不良事件的类型、严重程度、发生和持续时间、结局以及与试验药物及药物剂量的关系等。
对实验室指标的比较和评价,主要关注治疗前正常而治疗后异常的发生情况,以及治疗前异常但在治疗后加重的受试者,需列表描述上述两种情况。生命体征、心电图、体格检查以及其他安全性相关指标的分析与实验室检查指标的分析类似。必要时,进行实验室指标前后变化及组间比较的分析。
在大多数试验中,对安全性指标的分析常采用描述性统计分析方法,必要时辅以置信区间。
(8) 合并用药分析:关于试验期间的合并用药分析,与不良事件的分析方法类似。需列出合并药物的详细情况,如受试者编号、中心、组别、合并药物名称、使用原因、开始时间、结束时间等,进行组间合并用药的比较。
五、常见问题回答
1.在统计分析计划中,当主要指标在FAS和PPS数据集中的分析结论不一致时,如何考虑?
答:在确证性试验中,FAS和PPS在优效性试验和非劣效性、等效性试验中的作用是不一样的。在优效性试验中,FAS通常是主要的分析集,因为它纳入了依从性不好的受试者,因此更加保守。但是在非劣效性试验或者等效性试验中,FAS的结果则不一定保守,因此使用时需要谨慎。通常要同时对FAS和PPS进行分析,如果两个分析集的结果出现结论不一致时,应对其原因进行详细分析、讨论和解释。
2.在统计分析计划中,如何考虑基线不均衡的指标?是否需要引入统计模型对主要指标的分析进行校正?
答:在方案中应尽可能地考虑到影响疗效评价的混杂因素,并利用随机化、统计模型等方法对其进行校正,但必须在方案中事先规定好要考虑的因素。对于方案中没有事先规定的因素,即使后来的分析结果显示组间不均衡也不必对其进行校正。但需考虑敏感性分析,讨论不一致的原因。
3.数据锁定后,需要修改统计分析方法,是否可以?
答:一般不可以。若要修改事先确定的统计分析方法,必须给出充分的理由,并按照规定的批准程序履行手续后方可实施。
4.对于轻度违背方案的受试者,是否可以进入符合方案集(PPS)?
答:纳入符合方案集的受试者一般具有以下特征:(1) 完成事先设定的试验药物的最小暴露量:方案中应规定受试者服用药物的依从性达到多少为治疗的最小量。若未达到,则作为重大的违反方案而从符合方案集中剔除;(2) 主要指标可以测定:通常指试验前后主要指标均可以测得;(3) 未对试验方案有重大的违背。对于未达到方案中事先规定的“重大违背方案”标准的轻度违背方案者,仍可考虑进入符合方案集。为慎重起见,凡属分析数据集确定时遇到的疑问,都应该由参加盲审的各方共同讨论决定。另外,如何界定违背临床试验方案是轻度还是重度,不同的临床试验,判断的标准不尽相同,需要特别讨论,并事先定义。
5.多中心临床试验中,对主要指标进行分析时如何考虑中心与组别的交互作用?
答:对于多中心临床试验,在分析主要指标时,通常要考虑中心效应,需描述各中心不同组别的疗效。此外,还需检验中心与处理组别的交互作用,用于分析中心间处理效应的异质性。如果不存在中心与组别的交互作用,可认为各中心的处理效应同质,估计处理效应的统计模型中不应包含中心与组别的交互作用项;反之,则说明各中心处理效应异质,应进行相应的敏感性分析,遵从保守的原则解释效应异质性对试验的统计学结论的影响。
[1]化学药物和生物制品临床试验的生物统计学技术指导原则GCL4 -1.2005.
[2]ICH Steering Committee.Statistical Principles for Clinical Trials (E9)//International Conference on Harmonization of Technical Requirements for Registration of Pharmaceuticals for Human Use.International Conference on Harmonization,1998.
[3]ICH E.General considerations for clinical trials//London,UK:International Conference on Harmonization.1997.
[4]International Conference on Harmonization Working Group.ICH harmonized tripartite guideline:guideline for good clinical practice E6 (R1)//International Conference on Harmonization of Technical Requirements for Registration of Pharmaceuticals for Human Use,1996,10.
[5]North PM.Ensuring good statistical practice in clinical research:guidelines for standard operating procedures (an update).Drug Information Journal,1998,32(3):665-682.
[6]ICHE.Structure and content of clinical study reports//London,UK:International Conference on Harmonization.1995.
[7]邓伟,贺佳主编.临床试验设计与统计分析.北京:人民卫生出版社,2012.
(责任编辑:郭海强)
中国临床试验生物统计学组成员(按姓名拼音排序):陈峰、陈平雁、陈启光、贺佳、黄钦、金丕焕、李康、李宁、李卫、李晓松、凌莉、刘玉秀、苏炳华、孙高、王武保、王彤、魏朝晖、夏结来、姚晨、易东、尹平、于浩、张罗漫、赵耐青。