中药新药临床研究数据管理应用CDISC标准的初步探讨
2016-01-11陆芳李庆娜赵阳高蕊
陆芳 李庆娜 赵阳 高蕊
摘要:以一个中药新药Ⅲ期临床研究为例,简要介绍在数据库中构建人口统计学、受试者特征、临床事件、病史、量表、实验室检查、不良事件等7个中药新药临床研究中常用的数据采集模块,以及将其转换到研究数据表格模型(SDTM)的过程,探讨临床数据交换标准协会(CDISC)临床数据交换标准在中药新药临床研究中应用的可行性和需要注意的问题。
关键词:中药新药临床研究;临床数据交换标准;数据管理
DOI:10.3969/j.issn.1005-5304.2016.01.002
中图分类号:R2-05 文献标识码:A 文章编号:1005-5304(2016)01-0009-06
A Preliminary Discussion of Application of CDISC Standards in Clinical Research Data Management of New Traditional Chinese Medicine LU Fang, LI Qing-na, ZHAO Yang, GAO Rui (Clinical Pharmacology Institute of Xiyuan Hospital, China Academy of Chinese Medical Sciences, Beijing 100091, China)
Abstract: In this article, a new TCM clinical trial of phase Ⅲ was served as an example of application of Clinical Data Interchange Standards Consortium (CDISC). It briefly introduced seven data acquisition modules commonly used in clinical research of new traditional Chinese medicine, namely demographics, subject characteristic, clinical event, medical history, questionnaire, laboratory inspection and adverse event. It also introduced the process of transferring the above modules to Study Data Tabulation Models (STDM), and discussed the feasibility and some issues that required attention of CDISC application in clinical research of new traditional Chinese medicine.
Key words: clinical research of new traditional Chinese medicine;clinical data interchange standards;data management
临床数据交换标准协会(Clinical Data Interchange Standards Consortium,CDISC)是一个全球性的、开放的、多学科的、非盈利性组织,通过建立一系列临床研究数据的标准,如临床数据采集标准(Clinical Data Acquisition Standards Harmonization,CDASH)、实验室数据模型(Laboratory Model,LAB)、操作数据模型(Operational Data Model,ODM)、研究数据表格模型(Study Data Tabulation Model,SDTM)、分析数据库模型(Analysis Dataset Model,ADaM)等,来支持临床研究数据与元数据的采集、交换、递交和储存,以优化研究实施、数据交流、统计分析及最后向管理部门递交资料的流程,大大缩短研究周期、节省费用[1]。2014年12月,美国食品药品监督管理局(Food and Drug Administration,FDA)发布了具有约
束力的数据申报标准指南,要求24个月后开始的临床试验必须使用FDA要求的标准、格式和术语进行注册申请递交,以避免管理部门在审查研究数据时花费较多的资源[2]。我国药政当局也正在着手制定适合我国,特别是中药新药临床研究的数据采集和申报标准,本文从中药新药研究应用CDISC标准实例出发,探讨其应用的可行性和需要注意的问题。
1 建立机构临床研究数据采集标准
笔者曾对CDISC标准进行过解读[3],CDASH由CDISC于2008年10月制定,其目的是简化和规范各个临床研究中心的数据采集,为设计病例报告表(Case Report Form,CRF)提供标准。其由一个基本的数据采集字段集(包括定义变量名称、解释、元数据)组成,适用于临床研究阶段绝大多数CRF的设计。SDTM围绕着临床研究过程中采集的一系列观察信息构建,它规定递交到药政管理部门的临床研究数据库和数据库变量的标准,包括数据库的结构、目的、特征和其所包含的内容,从而使评审人员能够正确理解所递交的数据库信息。
要提交符合SDTM的数据,为减少后期数据库的映射工作,最捷径的做法是在创建数据库时即按照CDASH和SDTM对变量及元数据进行定义,并通过define.xml文件对数据的结构和内容进行描述。笔者参照CDASH和SDTM制定了本机构临床研究数据采集标准,其中数据采集模块共分为18大类,即一般识别变量(Common Identifier Variables)、不良事件(Adverse Events,AE)、伴随治疗(Concomitant Medications,CM)、人口统计学(Demographics,DM)、研究处理情况(Disposition,DS)、药物依从性(Drug Accountability,DA)、心电图检查(ECG Test Results,EG)、研究药物(Exposure,EX)、纳入排除标准(Inclusion/Exclusion Criteria Not Met,IE)、实验室检查(Laboratory Test Results,LB)、病史(Medical History,MH)、体格检查(Physical Examination,PE)、方案偏离(Protocol Deviation,DV)、受试者特征(Subject Characteristics,SC)、物质使用情况(Substance Use,SU)、生命体征(Vital Signs,VS)、量表(Questionnaire,QS)、临床事件(Clinical Event,CE)。数据库中的变量分为CDISC和机构标准,能够直接按照CDASH或SDTM命名的变量为CDISC,否则为机构标准,在中药新药临床研究中参照此标准进行数据采集。
2 研究实例分析
以一个中药新药Ⅲ期临床研究为例,简要介绍临床研究中需要采集的受试者特征、人口统计学、临床事件、病史、量表、不良事件、实验室检查等7类数据及将其转换为便于药政管理部门审核的SDTM数据集的过程。
研究实例:A药治疗急性气管-支气管炎(痰热阻肺证)随机双盲、安慰剂平行对照、多中心Ⅲ期临床研究。研究对象为符合急性气管-支气管炎西医诊断标准及痰热阻肺证中医辨证标准,年龄在18~65岁之间,自愿签署知情同意书者。试验组药物为A药(10 mL/次,每日3次),对照组为安慰剂(10 mL/次,每日3次),疗程6 d。主要疗效指标为咳嗽、咳痰症状的改善。本试验数据管理基于电子化数据管理系统,在临床试验开始前,需要对整个试验中的数据管理做出安排,根据试验方案及相关文件,制定数据管理计划。参考机构数据采集标准,明确所要收集的数据及其类型,设计数据采集表格。为方便后期数据库的建立、数据的录入和提取,在设计数据采集表格时,参考CDASH,尽量以CDASH提供的域为单位进行CRF模块布局,使用各域中推荐的变量,其他变量根据方案要求灵活选择;同时,使用CDISC提供的受控术语作为变量结果代码。完成纸质CRF的设计及注释后,在电子数据采集系统中构建电子病例报告表(eCRF)。在数据库设计阶段引入CDISC标准,保持数据标准的统一和数据的可追溯性,可从数据库中直接抽取出大量符合SDTM的数据集,进而减少后期繁杂的映射转换。
2.1 受试者特征
SC是与受试者相关,并且没有被采集到其他域中的数据。如受试者姓名拼音首字母、婚姻状况、受教育程度等。SC域是DM数据的扩展,每位受试者只采集1次数据,一般情况下试验期间该域中的数据是不会更改的。
从电子化数据管理系统导出的数据看,SC数据集为非标准化结构(见表1)。经过转换,原来在数据库中的变量名“MARISTAT(婚姻)”、“EDLEVEL(受教育程度)”“EMPJOB(工作性质)”转化为变量“SCTESTCD(受试者特征简称)”和“SCTEST(受试者特征)”的观测结果,数据结构呈现符合SDTM的结构(见表2)。
2.2 人口统计学
DM数据的结构是固定的,包括出生日期、年龄、性别、民族、人种及国家。在创建DM模块变量池时,为了收集受试者的民族信息情况,我们使用了CDASH中的变量ETHNIC(族群),另外建立了一个变量“ETHNIOTH(其他民族)”,作为机构标准(见表3的CDASH数据集)。在转化为SDTM数据集时,按照CDISC中“RACEOTH(其他人种)”的处理方式,将相关数据放在DM域补充数据集(见表3的SUPPDM数据集)中。对于以SDTM形式上报的数据,要定义一段时间作为受试者“接受试验干预”的参照时间段,开始和结束日期分别以变量“RFSTDTC(参照开始日期)”和“RFENDTC(参照结束日期)”表示。RFSTDTC是为研究开始的第1日,在本实例研究中,根据试验方案,把这段时间定义为从第1次服药日期到最后1次服药日期的时间。
2.3 临床事件
CE域是获取研究中疾病的发作症状或体征,或者虽然可能导致不良事件,但事件本身并不构成不良事件。本实例的研究疾病是急性气管-支气管炎(痰热阻肺证),有关该疾病的诊断信息,为区别于既往病史信息的采集,将其记录在CE域。需要说明的是,在CDASH中并没有CE域,为了方便数据收集,在建库时分西医诊断和中医辨证2个变量收集原始数据,后期再转换为纵向CE数据集。事件名称需转换为术语,由变量“CEDECOD(源于词典的术语)”收集,西医诊断可以使用国际医学用语词典(MedDRA)中的规范术语,中医辨证可参考《中医临床诊疗术语·证候部分》(GB/T 16751.2-1997)中的术语。见表4、表5。
2.4 病史
MH数据指受试者在试验开始之前的病史,包括一般病史、过敏病史、生殖病史或其他特定疾病的病史。本实例在数据库中采用1个病例多条记录的模式收集MH数据,导出的数据为纵向数据结构,其中以“MHCAT(病史分类)”区分“一般病史”和“过敏病史”(见表6)。“MHENRF(结束状态)”是根据研究参考时期定义病史的结束状态,对于参考时期的定义每个研究可以不同。本实例研究参考时期以人口统计学数据集中的定义为准,即以第1次服药日期作为研究开始时间,结束时间为最后1次服药日期。该参考时期内如果病史未结束,则结果记为“继续”,病史结束日期为“空”;否则,则要记录病史结束日期。
2.5 量表
QS设置的每个问题均有一个特定的数字“得分”,计算这些得分的总和可得到总评分。QS数据可包括但不限于受试者报告的结果及验证或未经验证的调查量表,如汉密顿抑郁量表、阿尔茨海默病评定量表等。
在中医临床研究中一般会收集中医临床症状积分情况,本例在建库时将中医症状观察作为QS域中的一个分类。对于这类标准二维表格式的数据,我们可以直接导出纵向结构数据(见表7采集数据集),转化为SDTM数据集时,我们将变量“QSCAT(量表分类)”赋值为“QSCSO(临床症状观察)”;对于变量“QSTESTCD(问题简称)”尚未形成规范的受控术语,则以模块名称QSCSO加阿拉伯数字的形式表示(见表7提交数据集)。变量“QSDY(研究天数)”描述了从参考日期作为第1日到本次访视量表填写日期的天数,该变量通过量表填写日期与DM域“RFSTDTC(参照开始日期)”的比较而得到。从RFSTDTC每过1 d“QSDY(研究天数)”的值就增加1,往前1 d变量值就减1。
2.6 不良事件
对于AE,和病史的数据采集一样,直接应用SDTM采集,在数据库中采用1个病例多条记录的模式收集数据,导出的数据为纵向数据结构,其SDTM数据集样式见表8。其中,必需变量“AEDECOD(字典编码事件名称)”一般使用MedDRA中的首选语(PT),但中医临床试验中出现的一些不良事件名称如“上火”“潮热”等还不能在MedDRA中找到规范的编码。此外,对于与该条AE关联的实验室检查结果,使用相关记录(RELREC)数据集进行关联,其关系类型(RELTYPE)为一对一(ONE),对该名受试者的关系标识符(RELID)为“A”(见表9)。
2.7 实验室检查
LB域存储CRF采集或来自中心实验室的检查数据。在本实例研究中,为了方便数据的采集,在建库时,将LB域分为几个亚模块,分别采集血常规、血生化、尿常规和便常规数据。在转化为符合SDTM标准要求的数据集时,需要将几个亚模块进行拼接,并将变量“LBCAT(实验室检查种类)”赋值为检查结果对应的亚模块的名称。例如,血常规检查数据对应的LBCAT的结果为“血常规”。另外,对于LB域,除了收集是否在正常值范围内外,还经常会收集“临床意义判定”和“异常解释说明”。但是在CDASH和SDTM中实验室检查域均无该变量,故笔者建库时在LB域中增加变量“LBCLSIG(是否有临床意义)”和“LBCOVAL(异常解释说明)”。在转化为SDTM标准变量时,将变量LBCLSIG记录在LB域补充数据集SUPPLB,变量LBCOVAL记录在注释域(Comment Domain,CO)中,以“RDOMAIN(关联域名)”、“IDVAR(标识变量)”和“IDVARVAL(标识变量值)”将LB域与补充数据集SUPPLB和COMMENTS数据集联系起来(见表10)。
3 讨论
从数据库建库开始引入CDASH和SDTM,具有一些明显的优势[4]。统一的数据收集定义可促进不同项目研究间数据库设计和结构的标准化,使数据直接以上报递交的SDTM格式储存,简化甚至消除了提取数据的再操作,使数据流程更加合理化[5]。但也存在一定缺陷,虽然CDASH是根据SDTM结构建立的数据采集标准,但毕竟二者的目的不同,因此增加了数据库内的映射复杂性。同时由于CDASH优化的线性法要依赖使用的数据库系统,如果其基本表结构对应并不友好的录入界面,还可能会使数据录入过程复杂化[6-7]。
通过实例分析,中医和西医之间其临床研究数据采集并没有太多差异,基本可以按照CDASH或SDTM中的域或变量结构来采集数据。同时,受控术语对于数据标准化亦很重要,CDISC受控术语是一套CDISC开发或CDISC采纳的标准表达(值),适用于CDISC定义的数据集里的数据条目,支持CDISC各个基本标准(如SDTM、CDASH、ADaM和SEND)及所有疾病/治疗领域数据标准对受控术语的需求[8]。目前,在应用CDISC标准的过程中,存在的主要问题是中医临床研究相关标准及其术语的缺乏,包括中医临床症状类量表和具有中医特点的控制术语,如CDISC中合并用药的“剂量单位”“剂型”“给药途径”,应补充中医特有的控制术语,如艾灸一壮(剂量单位),汤剂、散剂、膏方(剂型),烟熏、沐浴(给药途径)。
可喜的是,目前在国家食品药品监督管理总局倡导下已经成立临床试验数据标准化工作指导组,其下设的TCM专业小组对中医临床研究如何实现CDISC标准进行了研究和有益的探索[9]。CDISC标准在中医临床研究中的使用还处于起步阶段,由于对CDISC标准理解的不同,可能会造成数据库的建设和后期转换整理时映射难度和映射结果的差异,例如,有的数据管理单位可能会把研究疾病相关中医临床症状放在事件或干预的“相关发现 (Findings About)”中进行收集。对此,应加强对CDISC标准的学习和研讨,逐渐形成行业内的标准,实现助力数据审评、数据交换的最终目的。
参考文献:
[1] CDISC. CDISC Vision and Mission[EB/OL].[2015-01-28].http:// www.cdisc.org/CDISC-Vision-and-Mission.
[2] FDA. Study Data Standards for Submission to CDER[EB/OL]. [2015-01-28].http://www.fda.gov/drugs/developmentapprovalprocess/ formssubmissionrequirements/electronicsubmissions/ucm248635. htm.
[3] 陆芳,高蕊,唐旭东,等.临床研究中的数据管理标准CDISC及其应用前景[J].中国新药杂志,2011,20(24):2400-2404.
[4] 李庚,李晓彦,温泽淮.临床数据交换标准协会标准在中医药临床研究病例报告表设计中的应用[J].广州中医药大学学报,2014,31(1):138- 141.
[5] 黎燕兰,胡镜清,刘保延.CDISC标准与中医药临床研究数据标准化[J].世界科学技术-中医药现代化,2012,14(6):2109-2114.
[6] 董雯雯.CDISC标准在药物临床试验中的应用[D].上海:复旦大学, 2012.
[7] 向楠,邓阿黎,丁晓娟,等.中药新药临床试验病例报告表的标准化及电子化研究探讨[J].中药新药与临床药理,2006,17(4):297-299.
[8] National Cancer Institute. CDISC Terminology[EB/OL]. [2015-01-28].http://www.cancer.gov/cancertopics/cancerlibrary/ terminologyresources/cdisc.
[9] 王骏,韩景静,黄钦.从药品技术审评谈临床试验的数据标准化[J].中国新药杂志,2014,23(19):2228-2230,2279.
(收稿日期:2015-06-18)
(修回日期:2015-07-20;编辑:蔡德英)