VTE临床研究数据库的建立及应用
2021-11-20惠美蓉杨广林叶开创傅泽庭胡小霞黄斯旖王瑞华陆信武
惠美蓉 杨广林 仇 鹏 叶开创 傅泽庭 胡小霞 黄斯旖 傅 彦 王瑞华 陆信武
1 上海交通大学医学院附属第九人民医院血管外科,上海 200011 2 苏州白鸽云信息技术有限公司,江苏 苏州 215123
深静脉血栓形成(deep venous thrombosis,DVT)与肺栓塞(pulmonary embolism,PE)是静脉血栓栓塞症(venous thromboembolism,VTE)在不同阶段、不同部位的两种临床表现形式[1]。二者具有相同的易患因素,且PE具有高发生率、高致残率和高病死率的特点。DVT的慢性并发症—血栓后综合征(post-thrombotic syndrome,PTS)与PE的慢性并发症—慢性血栓栓塞性肺动脉高压,均将严重影响患者的远期预后及生活质量[2-3]。依托数据库开展的实用性临床试验(如真实世界研究)可为临床诊疗方案的制定提供一定的依据,而国内早期VTE临床研究数据库多是针对某一个或某几个临床问题而设计的小样本数据库,都仅关注局部静脉血栓,忽略了VTE这一疾病的整体性,难以积累有效的循证医学证据。上海交通大学医学院附属第九人民医院血管外科于2016年建立了单中心VTE数据库,同时纳入DVT、PE和PTS患者,涵盖病历信息、检验信息、影像信息等多模态数据,从疾病的发生、转归方面获得患者的全流程数据,旨在通过整体化、全疗程化、规范化的VTE数据管理,为该病的临床研究和诊疗提供良好的平台支持,现报道如下
1 一般资料
1.1 纳入及排除标准
该VTE数据库目前包含DVT和PTS两个病种,每个病种对应相应的疾病内容。由于PE主要来源于DVT,因而DVT表格中包含了PE的相关变量。例如,选择的患者为PE患者,系统会跳至PE界面,变量包括肺动脉计算机体层血管成像(computed tomography angiography,CTA)提示PE位置、血氧饱和度等。本中心作为国内较大型的下肢静脉介入诊疗中心,从2016年开始对下肢DVT与PTS患者的治疗基本都以腔内介入治疗为主,因此,该数据库在初期变量设计时以腔内治疗为模板。数据库所纳入的病例为自2016年开始于上海交通大学医学院附属第九人民医院住院并接受手术治疗及保守治疗的DVT及PTS患者,少数行杂交手术的患者记录在数据库备注中。
1.2 研究问题
由临床经验丰富的血管外科医师以循证后的临床问题为导向,前瞻性地提出临床研究问题,设计研究变量。研究问题涵盖疾病发生的高危因素、疾病自然史、抗凝药物的使用、下腔静脉滤器植入术、机械血栓清除治疗、溶栓治疗、球囊扩张成形术、支架成形术、联合治疗、药物器械的安全性、药物器械的有效性、药物器械的卫生经济性、患者获益度等方面。
2 软件开发与数据安全
2.1 软件开发
系统基于C语言开发,采用.NET Framework技术和MVC三层体系架构,业务及管理系统的设计采用B/S结构,所有操作基于浏览器进行。通过HTML5、js、CSS等技术实现了多终端适应。可以兼容多操作系统、多终端类型,并于个人计算机(personal computer,PC)、平板电脑和手机终端中录入信息。系统包含的主要模块有用户管理、项目管理、项目权限、可视化电子表格编辑、病例管理、电子表格录入和病例导出等。
2.2 数据安全
2.2.1 隐私性信息全加密保护
采用全加密的方式对于患者的身份信息进行持久化存储。在信息查询、导出等功能中,需要先按照标准流程将加密数据解密后进行处理。
2.2.2 Web服务禁止爬取
在系统建设中,采用一系列技术手段禁止搜索引擎或者其他爬虫网站的搜索,以保证系统应用的隐私性。
2.2.3 安全防火墙
系统部署在多重防火墙的服务器群中,能防止绝大多数恶意攻击行为。
2.2.4 常规性数据备份及异地灾备
数据备份是系统容灾的基础,设定策略按照常规性每日备份的方式保证数据的完整性。当前系统因为各种因素导致系统和数据受到严重毁坏(如地震、火灾等)时,异地灾备则可保障系统的恢复。
3 数据库运行
3.1 数据库人员组成及职责分工
3.1.1 人员组成
数据库人员由医学团队及计算机团队组成。医学团队包括临床研究医师、数据库临床协调员、临床研究护士。计算机团队包括项目负责人、开发人员、售后维护工程师。
3.1.2 研究医师职责
数据库内容架构由血管外科静脉亚专业组完成。组内通过专病循证的思路,设定研究指标,再由临床经验丰富且有临床研究设计经验的医师进行数据库内容的设计,制定各部分数据表单和数据收集项列表。再通过调研收集意见,完善数据库的纳入变量。
3.1.3 计算机人员职责
负责数据库程序设计,保证数据呈现符合逻辑,保证数据安全及脱敏。在完成数据库创建后,应对数据库各方面进行测试,以保证数据库能够安全稳定的运行。为了方便操作人员规范应用,应制定相应的操作指南。在数据库运行的过程中,负责数据库软件的维护及新功能开发、数据库版本的更新和发布。
3.1.4 数据库临床协调员职责
负责研究医师与计算机人员的有效沟通及数据管理。数据库设计之初,将研究医师的医学需求转变为计算机人员可以清楚理解的病例数据采集表,使数据库的逻辑设计更加合理化。在数据库运行过程中,收集并汇总新的需求,不断完善数据变量。在使用过程中,发现数据库存在的问题,及时反馈并进行纠正,使数据库能够良好运行。对术前评估、术中数据、随访报告等原始数据均进行纸质版归档,保证数据可以溯源。
3.1.5 研究护士职责
研究护士进行患者随访、数据整合。随访方式包括线上随访和线下随访。患者入院时,研究护士通过随访专用平板电脑添加患者微信,并进行术前基线访视。待患者出院前,研究护士与患者预约好随访时间。随访期间,通过问卷的方式向患者微信发布随访内容,并收集随访信息。若患者需来院随访,则制定相应的随访流程。例如,对患者进行随访前,研究护士提前告知门诊医师患者来访时间,并提醒复诊医师患者本次的检查内容,待患者到达后,医师为患者进行体格检查、开具随访检查项目,并提醒研究护士患者来访,再由研究护士执行具体随访并记录随访结果。研究护士每周整理新入院患者信息,并撰写每周汇总表,同时跟踪未登记及未随访患者,并备注原因。
3.2 数据库内容
DVT与PTS的内容各包含9个部分,分别为患者基本信息、入院记录、术前检查、术中操作、术中可能遇到的问题和处理、术后记录、抗血栓治疗、随访记录及影像学检查结果。(1)基本信息包括一般人口信息及身高、体重、体重指数(body mass index,BMI)等;(2)入院记录包含入院日期、基础疾病史、血管疾病史等;(3)术前检查包括血常规、血生化、凝血指标、蛋白C、蛋白S、彩色多普勒超声检查、计算机断层扫描静脉血管造影(computed tomography venography,CTV)等;(4)术中操作包括手术日期、术中造影情况、手术处理细节,如机械血栓抽吸、球囊扩张、支架植入、置管溶栓等;(5)术中可能遇到的问题和处理包括导管无法跟进、静脉穿孔或出血等;(6)术后记录包括水化方案、术后血常规和凝血指标等;(7)抗血栓治疗包括抗血栓药物及压迫治疗情况等;(8)随访记录涉及术后1、3、6、12、24个月等随访阶段,每个阶段的随访内容包括抗凝和抗血小板药物使用情况、超声随访情况、静脉功能不全的流行病学和经济研究-生活质量(venous insufficiency epidemiological and economic studies-the quality of life,VEINES-QOL)量表评分、临床表现-病因学-解剖学-病理生理学(clinical- etiology-anatomy-pathophysiology,CEAP)分 级、Villata评分量表评分等;(9)影像学检查结果包括造影、超声和CTV报告三种,可以分别上传该患者全部影像学检查报告,并存储各类影像的原始数据。
3.3 数据库的录入
3.3.1 数据库登录过程
采用Web在线登录方式登录数据库,方便随时查看与使用。采用账号密码的方式进行身份认证,设置角色权限控制,不同角色分配不同的账号和密码。数据库登录后,首页填写患者基本信息,并选择患者所属疾病是DVT还是PTS,点击保存后,进入相应疾病的表格界面。(图1)
图1 VTE数据库首页
3.3.2 数据录入过程
病例信息录入采用多终端Web录入的方式,满足了数据录入的便捷性。利用Auto Compelet技术,可以快速匹配出用户之前录入的信息,如球囊扩张部分,输入球囊名称时,仅需输入器械的第一个字母,则以该字母开头的多个名称就会显示以供选择,减少了手动输入的时间,提高了录入速度和一致性。通过智能控件和表达式控件等,系统可以方便地实现自动计算等逻辑,如患者静脉评分表格Villata评分、静脉临床严重程度评分表(venous clinical severity score,VCSS)评分,选择好每项评分后,系统自动合计总分,减少了手动计算时间及失误的可能,保证了数据录入的高效性和准确性。另外,系统使用cookie的方式缓存了一些历史操作内容,通过该方式可以实现快速录制。(图2)
图2 VTE数据库录入界面
3.3.3 影像上传功能
通过点击上传附件可上传每例患者的相关影像学检查结果,如患者的随访检查报告,包括造影报告、B超报告、CTV报告等,可以使随访结果与患者诊疗过程相对应,并且能够有效保存患者的原始记录。(图3)
图3 VTE数据库肺栓塞界面
4 数据库应用
该VTE数据库共包含423个变量,自2016年1月至2021年6月共纳入1123例患者。其中DVT包含218个变量,共纳入674例符合入选标准的患者,其中男性361例,女性313例,包含PE患者50例,年龄24~89岁,平均(57.1±19.2)岁。PTS专病包含变量205个,共纳入符合入选标准的患者449例,其中男性246例,女性203例;年龄14~81岁,平均(55.7±16.6)岁。纳入的病例数占全部VTE病例总数的85%( 955/1123 ),随访率为82%( 921/1123 ),最长随访时间为48个月。依托该VTE专病数据库,目前本中心已牵头1项国际注册临床试验,参与8项国内多中心注册临床试验;已申请多项临床研究课题,开展5项临床医师主导的前瞻性干预性研究、专病队列研究和回顾性研究;发表了7篇回顾性临床研究。下面结合1例实例介绍本数据库的使用流程。
接受腔内支架植入术的PTS患者为了预防支架内血栓形成和再闭塞,术后仍需口服抗凝药物进行治疗。华法林是支架植入术后的常用抗凝剂,但该药存在许多局限性和较差的患者依从性[4]。与华法林相比,利伐沙班作为新型口服抗凝药物,能够立即抗凝,无需低分子肝素桥接及频繁的国际标准化比值监测,已被证明其较高的疗效与安全性[4-5]。本中心于2020年开展了一项回顾性队列研究,比较了慢性髂股静脉闭塞患者于支架植入术后服用利伐沙班与华法林的安全性与有效性,旨在比较这两种抗凝药物对静脉支架植入术后慢性髂股静脉闭塞的PTS患者的安全性和有效性[6]。纳入标准:(1)2016年1月至2017年12月,在本中心成功行髂股静脉支架植入术,连续一年服用利伐沙班或华法林的单侧慢性髂股静脉闭塞的PTS患者。(2)年龄大于18岁,男女不限。通过检索数据库中的变量字段,包括患者入院时间、年龄、CTV显示压迫组织、术中造影显示病变部位、支架植入部位、术后抗凝药物使用情况、凝血指标等,从2016年1月至2021年6月已纳入的449例PTS患者中共筛选到192例符合纳入标准的患者。排除标准:(1)慢性双侧髂股静脉和下腔静脉闭塞的患者。(2)华法林国际标准化比值控制在2~3,少于2/3整个随访期的患者。(3)通过计算机断层扫描或数字减影血管造影(digital substraction angiography,DSA)诊断被肿瘤或动脉瘤外部压迫。(4)联合抗血小板治疗或两种抗凝药物交替使用的患者。根据排除标准,从符合纳入标准的192例患者中排除38例,最终筛选出154例研究对象。其中,利伐沙班组69例,华法林组85例。批量导出154例患者的全部数据,再从导出的结构化数据中快速提取人口统计学变量,包括两组患者的靶肢体、平均年龄、性别、BMI、高血压、糖尿病、脑卒中、恶性肿瘤、是否发生PE、Villata评分、PTS严重程度、发病诱因、CEAP分级等数据。统计学分析结果显示,利伐沙班和华法林的出血发生率(10%vs16%,P=0.23,HR=0.58,95%CI:0.25~1.37)无显著差异;利伐沙班的1年初期通畅率(84%vs71%,P=0.049,HR=0.50,95%CI:0.26~0.96)与2年初期通畅率(79%vs63%,P=0.037,HR=0.52,95%CI:0.29~0.93)均较高。
5 数据库讨论
在全球范围内,VTE的发病率很高。美国VTE的发病率为1.17/1000人年,每年有35万例患者发生VTE[7]。在欧洲联盟中的7个国家,症状性VTE发生的例数每年超过100万[8]。而在中国,近年来,VTE患者数量迅速增加,来自国内60家大型医院的统计资料显示,住院患者中,PE的发生率由1997年的0.26‰上升到2008年的1.45‰,DVT发生后的PTS则影响了超过40%的患者[9]。
然而,目前对于VTE的诊疗,依然存在着抗凝、血栓清除、PE处理、髂静脉处理、滤器合理应用、VTE复发、PTS处理等临床问题,而针对这些问题,临床上主要还是依靠临床医师的个人经验,缺乏高等级循证证据的支持[10]。国内VTE诊疗领域暂无大型多中心注册研究,国外知名的VTE大型真实世界研究包括以下3种:(1)RIETE研究是2001年启动的包含DVT和PE的全球多中心注册登记研究,现已有超过72 000例患者入组,已发布130篇临床实践和卫生经济学论文,该研究仍在进行中[11];(2)XALIA研究是XArelto®牵头的前瞻性、观察性队列研究,观察来自加拿大和欧洲的VTE(包含PE和DVT)患者的VTE复发率、病死率、并发症发生率、治疗和护理的依从性及治疗满意度,共招募5142例患者,该研究已完成招募[12];(3)PREFER研究是一项在欧洲七国进行的前瞻性、观察性、多中心研究,共381个中心参与,收集了VTE(包含DVT和PE)患者的生活质量、治疗满意程度、复发情况和经济负担,该研究共招募3455例患者,该研究已结束[13]。
本诊疗中心以疾病研究为目的,于2016年建立了VTE数据库并顺利运行至今。该数据库能够统一管理患者全程诊疗数据,具备了数据检索、数据导出、影像上传等功能,实现了研究数据的标准化存储与提取,极大方便了研究人员对数据的查询及应用。与以往的一些VTE数据库相比,该数据库具有以下特色:(1)本数据库是以循证后的临床问题为导向的研究型数据库。首先针对疾病的手术适应证、手术方式、抗凝药物的选择及使用时间等争议性临床问题进行文献循证,科学性提出临床问题,再以临床指标作为研究终点,设计研究变量。并非单纯为某个临床研究而设计。(2)相较于单独存在、孤立分散的疾病数据库,该数据库是一个系统化、集成化的静脉数据平台,目前包含DVT、PTS两个病种,以后根据需要还可以继续添加其他静脉血栓疾病相关内容,如DVT伴髂静脉受压综合征等。(3)数据库包含疾病的发生和长期随访数据,同时纳入其他影响疾病发展和诊疗的因素,如卫生经济学指标。在治疗后1、6、12、24个月进行整体量表[五维度欧洲生命质量量表(EuroQoL Group's five-dimension questionnaire,EQ-5D)、36条 简 明 健 康状况调查表(medical outcomes study short-form 36,SF-36)量表]、质量调整生命年(quality-adjusted life year,QALY)值、成本指标(直接/间接)、增量成本效果比(incremental cost effectiveness ratio,ICER)等的评估,可对现有临床方案或新药物、器械的经济性进行评估,为患者的获益、诊疗决策提供依据。
该数据库目前在数据收集方面主要采取以下方法:(1)数据库专员通过查询医院信息系统(hospital information system,HIS)、实验室信息管理系统(laboratory information system,LIS)完成患者基本信息、实验室检查等数据的采集录入。(2)手术医师下台后,填写提前设计好的标准化纸质版手术记录模板,完成术中数据的采集。研究护士通过问卷星等方式完成随访数据的收集,并由数据库专员录入数据库。鉴于目前各部分数据的收集较分散,正在对数据库进行升级。通过数据库后台表格及权限的设定,手术医师可通过平板电脑、手机等随时快速录入术中信息,研究护士可直接利用系统向患者发送二维码收集随访信息。而鉴于人工二次录入需要较多的人力、时间,存在数据错录、遗漏等缺点,在数据库中预留了各类型格式数据端口,将在未来实现与医院HIS、LIS、图像存档及通信系统(picture archive and communicate system,PACS)等系统的互联互通,自动导入患者的检验数据、影像数据等,以此减少手动录入的不足。
数据库数据的准确性及客观性是研究质量的前提。目前,该数据库通过以下方式保证研究质量:(1)设定自动校验字段必填验证、自动计算、自动判断录入值与异常值的差异等内嵌逻辑,减少了数据缺失、错录等问题的发生。(2)通过人工核查确保数据录入的准确性。数据库临床协调员在录入数据的过程中,通过查看数据,发现存在的问题,及时反馈给数据填写人,由填写者完成数据的整改。后期也将开发系统数据核查功能,设定逻辑判断语句,由数据库自动识别录入错误,实时向操作人员提出质疑,以便实时进行数据确认及整改。通过系统自动逻辑核查及质控人员双重核查,可进一步优化数据的质量控制,从而保证数据的质量。
对于该数据库,将继续优化数据登记、数据利用等功能,并向多家本中心医疗联盟体开放,为开展静脉疾病的多中心前瞻性临床试验及真实世界中的大样本量专病队列研究等提供保障。同时,应用大数据人工智能技术,根据患者的信息、影像学数据、实验室检验结果、随访时序性数据等建立疾病的多模态动态风险预测模型,开发基于知识库的辅助诊疗决策系统,也是该数据库下一步的发展方向。