区域性临床研究整合平台的建设探讨
2023-11-01林毅渠田田钱碧云吕文文俞章盛冯铁男
林毅,渠田田,钱碧云,3,吕文文,俞章盛,4,冯铁男
区域性临床研究整合平台的建设探讨
林毅1,渠田田2,钱碧云2,3,吕文文2,俞章盛2,4,冯铁男2
1.上海港讯电子科技有限公司,上海 200023;2.上海交通大学医学院临床研究中心,上海 200025;3.临床研究促进发展中心 上海申康医院发展中心,上海 200041;4.上海交通大学数学科学学院,上海 201100
探讨国内建立区域性临床研究整合平台的可行方案,为研究者发起的临床研究(investigator initiated trial,IIT)提供数据支持。总结国内外各类临床研究平台建设现状,以此为改进依据介绍上海交通大学医学院人工智能临床研究平台建设情况。人工智能临床研究平台涵盖医学院附属医院的业务库文字及影像专病数据,支持回顾性与前瞻性临床研究,但在数据使用的伦理考量与共享机制等管理方面仍需要实践探索。合规的区域性临床研究整合平台可支持科研人员发现临床问题、探索或验证临床假设,为开展多中心、大规模的IIT打下良好的数据基础。
研究者发起的临床研究;临床研究平台;专病数据库;管理机制
研究者发起的临床研究(investigator initiated trial,IIT)来自于一线临床工作,研究成果能够更好地服务临床,没有一定数据支撑的研究设想很难进一步形成高证据等级的研究设计。国家卫生健康委员会印发了《关于印发国家健康医疗大数据标准、安全和服务管理办法(试行)的通知》,号召医疗数据安全与共享,同时《医疗卫生机构开展研究者发起的临床研究管理办法(试行)》也鼓励医疗机构积极开展规范化的IIT,为临床科研数据库的建设发展提出了更高的要求。
1 临床研究科研平台构建现状
1.1 国内三甲医院内部专病数据库
国内专病医疗水平较高的三甲医院尝试建立供院内临床科研使用的专病数据库,涵盖呼吸、消化、内分泌、肿瘤、精神疾病等众多疾病领域[1-9]。此类专病库力求将院内医院信息系统(hospital informationsystem,HIS)、实验室信息系统(laboratory information system,LIS)、影像存储与传输系统(picture archiving and communication system,PACS)等多个临床业务系统数据集成整合,提取业务数据表,普遍能使用脱敏算法剔除受试者隐私数据,可进行复杂条件、递进式的多病种科研病例查询筛选,部分数据库还可以对病例报告表(case report form,CRF)进行个性化定制与模板化管理,并将研究数据导出为常用统计分析软件兼容的格式,为临床辅助决策与科研提供数据支撑。也有尝试促进多中心临床研究开展的专病库,如上海交通大学医学院附属第九人民医院集团血管外科专病数据库通过云端访问技术可在医联体中共同使用,山东第一医科大学附属省立医院阿尔茨海默病临床数据库在联盟医院内可数据共享等[5,7]。
但目前记录诊疗信息的业务系统普遍存在遗失病种关键信息的风险,导致专病库的信息提取不完整,为回顾性研究质量带来隐患。前瞻性研究的开展可以指导完善诊疗信息的记录,防止科研信息缺失,为开展回顾性研究打好基础。
1.2 国内外公共科研数据库
与基于三甲医院业务库建立的专病库不同,国内外公共科研数据库共享程度更高,为全世界研究人员提供了良好的数据支持,例如中国人群基因组多态数据库、美国肿瘤基因组图谱计划等基因组学数据库,重症监护医学信息集市(Medical Information Mart for Intensive Care,MIMIC)重症系列、中国以及其他国家的健康与营养调查、美国监测、流行病学和结果(Surveillance,Epidemiology,and End Results,SEER)数据库等基于诊疗或调查的免费医疗数据库,还有地方政府、期刊平台等建立的公共科研数据库,为流行病学研究、罕见病临床科研试验等提供数据支持等[10-17]。
此类科研使用公共数据库并不局限于单病种,数据采集类型更多、范围更广,且共享程度高,但多数需要科研工作者使用一定的编程语言辅助才能整理、分析数据,有的数据库下载使用数据包需要提供研究方案、伦理批件、提交众多申请表格等,申请周期较长。
1.3 上海交通大学医学院区域性临床研究整合平台建设意义
由于国内外医疗、科研机构正在使用的科研数据库存在以上诸多问题,且国内临床研究平台的建设范围通常局限在三甲医院或其他医疗机构内部,缺乏将数据按一定标准脱敏并结构化后进行共享的区域性临床研究整合平台的建设,因此上海交通大学医学院在校内原有的电子数据采集系统(electronic data capture system,EDC)基础上进一步扩展,建设成了一个沟通多家附属医院、可全面支撑前瞻性与回顾性临床科研的数据平台——人工智能临床研究平台,旨在为临床医生收集整理病例数据、总结过往诊疗规律、进行数据深度挖掘、发表高质量临床研究文章提供助力。
2 上海交通大学医学院人工智能临床研究平台建设探索
随着临床研究工作者对提升科研效率、挖掘诊疗信息的需求增加,上海交通大学医学院立足大学与附属医院两层级临床研究架构,在附属医院区域内探索建立临床研究整合平台,参照相关法规政策,在原有EDC基础上自主设计并建设了人工智能临床研究平台。该平台包含了分布式语义检索系统、项目全流程管理平台、数据质量管理系统、临床数据采集系统、物联网数据采集系统、医学影像数据平台、临床研究单病种系统七大模块(图1),以期更好地服务IIT。
2.1 人工智能临床研究平台涵盖模块
2.1.1 分布式语义检索系统 该系统通过自然语言处理、知识图谱、机器学习等人工智能引擎,对来自于医院的HIS/RIS/PACS/LIS等可对接的业务系统中半结构化描述语句进行处理、识别,为回顾性研究提供临床电子病历的精准、高效检索能力,实现数据的结构化、标准化和归一化。
图1 人工智能临床研究平台七大模块关系图
2.1.2 项目全流程管理平台 该平台将为前瞻性IIT的设计与开展提供全局化、规范化的流程管理,包括但不限于研究设计与执行等方面的标准化管理与操作流程,从而达到高质量IIT所要求的精细化管理水平。
2.1.3 数据质量管理系统 该系统是针对临床数据采集系统进行数据质控的一套质控系统,例如:可监控关键指标的缺失率、随访的超窗率以及不良事件的发生率,当接近不可接受的频率时及时预警,从而达到研究全过程的智能化数据质控。还可进行源文件上传,支持临床监查员远程溯源质控。
2.1.4 EDC 该系统将为前瞻性多中心设计的临床研究提供数据采集服务,可满足IIT个性化模块的构建需求,实现数据自动核查、质疑管理、稽查轨迹、数据导出等多项功能。
2.1.5 物联网数据采集系统 该系统将提供面向医疗智能穿戴设备的信息采集与管理能力,可前瞻性采集患者的实时健康状态信息,或回顾性采集已有物联网相关数据进行分析。
2.1.6 医学影像数据平台 该平台整合医院相关业务系统的影像数据资料并进行分类、治理、标注,从而为影像数据的便捷、高效利用奠定基础,可前瞻性或回顾性采集分析影像数据。
2.1.7 临床研究单病种系统 基于以上六大模块进一步整合形成多项单病种专病数据库,以患者为中心构建形成标准统一的临床研究单病种系统,为面向单病种的深层次研究与应用奠定基础。
2.2 人工智能临床研究平台优势
平衡数据共享联盟单位内部的各项政策与利益需要由非盈利性质的权威机构牵头协调,数据库需要专业的人力维护并耗费高额的维护费用,因此联通多家中心的规范化、安全稳定的临床研究整合平台需要由政府或高校等机构承担;该人工智能临床研究平台筛选、整合上海交通大学医学院附属13家医院中的专病数据,针对立项的专病类型,在联盟医院内部推广由牵头主要研究者(principal investigator,PI)组织该疾病领域专家整理的专病关键指标集合,逐步规范医院HIS等业务库中的常规诊疗记录要点,力争控制回顾性研究关键信息的缺失率;该平台数据检索、整合、分析等基本操作无需代码辅助,只需关键词检索与拖拽等操作即可完成,大幅提升电子病历、实验室检查、影像等数据的分析利用能力。
2.3 人工智能临床研究平台管理机制尚存在挑战
人工智能临床研究平台汇集多个专病数据库,是一个大型的资源交换与整合数据集合。该平台技术上足够保障患者个人信息不泄露,但患者医疗数据被用于各项科研探索,如何从伦理层面保护受试者需要严格的伦理论证;每个病种需要根据研究者贡献程度探讨访问权限,发表文章或进行其他科研转化后,与提供数据的各方如何分配成果尚需实践,只有解决了数据申请与共享机制、平衡数据贡献各方利益,才能完全实现跨中心数据综合利用。
3 小结与展望
医学院人工智能临床研究平台涵盖多项数据采集与处理模块,可为前瞻性与回顾性的研究提供全方位的数据支撑,且平台数据由医学院临床研究中心专业数据管理团队运维,力求改善传统专病数据库重建设轻维护的弊端,避免一般课题组在课题结束后不再二次使用的资源浪费[18]。
未来IIT研究的数量与质量还会继续保持增长趋势,数据采集与处理信息平台将为临床科研提供有力的数据支撑。医学院人工智能临床研究平台将在数据安全与数据共享机制方面继续加强建设,借助长期与附属医院研究者合作的业务优势,在项目实践中不断完善功能,持续优化界面,为其他尝试建设数据安全、信息深度共享的区域性临床科研整合平台提供一定参考。
[1] 袁骏毅, 潘常青, 李榕, 等. 基于临床数据中心的冠心病专病数据库的构建与实现[J]. 中国卫生信息管理杂志, 2022, 19(5): 707–712.
[2] 陈可, 王俊. 中晚期非小细胞肺癌专病数据库的构建及应用探讨[J]. 中国数字医学, 2022, 17(6): 109–113.
[3] 屈媛圆, 高琳娜, 宋欢. 结直肠癌专病数据库的发展与展望[J]. 中国普外基础与临床杂志, 2021, 28(12): 1543–1545.
[4] 孙颖, 李超峰, 林丽, 等. 鼻咽癌专病科研数据库建设与应用[J].中国数字医学, 2021, 16(1): 7–12.
[5] 惠美蓉, 仇鹏, 王世鹏, 等. 研究型下肢动脉硬化闭塞症专病数据库的建立及应用[J]. 中国血管外科杂志(电子版), 2020, 12(3): 248–251.
[6] 荣雯雯, 汪刚, 朱其立. 基于人工智能的病历后结构化专病数据库在临床研究中的价值探讨[J]. 上海交通大学学报(医学版), 2020, 40(7): 996–1000, 995.
[7] 李慧杰, 张晴晴, 刘瑞红, 等. 大数据背景下临床专病数据库建设实践与思考[J]. 中国卫生事业管理, 2020, 37(8): 574–576, 591.
[8] 罗辉, 薛万国, 乔屾. 大数据环境下医院科研专病数据库建设[J]. 解放军医学院学报, 2019, 40(8): 713–718.
[9] 王淑, 陈敏, 凌琦鸣, 等. 基于临床数据中心的专病研究系统建设与实践[J]. 中国医院, 2017, 21(8): 16–18.
[10] 陈炜, 张戈, 张思仲. 人类基因组多态数据库Go!Poly及其应用[J]. 中华医学遗传学杂志, 2001, 18(6): 71–74.
[11] 阴常欣, 马文丽, 郑文岭. GEO-基因表达综合数据库的应用与数据挖掘[J]. 医学分子生物学杂志, 2009, 6(2): 161–166.
[12] Medical information mart for intensive care [EB/OL]. [2022-10-25]. https://mimic.mit.edu/.
[13] 涂吉, 何慧婧, 胡耀达, 等. 美国国家健康与营养调查中的信息化系统应用及启示[J]. 中华流行病学杂志, 2022, 43(7): 1127–1133.
[14] 王超, 张晓宇, 张磊, 等. 中国成人居民正常体温:基于2015年中国健康与营养调查[J]. 中华内分泌代谢杂志, 2022, 38(3): 201–207.
[15] SEER incidence data, 1975-2019 [EB/OL]. [2022-10-26]. https://seer.cancer.gov/data/.
[16] 鲍萍萍, 郑莹, 王春芳, 等. 上海市肿瘤病人数据库的管理和应用[J]. 中国肿瘤, 2005, 14(8): 514–516.
[17] 徐敏, 朱俊民, 密一恺, 等. 罕见病数据库建设的探索与实践[J]. 中国数字医学, 2017, 12(5): 77–80.
[18] 顾颖. 专科病例数据库建设现状与对策[J]. 中华医学图书情报杂志, 2011, 20(11): 20–22.
Exploring the construction of regional clinical research integration platform
LIN Yi, QU Tiantian, QIAN Biyun, LYU Wenwen, YU Zhangsheng, FENG Tienan
1.Shanghai Gaintion Electronic Technology Co., Shanghai 200023, China; 2.Clinical Research Institute, Shanghai Jiao Tong University School of Medicine, Shanghai 200025, China; 3.Shanghai Clinical Research Promotion and Development Center, Shanghai Shenkang Hospital Development Center, Shanghai 200041, China; 4.School of Mathematical Sciences, Shanghai Jiao Tong University, Shanghai 201100, China
To explore a feasible solution for establishing a regional clinical research integration platform in China to provide data support for investigator initiated trials (IIT).To summarize the current situation of the construction of various clinical research platforms at home and abroad, and introduce the construction of the Artificial Intelligence Clinical Research Platform of Shanghai Jiao Tong University School of Medicine based on this improvement.The artificial intelligence clinical research platform covers business repository text and imaging-specific data of the medical school hospitals and supports retrospective and prospective clinical research, but still needs practical exploration in the management of ethical considerations and sharing mechanism of data use.A compliant regional clinical research integration platform can support researchers in identifying clinical questions, exploring or validating clinical hypotheses, and laying a good data foundation for conducting multi-center and large-scale IIT.
Investigator initiated trial; Clinical research platform; Specialized disease database; Management Mechanism
R12
A
10.3969/j.issn.1673-9701.2023.29.023
冯铁男,电子信箱:tienan@sjtu.edu.cn
(2022–11–29)
(2023–09–13)