大数据+AI制导的临床试验受试者智能招募实践
2024-07-07冯晨阳何仲廉葛洁英曹烨李超峰
冯晨阳 何仲廉 葛洁英 曹烨 李超峰
[摘要] 受试者的招募,尤其是肿瘤患者、罕见病患者等,一直是研究者面临的一个难点。笔者医院临床试验项目逐年增多,目前主要通过主诊医生人工识别患者是否适合某临床试验入组的条件,存在效率低下、入组率低等问题。本文介绍笔者医院基于大数据平台的临床试验受试者智能招募系统的建设与实践。该系统实现了受试者和临床试验项目智能匹配、项目管理、项目查询等功能,通过系统一年多的应用,该系统增加项目信息曝光量,使得医患信息对等,有利于患者了解相关信息,进一步增加入组的概率,同时智能匹配可提高受试者招募效率和成功率,为笔者医院临床试验的开展提供支撑。
[关键词] 临床试验;受试者招募;医院信息化;大数据平台;人工智能
[中图分类号] R857.3 [文献标识码] A [DOI] 10.3969/j.issn.1673-9701.2024.17.020
患者临床试验受试者的招募,尤其是肿瘤患者、罕见病患者等,一直是研究者面临的一个难点[1-4]。有研究报道,受试者招募直接影响试验的成败:85%~95%延期的原因是不能按计划招募到合格的受试者,19%的临床试验由于未能达到预计样本量而终止试验[5]。一篇分析药物临床试验暂停或终止的原因显示,广东省内因入组困难或招募数量不足暂停或终止的试验占比达20.49%[6]。
招募困难的主要原因之一在于部分临床试验招募条件苛刻,目标人群比较少[7]。随着精准医学的发展,患者招募条件越来越复杂,不仅包含常见的年龄、检验、诊断、药品、病理等条件,还包含很多如治疗方案、疗效、治疗时间间隔、基因、手术等条件,传统翻阅病历、在医院信息系统(hospital information system,HIS)、实验室信息系统(laboratory information system,LIS)等。单个系统内查找受试者的方式,非常低效且难以精准定位受试者、错过受试者能够参加临床试验的窗口期。而患者因缺少信息来源,以及相关医学知识,难以自主发现合适的临床试验。
随着信息技术的发展,大数据制导、以患者需求为导向的招募成为新模式[8-9]。国家药品监督管理局发布的《以患者为中心的临床试验实施技术指导原则》(征求意见稿)提及“为了让有需求的受试者发现合适的临床试验,可以考虑采用互联网平台招募、基于患者信息大数据的智能化招募等方式”[10]。
基于此,本研究探索利用大数据和人工智能技术,依托笔者医院大数据平台建设基础,在临床研究部、信息中心、临床科室通力合作下,将完成临床试验受试者智能招募系统的建设实践进行阐述。
1 智能招募系统建设与开发
1.1 受试者全生命周期标准化数据集构建
大数据平台基于Hadoop分布式技术架构,在不影响业务系统的前提下,将包括HIS、LIS、电子病历系统(electronic medical records,EMR)、医学影像信息系统等多个系统数据整合到标准的数据模型,通过智能索引,智能清洗,智能结构化和标准化,形成格式统一、表达统一、标准统一的受试者全生命周期标准化数据集,见图1。
智能索引根据受试者本身不可改变的特征信息如姓名、民族、籍贯、身份证号、性别、生日等,在可预见的时间范围内以双层MD5(客户端、服务端双层MD5消息摘要算法)为核心形成不可逆的加密算法生成受试者唯一ID,既能保证受试者敏感信息不被破解,又能保证数据在生产过程中的一致性和连贯性。基于唯一ID,每个受试者所有数据都可以被整合起来形成一个全量数据集。智能清洗将来自不同系统中不同格式、不同名称但相同语义的字段进行统一格式。统一名称的基于规则的映射转换,积累的规则越多,清洗过程的效率越高。智能结构化和标准化参考现有知识库中定义的医学标准和规范,利用自然语言处理(natural language processing,NLP)、机器学习和知识图谱等人工智能(artificial intelligence,AI)技术将医疗语义信息从原始的自然语言表达,扩展分析为结构化的Key-Value模式,对数据依据主题字段进行划分,针对电子病历、影像检查报告、手术记录、临床诊断等10类记录做了结构化的处理,形成了超过7000+的字段数据集,为后续应用提供基础。
1.2 智能招募AI引擎构建
本项目在大数据平台的架构之上,对接临床试验管理系统(clinical trial management system,CTMS)以获取临床研究项目的纳排和入组信息。通过基于医学知识图谱的条件拆解,形成临床试验项目的纳排特征库,见图2。根据大数据平台的数据字段,形成患者疾病特征库。再通过自然语言处理、机器学习等技术手段构建招募AI引擎,将以上两个库的识别和匹配,形成患者-项目数据库。
1.3 院内系统深度集成、有机交互
综合梳理系统使用者包括医护、患者、项目管理者、机构人员的使用需求,对接院内多个系统,开放院内外共6个入口,增加系统可及性、可用性,见图3。
开发和建立医生端、患者端有机交互模式,医患在医生工作站或者患者端操作时,后台无感将患者ID传入智能招募引擎匹配项目,如有合适项目推送至医生工作站或者患者端,从而达到智能、主动提醒的目的。
2 建设成果
2.1 移动端便捷查询、咨询及报名
嵌入患者移动端、医护移动端,患者可根据需求通过关键词、病种、分期或者组合筛选。
2.2 智能匹配与推荐
患者在移动端可进入智能匹配,通过分阶段填写基本信息、癌肿、用药等信息,系统智能匹配患者适合的项目;如当前患者为笔者医院就诊过患者,系统可根据患者既往病历智能匹配患者可能适合的项目,见图4。
2.3 招募规则拆解及患者查询
系统提供招募规则可视化配置工具,针对招募条件复杂的临床试验,首先对招募条件进行医学拆解,转化为计算机可以表述的字段,然后利用大数据技术制定检索语句进行检索,系统秒级返回符合条件受试者,根据返回情况,对纳排字段生产及大数据检索进行迭代优化。最后,系统将符合条件受试者推送到系统中相应的招募项目,系统提醒研究者查看确认,研究者可直接根据患者全景进行患者确认。
3 应用效果
3.1 实现医患信息对等,提升患者对临床试验项目可及性
患者有统一入口快捷查询笔者医院临床试验项目,通过智能匹配提升寻找合适项目速度和精准度,同时系统建立患者和研究者的双向快速触达通道。目前系统内共维护招募项目387项,月均访问量9万人次;后台处理患者咨询报名量1138项。
3.2 拓宽招募渠道,提升患者招募效率
较既往张贴海报、人工筛选的模式,通过智能匹配和主动提醒的方式,可以大大拓宽受试者招募渠道。自2022年5月上线至今,系统已协助招募入组,300余例,其中移动端患者主动报名1138例,最终入组145例,转化率达12.74%。医生端主动提醒721例,最终入组147例,转化率达20.39%,极大提升患者招募效率,加速临床试验。
3.3 大数据+AI制导,可实现受试者精准筛选
对于笔者医院较难招募受试者的项目,采用项目定向智能匹配模式,基于大数据算法结合智能纳排深度挖掘存量及增量病历,提供受试者名单跟进入组。以笔者医院内科一项罕见靶点项目为例,根据项目纳排,智能匹配到患者60例,共计15例进入到筛选期,转化率达25%,该项目目前共入组患者20例,其中12例与智能招募系统纳排一致,一致率达60%。
4 总结
通过大数据+AI制导的招募方式,为传统招募模式存在的因数据孤岛、数据未治理导致院内数据无法有效利用,医生手动筛选、患者被动知悉,而导致招募效率低下的问题,提供了有效解决方案。结合与院内系统的有机交互,可实现患者端智能查找项目,医生端快速筛选患者,充分利用笔者医院数据资源,提升临床试验项目患者的可及性,同时拓宽招募渠道,提升招募效率和速率,从而提升临床试验效率,对于降低研发成本,加速研发进程,促进药物产业转化都具有重要意义。
实践过程中,因招募工具依赖院内现存数据,对于缺少临床试验筛选所需的非常规检查项目的患者,难以识别和抓取。此外对于部分纳排条件极其复杂需专业医生人工判断的项目,智能招募工具的价值也有限。在未来工作中,将继续探索人工智能技术在大数据中深度挖掘的能力,通过深度学习技术,依据患者已有数据对缺失信息进行预测和概率提示。引入生成式人工智能模型的理解和推理能力,加强对项目纳排和医疗文书的理解,进一步增加筛选精准度[11]。
利益冲突:所有作者均声明不存在利益冲突。
[参考文献]
[1] 陈诚, 鲁晓雨, 盛丽婷, 等. 药物临床试验受试者入组速度的影响因素分析[J]. 中国临床药理学杂志, 2023, 39(17): 2544–2547.
[2] 袁靖, 李玉玺, 陈云华. 罕见病临床试验患者招募的策略分析与经验分享[J]. 中国临床研究, 2016, 29(1): 118–122.
[3] KADAM R A, BORDE S U, MADAS S A, et al. challenges in recruitment and retention of clinical trial subjectsly[J]. Perspect Clin Res, 2016, 7(3): 137–143.
[4] 周晓妮, 朱兆华, 阮光峰, 等. 研究者发起的临床研究受试者招募现状及对策[J]. 广州医药, 2023, 54(11): 11–15.
[5] MC DONALD A M, KNIGHT R C, CAMPBELL M K, et al. What influenes recruitment to randomised controled trials? A review of trials funded by two UK funding agencies[J]. Trials, 2006, 7: 9.
[6] 颜曼. 药物临床试验暂停或终止的原因分析[D]. 广州: 暨南大学, 2022.
[7] 严康. 临床实验中影响受试者招募的因素分析[D]. 南京: 南京中医药大学, 2015.
[8] ULENAERS J. The impact of artificial intelligence on the right to a fair trial: Towards a robot judge?[J]. Asian J Law Econ, 2020, 1(2): 202008.
[9] 曹国英, 付海军, 何为, 等. 智能化临床研究专家共识[J]. 中国新药与临床杂志, 2020, 39(6): 321–328.
[10] 国家药品监督管理局药品审评中心. 国家药监局药审中心关于发布《以患者为中心的药物临床试验设计技术指导原则(试行)》《以患者为中心的药物临床试验实施技术指导原则(试行)》《以患者为中心的药物获益-风险评估技术指导原则(试行)》的通告(2023年第44号)[EB/OL]. (2023-07-27)[2024-03-08]. https://www.cde.org.cn/main/news/viewInfoCommon/42c008e28f7004cd19b73949142380bd.
[11] 郭华源, 刘盼, 卢若谷, 等. 人工智能大模型医学应用研究[J]. 中国科学: 生命科学, 2024, 54(3): 482–506.
(收稿日期:2024–01–29)
(修回日期:2024–04–16)
声 明
近期,有不法人员通过各种渠道获取本刊第一作者或通信作者电子信箱,冒用《中国现代医生》编辑部向本刊作者发送诈骗邮件,以延误职称晋升为由,要求作者添加微信处理相关事务骗取作者费用,严重损害作者的利益和我编辑部形象。鉴于此,《中国现代医生》编辑部郑重声明:
1. 本刊暂无微信联系方式,唯一投稿渠道为《中国现代医生》官网(http://www.zgxdys.ac.cn)。杂志官方信箱为:zgxdys@imicams.ac.cn。
2.《中国现代医生》是万方医学、中国知网、中文科技期刊数据库全文收录期刊。期刊出版后1个月左右可在上述数据库的网站查阅作者论文。
3.《中国现代医生》编辑部目前收取版面费仅有对公转账一种方式。开户行:中国建设银行北京雅宝路支行;开户名称:中国医学科学院医学信息研究所;银行帐号:11001028400059856368。