精准医学决策支持知识组织研究*
2020-11-19张秀梅翟运开吴晨溪张兵涛徐建武
张秀梅 翟运开 丁 楠 吴晨溪 张兵涛 徐建武
(中国科学技术信息研究所 北京 100038) (郑州大学管理工程学院 郑州 450001) (北京万方数据股份有限公司 北京 100038) (中国科学技术信息研究所 北京 100038)
1 引言
临床决策支持系统(Clinic Decision Support System,CDSS)是医院信息系统重要组成部分,我国智慧医院及电子病历等相关政策明确对其提出要求[1]。随着“互联网+”、移动互联、大数据、人工智能、机器学习、区块链等新技术不断发展,医疗及医院信息化领域面临着全新挑战和机遇[2-3]。CDSS的历史可以追溯到1976年斯坦福大学研究开发的MYCIN,虽然发展历史久远,但现实应用中仍存在一定问题,如知识与规则流程融合、临床从循证医学走向精准医学、多学科联合决策支持、知识内容严谨性和质控等[4-8]。本文从精准医学临床决策支持系统(Clinical Decision Support System for Precision Medicine, PM-CDSS)出发,研究构建支撑PM-CDSS的精准医学知识组织体系,满足CDSS在多角色工作场景中的信息需求。
2 医学知识组织体系
2.1 基本概念
医学知识组织体系或知识组织系统(Medical Knowledge Organization Systems, MedKOS)涵盖医学领域内各种词表、概念体系、分类体系等,具有组织和描述医学知识、概念语义消歧和标准化、概念间层级和非层级结构语义关联展示等功能,属于图书情报学科领域中的一个分支,包括对知识单元或概念内在结构进行的加工、整理、序化、表示等一系列操作。
2.2 相关研究
国外关于医学知识组织研究较为成熟,其中在临床及学术领域应用较为广泛的有:医学主题词表(MeSH)、一体化医学语言系统(UMLS)、系统化人兽医学术语表临床术语(SNOMED CT)、观测指标标识符逻辑命名与编码系统(LONIC)、国际疾病分类(ICD)等;精准医学相关知识组织有:人类孟德尔遗传在线(OMIM)、罕见病(ORPHA)、中文人类表型(CHPO)、药物基因组学(PharmGKB_drugs)、基因(HGNC)、变异(DisGeNET)、药物编码查询系统(ATC)等。国内医学知识组织体系有:中国图书馆图书分类法、医学主题词表中文版、UMLS中文版、中医药主题词表等[9-17],见表1。
表1 国内外主要医学知识组织体系
续表1
3 精准医学知识组织体系设计
3.1 PM-CDSS系统
3.1.1 概述 基于场景的精准医学临床决策支持系统(Senario based Clinical Decision Support System for Precision Medicine,PM-CDSS)为精准诊断和治疗提供决策支持,涵盖场景、对象、时间、决策信息的精准等。构建覆盖全学科、多角色(支持医生、护士、药剂师、麻醉师、检查/验技师等)主要工作场景,满足诊前、诊中及诊后全流程需求的精准医学决策支持系统,为临床工作提供及时、有效的精准参考建议,进而降低医疗风险,提高总体诊疗水平[18]。本文基于上述对于精准医学的理解和认知,重点分析PM-CDSS的场景需求及知识组织设计。
3.1.2 特点 对知识数据颗粒度要求更细、内容时效和准确度要求更高,需要抽提各类医学概念类;在推理过程中以医学概念类之间的语义关系为基础,建立语义规则库,为输出最佳决策信息提供支撑。能够适应不同终端载体,深入场景与各医院信息系统深度整合,动态、精准地提供决策支持。传统CDSS与精准CDSS区别,见表2。
表2 传统CDSS与精准CDSS区别
3.2 数据来源(表3)
3.2.1 概述 一方面遵从循证医学要求,知识数据必须有权威可靠出处,才能够为决策支持所用;另一方面数据广度和深度要求更高,数据广度方面增加精准医学相关术语和知识,深度方面需要对数据进行二次碎片化加工,为临床决策提供支撑。
表3 精准医学主要概念及数据来源
3.2.2 获取途径 一是国内外主要医学知识组织术语集合,包括精准医学相关术语体系,如ICD10/11,SNOMED CT,OMIM,ORPHA,CHPO等;二是国家颁布的各类标准,医保目录,医疗服务操作项目等;三是临床路径或指南等正式公开发表的文献,权威工具书教材等;四是官方渠道获取,如药品说明书等;五是基于医院临床实际情况经过验证的方法结论[19-20]。此外在以上数据采集的基础上,还需要对数据进行二次深度加工,包括数据碎片化加工、术语统一等处理,以及最终数据的审核入库。
3.3 相关概念抽取
3.3.1 意义 传统知识库以文献为单元进行知识组织,而精准医学知识库的数据颗粒度更小,需要将医学领域中涉及到的医学概念进行抽取标注。通过提取概念可以为后续构建语义关系提供基础,不同概念类别也能够为不同决策场景提供数据支持。
3.3.2 知识类型 本文以临床医学指南、临床路径、检查检验操作指南、药物说明书等数据为基础,根据临床应用场景需求,将医学概念进行聚类归纳后,总结出以下10个主要知识类型:疾病类、症状体征类、病因病机类、药物类、检查类、检验类、护理类、诊断类、治疗类、个体特征类。除定义每个概念类别自有属性值(如名称、别名、ID等)外,还需定义概念相关属性,例如数值属性,如年龄、性别是单值属性,参考值范围是数值属性;对象属性指两个类别之间的关系,如症状发生的部位、适应症对应的疾病等[21-24]。此外需要对每个概念类赋予唯一ID,建立统一的分类体系,并将其与院内各类医学术语词典进行匹配关联,便于后期语义关系的梳理、导航浏览及系统对接应用。精准医学知识组织体系,见图1。
图1 精准医学知识组织体系
3.4 知识语义关系
3.4.1 内涵 语义关系构建是精准医学决策支持的关键,智能化的动态提醒基于强大的数据规则库作为支撑,不同场景下通过调用不同规则语义关系可以实现不同支持目的,如医嘱推荐、医嘱合理性判断、诊断及鉴别诊断等。
3.4.2 语义关联关系 根据已有知识组织体系相关研究[25-26],归纳总结以下常见的语义关联关系:等级与非等级关系。非等级关系包括等同、相关关系及其他。本研究在梳理医学概念类基础上,总结参考临床医学指南、临床路径、检查检验操作指南、药物说明书等知识中关于概念与概念之间的描述,梳理标注22种精准医学知识语义关系,见表4。由于医学知识组织体系是不断发展的体系,医学概念及语义关系也会不断更新调整。
表4 精准医学知识语义关系
4 知识组织应用
4.1 应用范畴
知识组织体系应用范畴较广,在信息检索优化、知识库构建、临床决策支持、命名实体识别、数据挖掘等方面都可以发挥重要作用。本研究仅在场景化的精准医学决策支持方面进行讨论。临床诊疗活动是一个连续的过程,单场景应用包括临床辅助诊断、临床诊疗建议、合理性检查、数值提醒、数据挖掘等方面,该方式无法完全发挥医学知识组织在临床实践中的作用,如仅有诊断结论而没有后续的治疗建议,或仅有标准化的治疗方案但缺少相应的个性化用药指导等。鉴于此,提出基于临床业务流程的决策场景,在临床业务流程模型中每个业务节点都与知识库进行关联,在不同节点进行相应提醒,以门诊和住院两个场景为例进行分析。
4.2 门诊场景(图2)
图2 门诊场景精准医学决策支持
询问病情时能够提供问诊及分诊信息;初步诊断时提供辅助诊断建议;下达检查检验医嘱时推荐合理的检查检验项目并对其合理性进行判断;阅读结果报告时有相关解读及危急值提醒标注;下达用药处方时提供药物说明并合理性判断;患者离开医院后能够进行健康管理。
4.3 住院场景(图3)
图3 住院场景精准医学决策支持
撰写电子病历时有相关提醒及校正;初步诊断时进行鉴别诊断提醒;下达医嘱时有推荐医嘱提醒,并对医嘱内容进行合理性判断及风险提醒;阅读结果报告时有相关解读及危急值提醒标注;制定并执行治疗处理方案时有风险评估、护理方案及相关风险预测提醒;患者出院后能够进行健康管理。
5 结语
基于场景的精准医学知识体系研发以临床业务流程为中心,满足各种场景临床决策支持需求。本文通过调研国内外医学知识组织体系及临床主要业务场景,对PM-CDSS特点、医学知识组织体系、知识数据来源、概念抽取、语义关系梳理及场景应用进行系统性研究,由于精准医学知识组织体系是一个复杂且庞大的工程,现有知识组织体系还存在一定差距,下一步将在PM-CDSS实现、知识组织工程化以及知识组织体系完善等方面开展研究。