APP下载

基于双层建模的知识表达方法在医学知识库构建中的应用

2017-12-28张寅升乔清治李昊旻吕旭东段会龙

中国生物医学工程学报 2017年5期
关键词:医学知识表达方法知识库

张寅升 王 瑞 乔清治 李昊旻 吕旭东 段会龙

1(浙江工商大学管理工程与电子商务学院,杭州 310018)

2(山西大医院信息处,太原 030032)

3(浙江大学附属儿童医院,杭州 310003)

4(浙江大学转化医学研究院,杭州 310027)

5(浙江大学生物医学工程与仪器科学学院,杭州 310027)

基于双层建模的知识表达方法在医学知识库构建中的应用

张寅升1王 瑞2乔清治2李昊旻3,4∗吕旭东5段会龙5

1(浙江工商大学管理工程与电子商务学院,杭州 310018)

2(山西大医院信息处,太原 030032)

3(浙江大学附属儿童医院,杭州 310003)

4(浙江大学转化医学研究院,杭州 310027)

5(浙江大学生物医学工程与仪器科学学院,杭州 310027)

医学知识库是临床决策支持系统(CDSS)的重要组成部分。目前部署在医院内部的CDSS通常针对特定的需求(如合理用药、辅助诊断),其知识库所涵盖的知识种类比较单一。构建一个整合多种不同医学知识种类的协同知识库,能够使得不同类型的知识内容作为一个有机整体提供更加全面和有效的决策支持应用。提出一种基于双层建模的知识表达方法,首先分析和归纳临床信息化环境下影响诊疗决策的各类医学知识,如诊断知识、治疗知识、药学知识等,并对它们之间的协同关系进行定义,形成认知模型,然后针对特定的知识推理和计算的需求,为每一种知识类型选取具体的知识表达形式,形成最终的计算模型。基于该双层建模方法所研发的临床决策支持系统在三甲医院已运行4年多,实践表明该系统有效解决不同知识类型的集成和推理的需要,为构建整合和全面的知识应用奠定基础。

知识表达;知识库;临床决策支持系统;双层建模

引言

临床决策支持系统(clinical decision support system,CDSS)可以作为贯彻循证医学的一种信息化工具,而医学知识库是CDSS中的一个基础性资源,它将医学文献、教科书中的循证医学知识表达(表征)为计算机可处理的形式并进行存储,是CDSS提供循证决策支持的基础。在实际的临床环境下,医疗机构采购的CDSS通常来自不同厂商,并针对特定的需求(如合理用药、辅助诊断、感染控制等)。其知识库涵盖的知识种类比较单一,并且大多采用私有的知识表达方法,难以整合形成协同的(coordinated)知识资源。而这种协同性的缺失削弱了知识在临床实践中的应用效果,比如仅有诊断结论而没有后续的治疗建议,或者仅有规范化的治疗方案但不能在治疗过程中提供剂量调整等个性化支持。这导致不同类型的知识内容难以作为一个有机整体提供更加全面和有效的决策支持。工程领域的解决思路分为两种:一种是从系统层面上研究如何实现不同类型临床决策支持系统或服务之间的协同,即如何对异构系统进行流程集成。另一种是从底层的知识表达模型上进行知识内容的整合和再组织,通过构建相应的知识库实现统一的知识管理。本研究重点对第二种思路进行研究,目标是设计一种能够包容各种不同知识类型及其协同关系的知识表达方法。

1 基于双层建模的知识表达方法

为实现对各种不同知识类型及其协同关系的表达,直接的解决思路是定义一个相对完备的模型,把各种所需要的知识以规范化的方式表达在这个模型中。然而,这种方案在应对医学这个特定领域时存在若干局限性。首先,相比于其他领域,医学领域的知识比较复杂,自主设计一个相对完备的模型所需的工作量会非常巨大,不但需要考虑领域本身的知识体系结构和各种知识种类的特点,还需要兼顾各种应用场景的具体需要;其次,知识表达模型需要相应的执行引擎或推理技术来驱动知识内容,而实现一个与自定义模型相匹配的知识执行功能并非易事。以上两点可归结为认知充分性(epistemological adequacy)问题和启发充分性(heuristical adequacy)[1]问题,前者强调对目标领域内感兴趣实体的表达能力,后者强调知识表达对于知识推理和解决问题的便利性。对于复杂领域,单一的知识表达形式难以涵盖领域中形态多样和特征各异的知识类型,也难以满足高效推理的要求,因此需要多种不同的知识表达形式的共存和互补[2]。

基于以上思路,本研究设计了一种双层建模的知识表达方法,将知识表达模型划分为顶层模型和底层模型(见图1),顶层模型负责对不同知识类之间的语义关联进行定义,而底层模型包含各类知识的具体表达形式,可以定制各自适用的表达形式或复用现有的表达规范。顶层模型是一个认知模型(epistemological model),包含了针对特定需求或任务所需要的知识类型,而底层模型是一个计算模型(computational model),即适合计算机系统执行和处理的数据结构。两种模型相互关联,一方面满足了领域专家对领域整体框架和脉络的把握,另一方面又使得知识内容满足了计算机系统推理和处理的需要。

图1 基于双层建模的知识表达方法Fig.1 A knowledge representation method based on two-layer modeling

1.1 认知模型的构建

认知模型的建立首先需要决定将哪些种类的医学知识纳入知识表达的范围。从CDSS的角度出发,本研究优先考虑影响诊疗决策的基本知识,并使用本体技术定义了图2所示的认知模型。认知模型将领域知识分成人可读知识和计算机可执行知识两大类别。人可读知识是一类非结构化的知识工件(artifact),包含了临床指南、系统综述等次级循证医学知识和随机对照试验等初级知识,以便于临床工作者高效地阅读和获取知识。这类知识能够对临床决策支持干预作出解释,并为临床医生的决策提供可靠的参考依据。计算机可执行知识是一类结构化的知识工件,它将人可读知识转换为计算机可处理的结构和逻辑,并且能够在信息化环境中驱动决策支持应用。计算机可执行知识又分为规范化表达的知识(由知识表达规范所定义的结构来表示和存储)和硬编码知识(如编译到程序内部的二进制处理逻辑)。引入硬编码知识出于以下两点考虑:首先,在闭源软件和遗留系统中,硬编码是知识的普遍存在形式,这类知识没有被显式表达而且难以提取,因此通常被排除在知识库管理之外,不能得到有效利用;其次,规范化知识表达具有内在的缺陷[3],即不能无限细致地表达全部知识,而硬编码知识在表达形式和推理形式上不受限制,在实际临床应用中可以按需开发或集成相应的工具,弥补规范化表达知识的不足。

图2 用于构建医学知识库的认知模型Fig.2 Epistemological model for medical knowledge base

认知模型还体现了不同知识之间的关联:一是临床问题实体作为纽带关联起诊断类知识和治疗类知识。基于这种关联,当诊断规则产生临床问题后,以该临床问题为准入条件的临床协议可以同时被推荐给临床医生,以实现更加全面的决策支持。二是硬编码形式的知识补充规范化表达的知识。硬编码形式的知识不受限于特定的知识表达形式,可以由各种第三方或自主开发的应用工具提供,能够为规范化表达的知识提供有力的补充。三是人可读的知识为计算机可执行的知识提供临床证据参考。在提供决策支持干预时同时提供现场临床证据可以提高医务人员对干预的认同和对相关循证医学知识的认知,以改善临床实践。

1.2 计算模型的构建

认知模型是一个上层本体(upper ontology),对其进一步细化为计算模型后,才能成为满足CDSS实际需要的应用本体(application ontology)。认知模型细化为计算机模型的过程是一个确定子表达形式(subformalism[1])的过程,即为认知模型中的类选取具体的知识表达形式和受控术语集,从而将其转化为计算机可识别和可处理的形式。图3显示了从认知模型生成计算模型的过程。计算模型可以根据不同的知识类型按需定制表达和推理方法,也可以复用已有的知识表达规范和相应的推理引擎,例如,“临床数据项”可以使用UMLS(一体化医学语言系统)、SNOMED CT等本体系统进行限定;“诊断规则” 可以使用 Arden Syntax[4]、Drools 规则语言(Drools Rule Language,DRL)[5]、CLIPS(C 语言集成产生式系统)等规则语言进行表达和推理;“临床问题”可以使用ICD进行限定;“医嘱集”可以使用HL7 Order Sets Specification[6]进行表达;“临床路径”可以使用 GLIF、SAGE[7]、PetriNet[8](及衍生语言)等流程类的建模语言进行表达和推理;“检验”项目可以使用LOINC进行限定;“手术”项目可以使用现行操作术语(current procedural terminology,CPT)[9]进行限定;“用药”项目可以使用 NDF-RT、RxNorm[10]等术语系统进行限定。

图3 根据认知模型生成计算模型。图中上层本体对应认知模型,其中的类经过特定的知识表达形式及术语系统表达和约束后,形成计算模型Fig.3 Deriving computational model from epistemological model.In this figure,the upper ontology is the epistemological model.The computational model is generated by specifying concrete knowledge representation formulisms and terminologies for concepts in the epistemological model.

计算模型将医学知识转化为计算机可处理的形式,并决定了知识库的存储结构。基于对象关系映射(object-relational mapping,ORM)[11]等技术,可在一定程度上实现从计算模型到知识库存储结构的自动化构建和同步更新。常用的ORM包括微软.Net平台的 Entity Framework、Java平台下的Hibernate等。

2 系统实现

基于以上的双层建模方法,在国内某三甲医院构建了医学知识库,并在住院部的医嘱录入(computerized physician order entry,CPOE)系统中实现了若干决策支持应用。

2.1 医学知识库建设

医学知识库采用SQL Server关系型数据库实现,数据库结构通过ORM技术从知识表达模型生成,当前版本的数据库共包含了62张数据表。通过部署在医院内部的网络化知识编辑系统(http://ktp.brahma.top/),临床专家不断对知识库的内容进行维护,并形成了初具规模的知识资源。表1列出了当前知识库中一些有代表性的知识内容,涵盖了多种类型的知识及相互关联。

2.2 临床决策支持系统

本研究提出的知识表达模型和构建的医学知识库集成了多种类型的知识,并规范化表达了它们之间的关联,从而为实现全面而协同的决策支持奠定了基础。在CDSS的系统构建上,本研究以医学知识库为起点,首先为每一类医学知识提供相应的知识服务(如用于诊断规则和用药规则的推理模块),然后通过工作流引擎实现对不同知识服务的编排(orchestration)和协同调用,最终形成了一套集成在医嘱录入系统(CPOE)中的协同 CDSS[12]。图4展示了系统中一些典型的决策支持应用。A区域为临床问题列表,其中的临床问题根据诊断规则推理得出。根据知识表达模型中所定义的硬编码形式知识与规范化表达的知识的关联,用户上传到知

识库中的二进制插件工具可以被注册到临床问题上,为其提供丰富的扩展功能。例如,图中a是针对类风湿关节炎的插件工具按钮,点击后弹出B所示的DAS28类风湿关节炎疾病活动性评分工具,用户也可以将这些工具注册到用户工具栏(图中c)。对于推理得出的临床问题,点击后可以显示与该问题相关的诊断规则和临床数据项(图中C区域),进一步可以查看相关临床数据项的历史变化曲线(窗口D),以直观显示该临床问题的发展趋势。点击图中b所示的Infobutton,可以查看与该临床问题相关的临床指南(窗口E)。针对每个临床问题的临床协议会同步推送给医生(图中F区域),用户只需要点击应用按钮(图中d)就可以在医嘱录入区域生成医嘱。在应用临床协议的过程中,还可以自动调用执行与医嘱项目相关联的插件工具,如G显示了胰岛素个性化剂量调整工具。图中H为药物医嘱的Infobutton,点击后弹出与该药品相关的药品说明书(窗口I)。医生提交医嘱时,会触发知识库中的用药规则,对医嘱项进行合理用药审查,检测到的剂量、禁忌征、相互作用等用药提醒会通过消息窗口J推送给医生。

表1 知识库中维护的内容Tab.1 Maintained contents in the knowledge base

图4 在CPOE中实现的临床决策支持(A—临床问题列表;B—DAS28类风湿关节炎疾病活动性评分工具;C—推理临床问题所用的诊断规则和临床数据项;D—临床问题相关数据项的历史变化趋势;E—高血压的临床指南;F—高血压的标准医嘱集和临床路径;G—胰岛素剂量调整工具;H—下达药物医嘱的Infobutton;I—肝素钠注射液药品说明书;J—合理用药警报)Fig.4 Clinical decision support in CPOE(A-Clinical problem list;B-Rheumatoid arthritis DAS28 calculator;CThe diagnostic rule and clinical data items used to generate the current problem;D-Historical trends of related clinical data items for the current problem;E-Hypertension clinical guideline;F-Standard order sets and clinical pathways for hypertension;G-insulin dosing advisor;H-Infobutton for prescribing medication;I-the drug label for the heparin injection;J-Drug use alerts)

基于不同知识类型之间的协同关系,系统实现了“‘临床数据’驱动‘诊断规则’→产生‘临床问题’→推荐‘临床协议’”这样的一体化决策支持流程,并实现了硬编码插件工具在诊疗流程中的无缝介入。系统于2013年在国内三甲医院上线,目前已运行4年多。该系统使得不同种类的知识能够作为一个有机整体提供更加全面和有效的决策支持,是CDSS在临床实践中的一个成功案例。

3 讨论

本研究提出了一种基于双层建模的知识表达方法,从表达粒度(granularity)上将表达模型划分成认知模型和计算模型两个层次。认知模型是一个相对抽象的模型,负责对知识类型及相互之间的关系进行定义。计算模型拥有更加细致的表达粒度,使得特定类型的知识具备实际的可执行或可推理能力。这种双层模型即能够满足用户自定义表达和推理方法的需要,又能够兼容和复用各种已有的知识表达规范(见图3)。在研究提出的双层建模方法中,认知模型恰好可以作为一个主体框架(backbone)去整合各种不同的知识表达形式。本研究提出的这种由粗入细的建模方式符合人类的自然思维习惯,可推广到其他领域的建模和知识表达。

本研究构建的知识表达模型定义了不同知识类型之间的语义关联,并基于这个模型在临床中进行了系统实践,成功构建了医学知识库和相应的临床决策支持系统。当前版本的知识表达模型包含了临床环境下决策支持所需的典型知识类型,随着后续临床需求的增加,还可以向知识表达模型中扩展更多知识类型和语义关系,使得知识库和临床决策支持系统能够及时响应不断出现的新型医学知识。如,以基因组学为代表的新型知识和高通量检验技术,正在逐步进入临床以指导个性化医疗实践。针对这类新的知识,当前的表达模型不仅可以将基因组学知识纳入知识库,还可以建立它们与已有知识(如临床问题等表型知识和合理用药规则)的关联。从技术层面考虑,当模型扩展了新的知识类型和语义关系后,对象关系映射技术可以方便地实现知识库存储模式与表达模型的同步更新,使得知识库能够及时响应快速发展的新型医学知识。

在本研究中,医学文献是CDSS知识库内容的主要来源,然而不能忽视的是,以文献为主要传播途径的医学研究正呈现出快速增长趋势,如何将这些新发现的知识及时且迅速地转化为符合知识库表达模型的结构化内容是CDSS面临的一个重大挑战。医学自然语言处理和文本挖掘等技术作为医学信息学领域的研究热点,有望实现自动化或半自动化的结构化的知识提取,这也是接下来将持续开展的一项工作。除了公开发表的医学文献,医疗机构内部伴随着诊疗业务开展而产生的大量临床数据也是极具价值的潜在学习资源。基于这些临床数据,可以形成更符合本地医疗机构的诊疗规程和结构化知识,对于改进CDSS的本地化应用具有重要价值。例如,美国卫生信息技术协调员办公室(Office of the National Coordinator for Health Information Technology,ONC)将快速学习(rapid learning)作为其 5年战略计划(2011-2015)的目标之一,以充分挖掘临床数据的重大潜力;2014年ONC进一步将学习型医疗系统(learning health system,LHS)作为其未来10年的战略目标。因此,如何基于临床数据实现对知识库内容的扩展也是临床决策支持系统的研究方向之一。

在系统评估方面,本研究需进一步开展定量评估的工作。基于双层建模方法所构建的CDSS已在临床使用多年,但目前对系统的评估仅限于临床用户的主观反馈和体验。后面可以通过系统对照的方式对用户接受度(对CDSS建议的采纳程度)、业务流程改进(由一体化决策支持带来的流程改进和效率提升)、诊疗效果等指标进行量化分析。

[1] Nebel B.Reasoning and Revision in Hybrid Representation Systems[M].Berlin:Springer-Verlag Heidelberg,1990.

[2] Sloman A,Whyweneed manyknowledgerepresentation formalisms [C] //Research and Development in Expert Systems IX-Proceedings BCS Expert Systems Conference 1984.Bcston:Cambridge University Press,1985:235.

[3] Weng C,Tu SW,Sim I,et al.Formal representations of eligibility criteria:A literature review [J].Journal of Biomedical Informatics,2010,43(3):451-467.

[4] Kraus S,Enders M,Prokosch HU,et al.Accessing complex patient data from Arden Syntax Medical Logic Modules [J].Artificial Intelligence in Medicine,2015,In Press.

[5] Fobel A,Subramanian N,Comparison of the performance of Drools and Jena rule-based systems for event processing on the semantic web [C] //IEEE International Conference on Software Engineering Research,Management and Applications.Hammamet:IEEE,2016:24-30.

[6] McClay JC,Campbell JR,Parker C,et al.,Structuring Order Sets for Interoperable Distribution [C] //AMIA 2006 Symposium:Biomedical and Health Informatics.Washington,DC:American Medical Informatics Association,2006:549.

[7] Peleg M. Computer-interpretable clinical guidelines:a methodological review [J].Journal of Biomedical Informatics,2013,46(4):744-763.

[8] Weng JT,Ameedeen MA.A survey of petri net tools [J].Lecture Notes in Electrical Engineering,2015,315(8):537-551.

[9] Hirsch JA,Lesliemazwi TM,Nicola GN,et al.Current procedural terminology:A primer [J].Journal of NeuroInterventional Surgery,2015,7(4):309-312.

[10] Zhu Q,Jiang G,Chute CG.Profiling structured product labeling withNDF-RT and RxNorm [J]. JournalofBiomedical Semantics,2012,3(1):16-20.

[11] Torres A,Galante R,Pimenta MS,et al.Twenty years of objectrelational mapping:A survey on patterns,solutions,and their implications on application design [J].Information and Software Technology,2017,82:1-18.

[12] 张寅升,南山,段会龙,等.基于工作流管理技术的医学知识库集成与协同应用 [J].中华医院管理杂志,2016,32(11):833-836.

A Knowledge Representation Method Based on Two-Layer Modeling for Constructing Medical Knowledge Base

Zhang Yinsheng1Wang Rui2Qiao Qingzhi2Li Haomin3,4∗Lv Xudong5Duan Huilong5

1(School of Management and E-Busineess,Zhejiang Gongshang University,Hangzhou310018,China)

2(Department of Information,Shanxi Dayi Hospital,Taiyuan030032,China)

3(Children’s Hospital,Zhejiang University,Hangzhou310003,China)

4(Institute of Translational Medicine,Zhejiang University,Hangzhou310027,China)

5(College of Biomedical Engineering&Instrument Science,Zhejiang University,Hangzhou310027,China)

Medical knowledge base is an important asset for clinical decision support system(CDSS).Current CDSSs deployed in hospitals are mostly targeted at specific requirements(e.g.rational drug use,computeraided diagnosis),and their knowledge bases usually contain one specific type of knowledge.A comprehensive knowledge base that can coordinate different types of medical knowledge is essential for building integral and effective decision support applications.This paper proposes a knowledge representation method based on twolayer modeling.First,an epistemological model is constructed to cover various diagnostic and therapeutic knowledge types used in clinical settings,as well as their coordinative relationships.Then,based on specific reasoning and computation requirements,concrete representation formulisms are assigned to each knowledge type to form the final computational model.A clinical decision support system based on this two-layer modeling method has been running for more than 4 years in a Class III hospital.Practices show that the system effectively solved the need of integrating and reasoning of different knowledge types,and has established a foundation for building integral and comprehensive knowledge applications.

knowledge representation;knowledge base;clinical decision support system;two-layer modeling

R318 文献标志码:A 文章编号:0258-8021(2017)05-0573-07

10.3969 /j.issn.0258-8021.2017.05.009

2016-11-25,录用日期:2017-04-26

国家高技术研究发展计划(863计划)(2012AA02A601);国家自然科学基金(30900329)

∗通信作者(Corresponding author),E-mail:hmli@zju.edu.cn

(致谢:本研究受浙江省信息化与经济社会发展研究基地资助)

猜你喜欢

医学知识表达方法知识库
汉语近义词辨析知识库构建研究
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
思维导图在医学中的应用
加强班级凝聚力建设,激发学生学习的积极性
新环境下《解剖学》教学资源开发探讨分析
卫星状态智能诊断知识库设计方法
卫校化学教学中渗透医学知识的实践
英语中序数词的表达方法
表达感谢
位置与方向测试题