临床指南知识表达模型研究现状分析
2017-03-21,,,
,, ,
临床指南系统融合了领域内权威专家的临床指导意见,包含了基本的临床相关理论知识及大量科学严谨的临床诊疗建议[1]。临床指南中包括各种各样的临床决策辅助的手段,如临床路径指导、实践算法、边界准则或适当标准以及实践参数等。临床指南的编撰过程科学严谨,对指定疾病的诊疗有着系统全面的描述,在临床实践中可规避医生主观或其他不确定因素而导致的医疗失误,同时规范医生的医学操作,降低诊疗成本,提高医疗质量[2]。疾病管理以临床指南为标准,针对威胁人群健康和工作生活质量的慢性病,遵照临床防治指南可以预防或延缓疾病的发生和转归,甚至改善患者结局[3]。
目前临床实践过程中存在临床指南使用率低、医生依从性差等问题,推动临床指南的发展与应用需要更有效、智能的手段。将文本形式的临床指南转化为计算机知识表达模型是临床指南实践中需要解决的关键问题之一,对于提高临床指南的利用率至关重要。在临床实践中,构建临床指南知识库是解决临床指南应用瓶颈的方法之一。知识库可供医生随时查阅指南内容,也可在其需要时提供辅助性的诊断建议。构建知识库的第一步是对文本临床指南的合理知识表达。本文将着重分析临床指南知识表达模型的发展现状以及存在的问题,讨论各模型的特点,以期为构建临床指南知识库提供理论支持。
1 临床指南
1.1 临床指南的定义
20世纪90年代,世界著名循证医学的创始人之一Guyatt教授提出了“循证医学”的概念,之后临床指南随之诞生并迅猛发展。目前被广泛认可的临床指南的定义是1990年美国医学研究所提出的。临床指南即系统开发的多组指导意见,帮助医生和患者针对具体的临床问题做出恰当处理,从而选择、决策适宜的卫生保健服务[1]。在医生对疾病有任何疑问的时候,都可通过查阅临床指南得到解答[4],智能的临床指南知识库还可在适当的时机为医生提供科学的临床决策建议。
临床指南是伴随循证医学的蓬勃发展顺势而出的产物,也是循证医学和临床实践的纽带,主要得益于其严谨的开发过程,这保证了临床指南内容的科学与准确。临床指南出现的重要意义是临床指南将医学理论知识与大量专家意见相结合,同时符合严谨的循证医学。医务人员可以通过学习临床指南提高诊疗水平,并在临床实践中灵活运用。
1.2 临床指南中的知识
临床指南的主要作用是在临床实践活动中为医务人员提供理论支持和参考建议。临床指南并未规定医生必须按步骤操作以束缚医生的诊断思维,阻碍医生在诊疗过程中发挥主观能动性。因此临床指南并不能完全取代医生的思维和临床判断。Berner[5]教授按照临床知识的描述及内容的差别将文本指南中的临床知识分为逻辑(Logic)、过程(Procedural)、网络(Graph/Network)和组织(Structured)4层。
1.2.1 医学逻辑
逻辑是人们用以处理问题而抽象的一种思维规则或计算方法,是人工智能领域中最常用的表达形式之一。临床指南中的临床知识主要是由陈述性知识(Declarative Knowledge)和程序性知识(Procedural Knowledge)组成。从信息加工处理的角度讲,陈述性知识是有关事物及其关系的知识,包括事实、概念、原则和理论等;程序性知识是有关完成某项任务的行为或操作步骤的知识,包括进行信息转换活动的所有具体程序和从事此类活动的技能。其中陈述性知识一般由命题和语句组成,命题最大的特点之一是采用“是”(True)或者“否”(Flase)的形式,如收缩压≥140 mmHg或舒张压≥90 mmHg可表示为:(SBP≥140 mmHg)or(DBP≥90 mmHg)
当然,临床指南中的医学逻辑并非都明确清晰,也存在含糊不清的语句。对于不同的医学逻辑,在逻辑层所采用的知识表达方法也相应存在差别[6]。
1.2.2 医学流程
医学流程是临床指南中临床知识的另一部分,主要是用逻辑表达符将陈述性知识进行连接,然后进行推理得出陈述性医学知识表示的结论。如在非同日3次血压值的条件下,如果患者的收缩压大于等于140 mmHg或舒张压大于等于90 mmHg,则患有高血压,知识表达如下:
IF(SBP≥140 mmHg)or(DBP≥90 mmHg)
THEN Hypertension is True
1.2.3 知识网络
临床指南中包含大量的医学流程,如高血压的诊断性评估主要包含“病史检查”“体格检查”“实验室检查”“血压测量”“靶器官损害检查”5个医学流程,但它们并不是无序的,通过节点的形式将医学流程连接,节点间通过有向箭头连接为知识网络。目前构建临床指南中知识网络的常见方法有决策树、贝叶斯网络、人工神经网络以及语义网络技术等。
1.2.4 知识组织
知识网络是将含有知识的集合物加入信息价值的一种跨学科领域的文化活动,以便为用户群提供最好的相关信息体系,即知识的序化。临床指南中的知识组织是按照指南知识的内在逻辑联系,运用一定的组织工具、方法和标准对知识对象进行整理、加工、表示和控制等一系列的序化活动,将领域内的医学知识关联成为一个整体。知识库和临床决策支持系统(Clinical Decision Support System,CDSS)不可能仅服务于某一疾病领域,因此对领域间的医学知识进行规范整理、序化和表达,有利于临床指南知识的共享和更新。如对于一个服务于社区卫生的慢病管理决策支持系统,其中需同时包含常见的慢性病,如糖尿病、高血压、脑卒中等慢病的诊断防治指南。
对临床指南中的知识进行分层关键在于对临床指南知识表达模型进行选择时,应针对不同指南、不同层次知识的特点,在构建知识表达模型的过程中达到与指南的高度融合。
1.3 临床指南存在的问题
临床指南是由自然语言组成的文本,尽管医生可通过使用临床指南提高医疗服务质量,减少医疗事故,但在实际操作过程中,依然存在以下问题。
1.3.1 文本指南语义不明
书面的临床指南由自然语言构成,经常会出现定义不明确、表达缺乏特异性的情况,尤其是临床的不良事件等方面[7]。临床指南中的术语定义不确切,要表达的建议经常不清楚,有时措词含糊,从而导致阅读与整合困难[8]。
1.3.2 医生的积极性不足
大多数情况下,医生的接诊时间有限,无法及时查看指南上的信息辅助自己判断。诊疗时医生更需要准确理解,将患者的病情与临床指南相结合,提出个性化治疗方案,对医生而言这些使用临床指南产生的工作延长了工作时间,增加了负荷。临床指南只对某种或某类疾病有指导意见,会与具有个性化特点的患者之间存在一定差异,需要医生灵活判断。
1.3.3 指南导向与现代诊疗理念不符
临床指南是以疾病为导向的,通过收集有关特定疾病的现有证据编写而成,具有较高的学术意义。而在日常医疗实践中,疾病通常伴随着其他合并症,需多个专业医生共同合作,利用多个临床指南的信息对患者疾病进行准确诊断。这种不同专业的医生对同一患者同时使用多个临床指南的过程需监督机制以减少医疗失误。而现代医疗的理念是以患者为中心,因此疾病为中心的指南的适用性受到了质疑和挑战[9]。受到当前技术条件的限制,绝大多数临床指南都无法被计算机识别、理解与分析,因而决策支持系统不能直接提取患者电子病历中的信息并分析指南中的有关知识,在患者诊疗的关键时刻,准确有效地向医生提供决策建议。系统也无法为医生提供检索学习的功能。但是通过文献调研发现,在实际诊疗过程中只有少数医生使用临床指南,并且是在遇到棘手的疾病时才会查询指南,因为在临床实践中翻看、查找、理解到需要的临床指南将花费更多时间,导致诊断治疗速度降低,甚至延误病情。
2 临床指南知识表达模型
随着卫生信息化的迅猛发展以及各种疾病临床指南日臻完善,国内外研究也从对文本形式临床指南领域转变为了数字化临床指南方面。数字化临床指南是将临床指南编入计算机可识别的结构模型中,与CDSS相结合,在系统中以主动(出现异常时主动提醒)或被动(等待医生寻求建议)的形式提供给医生,将指南的参考与建议作用发挥到最大[10]。以下对目前国内外临床指南知识表达模型发展现状及各模型间的区别比较进行介绍。
2.1 发展现状
临床指南产生于20世纪末期,一些国家对于临床指南的数字化研究已经取得了较理想的成果。随着国内外对临床指南数字化研究的深入,目前比较成熟的临床指南知识表达模型有将近20项[11](图1)。
图1 临床指南知识表达模型发展历程[12]
1989年,Arden语法首次被提出,它提供了一组医学逻辑模块[13],每个模块包含进行一项单独医学决策所需的逻辑。但Arden语法不足以表示复杂的临床指南,如具有高级临床决策算法或多个步骤随时间推移[14-15]。随后出现了更加灵活全面的表达模型,如美国的Asbru、EON、GLIF和 SAGE,欧洲的GUIDE,PRODIGY,PROforma,GASTON等。其中,SAGE和GLIF旨在实现通用的、可互换的格式,PRODIGY3重点表达某些疾病领域(如慢性病管理和预防保健程序)中的指南。
临床指南表达方法主要分为基于自然语言处理和人工智能等技术两类。整理标注文本指南,通过标签的方式,人工将临床指南加工成计算机可以理解的新文本[16],典型模型是GEM。根据指南中的诊疗过程,可视化表示医学流程,通过流程图中节点间的关系可视化表达指南的内容,典型模型是GLIF。大多数现有的临床指南知识表达模型是独立开发,但模型具有共同点,系统反映了建模工作的综合观点及其固有属性[17]。尽管指南知识表达模型都有独特的设计选择,但可代表和执行各种复杂程度不一的指南;提供可视化的工具,允许非专家用户能够通过界面形式直接创建、修改、编译、删除和执行实现临床指南的计算机算法;通过最小的、能重用的结构有效地表达指南,以最大限度地减少通用临床指南表达的工作量。以下为几个较为典型的临床指南知识表达模型,支持异构的决策支持系统无缝集成,并自动化执行。
2.1.1 GLIF
GLIF(Guideline Interchange Format)是由美国哈佛大学、斯坦福大学、哥伦比亚大学和麦吉尔大学医学信息学实验室的合作项目——Inter Med协作实验室开发的,其主要动机是实现用于建模和传播临床指南的标准化共享语言,提出一个精确、无歧义、可阅读、机器可识别、在计算机平台独立的指南知识表达模型[18]。GLIF的构建目标是通过不同的软件工具启用查看GLIF3格式的指南,使临床指南适应各种本地化应用。GLIF使用Protégé作为其编辑工具,其中GLIF3开发面向对象的咨询和表达语言-GELLO编码医学决策规则[19],用概念层、逻辑层及应用层的三层架构对指南进行抽象。比较成熟的应用案例包括:以色列几家初级护理门诊诊所中正在使用GLIF3表达糖尿病足部疾病相关的临床指南辅助临床决策,哥伦比亚大学以冠状旁路移植术术后护理指南为基础进行决策服务[20],纽约长老会医院正在探索利用GLIF及其推理引擎与临床信息系统的临床事件监测相结合。
GLIF知识表达模型的特点是引入领域本体,通过本体论的方法实现了临床指南内容的规范表达;缺点是建立过程复杂,需要跨行业研究人员的合作。医学专家构建医学决策和行为方面的流程图,表述临床指南的核心实质。在此基础上,GLIF3信息学家编码定义表达模型中的细节,如患者数据类型、每个医疗决策的算法和临床建议等。从指南内容的流程图建立到指南中概念和逻辑表达式的形式化编码,过程较繁琐[21]。此外,GLIF缺乏与机构信息系统集成的可靠容量,尚未被卫生信息学界广泛认可,缺乏标准的医疗术语和通信协议,HL7等标准研究机构已在努力解决此问题。利用虚拟电子病历(vEMR)的概念,最终可能会解决问题。然而,如何将本体模型与异质临床信息系统整合仍然是一个挑战。
2.1.2 Arden Syntax
Arden医学逻辑模块语言(Arden Syntax For Medical Logic Modules)是第一个表达模型,于1989年被提出,1999年被HL7收纳。Arden Syntax是一个为了便于各医疗机构之间共享医学知识而产生的医学逻辑模型,主要为决策支持系统提供可使用的知识,为医务人员提供诊疗的参考建议和提醒[22]。Arden语言将医学知识编码作为基于规则的程序,也称为医学逻辑模块(Medical Logic Modules,MLM)。每个MLM都包含足以做出一个临床决策的医学知识,一套可以做出单一的医学决策的逻辑。Arden Syntax并不能用于表示综合临床指南,为构建一个完整的临床指南,需要构建复杂的逻辑来连接各个MLM,因此Arden开发了扩展语法来适应这种限制。如交互式MLM,指定了如何使用多个MLM作为一组来模拟指南行为,并增加了增强版决策表,实现了额外容量的计算,如概率推理。
Arden Syntax曾在美国Columbia-Presbyterian医学中心验证应用,医学中心编辑了约240个MLMs,每个MLM的内容得到了 HL7 Arden 工作小组的验证和维护[23]。Arden语言组织的医学逻辑模块结构清晰,分工划分明确,同时支持可扩展标记语言XML进行编码,这有利于与电子病历的结合。其局限性与GLIF相同,都是将本体与异质临床信息系统整合问题。由于不同地域的医学数据结构,医疗术语及数据访问方式不尽相同,本地化应用存在困难。
2.1.3 EON
EON是由斯坦福大学医学信息学系1996-2003年开发的临床指南知识表达模型,之后转交SAGE项目组。其目的是创建由一组软件组件组成的体系结构和开发人员使用的一组接口来构建强大的决策支持系统[24]。EON定义了指南知识结构,如资格标准、抽象定义、指南算法,决策模型和时间查询等方面[25]。EON系统的研究主要集中在3个方面:利用面向时间概念的患者诊疗记录建立科学的推理机制,如何利用知识表达模型向患者提供准确的决策支持,为临床指南和协议的编码创建知识环境。
ATHENA决策支持系统是一个基于EON模型的高血压决策支持系统,完成了与电子病历系统的整合,目前已在美国退伍军人部的3个医疗中心成功实施[26]。ATHENA客户端通过指南解释器和数据库服务器处理用户的需求,并显示建议或参考。曾有研究者对ATHENA系统进行了长达15个月的临床评估实验[27],初步数据表明,通过ATHENA系统医生加强了对高血压的治疗,其中63.9%的患者在实验时间内已经配以2种以上的抗高血压药物,ATHENA系统运行良好,医务人员依从性较高。
2.1.4 SAGE
与GLIF类似,开发SAGE(Sharable Active Guideline Environment)的目的是在继承现有本体的特征和构建医学标准的基础上,实现基于临床指南的决策支持系统的互操作分布式模型。SAGE于2002年开始作为IDX公司、斯坦福医学信息学系、梅奥诊所、内布拉斯加大学、山间医疗保健组织和Apelon之间的合作项目。SAGE的最终目标是建立一个能够在异构的临床决策系统中执行指南的架构[28]。SAGE采用Protégé作为编辑工具,使用Kwiz作为定制插件,扩展了Protégé在SAGE中的指南建模能力,已经编码的指南包括免疫、糖尿病和社区获得性肺炎指南本体,计划在梅奥诊所和内布拉斯加大学医学中心的模拟环境中使用。
SAGE模型可吸收存在的临床指南知识表达模型的优点与特色,建立自己的表达模型,各个模块都有其他模型部分的特色,如Activity Gragh、Decision Map、Decision Model等模块。因此,研究SAGE模型的知识表达框架,有利于对其他临床指南知识表达模型的兼容性研究(图2)。
图2 SAGE模型吸收其他模型模块示意图
2.2 知识表达模型的比较
上述4种主流临床指南知识表达模型基本涵盖了临床指南表达研究的大部分领域。Peleg等人[29]利用对比分析法尝试各种指南建模方法,通过指南计划组成、目标表征及意图,指南行为模型、决策模型、标准表达语言、数据解释、医学概念模型及患者信息模型8个维度对以上模型进行了并列比较,得出了在计划组织、表达语言、概念医疗记录模型等维度上发现了共识和主要差异在其目标表示、决策模型、场景的使用及结构化医疗行为方面的结论。
2.2.1 目标表示
临床指南知识表达模型根据其如何表达指南意图或目标分为2组。GLIF将目标指定为文本字符串,目的是将此文本呈现给用户或用于索引和搜索临床指南;将指南目标表示成表达式,目的是用作控制计划执行状态。EON等模型通过表达式,并使用结果表达式影响控制流程、生成建议或解释。
2.2.2 决策模型
决策是大多数临床指南的核心。4种临床指南表达模型中使用了交换结构、论证模式、决策树、影响图等决策模型,还支持通过调用外部函数进行决策。
2.2.2.1 交换结构
交换结构描述了在分支确定的情况下指南控制流的互斥分支。GLIF和EON都使用特定的图元建模这种交换结构,通过测试表达式是否匹配多个常量值中的一个,并强制执行相应地进行分支。其他格式不使用显式结构表示交换结构,而是通过前提条件或论证规则中的互斥表达式实现类似的行为。
2.2.2.2 选择是否使用替代品的论证规则
4种模型使用论证规则表达如何选择替代品的非确定性决策,即当存在2种以上的患者可行的替代方案时应如何选择。不同的选项与不同的条件-参数集相关联,模型可用数字表示方案的支持程度(如成本/效用模式)或使用符号权重(如反对、确认和排除),二者都需使用聚合权重的方法。
2.2.3 计划
虽然4种模型都使用术语“计划”(Plan)来描述任务集合,但使用该术语的方式仍存在差异。计划指的是“整体设计或目标的部分的有序排列”,而EON则是区分“管理指南”(疾病状态图)和“咨询模板”(对于不属于管理决策的行为的、数据收集或显示的或者和病人教育有关的上下文关联建议)。GLIF有指南和宏2种计划,指南类似于EON的管理指南,宏是通过声明将指南中指定程序模块变成一组GLIF的三步骤所实现的单个构建体。下面通过不同的计划组件对4种模型进行对比。
一是分支(Branching)。GLIF和EON在指南实施中分支步骤和同步步骤是并行的,根据非布尔选择方法,分支步骤将流程引导到1个或多个指南步骤中。分支步骤和同步步骤一起使用,通过多个可能并行的路径来同步控制流程。当分支步骤上的选择方法是并行时,同步步骤进一步沿着分支步骤的每个可能路径进行,以便在可以访问准则中的附加步骤之前重新同步控制流程。
二是行为(Action)。临床指南行为是用于表示临床指南描述的实际任务的建模原语(如药物处方)。虽然所有的指南表达模型都可以指定医疗行为,但并不是所有的模型都是通过专业的结构化概念实现的。GLIF和EON中的医疗行为包含用于将其实例映射为指定词汇表的槽。在GLIF中,指南编码器通过HL7参考信息模型的数据模型定义患者数据项的属性的方式指定医疗行为。
三是场景(Scenario)。EON中的情景或GLIF中的患者状态是一个定义患者具体情况的计划组件。其特征在于患者状况、治疗情况等[30],方案作为临床指南的切入点。在EON中,咨询模型与用于描述场景的特定操作相关联。
总之,4种模型各有特点。EON的侧重点在于研究支撑临床指南知识表达模型开发和应用的临床决策支持架构的研究,GLIF和Arden Syntax在临床指南知识表达模型的标准化研究工作上有独到见解,SAGE模型在之前指南表达模型研究的基础上集成了这些指南表达模型的优点。
3 临床指南知识表达面临的挑战
3.1 临床指南表达模型的标准化不足
大多数情况下,组成临床决策的临床知识是需要多专业合作的,因此临床指南表达模型必须是可共享和互操作的,而知识的共享必然做到知识标准化。目前,在数字化临床指南领域进行知识标准化的相关工作条件并不成熟,知识表达标准中应该包含哪些组成部分仍然存在争议,从组件的标准到形成完整的计算机可执行的临床指南标准的过程尚不清楚[31]。
3.2 临床指南间的共享不足
构建一个不受机构、国家与地区限制的、可共享、可执行的知识是临床指南知识表达模型研究者和开发机构的终极目标[20]。由于表达模型的多样性和不同地区临床指南本土化需求的不同,共享模型变得困难。DeGel教授和Open Clinical等组织正在为促进临床指南表达模型的共享而努力,致力于构建一个计算机可理解、可执行的指南模型库和组件,目前已开发出执行不同临床指南模型的引擎[32-33]。
3.3 不确定性临床知识的表达不充分
上述临床指南表达模型虽涵盖了模型研究工作的大部分领域,但其中的不确定性知识的效果有限,支持力度不足。因为不是所有医学指标都能精确量化,在临床指南中经常出现“轻度”“少许”等不确定性词汇,需要医生结合实际情况和个人经验去主观判断。由于目前医学发展水平的限制,临床指南很难准确而全面地描述所有疾病的成因、诊断与治疗方案。而不确定性医学知识的表达研究对于提高临床决策支持系统给出的诊疗建议的正确性有较大的帮助[6]。