论描述逻辑在中医药领域的应用
2015-11-05于彤刘静朱玲董燕贾李蓉
于彤++刘静++朱玲++董燕++贾李蓉++杨硕++谭丽娜
摘要:描述逻辑是一种面向计算机知识表示的逻辑语言,主要用于描述概念分类以及概念之间的关系。因其表达能力强、逻辑严谨、支持自动推理等特点,在本体工程中得到了广泛应用。本文结合中医药知识体系的具体案例介绍描述逻辑的概念、特点和表达方式,并探讨其在中医药领域的应用价值。
关键词:描述逻辑;中医药;本体;知识表示
在计算机科学领域,本体是针对一个概念体系的正式而明确的规范。传统的本体构建方法包括框架系统(frames)和语义网络(semanticnetwork)等。这些方法在语义上缺乏严谨性,实际应用效果并不尽如人意。近年来,描述逻辑(description logics,DL)以其强大的表达能力和可计算性的保证,已逐渐取代上述两种本地构建方法而成为新的主流。
DL为中医药知识体系的系统梳理提供了严谨的逻辑模型。它不仅能有效处理中医药领域的复杂知识,对中医药概念体系进行精确描述和规定,而且将有助于提升中医药领域本体的规范性。但中医药信息学者在本体工程实践中尚未充分利用DL的表达能力,有关DL在中医药领域应用的文献较少。笔者将结合中医案例介绍DL的概念、特点和表达方式,并探讨DL在中医药领域的应用价值,为构建基于DL的中医药领域本体提供参考。
1 描述逻辑的基本概念
DL是一类形式化知识表示语言的统称,可用于对概念定义及特征进行形式化描述,并据此实现概念之间关系的自动推理,因而适用于领域概念化和本体设计。DL技术产生于20世纪80年代,在90年代取得了一系列理论和算法上的突破,从21世纪开始则趋于实用化。经过20余年的发展,DL已成为成熟的知识表示系统。
根据DL,一个知识体系中包括3种基本组件:概念(concept)、角色(role)和个体(individual)。其中,“个体”对应某个具体的对象;“概念”对应由两个或多个对象所构成的集合,这些对象被称为这一“概念”的实例(instance);“角色”则表示某种个体之间的二元关系。例如,“病人”属于一个概念,某位病人“张三”属于个体;“四君子汤”属于一个概念,“张三”某次服用的一副“四君子汤”则是一个个体;若“张三”被诊断为“肾虚”,则可以说“肾虚”属于一个概念,而“张三”的临床表现属于“肾虚”的一个实例;“治疗”“临床表现”等二元关系则属于角色。DL为表达领域实体之间的关系提供了多种手段。
1.1 蕴含(i nc lusi on)关系
DL可表达概念或角色之间的蕴含关系( )。例如,“中药 药物”表明“药物”这一概念囊括(subsume)了“中药”这一概念;又如,“治疗 影响”表明“治疗”关系是一种特殊的“影响”关系。
1.2 等价(equivalence)关系
DL可表达概念或角色之间的等价关系( )。例如,“病人;患者”表明“病人”和“患者”是同义的概念;又如,“治;治疗”表明“治”和“治疗”是同义的角色。
1. 3 隶属(type)关系
DL可表达“个体”和“概念”之间的隶属关系(∈)。个体是从某个(或某些)概念延伸出来的一个特殊的实例,而这个(这些)概念被称为该个体的类型(type)。例如,“人参∈中药”表明人参属于一种中药;“气虚证∈证候”表明气虚证属于一种证候。
1.4 个体关联关系
DL可通过断言(assertion)表示个体之间的二元关系。可将“四君子汤”“人参”“气虚证”等领域实体表示为个体,再通过“包含”“治疗”等角色表达个体之间的关联关系,如(人参,治疗,气虚证)(四君子汤,包含,人参)等。
2 描述逻辑的表达方式举例
DL为表达复杂的领域知识提供了丰富的表达方式。如表1所示,DL提供“合取( )”“析取( )”“非( )”“存在量词( )”“全称量词( )”等构造算子(constructor),用于通过简单概念和角色来构造复杂概念。例如,可将“疏肝剂”这一概念表示为“方剂 疏.肝”;又如,“中医典籍 作者.中医”表示“中医典籍的作者仅能为中医”。可见,DL是一种侧重于描述“疏肝汤”之类复杂概念的逻辑语言,这也是“描述逻辑”名称的由来。下面对DL的表达方式进行具体介绍。
2.1 互斥关系
DL可被用于定义两个概念是互斥的。在DL中,A
B表示概念A和B是互斥的;即任意A的实例不可能同时是B的实例。例如,可通过“寒;一热”表示“寒”和“热”两者之间没有交集。
2.2 全称约束
在DL中,全称量词V表示“仅仅”“只”等意思。例如,“方剂 包含.中药”表示“任意方剂所包含的仅能是中药(它不能包含西药)”的概念,即“任意一种方剂都仅能与中药发生‘包含关系”;又如,“水 克.火”表示“属水者仅能克火”的意思。
2.3 存在约束
在DL中,存在量词 表示“存在”的意思。例如,“方剂 包含.中药”描述“任意方剂都‘存在一些组成成分”的概念,即“每种方剂都与某些中药存在‘包含关系”。
2.4 角色互逆
在DL中,一个角色可被声明为另一个角色的逆角色。P为Q的逆角色,则任意形如(x,P,y)的陈述蕴含形如(y,Q,x)的陈述。DL使用负号来表示逆角色,P-Q即表示P为Q的逆角色。例如,“被治疗;治疗”表达“治疗”和“被治疗”之间的互逆关系。
2.5 角色的定义域和值域
通过DL可以描述各种角色的定义域(约束角色适用的主体的取值范围)和值域(约束属性适用的客体的取值范围)。例如,“ 治疗.
药物”表示“治疗”的定义域为药物,“ 治疗.疾病”表示“治疗”的值域为疾病(T表示包含所有事物的类型)。
3 描述逻辑的应用价值
近年来,本体成为实现生物医学术语规范化的一项新兴技术,它帮助交互各方对特定领域内共用的概念、术语以及概念分类建立一致的理解,从而支持知识的表示与共享。目前,生物医学领域已出现了数百个本体,著名的UMLS、SNOMED CT、Gene Ontology等生物医学术语系统都体现了本体的设计理念和方法。本体技术在中医药领域也得到了成功应用,建成了温病学、传统针灸、中医脾胃病、中医证候、中药、中医古籍等方面的一系列本体。DL作为目前国际上主流的本体表示方法,在中医药领域具有广阔的应用前景。
DL在中医药领域的核心作用在于构建领域本体以及基于本体的知识库,从而系统性地存储和管理中医药领域知识,为知识服务系统提供稳定的知识来源。中医药知识体系具有结构复杂、表达方式多样、模糊性强等特点,DL为中医药领域提供了高级的知识建模手段。基于DL,可对中医证候学等复杂知识进行清晰表达,有利于梳理证候、疾病、症状、中药、方剂、治法、出处等之间错综复杂的关联关系,建立以本体为主框架的中医药知识体系。因此,DL为中医药本体知识库系统的构建提供了解决方案。
DL在保证可计算性的前提下,提供了强大的表达能力。基于DL的理论,己出现了FaCT、Racer、Pellet等一系列实用的推理机,在实际应用中均表现出良好的性能。在未来,有可能将中医辨证论治的知识存入知识库中,基于DL实现中医药知识的自动推理,从而改进临床决策支持系统的效果,帮助临床医师做出更准确的诊断。
基于DL的逻辑模型可为语义关系赋予更加确切的含义。例如,假设在本体中具有“中药,治疗,疾病”这样一条语义关系,若这条关系意味着“任何中药都能治疗某种疾病”,则对应的DL公式为“中药 治疗.疾病”。严谨的DL公式可用于自动检测本体中的错误。例如,“方剂”和“中药”之间的关系一般是“某方剂是由某些中药组成的”,两者之间不可能出现“治疗”关系。可通过DL规定“方剂和中药之间只能存在‘由……组成关系”,指导推理机找出本体中的错误,藉此保持本体内逻辑关系的一致性。例如,若机器发现形如“方剂,治疗,中药”的语义关系,则可将其作为一个错误呈现给系统管理员,由管理员检查错误的原因并修改。另外,DL还能支持本体自动转换、自动重构等方法的实现,促进中医药本体的规范化。
DL与语义网(semantic web)技术有密切联系。语义网是一个机器可以理解且人机共享的信息空间,为在互联网环境中进行语义信息和结构性知识的交换提供了理想的解决方案。DL为语义网技术体系之中的万维网本体语言OWL提供理论基础,对OWL的设计和语义定义起到指导作用。因此,基于DL构建的知识库与互联网具有天然的结合点,有利于通过互联网对中医药知识进行广泛传播,
4 小结
DL是近年来知识表示领域的研究热点,因其表达能力强、逻辑严谨、支持自动推理等特点,在本体工程中得到广泛的应用。DL为中医药领域提供了高级的知识建模手段,使领域本体在逻辑上更加严谨,应用上更为可行。在中医药领域中应用DL,需要分析实际的语言环境,理解语义关系的确切内涵和用法,进而决定逻辑模型的设计。可选择中医证候学等涉及复杂概念体系和领域逻辑的子学科开展DL的示范性应用研究,最终建立完整的中医药逻辑模型,为中医药领域的知识表示与共享奠定基础。