军事医学本体构建的理论问题探讨
2016-03-22,,,,
,,, ,
[作者单位]1.解放军医学图书馆,北京 100039;2.军事医学科学院卫生勤务与医学情报研究所,北京 100850
1 军事医学本体的概念及解析
1.1 军事医学本体的概念
军事医学本体属于领域本体的范畴,是军事医学领域关于共享概念模型的明确形式化规范说明。
1.2 与通用顶层本体、一般医学本体的关系
通用顶层本体,一般也称为通用本体,是独立于领域的高层本体,它使完全相异的系统能够使用一个共同的知识库,并且从通用本体可以衍生出领域本体。通用本体通常表达最常识、最基本的概念和知识,也就是人类对世界的基本认识[1]。通用本体是各领域本体构建的基础。
军事医学属于特种医学范畴,相对于军事医学,通常将西医称为一般医学。一般医学本体和军事医学本体分别表达医学领域和军事医学领域中概念及概念之间的关系,其中军事医学本体分为军事医学顶层本体和军事医学各子领域本体。由于医学科学和技术对军事医学具有重要的支撑作用,因此一般医学本体的概念体系能够为军事医学本体的构建提供借鉴和参考,军事医学本体和一般医学本体是交叉扩展的关系。
通用顶层本体、一般医学本体和军事医学本体的分属关系如图1所示。
图1通用顶层本体、一般医学本体和军事医学本体的分属关系图
2 军事医学本体构建的需求分析
2.1 军事医学本体构建的必要性
军事医学本体的构建是在语义层次挖掘军事医学知识的理论和技术基础。军事医学知识体系的复杂性决定了其本体构建的复杂性[2]。军事医学是在特定目的导向下产生的、为特定群体服务的一门综合性学科。军事医学各分支领域由于形成的历史条件存在差异,研究内容也不同,因而在发展完善程度上差别较大,从而形成了军事医学学科多维、多态、多元的复杂特征[3]。从这个意义上说,本体较强的描述能力为表达和处理军事医学领域这种复杂的知识体系提供了一种理想化的模型,可以通过语义分析推理挖掘一些相关的知识。
军事医学本体的构建能够促进军事医学知识的共享及重用,目前已经积累了大量数据和信息,特别是近几十年,生命科学数据量激增,使得军事医学成为一种数据密集型学科。科学数据的本体描述是实现科学数据语义集成共享目标的首要工作[4]。军事医学领域本体独立于数据源模式,可作为数据源稳定的概念接口,为军事医学不同应用系统间的互操作提供统一的标识码,使得计算机能够理解语义信息,系统间的交流准确无歧义,进而实现不同系统之间军事医学资源的共享。
军事医学本体的构建是军事医学信息检索的需要。即使在数据量不多的数据库,采用关键词进行全文检索仍存在检索结果与用户要查找的文献有些出入的问题。大数据时代下,随着数据量骤增,使用数据库进行全文检索的问题更加突出,导致出现用户不需要的结果。
本体能够将领域知识表示成机器能够理解的形式,从动态角度体现概念之间的语义关系,提供语义层的检索,提高知识获取的效率和质量。
2.2 目前军事医学术语标准的现状与问题
2.2.1 分类法
2.2.1.1 中国图书馆分类法
中图法(第五版)[5]中与军事医学密切相关的类目有R82军事医学、R83航海医学、R84潜水医学、R85航空航天医学。
中图法对军事医学的分类较为简单,是一种线性分类方式,并且分类体系不够严密,并未从知识领域、知识体系的角度来分类,因而使得分类体系漏掉了许多重要的知识领域,如军队卫生装备学、军事心理学、军事环境医学、军事毒理学等。中图法的一维线性结构缺少本体模型中概念间的关系,其树状分类结构可为军事医学本体领域概念的分类提供参考。
2.2.1.2 中华人民共和国学科分类与代码国家标准
简称《学科分类与代码》,是中华人民共和国关于学科分类的国家标准。其中与军事医学相关的一级学科为医药科学类下的“340 军事医学与特种医学”,其二级学科为“军事医学”、“特种医学”、“军事医学与特种医学其他学科”。但学科分类与代码的分类对象是学科,不同于专业和行业的分类,不能代替情报、文献、图书分类以及学术上的各种观点[6]。因此,学科分类与代码并未对军事医学学科进行细分,无法用于军事医学本体的构建。
2.2.2 叙词表
2.2.2.1 中文医学主题词表(CMeSH)
CMeSH[7]主要收录美国国立医学图书馆《医学主题词表》(2012版)中译本(由中国医学科学院医学信息研究所翻译出版)、《中国中医药学主题词表》(由中国中医科学院中医药信息研究所编辑出版)及《中国图书馆分类法·医学专业分类表》(由《中国图书馆分类法》编委会、中国医学科学院信息所图书馆编辑出版)。在中文医学主题词表(2012版)的检索系统中,输入主题词“军事医学”,查询结果(图2)显示,该主题词无下属分类,无法用于军事医学本体的构建。
图2 中文医学主题词表(2012版)对“军事医学”的查询结果
2.2.2.2 军用医学主题词表[8]
该词表是《军用主题词表》系列的重要组成部分,1993年出版。该叙词表总词量为23 387个,其中正式主题词(含专业名词)为20 662个,非正式主题词为2 725个,属大型专业词表,用户可以从字顺表、范畴表(学科分类)和英文译名查找[9]。词表中词间关系分为等同关系(Y-用,D-带)、等级关系(S-属,F-分,Z-族)和相关关系(C-参)3种。词表中设置了族首词,表示在词族中概念最大的主题词。
《军用医学主题词表》中,款目词用“参”项表示概念词间的相关关系,但是这类参照项数量较少,使得许多概念间的相关关系在叙词表中没有给出。另外,这些相关关系都是“匿名”的,即无法通过叙词表中概念间的相关关系来获得具体的语义信息。而本体的构建会进一步揭示概念间的相关关系,使知识的表达更完整。
《军用医学主题词表》提供了相对丰富的军事医学概念及可靠的概念关系,是构成军事医学本体概念的良好基础,应该最大程度地加以继承[10]。
2.2.3 专业词典和书籍
专业词典能够对领域内的专业词汇做出解释,因此可以从中抽取领域本体的概念及关于概念的定义[10]。军事医学专业词典和书籍具有极高的专业性和权威性,能够为军事医学本体构建提供权威的概念定义及概念间的逻辑关系,从而为本体模型框架的构建提供科学指导。同时,其蕴含的大量军事医学概念间关系,可作为本体构建概念关系提取的语料库,通过文本分析的方式提取军事医学语义关系。
2.2.4 术语标准
全国科学技术名词审定委员会是经国务院授权,代表国家进行科技名词审定公布的权威机构。图3为在全国科学技术名词审定委员会网站数据库中进行检索的结果。从图3可以看出,“医学”和“军事科学”(目前在审定中)分类下均无“军事医学”分类项。以“军事”为检索词,按照“包含”检索的方式,检索出24条记录,其中跟军事医学相关的有“军事药学”、“军事心理学”、“军事航海”、“军事航空”、“军事航天技术”5条。
全国科学技术名词审定委员会公布的名词术语具有权威性,可选取军事医学相关术语作为军事医学概念集用于本体模型框架的构建,但目前关于军事科学的名词术语还未公布,待该领域术语完善之后,可从中抽取军事医学相关名词术语用于军事医学本体的构建。
2.2.5 存在的问题
通过对目前军事医学术语标准现状的分析,发现现有军事医学术语标准主要存在以下两个问题。
一是术语标准自身存在的弊端。分类方式简单,无法解决军事医学相关知识和学科跨越、相关重合等复杂性分层结构与网状立体结构问题,但专业性强,可为军事医学本体构建提供语料支撑。
二是内容大多较陈旧,无法紧跟军事医学的进展。《中国科学:生命科学》杂志2011年刊登了军事医学科学院建院六十周年专辑,包括20篇该院重点学科和科研成果,既涵盖了传统军事医学领域如输血医学[11]、三防医学[12-14]等,又有很多新兴军事医学领域如蛋白质组学[15-16]、生物医学工程学[17-18]等。以生命科学为代表的新兴学科已经成为现代军事医学的重要支撑性学科,对这些学科在军事医学本体中的构建还需要寻找其他术语标准做以补充。
图3 全国科学技术名词审定委员会网站对“军事”的检索结果
3 军事医学本体构建的复杂性分析
军事医学本体的构建是个复杂的过程,具有较大难度。本文将从军事医学学科知识的复杂性、军事医学概念的复杂性及概念之间关系的复杂性三方面对其进行讨论。
3.1 军事医学学科知识的复杂性
军事医学学科包含范围广,分科分类细,并且不断发展演化。张明华在《军事医学系统论》一书中将军事医学学科体系划分为3个层次[19],一级子系统分为医学与军事学、管理学交叉形成的社会人文学科,医学科技在军事环境中应用形成的主体技术性学科,围绕卫勤保障任务形成的综合保障性学科。此外,还以军人为中心,按照人的身心伤病层次、人-生态环境层面以及人-机-环境层面对军事医学研究任务进行进一步层次划分,最后分为31个子学科。军事医学首先是军事的医学,随着军事需求的不断发展变化,军事医学也逐步进行战略转型,其内部包含的门类更加细化,且内容也不断增多,一切有关战斗力的生成与维护、国家安全与发展的知识和技术都会成为军事医学的内容。目前,学科交叉和技术融合已经成为知识创新的强大动力,成为新知识的生长点,不仅会对生物医学和整个科学技术发展产生深远的影响,而且必将促进军事医学研究范式的更新。以上这些都造成了军事医学知识量越来越庞大、内容越来越复杂,且处于动态变化中。
3.2 军事医学概念的复杂性
概念是反映对象本质属性的思维方式。中华人民共和国国家标准GB/T 15237.1-2000中,将“概念”定义为“对特征的独特组合而形成的知识单元”[20]。军事医学概念应满足领域概念的一般性特点:首先概念的词性通常为名词;其次概念所表达的内容一般是一类或者具有实际意义的事物,不能太过具体[21]。军事医学是一个特殊的分支范畴,目前学科体系的划分还未形成统一的标准,定义不明确,边界不明显。军事医学概念应包含军事医学领域的全部方面,其概念表达的全面性和代表性应获得领域专家的认同。随着时代变革及学科的不断发展演化,军事医学的概念也应不断更新。
军事医学概念包含通用性概念、上位学科领域概念和军事医学领域特有概念3个部分。通用性概念:在任何学科领域都需要的,属于通用本体的基本内容,在军事医学领域概念中也不可或缺,如时间、地名、人名、机构等;上位学科领域概念:军事医学是医学和军事学的交叉学科,军事医学概念与医学和军事学概念存在相似性[19],因此既可以继承某些医学领域概念,如基础医学、临床医学、急救医学等概念,也可以继承某些军事学概念,如战创伤等军事伤病防治领域概念;军事医学领域特有概念:该部分概念的特点是在军事医学领域频繁出现,而在其他领域及通用领域中出现的概率较小,如军队卫生学、军队流行病学、核化生武器医学防护学、军事生物医学工程学、军队卫生装备学、军事药学、军事医学史学等学科领域概念。
3.3 军事医学概念之间语义关系的复杂性
军事医学概念之间语义关系的复杂性主要取决于3个因素。
3.3.1 军事医学本体语义网络本身的复杂性
军事医学本体的核心结构是一个复杂的语义网络,而语义关系是支撑这个语义网络的框架。由于军事医学与一般医学的知识结构具有较高的相似性,军事医学概念间的关系可以继承一般医学概念间的语义关系。除此之外,还应根据军事医学自身特点建立军事医学特殊的语义关系。如军事医学的服务对象——军人是区别于普通民众的一类特殊群体,其年龄分布、健康要求、作业环境、伤病特征等均有其特殊性,这些在特定层面上均决定其特殊的语义关系。
3.3.2 军事医学学科体系的复杂性
军事医学本身是一门具有庞大复杂知识分支体系的学科,不但各个分支分得很细,而且每个分支学科之间互相交叉重叠,形成一个错综复杂的知识网,因此清晰地反映出每个知识点及知识点之间的关系也变得更加困难。
3.3.3 军事医学知识本身的复杂性
军事医学知识的复杂性特点,使得在知识表达和分析上都存在一定困难。为了提高军事医学本体的性能,我们在构建军事医学本体时要对军事医学知识进行分析研究,探索其本体构建的复杂性,这对军事医学本体的检查和维护都是有益的。