作战数据知识化:需求与方法

2015-11-01黄红兵潘显军李贤玉张连伟

指挥与控制学报 2015年4期

黄红兵潘显军李贤玉张连伟

早在2003年5月美国国防部签署的《国防部网络中心数据战略》[1]中,数据的可理解性就被作为一个重要目标被提出来:“用户和应用能同时在结构和语义上理解数据,并很容易确定该数据怎样用于特定需求”.我国学者也提出了军事信息系统的“新三互”能力,即互操作、互理解、互遵循[2].无论是获得数据可理解性或高层互操作,还是作战数据的更深层次的应用(如军事信息系统的智能化、自动化应用),都需要赋予数据以语义,将作战数据知识化.目前绝大多数军事信息系统中,作战数据的语义都是在人工理解的基础上,通过各种应用的程序指令和业务逻辑来体现,这严重限制了知识的可重用性,也制约了各军事信息系统之间的互操作性.作战数据知识化是解决这些问题的一个重要途径.文献[3]也指出,知识自动化是“指控5.0”的关键技术之一.

本文从军事信息系统发展现状出发,讨论了作战数据知识化的必要性和需求;进而以语义Web研究中发展出来的知识表示技术为基础,给出了作战数据知识化的一般方法,包括作战知识的本体化建模、作战数据的知识获取以及作战知识的推理扩充等方法.

1 作战数据知识化的目的与需求

作战数据知识化不是“为技术而技术”,而是军事信息系统,特别是指挥控制信息系统深入发展的必然需求.

1.1 作战数据知识化的目的

作战数据知识化最基本的目的是服务于军事信息系统智能化和军事信息系统互操作.

1.1.1 军事信息系统智能化

随着军事需求的发展,智能化已渐渐成为军事信息系统发展的主要着力点,主要集中于军事情报的融合处理[4−5]、指挥控制的决策支持[6−7]、作战计划的自动生成[8−9]等诸多领域.虽然智能化的概念非常宽泛,但是基本上都是建立在“知识”的基础上的.

智识的DIKW(Data-Information-Knowledge-Wisdom)等级模型[10]提出近三十年,虽然数据、信息、知识和智慧的内涵与外延、它们之间的关系以及它们之间的严格区分还没有定论(或许也不可能有定论),但是从信息系统的角度看,数据、信息、知识和智慧大体可以与不同类型的信息系统相对应[11],如图1所示.

图1 DIKW与不同信息系统之间的大致对应关系

一定的信息形式支撑一定的信息系统,因此,要想军事信息系统有更深入的、智能化的发展,作战数据知识化势在必行.

1.1.2 军事信息系统互操作

虽然军事信息系统互操作问题很早就被提出来了,美国国防部也早在1998年就发布了信息系统互操作层次模型[12],但是一直没能很好解决.面向服务的技术一直被认为是系统互操作问题的最终解决方案,并且这些理念和技术也融入进了许多体系结构框架,例如北约的NAF 3.0、美国的DoDAF 2.0、英国的MoDAF 1.2等.但是,正如文献[13]指出的:由于许多军事组织之间点对点的单一关系,在信息系统服务化的实践中,很多时候只是将原来的“烟囱式”系统迁移到了“烟囱式”服务.研究者们认识到,即使有服务和消息的标准、协议等,各系统还是处于“巴别塔”中(来源于圣经故事,指因语言不同、无法沟通),对数据的一致理解、数据重用等问题是阻碍军事信息系统互操作的一个非常重要方面.

从(广义的)数据互操作角度,概念互操作等级模型(LCIM,The Levels of Conceptual Interoperability Model)[14]给出了系统互操作的另一种视角,如图2所示.

按照LCIM 模型,目前许多系统还只停留在语法互操作层次,为了提高军事信息系统的互操作层次,作战数据知识化是一个重要手段,通过作战知识共享,实现更高层次的系统互操作.而在一些互操作标准中也包含着军事数据知识化的需求,如C-BML[15−16].

图2 概念互操作等级模型(LCIM)

1.2 作战数据知识化的需求

作战数据知识化,首先需要形成概念体系、建立起知识模型;然后在此模型的基础上,对现有作战数据进行知识抽取,并根据需要对它们进行合并、校准;更深入地建立推理规则或特定数学模型,对作战知识进行推理扩充,导出其隐含知识.

1.2.1 作战知识建模

作战知识本质上是一种领域知识.作战知识建模就是将作战领域所涉及的知识概念化、形式化,通过这些概念之间的关系表达其语义,并通过派生于军事规则的上下文来表达其语用.

作战知识建模需要将相关作战知识形式化,具体地,需要将作战知识涉及的实体概念、属性概念、概念间的关系以及相关军事规则进行形式化,形成计算机可处理的数字化知识,如图3所示.这些实体概念包括组织、人员、设施、装备、资源、环境、活动、计划等涉及和包含的各种实体概念.实体属性概念包括能力、数量、位置、速度等描述实体特征的各种概念.概念之间的关系包括概念间的类属、组织间的从属、作战活动中的支援、物资分配中的占有等各种关系.军事规则是从军事条令、作战手册等归纳、抽象出的一系列规则,包括相关约束条件、触发规则等.

作战知识建模需要选择相应的知识表达方式,本文选择本体(Ontology)来描述知识,关于这点将在第2节讨论.

图3 作战知识建模

1.2.2 作战知识抽取、合并、对准

作战数据知识化的第2步,需要将现存于各种军事信息系统中的数据,按照建立起的作战知识模型,进行知识抽取、合并,形成知识库,并且对不一致的知识进行匹配对准,形成可用的作战知识库,如图4所示.作战知识抽取就是按照一定的知识表示方式从作战数据中获取作战知识;合并就是将获得的作战知识按照统一的知识表示对获得的知识进行整合;匹配对准是根据建立的作战知识模型,在不同来源知识的不一致概念之间建立联系,赋予一致的语义.通常,作战知识抽取与合并可以一并进行,在抽取时就按照统一的知识表示来进行,合并就很简单,可以连带实施,如图4所示.

图4 作战知识抽取、合并、对准

作战知识的获得之所以要从现有的信息系统数据中抽取,主要基于两个原因:1)从头开始获取作战知识所需要的工作量太大,而现有数据中本身蕴含着一定的知识模型,只是在实体化数据时丢失了这些模型;2)考虑系统的兼容性和延续性,基于知识的新系统不可能完全抛开原来的数据,只能在原有作战数据的基础上增加语义信息,形成作战知识.

按照一定的作战知识模型,直接从数据中抽取获得的作战知识,是一种显式知识.除了表达不同,它并不能带来更多信息.作战数据知识化的红利来自蕴涵于显式知识中的隐式知识,而隐式知识是通过推理获得的.因而作战数据知识化的一个非常重要的需求是作战知识的推理扩充,如图5所示.

图5 作战知识推理扩充

作战知识推理扩充一般包括两类:一类是基于知识表示的,即利用知识表示的语义表达能力,进行知识推理.例如,如果存在两条显式知识“A是驱逐舰”、“驱逐舰是舰船”,在一定的知识表示下,可以自动推理出“A是舰船”.另一类相对复杂一些,需要按照一定的表达方式建立推理规则,通过相应规则驱动隐式知识的获取,如图5.在作战数据知识化时,需要考虑这两种知识推理扩充方式.

2 作战知识的本体化建模

在计算机科学和人工智能领域,本体(Ontology)是一种知识表示方法[17],是一个关于领域知识的形式化描述.作战知识本体化建模就是通过本体技术,将作战领域知识以一种形式化的、机器可处理的方式组织和表示出来.

2.1 本体技术

抽象地,知识是关于论域中事物和事件的命题集,而命题都是由概念及概念之间的关系来表达.本体技术就是基于这一认识,以形式化方法来描述概念及概念之间的关系,并以此来表达知识.

2.1.1 一般本体及其表达

知识的基本组成是命题,命题的基础是概念,概念由其内涵与外延决定,但是孤立的概念难以表达意义,意义蕴含在概念的关系中.因此,作为知识表达的本体,其组成包括:

1)类或类型(Classes or Types),描述客观世界对象的类型,用于表达概念内涵;

2)对象或个体(Objects or Individuals),描述客观世界对象个体或实例,用于表达概念外延;

3)特性(Properties or Attributes),描述类或个体的特征,用于表达概念内涵;当将类或个体之间的关系看作一种特性(Properties)时,也用于表达概念之间的关系;

4)属性值(Attribute Values),个体特性的值,用于表达概念外延;

5)关系(Relations),描述类之间、个体之间、类和个体之间的关系,用于表达概念之间的关系;

6)断言或/和公理(Assertions or/and Axioms),利用以上概念给出论域中的相关命题.

作为共享概念模型的形式化显式规范描述[18],本体需要一种具有明确语义的显式描述方法.

本体描述方法在语义Web(Semantic Web)[19]领域得到了深入发展,最终形成了本体描述语言OWL(Web Ontology Language).早在2004年OWL就成为W3C推荐的本体建模标准,新的版本OWL2[20]也于2012年正式发布.

OWL的基本构造块包括类(Class)、个体(Individual)、特性(Property)和公理(Axiom)[21].对于上述本体组成,OWL中的显式表达对应如表1.

OWL的逻辑基础是描述逻辑(Description logic),有着严格的语法和形式化的语义[22].描述逻辑是一阶谓词逻辑的一个子集,有着很好的可计算性,能够进行有效推理.也正因如此,语义Web领域已经发展出了很多本体开发和知识推理的工具[23],如 Prot´eg´e[24−25]、Jena[26−27]、Pellet[28−29]等.

2.1.2 概率本体及其表达

由于OWL是基于传统逻辑的,对概率性知识描述以及可能性推理的支持存在不足.而在许多领域中,不确定信息是固有的,甚至处于支配地位,如军事的许多相关领域.这些领域的许多知识通常以一种概率模型表示.而通过在标准本体上增加注解(Annotation)的方式,不能表达概率模型中的结构性约束和概率依赖关系,更不能进行有效推理.因此,研究者们拓展了语义Web语言,以支持概率性知识描述和可能性推理[30−31],其中最典型的一种是概率网络本体语言(Probabilistic Web Ontology Language,PR-OWL)[32−33].

PR-OWL是OWL的扩展,用以表达复杂的贝叶斯概率模型,经过发展解决了早期在表达及语义上与OWL不相容的问题[34−35],并被应用于许多领域[31].

PR-OWL是基于多实体贝叶斯网(Multi-Entity Bayesian Networks,MEBN)[36]构建的,其主干概念如图6所示,这些概念就是来源于MEBN,也是PR-OWL顶层本体的主要部分.

MEBN是一种一阶贝叶斯逻辑,也是一种直接基于实体关系的一阶概率逻辑[37],它利用实体关系模型将贝叶斯理论融进了经典的一阶逻辑,能够以逻辑一致的方式表达不确定性.在MEBN中一个实体贝叶斯模型就是一个MEBN理论,在PR-OWL中以MTheory表达;MEBN理论由若干MEBN片段(MFrag)组成,在PR-OWL中通过关系hasMFrag表达这种包含关系;每个MEBN片段代表了一组实体的影响关系以及与之关联的随机变量之间的概率信息,拥有随机变量的实体在PROWL中以Node表达;实体(Node)或者拥有一个被其他实体定义的可能状态,或者被一个概率分布所定义.

表1 本体基本组成在OWL中的表达

图6 PR-OWL的主干概念及其关系

正是基于这种形式化表示,PR-OWL也有了自己的工具——UnBBayes[38−39].UnBBayes提供了图形用户界面和推理器,可以用于对基于PROWL/MEBN的概率本体进行建模和推理,并且与基于OWL的本体建模工具(如Prot´eg´e)保持兼容.

2.1.3 本体开发的一般过程

本体建模是一个复杂的系统工程,它不仅需要广大领域专家的参与,还需要有效的开发方法和建模工具.研究者们从工程化的角度给出了很多本体开发方法[40],一般地,包括以下步骤:

1)确定本体建模的目的、范围和需求:本体的使用目的是什么？使用本体来完成哪些具体任务？需要对哪一具体领域建模？需要这一领域哪些方面的知识？本体以何种粒度进行建模？

2)获取领域知识:根据需求,针对不同的知识性质对知识进行分类,确定相关知识的来源;对不同来源的知识采用相应的方法进行知识获取,形成本体的半形式化描述.

3)本体构建与精化:按照一定的概念模型,利用建模工具,对半形式化的领域知识,进行结构化的显式表达,形成形式化本体;如果有相关本体存在,重用已经存在的本体.

4)本体验证与确认:根据逻辑标准、结构和形式标准、准确性标准等来评估与验证本体,确定所构建的本体是否符合需求.

当然,这些之间可以存在一些迭代.

总之,本体以其强有力的知识表达能力已被广泛关注,语义Web领域发展出来的诸多技术和工具现在不再局限于该领域自己,已经被应用于其他诸多领域,如物联网[41]、情报大数据管理与分析[42]等.随着智能化需求的发展,这些技术和工具也正被应用于各种军事领域.

2.2 作战知识及其一般层次

从知识体系角度,作战知识可以按作战层次分为战略知识、战役知识和战术知识等,也可以按作战要素领域分为指控领域知识、情报领域知识、通信领域知识、气象领域知识,等等.但是,这些分类方法,还是将作战知识条块分割,并不利于系统互操作.一般来说,无论是作战数据、作战知识,还是建构于其上的信息系统,它们都隐含着一个模型,该模型是现实作战系统某些方面或属性的简化描述,用于结构化、理解或服务于真实作战系统.

综合诸多方面的考虑,可以将作战知识分成3个大的层次,如图7所示:1)关于作战系统自身的知识,即作战系统的组成以及这些组成之间的关系的知识;2)关于作战实体围绕作战而展开的活动的知识;3)关于战场态势的事实判断以及未来状态的预期的综合性知识.

图7 作战知识及其一般层次

作战系统自身的知识,即关于作战系统的组成以及这些组成之间的关系的知识.作战系统的组成,即构成作战系统的各种实体,包括参加作战的敌我兵力(包括建制、人员、武器、装备等)、作战环境(包括陆地、海上、空中、太空等物理环境和政治、经济、文化等非军事环境)、作战资源(主要指的是消耗性物资,如弹药、频谱、油料、粮食等)、时间(包括时刻、时序、时延等)、空间(点、线、面、体、方位;位置、长度、面积、体积、角度等),等等.作战系统组成之间的关系,主要通过相关属性、隶属关系、制约条件等来体现,如武器的装弹量、通信装备所占频率、作战单元之间的隶属、武器装备适用的战场空间,等等.作战系统自身的知识主要描述Who、When、Where.

关于作战活动的知识,指的是与作战活动的主体、效用、目的等相关的知识.对活动的描述可以是描述性的,即事件;也可以是规范性的,即任务.作战活动是在一定的战场环境和社会背景下,由作战单元承担执行,它发生在一定的时间、空间中,消耗相应的作战资源.因此,关于作战活动的知识是建立在关于作战系统自身的知识上的,是关于What的知识.

关于事实、预期与决策的知识,包括与态势、计划、命令等概念相关的知识,它是在关于作战系统自身的知识和关于作战活动的知识的基础上,对作战实体过去、现在、未来的状态和活动的综合判断,以及在这些判断之上形成的策略、措施.这些知识蕴含着人的意识,是What、Who、When、Where、Why、How 的综合知识.

关于作战系统自身的知识是最基本的,是其他两类知识的基础.

这3类作战知识存在于军事理论、作战条令、行动手册、数据标准、数学模型乃至数据库等结构化或非结构化的文件和数据源中,也存在于各军事领域专家的大脑中.

2.3 作战知识的本体构建

2.3.1 作战知识本体的组织

基于本体的作战知识可以分为两类:模式知识和实例知识.模式知识也称术语知识(Terminological Knowledge),对应于描述逻辑的T-Box,它们定义了领域知识结构,描述的是关于类的知识.实例知识也称断言知识(Assertional Knowledge),对应于描述逻辑的A-Box,描述的是关于个体的知识.将这两类相分离,保证了知识结构不被破坏,将类和个体分开,使模式知识具有复用性.

为了具有更好的可重用性和互操作性,可以将描述模式作战知识的模式本体分成一般本体和特殊本体.一般本体(或称顶层本体、基本本体、核心本体)指的是可以在不同军事领域进行复用的本体,这些本体中的概念是非常一般化的、独立于特定领域的,如作战实体、活动、事件、时间、空间,等等.特殊本体指的是与特定领域、应用、任务、活动、方法等相关的本体.基于这种认识,作战知识本体可以按图8的层次方式进行组织.

顶层本体定义最一般的军事概念和关系,可以被所有军事领域复用;领域本体描述陆、海、空等军兵种或指控、情报、通信等领域知识,可以被该领域的所有应用复用;应用本体针对特定应用而构建,表达该应用所需要的特殊知识.

2.3.2 作战知识顶层本体

根据前面关于作战知识及其一般层次和组成的论述,可以构建作战知识顶层本体,其主干结构如图9所示.作战知识顶层本体围绕作战活动而构建,将关于作战系统自身的知识、关于作战活动的知识和关于事实与预期的知识联系在一起,融合成一个有机的顶层知识框架.

图8 作战知识本体的层次组织方式

图9 顶层作战知识本体的主干结构

有关作战系统自身的本体主要集中于实体(Entity),其类层次结构如图10所示.当然这只是一个实例,实际的类层次结构需要结合军事理论、作战条令、数据标准等来抽象得到.

2.3.3 领域本体和应用本体的构建

领域本体和应用本体的构建,在概念和关系上是对顶层本体的精化和扩充.例如,在情报领域,可以对“态势(Situation)”进行精化、扩充,形成如图11所示的态势感知核心本体[43].

领域本体和应用本体在精化和扩充过程中,应遵循以下两个原则:1)“奥卡姆剃刀”原则,“如无必要,勿增实体”,保持本体中概念和关系简单、有效;概念和关系越复杂,构建过程中越容易出错,同时知识推理更耗资源;2)模块化原则,提高本体的内聚度,减小本体间的耦合度,这可以利用本体语言提供的模块化特征(如OWL的模块化、可组合、分布等特性),通过关注点分离来实现.

图10 实体的类层次结构

图11 对顶层本体精化和扩充得到的态势感知核心本体

遵循这些原则,可以带来如下好处:1)可扩展,利于开发,使本体设计可协作、可持续;2)可组装,利于维护,许多维护任务可以通过更换发生问题的模块来完成;3)可重用,方便使用,每个独立模块都可以更容易地在其他语境中使用;4)有效推理,因为简单并且可能只有模块的一小部分与推理问题有关或这个推理可以分配到独立模块进行处理,使得对一些推理变得更有效率;5)更开放,便于本体更方便、自然地演进.

通常,由传统数学模型描述的概率性知识,可以在应用本体中构建,如果是领域通用的本体,可以在领域本体中构建,以便于知识复用.

鉴于本体的设计目的以及当前技术水平,并不是所有概率性知识都可以通过本体表达,能够表达的通常只是一些能够进行概率或模糊推理的知识,PR-OWL表达的则是能够进行贝叶斯推理的知识.基于PR-OWL创建领域性的或应用的概率性本体,可以按以下步骤进行:

1)确定需要建模的概率性知识所涉及的概念实体.这些实体的确定通常可以通过识别具有影响关系的逻辑组来实现.

2)确定实体所具有的属性.如果属性是连续的,确定如何将它离散化;如果是离散的,但是取值太多,确定如何将取值分组.

3)确定实体之间的影响规则,包括同一个逻辑组之内的实体之间以及不同组的实体之间.这些规则表现为实体属性值或其分布之间的相关关系.

4)将以上实体、逻辑组、影响关系和规则,映射到MEBN的相应元素.一般地,逻辑组映射到MEBN的片段(MFrag);根据在逻辑组中影响关系的位置不同,实体分别映射到语境结点(Context Node)、输入结点(Input Node)或驻留结点(Resident Node);影响规则映射到概率分布(Probability Distribution).

5)利用建模工具,将上述结果通过PR-OWL表达出来.

3 基于作战数据的作战知识本体获取

作战知识本体获取的基本方法有两种:自上而下的方法和自下而上的方法.自上而下的方法即如上节所述从顶层本体一步步精化、扩充.自下而上的方法则是从数据库、文档等结构化或非结构化数据中提取本体.考虑现实需求,特别是系统的兼容性和延续性需求,作战知识本体的获取通常基于已有的作战数据,从这些数据中抽取和构建本体.

从作战数据中获取本体主要包含3个方面的工作:模式本体的构建、实例本体的抽取、作战知识本体的匹配与对准.

3.1 作战知识模式本体的构建

作战数据最主要的存储方式是数据库,它们都是基于一定的数据模型来构建的.因此,作战知识模式本体的第一种获取途径就是作战数据的数据模型.而另外一些与数据相关的作战知识,隐含在作战数据的应用逻辑中,包括对数据的处理和分析.

3.1.1 数据模型到本体的直接映射

作战数据模型通常基于一定的数据标准来开发,一般以ER(Entity-Relationship,实体-关系)图表示,存在于开发文档和相关文件中.数据模型还可以利用工具(如Sybase Power Designer),通过逆向工程,从已有的数据库模式(Database Schema)中获取.

关系数据模型也包括实体、关系、属性等基本元素,可以与本体中的概念相对应,对应关系如表2所示.

更进一步,数据库组件与OWL表达的映射关系如表3所示.

基于作战数据,利用这种对应关系进行映射转换,可以提取作战知识的许多模式本体,能够减少从头开始构建本体的工作量,并且能够与作战数据相容,利于军事信息系统的继承与发展.

但是,作战数据库中的实体表一般对应于作战知识模式本体中最下一层的类,不能构成完整的作战知识本体类层次结构.通常情况下可以采用两种方法完善这一工作:1)基于从作战数据中提取的本体一层一层抽象得到作战知识本体的类层次结构;2)更直接地,从作战数据标准或数据库表名直接构建出来,因为作战数据中的实体分类,通常在数据标准中给出,或体现在数据库表名中.另外,还有一些关系数据模型无法表达的知识,也需要人工进一步完善,例如,关系的传递性、对称性、自反性,不相交类,关系链,等等.

3.1.2 作战数据应用中的本体获取

在传统的军事信息系统中,作战数据的绝大部分语义都蕴涵在了数据的应用逻辑之中,体现在数据的处理和分析上.因此,这一部分与数据相关的作战知识,需要深入挖掘数据应用的业务逻辑,从中提取可以本体化的知识.这一过程相对复杂,获取手段也多是特定的,难以给出通用的具体方法,其一般过程如图12所示.

表2 关系数据模型基本元素与本体中的概念的对应关系

表3 数据库组件与OWL表达的映射关系

图12 从作战应用中获取本体的一般过程

随着数据分析处理技术的发展,基于数据的作战知识的一个重要来源是数据分析,这类知识不仅可以是分析结果还可以是分析过程.对分析过程的本体建模通常比较难,特别是涉及复杂的数学模型,图12包含了PR-OWL可以进行建模的数据分析过程,即基于贝叶斯网的分析过程.

3.2 作战知识实例本体的抽取

数据库中的数据实例(即数据库表中的行),可以基于提取的模式本体,按照一定的映射规则,从数据库中提取转换为实例本体.

从数据库中抽取实例作战知识本体的基本框架如图13所示.

数据实例到实例本体的映射规则如表4所示.基于作战数据和模式本体,利用表4中的这种映射关系,就可以抽取作战知识的实例本体.

至于概率本体的实例,由于其与实例数据的对应关系比较复杂,通常要根据具体的模式概率本体与相应数据库模式的对应关系,建立起数据实例的提取映射规则,然后基于这些关系和规则来抽取.

表4 数据实例到实例本体的映射规则

图13 作战知识实例本体的抽取框架

3.3 作战知识本体的匹配对准

构建作战知识的一个重要目的是知识共享.因此,在许多应用场合下,需要将从不同作战数据中获取本体进行合并,实现知识的共享与复用.但是,不同来源的作战知识本体可能存在一些不一致的地方,不能通过简单堆积就能实现合并;同时,这些不同本体之间还可能存在一定的关系,需要建立起这些关系,使作战知识保证完整性.

不同本体之间的异质性有多种类型[44],包括:1)语法异质性(Syntactic Heterogeneity),指的是因为采用不同本体语言表达产生的不一致性;2)术语异质性(Terminological Heterogeneity),指的是在不同的本体中使用不同的名称指称同一个(种)实体;3)概念异质性(Conceptual Heterogeneity),也称语义异质性(Semantic Heterogeneity),指的是由于使用了不同的概念定义或不同的概念而导致的不一致;4)语用异质性(Pragmatic Heterogeneity),关注的是人怎样理解和使用实体概念,这种异质性一般是计算机难以处理的.

本体之间的语法异质性,可以通过不同本体语言之间的转换关系,利用工具很容易完成.对于作战知识本体来说,通常情况下对它们的理解和使用基本一致,因而语用异质性一般可以不用考虑.对于术语异质性和语义异质性,需要在不一致的本体之间找出对应关系,并通过确定的描述方式显式表达出来.

术语异质性和语义异质性一般是紧密相关的,消除它们的一般过程如下:

1)从不同本体的最上层概念开始,逐层比较这些概念的名称和意义;

2)找出这些概念之间的关系,如同义关系、反义关系、同一关系、并列-互斥关系、超类-子类关系、整体-部分关系,等等,或者没有关系;

3)基于给定的本体语言,显式描述这些关系.

这一过程相当于在不同作战知识本体之间添加必要的匹配对准知识,使合并起来后的本体保持一致相容.这种匹配对准知识主要表现为相关概念之间的关系,OWL中描述类、特性和实例各自之间关系的显式表达方式如表5所示.图14给出的是一个基于OWL的简单本体之间的匹配对准实例.

4 作战知识的推理与扩充

除了能够将作战数据所不能描述的诸多知识进行表达外,作战数据知识化的另一好处是能够从这些显式表达的知识中推出隐含的知识,并且这些推导过程通常是通用的,不特定于具体数据,便于知识共享和应用系统的构建.

4.1 推理扩充的形式与方法

作战知识的推理扩充通常有几种方式:基于知识表示的语义推理、基于显式规则的推理、基于特定数学模型的知识发现与获取.

表5 类、特性和实例各自之间关系的OWL表达

4.1.1 基于知识表示的语义推理

基于知识表示的语义推理指的是,以RDFS和OWL等知识表示方法为基础,通过RDFS和OWL等的语义规则,来推理扩充作战知识.例如,表6给出的是RDFS语义推理的最小规则集.这些语义规则给出了如何从显式表示的知识来推理隐含知识的方法,并且这些规则来源于知识表示的语义,因此,可以称之为“基于知识表示的语义推理”.

由于基于知识表示的语义规则是一般性的,其推理可以基于通用推理器来进行.例如,基于RDFS和OWL的作战知识推理扩充,就可以利用工具Prot´eg´e、Jena、Pellet 等来进行; 基于 PR-OWL的,则可以利用UnBBayes来推理扩充.

为处理日益增长的知识库,一些研究引入了云计算技术,以加速对大规模知识的推理[45−46].

4.1.2 基于显式规则的推理

虽然不同于知识表示的语义规则,显式推理规则在某种意义上也是一种知识,它是对语义规则的扩展和补充.由于RDFS和OWL等知识表示方法的语义局限性,许多情况下需要利用一些显式规则来表达相关作战知识,并进行知识的推理扩充.

虽然标准化组织W3C的语义Web技术栈中有关于规则的部分,但是由于需求过于多样,并没有给出一个标准规则,而只是给出了规则交换格式标准(RIF,Rule Interchange Format),旨在提供一种核心规则语言及其扩展方法,以允许不同规则系统之间的转换.

图14 作战知识本体匹配对准的简单实例

表6 RDFS语义推理的最小规则集

目前语义Web领域应用比较广泛的一种规则语言是SWRL(Semantic Web Rule Language)[47].SWRL的主要目标是:以与OWL语法、语义和理论模型相一致的方式,提供比OWL更丰富的表达.基于SWRL的作战知识规则推理,也可以利用现有工具进行,如Pellet等.

4.1.3 基于特定数学模型的知识发现与获取

基于知识表示的语义推理和基于显式规则的推理都是基于形式逻辑的,具有一般性和通用性,但是也正因如此,许多特定领域基于特定模型的知识,很难通过前两种方法得到.另一方面,通过统计、数据挖掘、机器学习、大数据等方法从数据中发现、获取知识,已成为作战知识推理扩充的重要方法.这些基于特定数学模型的知识都隐含在具体处理分析过程中,通常难以通过一般化的方法表达.

目前,基于特定数学模型的知识发现与获取,通常是直接从数据库中获取数据,并将可以通过语义和规则推理的知识隐含在业务逻辑中,导致具体模型程序与数据耦合太紧.其实,这一过程可以建立在知识表示和推理规则上,以简化相关知识的获取过程(相关框架结构见4.2节).

4.2 作战知识推理的应用框架

作战知识推理主要为军事信息系统应用的业务过程提供必要的知识,其应用框架如图15所示.对基于本体表达的作战知识,其查询与获取通常使用SPARQL语言(SPARQL是SPARQL Protocol and RDF Query Language的递归缩写)[48].基于语义规则和显式推理规则,推理引擎得到知识库中存在或隐含的知识.基于特定数学模型的知识发现与获取过程,可以利用知识库和推理引擎简化相关知识的获取逻辑,使其关注点更聚焦于数学模型的实现,而知识推理可以基于成熟的推理器.

图15 作战知识推理的应用框架

5 结论与展望

作战数据的可理解性是军事信息系统互操作及自动化、智能化的关键,作战数据知识化是解决这些问题的一个重要途径.本文首先详细论述了作战数据知识化的必要性和需求,指出它是军事信息系统,特别是指挥控制信息系统,深入发展的必然需求.进而,在讨论作战知识及其一般层次和回顾本体技术的基础上,给出了作战知识的本体构建方法.然后,辅以实例,详细论述了基于作战数据的作战知识本体获取方法,包括:作战知识模式本体的构建方法、作战知识实例本体的抽取方法、作战知识本体的匹配对准方法.最后,讨论了作战知识的推理与扩充问题,指出了推理扩充的形式与方法,给出了作战知识推理的应用框架.

作战数据知识化的具体实践,还有很多细节问题亟待解决,包括适用于各个领域的作战知识顶层本体的构建、各种领域知识本体的生成、应用本体抽取中映射关系的确定,等等,这些都要具体问题具体分析,在实际工作中深入研究解决.另外,作战知识的具体应用也是需要广泛而深入研究的问题,目前可见的应用包括态势感知和威胁评估、作战计划生成与验证自动化、辅助决策支持等.作战数据知识化以及作战知识的应用,目前遇到的障碍可能主要来自于观念固化和知识储备不足,包括设计习惯形成的路径依赖以及对遗留系统的处理等,这些都要在实际工作中努力克服.

总之,随着军事信息系统深入发展,作战数据知识化的需求越来越迫切;而信息技术和智能技术的发展,也使得作战数据知识化成为可能;互操作和智能化的需要,使得基于知识的军事应用也会越来越多.