APP下载

基于本体的主战武器装备知识图谱构建

2021-12-20顾丹阳李明倩权冀川

指挥控制与仿真 2021年6期
关键词:三元组轰炸机实例

顾丹阳,李明倩,权冀川,刘 勇,罗 晨

(中国人民解放军陆军工程大学,江苏 南京 210007)

知识图谱的概念最早可以追溯到20世纪60年代形成的“语义网络”理论,2012年谷歌首次提出“知识图谱”技术并用于搜索引擎的智能化实现,它由互连的节点和边构成,以图的形式呈现节点及其之间的关系[1]。

知识图谱包括通用知识图谱和领域知识图谱两大类。通用知识图谱主要强调知识的广度,而领域知识图谱则面向不同的领域,基于不同行业的不同需求定制,往往需要领域专家的经验支持和反复讨论。例如,国土资源[2]、测绘[3]、电力[4]、网络安全[5]、情报[6]等领域的知识图谱研究。

而武器装备领域比较特殊,该领域数据来源广泛、类型多样,有利于构建知识完备、有效辅助战场决策的知识图谱,但同时又大幅增加了构建知识图谱的难度和复杂性。

在该领域,已经形成了部分初步的研究成果。林旺群等[7]对知识图谱体系架构及研究进展进行了综述;邢萌等[8]、吴云超等[9]、葛斌等[10]对军事领域知识图谱的构建环节、技术及应用场景进行了研究;赵瑜等[11]、丁君怡等[12]基于开源数据研究了军事领域相关内容的知识图谱构建方法;车金立等[13]基于百科知识对军事装备知识图谱进行构建与应用研究,但其数据来源与数据类型较为单一;刘梦超等[14]、王宏宇等[15]从军事领域本体出发研究知识建模的内容与方法;江志浩等[16]、车金立等[17]、袁清波等[18]、赵颜利等[19]、左毅等[20]分别对军事领域的作战目标、装备维修保障、指挥控制保障、战例知识、战场海空目标识别等分领域的知识图谱应用进行了研究;李代祎等[21]就面向问答系统的知识图谱进行了研究;夏正洪等[22]对知识图谱的效能评估及可视化分析进行了研究。上述研究成果都为知识图谱的构建提供了思路和借鉴,但在复杂应用环境下构建高质量的武器装备领域知识图谱仍然面临较多的困难。

近年来,军事领域对于武器装备的“数据化”“信息化”要求越来越高,作战形式也向“联合”方向发展,单一军兵种或单一形式的数据资料远远不能满足战场需求。如何展示武器装备数据之间的关系,对武器装备数据进行进一步的分析,全面考量各类武器装备对于军事行动的作用,支撑相关领域相关内容的快速分析和智能搜索,成为当前亟待解决的问题。作者尝试提出一种武器装备知识图谱的构建方法,以支持主战武器装备数据的智能信息搜索,进一步发挥大量武器装备数据的潜在价值。

1 武器装备领域知识图谱的技术架构

1.1 知识建模方法

知识建模的方法通常有2种:自顶向下的方法和自底向上的方法。

自顶向下的方法通常首先为知识图谱定义数据模式,数据模式从最顶层概念构建,逐步向下细化,形成结构良好的分类学层次,然后再将实体添加到概念中。自底向上的方法是对实体进行归纳组织,形成底层概念,然后逐步向上抽象,形成上层概念。一般通用知识图谱主要采取自底向上的方法,而专业领域的知识图谱一般采取自顶向下的方法。

武器装备领域属于典型的专业领域,其概念层次划分分明,但部分专业知识存在于领域专家头脑中,可能无法从数据中归纳、抽象得到,所以该领域知识图谱在开始构建时更适合采用自顶向下的方法。当知识图谱的基本结构(或概念层次结构)已经确立并且其类别节点或关系的数量达到一定规模后,可以采用自底向上的方法为图谱扩充实例及属性数据。如果出现新的概念或类别,必须经过人的审核确认才能加入知识图谱中。

在知识图谱构建之后,其后续维护和发展,需要采取自顶向下和自底向上相结合的方法。自顶向下的方法保证知识图谱中概念和类别层次在质上的正确性,自底向上的方法保证知识图谱中实例及关系数据在量上的有效扩增。2种方法互相依赖、相互补充,共同促进知识图谱结构和规模的递增和迭代发展,形成持续进化的良性循环。

1.2 本体设计

本体的概念最初起源于哲学领域,是对世界上真实存在的系统的描述,是客观存在的一个系统的解释或说明[23]。Gruber将本体定义为“本体是概念化的明确的规范说明”[24],W.N.Borst引申为“本体是共享的概念模型的形式化的规范模型”[25],Fensel认为主要包括4个方面[26]:

1)概念化:客观世界现象的抽象模型;

2)明确:概念及概念之间的联系都被精确定义;

3)形式化:精确的数字描述;

4)共享:本体中反映的知识是其使用者共同认可的。

本文借鉴环球网_环球兵器栏目[27]、中国网-武器资料库栏目[28]等热门军事网站对于武器装备的分类情况,参考了中国指挥与控制学会(微信号c2_china)、电科防务(微信号:CETC-ETDR)等公众号资源,结合武器装备现有数据对武器装备领域的重要本体概念进行了梳理分析。

本文主要聚焦于平台级的武器装备进行分类。对于以某种平台为载体的装备,例如专门用于通信保障的通信车、用于地理测绘的测绘车辆等,统一归结到车辆类别中;而对于以独立形态存在的通信电台等装备,可以在领域本体中扩充相应的本体概念,例如通信电子装备。

以下是我们定义的部分武器装备领域本体概念,主要围绕平台级武器装备展开。依据上述扩充原则,在此基础上可以扩展出其他类型的武器装备本体概念。

武器装备领域本体={飞行器、舰船舰艇、枪械与单兵武器、坦克装甲车辆、火炮、导弹武器、爆炸物、通信电子装备、软件类设备……};

飞行器={航空器、航天器};

航空器={战斗机、攻击机、轰炸机、教练机、预警机、侦察机、反潜机、电子战机、无人机、运输机、飞艇、试验机、加油机……};

舰船舰艇={航空母舰、战列舰、巡洋舰、驱逐舰、护卫舰、两栖作战舰艇、核潜艇、常规潜艇、水雷战舰艇、导弹艇、巡逻舰、巡逻艇……};

枪械与单兵武器={非自动步枪、自动步枪、冲锋枪、狙击枪、手枪、机枪、霰弹枪、火箭筒、榴弹发射器、刀具……};

坦克装甲车辆={步兵战车、主战坦克、特种坦克、装甲运兵车、装甲侦察车、装甲指挥车、工程抢修车、布雷车、扫雷车……};

火炮={榴弹炮、加农炮、加农榴弹炮、迫击炮、火箭炮、高射炮、坦克炮、反坦克炮、无后坐炮、装甲车载炮、舰炮、航空炮、自行火炮、弹炮结合系统……};

导弹武器={反弹道导弹、潜舰导弹、空舰导弹、岸舰导弹、舰舰导弹、空空导弹、地空导弹、舰空导弹、地地导弹、舰地导弹、空地导弹、潜地导弹、反辐射导弹、反坦克导弹……};

爆炸物={地雷、水雷、手榴弹、炮弹、炸弹、鱼雷、火箭弹、原子弹、氢弹、中子弹……}。

作者认为飞行器是指由人类制造、能飞离地面并由人直接操控或遥控的在大气层内或大气层外空间(太空)飞行的器械飞行物。在大气层内飞行的称为航空器,在太空飞行的称为航天器。所以卫星、宇宙飞船、空间站等太空中的装备我们一并归为航天器。但一般情况下并不把这类装备认为是主战武器装备,因此航天器不是本文研究的重点内容。而导弹等武器虽然具备上述性质,但其在现代高技术战争中经常是以独立的平台形式出现,在海战或空战中的作用尤为突出,因此根据这些应用特点,将其单独划分出来作为一类武器装备。

图1是基于上述本体概念划分出来的主战武器装备本体概念层级图。

图1 主战武器装备本体概念层级图

除上述本体概念和层级分类外,还有一些概念也和武器装备存在非常紧密的联系。如图2所示,B-2轰炸机是轰炸机的一个实例,研发国家为美国,参加过科索沃战争,又名“幽灵”轰炸机。本文将这些与武器装备概念直接相关的概念也提取出来作为本体处理,称为扩展领域本体。例如:“美国”为“国家”这一本体下的实例,“科索沃战争”为“战争”这一本体下的实例。

图2 扩展领域本体示例

当研究武器装备的作战应用时,就必须关注这些扩展领域本体,主要涉及组织、军事行动、生产企业三类与作战应用直接相关的概念。将国家、地区、国际组织、非政府组织等基于地理区域的独立实体统称为组织,一般代表武器装备的拥有者、使用者或部署地;将战争、战役、战斗、武装冲突、军事演习等统称为军事行动,其中战例是战争、战役、战斗实例的通称;将生产厂家、公司、军工企业等研发、生产或销售武器装备的独立经济实体统称为企业。

根据其他应用目的也可扩展其他的领域本体。

1.3 关系建模

1.3.1 关系定义

关系指事物之间相互作用、相互影响的状态,或人和人之间或任何事物之间某种性质的联系。在武器装备领域,本体及其之间的关系主要分为6类:上下关系主要是根据范围确定父概念与子概念,由于上下关系的数量有限,在构建时可主要依赖研究报告和热门军事网站中所描述的上下层次关系;同义关系主要指概念上相同或者相似的表达,主要从字面表示的不同对同一个概念或者本体进行抽取;属性关系为武器装备及其特征之间的关系;整体与局部关系主要存在于武器装备的组成当中,本文研究内容的颗粒度为武器平台的级别,因此该类关系并未具体体现;概念与实例关系主要是指上层概念与下级具体实例之间的关系;但并不是所有的关系都能归结到这5种关系上来,其他无法明确归类的关系在本文中统一称为一般关系。

以图2为例,航空器与轰炸机为上下关系,即父概念与子概念的关系;科索沃战争是战争的一个实例,即为概念与实例关系;B-2轰炸机的研发国家为美国,美国是国家概念的一个实例;研发国家是轰炸机的一个属性,即为属性关系。

1.3.2 关系描述

根据上述关系的定义,常采取RDF(Resource Description Framework,资源描述框架)三元组的形式对关系数据进行描述。

RDF是W3C的推荐标准,是一种资源描述语言,它受到元数据标准、框架系统、面向对象语言等多方面的影响,用来描述各种网络资源,其为人们在Web上发布结构化数据提供了一个标准的数据描述框架。

RDF用二元关系模型来表示事物之间的语义关系,即使用三元组集合的方式来描述事物和关系。三元组也是知识图谱中知识表示的基本单位,可用于表示实体与实体之间的关系,或者实体的某个属性的属性值是什么。从内容上看三元组的结构为“资源-属性-属性值”的形式。

根据抽取的大量数据,将武器装备的属性及武器装备之间的关系进行梳理总结。根据武器装备属于不同的层次、分类来确定本体之间存在什么关系;根据描述本体性质的内容,来提炼本体的属性。如图2所示,可以得到<轰炸机,研发国家,国家>这样的三元组,既是轰炸机和国家两个实体间的关系,又可以将国家作为描述轰炸机的属性之一。

由于不同的装备具有不同的性能或特性,可以将一些概念的特殊属性补充到知识图谱中去,例如:预警机一般不携带炸弹,而轰炸机会携带炸弹,轰炸机携带某个型号的炸弹这一关系就会构建到知识图谱中,如图2所示,

2 武器装备领域知识图谱的构建过程

2.1 构建流程

本文在开始构建知识图谱时采取自上而下的构建方法,首先构建领域本体,而后对收集到的大量数据进行抽取,并对其中的冗余数据进行融合,形成符合要求的三元组形式,最后利用知识图谱工具构建知识图谱。构建好的知识图谱可用于指导数据的抽取过程,以不断丰富和完善知识图谱。总体构建流程如图3所示。

图3 构建流程

2.2 实体、属性抽取

在对本体进行设计后,会形成本体概念的层次体系,体系中的本体都是经过验证的准确概念。在对大量数据进行处理时,如遇到不在体系中但是符合本体条件的词语,可进行人工判定并加入体系。

根据定义好的本体概念层次,结合获取的大量数据,对武器装备领域的知识进行实体抽取,主要以本体实例的形式充实到知识图谱中。同时,抽取本体的各种属性对知识图谱进行丰富,例如,每类武器装备实例都有研发国家、生产日期、配发部队等。

下面以B-2轰炸机为例进行说明,下文是百度百科对B-2轰炸机的部分阐述:

“B-2轰炸机是当今世界上唯一一种的隐身战略轰炸机。B-2轰炸机机长21.03 m,机高5.18 m,翼展52.43 m,机翼后掠角33度。可携带8枚近距攻击导弹,8枚B83炸弹。B-2轰炸机第一次投入实战是在塞尔维亚的科索沃战争,这是投入服役十年后的第一次出战。

2003年3月,B-2轰炸机投入伊拉克战场,一架B-2在28日晚上首次实战投放了两颗2 130 kg的新型EGBU-28制导炸弹,炸毁了巴格达市内位于底格里斯河畔的一个通讯塔。”

本文对此内容进行实体抽取将会得到“B-2轰炸机、隐身战略轰炸机、近距攻击导弹、B83炸弹、塞尔维亚、科索沃战争、伊拉克、EGBU-28制导炸弹、巴格达市、底格里斯河、通讯塔”等实体。

2.3 关系、属性抽取

基于上文建模的6类关系,对数据进行关系、属性抽取处理,得到<实体,关系,实体>、<实体,属性,属性值>等三元组。

继续对上文的B-2轰炸机示例进行抽取可得到以下三元组:

其中表示关系的三元组有:

;

;

;

;

;

;

<通讯塔,位于,巴格达市>。

表示属性的三元组有:

;

;

;

2.4 知识融合与更新

抽取得到的知识中可能存在大量的冗余,需要对冗余数据进行融合。同义词和近义词是典型的冗余数据之一,可作为同义关系来处理。将语义相似的、表达方式不同的词语定义为同义关系,再遇到此类词语时,将其按照同一类模板进行处理。

另外,时间和地点数据也可以用于进行知识融合。通过判断时间和地点的一致性可以把不同实体有效关联起来。可以对时间和地点进行单独处理,以辅助武器装备领域知识图谱的构建,提高知识图谱的准确性。

知识图谱还要随着数据的更新换代而不断迭代更新,因此需要经常对数据进行获取处理,并对图谱进行更新维护。随着武器装备的发展,其领域本体、关系等也需要适时更新。

2.5 知识图谱构建结果

图4是利用Neo4j图数据库构建的知识图谱。显示了航空器、B-2轰炸机、科索沃战争等实体或实例及其之间的关系。

图4 利用Neo4j构建的知识图谱示例

图5是利用Cypher语句对“B-2轰炸机在哪些战争中投入过使用?”这一问句进行查询的结果。根据需要我们也可以围绕某一节点对知识图谱进行不同深度的查询。

图5 知识图谱查询示例

3 结束语

本文阐述了武器装备领域知识图谱的构建方法,重点定义了其领域本体及关系,讨论了实体、关系、属性等抽取过程。构建知识图谱时,首先要确保本体概念层次的完整性和准确性,再对下层数据进行扩充,这样才符合武器装备领域的特点。构建知识图谱时,经常面临的一个现实问题是,虽然数据量很大,但真正对构建图谱起作用的不多,而且武器装备领域的很多敏感资料是采集不到的。因此如何保证图谱的实时性和有效性是值得进一步研究的问题。

猜你喜欢

三元组轰炸机实例
基于带噪声数据集的强鲁棒性隐含三元组质检算法*
第十一页 知识点 轰-6K轰炸机
特征标三元组的本原诱导子
B-1B轰炸机
关于余挠三元组的periodic-模
图-95轰炸机
完形填空Ⅱ
完形填空Ⅰ
三元组辐射场的建模与仿真
空中大力神