作战目标知识图谱构建与应用
2020-04-14江志浩郑义成王雅芬
江志浩,周 卿,石 敏,郑义成,王雅芬
(1.91977部队,北京102249;2.海军装备部,北京100071)
高技术条件下作战,各类战场传感器和监控设备被广泛使用,产生的各类作战数据、情报数据呈“爆炸式”增长,且各类作战目标信息具有数据量大、传输迅速等特点。因此,在现代战争中,造成“战争迷雾”的主要因素已不再是信息匮乏,而是信息过剩。如何将各类作战目标信息快速、高效、准确地提供给指挥员,避免其淹没在海量信息中,是作战目标信息服务保障和辅助决策的核心问题之一。
作战目标信息具有典型的大数据“4V”特征[1-2]:①规模巨大(Volume),包括陆、海、空、天、电磁、网络等各作战域的作战目标信息;②类型多样(Variety),包括多种战场侦察监视手段获取的多类作战目标结构化、半结构化和非结构化信息;③高速处理(Velocity),战场态势瞬息万变,对作战目标信息处理提出高速甚至实时性要求;④高价值(Value),作战目标数据直接关乎军事利益和国家利益,本身具有高价值的特征。如何将这些战场信息优势转换为决策优势和作战优势是作战目标信息服务保障的难题之一。
知识图谱(Knowledge Graph)[3-5]是解决上述难题的方法之一。知识图谱可对海量数据进行重新抽象、整理和组织,以更加合理、有序、直观的方式将知识展示给用户,使之能更加有利于人的理解和认知,从而更加有效地指导决策。
1 知识图谱与作战目标
1.1 知识图谱的概念
知识图谱,本质上是一种语义网络,用于以符号形式描述物理世界中的概念及其相互关系。知识图谱用于绘制、分析和显示研究主题之间的相互联系,是将应用数学、图形学、信息可视化、信息科学等学科的理论和方法与计量学引文分析、共现分析等方法结合,达到知识融合目的的现代理论。它将复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制显示出来,揭示知识领域的动态发展规律,可为特定领域研究提供切实、有价值的参考。
知识图谱构成了一张巨大的语义网络图,网络节点表示一个实体或一个概念,节点之间的边表示属性或关系。因此,知识图谱的基本组成单位是“实体—属性”和“实体—属性—实体”“实体—关系—实体”三元组,实体间通过关系相互链接而构成一个网状的知识结构,通过一个由众多节点和边构成的网状图对知识进行完整而清晰的描述。当大量知识图谱经整合并按体系分类组织后,就形成了知识库。
1.2 作战目标和作战目标数据
目标在作战指挥中的定义是:交战双方为实现某种作战意图,彼此进行跟踪、打击、压制、攻占或摧毁的对象[1]。因此,作战目标既包括敌我双方参与作战的飞机、坦克、车辆、舰艇、卫星等平台,又包括来袭导弹、鱼(水)雷、作战机器人、UUV/UAV、潜(浮)标等武器和传感器目标,还包括各类作战工事、指挥所、部队甚至重点人员等目标。
在作战过程中,指挥机构和指挥员要做出准确的决策。这不仅要及时了解目标实时态势等战场情报信息,而且要结合战场情报信息对敌我双方战场目标进行及时、准确、全面的理解。因此,作战目标信息应该包含以下4个方面。
1)目标基本数据。如目标的名称、属性、类型、身份、尺寸、结构、作用、技战术性能等。
2)目标特征数据。声学、光电(含可见光、红外、激光、紫外线等)、射频(包括通信辐射源、雷达辐射源、雷达散射特征等、电磁指纹特征等)、核辐射等特征数据。
3)目标战例数据。历史航迹、主要作战样式、以往战例等信息。
4)目标战场数据。目标指挥关系,目标与目标、目标与任务之间可能存在的关系等信息。
1.3 作战目标知识图谱
知识图谱在商用领域的应用,展现出其在解决知识理解、知识推理、知识演化方面问题的巨大优势。目前,知识图谱多应用于医疗、图书等通用领域,在军事等针对性较强领域的应用相当有限,尤其是面向作战目标分析的知识图谱技术应用,还没有较好地实现知识图谱构建和应用。
传统的作战目标保障通常采用多头保障、分级处理模式。因此,作战目标数据通常散落在特定传感器、情报分析、指挥决策、武器等系统的各个角落,难以形成目标知识体系和数据合力。新技术条件下,战场目标信息呈爆炸式增长,传统的信息管理、处理方式已经无法满足对战场信息及大量作战知识的管理、应用和理解。
利用多源情报战场态势数据,通过作战目标知识图谱的构建,可对战场目标的真实情况、目标信息、行为模式、作战关系等进行“深度刻画”,将有效支撑战场作战指挥、情报研究、动向预判等行动。
1.4 作战目标知识表示
作战目标知识表示是作战目标知识图谱构建的核心之一,直接影响到基于作战目标知识图谱的推理、计算、关联等应用。作战目标知识图谱通常利用目标本体知识表示对目标进行描述。目标本体知识表示包括实体、事件、属性、关系、状态等方面。其中,实体包括作战目标对象、装备、设施、人员等,例如“里根”号航母、美军驻日本横须贺海军基地、AN/FPS-115远程预警雷达;事件包括各类作战案例、军事行动等,如“环太平洋-2020”联合军演、亚丁湾护航、跟踪监视等;属性是实体或事件相关的特征属性,如目标国别、目标种类、时间、地点、吨位、规模尺寸等;关系是指实体与实体、实体与事件、事件与事件之间的逻辑关系,包括隶属关系、指挥关系、从属关系、时空关系、因果关系等;状态为作战目标与时间、空间相关的状态,如航渡、锚泊、维修、封存、坠毁等。
作战目标本体知识表示如图1所示。
图1 作战目标本体知识表示示例Fig.1 Target ontology diagram of knowledge description in battlefield
2 作战目标知识图谱构建
2.1 作战目标知识图谱技术应用架构
作战目标知识图谱应用架构共3 层,包括作战目标知识收集、作战目标知识库构建、作战目标知识图谱应用服务,如图2所示。
图2 作战目标知识图谱应用架构Fig.2 Application framwork of target knowledge graph in battlefield
作战目标知识收集是建立知识图谱构建的基础,通过对目标特性、地理信息、战场环境、情报资料、武器装备等数据资料进行收集、整理、分类,形成作战知识体系。
作战目标知识图谱构建是知识图谱技术在军事应用中的核心,主要是通过知识抽取、知识融合技术,从各类数据中抽取目标实体、属性(值)及关系,并对作战目标知识进行整合和优化,完成知识图谱构建。
作战目标知识应用服务是基于作战目标知识库和具体军事需求开展的搜索查询、统计分析、可视化表示、知识挖掘、语义分析的军事化应用。
2.2 作战目标知识图谱构建的主要步骤
2.2.1 实体抽取
实体抽取[6-7],也叫命名实体识别(Named Entity Recognition,NER),是从各种知识数据中自动提取出实体并对每个实体做分类、标签。
传统的方法有基于规则的方法,如从数据集中识别抽取出人名、地名等专有名词等实体信息;基于统计学习的方法,是一种基于有监督学习的实体抽取方法,在准确率和召回率上的表现还不够理想,且算法的性能依赖于训练样本的规模。
由于军事领域的实体分类相对固定,人工预先定义分类与统计聚类相结合的方法可实现实体抽取。对于任意给定的实体,采用统计机器学习的方法,从目标数据集中抽取出与之具有相似上下文特征的实体,从而实现实体的分类和聚类。
2.2.2 关系抽取
关系抽取[8-9]就是从数据集中提取出实体之间的关联关系,通过这些关联关系,实现对实体不同知识的联系,进而形成网状的知识结构。
早期的关系抽取研究方法主要是通过人工构造语法和语义规则,据此采用模式匹配的方法来识别实体间的关系;基于特征向量或核函数的有监督学习方法,但需要大量人工标注的训练集,才能确保算法的有效性和准确性。
由于军事领域的实体关系具有多样性和复杂性,可采用基于自监督学习的开放信息抽取模型,通过采用少量人工标记数据作为训练集,据此得到一个实体关系分类模型;再依据该模型对开放数据进行分类;依据分类结果,训练统计机器学习模型来识别“实体—关系—实体”三元组关系。
2.2.3 属性抽取
属性抽取[7]是从不同信息源中采集特定实体的属性信息的过程。例如,针对某个特定敌方目标,可以从各类目标信息中得到其呼号、代号、国籍等信息。属性抽取能够从多种数据源中汇集这些信息,实现对实体属性的完整勾画。
作战目标知识图谱存在一些涉密实体,大量的实体属性为涉密信息,公开数据集、公开知识库很难满足属性抽取的需求。对于结构化数据,实体属性可视为实体与属性之间的一种名词性关系,将属性抽取问题视为关系抽取问题;对于半结构化数据,可通过对结构化部分自动抽取生成语料,用于训练实体属性标注模型,然后将其应用于非结构化数据的实体属性抽取;对于公开数据集、公开知识库查询不到的实体,须通过人工标注数据作为训练集,采用数据挖掘的方法直接从数据源中挖掘实体属性与属性(值)之间的关系模式,依据实体属性(值)附近都存在一些用于限制和界定该属性(值)含义的关键词,进行属性抽取。
2.2.4 实体消歧
实体消歧是解决因实体同名产生歧义问题的过程。在实际应用中,经常会遇到某个实体名称在不同环境下对应不同实体对象的问题。如“DDG 171”这个代号可以是日本“旗风”级导弹驱逐舰“旗风”号,也可以是我国052C 型导弹驱逐舰“海口”号。因此,必须通过实体消歧,建立实体、关系、属性的准确链接。
对于作战目标知识图谱来说,不能采用百科知识模型和开源知识模型,须利用作战目标之间的关系将与之相关的指称项链接起来构成一个知识网络。在每个网络节点上加上目标实体指称项的上下文语义特征作为其属性,利用网络图分析技术,计算该网络中节点与指称项之间的相似度,利用极大似然准则实现实体消歧。
2.2.5 指代消解
指代消解是解决多个指称项对应于同一实体对象问题的过程。在实际作战应用中,一个目标有舰/机名、舷/机号、呼号,在指挥系统中还有批号,这些指称项往往指向同一个实体对象,必须利用指代消解技术将这些指称项关联合并到正确的对象上。
传统基于句法分析的指代消解方法,通过建立搜索树,仅适用于实体与不同指代出现在同一场景,具有较大局限性。作战目标知识图谱的指代消解可采用统计机器学习方法,将指代消解作为分类和聚类问题进行求解,聚类法的基本思想是以实体指称项为中心,通过实体聚类实现指称项与实体对象的匹配,其关键问题是如何定义实体间的相似性测度。
3 作战目标知识图谱应用与展望
3.1 作战目标智能搜索
知识图谱智能搜索包含2 类核心任务:一是利用相关性在知识库中找到相应的实体;二是在此基础上根据实体的类别关系及相关性等信息找到关联的实体[10]。
目前,知识图谱智能搜索主要用于语义搜索[11-12]和知识问答[13],在作战或指挥信息系统中对智能搜索的需求主要是语义搜索,旨在解决现阶段基于关键字的Web搜索或数据库搜索中,因无法理解用户需求而导致的搜索精准度低、关联查询难的问题。
根据作战系统或指挥信息系统对作战目标知识智能检索的需求,可利用本体、属性、关系3 种方式构建检索策略,即基于本体搜索的目标检索、基于属性的目标检索、基于关联关系的目标检索。基于本体搜索的目标检索是一种灵活有效的查询方式,将本体描述中所有名称和本体自身元数据中的文本内容拼接成一个文本,进而建立面向关键词的搜索;基于属性的目标检索是将关键词索引的范围从本体名称扩大到与其直接相关的属性、类型等知识的技术,以便支持更加便捷的查询。该技术在关键词索引基础上引入了实体属性、类型等信息形成多个约束条件,可支撑方面搜索(Faceted Search);基于关联关系的目标检索是利用特定实体之间的关联关系进行实体检索的技术。在知识图谱技术中,图结构的RDF数据[14]特别适合实体间的关联查询,可通过广度优先遍历搜索每个节点到初始节点的路径挖掘节点间的隐形关联,或通过图相似模式挖掘其潜在关联。
3.2 战场态势与作战目标可视化分析
知识图谱可视化[15-16]是将知识库中的信息以易于用户理解的形式呈现的技术。在战场态势分析和作战目标研究等方面,通过基于知识图谱的可视化分析界面,可实现目标和态势的多维度视觉展示和分析,尤其在作战中对群目标进行分析时,既可以采用传统模式将群目标中的每个目标信息进行视觉表示和可视化分析,也可以利用知识图谱优势,从时间、空间、频谱、统计、关联度等多个维度进行表示,支持对作战目标和态势进行时序、分布、热度、树形、网络的分析。
3.3 作战关系分析与挖掘
作战关系分析是以对战场环境、敌我目标的认知为基础,建立战场数据、信息、知识之间的内在联系,是对战场信息的深层次融合。基于知识图谱的知识推理,是从实体关系、属性等出发,通过建模、计算和分析,从现有知识中发现新的知识的过程。知识推理的对象不仅针对实体间的关系,也针对实体的属性值、属性类别等。知识推理的方法主要有2类:基于逻辑的推理和基于图的推理[17-18]。
作战目标知识图谱具有实体类别和数量多,实体关系复杂、多变,实体属性多样、信息繁杂等特点,非常适合基于图的推理方法。
图神经网络(Graph Neural Networks,GNN)是当前AI领域最热门的研究方向,适用于图结构数据的深度学习架构。GNN利用节点和关系对事物进行描述,且节点和关系均带有属性。由于知识图谱先天具有上述图结构特性,且擅长推理是GNN 的优势之一。因此,“知识图谱+GNN”的技术组合,成为解决基于知识图谱进行关系分析和挖掘问题的新型手段。
文献[19]研究表明,基于GNN方法可实现三元组邻域复杂而隐含的模式信息的生成,可基于知识图谱构建实现实体关系的补全。该成果应用在作战目标分析中,恰恰就是一个目标关系推理的实现过程。因此,通过“知识图谱+GNN”技术组合的应用,不仅可以挖掘推理得出战场目标间的关系,而且还可实现目标与战场事件的关系。
3.4 作战行为规律挖掘
目标活动规律体现目标在时间、空间域上的关联规律,包括基本关联、时序关联、因果关联等。目标活动规律除目标自身的活动规律之外,不仅有目标与目标(或事件)之间的活动规律,如一个目标的出现经常伴随着另外一个目标的出现;而且还有目标在时序上的不同状态以及不同状态下的属性特征,如作战目标在执行任务不同阶段的编队特征、电子设备开关机规律和航行参数等。
目标活动规律挖掘过程如图3所示。
图3 目标活动规律挖掘示意图Fig.3 Diagram of mining of the target’s activity law in battlefield
利用作战目标知识图谱对目标实体语义特征提取,进行目标活动规律挖掘,可以着力研究以下几个方面.
1)目标综合识别与规律分析。根据目标相关特征数据,进行目标识别,并统计目标各类武器、传感器活动规律统计,形成目标载荷开关机规律及其载荷间的作战协同规律。
2)目标分布规律分析。根据目标航迹数据,对战场目标历史航迹进行统计分析,从时间、空间2个维度形成热力图,获取目标分布规律。分析目标分布规律,获取目标稳定航线、活跃阵位以及后续动向等信息。基于战场空间热力图结合目标作战能力知识,获取战场火力分布情况。
3)目标编组模型分析。在执行特定作战任务时,目标编配、武器传感器编配甚至目标运动状态均存在一定规律。如航母在执行舰载机作业时,对海雷达、对空雷达、预警机、作战飞机、母舰航向航速等知识在时间、任务维度均具有一定编组规律。因此,通过目标知识的编组模型可获取隐藏在这些目标、关系、状态等信息中的“真相”。
4)目标活动模型分析。根据对执行特定作战任务的目标时空序列、作战目标性能进行关联研究,分析目标保障周期、典型作战任务周期等作战目标知识,并结合战场目标态势、电磁态势等知识,判断作战目标工作状态和所处任务阶段。
3.5 作战指挥中的智能辅助决策
利用知识图谱技术,可以有效地将海量的战场信息和数据利用起来,辅助情报分析人员、作战指挥员进行战场态势的理解,为指挥决策提供更加准确、高效、可靠的信息依据。
例如,利用知识图谱技术可以基于事件驱动传导路径的方式进行知识发现,从而发现事件与事件、事件与目标之间的逻辑关系、统计学关系,挖掘出实现传统战场信息保障中隐藏的目标知识。在作战辅助决策过程中,往往需要根据当前战场态势进行推演,利用事件的因果关系,预测不同作战行动后战场形式的发展趋势,梳理作战目标、行动过程,从而准确把握作战行动的走向,以便提前预案和应对。
3.6 作战意图识别和态势预测
利用知识图谱开展作战意图识别和态势预测,是通过构建一个战场动态序列知识体系,对目标相关属性、类型、状态、行为模式和战场环境等若干态势要素进行分析,从而发现其内部或之间的相互关系,用于对战场态势发展趋势进行预判识别的过程。
贝叶斯理论是以随机事件之间的逻辑关联关系及关联关系的先验概率分布参数为背景知识,在明确部分随机事件状态的前提下,计算与之相关的随机事件状态概率的过程。基于作战目标知识图谱和贝叶斯网络模型的作战意图识别和态势预测流程如图4所示。
图4 作战意图识别与态势预测流程Fig.4 Flow chart of combat intention recognition and situation prediction
图4 中,贝叶斯网络的逻辑片断通常由先验信息组成若干推理规则集合,主要包括3类。
1)基本关系逻辑推理,是通过建立事件、目标的静态关系,用于描述战场目标、事件之间的相互逻辑关系。
2)概率迁移逻辑推理,是通过统计事件之间的概率转移关系,从而发现事态发展的可能性,用于描述战场目标、事件之间的概率迁移关系。
3)序列关系逻辑推理,是通过统计和分析作战目标的行为序列关系,从而发现其时序关系或因果关系,用于描述战场目标、事件之间时序和根事件状态空间的对应关系。作战目标的行为序列通常指其在遂行特定战术任务时,依据作战目标的特点、性能、对象,乃至作战手册、条令等要求执行的一系列特定的动作序列。
4 作战目标知识图谱面临的挑战
4.1 作战目标保障对时效性的要求
现代战争瞬息万变,各类传感器和指挥系统、情报系统产生的战场态势和目标数据量巨大、数据流转快,对作战目标保障的时效性带来巨大考验。为解决作战目标知识图谱应用的时效性问题,须在以下2 个方面进行突破。
1)大规模存储计算一体化技术。随着实时作战数据的引入,作战目标知识图谱将快速增加,给数据存储、计算带来巨大挑战。存储计算一体化将大幅减少数据流转,提高计算效能,被认为是下一代AI 系统的“入场券”。
2)片上应用技术。为解决基于作战目标知识图谱的人工智能技术在传感器、兵器等末端的应用问题,从而减少数据流转环节对时效性的影响,必须通过相关技术在片上系统应用,突破计算机集群的束缚。
4.2 知识质量与数量之间的矛盾
在作战目标知识图谱的应用中,只有准确、全面的高质量作战目标知识才能成为作战目标信息服务保障和辅助决策的有效支撑,而通过各种手段获取作战目标知识的质量不尽相同,甚至会出现一些低质量知识。此外,知识规模将随着这些知识的不断积累而增长,对知识管理、存储及应用带来巨大挑战。同时,大量低质量数据也会涌入知识系统。如何将海量知识快速有效地形成目标信息,同时避免低质量知识对目标信息的干扰,这是解决大规模作战目标知识图谱应用的关键所在。
因此,在作战目标构建知识图谱应用体系中,一方面可利用分布式存储、并行计算技术为超大规模知识图谱解决存储、算力等问题;另一方面,应建立知识质量评价体系,尽可能降低知识系统中的低质量知识的比例;此外,在知识应用过程中加强数据融合,将各类目标信息进行综合、过滤、合并,降低低质量数据的干扰。
5 结束语
本文从作战目标服务保障中知识图谱技术的应用需求出发,提出了作战目标知识图谱应用架构和具体步骤,给出了典型应用。尽管在军事领域,作战目标知识图谱具有广泛的应用前景,但目前的作战目标知识图谱的技术储备和应用基础还比较薄弱,尤其是基于该技术的目标关系、规律挖掘等还有待提高,这是下一步深入研究的方向之一。