基于多源异构信息的海上目标综合识别方法
2022-10-17余舟川庞殿松
余舟川,庞殿松,龚 诚
(中国人民解放军91001部队,北京 100841)
随着信息技术的不断发展,信息化战争中,海上目标信息获取手段不断增加,信息来源种类多,差异大,呈现出多源异构的特点。“多源”指的是数据的来源有多个源头。海战场信息中,有雷达、电子对抗等传感器设备探测得到的数据,有侦察卫星、光电探测设备等通过成像得到的信息,有从互联网、人工情报等方式中提取的信息等,情报来源多样。“异构”指的是数据结构的不等价性。对于非同源数据,数据通常异构,且差异明显。海战场中,雷达等传感器提供的是目标实时航迹数据,卫星、光电等设备提供的是图像、视频数据,互联网和人工手段提供的是文字、图片数据。其中,航迹数据为结构化数据,文字、图片、视频等为非结构化数据。海上目标信息多源、异构、多模态的特点对数据分析和处理提出了新的要求。当前,国内海上目标信息处理研究主要集中在结构化数据方面,并取得了不少研究成果,但对非结构化数据的智能处理研究还不多,特别是在军事运用领域,尚难以满足多源异构数据的运用需求。
近年来,国内学术界对多源异构数据进行了相关研究,并取得了一定的研究成果。多源异构数据融合方法主要分为基于贝叶斯网络的深度学习融合方法和基于证据理论的多源信息融合方法。在基于深度学习的多源异构信息融合方面,张天宇以迁移学习和贝叶斯网络相结合的方式,提出了一种综合利用雷达、AIS和可见光进行海上目标识别的方法;贺雅琪提出了一种基于ELM极限学习机的多源异构数据融合方法,周钢等提出了一种基于集成学习的多源信息融合算法等。基于深度学习的方法在模型合适的条件下,可取得较准确的融合效果,但对于军事领域中的海上目标识别问题而言,该方法存在计算复杂度高,实时性不强,需要大量训练样本等缺点,现阶段难以在工程领域实际应用。在基于证据理论的多源异构信息融合方面,陈雁飞提出了几种针对海上目标识别的基本概率赋值方法,王成平、吴明雨、陈致远等人就证据理论在空中和海面目标识别中的应用进行了研究,基于证据理论的多源异构信息融合方法清晰明了,且对先验信息要求较少,适用于工程实际,但是,当前对证据理论的研究主要集中于利用几组关联信息对目标属性进行识别,未能达到对多源异构数据的充分利用。
针对充分利用多源异构信息实现对海上目标快速准确识别的需求,本文提出了一种基于D-S证据理论和时空编码的海上目标综合识别方法,对于图像、文字、视频等非结构化数据,提取目标的发现时间、当前位置和关键属性,进行航行轨迹预测推演和时空编码,形成规范的格式化信息,然后,作为证据理论中的一条证据,与目标的结构化探测数据进行证据合成,得出海上目标综合识别结果。通过应用实例表明,本文所提算法可充分利用各类多源异构情报信息,快速准确地给出海上目标的综合识别结果,具有较高的工程应用价值。
1 基本概念
1.1 海上目标综合识别
海上目标综合识别可以分为数据级、特征级和决策级三个层级。数据级综合识别的信息为未经处理的原始信息,如雷达、电子侦察设备获取的原始信息,通过融合,使信息更加清晰、准确;特征级目标识别的信息是信息源经过特征提取获得的目标矢量信息,每个信息源独立地提取目标特征,由这些特征生成一个共同的特征空间用于目标分类;决策层目标综合识别将各信息源独立完成目标观测和特征提取后的目标识别结论进行关联处理,形成决策级目标综合识别结果。
以往研究大多集中于数据级目标识别的层级,本文将重点研究特征级和决策级目标识别。
1.2 D-S证据理论
D-S证据理论是由Dempster提出,经Shafer改进完善形成的一种理论。该理论把问题和证据分解成若干个子问题、子证据,通过定义信任函数的概念,确定相应的基本概率赋值,将多组证据以组合规则进行融合,得出不确定问题的解。D-S证据理论可以用比较符合人的逻辑思维的方式处理不确定问题,能够明确描述“不确定”“不知道”等概念,不需要先验概率就可以对证据进行融合。
D-S证据理论定义了一个互不相容的完备集合,称为辨识框架。命题是包含于框架中的独立命题,有
Θ={,,…,}
(1)
映射2→[0,1]为辨识框架上的基本概率分配函数,满足:
(2)
其中,()表示证据对命题的支持程度,D-S证据理论的证据合成规则为:
(3)
多个证据的合成公式为:
(4)
式(4)中,可以保证每条证据对辨识框架中概率支持度的和为1,对新合成证据体为空集的概率支持度为0,用归一化因子保证归一性和非负性。为冲突因子,表示各证据之间的冲突程度。
2 海上目标综合识别方法
2.1 非结构化数据时空编码
海上目标识别过程中的非结构化数据主要为卫星侦察、人工情报等手段获取的海上目标当前位置、时间、属性、意图等信息。与结构化数据相比,非结构化数据具有格式差异大,更新间隔长,时效性较低等特点。当前,对非结构化数据的处理主要靠人工推理研判,效率较低,而基于多源异构数据融合理论的研究主要集中于处理实时的非结构化数据,与实际应用场景偏差较大。为了解决上述问题,本文提出了一种基于时空编码的非结构化数据处理方法,将非结构化数据统一至同一维度,并对非结构化数据中目标的航行轨迹进行推理编码,解决非结构化数据时效性不强的问题。
时空编码方法是在全球网格模型的基础上,引入时间划分的概念,利用时空编码表示当前的地理位置,形成统一的信息索引,方便快速进行数据查找和关联。
空间编码采用全球方格坐标模型,时间编码的基本时间元为船以巡航速度穿越单个最小方格所需的时间,记为,单位为h。时间编码计算自当日零时开始,24时结束,则日内可划分为(24/+1)个时间单元。目标时空编码的基本格式为
当日日期+日时间单元序号+空间方格序号
例如,某艘舰艇的时空编码为D0327T12G35,代表该舰艇在3月27日12至13时段内位于35号方格位置。
建立时空编码规则后,对于接收到的非格式化信息,先进行智能信息抽取,获得目标当前位置、侦察时间、目标属性等关键信息,其中,目标当前位置和侦察时间用于建立时空编码,目标属性是时空编码指向的信息内容,通过时空编码可快速对目标信息进行查找检索,又叫时空索引码。由于非结构化的文字、图像信息提取后的有效内容一般可归结为某年某月某时在某海域发现某目标的形式,时效性不强,难以与雷达、电子侦察设备掌握的航迹进行实时关联,因此,需要基于时空编码对目标的活动轨迹进行推理。
推理的方式为:先将目标与本地知识库中该目标的历史航迹进行匹配,若能成功匹配出相似的历史航迹,则认为该目标继续沿该历史航迹经过方格为高概率事件,下一时间单元内该目标进入历史航迹所在方格内的概率为预设的最高概率,目标向其他方格行驶的概率均分,即为(1-),代表该目标可能经过的其他方格。若未能成功匹配出相似的历史航迹,则以该目标向目的地最近的航线作为高概率事件,若仍无法获知该目标目的地,则认为该目标下一时刻进入所有相邻方格的机会均等。概率划分如图1所示。
图1 下一时刻编码概率分配图
在时空索引码后引入目标出现概率,构成完整的时空索引码,代表该目标在该时间段出现于该方格的概率,假定非格式化信息中,目标在月日第个时刻出现在方格G35,依照历史航迹,下一时刻将进入方格G34,概率为60%,另外,该目标还有可能进入G24、G25、G44、G45,概率均等,则该目标在(+1)时刻可生成如下索引码:
DMNT(+1)G34P60
DMNT(+1)G24P08
DMNT(+1)G25P08
DMNT(+1)G35P08
DMNT(+1)G44P08
DMNT(+1)G45P08
然后,可继续为该目标的+2,+3,…,+时刻进行时空编码。目标在+时刻在高概率航线对应方格停留的概率始终保持为,假定目标在+-1时刻,除了进入高概率方格外,还可能进入个其他方格,而目标在至+时间段内,总共还可能到达个其他方格(包含该目标已经过的方格),则认为目标在个其他方格停留的概率为
(5)
在其余个方格内停留的概率为
(6)
当雷达或电子侦察设备发现目标后,即可根据发现目标的时间和位置,通过查找索引码,快速获取在时空位置处可能出现的目标信息,实现结构化与非结构化情报信息的互相关联印证。
2.2 基于D-S证据理论的海上目标综合识别过程
1)根据雷达探测信息和电子侦察设备获取的目标方位信息,进行关联和融合计算,获取当前海上目标的位置。当前,对雷达信息与目标方位信息的关联方法已有较为深入的研究。
2)根据电子侦察设备的辐射源分析结果,推断海上目标的可能类型。不同型号、级别的舰船搭载的电子侦察设备的工作参数均不一致,因此,利用预先建立的特征数据库,根据舰船装载的辐射源情况,可对该目标的类型进行初步推断,并根据该辐射源搭载在不同平台上的概率,确定对应的概率分配函数。
3)根据该目标所处的时间和位置,通过时空索引码,获取该目标可能的目标类型,如果存在多个非实时情报信息对应的目标,则依据各自对应的概率,预先进行归一化处理。
4)应用证据理论对雷达数据、电子侦察数据和非实时数据进行证据组合,得到最终的海上目标识别结果。
3 应用实例
3.1 非结构化数据时空编码
假设我方获取一条如下文字形式的动向侦察情报:“3月27日,一艘F型驱逐舰L时自S位置出发,前往D位置执行巡逻任务”。首先将目标的当前时间和位置进行时空转换,假设S位置位于方格34中,D位置位于方格11中,L时位于当日的第个时间间隔内,如图2所示。
图2 目标位置编码示意图
图中曲线表示系统从知识库中匹配得出的该目标的历史航迹,根据知识库中的信息,目标依照历史航迹行驶的概率为60%,则在发现时刻,F型驱逐舰目标对应的时空编码为
D0327TXG34P100
接下来,预测目标在第+1个时间间隔内的位置,根据历史航迹数据,目标进入方格33的概率为60%,除此之外,目标若不按照历史航迹行驶,则可能在下一个时间间隔内进入方格23、24、34、43、44,进入周围其他5个方格的概率为
(7)
则第+1个时间间隔内该目标的时空编码为:
D0327T(+1)G33P60
D0327T(+1)G23P08
D0327T(+1)G24P08
D0327T(+1)G34P08
D0327T(+1)G43P08
D0327T(+1)G44P08
然后,继续预测目标在+2时间段的位置,根据高概率保持原则,目标在+2时间段进入G23的概率仍为60%。由于+1时间段目标位于G33,并优先考虑目标处于前进状态,则+2时间段目标可能进入的位置为G22、G32、G33、G42、G43,概率为
(8)
此外,自出发点计算,+2时间段目标可能到达的其他方格包括G14、G24、G34、G44,概率为
(9)
因此,在+2时间段,F型驱逐舰对应的时空编码为:
D0327T(+2)G23P60
D0327T(+2)G22P05
D0327T(+2)G32P05
D0327T(+2)G33P05
D0327T(+2)G42P05
D0327T(+2)G43P05
D0327T(+2)G14P04
D0327T(+2)G24P04
D0327T(+2)G34P04
D0327T(+2)G44P04
同理,可继续依次计算F型驱逐舰在+3,…,+时间段内对应的时空编码。
3.2 基于证据理论的海上目标综合识别
假设在3月27日,我方舰艇雷达在第个时间段内于G12海域探测发现一批不明目标,并通过电子侦察设备截获该目标的雷达信号,经过全脉冲分选和脉内特征提取,再与本地知识库中已知的雷达特征参数进行比对后,判断该雷达为R型对海警戒雷达,装载R型对海警戒雷达的舰艇有F、G型驱逐舰和H型护卫舰,按照附近海域各型舰艇数量进行基本概率分配,得出目标辐射源参数的基本概率分配,如表1所示。
表1 目标辐射源参数的基本概率分配
然后,可依照雷达回波对目标类别进一步推理。假设从雷达回波分析,该目标是大型目标,而F、G型驱逐舰是大型目标,H型护卫舰是小型目标,因此,可得目标大小的基本概率分配,如表2所示。
表2 目标大小的基本概率分配
应用证据理论对和进行第一次证据合成,首先计算目标的冲突系数:
(10)
则可计算第一次证据合成后的概率分配函数为:
(11)
(12)
(13)
因此,第一次证据合成后目标的基本概率分配如表3所示。
表3 第一次证据合成后的基本概率分配
然后,根据目标“第个时间段内于G12海域”的情报,通过时空编码D0327TLG12搜索对应的非格式化情报信息。假设通过搜索,编码D0327TLG12对应如下3条信息:D0327TLG12P60,对应信息为F型驱逐舰;D0327TLG12P65,对应目标为H型护卫舰;D0327TLG12P10,对应目标为G型驱逐舰。则归一化后非格式化情报的基本概率分配函数,如表4所示。
表4 非格式化情报的基本概率分配
将第一次证据合成后的基本概率分配函数与再次进行证据合成,得出证据合成结果如表5所示。
表5 第二次证据合成后的基本概率分配
第二次证据合成后,可以得出目标为F型驱逐舰的合成概率最高。因此,经过雷达、电子侦察设备和非格式化情报综合识别后,可得出目标识别结果为F型驱逐舰,可信度约为65%。
4 结束语
针对当前海上目标识别中结构化和非结构化的多源异构信息未有效整合利用,识别过程主要依靠人工研判的缺点,本文提出了一种将非结构化信息进行时空编码统一至相同维度,再利用D-S证据理论与结构化信息进行合成的方法,该方法逻辑清晰,计算量小,具有较高的工程实用价值。