复杂目标红外辐射特性大数据知识表示及建模方法
2021-01-18洪泽华章佳君周金鹏谢文雅陆志沣
洪泽华,章佳君,周金鹏,谢文雅,陆志沣,赖 鹏
(上海机电工程研究所,上海 201109)
0 引言
复杂目标红外辐射特性建模技术是电磁环境仿真中的一项关键技术,它利用计算机生成目标的红外辐射信号,为相应的红外探测器提供模拟的电磁环境。
复杂目标的复杂性,表现为目标几何结构复杂,目标与环境之间的交互关系复杂,目标受大量非线性、不可控、不确定、难以预知等难以量化的因素的影响,不再是简单的线性关系[1-2],这使得复杂目标电磁特性的建模仿真很难借助传统的方法开展。传统建模仿真是建立在相似性理论基础之上[3],通过对实际系统进行模拟,使两者之间具有相似性,用相似性中的类比方法来获取结果,从而达到仿真的目的[4]。典型建模方法有基于人工智能技术的建模方法[5-6]、基于离散事件的建模方法[7-8]、基于复杂网络理论的建模方法[9-10]等,其建模仿真本质上是建立在精确化和定量化的基础之上[11]。而由于复杂目标的复杂性,传统方法难以对复杂目标红外辐射特性进行实时的精确化和定量化描述,很难建立复杂目标红外辐射特性仿真模型[12-13]。
基于大数据的复杂目标红外辐射特性建模仿真方法,是直接以实际应用、靶场试验、内场试验、理论计算产生的复杂目标红外辐射特性大数据为对象,采用大数据处理手段,建立电磁特性数据与复杂的变量之间的关联关系,实现直接数据驱动的复杂目标电磁特性建模仿真。相对于传统基于相似性原理的建模方法,基于大数据的建模,无需了解研究对象的运行机理,避免了复杂目标因其特征难以精确化和定量化描述而无法构建仿真模型的情况。
1 大数据的获取及特性分析
1.1 目标红外辐射数据的获取
近年来,红外热成像日益广泛地应用于各种军事技术中。红外探测系统的设计及目标的红外隐身性能都要求提供各种典型目标的红外辐射特性。红外辐射是目标重要的电磁特性之一,是目标探测、定位、识别、跟踪等研究的必须输入,它为精确制导装备提供目标的红外图像特性,为装备的红外隐身材料和隐身结构设计提供量化的特征,也是红外隐身效果评估的主要依据[14-15]。
随着红外技术研究的深入,目标红外辐射特性数据的来源也越来越广泛,主要包括论证数据、设计数据、试验数据、仿真数据、作战数据、侦察数据、经验数据等。数据获取手段主要有两种:外场实测,对实测数据进行统计建模;数值模拟。
1)红外传感器探测数据。一切温度高于绝对零度的目标都会不停地向外辐射热能,置于地面和天空背景下的军事目标(如飞机、导弹、舰船等),由于它们一般都具有较高温度的发动机,或由于高速飞行时剧烈压缩空气使蒙皮温度升高,这些往往都会产生强烈的红外辐射,从而被红外传感器探测到。
红外探测是目标红外辐射数据的主要来源之一。随着红外制导、情报侦察等领域的信息采集手段不断加强,所产生的目标红外辐射数据也呈现爆炸式增长。以高分辨率红外成像卫星为例,每颗星每天产生1 TB 的高分辨率红外图像数据,一颗卫星每年新增的数据量就将高达近400 TB。据估计,目前已积累的数据达到100 PB 以上。
2)数值模拟。数值模拟是开展目标红外辐射特性研究的重要手段,也是目标红外数据的主要来源之一。当前,计算目标的红外辐射特性,一般从基本物理模型和过程出发,首先是计算目标表面的温度场,然后再考虑目标与环境的交互关系、大气传输效应等因素,综合得出目标的红外辐射特性数据。
实测、模拟是获取目标红外辐射特性数据的两个重要手段,但各有优缺点。实测数据可信度最高,最能真实反映目标的红外辐射特性,但获得实测数据的成本很高,且实测统计存在局限性,一般只能针对有限的状态,适应性较差;而模拟数据获取成本低,基本不受外界条件限制,可以进行各种边界条件模拟,但模拟数据的可信度不高,只能部分反映目标红外辐射特性。
1.2 数据特性
在装备的研制和使用过程中,已积累了海量的目标红外辐射数据,它们不但可以从不同侧面描述目标的红外辐射特征,还能揭示目标与外部环境的交互关系。它们有一部分是经过处理的实验数据,也有大量未经处理的原始数据。这些数据存在以下主要特点:
1)数据量大。海量性是目标红外辐射数据的重要特性,也是数据驱动的目标红外特性建模的基础。目标红外辐射数据来源广泛,仅卫星探测的红外图像数据就已上100 PB,还有历年的外场靶试探测数据、试验室的测试及仿真数据等,难以统计。
2)信息量大。目标红外辐射数据,有部分来源于试验测试数据。这些数据是根据试验目标,针对具体过程和主要变量,通过有目的性的设计而得到的,基本符合建模研究的要求,且覆盖了大部分变量空间。因此,这些数据具有较多的有效信息。
3)形式多样。目标红外辐射数据记录了目标在全生命周期内所有状态下的数据,数据多种多样。此外,数据库记录的数据不仅包括关系数据,还有图像传感器和声学传感器记录的声像资料。这些结构化和非结构化的数据极大地丰富了目标红外特性大数据的类型,同时也带来了更多的信息和挑战。
4)数据增长速度快。目标红外辐射特性广泛应用于不同领域,众多的试验、监测和传感装备每秒钟都产生大量数据,这些数据的产生速度达到了一个前所未有的水平。
5)具有相关性。由于影响目标红外特性的变量很多,且部分变量之间存在相关性和耦合性,一个输入变量改变通常引起多个输出变量跟随变化,每个输出变量的改变同时又是多个输入综合作用的结果。因而,试验数据也表现出相关性和耦合性。
6)样本分布不均匀。在数据采集过程中,人们通常在关注点上采集的样本较多,在其他方面样本相对要少很多,这造成了样本分布的不均匀性,使得样本点集中在有限的空间里,给后续应用带来一定的挑战。
2 复杂目标红外辐射特性大数据知识表示
2.1 数据维数处理
由于影响目标红外辐射特性的变量较多,而且在大部分情况下,多变量之间常存在一定的相关性。当变量较多且变量之间存在复杂关系时,会显著增加建模的复杂性。因此,建模前必须要对输入变量进行降维和简化。本文主要从两个方面对高维的目标红外辐射数据进行降维和简化。
2.1.1 机理分析
基于先验知识和热力学基本定律,对目标红外辐射特性各变量和主导变量之间的关系进行机理分析,初步选择对目标红外辐射存在较大影响的变量作为模型的输入。
以空中高速飞行目标为例,根据飞行器红外特性产生机理分析,空中高速飞行器3 大辐射源分别是被加热的尾喷管红外辐射、发动机排出的高温尾喷焰辐射和飞行器蒙皮辐射。其中,尾喷管红外辐射和发动机排出的高温尾喷焰辐射与飞行器发动机工作状态、高温尾喷气体成分等有关;目标的蒙皮辐射不仅与其本身大小,构成机身的表面材料性质有关,也和目标的飞行速度、飞行高度以及周围大气环境有着密切关系。目标的蒙皮辐射在不同波段所占的比重都不一样,不同波段的红外辐射也具有不同的作用。根据机理分析,初步得出影响飞行器红外特性的因素有飞行器类型、飞行器的发动机工作状态、飞行速度、飞行高度、大气环境等。
2.1.2 主成分分析
机理分析法是一种定性的分析方法,难以定量地说明各输入变量对目标红外辐射特征的影响程度。本文在机理分析得到的原始数据的基础上,采用主成分分析法,进一步定量分析各输入变量的影响程度,得到最终降维和简化的变量组。
主成分分析是将具有一定相关性的变量组合成一组无关的新变量组。新变量应尽可能多地反映原变量的信息,即var(x1)越大越好。var(x1)表示新变量x1的方差,该值越大,表示包含的信息量越多。如果x1不足表征原来的信息,则还需第2 个成分x2,且满足
即与2 个新变量无相关。
主成分分析的典型步骤如下:
步骤1对目标红外辐射特性原始样本进行标准化并计算相关系数。
假定X为一个n×p的数据矩阵,由p个变量和n组数据样本组成,即
标准化原始数据为
经标准化处理后的相关系数矩阵为
步骤2列出目标红外辐射特性主成分,并计算其贡献率。
主成分表达式如下:
式中:ajp为相关系数矩阵R的特征向量,相应的特征值用(λ1,λ2,…,λp)表示。
每一个新变量的贡献率为
主成分分析可得到p个成分,但是各主成分的方差是递减的,即包含的信息量也递减,因而,在实际应用时,主成分个数可以根据主成分累计贡献率来决定。为保证能充分反映原始数据信息量,一般要求贡献率累计量达85%以上。
2.2 数据知识表示
根据主成分分析法所得到的主要因素构建主要因素集合:F={F1,F2,F3,…,Fk},集合中的元素Fk(k=1,2,…,k)代表第k个影响目标红外辐射特性的主要因素。
根据主要因素集合F中的元素Fk组合形成目标红外辐射特性数据的关键字key(或称为ID),与key 对应的数据结构表示为
其中,charac1、charac2 等是用于描述组成目标红外辐射特性的变量。上述关键字和对应的数据组成(key,data)就是对目标红外辐射特性数据的知识表示。
对数据进行检索操作的规则知识可表示为
式中:fi为变量Fi对应的值。
3 数据驱动的复杂目标红外辐射特性建模方案
3.1 建模方案
数据驱动的目标红外辐射特性建模仿真方法的框图如图1 所示,主要包括以下步骤:
步骤1针对原始数据,先对目标的红外辐射特性产生机理进行分析,初步得出影响目标的红外辐射特性的所有可能的因素;然后,利用主成分分析法对大数据进行分析,得出影响目标的红外辐射特性的主要因素以及各主要因素的贡献率。
步骤2根据主成分分析的结果进行目标红外辐射特性大数据知识表示。
步骤3根据用户的输入条件和规则知识,进行大数据实时检索。
步骤4判断数据检索是否成功,如果成功则输出数据,完成建模仿真;如果未成功,则进一步完善目标红外辐射特性数据或知识表示。
图1 数据驱动的目标红外辐射特性建模方法框图Fig.1 Diagram of data-driven modeling for infrared radiation characteristic of targets
3.2 结果分析
以空中某型飞机目标为例,说明数据驱动的目标红外辐射特性建模仿真方法。
在机理分析的基础上,利用主成分分析法对飞机红外辐射特性数据进行分析,得出影响该飞机红外辐射特性的主要因素为:飞行器类型、发动机工作状态、飞行速度、飞行高度、飞机与探测器的相对位置、探测器工作波段。其中,相对位置包括:相对距离、俯仰角、偏航角。需要说明的是飞机类型、发动机工作状态、飞行速度、飞行高度等变量是决定目标红外辐射的内在本征变量。飞机与探测器的相对位置、探测器工作波段等变量是外在表征变量,它实际并不影响目标的红外辐射的本征特性,只是对探测得到的表征数据产生影响,但这也是建模所需考虑的一部分。
根据主成分分析得到主要因素集合F={Type,Engine,Speed,Height,Distance,Theta,Phi,Waveband},集合中的元素分别表示飞行器类型、发动机工作状态、飞行速度、飞行高度、相对距离、俯仰角、偏航角、波段。根据集合F,构建飞机红外特性数据的key 为:Type_Engine_Speed_Height_Distance_ Theta_ Phi_band,飞机红外特数据结构为
其中,radiance 代表飞机的红外辐射亮度,depth 代表图像的每一个像素到探测器的距离。
假设用户需要模拟飞机在某状态的红外辐射特性,如目标类为F16 飞机,发动机工作状态为加力,飞行速度为0.9Ma,飞行高度为3 000 m,相对距离为135 m,俯仰角30°,偏航度210°,探测器工作波段为3~5 μm,则规则知识可表示为:
IF <Type=‘F16’and Engine=‘JL’and Speed=‘0.9’and Height=‘3 000’and Distance=‘135’and Theta=‘30’and Phi=‘210’and band=‘mIR’>THEN <(key,data)>。其中,key=F16_JL_0.9_3000_135_30_210_mIR,data 为与key对应的红外特性数据。
图2 给出了基于大数据的F16 飞机红外特性建模仿真结果,图中只显示了两种key 的红外特性仿真结果。其中,图2(a)是发动机为额定状态下F16飞机的红外辐射特性图像,飞机飞行速度0.5Ma,飞行高度200 m,俯仰角45°,偏航度135°;图2(b)是发动机为加力状态下F16 飞机的红外辐射特性图像,飞机飞行速度0.9Ma,飞行高度3 000 m,俯仰角30°,偏航度210°。
图2 飞机红外辐射特性模拟结果Fig.2 Simulation results of infrared radiation characteristics of aircraft
4 结束语
针对目标红外辐射特性建模仿真的复杂性,基于实际应用、靶场试验、内场试验、理论计算等过程中产生的大数据,采用数据驱动的方法,建立目标辐射特性仿真模型。该方法避免了相似性原理难以开展非线性、不确定、难以预知等条件下的复杂对象建模的问题。大数据的出现不仅为复杂目标红外特性建模提供了更加高效的模式和手段,同时也革新了建模仿真的思维方式。