基于仿真数据与工程经验的拦截器气动性能评估建模方法
2024-01-13叶文斌何仕培王国新满佳宁
叶文斌,郝 佳,2+,龙 辉,何仕培,王国新,满佳宁
(1.北京理工大学 机械与车辆学院,北京 100086;2.北京理工大学长三角研究院,浙江 嘉兴 314019;3.航天科工集团贵州航天技术研究院总体设计部, 贵阳 贵州 550081)
0 引言
临近空间高超声速飞行器(Near Space Hypersonic Vehicle,NSHV)指飞行高度在20 km~100 km,飞行速度在5 Ma~25 Ma的一类飞行器,主要包括空天飞机、临空无人飞行器、超高速巡航导弹等[1-2]。为了应对临近空间不同武器的威胁,发展和建立新型武器防御系统是必要之需,其中地基拦截是一种有效的遏制手段[3]。然而临近空间空气稀薄,拦截器的气动力不足,传统舵面控制方法无法满足拦截器机动过载要求。为了克服传统舵面控制方法的不足、实现控制指令的快速响应,直接力/气动力复合控制是目前较理想的方法[4]。该方法使拦截器控制系统具有更快的响应速度和过载能力,有效提高了打击精度,大幅提升拦截器的机动性能[5-6]。
侧向直接力喷流与高超声速来流相互干扰的流动特征非常复杂,存在激波与激波干扰、激波与附面层干扰等复杂流动,对拦截弹产生严重的力和力矩干扰,呈现极强非线性特性[7]。计算流体力学(Computational Fluid Dynamics,CFD)是预测侧向喷流干扰效应的主要手段之一,但是喷流干扰下流动特征评估方法对CFD计算模型与网格有着极高要求,导致CFD计算时间急剧提升,大大延长临近空间高超声速拦截器研制周期。因此,如何快速、精确地构建临近空间高超声速拦截器侧向喷流干扰气动模型,具有十分重要的学术与工程价值[8]。
临近空间高超声速拦截器侧向喷流干扰气动模型具有以下特征:高维、强非线性、昂贵[9]。这些特性导致了巨大的设计空间需要被探索,设计人员必须花费大量时间和成本进行计算机仿真,才能找到最佳的设计方案。为了快速得到方案,有效方法之一是构建代理模型(也被称为元模型、响应曲面模型或模拟器)来代替计算机仿真,然后应用优化技术来获得最佳设计方案[11-12]。使用代理模型可以避免大量调用耗时、昂贵的数值分析模型,从而降低计算成本。
目前,国内外关于代理模型研究较多,在高超声速拦截器气动性能方面也有相关研究。早期研究人员对拦截器气动性能评估问题进行简化处理(降低马赫数、无喷流干扰、降低问题维度等),构建该条件下的气动性能代理模型。DOWELL等[15]和SILVA等[16]提出了基于CFD数值模拟构造拦截器流场降阶代理模型(Reduced-Order Model,ROM)的思想,实验证明该模型可以快速、准确地预测气动弹性问题中非定常流场的气动力参数;AHMED等[17]以气动外形和气动性能(阻力和气动热)之间的影响关系为研究对象,利用Kriging方法构建映射模型、NSGA-II算法构建优化模型,完成钝头拦截器头部优化设计;CARPENTER等[18]使用神经网络对拦截器气动性能参数进行快速预测,针对不同马赫数下的性能参数,训练不同的神经网络。实验证明在低马赫数情况下,实验方法可以保证拦截器气动特性的快速准确评估。但是随着建模技术的发展,不少学者开始研究完整工况下,受喷流干扰影响的气动性能代理模型构建方法。欧敏[19]对逆向喷流下的再入拦截器进行参数化分析,对主要影响因素构建二次响应面模型,在其基础上进行减阻杆的优化设计;王毅等[20]使用Kriging插值模型进行了带喷流构型的气动阻力优化,采用拉丁超立方采样方法来获得训练数据,并在此基础上进行气动方案优化;LEE等[21]结合普通克里金与协同克里金方法,研究侧喷干扰效应下气动性能代理模型构建方法,通过实际气动数据集进行验证,证明了方法的有效性。
从以上应用可以看出,基于代理模型的气动性能快速预测已经成为拦截器设计领域快速发展的前沿方向。国内外对气动性能代理模型的构建方法进行了一定的研究和实验,但基本都是在样本数据充足的条件下开展的。针对喷流干扰下的拦截器设计问题来说,由于计算机仿真的耗时性/昂贵性,可用数据量显著减少。在小样本情况下,样本缺失了部分工况和气动力之间的映射规律,无论如何选择超参数,得到的预测误差始终较高[22]。因此,找到一种小样本下代理模型构建方法,对高超声速拦截器性能的精准预测尤为重要。
考虑到设计人员在设计拦截器时,往往可以总结出气动参数与气动性能之间的规律,本文提出一种融合工程经验与小样本数据来构建代理模型的方法(Experience-informed Bayesian Neural Network,EBNN)。针对拦截器气动性能参数之间非线性关系较强且工程经验存在主观性、不确定性的特点,本文采用贝叶斯神经网络作为代理模型构建方法,既对非线性关系有较好的拟合能力,又能保留模型不确定性的表达能力。通过某高超声速拦截器具体案例验证了所提方法的有效性,分别在有/无工程经验条件下进行代理模型构建,研究工程经验对代理模型预测精度的提升效果。
1 高超声速拦截器气动性能评估分析
1.1 拦截器气动性能评估模型
气动参数是高超声速拦截器最重要的设计参数。不同外形在不同工况下具有不同的气动性能,如图1所示。高超声速拦截器设计过程中需要确定拦截器喷流控制方式。根据侧向发动机在高超声速拦截器上安装位置的不同,可以将喷流的控制方式分为姿态控制、轨道控制以及结合前两者的姿态轨道复合控制。在确定喷流控制方法后,还需要构建喷流干扰的数学参数模型。喷流干扰效应有两种数学描述方法:①将喷流干扰效应折算到对发动机直接力、力矩的影响,按照干扰因子形式描述[25],干扰因子物理意义清晰,但该方法针对姿控、轨控、姿轨控耦合3种情况需要分别进行建模,使得气动建模以及拦截器动力学建模复杂程度增加;②将喷流干扰效应折算到对气动力、力矩的影响,该方法可以针对不同喷流干扰情况采用统一的数学描述,且有利于控制系统设计。因此,本文采用第②种方法来构建高超声速拦截器侧向喷流干扰效应数学模型。
高超声速拦截器气动性能评估涉及到的参数可以分为3类:第1类:外形参数。由于本文针对某一具体高超声速拦截器作为研究对象,因此在性能评估实验中将外形参数设定为不变量。第2类:工况状态参数,主要有马赫数Ma、攻角α,高度h,滚转角φ、舵偏角DEL、姿控喷流压力比pzj、姿轨控喷流压力比pzgj等,如表1所示。第3类:气动特性数据,主要参数有全弹法向力系数cy1、全弹俯仰力矩系数mz1、舵偏引起的法向力系数Δcy1(δ)、舵偏引起的俯仰力矩系数Δmz1(δ)四个气动基础量,以及喷流引起的全弹法向力系数增量Δcy1(j)、喷流引起的全弹俯仰力矩增量Δmz1(j)、喷流对舵偏引起的法向力系数影响量Δ(Δcy1(δ))j、喷流对舵偏引起的俯仰力矩系数影响量Δ(Δmz1(δ))j等四个气动干扰量,如表2所示。
表1 工况状态变量表
表2 气动特性变量表
气动干扰量需要根据气动性能进行计算,计算方式具体如下:
喷流引起的全弹法向力系数增量
Δcy1(j)=cy1(j)-cy1。
(1)
式中:cy1(j)表示喷流存在时全弹法向力系数;cy1表示无喷流时全弹法向力系数。
喷流引起的全弹俯仰力矩增量
Δmz1(j)=mz1(j)-mz1。
(2)
式中:mz1(j)表示喷流存在时全弹俯仰力矩系数;mz1表示无喷流时全弹俯仰力矩系数。
喷流对舵偏引起的法向力系数影响量
Δ(Δcy1(δ))j=Δcy1(δ)j-Δcy1(δ)。
(3)
式中:Δcy1(δ)j表示喷流存在时舵偏引起的法向力系数;Δcy1(δ)表示无喷流时舵偏引起的法向力系数。
喷流对舵偏引起的俯仰力矩系数影响量
Δ(Δmz1(δ))j=Δmz1(δ)j-Δmz1(δ)。
(4)
式中:Δmz1(δ)j表示喷流存在时舵偏引起的俯仰力矩系数;Δmz1(δ)表示无喷流时舵偏引起的俯仰力矩系数。
1.2 拦截器气动性能评估问题
气动特性快速评估是高超声速拦截器外形设计的关键一环,但是由于喷流气动干扰量受较多因素的影响(Δcy1(j)、Δmz1(j)是马赫数、攻角、滚转角、高度、姿控开度、轨控开度等6个变量的函数;Δ(Δcy1(δ))j、Δ(Δmz1(δ))j是马赫数、攻角、滚转角、开度、姿控压比、轨控压比、舵偏角等7个变量的函数),建模维度高,仿真耗时长[26]。拦截器外形设计过程中,往往只能进行有限次的仿真(例如性能评估过程中,姿/轨控开度只有5水平:0-25-50-75-100),需要耗时270天以上(20台128核高性能系统并行计算)。在有限次仿真条件下,设计空间存在大量未知区域。针对仿真耗时的问题,部分研究人员提出用代理模型代替仿真软件,以达到快速评估的效果。但就超高声速拦截器而言,数据少、成本高,已有数据无法满足高精度代理模型的需求。
针对上述问题,本文提出基于工程经验与数据融合的高超声速拦截器气动性能代理模型构建方法,该方法将工况状态作为输入参数,气动性能作为输出参数,通过挖掘工程经验中蕴含的规律信息,补充小数据情况下缺失的映射规律,构建高精度代理模型,进而帮助设计人员快速探索设计空间,构建优化方案,实现高超声速拦截器快速设计的目标。
2 基于仿真数据和工程经验的代理模型构建
本文建立了一种融合工程经验的贝叶斯神经网络,该方法利用设计人员积累的设计经验,补充小样本数据缺失的映射规律。考虑到高超声速拦截器问题维度高、非线性强的特点,提出用贝叶斯神经网络作为模型框架,一方面利用神经网络对于非线性问题表征能力强的优势,另一方面结合贝叶斯方法增强其不确定性表征能力。
2.1 贝叶斯神经网络模型
传统神经网络是点估计模型,通过单点输入,预测对应的单点输出。如式(5)所示,其训练方式可以视为通过极大似然估计(Maximum Likelihood Estimation, MLE)来实现网络参数(权重/偏置)修正。
(5)
式中:D表示训练数据集;xi表示训练数据的输入部分;yi表示训练数据的输出部分;w表示神经网络的权重。
贝叶斯神经网络通过贝叶斯方法以及KL(Kullback-Leibler)散度来构造损失函数,进而对神经网络参数进行训练(如图2)。与传统点估计的神经网络不同,贝叶斯神经网络是一种概率估计模型,其权重和偏置是一种概率分布。通过这种形式,贝叶斯神经网络不仅可以给出预测结果,还能给出结果的置信度与置信区间。图2上半部分所示为贝叶斯神经网络神经元节点的计算方式,先引入先验假设,即假设模型参数(权重/偏置)服从某种分布(一般设为标准正态分布),然后通过采样得到具体的权重/偏置数值,最后根据神经元节点的输入、权重/偏置与激活函数fact,计算得到该神经元节点的输出。
如图2下半部分所示,贝叶斯神经网络的前向过程与传统神经网络类似,但是引入先验概率后,神经网络参数的估计方法从极大似然估计变成了最大后验估计(Maximum a Posteriori Probability estimate,MAP),如式(6)所示。
wMAP=argmaxlogP(D|w)=
argmaxlogP(D|w)+logP(w)。
(6)
同时贝叶斯神经网络的参数是概率分布的形式,因此不局限于argmax值。根据贝叶斯法则,神经网络模型参数θ的后验分布为:
(7)
式中:p(D|θ)为参数θ的似然函数;p(θ)为参数θ的先验概率;p(D)为一个归一化常数;D为训练数据集。
2.2 基于贝叶斯神经网络的拦截器代理模型构建过程
本节以高超声速拦截器为建模对象,结合仿真数据和工程经验,通过贝叶斯神经网络构建高精度代理模型,构建流程如图3所示。
建模流程主要由两部分组成,下面对两部分内容进行详细介绍。
2.3 仿真数据/经验获取
仿真数据的获取主要依靠仿真软件,其获取过程包括网格划分、数值求解和后处理3部分。首先构建拦截器模型文件,将其导入到网格生成软件中,对计算域进行网格划分;然后采用国家数值风洞(National Numerical Wind tunnel,NNW)工程套装软件FlowStar获取临近空间拦截器侧向喷流干扰气动特性;最后根据CFD仿真云图计算无喷流拦截器气动特性与有喷流拦截器气动特性
工程经验的获取则主要依靠设计人员。本文将工程经验定义为:工况变量与气动性能之间的关联关系。考虑到贝塞尔曲线能够准确量化描述变量之间的变化规律,本文提出基于贝塞尔曲线的工程经验的获取方法[27],为了方便计算,以梯度的形式表征工程经验。
2.3.1 基于贝塞尔曲线的工程经验获取方法
贝塞尔曲线的原理是伯恩斯坦多项式(由伯恩斯坦多项式可证明:在[a,b] 区间上所有的连续函数都可以用多项式来逼近),因此贝塞尔曲线可在指定区间内表征任意的连续函数。以三阶贝塞尔曲线为例说明其基本原理。
(8)
(9)
(10)
(11)
进一步推导:
(12)
(13)
B(t)=P0(1-t)3+3P1(1-t)2t+3P2(1-t)t2+P3t3,
t∈[0,1]。
(14)
结合贝塞尔曲线的表达式可以发现,拟合曲线由一系列控制点Pi所定义,曲线上点的数量由t所决定。本文利用曲线由控制点定义的特点,开发了由专家操作的交互式知识获取工具。利用知识获取工具,专家通过增减控制点的数量、拖动控制点的位置可得到拟合曲线。专家完成知识绘制后,知识获取工具保存控制点坐标,完成知识获取整个过程。如图5所示为知识获取工具界面,初始曲线如图5a所示,依次拖动控制点2至控制点7,拟合曲线由图5a改变成图5b。
2.3.2 工程经验梯度化表征
由于获取到的工程经验只表示不同参数间的变化趋势,其变化区间没有实际物理意义,本文采用梯度的形式表征其变化趋势,并基于梯度构建贝叶斯神经网络损失函数的经验项。根据贝塞尔曲线解析式,贝塞尔曲线的梯度信息就是拟合点纵坐标关于横坐标的导数信息,因此本文根据链式求导法则,将t作为中间变量,计算拟合曲线上点B(t)的梯度gexp,如式(15)所示:
(15)
梯度化表征后的工程经验具体如表3所示,其余气动性能参数梯度化工程经验请见附录。
表3 全弹法向力工程经验表
2.4 代理模型训练
本文以贝叶斯神经网络作为拦截器代理模型构建方法,首先对贝叶斯神经网络参数进行初始化,包括神经网络层数、每层节点数、激活函数、权重、偏置的概率分布等。然后根据权重/偏置的概率分布进行采样,获取实际权重/偏置值。之后利用仿真数据与工程经验分别构建数据项损失函数和经验项损失函数,结合二者构建最终损失函数。最后基于损失函数计算误差,通过误差反向传播训练贝叶斯神经网络的模型参数。
2.4.1 参数初始化
构建贝叶斯神经网络第一步是模型参数初始化,其中神经网络层数、每层节点数、激活函数设置方式与传统神经网络相同。然而贝叶斯神经网络还是一种概率估计模型,初始化时需要设定网络权重及偏置的概率模型,一般将其设置为高斯分布w/b~N(μ,σ2)。但如果贝叶斯神经网络的权重、偏置直接从高斯分布中采样获得,会使得μ和σ变得不可微。目前解决该问题的方法是对其进行重参数化操作,以权重为例,将w重写为:
w=μ+σε。
(16)
式中:w表示神经网络的权重;μ表示该权重概率分布的均值;σ表示该权重概率分布的方差;ε服从标准正态分布,ε~N(0,I)。偏置b获取公式同理。
在重参数化中,ε到w只涉及到线性操作(平移缩放),采样操作在神经网络计算图之外,对于神经网络,ε只是一个常数,不会影响损失函数对μ和σ的求导。这样便可以先从标准高斯分布采样出随机量,然后可导地引μ,和σ,通过这种方法,完成贝叶斯神经网络的初始化操作。
2.4.2 参数设置
由于本文采用误差反向传播对参数(μ,σ)进行优化,而反向传播有可能使得方差σ小于0,对σ进行特殊处理,将σ重写为:
σ=log(1+eρ)。
(17)
优化对象由(μ,σ)变成(μ,ρ),同时保证方差σ恒大于0。
2.4.3 构建损失函数
为了挖掘工程经验中蕴含的规律信息,并将其融入到贝叶斯神经网络的训练过程,本文定义了一种新的损失函数公式,其损失函数值由数据项和经验项两部分组成。损失函数值越低,表示模型训练效果更好。损失函数公式如下:
LossFunction=lossdata+lossexp。
(18)
式中:LossFunction表示贝叶斯神经网络的损失函数;lossdata表示基于仿真数据构建的损失函数,称为数据项;lossexp表示基于工程经验构建的损失函数,称为经验项。
(1)数据项
由2.1节可知,贝叶斯神经网络模型训练的训练过程就是寻找权重参数w的最大后验概率MAP。直接求后验概率p(W|D)比较困难,本文采样的是变分推断的方式,利用一个由一组参数θ(μ,σ)控制的高斯分布q(W|θ)来逼近后验p(W|D),利用KL散度度量q(W|D)、p(W|D)两个分分布之间的相似性。KL散度越小,则两个分布越相似。通过这种方式将求后验概率的问题转化为求最优θ的优化问题。KL散度公式如下:
(19)
经过分解转为,原等式变为:
(20)
此时最小化式(20)就可以近似求得后验p(W|D)。同时,因为贝叶斯神经网络每一个权重/偏置都是一个独立的概率分布,式(20)可以进一步简化为:
(21)
式中:q(wi|θi)表示给定正态分布的参数后权重参数的分布;p(wi)表示权重的先验;p(D|wi)表示给定网络参数后,观测数据的似然。
(2)经验项
经验项的计算是通过自动微分方法,计算贝叶斯神经网络输入参数节点(例如马赫数、攻角)与输出参数节点(例如全弹法向力)之间的梯度关系,并将该梯度关系与实际工程经验中的梯度关系(2.2节)进行比较,计算均方误差,进而得到基于经验的损失函数项。
损失函数经验项用到的自动微分是将一个复杂的数学运算过程分解为一系列简单的基本运算,每一项基本运算都可以通过查表得出。自动微分有两种形式前向模式 (forward mode)和反向模式 (reverse mode),本文用到的就是自动微分的反向模式。该方法首先正向遍历整个图,计算出每个节点的值;然后逆向(从上到下)遍历整个图,计算出节点的偏导值,步骤如图6所示;节点内蓝色圆圈的数值表示正向计算出的结果,为了方便表达,从下到上、从左到右依次标注为n1到n7,可以看到最后的值n7(顶部节点)为42。
在逆向求导过程中使用链式求导方法:
(22)
(23)
通过自动微分可以快速获得输出变量和输入变量之间的微分。将该方法应用于神经网络,可以快速获得输出层任意节点与输入层任意节点之间的微分。因此,可以得到知识项的损失函数如式(25)所示。
(24)
lossexp=(gmodel-gexp)2。
(25)
其中:gmodel表示贝叶斯神经网络的输出节点y到输入节点x的偏导数;gexp表示输出节点y与输入节点x之间的工程经验(梯度关系)。
2.4.4 参数优化
贝叶斯神经网络训练方法与普通神经网络总体相同,首先计算损失函数,然后计算权重/偏置关于损失函数的导数。与普通神经网络不同的是,其训练对象是权重和偏置的概率分布参数N(μ,σ2),而非权重和偏置的数值。计算过程如下。
首先计算概率分布的期望μ关于损失函数的梯度:
(26)
然后计算概率分布的方差σ关于损失函数的梯度:
(27)
最后对概率分布参数进行更新:
μ←μ-αΔμ,
(28)
ρ←ρ-αΔρ。
(29)
其中:α表示学习率;μ表示对应权重/偏置的期望;ρ表示对应权重/偏置的方差,∈表示标准正太分布。
重复计算过程,直到模型训练误差或者训练代数达到指定要求。
4 实验设置与结果分析
本文针对某高超声速拦截器气动性能预测问题,以融合工程经验的贝叶斯神经网络(Experience-informed Bayesian Neural Network,EBNN)为代理模型构建方法,根据仿真结果对代理方法的气动性能预测结果进行误差分析。实验的输入参数为拦截器工况状态,如表1所示,输出参数为拦截器气动性能,如表2所示。
本文分别对有喷流影响与无喷流影响情况开展实验,研究工程经验融入对模型预测精度的影响。本实验采用的模型参数设置如表4所示。
表4 算法参数设置表
4.1 实验指标
(1)均方根误差
(30)
式中:m为预测值的数量;yi为第i个预测点的真实值;y′i为第i个预测点的预测值。
均方根误差(RMSE)又叫标准误差,它表示预测值和观测值之间差异(称为残差)的样本标准差。一般来说,RMSE越小表示模型精度越高。
(2)平均绝对百分比误差
(31)
式中:m为预测值的数量,yi表示第i个预测点的真实值,y′i表示第i个预测点的预测值。
平均绝对误差表示(MAPE)是相对误差度量值。一般来说,MAPE越小,表示模型精度越高。
(3)模型拟合度
(32)
式中:m为预测值的数量;yi为第i个预测点的真实值;y′i为第i个预测点的预测值。
模型拟合度(R-Squared)表示模型拟合效果。若结果为0,说明模型拟合效果很差;若结果为 1,说明模型无误差。一般来说,R-Squared 越大,表示模型拟合效果越好。
4.2 实验结果分析
4.2.1 工程经验对代理模型的影响分析
为了验证本文所提方法的有效性,针对气动性能参数展开对比实验,对有/无喷流干扰情况下进行测试。首先通过仿真软件获取训练数据,共300组数据。本文使用留出法来对代理模型进行训练,将数据分为两组互斥数据,其中200组用来训练,100组用做测试。图7展示了不同参数的训练过程。
在图7中,曲线表示30 000次训练过程中模型预测误差的变化情况。图7a~图7d四个子图表示无喷流干扰下的EBNN训练情况,图7e~图7h四个子图表示有喷流干扰下的EBNN训练情况。其中,紫色曲线表示没有融合工程经验的训练过程,黄色表示融入工程经验的训练过程。从图7可以看到,对于不同气动性能参数来说,黄色曲线大多低于紫色曲线,这说明融入工程经验的模型误差始终低于无工程经验的模型误差。在同样迭代次数下,融合工程经验的代理模型具有更高的模型精度。同时,可以看到在引入喷流干扰因素后,EBNN训练出现明显的震荡,但是融入工程经验的预测误差仍然低于无工程经验融入的预测误差。综上,可以得出以下结论:融入工程经验能降低EBNN的训练误差。
除了训练误差,本文也对模型泛化性能展开了实验,实验方式是利用300组数据中的100组测试数据测试训练完成的代理模型,进而得到测试误差,并以绝对百分比误差作为测试误差指标,如图8所示。图8中黄色部分表示在训练过程中没有加入经验的代理模型的测试误差,绿色部分表示训练过程中加入经验的代理模型的测试误差。从图8中可以看出在加入了工程经验后,不同气动性能的测试误差都有一定幅度的降低,例如cy1(全弹法向力系数)由16.58%降低到11.23%。由此,可以得出结论:融入工程经验也可以降低EBNN的泛化误差,提高其泛化性能。
为了进一步研究融入工程经验对代理模型的影响,本文以有/无喷流干扰和有/无工程经验融入作为标准进行分类,以均方根误差(RSME)为指标,通过100组数据对训练好的代理模型进行误差测试。测试结果如图9所示。
由图9可知,在有喷流干扰情况下,无论是有/无经验融入,代理模型整体误差都大于无喷流干扰情况,均方误差分别从7.06提升到21.67,5.03提升到14.09。这说明喷流干扰会给拦截器气动性能预测模型训练带来较大的困难,因为在喷流干扰情况下,设计参数增加了姿控开度和轨控开度参数,数据维度上升,进一步加重数据稀缺问题,提高了代理模型的测试误差。同时,在融入工程经验后,无喷流干扰下,代理模型预测误差从7.06降到5.03,降幅28.75%;有喷流干扰下,代理模型的预测误差从21.67降到14.09,降幅34.98%。这说明样本数据稀缺问题越严重,融入工程经验带来的误差降幅效果越好。
综上,可以得到如下结论:①喷流干扰影响比较大,引入喷流干扰因素会增加数据维度,使得数据缺失问题更严重,进而增加代理模型拟合难度;②融入工程经验可以降低代理模型的测试误差,提高模型训练效果;③工程经验对信息缺失更严重的代理模型提升效果更好。在有喷流干扰情况,经验的融入对模型精度有着更好的效果,预测误差降低幅度大于无喷流干扰的误差降低幅度。
4.2.2 不同代理模型的预测结果对比分析
为了进一步说明方案的优越性,本文还将EBNN与常用的代理模型方法进行比较,包括人工神经网络方法(Artificial Neural Network, ANN)、线性插值方法(Linear Interpolation, LI)、克里金插值方法(Kriging, KG),以RMSE与R2为指标。为了降低随机性的影响,代理模型训练方式采用五折交叉验证(5-fold cross validation),并重复10次取平均结果,比较结果如图10和表5所示。
表5 不同算法模型拟合度(R2)
从图10中可以看出,针对cy1、mz1、Δcy1(δ)、Δmz1(δ),最低模型拟合度为0.965(LI)。这说明在无喷流干扰情况下,4种代理模型方法都能保证较高的模型拟合度。而受到喷流干扰时,代理模型的模型拟合度(R2)普遍有降低趋势,例如全弹法向力系数cy1到喷流引起的法向力系数增量cy1(j),R2从0.99分别降低到了0.923(ANN),0.862(LI)、KG(0.887)和0.956(EBNN)。同时在表5中还可以看到,在有喷流干扰时,EBNN的R2始终能保证较高的水准,最低为0.775。其他算法则有较大的起伏波动,最低分别为0.692(ANN),0.561(LI)和0.681(KG)。这说明EBNN相比于其他算法,在有/无喷流干扰情况中都能有较高的模型拟合度。
除了使用交叉验证法预测不同代理模型的预测精度和模型拟合度,本文还使用留出法来对不同代理模型进行训练,一部分作为训练集,另一部分用作测试集。图11展示了不同代理模型在不同划分比下的预测误差。横坐标表示训练集的数据比例,纵坐标表示所有气动性能预测误差的均值,对每种划分比例的实验重复进行10次,取平均值。从图11中可以看到,随着训练集数据占比的增加,4种代理模型的预测误差都呈下降趋势,且在所有数据划分比下,EBNN都有着最低的预测误差。由此可见,EBNN相较于其他代理模型方法,确实能够更准确地预测拦截器气动性能。
除了预测精度,本文还以误差均值和方差为依据进行了误差分析,以验证方法的鲁棒性,结果如图12所示。同样是五折交叉验证法,先是记录每种代理模型对所有气动性能参数的预测误差,然后计算误差的均值和方差。横轴表示用到的代理模型,左边纵轴表示代理模型的8种气动性能预测误差均值,右边纵轴表示预测误差的方差。从图12可以看出,面对不同气动性能参数,在4种代理模型中,EBNN的方差最小。由此可见EBNN的鲁棒性优于其他代理模型算法,其性能最稳定。考虑到拦截器气动力复杂多变,因此笔者认为:在喷流与非喷流条件都表现较好的EBNN算法更适合拦截器气动外形设计问题。
5 结束语
本文针对喷流干扰下的拦截器气动性能快速评估问题,提出一种基于贝叶斯神经网络的代理模型构建方法。首先分析拦截器飞行过程,从中总结出重要设计参数。然后针对传统设计过程中的不足,提出基于代理模型的快速设计方法,并用融合工程经验的代理模型代替原本耗时昂贵的仿真软件。以某高超声速拦截器为对象,基于设计过程中常用的代理模型构建方法为对比,以均方误差和模型拟合度为验证指标展开试验。得到结论如下:
(1)本文所提出的代理模型构建方法在某高超声速拦截器上有着良好表现。通过融合工程经验,可以有效降低代理模型的预测误差。无论是训练过程,还是测试过程,有经验融合的代理模型都表现出更为优秀的预测精度。目前只用到了梯度形式的工程经验,在后续工作中,可以考虑挖掘分析更多类型的工程经验,进一步提供代理模型的预测精度。
(2)从实验结果中可以看出,喷流干扰因素将会影响代理模型的预测精度。在考虑舵偏影响情况下,代理模型预测误差会有小幅提升。而在考虑喷流干扰因素时,代理模型的预测误差会进一步提升。但是本文所提出的融合工程经验的代理模型构建方法对喷流干扰影响下的性能预测有着更加优秀的效果。相较于无喷流干扰情况,在融合工程经验后,最终训练得到的代理模型的测试误差在5%以内,表明本文所建立的代理模型能够获得较高精度的气动性能参数预测结果,并具有良好的泛化能力。
(3)本文所提出的代理模型构建方法在鲁棒性上也有更为优秀的表现。相较于传统代理模型构建方法,本文提出的融合工程经验的贝叶斯神经网络方法(EBNN)有着更高的鲁棒性。通过残差分析,我们发现对于不同的气动性能参数,EBNN的异常误差更少。并且在不考虑异常误差时,EBNN依旧有着更低的测试误差。
除了以上结论,作者在实验过程中还遇到了一些研究问题,计划在后续工作中解决。首先是贝叶斯神经网络的冷后验问题。贝叶斯神经网络对于先验分布有一定的要求,不同的先验分布会影响训练结果。标准高斯先验通常不是最优的,如何找到最优的先验分布是一个需要解决的问题。其次是经验类型问题。工程设计问题中存在多种多样的设计经验,目前本文只用到了梯度形式的经验,如何统筹不同类型的工程经验,将其都融入到代理模型训练过程中也是一个需要解决的问题。
附录
表2 舵偏引起的法向力系数工程经验表
表3 舵偏引起的俯仰力矩系数工程经验表
表4 喷流引起的法向力系数工程增量经验表
表5 喷流引起的俯仰力矩系数增量经验表
表6 喷流对舵偏引起的法向力系数增量经验表
表7 喷流对舵偏引起的俯仰力矩系数增量经验表