APP下载

基于深度神经网络的流场时空重构方法

2022-07-14韩仁坤刘子扬钱炜祺王文正陈刚

实验流体力学 2022年3期
关键词:流场高分辨率校正

韩仁坤,刘子扬,钱炜祺,王文正,陈刚,2,*

1.西安交通大学 航天航空学院 陕西省先进飞行器服役环境与控制重点实验室,西安 710049

2.机械结构强度与振动国家重点实验室,西安 710049

3.中国空气动力研究与发展中心,绵阳 621000

0 引 言

粒子图像测速(Particle Image Velocimetry,PIV)是一种基于流场图像分析的非接触式瞬时全流场测量技术,它可以获取流场的准确定量信息。PIV 实验使用的硬件设备主要包括光源系统和成像系统,二者的品质决定了成像质量和测量范围等性能参数。PIV 测量对硬件设备的高要求导致了实验成本的增加,要实现流场的高精度、高分辨率测量只能购买昂贵的PIV 测量仪器,因此研究基于数据驱动的流场时间和空间高分辨率重构技术很有必要。

近年来飞速发展的人工智能技术已经对人类的工作和生活方式产生了颠覆性的影响。其中,推动人工智能发展最主要的动力就是深度神经网络。由于具备强大的非线性描述能力和深度特征捕捉能力,深度神经网络已在图像处理、语言翻译、疾病诊断、游戏竞赛等众多领域取得了惊人的成就。自从Ling 等将雷诺不变量引入神经网络以修正雷诺平均湍流模型后,深度神经网络在流体力学领域的应用研究已成为一个研究热点。研究者们使用深度神经网络在控制方程学习、流场重构和响应预测等方面展开了研究。

例如,流场重构时使用深度神经网络的强大表征能力,直接从流场数据中挖掘规律,并重现出流场整场信息。Sekar 等使用深度神经网络预测不同翼型在不同状态下周围流场的分布情况,首先使用卷积神经网络(Convolutional Neural Network,CNN)提取翼型的形状特征,然后将其与来流状态组合在一起,最后使用全连接神经网络预测翼型周围流场分布。Jin 等研究了表面压力与流场分布之间的映射规律,使用混合卷积神经网络,以圆柱表面压力分布为输入,预测圆柱周围流场分布情况。在不同雷诺数情况下,均能得到准确的预测结果,流场数值及结构均与真实值吻合良好。Han 等对流场的时空演化过程进行研究,构造了一种基于卷积神经网络和长短时记忆神经网络(Long-short-term Memory Neural Network,LSTM)的混合神经网络,使用前几个时间步(dt)的高维流场预测下一时间步的高维流场。惠心雨等将条件生成对抗网络与卷积神经网络相结合,改进了条件生成对抗网络对生成样本的约束方法,基于改进的回归生成对抗网络深度学习策略能准确预测出指定时刻的流场变量。

针对实验或者模拟数据中不同分辨率数据之间的转换问题,Fukami 等使用混合卷积神经网络对低分辨率数据进行高分辨率重构。通过DNS 数值模拟得到低分辨率和高分辨率数据,低分辨率数据是高分辨率数据经过平均池化或最大池化的结果。其使用间断跳跃卷积神经网络,以低分辨率数据为输入,通过多次卷积得到对应的高分辨率流场。Lagemann 等尝试将深度神经网络应用于PIV 测量结果分析:首先使用全连接神经网络计算2 帧测量图像之间的相关性;然后使用卷积神经网络将此相关性添加至第一帧图像,并得到空间粒子点的速度矢量;最后将得到的矢量图进行高分辨率重构,得到高质量的速度分布图。朱浩然等尝试将深度神经网络在PIV 测量结果分析中的应用拓展至三维范围。

当前深度神经网络在PIV 测量技术中的应用大多集中在计算分析2 帧相邻图像中粒子的速度矢量,对速度场的高分辨率重构研究很少,尤其是时间维度的高分辨率重构。本文利用卷积神经网络和长短时记忆神经网络设计了一种低分辨率流场数据的时间和空间高分辨率重构方法,能够以较低成本获得高质量的流场准确定量信息,提高实验效率,节约实验成本。

1 方 法

1.1 空间高分辨率重构

PIV 实验测得的流场数据通常分辨率较低,为了提高结果的分辨率,需要使用更高性能的相机和计算机,这将导致实验成本急剧增加。卷积神经网络自身具有局部连接和权值共享特性,能够更准确地学习全局整体特征,局部噪声对特征学习的影响不大。实验数据中经常包含多因素导致的误差,而卷积神经网络可以忽略这些误差,抓住数据的主要结构特征。构建了一种基于卷积编码机(CNN encoder)和卷积解码机(CNN decoder)的深度神经网络结构,如图1所示,其中,F代表低分辨率流场数据,F代表高分辨率流场数据。使用该深度神经网络能以较低成本将低分辨率测量结果重构为高分辨率结果,从而获得更多的流场细节特征。

图1 空间重构深度神经网络结构示意图Fig.1 Structure of deep neural network for spatial reconstruction

编码机与解码机原理基本相同,都是通过卷积过程学习输入数据的特征。其不同之处在于:学习数据特征的过程中,编码机将输入数据尺寸降低以获得更抽象、更深层的特征,而解码机在学习过程中将输入数据尺寸放大,更详细地展示学到的特征。将实验测得的低分辨率数据输入到该深度神经网络后,编码机首先对数据进行卷积降维,生成数据的深层特征空间;然后对深层特征空间里的流场特征进行升维,得到高分辨率流场数据。这样不仅可以实现数据从低分辨率到高分辨率的重构,还能获得数据的深层结构特征。这些特征可用于流场结构和演化过程的进一步分析。

本文中所使用的低分辨率数据形状为14×14,高分辨率数据形状为100×100。因此,重构后的流场数据空间数据点数是原来的 51 倍,重构后流场分辨率得到显著提高。针对此数据采用的编码机包含两层卷积过程,每层中卷积核的大小均为3×3,滑移步长分别为1 和2,得到的深层特征尺寸为7×7。解码机包含5 层卷积过程,逐步将尺寸为7×7 的深层特征重构为100×100 的高分辨率结果。

1.2 时序预测及校正

长短时记忆神经网络是一种用于学习时序数据中时间演化特征的神经网络,其每个神经元包含3 个门(图2):输入门i(增加有用信息至神经元状态c),遗忘门f(从神经元状态中剔除无用信息),输出门o(输出信息h至下一神经元)。通过不断在神经元状态参数c上添加或去除信息,使神经网络学习到多个时间步的时序数据x在时间维度上的演化关系。在LSTM 神经网络中,每个LSTM 的单元输入有3 个,包括当前时刻网络的输入值x、上一时刻LSTM 的输出值h以及上一时刻的单元状态c;单元输出有2 个,包括当前时刻LSTM 输出值h和当前时刻的单元状态c。本文中x 对应不同时间步输入流场数据,h 和c 则作为内部参数在神经网络中传递。

图2 长短时记忆神经网络的神经元结构图Fig.2 Sketch of neuron structure in LSTM

在进行流场数据时间维度高分辨率重构时,构建长短时记忆神经网络学习流场演化过程,使用前3 个时间步流场数据预测下一时间步流场数据。与上一小节中空间高分辨重构网络相结合,长短时记忆神经网络即可在深层特征空间上运算,预测下一时刻的流场特征,从而实现下一时间步流场高分辨率预测;预测得到的流场可以作为下一步预测的输入。因此,给定初始状态后,神经网络可以进行持续预测,如图3所示,图中上标代表时间步。从图中可以看出,在完成一个时间步预测得到高分辨率流场后,对其进行下采样,降低至与输入数据匹配的维度后,再与已知时刻流场数据和相结合,即可进行下一时间步流场预测。不同数据的结合方式为:上一时刻预测的输出通过CNN encoder 提取流场特征,将特征作为x 输入到LSTM 层的神经元中;前两个时间步数据也需要提取特征,然后将特征输入到LSTM 层的其他神经元中,完成对下一时间步流场的预测。

图3 流场时空重构数据流动示意图Fig.3 Sketch of data flow in flow field spatio-temporal reconstruction method

深度神经网络结构如图4所示,此神经网络包含编码机、LSTM 和解码机3 部分。其中,编码机对数据进行卷积降维生成数据的深层特征空间;LSTM捕捉深层特征空间内不同时间步流场演化过程,并预测下一时间步流场特征;解码机对深层特征空间内的流场特征进行升维,得到高分辨率流场数据。深度神经网络各部分结构的参数如表1所示,除了最后一层不使用激活函数,其他层均使用Relu 函数作为激活函数。

图4 深度神经网络结构示意图Fig.4 Sketch of deep neural network structure

表1 深度神经网络结构参数Table 1 Details of the structure parameters in the hybrid deep neural network

但是,在时间维度进行流场持续预测过程中,误差积累会导致后续预测结果与真实值偏差越来越大。因此,在预测过程中需要不断对预测过程进行校正,使预测误差保持在合理水平。本文通过在预测过程中不断加入已知时刻数据对预测过程进行校正,两个校正时间步之间得到的流场数据即可理解为在时间维度上的加密过程,提高了时间维度的分辨率。如每隔5 个时间步校正一次,则在时间维度的密度为原数据的5 倍。

1.3 神经网络训练

由于高分辨率重构方法很难用真实的实验数据直接进行验证测试,而实验测量数据与模拟数据的区别只在于实验数据含有实验装置和实验方法导致的各种误差,因此可以通过在数据集中添加噪声的方式使模拟数据符合实验数据分布规律。实验数据能给出的规律及存在的问题,经过处理后的模拟数据同样可以给出,因此使用模拟数据同样能够证明本文提出方法对实验数据的适用性和有效性。本文使用人工合成数据对重构结果进行验证测试。

通过数值模拟方法得到不同雷诺数(Re)条件下二维圆柱绕流流场演化过程。CFD 求解器采用自主开发的多块结构化网格求解器,计算网格如图5所示。求解基于有限体积法,空间离散格式为二阶Van Leer 格式,时间推进方式为LU-SGS 隐式方法,时间步长均设置为0.02 s,保存每一时间步完整流场。

图5 结构化网格Fig.5 Structured grid

截取部分区域流场,范围如图5中红色方框所示,并对其进行无量纲化,得到无量纲的压力(p)和速度(U,V)。将无量纲流场数据投影到不同分辨率的网格点上,即可得到高分辨率流场数据和低分辨率流场数据。每个状态取400 个时间步流场作为数据集,选取范围为圆柱绕流尾流场中涡脱落达到稳定状态后的阶段。将每个时间步流场数据投影至尺寸为100×100 且均匀分布的网格点上,每个状态得到的数据集尺寸为400×100×100×3。为了使模拟数据更加贴近实验数据,需额外在低分辨率流场数据中添加噪声,以模拟实验时产生的各种误差。添加的噪声为随机噪声,其均值为0,方差为0.1。数据集为经过无量纲化的数据,压力和速度值均在1 附近,因此添加的噪声大小在10%左右。

神经网络的训练过程是一个神经网络内权值和偏置值逐步寻优的过程,输入数据前向传播,误差反向传播。本文采用均方根误差(RMSE)作为损失函数评价预测结果好坏,计算方法如式(1)所示:

式中,为i 位置点的预测值,ψ为i 位置点的真实值,N 为数据点的个数。神经网络的每一步训练均需先计算均方根误差,再求得该误差对需要优化的每一个参数的导数,然后通过自适应矩阵估计算法(Adam)根据误差的导数更新神经网络中的参数。完成一个时间步参数更新后,输入新的数据计算预测误差,再计算导数,然后进行参数更新。重复此过程即可逐步提高神经网络的预测精度,当神经网络的预测精度达到要求时即可停止训练。整个训练过程是基于开源平台TensorFlow 框架自动运行的。训练完成的神经网络可用于相似问题的快速预测。训练环境为英伟达RTX2080Ti 显卡,显存10 GB。在该环境下每次训练时长为12 h。

2 结果及讨论

测试算例使用雷诺数分别为300、400、500、600 时的二维圆柱绕流数据作为训练集训练神经网络,使其学习雷诺数为300~600 的二维圆柱绕流流场演化过程;使用雷诺数为550 时的数据作为测试集,测试集中添加与训练集不同类型的噪声。测试集的数据在训练时未输入到深度神经网络中,因此深度神经网络对测试集的预测结果可以较好地显示其泛化能力。下文展示了该混合深度神经网络的空间高分辨率重构能力和时空同时重构能力。

图6为瞬态流场高分辨率重构结果,第一列为重构结果,第二列为数值模拟结果,第三列为重构结果相对于数值模拟结果的误差;圆柱直径为D,圆心位于坐标(0,0)处。可以看出重构出的高分辨率流场与真实流场吻合较好,二者的RMSE 为0.006 5。图7是以真实流场中每个数据点的变量值为横坐标、以对应点的高分辨率重构结果变量值为纵坐标作出的数据点分布图,真实值与预测值越接近,则该数据点位置越接近y=x 参考线。图中所有数据点均分布于参考线附近很小的范围内,更加直观地展示了高分辨率重构结果的准确性。

图6 空间高分辨率流场重构结果与数值模拟结果对比Fig.6 Comparison of spatial high-resolution reconstruction results and numerical simulation results

图7 流场重构值与真实值对比散点图Fig.7 Scatter of comparison between reconstructed flow field value and ground truth flow field value

在进行时空高分率辨重构时,将实验测得的测试状态下3 个时间步流场作为神经网络的初始化输入。图8为基于初始化3 个时间步流场数据的流场时空重构结果,以及顺流方向速度场在经过不同时间步后的高分辨率预测结果与真实值的对比。从图中可以看出,初始时间步的预测结果与真实值之间吻合较好,但是随着预测时间步的增加,误差也在逐渐积累(图9中红色曲线),导致一定时间步之后预测结果与真实值之间的误差已经超出可接受范围,此后的预测结果不再满足需求。因此需要在预测过程中不断添加正确信息。

图8 无校正时不同时间步流场重构结果与数值模拟结果对比Fig.8 Comparison of flow field reconstruction results without correction and numerical simulation results at different time steps

图9中绿色曲线为每隔5 个时间步添加一次校正数据后的误差变化过程,黑色竖直虚线表示添加校正数据的位置。此过程可视为一种时间维度加密过程,相对于已知流场数据,一个时间步变成了5 个时间步,因此添加校正后预测得到数据时间维度密度为原始数据的 5 倍。研究发现,用已知时间步的准确低分辨率数据代替深度神经网络预测得到的高分辨率数据进行下采样,将其结果作为下一时间步的输入数据,预测误差不会持续增加;但在插入校正数据的时间步后,下一时间步的预测误差会突然增大。这是因为深度神经网络在前几个时间步的预测过程中已经产生了一定的误差,相比于真实流动的趋势已经产生了改变,直接将真实数据插入到深度神经网络预测过程中,会导致输入数据中前后时间步的数据不匹配,从而改变深度神经网络自身的预测趋势,导致预测误差突然增大。

在校正时间步中插入的数据应既能保持深度神经网络的预测趋势,也能改善预测得到数据的准确性。将深度神经网络预测数据与已知真实数据按比例混合,作为下一时间步预测的输入数据。生成混合校正数据方法为F = 0.2F+ 0.8F。F 为校正后的数据,作为下一时间步预测的输入;F为上一时间步预测结果;F为对应时刻已知真实值。图9中蓝色曲线为采用混合数据进行校正的预测误差变化过程,可以看出,校正时间步误差已经不会突然增大,而且在一定范围内始终保持较高的准确度。

图9 不同校正方法持续预测结果均方根误差对比Fig.9 Comparison of the RMSE between different correction methods

图10 为采用混合数据进行校正、顺流方向速度场在经过不同时间步预测后的高分辨率预测结果与真实值之间的对比。可以看出,与图8中相同时间步相比,整场预测误差已经降低了许多,基本上能与第一步完全使用真实数据进行预测的误差保持在同一水平,证明该种预测和校正方法是有效的,可实现低分辨率流场的时间和空间高分辨率重构。选择坐标为(1.5,0)的点作为特征点,对比该点不同时刻的重构结果与真实值,如图11 所示。从图中可以看出,在一段时间内重构结果与真实值吻合较好,展示出了较高的预测精度。

图10 使用混合数据校正时不同时间步流场重构结果与数值模拟结果对比Fig.10 Comparison of flow field reconstruction results corrected with proportional mixing data and numerical simulation results at different time steps

图11 特定位置流场变量演化对比Fig.11 Comparison of evolution of flow field variables at specific locations

3 结 论

实现了基于深度神经网络的流场时间和空间高分辨率重构,重构后的流场数据空间密度为原始数据的51 倍,时间维度密度为原始数据的5 倍。

1)在对流场进行空间高分辨率重构时,卷积神经网络能够忽略输入数据中存在的一些噪声,得到流场的深度结构特征。

2)使用深度神经网络对流场在时间维度上进行持续预测会产生误差积累,在预测过程中添加已知准确信息能够对预测过程产生校正作用,使预测误差保持在一定范围内。

3)在深度神经网络预测过程中添加校正信息时,添加的校正信息既需具有准确性又需与预测趋势保持一致性。

基于深度神经网络的流场时空重构技术具有成本低和适用性广的优势,很有希望应用于更真实的实验;该技术也存在许多值得研究的问题,如模拟数据与实验数据的匹配性研究、深度神经网络结构参数对预测结果的影响以及更有效的校正方式等。

猜你喜欢

流场高分辨率校正
车门关闭过程的流场分析
液力偶合器三维涡识别方法及流场时空演化
基于GEE云平台与Sentinel数据的高分辨率水稻种植范围提取——以湖南省为例
高分辨率CT+人工智能在新型冠状病毒肺炎诊断与疗效评估中的应用研究
基于机器学习的双椭圆柱绕流场预测
再分析降水资料的适用性评估与偏差校正
探讨高分辨率CT在肺部小结节诊断中的应用价值
真实流场中换热管流体诱导振动特性研究
炫酷ACR
一种具有自动校正装置的陶瓷切边机