基于稀疏环境监测点的流动时程重构模型精度研究

2024-01-06战庆亮葛耀君

中国环境科学 2023年12期

战庆亮,刘鑫,晁阳,葛耀君

战庆亮1*,刘鑫1,晁阳1,葛耀君2

(1.大连海事大学交通运输工程学院,辽宁大连 116026；2.同济大学土木工程学院, 上海 200092)

根据有限数量且稀疏分布的环境流场监测点处的观测数据,得到更多空间位置处的环境测点的流动时变信息,能够为大气监测、水体监测和污染物扩散等问题的控制与研究提供更加丰富的数据.本文研究了物理约束对机器学习流场时程表征模型的精度影响规律,研究了可用测点数以及物理约束权重对重构精度的影响.以低雷诺数方柱大气绕流为例,开展了基于稀疏环境监测点的数据进行高空间分辨率流场时程重构的精度研究.研究发现当监测点数量增至500时精度不再提高;当监测点数量仅有50时,约束权重为10可得到最优结果.结果表明,通过选择合适的物理约束影响权重,可以有效弥补可用数据较少的问题,为环境流动问题的数据处理和高分辨率流场重构提供了新的方法与依据.

环境流场时程；稀疏监测点；环境流场重构；物理约束；测点数量

流场是环境科学研究中的重要领域,流场监测的时变信息有助于预测和管理环境中的水文、气象和污染扩散过程.例如,流场信息有助于明确空气污染的扩散和传播规律[1-2],可以帮助研究水污染物的扩散和输运机制[3-4],也对大气的时变研究具有重大作用[5-6],能够更好地理解气候变化的机制等、为环境保护和资源利用提供科学依据[7-8].当进行空气质量监测、气象监测以及水体监测等研究时,通常是在城市、工业区、交通枢纽等地点或者河流湖泊的若干位置布设一些流场测点,例如空气质量监测站、水体质量监测站等.这些测点通常只能提供局部的流场数据,而无法提供更全面的大范围流场及污染物的时变信息.为了更好地全面了解城市空气质量、水体等状况,需要通过稀疏测点的流场重构其他位置处的信息,对观测区域内的时变物理信息进行预测和评估.然而,环境中流场的时空变化规律复杂,不仅单个测点的物理量呈现复杂的时变特征,同时不同测点之间的物理量变化规律也各不相同,导致了在仅有少量已知测点的流场信息的情况下很难重构整个流场.

随着人工智能技术的发展,深度学习逐渐成为复杂流动重构问题研究的新方法[9],例如基于卷积神经网络(CNN)的重构方法和基于生成对抗网络(GAN)的流场重构方法.一方面,部分研究通过超分辨率图像重建[10]、残差网络[11-12]、多时间路径卷积神经网络[14]等方法进行流场重构,另一部分研究采用生成对抗网络模型[15-18],通过训练使得对抗模型能够对空间和时间的流动数据进行判断,促使生成模型产生高度准确且具有丰富细节的时变物理量.这些研究的重构思路均是基于模型的图像特征识别与增强实现的.

然而,上述研究方法中使用的数据通常是实验获取或模拟的流场快照数据,在实际环境流场问题中难以获得大范围的流场快照数据.流场测点处的时程数据是目前环境实验能够获取的主要数据类型,但是目前针对流动时程的深度学习研究较少.如文献[19]提出了针对流场时程数据的流动表征和流动特征识别的方法[20-21].此外,还进行了对流场时程特征进行提取的模型研究[22-23],为深度学习方法在流场时程数据的分析和重构应用方面提供了可行的解决方案.然而,在训练样本数据有限的情况下,这些方法在通过数据驱动的模型训练方式获取准确结果方面存在一定的困难.

为了克服纯数据驱动的流场研究难点,借鉴Raissi等[24]提出的求解方程与参数反演方法[25],文献[26]提出了考虑物理方程约束的流场表征的机器学习方法,初步结果表明能够在已知测点数据较少的情况下提高模型的准确性.该方法非常适合用于环境测点的流场重构研究,然而环境测点个数对精度的影响、物理约束强度对模型精度的影响机制并不明确.因此,本研究进一步讨论不同数量已知监测点以及物理信息在损失函数中的占比对稀疏环境监测点的时程重构模型精度问题.

1 问题与方法

1.1 流动问题及模拟

本文以环境流动的基本输运量开展研究,主要针对速度场和压力场进行求解与重构.其他物理量(例如温度场、密度场以及污染物浓度等)的输运方程可基于所求速度场进行计算,这些物理量方程求解时强非线性对流项的速度场是已知的,因此求解较容易,其重构方法与本文所述无本质区别,这里选择低雷诺数下的方柱绕流问题为例开展具体讨论.具体的,以环境流动中广泛存在的方柱绕流场为例,讨论深度学习模型的物理约束机理.

计算域如图1a所示,雷诺数= 100.其中方柱的边长为,方柱周围矩形区域内使用较密的网格,距离方柱较远的区域使用较稀疏的网格.入口边界条件设置速度入口,右侧边界为压力出口,上下边界为对称边界条件,方柱壁面设置为无滑移边界.

(a) 计算域

(b) 测点

图1 流场计算域和测点布置

Fig.1 Sketch of computational domain and sampling points

图2 测点时程曲线与瞬态流场云图

在方柱周围和下游区域布置了多个流场监测点,用于记录环境流场中的物理量随时间的变化,如环境中的温度与风速变化.这些监测点涵盖了方柱周围的7000个位置,如图1b所示.使用zFlower软件计算了每个监测点处的物理量时程,并得到了不同位置的物理量随时间的变化曲线.此外,选择特定时刻的瞬时值按照测点位置排列,可以得到流动瞬态云图,如图2所示.

环境问题研究中的流动监测范围通常很大,无法布置如本算例所示的如此密集的测点,因此,探索如何利用少量测点的时程数据对模型进行训练以提高准确度,对环境流场的重构和预测具有重要的研究价值.

1.2 物理信息约束的重构模型

本文采用深度学习网络模型,通过对已知测点样本进行训练,实现对计算域中其他测点处物理量时程的预测.所采用的网络模型结构如图3所示[26],其输入层包括测点坐标和时程信息,输出层包括压力、流向速度和横向速度的时程.

模型的基本计算流程如下:(1)通过深度学习网络模型建立测点坐标与压力、流向速度和横向速度时程之间的映射关系模型结构;(2)并通过已知测点的坐标和时程对网络模型的权重进行训练;(3)通过将输入层与神经网络(NN)输出的时程与Navier- Stokes方程相结合,构建了物理约束(PC)的损失项,并通过模型训练同时降低时程误差和方程误差,完成模型的训练;(4)在模型中输入待预测点的坐标,即可得到该点处的流场时程信息,从而实现大范围空间的流场重构.

其中,物理约束的损失项表达式如下所示:

式中:(,)代表计算域中测点的空间坐标;表示压力;和分别表示流向速度和横向速度;PC代表物理约束方程损失项;NN表示神经网络的损失,它衡量了模型输出值与已知测点真实时程之间的差异,可以看作是训练过程中模型对已知测点的拟合误差.加入物理方程约束后,模型的总损失函数为:

其中参数为约束强度系数(constrain factor),表示物理约束条件与神经网络对已知样本训练之间损失的比例关系,通过控制大小变化来检验模型.

图3 人工神经网络模型的原理[26]

2 结果与分析

本部分主要包含两部分研究,分别为不同数量已知监测点和不同物理约束强度系数对重构模型的精度影响.

2.1 已知监测点数量的影响

考虑到训练集大小会对模型结果的精度产生不同影响,分别训练不同数量的监测点时程数据,从7000个监测点中随机选取个样本点作为训练集,在模型训练过程中,仅需要该个点的数据信息.训练集数量范围从=50增大到=5000,如图4所示为样本测点布置情况,图中红色点为用于训练集的样本点,绿色测点不参与模型的训练.

(a)=50 (b)=100

(c)=500 (d)=3000

图4 随机选择的训练测点位置

Fig.4 Randomly selected measurement points locations for training

首先不对模型施加方程约束,此时为纯数据驱动模型,即物理约束强度=0,模型的损失为已知的监测时程与模型输出时程的均方误差,不同样本量训练总损失情况如图5所示.计算中,若损失趋于平稳则提前终止训练,每条损失曲线最终损失值均达到10-4数量级,且训练集数量越大需要的迭代次数(epoch)越少.

参考文献[26]中表示预测误差的计算方法,把不同坐标点的误差绘制成无量纲化的误差散点图.各算例采用除训练集外相同位置的测点作为预测集,不同误差以不同颜色来表示,若误差值小于5%用绿色表示,5%～10%之间用蓝色表示,10%～20%之间用黄色表示,20%～50%之间用粉红色表示,大于50%用红色表示.

图6所示为不同数量测点进行训练的模型预测结果,包含流向速度与横向速度的误差散点图以及对应的高分辨率瞬态云图.

结果表明,随着测点数量的增加,误差散点图精度最高的绿色区域范围不断扩大,误差最大的红色区域减小,且对应的预测云图逐渐接近真实的云图结果.

图5 模型训练总损失

图7为上述各误差散点图在空间维度上的均值,误差均值曲线呈下降趋势,且在测点数量= 500时逐渐趋于平缓,说明模型精度随测点数量的增加而增大.实际的环境流动问题监测时往往难以直接获得更多测点的数据,因此要研究物理约束强度的影响.

图6 误差分布与重构的瞬态云图

图7 误差随测点数量变化

2.2 物理信息的损失占比影响

进一步研究不同的物理信息约束损失占比对于模型拟合效果的影响.本文选取不同的范围为[10-9, 103],以50个样本点作为稀疏的已知环境流动监测信息,重构整个流动的预测模型.

模型训练后的测点时程误差均值如图8所示,图8a为不同下的流向速度和横向速度的误差均值,图8b为压力误差.结果表明=50时两幅图中均在=10处误差达到最小值,速度时程的精度提高了2倍,压力时程的精度提高了20倍;=100时在=1处得到最小值,速度时程的精度提高了2倍,同时压力时程的精度提高了50倍;不施加物理约束即=10-9时,模型无法拟合压力时程数据导致压力误差过大,方程约束在损失函数中占比过大即=103时,重构效果不理想导致速度误差过大.

使用不同的约束强度系数对模型进行训练并保存模型,预测结果如图9所示.当10-9时可看作不施加物理约束,得到的结果与数据驱动结果相同,且观察到横向速度云图误差极大;当增大至10-1时初步得到拟合较好的云图,但流场上游区域误差较大;当为1和10时取得了最优的云图结果,其中为10的误差散点图精度最高;继续增大到102时预测效果不理想,达到103时方程项占比过大导致模型训练失败.

(a) 速度误差均值 (b) 压力误差均值

图8 误差随参数α变化

Fig.8 Model error with respect to α

图9 速度误差分布与重构的瞬态云图

图10 压力误差分布与重构的瞬态云图

同时模型得到了压力的预测结果,如图10所示.在模型训练时,压力时程数据并不作为已知条件,是不参与模型训练的.压力时程直接由模型输出并通过方程约束精度,故在稀疏数据情况下较难拟合高分辨率压力云图.图中表明当=10时可得到较理想的云图结果,且误差散点图绿色区域显著扩大.综上可说明物理信息的损失占比对模型结果的影响不容忽视,在为某一数值范围的情况下模型可获得最优解.

3 结论

3.1 随着训练集监测点数量的增加,模型的预测精度逐步提升,基于数据驱动的模型结果在测点数量=500时误差逐渐趋于稳定.

3.2 物理方程约束项在模型损失函数中的占比较重要,在样本数据稀疏的情况下可提高精度.测点数量=50时,物理方程约束项的占比=10处误差得到最小值;测点数量=100时,=1处误差得到最小值.

3.3 基于时程的深度神经网络模型可预测未知测点处的时程,后续应进一步探索复杂流动的模型精度,并实现基于实测稀疏的环境流动监测数据的高空间分辨率流场重构.

[1] 周琪,于洋,刘苗苗,等.基于机器学习和非参数估计的PM2.5风险评估 [J]. 中国环境科学, 2022,42(8):3554-3560.

Zhou Q, Yu Y, Liu M M, et al. Risk assessment of PM2.5pollution based on machine learning and nonparametric estimation [J]. China Environmental Science, 2022,42(8):3554-3560.

[2] 周恒左,陈恒蕤,廖鹏,等.兰州市CMAQ近地面臭氧模拟结果的订正方法——基于机器学习方法 [J]. 中国环境科学, 2022,42(12): 5472-5483.

Zhou H Z, Chen H R, Liao P, et al. A revised approach to CMAQ near-surface ozone modelling results in Lanzhou-Based on machine learning methods [J]. China Environmental Science, 2022,42(12): 5472-5483.

[3] 嵇晓燕,姚志鹏,杨凯,等.基于MSLSTM-DA模型的水质自动监测异常数据报警 [J]. 中国环境科学, 2022,42(4):1877-1883.

Ji X Y, Yao Z P, Yang K, et al. Water quality alert with automatic monitoring data based on MSLSTM-DA model [J]. China Environmental Science, 2022,42(4):1877-1883.

[4] 任永琴,金柱成,俞真元,等.基于双向门控循环单元的地表水氨氮预测 [J]. 中国环境科学, 2022,42(2):672-679.

Ren Y Q, Kim J S, Yu J W, et al. Ammonia nitrogen prediction in surface water based on bidirectional gated recurrent unit [J]. China Environmental Science, 2022,42(2):672-679.

[5] 张寒博,杨骥,荆文龙,等.多种特征因子结合GBDT的降水数据降尺度方法研究 [J]. 中国环境科学, 2023,43(4):1867-1882.

Zhang H B, Yang J, Jing W L, et al. Downscaling method of precipitation data based on GBDT combined with multiple eigenfactors [J]. China Environmental Science, 2023,43(4):1867- 1882.

[6] 李静波,张莹,盖荣丽.基于机器学习的星载短波红外CO2柱浓度估算 [J]. 中国环境科学, 2023,43(4):1499-1509.

Li J B, Zhang Y, Gai R L. Estimation of the column concentration of carbon dioxide using spaceborne shortwave infrared spectrometer [J]. China Environmental Science, 2023,43(4):1499-1509.

[7] 葛渊博,卢文喜,白玉堃,等.基于SSA-BP与SSA的地下水污染源反演识别 [J]. 中国环境科学, 2022,42(11):5179-5187.

Ge Y B, Lu W X, Bai Y K, et al. Inversion and identification of groundwater pollution sources based on SSA-BP and SSA [J]. China Environmental Science, 2022,42(11):5179-5187.

[8] 潘紫东,卢文喜,范越,等.基于模拟-优化方法的地下水污染源溯源辨识 [J]. 中国环境科学, 2020,40(4):1698-1705.

Pan Z D, Lu W X, Fan Y, et al. Inverse Identification of groundwater pollution source based on simulation-optimization approach [J]. China Environmental Science, 2020,40(4):1698-1705.

[9] 张伟伟,窦家庆,刘溢浪.智能赋能流体力学展望 [J]. 航空学报, 2021,42(4):524689.

Zhang W W, Kou J Q, Liu Y L. Prospect of artificial intelligence empowered fluid mechanics [J]. Acta Aeronautica et Astronautica Sinica, 2021,42(4):524689.

[10] Zhou L, Lu X, Yang L. A local structure adaptive super-resolution reconstruction method based on BTV regularization [J]. Multimedia Tools and Applications, 2014,71(3):1879-1892.

[11] Lim B, Son S, Kim H, et al. Enhanced deep residual networks for single image super-resolution [A]//O’Conner L.2017 IEEE Conference on Computer Vision and Pattern Recognition Workshops (CVPRW) [C]. Piscataway: IEEE, 2017:1132-1140.

[12] Tai Y, Yang J, Liu X. Image super-resolution via deep recursive residual network [A]//O’Conner L.2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) [C]. Piscataway: IEEE, 2017:2790-2798.

[13] Lai W S, Huang J B, Ahuja N, et al. Deep laplacian pyramid networks for fast and accurate super-resolution [A]//O’Conner L.2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) [C]. Piscataway: IEEE, 2017:5835-5843.

[14] Liu B, Tang J, Huang H, et al. Deep learning methods for super-resolution reconstruction of turbulent flows [J]. Physics of Fluids, 2020,32(2):25105.

[15] Xie Y, Franz E, Chu M, et al. Tempo GAN: A temporally coherent, volumetric GAN for super-resolution fluid flow [J]. ACM Trans. Graph., 2018,37(4):1-15.

[16] Xu W, Luo W, Wang Y, et al. Data-driven three-dimensional super-resolution imaging of a turbulent jet flame using a generative adversarial network [J]. Applied Optics, 2020,59(19):5729-5736.

[17] Lee J, Lee S, You D. Deep learning approach in multi-scale prediction of turbulent mixing-layer [J]. arXiv: Computational Physics, 2018.doi:10.48550/arXiv.1809.07021.

[18] Lin J, Lensink K, Haber E. Fluid flow mass transport for generative networks [A]//RUSH A, TECH C.ICLR 2020 Conference Blind Submission. [C]. Addis Ababa, Ethiopia: Open Review. net, 2020: 1-10.

[19] 战庆亮,白春锦,葛耀君.基于时程深度学习的复杂流场流动特性表征方法 [J]. 物理学报, 2022,71(22):224701.

Zhan Q L, Bai C J, Ge Y J. Deep learning representation of flow time history for complex flow field [J]. Acta Physica Sinica, 2022,71 (22):224701.

[20] 战庆亮,白春锦,葛耀君.基于时程深度学习的流场特征分析方法 [J]. 力学学报, 2022,54(3):822-828.

Zhan Q L, Bai C J, Ge Y J. Fluid feature analysis based on time history deep learning [J]. Chinese Journal of Theoretical and Applied Mechanics, 2022,54(3):822-828.

[21] 战庆亮,白春锦,张宁,等.基于时程卷积自编码的机翼绕流特征识别方法 [J]. 航空学报, 2022,43(11):526531.

Zhan Q L, Bai C J, Zhang N et al. Feature extraction method of flow around airfoil based on time-history convolutional autoencoder [J]. Acta Aeronautica et Astronautica Sinica, 2022,43(11):526531.

[22] 战庆亮,葛耀君,白春锦.基于深度学习的流场时程特征提取模型研究 [J]. 物理学报, 2022,71(7):074701.

Zhan Q L, Bai C J, Ge Y J. Flow feature extraction models based on deep learning [J]. Acta Physica Sinica, 2022,71(7):074701.

[23] 战庆亮,葛耀君,白春锦.流场特征识别的无量纲时程深度学习方法 [J]. 工程力学, 2023,40(2):17-24.

Zhan Q L, Bai C J, Ge Y J.Deep learning method for flow feature recognition based on dimensionless time history [J]. Engineering Mechanics, 2023,40(2):17-24.

[24] Raissi M, Karniadakis G E. Hidden physics models: Machine learning of nonlinear partial differential equations [J]. Journal of Computational Physics, 2018,357:125-141.

[25] Raissi M, Perdikaris P, Karniadakis G E. Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations [J]. Journal of Computational Physics, 2019,378:686-707.

[26] 战庆亮,刘鑫,白春锦,等.考虑物理方程约束的机器学习流场时程表征方法 [J]. 工程力学, 2023.doi:10.6052/j.issn.1000-4750.2022. 12.1067.

Zhan Q L, Liu X, Bai C J, et al. Physical constrained flow representation model using machine learning for flow time history [J]. Engineering Mechanics [J]. Engineering Mechanics, 2023.doi:10. 6052/j.issn.1000-4750.2022.12.1067.

Accuracy of environmental flows time history reconstruction model based on sparse observation.

ZHAN Qing-liang1*, LIU Xin1, CHAO Yang1, GE Yao-jun2

(1.College of Transportation Engineering, Dalian Maritime University, Dalian 116026, China；2.College of Civil Engineering, Tongji University, Shanghai 200092, China)., 2023,43(12)：6592～6600

Obtaining more environmental flow data at more monitoring sites based on limited and sparse available flow monitoring points can provide data for the study of atmospheric monitoring, water monitoring and pollutant dispersion issues. In this study, the influence of physical constraints on the accuracy of the machine learning flow field time history representation model was investigated, and the results of different available measurement points and physical constraint influence weights were compared. The environmental flow around a low Reynolds number square column was tested as an example. Results show that when the number of monitoring points was increased to 500, the accuracy did not improve. When the number of monitoring points was reduced to only 50, the error was minimised when the physical constraint weights were set to 10. The results indicate that the problem of less available data can be effectively compensated by choosing appropriate physical constraint influence weights. Providing a new method and basis for data processing and high-resolution flow field reconstruction for environmental flow problems.

environmental flow time history；sparse observation data；environmental flow reconstruction；physical constrain；number of monitoring points

X83

1000-6923(2023)12-6592-09

战庆亮,刘鑫,晁阳,等.基于稀疏环境监测点的流动时程重构模型精度研究 [J]. 中国环境科学, 2023,43(12):6592-6600.

Zhan Q L, Liu X, Chao Y, et al. Accuracy of environmental flows time history reconstruction model based on sparse observation [J]. China Environmental Science, 2023,43(12):6592-6600.

2023-04-30

桥梁结构抗风技术交通行业重点实验室(上海)开放课题(KLWRTBMC21-02);大连海事大学博联科研基金资助项目(3132023619);国家自然科学基金资助项目(51978527);辽宁教育厅研究计划项目(LJKZ0052)

* 责任作者, 讲师, zhanqingliang@163.com

战庆亮(1987-),男,辽宁大连人,讲师,博士,主要从事环境流体力学研究.发表论文30余篇.zhanqingliang@163.com.