基于AI技术的危化气体泄露扩散时空演化*
2022-08-25黎泉关蔚蔚李珍宝
黎泉 关蔚蔚 李珍宝
1. 兰州工业学院 甘肃 兰州 730050;
2. 兰州天泉信息科技有限公司 甘肃 兰州 730030;
3. 兰州理工大学 甘肃 兰州 730050
引言
危化有害气体的排放和泄漏对空气质量和公共健康构成严重威胁。例如,博帕尔的甲基异氰酸酯泄漏事故(1984年)造成上万人死亡[1]。与此同时,工业区释放的空气污染物也对附近居民的生活产生了不利影响。因此近年来,气化工厂爆炸事故、森林火灾等引起的有毒气体泄漏,已在各国频繁发生,严重影响人民的生命、健康和财产安全。2019年,我国盐城发生化工厂爆炸以及四川发生森林火灾,都造成了大面积的泄漏和扩散,这不仅危害了人们的健康,也极大地阻碍了救援工作。因此,预测有毒气体扩散规律以及提高灾害应对能力具有十分重要的意义。
1 传统危化有害气体的扩散预测
大气扩散(ADS)模型被广泛应用于预测气体在空气中的传输和扩散。已有许多有效的预测气体扩散的模型。常规ADS模型可大致分为3种主要类型:高斯模型、拉格朗日随机(LS)模型和计算流体动力学(CFD)模型。高斯模型是大气扩散预测中应用最广泛的模型。该模型只需要几个输入参数,使用简单的表达式且计算速度快。然而,高斯模型建立在几乎不考虑地形条件的理想的色散环境上,因此,在某些复杂的环境条件下(例如具有复杂地形的城市区域),该模型不够精确。LS模型采用随机方法,将气体输送描述为一个含有多个颗粒的马尔可夫过程。CFD模型可以灵活地表示复杂的几何形状,并且在城市有建筑物地形的气体扩散计算中保持较高的精度[2],因此被广泛用于各种各样的城市地形中有毒气体扩散的预测。然而,计算流体动力学有一个很大的缺点,它需要太长的时间来执行必要的计算,有时甚至超过几个小时。当突然发生事故时,利用CFD模型难以及时有效地指导救援工作,因此应急响应能力较差。
2 基于人工智能的危化有害气体扩散预测
综合上述问题,许多研究人员将机器学习(ML)模型引入到大气扩散预测中,如人工神经网络(ANN)和支持向量回归(SVR)。ML模型通常具有很好的预测输入和输出之间复杂关系的能力。这些模型通过一些预先确定的分散场景进行训练,对于这些场景,往往能够获得相对较高的预测精度。此外,经过训练的ANN或SVR预测模型的计算速度相对较快。在各种类型的人工神经网络中,反向传播(BP)网络被最广泛地用于预测大气扩散。与其他人工神经网络(如径向基函数(RBF)网络)相比,BP网络需要确定的超参数较少。因此,BP网络相对容易建立和训练。
然而,上述研究中的大多数ML模型都是直接基于一些原始监测参数的输入构建的。有了这些输入,ML模型通常会产生可接受的预测结果。然而,这种输入参数的选择可能会增加模型训练的难度,从而降低预测精度,因为原始监测参数与输出(浓度)之间的关系通常非常复杂。因此,尽管在上述研究中成功地测试了这些ML模型,但通过更有效的输入选择,可以进一步改进它们。此外,现有的研究通常集中在一个特定的ML模型上,而不是在气体扩散预测中比较不同的ML模型,并在模型选择上提供一些指导。事实上,不同的ML模型在性能上有很大差异,例如在拟合和泛化能力上。此外,通过预先确定的场景进行训练并通过特定案例进行测试,ML模型的性能在很大程度上取决于训练集和测试集。因此,需要分析训练集和测试集的大小对预测性能的影响,这一分析也有助于揭示ML模型在拟合和泛化能力上的差异。
在人工智能和数据科学学科的推动下,研究人员提出了基于历史样本(如神经网络和机器学习)的建模方法来发现预测的输入输出之间的复杂关系。其中一个新方法是气体探测器、人工神经网络(ANN)和PHAST模型的集成模型。在该方法中只要对模型进行预先训练,模型参数就可以直接用于瓦斯浓度的预测。
虽然上述研究中的神经网络模型在气体扩散预测方面表现出了突出的能力,但仍存在一些不足之处,如对高浓度点的预测不准确、浓度值为负值等。近年来,在深度学习的热潮下,许多学者开始研究基于深度学习的预测模型,发现这些模型能够更好地描述数据特征之间的关系,在预测和分类方面具有更大的优势。
3 基于人工智能的危化有害气体扩散预测模型
3.1 基于反向传播网络的预测模型
人工神经网络是色散预测中应用最广泛的ML模型。由于其良好的拟合能力,人工神经网络能够逼近复杂的非线性函数。在计算效率方面,经过训练的人工神经网络可以快速计算预测。本文建立了反向传播拟合网络来预测特征点的浓度。这种类型的网络在色散预测研究中非常流行[3]。为了获得更高的预测精度,这里应用了两个隐藏层。网络的输入通常是与大气扩散有关的参数。这些参数通常包括气象参数、与关注点相关的参数和源项。应仔细选择这些输入,以获得更好的性能。至于激活单元,所有隐藏层的激活函数都是“传递函数”,以提高收敛速度和求解精度。“传递函数”是一种S形函数,其表达式为:,相比之下,输出层(只有一个神经元)的激活功能是用以输出浓度的连续值的“线性传递函数”。
3.2 基于支持向量回归的预测模型
支持向量回归(SVR)是为解决回归问题而开发的支持向量机(SVM)的扩展。SVR的思想基于高维特征空间中的线性回归函数,输入数据通过核函数映射。此外,SVR并没有最小化训练误差,而是试图最小化泛化误差,从而获得更好的泛化效果。给定一组训练点,其中是一个输入,而zi∈R1是目标输出,SVR的标准式可表示为:
3.3 基于长-短期记忆网络的预测模型
长-短期记忆网络(LSTM)是一种特殊类型的递归神经网络(RNN)。传统的人工神经网络(ANN)层与层之间是完全连接的,层内部没有连接,而RNN的隐藏层之间是连接的。ANN和RNN的结构对比如图1所示。人工神经网络的输出是相互独立的,RNN的输出不仅受当前输入特征的影响,而且还受前一时刻输出的影响,因此RNN具有更好的时间序列性能。
图1 基于LSTM的预测模型
3.4 实验结果对比分析
本文以BP模型、RNN模型与LSTM模型的预测值与实验结果真实值进行对比,接入如图2所示。其中,红色线条为预测值,黑色线条为实验结果真实值。从图2结果中可以看出:相对于BP模型和RNN模型,LSTM模型的预测结果更加接近实验真实值。
图2 不同模型的预测值与实验结果真实值对比结果
4 结束语
本文比较分析了用于危化有毒气体扩散的主要预测模型。尤其对基于人工智能的气体扩散预测模型进行了分析:首先建立原始输入参数;然后为了提高预测精度,由原始监测参数形成积分高斯参数,并将其作为人工智能预测模型的输入,使用典型的现场数据集对两个不同输入的预测模型进行了分析;最后还定性分析了训练集规模对预测模型精确度的影响。