基于神经网络的场地污染智能模拟和评估技术综述
2023-09-01刘宏舒孙大鹏
朱 华, 陈 倩, 刘宏舒, 孙大鹏, 周 慧, 池 辽, 庞 亮
(1.四川省地质工程勘察院集团有限公司, 四川 成都 610072; 2.四川省天晟源环保股份有限公司,四川 成都 610072; 3.四川省天晟源信息技术有限公司, 四川 成都 610072; 4.鞍钢股份有限公司,辽宁 鞍山 114033; 5.鞍山钢铁集团有限公司, 辽宁 鞍山 114033)
0 引言
随着城市化进程加快以及产业结构调整,冶炼、焦化、化工、油气开采等重点行业场地及周边地区土壤污染物超标率36.3%, 与冶炼化工相关的工业废弃地等场地所在的大面积土壤遭到污染。 由于土壤中的污染物质向地下水中迁移造成地下水污染,并且由于地下水的径流、排泄以及地下水位的波动,地下水中的污染物浸润土壤,造成双重污染,对周边居民食品和饮用水安全、生态环境、经济社会可持续发展带来了巨大危害[1-2]。因此,开展污染场地的污染监测响应、调查评估、风险预测管控和修复是十分急切和有必要的。
场地污染风险预测和管控首先要对待测场地的土壤和地下水的污染状况开展调查, 接着需要采集相应的场地样本,进行初步以及详细采样分析,并从中获得大量的污染数据样本。 通过物联网技术采集的数据的样本数量大、监测项目多,结构复杂包含大量的特征信息和关系信息[3]。那么如何利用这些数据提取有价值的信息并应用于场地污染风险模拟和评估就成了一个极为重要的问题。 目前采取的传统数据分析方法有主成分分析(PCA)、因子分析(FA)、判别分析(DA),层次聚类分析(HCA)等[4-7]。 但由于这些数据分析方法在处理像污染场地数据这种复杂的大数据集时,会有较大局限性,且当数据结构不满足线性条件时,这类数据分析方法结果可能会不准确。近年来人们开始通过提高环境监测的监测精度、优化数据分析方法来提高分析结果的准确性。 SAHU等[8]将纳米材料、电子器件和微流控系统的混合使用,并进一步改进了设计,使现场检测具有更高的灵敏度。 至于数据分析方面,夏文文等[9]利用内梅罗指数法和多元统计分析方法对洪泽湖水质情况水质进行评价分析。
随着计算机科学与技术的快速发展, 神经网络(NN) 因为其拥有较高的准确性和客观性开始活跃于各个科研领域和实际应用中[10-11]。由于神经网络在处理非线性问题时具有较大的优势, 在处理场地污染等大量复杂关系数据时可利用神经网络模拟非线性工程问题来了解输入和输出特征间的关系。 本文将在上述背景下, 着重讨论神经网络在场地污染模拟和评估方面的应用。
1 神经网络发展概述
神经网络是对人脑若干基本特性的一种抽象和模拟的模型,由大量神经元组成,并且可以通过调整各神经元之间的关系来达到处理信息的目的。 它具有良好的容错性与联想记忆功能, 以及较强的自适应与自学习功能。1943 年MCCULLOCH 等[12]将阈值函数作为计算神经元的主要特性, 将逻辑演算作为神经计算架构, 由此提出了神经网络的概念。 近年来,神经网络被广泛应用于各个领域之中。
神经网络一般由输入层、隐含层、输出层等多层节点组成[13-15]。输入特征信息由输入层进入,通过隐含层的计算后进入到输出层, 并且层与层之间通过权重和阈值来调节。整个过程一般先将数据经过预处理,然后将处理后的数据分为训练、验证、测试3 个部分,每个部分均根据需要设定一定的比例, 并初始化阈值和权重, 当训练数据从输入层通过隐含层至输出层之后,计算网络预测值和目标值的误差[16-17]。
随着HINTON 等[18]于2006 年在《Science》上发文,引出深度学习这一新的研究方向,神经网络再次成为各大领域的研究热点。 深度学习浅义上可解释为层数较多的人工神经网络, 实质上是一种对数据资料进行表征学习的算法。 深度学习便强调从结构中连续的层中进行学习数据资料的相关特征, 进而完成学习任务。 卷积神经网络(CNN)等模型则是其中学习效率很高的深度学习模型。传统CNN 结构包括输入层、卷积层、池化层、全连接层和输出层,结构见图1。
图1 卷积神经网络结构
几种应用较广泛的卷积神经网络模型如下。
(1)LeNet-5
LeNet-5 神经网络模型是最早出现的卷积神经网络模型之一, 共有7 层结构, 并且使用多个卷积核, 卷积核权值共享的方式既降低了网络中的连接数, 又使得整个模型更加简洁和利于计算。 通常来说,LeNet-5 被应用于手写字符或者文档的识别。
传统LeNet-5 的效率并不理想, 单通道的网络结构在进行特征提取时, 取得的结果并不完整且收敛速度达不到想要的效果。针对这一问题,YAO 等[19]提出了均匀忆阻器交叉阵列的制造来提网络的性能, 还构建了一个基于五层忆阻器的CNN 来用于MNIST 图像识别, 该CNN 系统比最先进的图形处理单元能够高出2 个数量级以上, 且拥有更强的拓展性。
(2)VGG-5
VGG 模型主要是使用很小的卷积核(3×3)构建各种深度的卷积神经网络结构, 并对这些网络结构进行了评估,最终证明16~19 层的网络深度,能够取得较好的识别精度。VGG 整个网络由卷积层和全连接层叠加而成,和AlexNet 不同的是,VGG 中使用的都是小尺寸的卷积核。VGG 模型虽然具有更简单的结构, 但GPU 数少的情况下可能会需要训练很久,以及其由于权重过多导致文件体积过大。
(3)GoogleNet
GoogLeNet 拥有网络小、参数较少,性能相对优越等优势,GoogLeNet 使用的是Inception 网络结构,通常要提升CNN 的性能, 一般会选择增大网络,但这种方式会导致过拟合的概率增加且计算量会变大, 而GoogleNet 引入的Inception 模块则可避免这些问题, 既可以维持网络稀疏性又可以减少参数保证高计算性能,同时还能提升网络的宽度和深度。
(4)DenseNet
密集卷积网络(DenseNet)的特点在于密集卷积块, 不同密集卷积块则用卷积层和池化层连接,该稠密连接方式由于采取的不是特征相加而是特征拼接,加强了特征和梯度的传递,采用全局平均池化层来降低参数, 最终再用线性分类器来进行分类。 在密集卷积块中,当前层之前的所有层的输出都会参与到该层的输入, 通过该方法可以有效的利用之前层的所有信息, 同时缩短了前层和后层之间的连接, 有效地解决了随着网络的加深而产生的梯度消失问题。
主流的几种经典卷积网络模型的优、 缺点对比结果见表1。
表1 各类卷积网络模型对比
2 场地污染结合神经网络的应用现状
通常情况下, 场地是否受到污染需要根据污染评估来判定,但通过传统方法成本较高,且拥有一定的滞后性。 近年来,在环境污染评估和预测领域,相关专家和学者开始把神经网络中的各种模型投入到环境评估和预测的实际应用中, 相较于传统的方法有了更强的准确性和时效性。 下面将从以下几个角度分别综述神经网络在场地污染领域中的发展现状和趋势。
2.1 土壤质量评价
土壤质量评价是改善土壤生态环境质量、 完善管理体系、保持土壤生产力可持续发展的有效途径。SHAO 等[20]提出了基于BP 神经网络的土壤质量综合评价SHM-BP 模型,将土壤样品中的重金属浓度输入经训练和验证的SHM-BP 模型,得到土壤样本的分类结果,该模型的准确率超过97%。 KEBONYE等[21]将自组织映射神经网络(SeOM-ANNs)与条件高斯模拟相结合来识别漫滩土壤中的潜在有毒元素(PTE)热点。 利用其将包含PTE 和土壤要素的158个土壤样本进行可视化分类, 对其用k-means 进一步分类,该聚类产生了总共5 个聚类。随后结合CGS来可视化研究区域的PTE 浓度,最终对研究区域的土壤质量进行评价。
神经网络在土壤质量评价方面取得了较好的效果,相较于传统的评价手段时间更短,准确率更高,可以有效的促进土地的评估和监测。
2.2 土壤重金属含量预测
由于各种工业活动产生的废气、 废液和废渣排放及泄漏导致大量重金属进入土壤环境, 造成土壤污染,并且重金属具有性质稳定、难降解和毒性强的特点,容易被土壤吸附并不断累积,进而威胁人类健康[22]。 土壤中重金属含量与土壤污染的控制直接相关, 但由于人力物力的限制, 很难对其进行详细检测, 因此通常需要根据现有数据预测未知区域的土壤重金属含量, 所以近年来各种神经网络模型被用于解决该类问题。
郭飞等[23]首先用主成分分析法提取高光谱数据中的主成分作为特征变量,然后选择ANN 模型以及其他三个模型构建经筛选过后的特征变量和Cd 含量的关系,接着再用决定系数、均方根误差和RPD评价模型的拟合精度。结果表明,该神经网络模型取得了较好的拟合效果。 同样利用高光谱遥感结合神经网络模型的还有王雪梅等[24],以不同变换处理下的特征波段反射率作为自变量, 土壤铬含量为因变量,采用多元线性逐步回归、偏最小二乘回归、BP 神经网络和随机森林回归方法构建土壤重金属铬含量的高光谱估测模型, 并对最优估测结果进行克里格空间插值。 在该研究中,通过与其余模型进行对比,经处理后的BP 神经网络模型估测精度和稳定性高于其他模型, 可作为研究区土壤重金属铬含量的最优估测模型。
任加国等[25]将研究区域选择在某金属加工厂中受到污染侵蚀的场地, 运用多元统计方法分析土壤样品中重金属和多环芳烃之间的关联性, 并以此为基础,利用已知数据样本训练BP 神经网络模型,预测缺失土壤样本中重金属和PAHs 的含量。 结果显示, 区域的土壤重金属和PAHs 含量有一定的超标现象, 该研究建立的BP 神经网络模型对污染物浓度预测结果获得较为理想的数值, 再次证明了BP神经网络对土壤中重金属含量预测效果较好。
在土壤重金属含量预测方面, 神经网络模型依旧表现出了较好的效果, 拥有较强的稳定性和预测精度。不足之处在于对于训练数据集的要求较高。综合上述文献, 整理相应的改进神经网络模型对土壤重金属含量估测结果见表2。
表2 文献中模型估测结果
2.3 地下水污染评价
地下水系统作为一个开放系统, 与外界因素有着密切而复杂的关系,特别是在污染迁移过程中,土壤中的污染物质向地下水中迁移,造成地下水污染。并且由于地下水的径流、排泄以及地下水位的波动,污染物质又反过来浸润土壤。因此,地下水污染风险评价是一个复杂的问题, 同时地下水污染风险模拟是防治地下水污染的重要手段。 开展地下水污染评价, 不仅可以全面探讨地下水污染与人类社会实践的关系,还可以及时确定地下水污染的重点区域,能够为地下水资源的管理和保护提供科学依据[26]。
在地下水污染评价这方面,袁瑞强等[27]采用综合指数法、主成分分析(PCA)法和BP 神经网络法对地下水雨、旱季水质进行了综合评价,结果表明,BP神经网络法适合整体水质评价, 评价结果最合理。GAD 等[28]在多元分析、人工神经网络模型和地理信息系统技术的支持下,使用指数化方法(如饮用水质量指数(DWQI)和健康指数(HI)),对El Kharga 绿洲努比亚砂岩含水层(SSA)的地下水质量进行了评估。结果显示,ANN-SC-13 是最准确的评估模型,因为它显示了其特性与DWQI 之间最强的相关性,该模型的13 个特征对于评估DWQI 非常重要。
2.4 地下水污染溯源和迁移模拟
地下水污染对饮用水安全和生态环境构成威胁。由于地下水污染的隐蔽性和复杂性,地下水修复方案的设计、风险评估和污染责任识别非常困难。因此, 研究地下水污染源的反演识别和地下水污染的扩散预测具有重要意义。 同样有很多学者利用神经网络模型进行了地下水污染的溯源和模拟。
PAN 等[29]以抚顺市某煤矸石堆放场为研究区,根据研究区的实际条件建立地下水污染质运移模拟模型,模拟地下水污染质未来时空变化特征,对地下水污染源源强及场地的渗透系数进行反演识别。 研究表明, 应用BP 神经网络方法建立替代模型的输出结果平均相对误差为1.5%, 利用BP 神经网络模型对污染源源强和渗透系数进行同步识别精度可以满足实际需求。
ALKINDI 等[30]使用贝叶斯方法(如贝叶斯广义线性模型(BGLM)和贝叶斯岭回归(BRR))来模拟地下水硝酸盐污染,用11 个地下水硝酸盐调节因子来作为模型的输入参数。结果表明,该研究的地下水硝酸盐模型比其他模型更有效, 并且钾在模型中的重要性最高,其次是降雨量、海拔、地下水深度和距居民区的距离。 该研究结果可为控制和减少硝酸盐污染源提供决策支持。
3 结论
近年来, 神经网络结合环境污染模拟和评估进行数据分析的研究成为热点, 神经网络模型在土壤质量评价、土壤重金属含量预测、地下水污染评价、地下水污染源溯源和扩散模拟等多领域中展示出超强的数据挖掘和分析能力, 能够在保证数据精度的同时,减少相应的实验成本,并且拥有较为理想的模拟精度和污染评估效果。 本文首先对神经网络原理和应用较为广泛的几个模型进行了介绍, 然后着重从各应用方面对神经网络在场地污染的模拟和评估领域的相关改进模型的应用进行了介绍。 神经网络在场地污染领域或者更大环境污染的模拟和评估领域还有巨大的开发和应用空间, 目前可以总结为以下几个方面:
(1)在使用神经网络模型对地下水污染进行反演识别时,随着变量灵敏度的增加,精确度也随之受到影响而增加。 并且观测井的位置对地下水反演识别的精度也有一定的影响, 在以后的反演识别研究应重点关注位置对于检测精度的影响。
(2)目前各文献均显示神经网络模型在场地污染领域取得了较好的效果, 但是如果模型受到外界环境因素干扰的话, 或者获取的污染样本不太理想的话,均会导致模型精度不高。 因此,用相关模型去处理实际的应用问题还存在一定的差距, 即神经网络泛化能力还有所欠缺, 今后可从该方面展开相关研究。
(3)目前改进神经网络模型的角度均着眼于拓展模型深度和宽度, 但如果局限于具体的污染评估需求时,则不能取得理想的效果,未来的研究方向可以针对污染物的特征做区分的模块化结构, 构建更加符合实际需求的模型。