核化危害源项反演技术现状及研究展望
2021-04-25韩朝帅诸雪征蒋金利
韩朝帅,诸雪征,顾 进,蒋金利,吴 杰,周 蔷
(1. 陆军防化学院 指挥系,北京 102205;2. 军事科学院 防化研究院,北京 102205)
随着国际形势和世界格局的发展演变,我国主要战略方向面临的战场核化安全形势变得更加严峻。战争中遭受核化武器袭击的现实威胁依然存在,使用常规武器精确打击我核化设施造成“类核化战争效应”也难以避免,核化危害扩散、泄漏、污染、杀伤的可能性极大存在,作战部队在遂行跨域机动、兵力投送、战线推进、攻防战斗等作战行动中,核化威胁也必将始终贯穿全程。
源项是指释放物质的种类、数量和位置等信息,其复杂性和不确定性是导致核化危害难以预测的重要原因[1]。源项反演是指通过对各种不同来源、不同误差信息、不同时空分辨率的观测资料进行逆向反推,进而确定危害源项信息的过程。源项反演技术作为核化危害扩散预测的反问题,是国家核生化安全和国防安全领域的重要基础性课题,对有效缓解和遏制危害源、精准预测危害物的时空传输和扩散情况、精确化提供防化保障辅助决策意义重大。
本文立足核化危害源项反演技术,从应用平台和关键算法两个方面,对国内外核化危害源项反演技术的现状进行了综述,并分析了该领域国内外研究的差距及下一步研究的重点。
1 国外核化危害源项反演研究现状
1.1 应用平台
20世纪90年代至今,随着相关基础学科的发展,反演技术与微气象场数值分析、复杂地形污染物扩散模拟、虚拟环境仿真等不断融合完善,美国、英国、荷兰、瑞典等多个国家都先后建立了包含泄漏源项模型、风场模型和扩散模型的综合应急反应系统,有多种评估软件系统(如表1所示)在国际上得到了广泛的商业推广应用,具备成熟的产业化程度,其中最具代表性的有HGSYSTEM系统、NARAC系统和TRACE系统等。
美国能源部(DOE)资助开发的HGSYSTEM系统[2]主要包括热力学模型、逸出模型、烟羽喷流模型、重气扩散模型、远距离扩散模型等多个模型,可评估气体、液体的扩散或包括多元混合物的两相释放,用于气体逸出扩散、闪蒸扩散、蒸发池扩散、重气扩散、纯扩散及伴有化学反应的UF6气体扩散。美国国家大气释放咨询中心(LLNL)研制的NARAC系统[3]能够模拟复杂的流场、详尽的颗粒扩散、多种空间尺度上的干湿沉降过程,包括局部及地区级气象预测、扩散模型和核爆沉降模型,可模拟分析复杂环境下的核化危害泄漏和释放。TRACE系统[4]可以处理多种类型化学危害颗粒及液滴的释放、转移和扩散,包括瞬时、连续、瞬变流、地水平面、抬升释放以及低或高动量射流等。
另外,英国的NAME系统[5]通过跟踪流体粒子的三维轨迹并采用蒙特卡罗方法计算空气浓度,模拟污染物中长期的传递和沉积,可以对瞬时或连续时间空气浓度进行反演和预测,包括放射性同位素的浓度、沉积量及剂量率。荷兰应用科学研究院(TNO)开发的决策支持系统GASMAL[6]将计算速度、图形显示以及数据库信息结合在一起,增强了对于化学事故应急处置至关重要的快速决策,以确保应急反应的时效性。
表1 国外核化危害应急反应系统
1.2 关键算法
1.2.1 基于欧拉方法的源项估计
大多数源项反演算法都采用欧拉方法,通过求得差异函数最小化来获得源项信息,如最优插值法、遗传算法、卡尔曼滤波法、集合卡尔曼滤波法、变分同化法等[7-11](如图1所示)。
在算法原理上,欧拉方法通常要么依赖于选择试验解的统计方法,要么应用伴随模型从观察时间向后计算到释放时间,两种方法都可能包括迭代优化求解[12-14]。在贝叶斯公式和卡尔曼滤波中,随机抽样用于生成源信息,然后将其用作同化模型的输入[15-17]。随后的浓度输出和浓度观测之间的差异可用于确定这些初始估计的可能性,所有似然估计计算产生源信息的概率密度函数都可用于优化程序,以获得源位置的迭代改进估计[18-21]。美国犹他大学机械工程系自动机器控制实验室的BOURNE等[22]提出了一种基于非参数贝叶斯公式的羽流源项估计和源搜索运动规划算法,在传统算法的基础上,将生物启发算法、多机器人算法、状态概率算法以及基于地图的算法等综合集成,利用多个机器人之间的协调和羽流估计模型来实现更快、更稳健的污染源位置确定和源强估计,已在装有气体浓度传感器的移动机器人设计中使用。
在伴随模型的基础上,变分同化法逐渐应用到源项反演中,并在研究过程中开展了大量实验和应用。最具代表性的是以BOCQUET为首的研究团队[23],该团队陆续用数值模拟实验、风洞实验与欧洲大气扩散实验的数据证实了变分数据同化在核事故源项反演问题上的有效性,之后又对切尔诺贝利与福岛核事故的释放源项进行了估计与研究。ZEMPILA等[24-25]曾将四维变分法应用于常规污染物源解析研究中,并在福岛核事故后发表了基于变分同化的源项反演结果,利用堆芯积存量、有限压力与温度数据、观测到的爆炸与排烟时刻以及剂量率监测数据,对释放源项进行了详细的时序预估,并将其作为变分源项反演的背景场。但该背景场对放射性物质的释放有所高估,从而成为最终释放总量估计结果偏高的重要原因之一。
此外,还有其他欧拉方法不需要伴随模型或贝叶斯公式,如模拟退火算法、洗牌复形算法等[26-27]。这些方法通过迭代调整源信息驱动的同化预测,从分散模型直接获得源信息,以匹配观测到的危害浓度值,进而求出最优的源项信息。
图1 基于欧拉方法的源项反演算法
1.2.2 基于拉格朗日方法的源项估计
源项反演算法的第二大类是拉格朗日方法,但并未像欧拉方法那样被广泛研究应用。拉格朗日方法属于实体回溯的范畴,即将实体的状态回溯到其原始状态,这种方法类似于目标跟踪问题[24]。传统的拉格朗日回溯法是通过单个流体包裹时间分析实现来源的回溯[25,28-29],该方法对风场和污染物浓度数据的要求往往过高,无法用于源项估计问题。此外,反向流必须收敛,以便准确地将流体追踪回其来源,或者流体必须能在时间上演化,以便多个轨迹在源位置交叉[30]。
在传统拉格朗日包裹回溯法基础上,一些学者从多源反演、多尺度反演角度对其进行了扩展改进,提出了拉格朗日实体回溯、拉格朗日粒子模型等方法。美国宾夕法尼亚州立大学的ALLEN等[31-34]在污染物传输和扩散领域开展了一系列研究,针对不确定污染源数量及释放重叠复杂问题,融入湍流和实体扩散对多源浓度场的影响作用,提出一种基于拉格朗日状态估计的多实体场近似确定方法(MEFA),实现多种瞬时释放或持续释放污染源的位置定位。其不足之处是并未考虑建筑物、地形等复杂下垫面对污染物扩散的影响。
希腊的STOHL等[35]采用RODOS软件中的拉格朗日粒子模型,基于数值模拟实验与场地示踪实验数据进行源项反演研究,初步实现了利用剂量率数据对核事故释放源项的反演。其后,为了强化RODOS对核事故后果的预测与评价能力,又开展了基于卡尔曼滤波法的“场外核事故应急数据同化”项目[36]。可惜的是,由于实际核事故情况过于复杂,实验结果与实际相差较大,因而没有一直进行下去[37]。BADY等[38]根据计算流体动力学基本原理进行拉格朗日粒子模型逆建模,旨在利用直接反演技术确定城市空气污染源位置。
1.2.3 基于深度学习的源项估计
深度学习的提出给源项反演提供了新的思路,该方法不需要对源项和观测值之间的数学关系进行探究,只需对足够多的训练数据进行学习,即可高速快捷地进行预测和反演,深度学习组织映射关系如图2所示,图中X1,X2……Xd表示输入的观测数据,m1表示数据的处理过程,m2表示反演得到的源项信息)。BOUGOUDIS等[39]提出了一种基于混合机器学习的三重智能集成系统(HISYCOL),该系统通过集群数据集和无监督机器学习,实现了数据向量的聚类跟踪和隐藏知识挖掘,在处理高污染物浓度下的相关性分析、源项反演中效果显著。荷兰特温特大学的DETERS等[40]针对城市颗粒物污染扩散问题,提出了一种基于6 a气象和PM2.5污染数据的机器学习反演方法,通过测试分析表明,强风或强降水下,该方法反演精度要好于稳定气象下的反演精度,原因在于稳定气象下,PM2.5污染扩散受下垫面的影响远大于极端环境下。法国索邦大学的BRAJARD等[41]针对观测数据中噪声影响较大、污染预测模型精度不高的问题,提出了一种基于卡尔曼滤波和神经网络相结合的混合数据同化方法,并通过洛伦兹-96模型进行数值实验分析。实验对比发现,相较卡尔曼滤波法,混合方法不仅在计算时间上缩短了两倍,且随着观测噪声的增加,能够保证反演和预测精度的平稳下降。
图2 深度学习组织映射关系示例
2 国内核化危害源项反演研究现状
2.1 应用平台
国内对核化危害源项反演的研究始于20世纪90年代,目前仍处于中试阶段,尚未达到产业化应用程度。原化工部劳动保护研究所对工业有毒物质的事故性泄漏进行了研究总结,建立了事故性泄漏模式及泄漏源反演模型[42]。北京城市危险源控制技术研究中心自1997年成立以来,一直将危害物质泄漏仿真技术研究作为其主攻方向之一,不断进行泄漏扩散、反演和风洞模拟实验研究,先后完成了“重要有毒物质泄漏扩散模型及监控技术研究”和“毒物泄漏源项反演模型研究”等课题[43]。中国辐射防护研究院的胡二邦等[44-47]先后完成秦山、连云港、福建惠安等核电厂事故应急实时评价系统的研制,组织开展了大量的SF6示踪实验和分析,源项反演作为其中的核心技术组成,可在获取传感器数据后对源项进行估计,为核电厂环境评价和应急处置提供了科学依据。公安部消防局组织研发了化学灾害事故处置辅助决策系统,很多企业、工业园区和政府部门也对危险化学品的生产、使用、储运开发了针对性较强的危险化学品泄漏点反演、扩散及应急救援系统[48-50]。军队研制开发了基于RODOS平台的核应急行动与决策平台[51]、突发核生化事件危害预测与评估软件系统[52-53],源项反演作为其中的核心功能模块,能够较快地实现污染源位置和强度的估计。
2.2 关键算法
在核化危害源项反演算法方面,国内相对国外起步较晚,但随着交叉学科和环境工程领域的快速发展,在扩散模式、数据同化、正则化等方面开展了大量研究,形成了一系列研究成果。
2.2.1 基于欧拉方法的源项估计
山东理工大学的李功胜等[54]在《扩散模型的源项反演及其应用》一书中对不同边界条件下扩散模型的连续源项及源项系数反问题进行了系统研究,从反演的存在性、唯一性、稳定性等角度,提出了基于不动点法、变分伴随、改进吉洪诺夫正则化的最佳摄动量算法,并结合具体案例对数据获取、模型构建、参数反演、问题解决等进行了实例分析。
西北核技术研究所的唐秀欢等[55]将集合卡尔曼滤波和高斯多烟囱扩散相结合,构建了非线性源项释放量的计算流程,并通过模拟仿真对集合成员数、初始值和扰动值进行了优化,分析了这些参数对反演结果的影响,验证了方法的可行性,但该文并未将优化后的模型应用到实验或实际数据反演中,准确性和稳定性有待验证。
清华大学的刘蕴等[56]引入四维变分代价函数梯度,从时间序列角度对地面和烟囱两种释放源项进行定量估计,并通过风洞实验和RIMPUFF系统数值模拟进行对比,对水平扩散参数和垂直扩散参数变化曲线进行偏差分析,验证方法的准确性和收敛性,具有一定的借鉴意义,但该文对伴随模式和切线性算子的计算缺少依据,在风场构建、扩散模型适用性及通过风洞实验改进算法精度上有待进一步加强。2019年,他们采用截断总体最小二乘变分法对扩散预测算子与观测值的误差进行了正则化修正,降低了反演算法的误差,较基本的四维变分算法准确性有所提高[57]。
哈尔滨工业大学的杨浩等[58]构建了基于贝叶斯方法的源项反演算法,该算法采用时间序列法和马氏链蒙特卡罗后验法对各点位的污染物浓度数据进行采集,通过经验知识和监测数据实现了反演参数、污染物浓度分布的概率表征,并结合实验数据得到了贝叶斯溯源中关键参数的推荐值。该方法对先验知识和历史数据要求较高,战场或应急环境下很难获取足够的经验数据,故基于贝叶斯方法的源项反演不适于核化环境下的污染源反演。
北京工业大学的沈泽亚等[59]以高斯扩散模型和误差平方作为反算模型和优化函数,以美国1956年在内布拉斯加州中北部奥尼尔镇开展的SO2外场实验为例,分别采用粒子群-单纯形、遗传-单纯形、遗传-粒子群3种混合算法对稳定、中性和不稳定气象条件下的扩散模拟、源强位置反算进行验证,评判3种算法在反算结果、反算时间、优化机理等方面的准确性、稳定性和时效性,得出不同算法在不同场景不同需求下的适用性,但在扩散系数的确定上描述模糊,有待进一步验证。此外,徐向军等[60]、宁莎莎[61]、章颖等[62]分别采用遗传算法、混合遗传算法、遗传模拟退火算法对核辐射源项参数进行了反演寻优。
2.2.2 基于拉格朗日方法的源项估计
同济大学的郑茂辉等[63]运用地理信息系统与计算流体动力学(CFD)的相关原理和方法,建立了一个街区尺度毒气扩散过程的高分辨率模拟框架模型,探讨了街区尺度下的下垫面建模、流动参数的表达和毒气扩散过程模拟等相关技术,并利用地理信息技术、CFD模拟技术和可视化技术对重质毒气在建筑扰动下的扩散过程与源项反演进行了模拟。
清华大学的赵全来等[64]针对“预测-应对”模式难以高时效提供准确预判、不适于非常规突发事件的现状,并考虑当前参数估计法存在的不足和困难,提出了“情景-应对”式重大核突发事故源项反演方法,通过构建简单风场下和复杂风场下的源项情景库,以情景比对的方式实现事故源项的快速反演,具有重要的现实意义。
陆军防化学院的GU等[65]针对战场化学危害溯源需求,从定性和定量两个维度对战场化学危害源项反演的信源数据、影响因素、基础模型、优化算法进行了系统研究,并采用数值仿真和示踪实验的方式进行了对比验证。结果表明:在连续和瞬时释放模式下源强误差均在3%以内,并且对监测值进行25%的误差扩大后源强误差依然维持在5%以内,具有较好的稳定性;同时证明了信源数量和分布情况对反演结果的影响,即信源数量越多、越靠近风向中心线,反演精度就越高。
西北核技术研究院的田自宁等[66]针对γ谱仪无法给出辐射源大概位置和源边界信息的问题,提出了一种基于虚拟源的体源模拟方法,该方法将放射体源分解成衰减层-放射层-衰减层-干扰层4层理论模型,采用虚拟点源来模拟放射层,并通过蒙特卡洛法和最小二乘法求取误差最小值。目前该方法已应用到均匀分布的核素识别中,对分析污染区域的深度和分布以及反解核弹头惰层厚度等具有重要意义。
2.2.3 基于深度学习的源项估计
国内关于深度学习在源项估计中的应用研究仍处于基础研究阶段。南京航空航天大学的凌永生等[67]将反演过程作为黑盒子考虑,以InterRAS软件系统对福岛核事故部分数据预测生成的8 352组实验数据为训练数据和测试数据,采用Matlab软件神经网络工具箱中的Newff函数、Sim函数、Traingdm函数和Trainlm函数进行学习训练,通过对训练时间、均方误差、训练误差等指标进行权衡分析,得到适用于简单非线性核事故源项反演的最优隐含节点数、训练函数及反向传播(BP)隐含层。2016年,该团队进一步深化了BP神经网络,将其应用到多核素源项反演中,构建了基于动量BP的I-131、Cs-137、Xe-133、Kr-85等4种核素的反演模型,用201 600组数据进行了学习训练和反演测试,结果表明,机器学习对数据比较分散的核素反演结果误差较小,对数据相对集中的核素反演误差较大,训练数据的选取对反演结果影响较大[68]。该项研究的不足是仅对单、双、三层隐含层结构进行对比实验分析,而对多隐含层、多核素的复杂非线性问题和深度神经网络的学习缺少研究。
此外,屈坤等[69]和朱晏民等[70]分别将人工神经网络(ANNs)和R语言神经网络应用到大气污染预测中,构建了基于深度学习的统计预测方法体系和反演模型,但缺少具体的训练和测试实验。
3 国内外差距及发展重点分析
综上可知,无论是国内还是国外,核化危害源项反演的研究都己颇具规模。从应用平台角度分析,美国、英国、荷兰等一些国家都开发了相对成熟的反演和扩散预测平台,我国现有平台基本仍以国外模式为基础进行二次开发。从反演算法角度分析,不管是欧拉原理、拉格朗日原理,还是深度学习,各个方法都逐渐呈现集成融合的态势。
3.1 国内外差距分析
3.1.1 反演精度和稳定性有待提高
造成反演误差的原因主要有3个:初值误差、扩散模式误差和同化算法误差。从降低反演误差、提高精度的角度对比,国外的HGSYSTEM,NARAC,SAFER等成熟产品,在实际应用得到了检验和完善,国内目前只有一些用于科研的原理样机,测试数据的来源和数量过于单薄,反演误差的可信性和稳定性都有待进一步提升。
3.1.2 战时核化危害研究和应用较少
国外不仅在民用、非战领域开展了大量研究,在战时核化危害预测和反演方面也进行了很多实验和应用。与此相比,国内虽然开展了很多研究和实践,但是更多的是非战和民用领域,对于源项反演技术在战场环境下的运用以及在核化袭击过程中如何快速溯源的研究较少,没有形成涵盖不同任务背景的核化危害源项反演技术的研究体系。
3.1.3 基础实验和样本数据严重匮乏
经过长期的研究探索,国外在核化危害预测和反演领域开展了大量的外场实验,为其开展新的方法、技术和产品研究提供了丰富的数据资源。相比而言,受《禁止核武器条约》和《禁止化学武器公约》约束,我国在核化防护研究中严重缺乏外场实验数据支撑,数据资源主要来自于风洞实验、示踪剂实验和国外公开实验数据,导致产品在真实环境下的稳定性和精确性大幅下降。
3.2 下一步发展重点
3.2.1 利用深度学习提高反演精度和速率将成为新的研究热点
相比传统反演方法,深度学习对提高核化危害反演精度和速率的优势十分明显,为源项反演带来了新的研究思路。但是,深度学习对训练样本和计算性能要求较高,在复杂反演样本的学习上难度较大,基本仍处于初级研究阶段[71]。基于深度学习与四维变分、集合卡尔曼滤波相结合的反演算法,必然会成为解决复杂环境核化危害反演问题的重要手段。
3.2.2 从单污染源到多污染源的拓展将成为新的研究重点
由该领域的研究现状可知,国内外相关学者主要聚焦于单点源连续或瞬时释放反演,在多污染源源项反演方面研究很少,美国个别研究机构开展了实验研究,国内仍处于数学推导阶段。然而,实战环境下,不可能存在单点源污染情况,多污染源连续、瞬时乃至混合释放的反演研究对于危害预测与防护决策的意义更为重大。因此,开展多污染源的源项反演将是下一步实战化应用的研究重点。
3.2.3 定性与定量混合反演将成为技术落地的研究难点
当前我军战场环境下各类防化侦察监测装备获取的信息种类多样且格式不一,监测到的数据多是基于灵敏度报警的定性化数据,量化监测数据的采集和获取手段相对较少,同时战场上污染物种类、危害源强、袭击方式、气象场等信息的获取有很多不确定性,反演结果的误差很难保证。因此,提出适用于战场环境的定性和定量混合反演技术,是亟待研究解决的难点。
另外,监测设备的科学布设对降低冗余干扰、提高反演精度意义重大,但是可借鉴的研究相对较少,急需开展基于单位强度不同位置的单源和多源实验[72]、基于单位间隔移动的单源和多源组合型综合实验[73]等基础性工作,通过源-受体之间约束特征的分析与识别来实现布设点的优化。该研究方向也是需要加强攻克的关键基础环节。
4 结语
本文从源项反演应用平台和源项反演关键算法(包括欧拉方法、拉格朗日方法、深度学习等)两个方面,对国内外核化危害源项反演技术的现状和二者间的差距进行了总结与分析。对比发现,目前国内主要存在反演精度和稳定性有待提高、战时核化危害研究和应用较少、基础实验和样本数据严重匮乏等3个方面的不足,下一步应重点从利用深度学习提高反演精度和速率、从单污染源到多污染源的拓展、定性与定量混合反演3个方面加强基础性研究工作。