核事故应急大气扩散模型ARTM验证与评价
2021-01-11宁莎莎李璟涛张怀宇
宁莎莎,李璟涛,张怀宇
(国家电投集团电站运营技术(北京)有限公司,北京102206)
新冠肺炎疫情目前在全世界传播,疫情应对中的应急工作备受关注。核事故由于后果的严重性,对于应急工作中事故情况的分析掌握有更高的要求,为了在事故应急情况下为决策者提供及时、准确的技术支持,需要对核应急决策支持与事故后果评价系统的各个模块的准确性进行验证,其中大气扩散模型的验证比对是其中非常重要的方面。目前验证评价大气扩散模型主要的两个困难是:(1)难以获得合适的实验数据集;(2)难以选择适宜的模型验证方法。本文针对以上两个问题,应用目前国际上应用广泛的KINCAID 示踪实验数据集和MVK(Model Validation Kit)模型验证评价方法,对放射性核素大气扩散模型ARTM(Atmospheric Radionuclide Transport Model)进行了验证评价。
1 示踪实验数据集
早期的示踪实验主要有三种类型:(1)大气示踪剂可行性研究实验;(2)定性大气扩散实验;(3)大气扩散参数确定实验,B.Vanderborght 等在1983年对这些实验进行了详细的综述[1],令人遗憾的是大量的实验都缺乏定量描述,而此后的示踪实验在吸取前人经验的基础上对实验条件和实验结果进行了相对详细的定量描述,使大气扩散模型的统计验证成为可能。按照实验规模,大气扩散实验分为大尺度大气示踪实验(200 km以上)和中小尺度(200 km以下)大气示踪实验。
大尺度扩散实验(200 km以上)由于其经费昂贵、实验设计和协调的复杂性而很少开展。现在能够应用于验证大尺度扩散模型的示踪实验数据集还不多,其中受到广泛关注的数据集有:CAPTEX、ANATEX、ETEX[2]。
相对于大尺度示踪实验而言,中小尺度的示踪实验数据集数量就比较多了。Kincaid 野外实验是EPRI 烟羽模型验证与开发项目的一个重要试验[3],于1980 年至1981 年在美国伊利诺斯州Kincaid 电厂进行,该核电厂的地理坐标为西经89.49°,北纬39.59°。海拔约180 m,周围是平坦的农场和少量湖泊,地表粗糙度约10 cm。示踪气体实验持续约350 h,示踪气体采用SF6,实验期间SF6从高187 m,直径9 m 的电厂烟囱释放,监测器分别布置在距源0.5 至50 km 范围内的12 条弧线上。数据集中包括了171 h,1 284 组弧线-小时数据,每组数据都设置有质量指数表示数值的可信任程度。
丹麦国家环境研究所(NERI)开发的模型验证比对工具MVK 中Kincaid 数据集是包含数据最全面、应用最广泛的数据集,此外还有Indianapolis、Copenhagen、Lillestrøm 三个大气扩散实验数据集。放射性核素的大气扩散可借助常规的实踪实验进行验证,如Ka-Hing Yau 等应用Kincaid 数据集验证了AUSTAL2000 和 CALPUFF 扩散模型,EPA 将该数据集应用于CALPUFF和其他大气扩散模型的验证,Steven R. Hanna 将 其 用 于 ISC3、 ADMS 和 AERMOD 模型的验证比对,邹敬等也应用此数据集验证比对了实时在线核事故决策支持系统系统中RIMPUFF模型的验证比对[4]。
2 大气扩散模型验证评价
目前国际上已经开展了一些关于空气质量模型一般评价方法的讨论,但是到目前为止还没有形成统一的评价方法和模型性能标准。应用统计评价方法分析验证模型中,MVK工具分析较为常用。
2.1 MMVVKK工具
丹麦国家环境研究所(NERI)基于Hanna[5-7]等的定量统计参数方法开发了模型验证工具MVK(Model Validation Kit)。该工具包包括Kincaid、Indianapolis、Copenhagen、Lillestrom 四个大气扩散实验数据集,定量分析程序(BOOT)、残差分析程序(Residual Analysis)及二维绘图程序(Sigplot)等。实验观测值与模型预测值通过MVK定量统计分析、残差分析及定性图形分析的全面比对,可以有效的评价模型的准确性、适用性,揭示模型的错误与数据中的坏点。
2.1.1 BOOT程序的统计方法
目前BOOT 程序已经涵盖了ASTM(American Society for Testing and Materials)的模型评价方法,诊断模型预测值的采用的统计量除平均值(Mean)、标准偏差(Sigma)外,还包括平均偏差(Bias)、比例偏差(FB)、几何平均偏差(MG)、标准化均方误差(NMSE)、几何平均方差(VG)、相关系数(r)及比例方差(FS),这些参数的计算公式如表1所示:
表1 BOOT程序采用的统计量Tab. 1 Statistical quality indicators adopted by BOOT software
式中:CO为观测浓度;CP为模型预测浓度;σCo为实验观测浓度的标准差;σCp为模型预测浓度的标准差,单位均为μg·m-3。
平均偏差Bias定义为预测平均值和观测平均值的差值,其数值可能是正数也可能是负数。当Bias为正数时,可能表示每一组数据的预测值均大于观测值,即模型具有高估的趋势,也可能表示预测值大于观测值数据对的偏差之和,大于预测值小于观测值数据对的偏差之和,因此Bias不具备表征模型高低估趋势的性能。其置信区间可以表示为:
式中:tα取决于t分布的自由度和置信区间的振幅。
FB和MG都是反映系统误差的统计参数。其中FB 更为常用,主要原因有2 个:(1)FB 是对称而有界的,可接受范围在-2(极端低估)到2(极端高估)之间;(2)FB 是一个无量纲数,使用于涉及不同浓度量级比较的研究中比较方便。但对于大部分的空气污染物来说,其浓度接近于对数正态分布,因此个别的高观测浓度或预测浓度会对比例偏差FB 产生显著的影响,而几何平均误差MG 由于采用对数的处理方法,对很高的数值就不那么敏感了,但接近于0的浓度值会对MG影响显著。
NMSE 是表征偏差的统计参量,对观测值与预测值的差值非常敏感,尤其峰值的偏差对NMSE 的影响更大。一般来说,模型的评价与验证都是用模型预测值直接与实验观测值比对的,但是由于观测值的不确定性主要来自于大气的随机扰动,而模型预测值的不确定性主要来自于模型模拟的物理过程,两者来源不同,直接比较的方法有可能会得到误导性的结果,因此有的时候将系统误差和非系统(随机)误差分开考虑是必要的。总的NMSE 可以表示为由系统误差引起的标准化均方误差NMSES与由非系统误差引起的标准化均方误差NMSEU之和。当非系统误差为0 时,NMSE 取到最小值NMSES。
类似地,VG 等于由系统误差引起的几何方差VGS与由非系统误差引起的几何方差VGU之和。
相关系数r是目前模型评价中使用最广泛的统计量。r为1 时,表示预测值与测量值正相关,即数据对(CO,CP)分布在斜率为正数的直线上;r为-1 时,则直线的斜率为负数;r为0 时,表示预测值和测量值之间没有线性关系。
α因子表示满足的数据所占的百分比(不包括(0,0)数据对)。α常取2 和5。FAC 对因为不受数据奇点的影响,是模型评价中最可靠的方法,可以作为消除极端值的工具和提高统计分析结果的方法。
2.1.2 MVK的局限性
MVK 虽然在模型的验证与评价中得到了广泛的应用,但其应用仍具有一定的局限性,主要体现在以下几个方面:
(1)数量有限,只考虑了4 个实验数据集;(2)仅适用于短程扩散模型;(3)只能处理一些相对简单的情景,主要适用于在均匀地表环境下单个点源释放无反应性气体的情景;(4)没有明确的解决由观测浓度的随机特性所产生的问题,程序只是直接将弧最大浓度和烟羽中心线浓度进行比较;(5)数据集主要关注的是弧最大浓度,只有部分数据集包括可信的侧风向积分浓度[8];(6)BOOT 程序采用的统计量中并没有一个综合性的统计指标,验证人员只能根据统计结果得到模型在某一方面的统计评价,而没有总体的适用性评价。
3 使用MVK 对ARTM(Atmospheric Radionuclide Transport Model)进行验证
本文应用MVK 工具,将ARTM 模拟结果与AERMOD 模 型 、 CALPUFF 模 型 及 Kincaid 数 据 集进行比对。AERMOD 模型和CALPUFF 模型是《环境影响评价技术导则大气环境》(HJ2.2—2008)推荐的大气扩散模型,已经广泛应用放射性核素大气扩散分析[9-12],此外CALPUFF 模型还能应用于核事故水体影响分析中[13]。Kincaid 数据集根据数据质量将数据进行分类,本文采用质量指示数分别为2 和3 的552 组数据进行比对验证,数据分布在3~40 km范围内,模拟区域地形平坦。
3.1 ARTM放射性核素大气扩散模型
ARTM 是以德国空气质量标准推荐的扩散模式AUSTAL2000 扩散模型为基础来计算大气中放射性污染物的扩散的,该模型系统主要包括诊断风场模型、雾羽抬升模型、浓度计算模型和核素沉积模型。模型的基本原理是拉格朗日烟团粒子模式,即把每个污染质点当成有标志的质点,粒子的运行轨迹可用下式表述:
式中:X为粒子的三维坐标分量;V为平均风速(u,v,w);V′为湍流脉动速度分量(u′,v′,w′);t为时间序列;Δt为时间步长。
通过释放大量粒子,计算粒子的轨迹,这些粒子描述气载污染物在大气中的迁移扩散。粒子在流场中按平均风输送,同时又用一系列随机位移来模拟湍流扩散,这样就表达了平流和湍流扩散两种作用,最后由这些粒子在空间和时间上的总体分布估算出污染物的分布[14]。
如图1 所示,ARTM 模型系统包括诊断风场模型、雾羽抬升模型、浓度计算模型和核素沉积模型。诊断风场模型结合地形和下垫面状况处理输入的气象数据,计算风场。浓度计算模型经过雾羽抬升模型的修正后输出每个网格的空气浓度。最后核素沉积模型输出每个网格的干、湿沉积浓度。
3.2 验证结果
实验的统计结果列于表2 中,模型预测值与观测值越接近,则表示模型的预测性能越好。
表2 实验比对结果Tab. 2 Results of the experiment
表2 中,ARTM 模型的均值偏保守,其他两个模型均值偏小,这样的结果不仅与模型本身的属性有关,与实验条件也有很大关系,如ARTM 因软件局限采用了平坦地形模拟,而AERMOD 和CALPUFF 均输入实际地形数据进行模拟,因此ARTM 的预测结果在数值上会比实际地形略大。一般说来如果模型的统计结果满足-0.3<FB<0.3,0.7<MG<1.3,NMSE<1.5,VG<4, FAC2>0.5, 则 可以认为模型的模拟结果是有效的[15],ARTM 的统计结果基本达到了这个标准。相关系数Cor 是在检验模式预测值有效性中广泛应用的统计量,描述了两组变量相对于各自的均值以统一比例增加或减少的程度[16]。ATRM 模型的相关系数值略低,表明观测值与预测值相对于各自的均值变化的统一程度较差。此外ARTM 模型比例方差数值上与理想值也是比较接近的。
模型预测值和观测值的对应的散点分布图如图2 所示。数据点在图中呈大致的椭圆形带状散布,但一部分点偏离较远,造成相关系数r值偏低。图3 为模型分位数图,分位数图是将模型预测值与观测值分别从高到低排序,然后将对应的点打印在图上,这个图的意义在于能反映模型的预测趋势[17]。由图4 柱状分析图可以看出,ARTM 模型柱状图0 km~3 km 距离段75%处约指向1.0,表明在该距离段有75%的数据的比值小于1.0。结合图1反映的预测趋势,说明ARTM 模型在0 km~3 km 距离段的预测有低估的趋势,在稍远处(5 km以外)ARTM 模型的预测值有高估的趋势。
4 结论
在大气扩散模型的验证评价中,需要结合模型的特点选择适合的实验数据集和验证评价方法。目前国际上应用广泛的示踪实验数据集和模型验证评价方法中,模型验证工具MVK(Model Validation Kit)采用了比较完善的统计分析方法和实用的图形工具,是众多验证评价方法中较为规范和成熟的。应用MVK 验证评价放射性核素大气扩散模型ARTM 的统计结果表明:ARTM 的模拟结果基本上是可信赖的,3 km 内的预测有低估的趋势,5 km外的预测有高估的趋势。
单一数据集只能代表有限的气象条件,对于模型验证评价应选取更多的数据集、综合采用多种验证评价方法做更广泛的比对。现有可靠性较高的数据集所能代表的源项、气象及地形条件仍十分有限,但现场扩散实验较为昂贵,为大气扩散模型适用范围和局限性的深入研究增加了困难,因此开展更多的高质量的示踪实验或者风洞实验用于模型验证比对也是十分必要的。