OPAQ 系统两种模式对O3预报准确率的探讨
2020-04-06王淑莹许纯领尹翠芳李鹏帅
王淑莹, 许纯领, 尹翠芳,李鹏帅
(1.北京立博威拓环境技术有限公司, 北京 100085;2.江苏省宿迁环境监测中心, 江苏 宿迁 223800)
空气质量与人类健康之间的关系已经引起了广泛关注,已有不少学者对此做了大量研究[1]。空气质量预报在污染事件发生前对公众的预警及制定减灾计划方面尤为重要,国内外学者也利用数值机理模型及统计模型来对空气质量进行预报,试图精准预测污染事件的发生,为减灾计划提供支持[2-7]。因此,评估预报模型的预报准确率对进一步提高模型预报准确性也具有较为重大的意义。现以江苏省宿迁环境监测中心空气质量预报业务系统(OPAQ系统)为例,基于人工神经网络算法的OPAQ系统的两种模式对臭氧(O3)预报准确率进行分析,探讨2种模式的优劣。
1 OPAQ 系统
OPAQ系统采用人工神经网络算法中的多层感知方法,其中一个隐含层代表一个输出层。预测的结果是污染物的日均值或日最大值。假如模型在当天早上运行,则当天00:00 至模型开始运行最近时刻的监测数据以及未来几天的气象数据作为输入数据。对每个监测站点配置几个不同的模型进行训练,不同模型的区别在于所采用的输入参数不同。所预测当天早上的监测数据及行星边界层高度(BLH)作为预测未来第N天的重要输入参数。行星边界层高度可认为是理查德系数(Ri)超过0.5时的高度[2]。其中Ri是浮力(由垂直温廓线确定)与惯性力(由大气湍流确定)的比率。如果Ri非常小(甚至是负的),湍流非常强烈,并且足以打破稳定的温廓线将颗粒物带至垂直方向,则从底部到行星边界层高度之间,颗粒物可以随湍流在此之间扩散。研究表明行星边界层高度在基于人工神经网络算法的空气质量预报系统中有非常重要的作用[8]。另外,还使用了风速与风向、温度、湿度及云量等气象参数来提高预测的准确性[8-9]。对每个监测站点都配置几种模型进行训练,最后选择一个最优的模型作为日常预报模型。
OPAQ系统具有两种模式,一种是预报趋势最优模式(RMSE模式),另一种是预报极值最优模式(SI模式)。预报趋势最优模式指的是在模型训练和验证阶段,选择预报值与监测值的均方根误差(RMSE)最小的模型作为日常业务预报时所采用的模型;预报极值最优模式指的是在模型训练和验证阶段,选择预报成功指数(SI)最大的模型作为日常业务预报时所采用的模型。
2 研究方法
2.1 数据时间
2018年1月1日—2019年7月29日。
2.2 统计分析的项目
O3预报的散点图、正确预警指数(FFE)、成功指数(SI)、错误预警指数(FFA)、相关性系数(R)以及级别预报准确率。统计方法技术说明见图1。
(1)
式中:SI——成功指数,为正确预报非超标天数和超标天数的比例,%;
N1——监测值达标预测值也达标的天数;
N2——监测值达标而预测值超标的天数。
(2)
式中:FFE——正确预警指数,为正确预报超标天数的比例,%;
N3——监测值超标且预测值也超标的天数;
N4——监测值超标而预测值达标的天数。
(3)
式中:FFA——错误预警指数,为错误预报超标,而实际未超标的天数比例,%。
图1 统计方法技术说明
3 结果与讨论
3.1 RMSE模式预报准确率评价
O3预报分析评价结果中,m表示监测值,d0表示预报当天,d1表示预报未来24 h,d2表示预报未来48 h,d3表示预报未来72 h。RMSE模式预报结果评价见表1。
表1 RMSE模式预报结果评价
由表1可见,在预测当天及未来24 h的FFE都能达到60%以上,预测未来48和72 h的FFE略低;在预测当天及未来24,48及72 h的FFA较低,均<10%。
图2(a)(b)(c)(d)为OPAQ系统RMSE模式当天及未来24,48及72 h的预测值与实际监测值对比的散点图,十字线为O3滑动8 h最大的超标临界值160 μg/m3。
由图2可见,RMSE模式预测当天及未来24,48及72 h的结果与实际监测值的拟合度较好,有个别值离散度较大。
图2 监测值与RMSE模式d0、d1、d2、d3预测值对比散点图
表2中展示了OPAQ系统统计预报模型RMSE模式预报当天及未来24、48及72 h的O3预报级别准确率的评价结果。表中天数列为监测值(m)与预测值(d0,d1,d2,d3)在O3各级别出现的天数,准确率为预测当天及未来3 d对O3各级别的预测准确率。由表2可见,OPAQ系统的RMSE模式在预测当天及未来24、48及72 h优-良天的预测准确率较高,在预测轻度污染-重度污染的准确率较低。
表2 RMSE模式预报准确率评价
3.2 SI模式预报准确率评价
表3为OPAQ系统统计预报模型SI模式预报当天及未来24、48及72 h的预报结果评价指标。由表3可见,在预测当天及未来24、48及72 h的正确预警指数FFE都>60%。
表3 SI模式预报结果评价
图3(a)(b)(c)(d)为OPAQ系统SI模式当天及未来24、48及72 h的预测值与实际监测值对比的散点图,十字线为O3滑动8 h最大的超标临界值160 μg/m3。
由图3可见,RMSE模式预测当天及未来24、48及72 h的结果与实际监测值的拟合度较好,有个别值离散度较大。
表4为OPAQ系统统计预报模型SI模式预报当天及未来3 d的O3预报级别准确率的评价结果。由表可见,OPAQ的SI模式在预测当天及未来24、48及72 h优-良天的预测准确率较高,在长达一年半的统计时段里,O3重度污染发生过1次,预测值为中度污染。
图3 监测值与SI模式d0、d1、d2、d3预测值对比散点图
表4 SI模式预报准确率评价
4 结论
(1) 2种模式预报评价指标显示,SI模式的正确预警指数FFE和成功指数SI要高于RMSE模式;而RMSE模式的错误预警指数FFA要低于SI模式,该指标越低越好;并且从长期来看,2种模式的相关性系数相差不大。
(2) 2种模式预报准确率表明,在O3优-良级别天时,RMSE模式的预测准确率较高;而在轻度污染以上时,SI模式的预测准确率明显高于RMSE模式。建议在夏季O3污染较严重的时段里,采用OPAQ系统的SI模式来预报ρ(O3)。