基于径向基函数神经网络温度预报订正方法及评估
2021-05-07张亚刚杨银张成军纪晓玲杨文军毛璐
张亚刚,杨银,张成军,纪晓玲,杨文军,毛璐
(1.中国气象局旱区特色农业气象灾害监测预警与风险管理重点实验室,宁夏银川750002;2.宁夏回族自治区气象防灾减灾重点实验室,宁夏 银川750002; 3.宁夏气象台,宁夏 银川750002;4.贺兰县气象局,宁夏 银川750200)
1 引 言
温度预报是天气预报的重要内容之一。多年来,除了数值预报模式外,客观温度预报主要还是以统计方法为主[1],陈豫英等[2-3]采用逐步回归MOS 方法,预报宁夏站点温度取得良好效果;吴启树等[4]用欧洲数值预报模式(ECMWF)的准对称滑动数据,通过训练建立最高、最低温度的MOS预报方法;李佰平等[5]提出了四种线性回归误差订正方法均能有效减小预报误差;罗聪等[6]提出基于GRAPES 数值模式的卡尔曼滤波方法,有效改进数值模式短时温度预报能力;张成军等[7]基于“动态建模、训练择优”原则建立了动态最优PP 温度预报技术有效提高了温度预报准确率;近年来,人工智能神经网络方法在气象预报中的应用越来越广泛[8-19],马学款等[8]用动态学习率BP 算法预报西藏自治区32个站点的最高、最低温度,使其能够达到业务精度要求;吴君等[9]建立BP-MOS神经网络算法,预报准确率高于逐步回归模型和M55模型;张天虎等[10]利用BP 神经网络与遗传算法,建立更高精度的大气温湿度反演模型;雷彦森等[11]在ECMWF、CMA 和JMA 等数值预报产品基础上,用BP 神经网络算法进行集成预报;郭庆春等[12]利用神经网络系统工具,建立比多元回归分析精度更高的BP 神经网络算法。从上述文献可以发现,采用BP 神经网络算法较传统统计方法有明显优势,但是与径向基函数(RBF)神经网络相比,仍然存在学习速度较慢、训练过程可能陷于局部最小及没有有效方法确定隐层神经元数的缺陷。农吉夫[13]采用径向基函数神经网络与主成分分析相结合的方法,使RBF 神经网络模型的预报精度从总体上要优于BP 网络模型;高领花等[14]采用RBF 神经网络非线性集成预测方法,不仅具有更好的拟合能力,而且计算效率要比BP 神经网络快得多;熊聪聪等[15]选取多模式数值预报数据,提出一种径向基函数(RBF)神经网络集成天气预报模型;Zhu 等[16]提出RBF 神经网络和卡尔曼滤波的融合算法来解决温度预报问题;陈广[17]提出融合变异的粒子群算法优化RBF 神经网络模型,进而弥补RBF 神经网络学习算法不足的问题;LI 等[18]和任巧丽等[19]结合主成分分析(PCA)和RBF神经网络,建立温度预报模型,提高预报的准确率。
上述研究成果大多数都是针对站点温度预报的,针对格点温度预报的很少。目前中国气象局下发各省的温度预报均为0.05 °×0.05 °分辨率的格点预报和实况,因此通过应用具有机器训练学习功能的RBF 神经网格算法,建立格点温度客观预报技术方法,进而提供更加精细准确的格点温度预报产品,对于服务社会发展需要具有重要意义。
2 资料与方法
2.1 试验用资料
使用2017 年10 月—2018 年9 月中央气象台预报的宁夏地区(104.15~107.8 °E,35.1~39.5 °N,共计2 418 个格点)0.05 °×0.05 °分辨率的未来72 h 逐日最高、最低温度格点产品,格点实况资料为相应时间段国家信息中心下发的宁夏地区0.05 °×0.05 °的逐日最高、最低温度格点实况建立RBF神经网络模型,再把2018 年10 月—2019 年9 月中央气象台逐日格点最高、最低温度的最新预报数据代入模型,进行RBF神经网络温度预报。
2.2 计算方法
径向基函数神经网络方法(简称:RBF 神经网络,下同),是Darken和Moody于1988年提出的一种能够以任意精度逼近任何连续函数的三层前馈神经网络,其结构分为三层:输入层、隐含层和输出层[9];它具有逼近能力强、结构简单、训练简洁、学习收敛速度快等优点,在分类能力和学习速度等方面都优于BP 神经网络;它不仅在理论上是前向网络中最优的网络,而且在学习方法上也避免了局部最优问题。
RBF 神经网络以高斯函数为径向基函数充当传递函数:
式(1)、(2)中:xp为 第p个输入样本,p=1,2,……,P(P表示样本总数),ci为网络隐含层结点的中心,ωij为从隐层到输出层的权值,i=1,2,……,h为隐含层的结点数;yi为与输入样本对应的网络的第j个输出结点的实际输出。
2.3 计算步骤
在程序设计时,首先基于中央气象台指导预报的日最高、最低温度格点预报产品与相对应的格点实况,然后应用Matlab 神经网络工具箱提供的newrbe函数(式(3)),快速设计一个目标误差为0的径向基函数神经网络:
其中,P为中央气象台预报的格点产品,每个格点有365组输入向量组成的1×365维矩阵,T为国家气象信息中心的格点实况产品,每个格点有365组目标分类向量组成的1×365维矩阵。SPREAD为径向基层的散布常数,表示径向基函数的扩散速度,它的取值直接影响神经元的数量等网络结构。因此在网络设计过程中,SPREAD 分别取0.1、0.5、1、5、10 等不同的值时得到不同的网络结构,将格点实况产品和神经网络输出的结果对比,发现当SPREAD取1时,格点实况产品与神经网络计算值之间的误差最小,网络性能达到最优,所以本文针对24 h、48 h、72 h 预报的SPREAD 常数选取的数值都为1。RBF 神经网络的传递函数为radbas,其调用格式为:
其中,N为输入行向量组成的1×365 维矩阵;A为函数返回矩阵,与N一一对应,即N中的每个元素通过径向基函数得到A。
最后利用Matlab工具箱建立好RBF神经网络之后,选取sim函数进行模拟仿真,调用方法为:
其中,net代表采用newrbe函数训练学习好的RBF神经网络,X为输入中央气象台实时预报数据,Y为RBF 神经网络预报值。RBF_NMC 神经网络预报流程图如图1所示:
图1 RBF_NMC神经网络预报流程图
3 检验结果
依据《全国智能网格要素预报检验办法》,对2018年10月—2019 年9月0.05 °×0.05 °分辨率的NMC、RBF_NMC,以及ECTHIN 最优插值0.05 °×0.05 °分辨率的未来72 h逐日最高、最低温度格点预报产品,从≤2 ℃温度预报准确率、订正技巧、平均绝对误差等几个方面分析各产品的预报性能。
式中:TMAEN为NMC 平均绝对误差,TMAEF为其他检验产品温度平均绝对误差。当TMAEN=0 时,SST=1.01×100%。
3.1 最高最低温度综合检验分析
3.1.1 24~72 h检验对比
图2 给出了NMC、ECTHIN、RBF_NMC 等3种温度预报产品的逐日最高、最低和综合(最高最低的平均)预报准确率、以及ECTHIN 和RBF_NMC 的温度预报订正技巧。由图可见,3 种产品的最高、最低温度预报准确率随着预报时效增加而降低。
最高温度预报准确率,24 h,RBF_NMC 最高为71.72%,ECTHIN 为67.45%,RBF_NMC 较NMC 预报准确率提高7.21%,RBF_NMC 订正技巧最高达到0.13;48 h,RBF_NMC最高为64.41%,ECTHIN 为63.6%,RBF_NMC 较NMC 预报准确率提高5.48%,RBF_NMC 订正技巧与ECTHIN 最高均达到0.11;72 h,RBF_NMC 最高为59.78%,ECTHIN 为58.14%,RBF_NMC 较NMC 预报准确率分别提高4.46%,RBF_NMC 订正技巧最高达到0.08。
最低温度预报准确率,24 h,RBF_NMC 最高为74.91%,NMC 为67.93%,RBF_NMC 较NMC 预报准确率提高6.98%,RBF_NMC 订正技巧最高达到0.15;48 h,RBF_NMC 最高为69.52%,ECTHIN为64.8%,RBF_NMC 较NMC 预报准确率提高5.67%,RBF_NMC 订正技巧最高达到0.12;72 h,RBF_NMC 最高为64.44%,ECTHIN 为60.52%,RBF_NMC 较NMC 预报准确率提高4.47%,RBF_NMC订正技巧最高达到0.09。
上述分析表明,24~72 h,RBF_NMC 的最高、最低温度预报准确率和订正技巧均为最高,平均预报准确率为67.46%,相对NMC 提高5.72%,订正技巧达到0.16,表现出良好的预报性能。
图2 2018年10月—2019 年9月24~72 h温度预报产品检验对比
3.1.2 分季检验对比
统计4 个季节中24~72 h 最高、最低温度的平均预报准确率和订正技巧(图3),进行对比分析。分季检验中,RBF_NMC 的24~72 h 最高、最低温度的平均预报准确率均优于NMC。
最高温度,从图3a和3b可见,春、夏、秋3个季节中,表现最好的产品都是RBF_NMC,其平均准确率为67.92%,较NMC 提高5.98%,较ECTHIN提高4.37%;其订正技巧最高达到0.13。冬季表现最好的产品为ECTHIN,其预报准确率达到70.57%;而RBF_NMC 预报准确率为63.25%,较NMC提高6.32%,订正技巧达到0.09。
最低温度,从图3c 和3d 可见,4 个季节中,表现最好的产品均为RBF_NMC,其平均准确率为69.12%,相对NMC 提高5.71%,较ECTHIN 提高6.27%;其订正技巧均为正技巧,冬季最高达到0.16。
图3 2018年10月—2019 年9月各季度温度主客观预报产品检验
分析表明,最高温度,除了冬季ECTHIN 表现最优外,RBF_NMC 在春、夏、秋3 个季节都表现最优;最低温度,RBF_NMC在4个季节中均为最优。
3.1.3 逐月检验对比
RBF_NMC 逐月最高、最低温度预报,准确率均优于NMC;但与ECTHIN 相比,各有优势(图4a和4b)。
最高温度预报准确率,RBF_NMC 与NMC 的变化趋势大致相同,但前者准确率明显高于后者。RBF_NMC 在3 月达到全年最高为74.18%,较NMC 提高了7.69%;7 月达到全年最低为55.50%,仍然比NMC 高出3.38%;RBF_NMC 的订正技巧,各月均为正技巧,最高在6 月份为0.11,最低在1月份为0.06。ECTHIN 在冬季(12 月、1 月、2 月)的最高温度准确率、稳定性都比RBF_NMC 要高,预报效果明显好于RBF_NMC;其中12 月准确率达到最高为70.57%,比RBF_NMC 提高2.12%;另外,ECTHIN 在5 月、7 月也略高于RBF_NMC;但6月份ECTHIN 的准确率比其他两个产品都要差一些;同时ECTHIN 的订正技巧变化很大,表现出很大的不稳定性,甚至11 月、9 月出现很明显的负技巧。
最低温度预报准确率(图4c 和4d),最低温度RBF_NMC 与NMC 的变化趋势大致相同,仍然均优于NMC,且技巧全部为正技巧。值得注意的是,NMC 和RBF_NMC 在2 月都出现了全年最低的准确率,这和张成军等[20]检验站点温度预报准确的“2 月低”现象是一致的;虽然是最低值,但RBF_NMC 的订正技巧亦然为正;而两者在6 月都出现了最高值,RBF_NMC 准确率达到了76.90%。相比较而言,ECTHIN 的逐月准确率有2 个月明显低于NMC,技巧评分也是负值;且12 个月中的技巧相比RBF_NMC都没有优势,不稳定性明显。
以上分析表明,RBF_NMC 最高、最低温度的逐月准确率都较NMC 高,虽然前者准确率随着后者而起伏,但技巧评分一直是正的,有较好的稳定性,参考价值大;ECTHIN 有个别月份的准确率和技巧均高于RBF_NMC,但整体稳定性差,不能经常参考应用。
图4 2018年10月—2019 年9逐月温度预报产品检验对比
3.2 最高最低温度的绝对误差空间分布分析
对比最高温度的绝对误差5 km 格点空间分布(图5、图6),自24~72 h,宁夏境内NMC 的绝对误差都比RBF_NMC 的绝对误差要大。其中,NMC 在贺兰山、沙坡头南部、同心北部、海原西南部及六盘山等地最高温度绝对误差均超过2 ℃;但RBF_NMC 则使上述区域的高绝对误差值全部下降;相对而言,宁夏中北部的订正效果优于南部山区。
对比最低温度(图7、图8),NMC在贺兰山、沙坡头南部、海原北部、西吉南部和六盘山的绝对误差在2 ℃以上,贺兰山大部超过了3 ℃;经RBF_NMC 方法处理后,大部降低到2 ℃以内,其中,贺兰山、六盘山为订正效果最好的地区。
对比分析表明,RBF_NMC 有效地发挥了其训练择优功能,能显著降低最高、最低温度的空间平面上的绝对误差值。
图5 2018年10月—2019 年9月NMC最高温度平均绝对误差
图6 2018年10月—2019 年9月RBF_NMC最高温度平均绝对误差
图7 2018年10月—2019 年9月NMC最低温度平均绝对误差
图8 2018年10月—2019 年9月RBF_NMC最低温度平均绝对误差
3.3 一次强降温霜冻天气过程的检验分析
2019年5月19—20日,宁夏出现强降温(局部寒潮)和霜冻灾害天气过程。19 日宁夏北部地区平均温度下降8~10 ℃,局部最大降幅12.1 ℃,达寒潮强度;20日,宁夏73站出现霜冻灾害天气。
对比分析此次过程中NMC、ECTHIN 和RBF_NMC 3种预报产品的最高、最低温度预报性能。图9 表明, RBF_NMC 在3 个预报时效中的最高、最低温度准确率都明显高于 NMC 和ECTHIN。RBF_NMC 最高、最低温度的平均准确率 比NMC 提 高8.7%,比ECTHIN 高14.0%。ECTHIN 的最高温度在24 h、72 h 高于中央气象台,但最低温度则在3 个时效均明显低于RBF_NMC 和NMC。相对而言,RBF_NMC 不仅准确率是最高的,也是最稳定的。
选取18 日起报24 h 最高温度的平均绝对误差进行对比(图10)。NMC 在宁夏的三个区域(红色)出现明显的偏高,绝对误差值在2.5 ℃以上甚至达到3.5 ℃;而RBF_NMC的绝对误差值明显降低,大部分下降到1.5 ℃以内。统计表明,宁夏境内所有格点的平均绝对误差,RBF_NMC 比NMC下降了0.73 ℃。
图9 2019年5月18日起报逐24 h时效温度主客观预报产品检验 a.最高温度;b.最低温度。
图10 2019年5月18日起报24 h时效最高温度平均绝对误差 a. NMC;b. RBF_NMC。
可见,RBF_NMC 在强降温天气过程中的预报性能较NMC和ECTHIN明显优异。
4 小结与讨论
(1)从逐时效预报效果对比检验看,RBF_NMC 的最高、最低温度预报准确率和订正技巧均为最高,平均预报准确率为67.46%,相对NMC 提高5.72%,订正技巧达到0.16,表现出良好的预报性能。
(2)从逐月预报效果看,RBF_NMC 最高、最低温度的逐月准确率都较NMC 高,虽然前者准确率随着后者而起伏,但技巧评分一直是正的,有较好的稳定性,参考价值大;ECTHIN 有个别月份的准确率和技巧均高于RBF_NMC,但整体稳定性差,不能经常参考应用。从逐季度预报效果看,最高温度,除了冬季ECTHIN 表现最优外,RBF_NMC 在春、夏、秋3 个季节都表现最优;最低温度,RBF_NMC在4个季节中均为最优。
(3)从分区域预报效果检验看,RBF_NMC 最低温度预报效果好于最高温度,相对NMC 平均绝对误差有明显减小,最高、最低温度平均绝对误差基本都控制在2 ℃以内。最高温度仍然以海源、同心、彭阳预报误差偏大为主,最低温度仍然以中卫、海源、惠农预报误差偏大为主,RBF_NMC 能有效地发挥了其训练择优功能,能显著降低最高、最低温度的空间平面上的绝对误差值。
(4)从一次强降温及霜冻过程检验结果分析看,RBF_NMC 对全区强降温天气过程中的预报性能较NMC明显优异。
以上研究结果表明,径向基函数神经网络方法适合于温度等连续性气象要素客观预报方法研究,取得了较好的订正效果,并且在时间序列分析、数据分类、模式识别、信息处理、图像处理、系统建模、控制和故障诊断等均有广泛地应用。文献[4]和文献[21]的研究表明不同训练期和不同因子建模会对预报准确率产生不同的影响,因此使用不同时段训练样本和更多训练因子来优化模型是本文进一步的研究方向。