决策级融合技术在环渤海地区短期天气预报中的应用
2014-12-06马鹏辉孙立尹杨燕军张剑
马鹏辉,孙立尹,杨燕军,张剑
(1.海军海洋水文气象中心,北京100161;2.中国人民解放军92727部队,山西长治046011)
1 引言
近年来天气气候预测方法发展较快,目前业务研究中应用较多的主要有:(1)线性回归方法或相关分析,即寻找一对变量x 和y 之间的关系;(2)自然正交方法及其扩展,即寻找一组变量x1,x2,…,xn之间的相关型[1];(3)典型相关方法或奇异值分解方法,即寻找一组变量x1,x2,…,xn和另一组变量y1,y2,…,yn之间的线性关系[2];(4)人工神经网络方法,是通过模拟人神经元之间反射的相互传导过程,来模拟大气这一非线性的复杂系统[3],即寻找一组变量x1,x2,…,xn和另一组变量y1,y2,…,yn之间的非线性关系;(5)统计降尺度方法,是利用多年的观测资料建立大尺度气候状况和区域气候要素之间的统计关系,并用独立的观测资料检验这种关系,最后再把这种关系应用于数值模式输出的大尺度数值预报产品,产生局地气候预测[4]。上述方法中,前3种属线性方法,它们在预测短期气候变化这种复杂的非线性系统时效果不理想,因为它们只能揭示变量之间的线性关系[5]。人工神经网络方法是非线性的,自从被引入到非线性特性显著的气象预报预测领域以来,已取得一系列研究成果,被看作是最有应用前景的方法[6],其缺点是不能处理大量的场格点资料,且短样本资料容易导致非线性不稳定[7]。统计降尺度方法能够将数值模式输出的物理意义较好、模拟较准确的数值预报产品应用于统计模式,从而纠正数值模式的系统误差且不用考虑边界条件对预测结果的影响;其缺点是需要有足够的观测资料来建立统计模式,且不能应用于大尺度气候要素与区域气候要素相关不明显的地区[8-11]。本文尝试将数据融合技术引入到天气预测中,通过决策融合来提高现有预测方法的准确率,以寻求改进天气预测效果的新途径。
数据融合是对同目标、多来源数据的自动检验、联合、相关、估计的过程,其目的是为了提高自动决策数据分辨率、决策精度和可靠性等[12]。按融合层次可划分为像素级融合、特征级融合和决策级融合。其中,决策级融合是在多种决策算法的决策基础上,将其决策结果(中间)作为输入矢量,应用决策算法将中间决策结果与实际结果再进行多次决策处理。就天气预报而言,决策级融合就是通过中间决策结果,将大气环境数据与实际天气结果进行多次联系和处理。杨燕军等[13-15]分别采用线性回归法、极值剔除法、支持向量机法对环渤海地区3 个区域共26 个站点的单站、区域短期天气预报进行了研究。本文以这3种方法作为融合算法,利用相同的历史资料,对环渤海地区短期天气预报进行融合决策研究,并对预报效果进行了分析。
2 决策级融合模式训练过程
初级决策的初始输入矢量(即特征因子组)可表达为:
式中,Y0为实际出现的天气类型代码组成的矢量;为通过预测方法对进行运算;“ ”表示通过左侧的运算得到右侧的结果;为与预测方法相对应的预报数据组,其括号内的内容表示预报数据组的具体内容,即初级决策方法的计算系数;为与初级预测方法相对应的预报临界值,其下标仍为预测方法序号。
则初级决策过程可表达为:
融合决策的实质,就是将中间(含初级)预测结果作为输入矢量,与预测对象的实际结果再做一次联系。那么,融合决策的输入矢量可表达为:
式中,n 表示融合决策级次(即进行n 次融合决策),当n=1 时,其矢量各元素即为初级决策结果。为了与初级决策的数学描述方法一致,这里仍采用分别表示预测方法、计算系数数据组、预报临界值。那么,不同级别融合决策的模式训练过程可表达为:
南海北部陆坡深水盆地中早期广泛发育的水道侵蚀形成了大量的深水水道,而这些深水水道的发育是形成浅水流层的关键因素。原本空洞的深水浊积水道会受到区域构造沉降、海平面变化的影响而开始充填巨厚的浊积砂体。而这些砂体会随着埋深的增加,逐渐被低渗泥岩或页岩地层所覆盖,地层载荷也随之增加,地层间的孔隙流体却不能有效排出,从而导致在下覆地层中不断积累,最终形成局部异常超压环境,这就是浅水流层的形成过程。
……
级决策级融合模式训练中的预测方法、预报数据组、预报临界值等代码的下标为1,表明最后一次融合只采用1种预测方法,得到的结果是1组预报数据和1个预报临界值。
3 决策级融合的决策过程及决策模式
在经过前述初级和各级融合的模式训练后,得到初级和各级融合决策的预报数据组和预报临界值,就可以进行各级融合决策。与前述决策级融合的模式训练过程相对应的决策过程可以表达为:
……
本文对环渤海地区的天气预报研究分为3个预报时效,即0—24 h、24—48 h 和48—72 h。其中每个预报时效的决策模式采用两级决策,即初始决策和一级融合决策。在初始决策中,分别采用线性回归法、极值剔除法和支持向量机法;在融合决策中,只进行一级融合决策,即m=3,n=1。
表1 各站点平均历史拟合率一览表(%)
4 模式训练效果分析
文献[13-15]已对预报区域、预报对象(天气类型)及优先顺序、特征因子选择及筛选等方面的情况作了详细说明,这里不再赘述。本文首先以线性回归法为初始决策算法,利用1996—2010年常规气象资料(其中1996—2005年资料用于模式训练,2006—2010年资料用于预报模式的试报检验),采用历史拟合率和试报准确率对决策级融合在环渤海地区短期天气预报中的预报效果进行分析。其中,历史拟合率从两个角度进行统计分析。
一是各个站点平均历史拟合率。表1是环渤海地区3个区域各站点平均历史拟合率,表中站点序号代表的具体站点见表3。由表1 可知,平均历史拟合率最高值为91.91%(威海站),最低值为68.48%(宝坻站)。26个站点中,平均历史拟合率低于70%的站点1 个,占3.84%;高于90%的站点2 个,占7.69%;80%—90%的站点5 个,占19.23%;75%—80%的站点14 个,占53.85%;其余4 个站点的平均历史拟合率在70%—75%,占15.38%。平均历史拟合率在75%以上的站点占80.77%。
二是不同预报时效平均历史拟合率。从各种预报时效平均历史拟合率一览表(见表2)可知,平均历史拟合率随着预报时效的后延略有降低,但在76%以上。
表2 各预报时效平均历史拟合率一览表(%)
试报准确率是按不同站点的各种预报时效来进行统计的。表3 是各预报站点的不同预报时效的试报准确率。相比之下,试报准确率较历史拟合率低10%左右。其中,达到80%以上的占1.28%,70%—80%的占21.79%,65%—70%的占39.74%,60%—65%的占21.79%,50%—60%的占14.10%。
由以上分析可知,采用线性回归作为初始决策方法应用于环渤海地区短期天气预报时,决策级融合获得了较为理想的历史拟合率和试报准确率。虽然试报准确率相对较低,但是试报准确率达到65%以上的占64.11%,因此本文认为,决策级融合在环渤海地区短期天气预报中的应用,具有较好的可信度。
表3 短期天气预报试报准确率一览表(%)
5 模式训练结果比较分析
采用和上述同样的方法,分别以极值剔除法、支持向量机法作为初始决策方法进行决策级融合,计算不同预报时效的平均历史拟合率和平均试报准确率(详细过程略),结果如表4 所示。与杨燕军等[13-15]得出的初始预报决策平均历史拟合率和平均试报准确率(见表5)进行比较可知,经过决策级融合后,3种初始决策方法的平均历史拟合率总体上得到了提升,其中,0—24 h 和24—48 h 的融合决策效果更好一些,平均提升2%—3%,48—72 h 的融合决策结果与初始决策结果相当;3种初始决策方法的平均试报准确率均有所提升,各预报时效平均提升2%左右。上述两方面的比较结果表明,经过决策级融合后,提高了平均历史拟合率和试报准确率。
表4 决策级融合的平均历史拟合率和试报准确率
表5 初始决策下的平均历史拟合率和试报准确率
6 结论
(1)本文以线性回归法、极值剔除法、支持向量机法为初始决策方法对环渤海地区的短期天气预报进行了研究。结果表明,预报效果在初级决策的基础上有所提高,特别是提高了预报结果的可信度;
(2)采用线性回归作为初始决策方法进行融合决策时,单站短期天气预报平均历史拟合率>75%的站点占80.77%,>70%的站点占96.16%;就预报时效而言,3 个预报时效的历史拟合率均>76%;就试报准确率而言,试报准确率>65%的站点占64.11%,>60%的站点占85.90%;
(3)无论是平均历史拟合率还是平均试报准确率,3 种初始决策方法经决策级融合后都有提高,比较而言,0—24 h 和24—48 h 的融合决策效果要好于48—72 h;
(4)决策级融合在环渤海地区短期天气预报应用的研究结论表明,决策级融合在日常业务预报系统中应用是可行的,可以在预报保障上发挥较好的指导和辅助作用。
[1]张书俊.自然正交分解在降水场预测中的应用[C]//中国气象学会. 推进气象科技创新加快气象事业发展——中国气象学会2004年年会论文集.北京:气象出版社,2004:56-60.
[2]张万诚,郑建萌,解明恩.典型相关方法在低纬高原汛期降水预报中的应用试验[J].气象,2002,28(6):32-34.
[3]董全,黄小玉,宗志平.人工神经网络法和线性回归法对降水相态的预报效果对比[J].气象,2013,39(3):324-332.
[4]刘永和, 郭维栋, 冯锦明, 等. 气象资料的统计降尺度方法综述[J].地球科学进展,2011,26(8):837-847.
[5]Hsieh W W, Tang B Y. Applying neural network models to prediction and data analysis in meteorology and oceanography[J].Bulletin of the American Meteorological Society, 1998, 79(6):1855-1870.
[6]朱智慧.BP 神经网络方法在海浪数值预报中的释用研究[J].大气科学研究与应用,2011,21(1):84-91.
[7]胡江林,张礼平,宇如聪.神经网络模型预报湖北汛期降水量的应用研究[J].气象学报,2001,59(6):776-783.
[8]Meal L O,Bogardi I,Giorgi F,et al.Comparison of climate change scenarios generated from regional climate model experiments and statistical downscaling[J]. Journal Geophysics Research, 1999, 104(D6):6603-6621.
[9]王冀,宋瑞艳,郭文利.统计降尺度方法在北京月尺度预测中的应用[J].气象,2011,37(6):693-700.
[10]李江萍,王式功.统计降尺度法在数值预报产品释用中的应用[J].气象,2008,34(6):41-45.
[11]任丽娜,翟宇梅,王力维.多模式集合在统计降尺度应用上的研究进展[J].科学技术与工程,2011,11(29):7185-7194.
[12]霍宏涛.数字图像处理[M].北京:北京理工大学出版社,2002.
[13]杨燕军.线性回归方法在环渤海地区天气预报中的应用[C]//中国海洋学会军事海洋学专业委员会.第八届军事海洋战略与发展论坛论文集.北京:海潮出版社,2012:156-160.
[14]马鹏辉,杨燕军.极值剔除法在环渤海地区天气预报中的应用[J].航空气象科技,2011,21(4):17-20.
[15]杨燕军,马鹏辉,张剑.基于支持向量机的环渤海地区短期天气预报[J].导弹气象,2012,19(3):9-12.