一种神经网络的云图短时预测方法
2010-10-20何如管兆勇金龙
何如,管兆勇,金龙
(1.南京信息工程大学大气科学学院,江苏南京 210044;2.广西区气候中心,广西南宁 530022)
一种神经网络的云图短时预测方法
何如1,管兆勇1,金龙2
(1.南京信息工程大学大气科学学院,江苏南京 210044;2.广西区气候中心,广西南宁 530022)
依据6 h T213数值预报产品的资料,采用EOF展开和人工神经网络等方法,对卫星云图短时预报方法进行研究。首先对卫星云图灰度值样本序列进行EOF展开,将提取出来的时间系数作为建模的预报量,以数值预报产品的物理量场作为预报因子,建立人工神经网络预测模型。将预报得到的时间系数与空间特征向量进行时空反演,实现对未来6 h云图的预测。预报方法的独立样本试验证明,预测结果与实际云图的主要特征基本吻合,尤其在预测云图的大体分布和发展趋势上得到了较好效果。
云图预测;人工神经网络;EOF展开;数值预报产品
0 引言
卫星云图作为重要的气象信息来源之一,在灾害性天气的监测和预报中发挥着越来越重要的作用。当前卫星云图的应用研究主要是在实时的监测分析和目标识别等方面[1-2]。如果能实现对云图的移动和变化状况进行一定时效的预测,就可在一定程度上弥补实时卫星云图应用在时间上的缺陷,显著增强卫星云图资料在天气预报中的实用性和及时性,使卫星云图在灾害性天气的预警预报工作中发挥更大的作用。
从20世纪90年代初开始,国内外对云图预测的研究工作主要以系统保持稳定为前提,采用交叉相关法[3-4]、时间突变法[5]等基于云图局部特征匹配和前后时次云团运动矢量关系进行线性外推,在对云的发展趋势预测和预报时效上存在着一定的不足,大大限制了这些短时效云团预测的可用程度。王继光等[6]、刘科峰等[7]提出对云图特征值进行动力模型重构和模型参数反演的云团演变非线性动力预测方法,但模型中没有考虑大气中水汽相态变化和云物理过程,制约了对云发展变化本质的刻画和描述。目前在国外已经采用MOS方法对云图进行预测[8-9],在数值预报模式中考虑了大气中物理量影响因子以及云物理过程,这代表了该领域的发展趋势和先进的研究方向;但该方法涉及了庞大的计算量和复杂的技术要求,在国内尚未见相应的应用研究成果报道。
由于云团发生发展直至消亡的整个生命史过程会明显受到大气环境场各个物理量因子的影响,并且云态变化更多的是非平稳、非线性的不规则变化,所以本文从云的演变过程与环境场影响因子之间的相关出发,建立二者的非线性统计关系模型,对卫星云图的未来发展变化进行预测研究,探索卫星云图的短时临近预报方法。
1 预报建模设计思想
云的发生发展并非简单的线性运动,而是受到大气环境、天气系统以及整个环境物理量场相互作用和综合影响的复杂的物理过程,某一地区和时刻内大气中云未来时刻的变化一定与该地区未来大气状况相联系。在云团的内部结构中,强烈的上升运动有助于向上输送水汽,凝结潜热的释放可使云团内的空气增暖,这种加热又可导致低层气压下降,有利于云团和气旋性环流的增强,以致继续出现这一正反馈的过程。研究[10]证明,有90%的云团与热带地区大尺度扰动,如赤道辐合带、东风波等天气系统相联系,而许多这些热带天气系统正是受到大气环流场的影响发展起来的。另外,云团在运动过程中的转向、变速等会受到周围环境高度场和风场等的影响。鉴于云团与气象要素之间存在着明确的天气动力关系,本文根据中国气象局T213数值预报模式18~24 h预报时效每隔6 h的高度场、风场、垂直速度场等物理量预报场资料,采用EOF展开和人工神经网络等方法对卫星云图灰度值进行预报建模研究。
根据分辨率的不同每一幅云图包含了若干像素点,若将每个点作为研究对象建立预测模型,计算量将非常庞大,同时也会增加模型的噪声干扰和计算误差。为此,设计采用经验正交函数分解的方法,对云图灰度值矩阵作EOF展开,得到代表云图空间分布的特征向量以及代表其随时间变化特征的时间系数。一般地,特征向量随时间的变化比较小,所以云图随时间变化的主要信息就集中反映在时间系数的变化上,每一个时间系数是展开对象的线性组合,反映了云图分布型随时间的变化。因此,以EOF展开得到的一维时间系数序列作为云图预测建模研究的预报对象,并将T213数值预报产品的物理量预报场作为云图预测建模的预报因子,采用人工神经网络方法,建立云图灰度值时间系数序列的非线性统计预报模型。将预测得到的云图灰度值样本各空间模态对应的时间系数,与相应的空间特征向量通过时空反演[11],得到二维云图灰度值矩阵预测值,实现对未来卫星云图的预测。
2 预报建摸方法
2.1 预报量计算处理方法
进行云图预测建模时,首先对云图灰度值矩阵采用EOF展开方法进行时空分离,将提取出来的空间场典型模态对应的时间系数序列作为模型输出的预报分量。EOF展开方法作为一种系统降维和特征提取的方法在气候分析和天气预报中已有广泛的应用[12]。EOF展开是将空间点的场随时间的变化进行分解,它是将一个要素场X看成时间函数Z和空间函数V的线性组合,其数学表达式为
由于EO F收敛速度快,浓缩性强,并且分解出来的特征向量是正交的[14],因此可以很好地表示云图样本序列的主要信息,这样就减少了原始云图中存在的噪声对揭示云图变化主要特征的干扰。
2.2 预报建模方法
考虑到云图变化的复杂性和非线性,本文在建立云图未来变化的预测模型时采用了一种目前得到广泛应用的非线性预报方法——B P神经网络模型[15]。
基本的3层B P神经网络的数学模型是
其中:A、B、C分别为输入层、隐含层和输出层矢量;ω1、θ1和ω2、θ2表示输入层与隐含层以及隐含层和输出层之间的连接权和阈值;f(x)为网络激活函数,这里采用Sigmoid函数,即
具体的数学原理和计算过程参见文献[16],在此不再冗述。
B P网络采用误差反传算法,通过不断调整网络权值使网络模型的计算输出与期望输出之间的误差平方和达到最小或小于设定的一个训练误差,其实质是一个无约束的非线性最优化计算过程。在网络结构较大时不仅计算时间长,而且很容易限入局部极小点而得不到最优结果。本文采用附加了冲量项的改进B P算法[17]。在网络模型中,增加冲量项可以减小由于网络结构选择不当,造成过拟合的影响和避免网络训练陷于较浅的局部极小点,使网络模型的学习过程更稳定,并提高收敛速度。
3 云图预报模型的建立与预报试验
3.1 资料
使用2005—2006年6—8月FY-2C红外卫星云图灰度值资料,研究范围为覆盖广西的区域,即103.5~112.5°E、20.3~26.5°N,分辨率为0.09°×0.09°,云图大小为70×100像素。考虑到相同区域特定季节内云的发展演变具有相似的内在运动规律[6],本文以汛期广西南宁地区有明显降水过程的相应时次云图样本为例,即能反映某一次造成降水的天气系统对应的云团演变过程。根据南宁地区日降水量大于25mm为标准(且卫星云图资料无缺漏),从中挑选出6个时间序列连续的过程,采样间隔为6h,共57个云图样本。在建立云图预测模型时,将2005年6月—2006年7月47张云图作为建模样本;将2006年8月3—5日的10张云图作为检测样本。
在建立云图预测模型时,预报因子取自中国气象局6h间隔的T213数值预报模式产品的9个物理量场资料:500hPa高度场、700hPa的u、v风场、700hPa垂直速度、850hPa高度场、850hPa的u、v风场、850hPa垂直速度和海平面气压场。选取范围为100~125°E、12~35°N。经纬网格距为1°×1°。
3.2 预报模型的建立
根据以上介绍的设计思想和方法,首先对47个云图建模样本作EO F展开,表1给出了前8个特征向量对应的特征值及各自的方差贡献,对应的前8个特征向量累计方差贡献达到了79.248%。前8个时间系数基本浓缩了该云图样本序列的主要信息,反映了云图分布型随时间变化的特征,且这些时间系数相互正交,因此取这8个空间特征向量对应的时间系数作为建立云图预测模型的预报分量,可以减少噪声影响和误差积累,以提高预报的准确率。
对云图建模样本的前8个时间系数与该云图时间序列时次相对应的9个物理量因子进行相关普查,挑选出与各个预报分量相关密切的预报因子,作为各预报分量非线性预报模型的输入。以成片的相关系数绝对值达到0.27以上(通过0.05信度的显著性检验)的格点区为基础,在高相关区内选出2个相邻格点的平均值作为预报初选因子。另外,在选因子时还采用了组合因子方法,即对相关符号相反的两个相邻或相近区域,将这两个区域的代表格点值相减,获得组合因子。由于本文在建立云图预测模型时采用的是B P神经网络,而B P网络方法本身并不提供从众多的预报因子中如何选取因子的方法[18],因此采用逐步回归方法从初选因子中筛选出作为模型输入的预报因子,来构造神经网络的学习矩阵。并考虑到一般神经网络模型的网络结构不宜过大[19],在进行逐步回归时通过设定F值控制入选的因子数量,即BP网络模型的输入维数,将各预报分量的模型输入节点控制在6以内。
表1 云图序列前8个EOF分解的特征值及方差贡献Table1 The first eight EO F eigenvalues and variance contributions of infrared cloud im age series
为了防止“过拟合”和误差局部收敛现象,提高预报模型的泛化能力,采用附加冲量项的改进BP神经网络算法,利用上述确定的预报因子和预报量建立云图预测模型。网络的训练样本为47个建模样本,检验样本为10个独立样本。该云图预测模型以8个时间系数为预报量,对每一个预报分量分别建立模型进行预测。以47个云图建模样本的前8个主分量分别作为模型的预报量,将各预报分量对应的预报因子作为神经网络建模的学习矩阵输入,建立各个主分量的神经网络预报模型。对于每一个预报分量,输入节点数即最终入选因子个数,输出节点数为1,即对应所要预报的时间系数,隐节点数因输入节点数而异,动量因子为0.9,学习率为0.75。对学习矩阵做1 000次训练,训练结束得到预报模型。
为了检验网络的预报能力,对10个独立样本的前8个时间系数进行预报建模检验。依照上述方法,将独立样本各预报分量对应的预报因子作为学习矩阵输入,模型固定参数不变,动量因子取0.9,学习率取0.75,当学习矩阵作1 000次训练后训练结束,分别得到云图独立样本序列的前8个时间系数的预测值。然后,根据以上云图样本通过EO F分解得到的前8个空间特征向量,与该模型预测出的时间系数通过时空反演,得到10个云图独立样本二维灰度值矩阵的预测值。
3.3 预测效果检验分析
将预测云图与实况云图进行对比(图1),黑色区域表示晴空无云,白色为有云区域。由图1可见,预测云图与实况云图的主要特征基本吻合,在描述云图的大体分布和发展趋势上能得到较好的效果。从实况云图来看,为一次气旋式云团非平稳发展的过程,从广西东南部生成运动至覆盖整个广西区域,预测云图基本实现了对云团生消、转向等特征的描述。表2为预测云图与实况云图灰度值矩阵的相关系数,二者的平均相关系数为0.61,最大的达到了0.76,预测结果基本上能反映出实况云图分布的主要信息。结合图1可见,预测图在云团集中分布区域表现出较好的一致性和相似性,特别是能较为准确地反映云团密集带的主要分布特征,但在描述云团的细节特征以及分散或者无云区域的预测上存在着一定的差异。
为了进一步检验云图预测的效果,将预测与实况云图的云顶温度(TBB)等值线分布进行比较,以2006年8月5日02时和08时为例(图2)。由图2可见,预测云图与实况云图TBB等值线分布的主要特征比较相似,对于云团TBB值相对较高的区域预测效果较好。但随着向云顶中部温度递减,低值区等值线范围的预测结果较实况要明显缩小。另外,在TBB梯度分布的预测上效果欠佳,实况云图的梯度要明显大于预测的结果。研究证明,较低的TBB值往往对应越大的降水量;而强降水区对应的则是在TBB梯度最大处[20]。因此,可利用预测云图对大范围的降水量进行估算,在一定程度上弥补了实时云图在时间上的缺陷;从本文对云图的预测精度来看,还难以实现对降水落区进行精确的估计。
表2 实况云图与预测结果相关系数Table2 Correlation coefficients between the predicted and observed cloud im ages
4 小结
本文研究的出发点是考虑大气环境场因素对卫星云图未来发生发展的影响,主要采用EO F展开和人工神经网络等方法,探讨了一种以数值预报产品资料为基础的卫星云图预测方法。从模型试验结果来看,云图预测结果与实况基本相符,可较好地描述云团移动和生消的变化趋势,尤其对区域内均匀分布的云图得到了较为理想的预测效果,表明了该方法具有较好的合理性和可行性。但该方法尚未实现对云图定点定量的预测,尤其在刻画云图结构与TBB等值线的细节特征上仍然存在着一定的差异,因而本文提出的这种云图预测方法还难以精确地应用于强降水等灾害性天气的监测和预报。
图1 云图预测试验实况(a-j)与预测(k-t)对比(2006年8月3日08时—5日14时,间隔时间6h)a,k.03T08;b,l.03T14;c,m.03T20;d,n.04T02;e,o.04T08;f,p.04T14;g,q.04T20;h,r.05T02;i,s.05T08;j,t.05T14Fig.1 (a-j)O bserved and(k-t)predicted cloud im ages in the interval of6hrs from0800BST3rd to1400BST5th A ugust2006
提出的云图预测方法突破了传统的线性外推方法只能对比较平稳状态的云团进行预测的局限性,建立了一种以数值预报产品资料为基础的非线性统计预测模型,能够很好地预测卫星云图未来的发展趋势,以及开展预报时效更长的研究工作。但是该方法仍存在着不足之处,较之国外先进的MOS方法,本文未考虑云内部的物理过程,并且仅选取了部分具有一定代表性的物理量因子,同时数值预报产品本身与实际的大气环流形势场就存在着误差,也会影响云图的预测精度。另外,考虑到为了减少误差的积累和噪声对预报准确率带来的影响,在预报建模和EO F时空反演时仅用了前8个特征向量及其对应的特征值,忽略了一部分累积方差贡献的原始云图信息,因而也影响了对未来云图发展变化的预测精度。
作为一种具有较长时效的气象卫星云图预报方法,比较有效地利用了数值预报产品资料的物理预报因子,使云图在未来变化的总体趋势上有了较好的预测效果,为进一步开展利用云图预测进行短时临近天气预报应用提供了重要基础。
图2 实况与预测TBB等值线分布(单位:℃) a.0805T02实况;b.0805T08实况;c.0805T02预测;d.0805T08预测Fig.2 (a,b)Observed and(c,d)predicted TBB(℃)contour patterns at(a,c)02:00and(b,d)08:00BST5 August2006
[1] 李伟钢,Ramirez M C V,Ferreira N J,等.气象卫星云图的多分辨小波分解及人工神经网络降水估计研究[J].南京气象学院学报,2000,23(2):277-282.
[2] 杨引明,姚祖庆.中国东部地区卫星估计降水系统及其应用[J].气象科学,2005,25(2):149-157.
[3] Thomasm H,Thomasm N.A short-term cloud forecase scheme using cross correlation[J].W ea Forecasting,1993,8(4):401-411.
[4] 黄勇,孔庆欣,郑兰芝.基于最大互相关的对流云预测[J].气象科学,2005,25(4):399-404.
[5] Genkova I S,Pachedjieva B,Ganev G,et al.Cloud motion estimation from M ETEOSAT images using time mutability method[J].Laser Physics and Applications,1999,3571:297-301.
[6] 王继光,张韧,郁文贤,等.基于卫星云图历史资料反演云团非线性预测模型[J].国防科技大学学报,2007,29(5):41-47.
[7] 刘科峰,张韧,李文才,等.奇异值分解与神经网络结合的卫星云图云团移动预测[J].解放军理工大学学报:自然科学版,2008,9(3):298-301.
[8] Vukicevic T,Greenwald T,Zupanski M,et al.Mesoscale cloud state estimation from visible and infrared satellite radiances[J].Mon Wea Rev,2004,132(12):3066-3077.
[9] Velden C S.Recent innovations in deriving tropospheric winds from meteorological satellites[J].Review of American Meteor Society,2005,36(2):205-223.
[10] 朱乾根,林锦瑞,寿绍文,等.天气学原理和方法[M].北京:气象出版社,2000:504-507.
[11] 何慧,金龙,贾志年,等.动力延伸预报产品在广西月降水预报中的应用[J].应用气象学报,2007,18(5):727-731.
[12] Jin Long,Kuang Xueyuan,Huang Haihong,et al.Study on the overfitting of the artificial neural network forecasting model[J].Acta M eteor Sinica,2005,19(2):216-225.
[13] 杨茜,吴涧,王卫国,等.全球对流层顶气压场的季节变化特征分析[J].气象科学,2008,28(3):328-333.
[14] 毛文书,王谦谦,马慧,等.江淮梅雨的时空变化特征[J].南京气象学院学报,2008,31(1):116-122.
[15] Hwang J N,Lay S R,M aechlerM,et al.Regression modeling in back-propagation and projection pursuit learning[J].IEEE Transactions on Neural Networks,1994,5(3):342-353.
[16] 孙照渤,谭桂容,赵振国.人工神经网络方法在夏季降水预报中的应用[J].南京气象学院学报,1998,21(1):47-52.
[17] 吴建生,金龙,杨善朝.一种提高前向神经网络泛化性能的新算法[J].信息与控制,2006,35(5):574-578.
[18] 金龙,吴建生,林开平,等.基于遗传算法的神经网络短期气候预测模型[J].高原气象,2003,24(6):981-987.
[19] 金龙.神经网络气象预报建模理论方法应用[M].北京:气象出版社,2004:186-201.
[20] 蔡晓云,伏建国,朱革.一种卫星和雷达资料结合的强降水临近预报方法[J].气象,1997,23(1):46-49.
A Short-term Cloud Forecast Model by Neural Networks
HE Ru1,GUAN Zhao-yong1,J IN Long2
(1.School of Atmospheric Sciences,NU IST,Nanjing 210044,China;2.Guangxi Climate Center,Nanning 530022,China)
Ashort-term cloud forecast model,based on the numerical forecast products data,is studied in this paper by means of the empirical orthogonal function(EOF)and artificial neural network(ANN)method.Firstly,the time coefficient of the EOF of the sample sequences of gray scale images of clouds was taken as the predictand and physical factors of numerical forecast products as the predictors,and an ANN forecast model was established.The future 6 h cloud forecast was made by the space-time inversion from the predicted time coefficient and the corresponding eigenmodes.The ANN cloud forecast model was verified by independent samples and the results show that the forecast results are better accorded with observed cloud pictures in the principle characteristics,especially in the general distribution and developing trend.
cloud forecast;artificial neural network;empirical orthogonal function;numerical forecast product
P457.1
A
1674-7097(2010)06-0725-06
2008-08-30;改回日期:2009-02-14
广西科学研究与技术开发项目(桂攻关052005-2A);国家自然科学基金资助项目(40675023)
何如(1983—),女,广西柳州人,硕士,助理工程师,研究方向为短期天气预报,past014@163.com;管兆勇(通信作者),男,博士,教授,研究方向为气候系统低频变率,guanzy@nuist.edu.cn.
何如,管兆勇,金龙.一种神经网络的云图短时预测方法[J].大气科学学报,2010,33(6):725-730.He Ru,Guan Zhao-yong,Jin Long.A short-term cloud forecast model by neural networks[J].Trans Atmos Sci,2010,33(6):725-730.
(责任编辑:刘菲)