基于加权马尔可夫链的杭州市年降水量预测
2012-07-02桑广书
施 程,桑广书
(浙江师范大学地理与环境科学学院,浙江 金华 321004)
1 研究背景
杭州市 (30°16′N,120°12′E)位于中国东南沿海, 是浙江省的省会,中国经济最发达的城市之一,属于亚热带季风气候,夏季高温多雨,冬季低温少雨,四季分明。降水丰富,但年际变化大。由于降水是水资源的主要补给来源,降水量的大小,决定着该地区水资源的丰富程度,而水资源的丰富程度又直接影响着当地工农业生产和人民群众的日常生活。因此如果能预测年降水量,就能提前做好工作部署,应对旱涝灾害,防患于未然。虽然大气降水存在着较大的不确定性,但如果能积累大量的历史数据,分析其规律,建立数学模型,仍可以利用数学方法预测年降水量。本文采用加权马尔可夫链模型,对1956—2008年的杭州市年降水量实测值进行分析,计算2009—2011年的降水状态和年降水量。利用计算值和实测值的误差来检验该模型的可行性,最后预测杭州市2012年降水状态和年降水量情况。
2 研究方法
马尔可夫(Markov)预测法,由前苏联数学家Markov(1856—1992)提出,是一种预测事件发生概率的方法。它是基于马尔可夫链,根据事件的目前状态预测其将来各个时刻 (或时期)变动的一种预测方法[1].。马尔可夫模型经过几十年的应用和不断改进,目前在生物学、天文学、物理学、地理学、气象学等领域中被广泛地应用[2].。
2.1 传统马尔可夫链原理
可以设一个随机过程X(t),在每个时刻 tn(n=1,2,…),Xn=X(tn)可以处在状态a1,a2,…,an之一,而且只在t1,t2,…,tn等可数的时刻发生状态转移。在这种情况下,如果过程在tm+k时刻变成任一状态ai(i=1,2,…,n)的概率只与tm时刻的状态有关,而与tm以前该过程所处的状态无关,该过程就称为马尔可夫链,简称马氏链[3].。
状态转移概率Pi,j(m,m+K)表示马氏链“在tm时刻出现Xm=ai的条件下,在 tm+K时刻出现Xm+k=aj”条件的概率,即 Pi,j(m,m+K)=P(Xm+k=aj丨Xm=ai)。所有的状态转移概率就可以构成状态概率转移矩阵P:
2.2 马尔可夫链的改进
传统的马尔可夫链采用概率最大隶属原则来确定预测对象的状态,但这种方法存在以下不足之处[4].:①最大隶属度原则只考虑最大概率的作用,而完全忽略了其他概率对事物产生的影响;②最大隶属度原则本身也有适用条件,当最大隶属度小于其他等级的隶属度的总和时,该原则就不再适用[5].;③最大隶属度原则只能确定对象可能出现的状态的概率,即只能推测对象在某一状态区间内,无法预测对象的具体数值。
基于上述不足之处,为了对传统马尔可夫链模型进行改进,使预测结果更加准确,前人多引入模糊集理论中的级别特征,定义级别特征值 H[2、4].:
其中
式中:η为概率的作用系数,其值越大,大概率的作用也越大,一般情况下取 η=2。根据级别特征值判断预测对象的状态后,由式(4)、(5)[5].计算预测对象的具体数值:
式中:x为预测值;Ai为状态i区间的上限值;Bi为状态i区间的下限值。
⑤为确保在任何水位组合下水流平稳、水闸稳定、水跃均发生在消力池内,要求分级启闭闸门,相邻闸门开启高差不得超过0.5 m,逐级循环启闭至计算高度e。一个操作循环结束,要留有合理的时间间隔,待水流平缓后,再进行下一个循环操作。
3 数据处理
本文根据杭州市1956—2008年的年降水量资料,利用这53 a的降水量及其状态来预测2009年的降水状态和降水量,然后把2009年的实测值加入原序列中,预测2010年的降水量,最后预测2012年的降水状态和年降水量。
3.1 计算均值及均方差无偏估计值
1956—2008年降水序列的均值及均方差无偏估计值可以由式(6)、(7)[1].计算得出:
3.2 采用均方差法将降水序列分级
水文学中通常把降水量分成5种状态:枯水年、偏枯年、平水年、偏丰年、丰水年。因此,用均方差法把该序列分为5个区间,每个区间对应一个马尔可夫状态[2].。根据表1确定历史资料序列各时段降水量所处的状态,结果见表2。
表1 杭州市年降水量分级表
表2 杭州市1956—2008年年降水量状态表[5].
3.3 建立状态概率转移矩阵
根据降水量所处的状态,计算不同步长的马尔可夫链的状态概率转移矩阵。如1956—2008年年降水量状态为1的发生9次,第2年的年降水量状态分别为:状态为1的发生4次,状态为2的发生1次,状态为3的发生2次,状态为4的发生2次,状态为5的发生0次,可以得到年降水量状态1且步长为1的状态转移概率为4/9,1/9,2/9,2/9,0。其他年份和步长的年降水量状态转移概率可依此类推。经统计,得到不同步长的状态概率转移矩阵如下:
3.4 计算序列的各阶自相关系数
自相关系数是指时间序列的前后期数值之间的相关关系程度。降水量各阶自相关系数的计算公式[1].见式(8):
式中:rk为第k阶的自相关系数;xt为第t时段的降水量,为降水量的均值;n为降水序列的长度,一般情况下计算至5阶即可。
经计算,可得降水序列的自相关系数分别为r1=0.008,r2=0.097,r3=0.083,r4=0.097,r5=-0.338。
3.5 各阶自相关系数归一化
对各阶自相关系数进行归一化,并将它们作为各种步长的马尔可夫链的权重,计算公式[5].见式(9):
3.6 判断降水状态预测降水量
以预测年之前5 a的降水量为初始状态,提取状态转移概率矩阵中初始状态对应的行向量组成新的状态概率转移矩阵,并在新组成的状态概率转移矩阵中对属于同一状态的列向量加权求和作为降水量处于该状态的预测概率,计算公式[6].见式 (10):
采用级别特征值法判断降水状态,若|H-i|<0.5,则该时段降水量所处状态为i。
根据1956—2008年的降水量序列及其相应的状态概率转移矩阵对2009年的降水状态进行预测。2004年的年降水量状态为1,距离2009年的步长为5步,就可以提取状态1的步长5的状态转移概率,依此类推,分别提取初始年份的状态和步长对应的状态转移概率,就可以组成杭州市2009年的降水状态概率转移矩阵。计算结果见表3。
表3 杭州市2009年降水状态预测表
将表3数据带入公式(2),经计算,可得H=3,|H-3|=0<0.5,则可判断杭州市2009年的降水状态为3,属于平水年。2009年杭州市降水量的实测值为1 616mm[7].,状态为3,预测降水状态与实际降水状态符合。将表3中的数据及H带入公式(4),取η=2,计算可得^x=1 670mm,与实测值对比,相对误差为3.3%。同理,把2009年的实测值带入原序列中,根据1956—2009年的降水序列可以预测出2010年的降水状态及降水量(见表4)。
表4 杭州市2010年降水状态预测表
经计算,H=2.9,|H-3|=0.1<0.5,则可判断杭州市2010年的降水状态为3,但实际状态为4。计算得^x=1 638 mm,实测值为1 728mm,相对误差为5.2%,小于20%的允许误差,因此预测仍可信。同理预测2011年杭州市年降水量 (见表5)为1 526mm,降水状态为3。该年的实测值为1 360mm[8].,相对误差为12.2%。
表5 杭州市2011年降水状态预测表
由上述计算可以看出,权马尔可夫链用于预测杭州市年降水量精度较高。尽管2010年计算的降水状态为3,实测降水状态为4;2011年降水状态为3,实际状态为2,降水状态的预测值和实测值稍有出入,但降水量计算值与实测值的误差分别为5.2%和12.2%,小于20%的允许误差,预测结果仍然可信。此外由于2011年的年降水量数据统计年鉴尚未公布,该年度的数据来源于中国气象科学数据共享服务网,该网站公布的数据与《浙江省统计年鉴》公布的数据,同一年份误差最高可达300 mm,且大多数年份该网站公布的数据小于《浙江省统计年鉴》所公布的数据,因此2011年的预测值和实测值的误差是否达到12.2%还有待验证。笔者认为,加权马尔可夫链预测精度较高,可以用于杭州市年降水量的预测。
最后将2011年实测值加入序列, 就可以预测杭州市2012年的降水状态(见表6)。
表6 杭州市2012年降水状态预测表
经计算,杭州市2012年的降水状态为4,属于偏丰年,年降水量预计为1 621mm。
4 结 语
综上所述,2009—2011年杭州市年降水量预测中,大多数年份的预测状态和预测值与实测情况相符,尽管2010年和2011年的预测状态与实际情况略有差别,但预测值与实际值的误差仍远小于20%的允许误差,与实测值比较吻合,说明加权马尔可夫链用于降水预测精度较高,可行有效,采用模糊及理论中的级别特征值结合判断降水状态,可以使结果更为可靠。预计杭州市2012年的降水状态为4,即偏丰年,年降水量为1 621mm,略多于多年平均值。根据今年上半年杭州市的实际降水情况看,降水量较往年多,因此预测值的可信度较高。但预测是否准确还有待全年实测值的验证。
[1].徐建华.现代地理学中的数学方法 [M]..北京:高等教育出版社,2011.
[2].王蓓,刘玉甫.滑动平均—马尔可夫模型在降水预测中的应用[J]..水资源研究,2009,30(2):25-27.
[3].丁晶,刘权授.随机水文学 [M]..北京:中国水利水电出版社,1997.
[4].陈才明,孙新新,白植帆.温州市年降水量的权马尔科夫链预测模型[J]..浙江水利科技,2009(2):8-13.
[5].孙映宏.基于均生函数模型的杭州市年降雨量预测 [J]..水电能源科学,2009,27(2):14-16.
[6].陈守煜.工程模糊及理论与应用[M]..北京:国防工业出版社,1998.
[7].浙江省统计局.浙江省统计年鉴2010[M]..北京:中国统计出版社,2010.
[8].国家气象信息中心.中国气象科学数据共享服务网[DB/OL].http://new-cdc.cma.gov.cn:8081/home.do.