张家口市年降水量的加权马尔科夫链预测
2014-11-09郭世娟
张 良,郭世娟
(1.河北省张家口水文水资源勘测局,河北 张家口 075000;2.保定市南水北调工程建设委员会办公室,河北 保定 071000)
张家口市属于干旱、半干旱地区,降水量是当地水资源的决定性因素,因此能够比较准确可靠的预测未来的降水量有着十分重要的意义。
由于降水受到地理纬度、大气环流、海陆位置等很多因素的影响,存在很大的随机性,因此难以通过物理成因来准确预测未来某一时段的降水量。由物理成因的定性分析及大量的降水序列资料的统计分析得知,降水量为一相依随机变量,其相依关系的强弱通常采用自相关系数作为其定量的测度[1],因此可以通过划分降水量丰枯状况的变化区间,用加权的马尔可夫链来预测张家口市未来的降水量丰枯变化,再结合模糊集理论中的特征值对张家口市年降水量进行预测。
1 加权马尔科夫链模型
1.1 马尔科夫链
马尔科夫过程是随机过程中的一个分支,具有无后效性的特点,即将来的情况只决定于现在所处的状态,与过去的情况无关。马尔科夫链是时间和状态都离散的马尔科夫过程,定义如下:设随机序列{X(n),n=0,1,2,…}的状态空间I是离散的,若在任一时刻n以及任意状态i0,i1,…,in-1,i,j,条件概率等式
成立,则称{X(n),n=0,1,2,…}为一个马尔科夫链[2]。
把式(1)扩展为
其中r为非负整数,表示系统在时刻n,状态i经r步转移到达状态j的概率。当Pij(n,r)与n无关时,称为齐次马尔可夫链。一般情况下在实际应用时可只考虑齐次马尔可夫链,记为Pij(n,r)=Pij(r)。当r=1时,Pij(1)可记为Pij。
1.2 马尔科夫链检验
用fij表示在研究序列(m个状态)中X1,X2,…,Xn中从状态i出发,经过一步转移到状态j的频数,以所有的fij为元素的矩阵就是转移频数矩阵。将转移频数矩阵各列之和分别除以各行各列总和就得到了边缘频率,把它作为边缘频率的估计,记为P·j,且
取统计量
当样本容量较大时,u服从自由度为(m-1)2的χ2分布,其中Pij为m×m转移概率矩阵。给定显著水平α,若u>(m-1)2,则认为序列服从马尔科夫性。反之,序列不能作为马尔科夫链来进行处理计算。
1.3 加权马尔科夫链模型计算步骤[3-6]
加权马尔科夫链指对于一系列的随机变量,经检验满足马尔科夫性后,需用相关的阶(各种步长)作出的加权马尔可夫链来预测未来某时段的指标值,各阶自相关系数刻画了各种滞时的指标值的相关关系的强弱,因此,可考虑先分别依其前面若干年的指标值所对应的状态对该时段的状态进行预测,然后,按前面各时段与该时段相依关系的强弱对绝对(转移)概率加权求和。
(1)计算研究序列的均值¯X、标准差σ。
(2)建立研究序列分级标准,将年降水序列分成丰水年、偏丰水年、平水年、偏枯水年、枯水年5个状态。
(3)进行马尔科夫性检验,若达到要求,进行下一步计算,否则不能作为马尔科夫链来进行处理计算。
(4)计算降水量序列的各阶自相关系数:
式中:rk为第k阶(滞时为k)的自相关系数,k为滞时(步长),k=1,2,…,m;Xn为第n时段的指标值;为序列的均值,L为研究序列的长度。
(5)对各阶自相关系数进行规范化,即
式中:tk为规范化相关系数,m为预测需要计算到的最大阶数。
(6)分别以前面若干时段的指标值为初始状态,结合其相应的各阶转移概率矩阵即可预测出该时段指标值的状态概率。
(7)将同一状态的各预测概率加权和作为指标值处预测概率:
max{pi}即为该时段指标值的预测状态。
2 基于模糊集理论中的级别特征值的预测[7-8]
引入模糊集理论中的级别特征值,定义级别特征值
式中:M 为级别特征值,Ni为权重集{N1,N2,N3,N4,N5},b为概率的作用系数,其值通常取2或4,其值越大,越突出大概率的作用,本文取4。根据级别特征值判断降水量的丰枯状态后,由式(7)计算降水量。
式中:R为预测的降水量;i为降水量预测状态;Ai,Bi分别为状态区间的上限值与下限值。
3 张家口市降水量加权马尔可夫链预测模型
张家口市1970~2010年的年降水量序列见表1,以此序列为基础预测2011年和2012年的年降水量。
表1 张家口市1970~2010年年降水量表
(1)计算求得降水量多年平均值¯X=384.8mm,标准差σ=82.95mm。
(2)利用降水量多年平均值和标准差两项指标将张家口市年降水序列分成丰水年、偏丰水年、平水年、偏枯水年、枯水年5个状态,见表2。
表2 张家口市年降水量分级表
(3)马尔科夫性检验。由表1的年降水量的频数转移矩阵,再结合步长为1的一步转移概率矩阵P(1),可算得统计量u=32.5466,给定显著性水平α=0.05,可得分位点χ2(16)=27.283。由于u>χ2(m-1)2,因此,张家口市年降水量序列满足马尔可夫性的要求。
(4)计算年降水量序列的各阶自相关系数及权重,见表3。
表3 各阶自相关系数和各步长权重表
(5)依据2010~2006年的年降水量,采用表3中的权重系数,对2011年的年降水量进行预测,见表4。由表4可以看出,max{pi}对应的年降水量预测状态为1,2011年实际年降水量为262.3mm,与预测的状态值完全吻合。
表4 2011年的年降水量预测
(6)根据模糊集理论中的级别特征值公式计算出2011年的年降水量为275.5mm,相对误差为5%,具有较好的准确度。
(7)同理,根据步骤(5)和(6)将初始年2010~2006年的降水量采用滞时2~6对2012年的年降水量进行预测,max{pi}对应的年降水量预测状态为3,2012年的实际年降水量为400.5mm,与预测的状态值完全吻合。根据模糊集理论中的级别特征值公式计算结果为386.4mm,相对误差为-3.5%,同样具有较好的准确度。
4 结语
通过以上分析可知,加权马尔可夫链对数据要求较少,精度较高,根据张家口市1970~2010年的年降水量资料预测出2011年、2012年的年降水量预测状态,分别属于枯水年、平水年,再依据模糊集理论中的级别特征值确定2011年、2012年的年降水量,与实际年降水量相对误差仅为5%和-3.5%,结果十分可靠。对提高降水量预报精度提供了一条新的方法。
[1]孙才志,林学钰.降水预测的模糊权马尔可夫模型及应用[J].系统工程学报,2003(4):294-299.
[2]黄振平.水文统计学[M].南京:河海大学出版社,2003:316.
[3]冉景江,赵燮京,梁川.基于加权马尔可夫链的降水预测应用研究[J].人民黄河,2006,28(4):32-34.
[4]陈守煜.中长期水文预报综合分析理论模式与方法[J].水利学报,1997(4):15-21.
[5]孙才志,张戈,林学钰.加权马尔可夫链在降水丰枯状况预测中的应用[J].系统工程理论与实践,2003(4):100-105.
[6]刘德地,陈晓宏.一种北江流域年降水量的权马尔可夫链预测模型[J].水文,2006(6):23-26.
[7]仲远见,李靖,王龙.改进马尔科夫链降雨量预测模型的应用[J].济南大学学报:自然科学版,2009,23(4):402-405.
[8]王涛,钱会,李培月.加权马尔可夫链在银川地区降水量预测中的应用[J].南水北调与水利科技,2010(1):78-81.