APP下载

基于随机Markov链的风向时间序列模型研究

2016-09-13刘吉臻林忠伟

现代电力 2016年3期
关键词:风向修正阈值

祝 牧,刘吉臻,林忠伟

(华北电力大学控制与计算机工程学院,北京 102206)



基于随机Markov链的风向时间序列模型研究

祝牧,刘吉臻,林忠伟

(华北电力大学控制与计算机工程学院,北京102206)

0 引 言

由于环境形势的日益严峻,发展可再生能源成为了当今能源发展的主题,风力发电和其他可再生能源在电力系统中的比重不断增加。根据全球风能理事会的统计数据表明[1],2014年全球新增装机容量为51.47GW,全球累计装机容量达到了369.6GW。而在同一时间,中国[2](不包括台湾地区),新增装机为23.2GW,累计装机容量达到了114.6GW,中国新增装机容量和累计装机容量均居世界第一。根据《中国风电发展路线2050》[3],在基本场景下,到2020、2030和2050年,风电装机容量将分别达到200GW、400GW和1 000GW;而在积极场景下,到2020、2030和2050年,风电装机容量将分别达到300GW、1 200GW 和2 000GW。

然而由于风具有较大的波动性和不可预测性,而且,风电场大多处于电网的末端,电网强度较弱,并且远离负荷中心,本地消纳能力不足,这就造成了“弃风”现象频发。根据国家能源局统计数据表明[4],2015年,风电“弃风”形势加剧,全年弃风电量339亿kWh,同比增加213亿kWh,平均弃风率15%,同比增加7个百分点,其中甘肃地区弃风率甚至达到了39%。为了解决“弃风”问题,探索大规模风的波动规律显得迫在眉睫。现有的对风模型的研究,包括风特性分析[5-8]、风速预测[9-12]等研究。

在这些研究中往往仅仅关注风速的大小,对风向的研究相对较少。风向与风速相比较,其变化相对缓慢。当建立一个完整的风模型时,应当将风向也加入到模型中去。文献[13]通过分析历史同期风向和风速数据之间相关性的基础上,建立了一个利用历史同期数据预测风速和风向的模型,这种方法在风速预测效果较好,而风向预测效果较差。文献[14]在气象研究中,利用模式输出统计法(Model Output Statistics,MOS)进行了风向矢量预测,其模型对气象站数据的要求较高,难以应用于风电场的风向预测中。

Markov链模型是随机过程研究中非常经典的模型之一,该模型被应用于多种随机过程的研究中,如排队模型[15]、人口迁移[16]等问题的研究中。隐Markov模型也常被应用于生物信息学的研究中[17]。而在风力发电的研究中,也有学者将Markov链模型应用于风速预测[18]和功率预测[19]中。

本文基于随机Markov链模型提出了一种风向时间序列模型,并选取气象学中的16风向作为Markov链模型的状态空间划分的依据。模型验证表明,该模型生成的风向时间序列较好地保存了原始风向时间序列的统计特性,从而,通过随机Markov链模型,可以生成任意时间长度的风向时间序列。这样生成的风向时间序列,可以应用于完整风模型的研究中。

1 Markov链模型

1.1Markov链模型的基本原理

Markov链模型[20-22]是可以凭实验估计观测系统离散状态之间的转移概率来表示的随机过程。在一阶的Markov链中,每个后续状态只依赖于紧接之前的状态。二阶或更高阶的Markov链的过程,在该过程中的后续状态取决于在两个或更前面的状态。

对于一阶Markov链模型,设Xt是一个随机过程,该随机过程可能处于的状态集合称为状态空间,记做状态空间S={1,2,…,M},在一般情况下,对于一个给定序列的时间点t1

(1)

定义Markov转移概率pi,j为当前时刻状态为i时,下一时刻状态为j的概率:

(2)

若随机过程的状态数为M,则相应的由全部转移概率构成的矩阵为M×M阶的,一阶Markov状态转移矩阵P为

(3)

一阶Markov转移矩阵具有如下性质:

(4)

即每一行的概率和为1。

若ni,j是从状态i到状态j序列的转移频数,转移概率pi,j的最大似然估计是

(5)

1.2风向模型状态划分

现有研究表明,当数据量足够时,状态划分的越细,其所建立的Markov链模型精确度越高。在气象学中常用的风向划分有8风向、16风向等。在本文的研究中,选取了16风向作为状态划分的依据,即将360°的全风向以22.5°作为一个区间,其示意图如图1所示。

图1 风向16方位图

风向区间的具体范围如表1所示。

表1 风向状态划分表

1.3Markov性检验

一般来说,对一个事物进行研究时,必须知道它过去的发展趋势和现在的状态,大多数预测方法都遵循这一规律。然而,当运用Markov链对事物进行预测的时候,不需要考虑其过去的发展趋势,只要掌握当前状态的情况,就可以对其将来的情况进行预测。这种Markov模型所特有的无后效性的特性,定义为Markov性。这个特性减少了研究者需要做的前期准备工作,使得Markov链的实用性大大增加。

在运用Markov链理论进行建模之前,必须首先对原始数据进行Markov性检验。

假设我们所研究的时间序列数据被分为m个可能的状态,ni,j表示已知序列中从状态i转移到状态j的频数,pi,j表示已知序列中从状态i转移到状态j的概率。将转移频数矩阵中,第j列的频数之和,除以整个矩阵的频数之和(即数据的个数),定义为p·,j,也就是“边际概率”:

(6)

当数据量足够大时,统计量:

(7)

本文的风向时间序列可得状态空间数为16的,一步转移概率矩阵(见附录A)。

1.4风向时间序列的生成

在实际风速生成的过程中还需要用到累积概率pCDF,一阶Markov链累积概率密度计算公式如下:

(8)

对于一阶Markov链模型生成的风向时间序列,它的初始状态i,是完全随机选择的。通过一个均匀分布的随机数发生器,生成在0和1之间的均匀分布的随机数ε。在一阶Markov模型中,计算下一时刻风速状态时,将随机数ε与累积概率转移矩阵的第i行的元素相比较。如果该随机数的值比累积概率前一时刻的状态大,但小于或等于累积概率下一时刻状态,则下一个时刻的状态被采纳。即已知当前状态为i,存在且只存在唯一的j使得

(9)

则此时下一个状态为j。

当然,通过随机数ε与累积概率矩阵相比,我们只是得到了一个风向状态的序列,要将其变成实际的风向时间序列的值,还需要利用下面的公式:

(10)

式中:Dr和Dl分别是风向状态的上下边界,它们的差也就是状态的宽度,本文的16风向划分的状态宽度为22.5°。Yi是均匀分布的在0到1之间的随机数,D即是实际风向。对于风向状态1,利用公式(10)计算可能会出现负数或大于360°的数值,当出现这种情况时,出现负数则在负数上加上360°,则为实际风向,同理出现大于360°的情况则是减去360°。

2 模型验证

本文的建模采用的历史数据,来自某风电场的测风塔,选取数据的时间跨度为2011年9月1日至2011年12月1日,数据的采样间隔为15min,共有8 760个数据点,其16风向的玫瑰图如图2所示。

图2 历史数据风向玫瑰图

由图2可知,该季节存在一个主风向北东北(NNE)。通过计算得到了16风向的状态转移矩阵P(16×16)。限于篇幅我们将该矩阵列在了文后的附录A中。

2.1模型生成风向时间序列

由于风向具有极强的季节性,因此我们选取与建模数据同属一个季节的另一段数据进行模型验证,验证时间段从2012年10月7日开始,共连续选取了1 000个数据点。选取验证数据的首个风向数据作为Markov风向模型风向生成的初始状态,利用一阶Markov状态转移矩阵,以及公式(9)和(10),生成了一个包含1 000个数据点风向时间序列,验证数据与生成数据的风向频数对比如图3所示。

图3 验证数据与生成数据频数对比图

验证数据风向频数与生成数据风向频数的差距极小,Markov链模型很好地保持了风向时间序列的分布特性(即风向时间序列的频数和频率特性),图3中局部放大的部分,是图中差异较为明显的部分,16个风向验证数据与生成数据的频数和频率如表2所示。

表2 验证数据与生成数据的频数和频率

2.2统计特性保存

利用风向模型生成的时间序列,其对历史数据的统计特性保存的非常完整,其一般统计参数如表3所示。

表3 一般统计特性

一般的统计参数这里不再多余陈述,这里着重介绍一下百分位数。百分位数又称百分数(percentile),在统计过程中,将全部数据从小到大排序,之后将其按大小顺序等分为一百段。百分位数就在段边界的特定点,它表明在序列中有多少百分比的值小于该值。假设在一个数据序列中,50%的百分数是15,那就表明在序列中小于15的值占整个序列的50%。

由此可知,本文所建立模型能非常好地保持风向时间序列的统计特性。

2.3模型自相关性分析

自相关函数是研究时间序列特性时最常用的工具之一。自相关函数能反映时间序列相邻量之间的关联程度和依赖程度,是研究时间序列必不可少的工具。通过观察自相关函数随滞后时间变化的图像,可以得到很多结论。若自相关系数伴随着滞后时间的增加很快下降则可以认为该时间序列是平稳的;反之,如果没有观察到这种情况,那么所研究时间序列就不是平稳的。

表4 百分位数表

定义滞后为k,时间序列长度为n,则其自相关系数ρk计算公式如下:

(11)

验证数据和生成数据自相关系数如图4所示。

图4 验证数据和生成数据自相关性

在滞后时间相同时,生成序列与历史数据的相比,其自相关系数值差值较小。

2.4功率谱密度

功率谱密度是时间序列分析中非常重要的一个参数,其从频域这个角度体现了风向时间序列的统计特性。利用Matlab中的功率谱函数,我们得到了验证数据和生成数据的功率谱曲线,如图5所示。

图5 验证数据与生成数据频率对比

由图5可知,这两条曲线非常接近。可知Markov模型生成的风向时间序列,较好地保持了风向时间序列的功率谱特性。

2.5风向模型预测性能分析

2.5.1误差公式选择

为了对预测性能进行评估,采用NRMSE(标准均方根误差)表达式。

预测误差etk为tk时刻的测量真值D(tk)与预测值D′(tk)的差,即

(12)

标准化预测误差:

(13)

由于风向角有极大值,因此

Dmax=360

(14)

最终预测误差ENRMSE为

(15)

式中:NT为用于评价预测误差所用数据的个数。

2.5.2修正阈值选取

利用Markov链模型生成的风向,能够非常好地保留原始数据的各种统计性质等。但其Markov性会造成当实际风向序列发生小概率突变时,由于其并不含有动态更新的环节,模型无法获知风向发生了突变。从风向突变开始,其生成的时间序列会出现误差累加的现象,这样会造成模型的预测误差过大。

因此,在利用Markov链模型进行预测时,需要加入误差阈值,当预测状态与实际风向状态有一个风向状态的偏差时,则累积状态误差累加1,当累积状态误差到达误差阈值时,则读入最近一个时刻的实际数据,重新进行风向预测。

以采样间隔15min为例,选取不同的误差阈值,其预测误差与平均修正间隔,以及预测阈值与预测误差之间的关系如图6所示。

图6 修正阈值与平均修正间隔以及预测误差关系图

由图6可知,当选取一个较小的修正阈值时,模型可以获得一个较小的预测误差,而同时其平均修正间隔较短,修正会过于频繁,使得预测失去价值;但当选取一个较大的修正阈值时,修正不再频繁,但其预测误差会变大。因此,为Markov模型选取合适的修正阈值,值得我们在之后的研究中,进行更加深入的讨论。

2.5.3预测效果

选取一段同一个季节的数据(2012年11月4日11时-15时)共4h的数据,对模型的预测效果进行验证。该段风向数据包含一个风向的突变。通过观察Markov概率状态转移矩阵,可知相邻的两个风向之间,发生4个风向或4个风向以上跳变的概率极低,低于5%。在这种情况下,我们定义相邻两个风向数据之间发生4个或4个以上风向变化时,可认为风向发生了突变。在预测验证中,选取5作为模型的误差阈值。实际风向序列、带阈值修正的预测模型与不带阈值修正的预测模型效果如图7所示。

图7 Markov模型阈值修正前后预测效果图

由图7可知,当实际风向发生突变时,带阈值修正的模型预测效果明显优于不带阈值修正的模型。

3  结束语

本文提出了一种基于随机Markov链的风向时间序列模拟模型。并以气象学中常用的16风向划分对风向时间序列进行了状态空间划分,建立了Markov链风向模型。模型验证的结果表明,本文所建立模型生成的风向时间序列较好地保留了原始数据的性质。证明通过随机Markov链建模,然后生成任意时间长度的风速序列的方法是可行的。在最后的预测效果验证中,可知本文模型在加入修正阈值进行预测修正后具有较高的准确性。

本文提出的方法、模型以及得到的结论可以为建立更加完整的风模型提供支持,并在加入阈值修正后,其短期风向预测效果较好。

[1]GWEC(Global Wind Energy Council). Global wind report 2014[EB/OL]. http://www.gwec.net/,2016-02-15.

[2]中国风能协会. 2014中国风电装机容量统计[EB/OL]. http:// www.cwea.org.cn/,2016-02-11.

[3]能源研究所(NDRC),国家可再生能源中心(CNREC), 国际能源署(IEA),中国风电发展路线2050(2014版) [EB/OL]. http://www.cnrec. org.cn/,2016-02-17.

[4]国家能源局. 2015年风电产业发展情况[EB/OL]. http://www.nea.gov.cn/, 2016-02-17.

[5]彭虎,郭钰锋,王松岩,等. 风电场风速分布特性的模式分析[J]. 电网技术,2010(9):206-210.

[6]曹娜,于群,戴慧珠. 风速波动时风电场动态特性分析[J]. 太阳能学报,2009(4):497-502.

[7]Ro K S, Hunt P G. Characteristic wind speed distributions and reliability of the logarithmic wind profile [J]. Journal of Environmental Engineering, 2007, 133(3):313-318.

[8]Dicorato M, Forte G, Trovato M. Wind farm stability analysis in the presence of variable-speed generators [J]. Energy, 2012, 39(1):40-47.

[9]王飞, 段家华. 基于在线支持向量机的风速预测方法研究[J]. 太阳能, 2015(5):57-60.

[10]Torres J L, García A, Blas M D, et al. Forecast of hourly average wind speed with ARMA models in Navarre [J]. Solar Energy, 2005, 79(1):65-77.

[11]Chen K, Yu J. Short-term wind speed prediction using an unscented Kalman filter based state-space support vector regression approach [J]. Applied Energy, 2014, 113(6):690-705.

[12]Liu H, Tian H Q, Li Y F. Comparison of two new ARIMA-ANN and ARIMA-kalman hybrid methods for wind speed prediction [J]. Applied Energy, 2012, 98(1):415-424.

[13]El-Fouly T H M, El-Saadany E F, Salama M M A. One Day Ahead Prediction of Wind Speed and Direction [J]. IEEE Transactions on Energy Conversion, 2008, 23(1):191-201.

[14]曾晓青, 赵声蓉, 段云霞. 基于 MOS 方法的风向预测方案对比研究[J]. 气象与环境学报, 2013(6):140-144.

[15]蒋阳升, 胡路, 蒲云. 随机到达车辆信号交叉路口的Markov链排队模型[J]. 西南交通大学学报, 2010, 45(4):621-626.

[16]陈兰, 申志慧, 郑玮锋,等. 人口迁移的空间相互作用、Markov 链和线性规划分析——以福建省南平市为例[J]. 吉林师范大学学报:自然科学版, 2014(4):148-153.

[17]黄影. 隐马尔可夫模型在生物信息学中的应用[J]. 电子科技, 2015, 28(8):185-189.

[18]章伟, 邓院昌. 基于组合模型的短期风速预测研究[J]. 电网与清洁能源, 2013, 29(7):83-87.

[19]周封, 金丽斯, 刘健,等. 基于多状态空间混合Markov链的风电功率概率预测[J]. 电力系统自动化, 2012, 36(6):29-33.

[20]基赫曼. 随机过程论[M]. 北京:科学出版社, 1986.

[21]斯注克. Markov过程导论[M]. 北京:高等教育出版社, 2007.

[22]Puterman M. Markov Decision Processes: Discrete Stochastic Dynamic Programming [J]. Technimetrics, 1994, 37(3):353.

(责任编辑:林海文)

附录A

风向Markov状态转移

Study on the Time Series Model of Wind Direction Based on Stochastic Markov Chain ZHU Mu, LIU Jizhen,LIN Zhongwei

(School of Control and Computer Engineering,North China Electric Power University, Beijing 102206,China)

基于随机Markov链模型提出了一种风向时间序列模拟模型。该模型选取气象学中较为细致的风向划分方法-16风向,作为Markov链模型状态空间划分的依据。模型验证表明,随机Markov链模型生成的风向时间序列较好的保留了原始数据分布特性、自相关特性、功率谱特性等统计特性。这证明,通过Markov链建模,然后生成任意时间长度的风向时间序列的方法是可行的,且在加入阈值修正后,该模型的短期风向预测效果较好。

Markov链;风向模型;自相关系数;功率谱

A time series model of wind direction is presented based on stochastic Markov chain model in this paper, in which the 16 wind-direction partitioning method in meteorology is used as the basis for partitioning the state spaces of stochastic Markov chain model. Model verification shows that the generation of time series of wind direction by stochastic Markov chain model can retains such better statistical characteristics as distribution characteristic of original data, autocorrelation coefficient and power spectrum characteristics. It is proved that it is feasible that the time series of wind direction in arbitrary time length is generated based on the stochastic Markov chain model, and the model has better prediction effect in forecasting wind direction by introducing threshold correction.

Markov chain; wind direction model; autocorrelation; power spectrum

1007-2322(2016)03-0001-07

A

TM614

国家重点基础研究发展计划(973计划)资助(2012CB215203)

2016-02-20

祝牧(1989-) ,男,博士研究生,研究方向为大型风电场群运行特性与优化控制研究等,E-mail:zhumu121@163.com;

刘吉臻(1951-),男,教授,博士生导师,主要研究方向为复杂系统建模与控制工业过程测控理论与技术等, E-mail:ljz@ncepu.edu.cn;

林忠伟(1981- ) ,男,副教授,研究方向为新能源电力系统建模与控制等, E-mail:lzw@ncepu.edu.cn。

猜你喜欢

风向修正阈值
Some new thoughts of definitions of terms of sedimentary facies: Based on Miall's paper(1985)
修正这一天
小波阈值去噪在深小孔钻削声发射信号处理中的应用
基于CS-TWR的动态阈值贪婪算法成像研究
基于自适应阈值和连通域的隧道裂缝提取
逆风歌
市场监管总局成立后的直企监管风向
软件修正
基于PID控制的二维弹道修正弹仿真
基于迟滞比较器的双阈值稳压供电控制电路