基于Johnson分布直接转换法的风速预测

2014-09-27王娟娟赵闻蕾王兴强靳小钊

电力自动化设备 2014年6期

王娟娟，赵闻蕾，王兴强，靳小钊

（大连交通大学电气信息学院，辽宁大连 116028）

0 引言

当前，我国多个区域电网处于风电大规模开发且计划上网而系统调峰能力有限的环境之下，故风电并网消纳问题引起了众多学者的关注[1-4]。该问题产生的根源即风速的波动性和随机性使得风电出力呈现出间歇性和不确定性的特点。因此，风电预测的精确度直接关系到调度中心机组组合、发电计划、调峰策略、备用容量优化等的计划与安排。风电预测的精确度越高，风电对电网的影响越小。

风电预测分为风速预测[5]与风电功率预测[6]两大类，因风速与风电功率相比更具有规律性[7]，故基于风速的风电预测更准确。在现有的多种风速预测方法中，时间序列预测法[5，7]是一种较常见的预测方法，虽然基于其得到的风速预测结果可控制在一定误差范围之内，但实际上此预测误差可进一步降低，也即基于该方法的预测结果的精度可进一步提高。这是因为风速大多呈现非正态分布的特性[8]，而目前常用的时间序列预测模型的预测对象却为平稳、正态、零均值的时间序列[9]。虽然将非正态数据序列进行正态化处理的方法有多种，如平方根转换、对数转换、季节性差分等[10-11]，但针对具体数据序列，选择何种转换方法需有较丰富的数学经验，且需对数据进行多次转换，计算过程复杂。

据此，本文在基于时间序列法对风速进行预测的基础上，采用Johnson分布直接转换对预测结果进行修正，即采用Johnson分布直接转换法[12]进行风速的预测。主要内容为：对原始风速数据进行初步处理之后，基于时间序列法建模，得到初步的预测结果；然后基于原始风速数据的四阶距，确定合适的Johnson转换曲线及其分布参数；最后基于该转换曲线修正初步预测结果，得到更符合实际风速数据的预测结果。仿真结果表明，在将具有正态概率分布特性的初步预测结果转换为非正态分布序列之后，风速的预测精度有了进一步提高，本文所提出的方法是有效且可行的。

1 基于Johnson分布直接转换法的风速预测算法

时间序列预测法即基于一系列按时间排列的平稳序列，探究其内在的变化规律，然后进行引伸外推，以预测其发展趋势的方法。而Johnson分布直接转换则是将非正态分布序列转换为正态分布序列的转换方法，其实质即针对非正态分布的时间序列，将由时间序列法得到的预测数据转换为更接近原始数据分布特性的数据序列。因Johnson分布直接转换可在2个具有相当不同分布的随机序列之间建立联系，使其具有几乎相同的自相关函数[12]，故本文将其应用至呈现非正态分布的风速序列的预测中。为便于叙述，下文将Johnson分布直接转换简称为Johnson转换。

1.1 算法流程

本文算法具体包括以下步骤。

a.原始数据的预处理。对风速数据序列首先进行零均值检验，若其均值不为零，则对序列进行零均值化处理；然后，对零均值化序列进行平稳性检验，若其不平稳，则需对不平稳序列进行平稳化处理以改善其平稳性；最后对平稳序列进行正态性检验。

b.模型的识别。判断处理后序列的自相关函数和偏相关函数的特性，依据其属于截尾还是拖尾确定应选用自回归AR（Auto Regressive）模型、滑动平均MA（Moving Average）模型或者自回归滑动平均ARMA（Auto Regressive Moving Average）模型中的哪一种。

c.模型的定阶。在模型确定之后，采用试探法进行模型阶数的确定，较常用的评价模型优劣的准则之一为最小信息量准则AIC（Akaike Information Criterion）[13]。

d.模型参数估计。模型的阶数即决定了参数的个数，参数估计的常用方法为最小二乘法。

e.准则校验。模型建立之后即要检验模型误差是否为平稳白噪声，若是平稳白噪声则通过检验，否则重新进行定阶与参数估计，直至通过检验。可采用χ2检验法进行准则校验。

f.若原始风速数据不满足正态性检验，且经拟合优度检验之后，也不符合任意一种特殊分布，则需对上述预测结果进行修正，即进行Johnson转换。

算法流程如图1所示。

图1 基于Johnson分布直接转换法的风速预测算法流程图Fig.1 Flowchart of wind speed prediction based on Johnson direct transformation

1.2 Johnson转换

如何根据已知样本数据构建合适的Johnson转换曲线是本文方法需解决的关键问题。

目前已有多种构建Johnson转换曲线的方法，其中样本百分位数法[14]因简单有效而得到广泛应用，该方法的具体步骤如下。

a.选择一个合适的代表性数值z，通过标准正态分布表找出对应于｛-sz，-z，z，sz｝的分布概率p-sz、p-z、pz、psz，其中s一般取3，使得上述分布概率能在样本数据累计中得到充分确定。

b.在原始样本数据中找出与上述概率对应的分位数 xsz、xz、x-z、x-sz，并令 m=xsz-xz、n=x-z-x-sz、p=xz-x-z，定义分位数比率rQ=mn/p2。

c.若 rQ＜1，则选择 SB分布；若 rQ=1，则选择 SL分布；其他情况选择SU分布。

d.在确定了Johnson分布类型之后，Johnson转换曲线即可确定，其分布参数δ、λ、γ、ζ也可求得。

e.通过得到的Johnson转换公式，即可对前述由时间序列法得到的预测结果进行修正。

2 实例分析

以我国某地区风电场的实测风速数据为例进行分析，该风电场的风速具有波动较剧烈、波动幅值不均匀的特点。在采样时间间隔为1 h的情况下，某月内12天的原始风速数据，即288点的数据序列见图2。

图2 12 d的风速数据序列Fig.2 Wind speed sequence for 12 days

基于MATLAB模拟软件，以前240个数据作为历史数据，建立预测模型，对后48个数据进行预测，即以前10天的风速数据预测最后2天的风速。

2.1 基于时间序列法的风速预测

依据前述步骤，首先在MATLAB环境下采用mean（）函数对前240个原始风速数据进行零均值检验，其均值非零，故需进行零均值化处理；然后对初步处理之后的数据采用adftest（）函数进行平稳性检验，检测结果为1，则数据平稳；最后再对此数据采用ksteat（）或 normplot（）函数进行正态性检验。由检验结果可知，此时该序列为非正态分布的随机平稳序列，故需先对该数据序列进行时间序列建模。

首先进行模型的识别。注意在调用MATLAB自相关函数和偏相关函数时，一方面需将延迟参数定义得大一些，以便更加直观和准确地观察自/偏相关函数的相关变化特性；另一方面，有时仅凭借观察难以得出自/偏相关函数具有截尾特性还是拖尾特性，这是因为参数估计具有随机性，故即使数据序列呈现截尾的特性，其相关函数有时也会在0附近上下波动。因此，为了提高模型识别的准确度，通常还要用区间检验法加以判断，即若函数呈几何方式衰减，且其在某一范围之内波动变化，则可认为此序列具有截尾性质[15]。上述序列的前200个自相关函数值和偏相关函数值及其相应的置信区间的近似上下界如图3和4所示。

由图3、4可见，该序列的自相关函数和偏相关函数均具有拖尾性，故应采用ARMA模型。

模型确定之后即可进行模型的定阶和参数估计，最终确定的模型为 ARMA（5，10）。经 χ2检验法检验可知，该预测模型可行。则由时间序列预测法所得的预测结果与原始数据间的对比如图5所示。

图3 原始风速序列的自相关函数Fig.3 Autocorrelation function of originalwind speed sequence

图4 原始风速序列的偏相关函数Fig.4 Partial correlation function of original wind speed sequence

图5 原始数据与基于时间序列法的预测数据对比图Fig.5 Comparison between original data and predicted data by time series method

对预测数据进行chi2检验，可知该预测数据序列近似服从正态分布，而原始数据序列并不服从正态分布。为了使预测数据更接近原始数据的分布特性，需对预测数据进行修正，即采用Johnson转换曲线对预测数据进行转换。

2.2 Johnson转换对预测结果的修正

2.2.1 z值的选择

因Johnson转换的原始转换式是要将非正态数据序列转换为正态序列，故理论上z的选取应以转换后数据序列的正态性最好为原则。因此要考虑分位值的代表性，但为了减少计算量，也需考虑样本量，故一般采用多次重复尝试的方式[14]。Chou等建议最理想的 z值范围为 0.25、0.26、…、1.25，即从 0.25 增长至 1.25，步长为 0.01[16]。

因本实例中原始数据较多，故在采用上述重复尝试方法确定z值之前，先借鉴文献[14]的思路，将z的上限控制为0.89，以缩小理想z值的搜索范围。经反复验证，本实例中z的取值为0.56时，经Johnson转换之后的数据的正态性最好。

2.2.2 分位数的确定

z值确定之后，根据分布概率，即可求得分位数。但在样本数据中并不是每次都可以直接得到分位数，此时，可采用内插法[14]得到近似的分位数。

2.2.3 Johnson转换曲线的选择

由分位数的计算结果可知rQ＞1，故选择SU分布。此时，对应的Johnson转换曲线为：

则非正态数据序列x转换为标准正态分布数据序列y的转换式为：

因本文需将预测得到的正态数据序列转换为更符合原始数据序列分布特性的非正态分布序列，故所需要的Johnson转换公式为：

其中，y为时间序列法的预测结果；x为经Johnson转换之后的非正态数据序列。

2.2.4 Johnson转换的转换结果

时间序列法的预测数据、原始数据及Johnson转换的结果所对应的正态概率图如图6所示。由图可见，因Johnson转换曲线是根据原始数据的数据特性确定的，故时间序列法的预测结果经由Johnson转换之后更加接近原始数据的非正态特性。

图6 时间序列预测结果与原始数据及预测修正结果的正态概率图Fig.6 Normal probability chart of predicted data by time series method，original data and predicted data by proposed method

综上所述，原始数据与预测结果及预测修正结果如图7所示。

图7 原始数据与预测结果及预测修正结果的对比图Fig.7 Comparison among original data，predicted data by time series method and predicted data by proposed method

2.2.5 误差分析

文献[7]定义了风速预测的绝对平均误差e：

根据此定义，由时间序列预测法和Johnson转换法得到的预测结果与原始数据的绝对平均误差分别为29.5%与22.33%。由此可见，利用Johnson转换对时间序列法的预测结果进行修正之后，预测精度有了进一步提高。

3 结论

风速预测对于风电的大规模发展以及电力系统的稳定运行具有重要意义。时间序列法用于风速预测是有效的，但其预测结果多为正态分布的数据序列，而大多数的原始风速数据呈现出非正态分布的特性。故本文将Johnson转换法应用在风速预测中，即根据原始数据的四阶距，构建合适的Johnson转换曲线，对时间序列法得到的预测结果进行修正，从而使得风速预测精度进一步提高。