基于最大熵原理的联合风速风向概率密度函数建模方法
2021-05-27陈友慧
陈友慧,王 淼,刘 岩,高 阳
(1.国网辽宁省电力有限公司经济技术研究院,辽宁 沈阳110015;2.沈阳工程学院 电力学院,辽宁 沈阳110015)
0 引言
电力系统中的输电线路和输电杆塔由于受到风速和风向(即风载荷)长时间的直接作用,会产生倾斜、断裂、倒塌等事故。因此研究风速、风向的概率分布及其建模,对于输电线路、输电杆塔等一次设备的选型、参数设计具有重要的理论和实际意义。
传统上对于风速、风向的概率分布有三类研究思路。第一类研究主要侧重于风速的概率分布模型,如威布尔概率分布及其改进方法[1]~[4]、瑞利概率分布及其改进方法[5]、极值概率分布及其改进方法[6],[7]、高斯概率分布及其改进方法[8]、帕累托概率密度分布、正态分布、Gamma分布、GEV分布、最大熵分布等[9]。第二类主要侧重于风向的概率分布。文献[10],[11]得到了风向服从高斯分布的研究成果。文献[12]~[16]提出了风向服从不同时间级,如秒级、分钟级、小时级的概率密度函数,但并没有深入给出各个时间级的概率密度函数。
第三类研究是在建立风速概率密度分布模型的同时,建立风向的概率密度分布模型。文献[17]指出,忽略风向将会低估建筑结构的疲劳损伤。文献[18],[19]从结构顶部加速度响应的均方根值表征的近似解析表达式,提出了风速风向联合分布的概率模型。文献[20],[21]基于Copula函数和帕累托混合模型,提出了多风向极值风速估计方法。文献[22]~[24]提出了风向频度概率分布,并通过与风速条件概率分布、谐波函数、对数正态分布联合,提出了风速风向联合概率密度分布模型。文献[25],[26]基于最大熵原理,建立了极值风速的Gumbel分布和风向的二阶混合von Mises分布的联合概率密度函数。
目前,对于风速、风向概率密度的研究没有经过最大熵原理单独、综合的检验,因而与实际仍然具有一定的偏差。对此,本文将最大熵原理应用至风速、风向概率密度推导,继而演绎至风速风向联合概率密度分布。
1 基于最大熵的风速概率密度
1.1 最大熵原理
最大熵准则:通常情况下,随机变量的概率分布一般只能测得其某种均值(如数学期望、方差等)或已知某些限定条件下的值(如峰值、取值个数等)。符合上述值的分布可能存在多种,而其中一种分布的熵最大。选用这种具有最大熵的分布作为该随机变量的分布,是一种有效的处理方法和准则。最大熵原理用数学模型表示为
式中:x为随机变量;p(x)为随机变量的概率密度;S(x)为熵值;αn为p(x)的N阶原点矩;N为一个较大的正整数。
1.2 最大熵风速概率密度函数
为了获得最大熵原理下的风速概率密度函数,设某时刻风速为vt,其对应的风速概率密度函数为p(vt),将其表示至式(1)中可得:
为了求解式(2)的最大值,通常联合约束条件构造拉格朗日函数:
式中:λ0,λ1,…,λn为拉格朗日乘子。
当式(2)获得最大值时,式(3)中的拉格朗日函数导数为0。对式(3)进行求导可得:
式(6)即为最大熵原理下的风速概率密度分布模型。其中还存在拉格朗日乘子λ0,λ1,…,λn,可以对式(3)求偏导获得:
式(7)等式左边为仅含有拉格朗日乘子的待求量,右边αi为概率密度函数p(vt)的N阶原点矩,可以通过采集样本计算得到,下面给出计算原理。
根据概率论可知,风速的概率密度分布在其变量范围内积分为1,即:
由式(11)可以看出:等式左边存在λ0,λ1,…,λn未知数;右边是通过实际测量地采集样本的N阶原点矩,可以采取M(M>N)次测量获得M个量测方程,采用最小二乘法予以求得。
1.3 最大熵威布尔风速概率密度函数
将风速现有研究成果与实际风速进行检验,普遍认为风速服从威布尔分布,模型为
式中:η为比例系数;k为形状参数。
本文基于式(12)的威布尔风速分布,在最大熵风速概率密度分布基础上,提出基于最大熵和威布尔分布的风速概率密度函数p(v)。
式中:v为风速;函数f(v,η,k)为式(12)中的威布尔概率分布。
2 高阶米塞斯风向概率密度函数
我国有专门的气象预测站预报风向,对于陆地的风向预报一般采用圆上的16方位表示,而海面上的风向预报一般采用圆上的36方位表示。对于圆上的风向连续概率分布模型,在统计学中一般采用冯米塞斯分布(Von Mises Distribution)(又称为圆周正态分布),通过采集连续的16方位中的风向数据拟合概率密度函数。严格来说,圆周可以均匀划分为无限个,那么根据多阶混合冯米塞斯分布可得概率密度函数为[16]
式中:f(θ)为风向概率密度函数,以圆周上的风向角度θ为变量;N为混合冯米塞斯分布的阶数;μi为风向所在的位置;κi为冯米塞斯分布的比例放大参数,κi≥0;ωi为混合冯米塞斯分布的各阶权值。
参数κi和μi的计算式分别为[27]
目前已有的研究主要取式(14)中的低阶,比如3阶、4阶、5阶等,一般不超过5阶。式(14)中的阶数越高,模型精度越高,通常取决于风向概率直方图的峰值数[27]。一般风向概率直方图的峰值数至少有两个,为了高精度地拟合风向概率分布,本文采取6阶混合冯米塞斯分布,即式(14)中的N=6。
3 风速风向最大熵联合概率密度函数
3.1 风速风向联合概率密度函数
风速风向联合概率密度实际上就是将风速概率密度、风向概率密度依据相关性原理进行表达。
式中:f(v,θ)为风速风向联合概率密度函数;Δθ为圆周上划分的风向角度的间隔。
由式(17)表示的风速风向联合概率密度函数具有一定的假设前提,比如假设风速、风向具有相对独立性,同一风向的风速概率密度相同等,因而缺乏最大熵的检验和校正。
3.2 风速风向最大熵联合概率密度函数
基于前述最大熵原理,可以推导获得风速风向的联合概率密度函数f(v,θ)[28]。
式中:ζ为角度;g(ζ)为ζ的概率密度函数;F(v)为风速的概率分布函数;F(θ)为风向的概率分布函数。
4 算例分析
我国多个地区常年受大风天气影响,对电网输电线路和杆塔等一次设备造成极大的冲击。对此,东北电网已经建成了国内较大型的风电场测风站,用于观测风速和风向。本文选用东北电网中某大型风电场间隔10min连续5 a的50m高度测风塔获得的风速、风向测量数据,所有数据均已经转换为标准值,2017年3月观测的部分风速数据如图1所示。风向采用16个风向方位,为了验证本文提出的高阶米塞斯概率密度,需要18组风向数据,对此采用二次数据插值技术获得18方位风向数据,如图2所示。图中以0~360°划分方向,原16风向是在0~90°,90~180°,180~270°,270~360°之间分别插入3个方向,构成16方向图,而本文是在此16方向中任意插入2个方向,形成18方向。
图1 部分风速数据Fig.1 Some wind seed datas
图2 风向数据图Fig.2Wind direction datamap
4.1 风速概率密度函数
在前文最大熵原理下分别拟合20m和80m高度的风速概率密度函数的各个参数,结果见表1,为了减少复杂度,计算过程中采用5位小数。
表1 20m和80m高度的概率密度函数参数Table 1 Parameters of probability density function for 20meters and 80meters height
将表1中的各个参数写入到相应的概率密度函数中,可以获得确定的概率密度。将传统最大熵原理的概率密度函数、本文方法获得的概率密度函数进行对比,采用平均绝对百分比误差函数MAPE拟合风速数据,结果如表2所示。
式中:yi为第i个实际值;fi为第i个预测值;n为个数。
表2 20m和80m高度概率密度函数拟合结果Table 2 Fitting results of probability density function of 20 meters and 80meters height
由表2可以看出:N取值越大,对应的MAPE越小,说明高阶拟合效果更好;本文方法比传统最大熵原理方法具有更好的精确度。
4.2 风向概率密度函数
本文以实际16风向角度测量数据,使用6阶米塞斯风向概率密度函数拟合实际风向数据,对风向概率密度拟合曲线与实际风向数据进行比较,结果如图3所示。
图3 风向概率密度拟合曲线与实际风向数据比较Fig.3 Comparison ofwind direction probability density fitting curve with actualwind direction data
由图3可见,利用风向概率密度函数拟合的曲线与实际测量的风向数据具有一致的分布趋势。在此情况下,需要进一步检验风速风向联合概率密度函数的建模效果。
4.3 风速风向联合概率密度函数
通过对风速和风向的建模,以及形成联合概率密度函数,与实测数据进行检验,结果见图4。
图4 本文概率密度函数与实测数据比较Fig.4 This paper compares the probability density function with themeasured data
由图4可以看出,本文提出的风速风向概率密度函数能够准确地拟合实际风的情况。在1 200~1 300个样本点出现拟合效果不佳的情况,是由这个阶段寒流导致的风速突变较大引起的。
5 结语
实际的风载荷是由风速和风向两部分构成,因此在研究风载荷对输电线路和输电杆塔等一次设备的冲击时,有必要建立风速风向的联合概率密度模型。本文基于最大熵原理,构建了风速的概率密度模型及风向的高阶米塞斯概率密度模型,进一步形成了最大熵原理下的风速风向联合概率密度模型,通过仿真,验证了该模型具有较高的精度。