APP下载

基于高层气象大数据的风电场中长期风功率预测研究

2020-05-25飞,纪

电力大数据 2020年2期
关键词:电功率高层风电场

李 飞,纪 元

(贵州电网有限责任公司信息中心,贵州 贵阳 550000)

随着世界经济的发展,社会对能源的需求也不断的增长,由于传统的化石能源的日益枯竭,以及环境污染日益严重,清洁的可再生能源所占比例越来越高,由于其不可再生性,面临着消耗殆尽的威胁,可再生能源得到了迅速的发展。特别是风力发电,其比重在电力系统容量中也越来越大[1-2]。由于风力资源的间歇性与波动性,导致了风电功率的随机性和难以预测性。随着风电场的快速建设,风电的大规模并网对电网调度、电能质量以及电力系统的稳定运行带来了严峻考验。在目前大力建设智能电网的趋势下,对风电场风电功率准确预测是保障电力系统安全稳定的的有效途径[3-4]。

目前风电对全网的电力平衡已经带来很大的影响[5]。对风电场功率进行预测是缓解电力系统调峰、调频压力,改善电能质量,提高风电接纳能力的有效手段之一。同时,风电功率还可以指导风电场的检修计划,提高风能利用率,提高风电场的经济效益。按照时间尺度划分,风电功率预测一般分为超短期预测、短期预测和中长期预测三类,而中长期风资源预测是优化资源配置,保障电力系统安全稳定的关键。

风电功率预测方法主要包括统计方法和物理方法[6]。统计方法基于历史统计数据建立天气状况与风电场出力的关系,然后根据实测数据和数值天气预报数据对风电场输出功率进行预测,常用的预测模型有时间序列[7]、神经网络[8-9]、支持向量机[10]等。物理方法则主要根据数值天气预报模式的风速、风向、气压、气温等气象要素预报值以及风电场周围等高线、粗糙度、障碍物等信息,采用微观气象学理论或计算流体力学的方法,计算得到风电机组轮毂高度的风速、风向、气温、气压等信息。然后根据风电机组的功率曲线计算得到每台风电机组的预测功率,再考虑风电机组间尾流影响,最后对所有风电机组的预测功率求和得到风电场的预测功率。

统计方法和物理方法各有优缺点。统计方法无需建立具体的数学模型,计算速度快,但需要大量历史数据。物理方法不需要大量的测量数据,但要求对大气的物理特性及风电场特性有准确的数学描述,这些方程求解困难,计算量大。

为提高中长期风功率预测精度,国内外研究机构都在尝试各种新的预测方法,主要包括多种方法同时预测、多数值天气预报、纳入实时功率和实时测风数据等。多数值天气预报、多种预测方法的集合预报逐渐成为发展趋势。使用传统单一预测模型时,除了预测精度不高外,每种方法都有其优劣程度和适用对象。例如卡尔曼滤波法难以对噪声的统计特性进行估计,模糊逻辑法学习能力较弱,灰色预测方法适合处理小样本数据等。

本文提出基于海量高层大气数据的风功率预测方法。高层大气是指位于对流层顶部至平流层底部,海拔高度为10 km~20 km的大气。此高度的大气运动受地表环境因素影响较小,位于此高度的大气运动更为规律,且众多研究表明,平流层和对流层的动力耦合非常密切,强的平流层大气运动会对主要发生在对流层的气候、天气现象产生影响。因此,高层大气运动对于中长期风力发电有着较大影响。

本文结合物理模型分析方法和大数据分析手段,首先对收集到的高层大气数据进行处理;随后通过hadoop大数据平台,利用大数据的数据挖掘和学习分析方法,用收集到的海量高层大气数据对所推导的模型进行训练和修正;文章第四节推导出高层大气运动与风力的关系的物理模型;最后,基于模型和大数据机器学习方法,根据高层大气运动数据和风电场历史数据,准确、有效地预测风电场中长期风功率。

1 高层大气数据的收集

衡量气象的指标主要有:气压、温度、海拔、露点、风速、风向等,本文选择美国国家海洋和大气管理局(NOAA)中的全球综合探空档案(integrated global radiosonde archive),得到了大小为55.6 GB的海量数据[11]。数据样本如表1所示。

表1 IGRA数据样本Tab.1 IGRA data samples

数据由分布于全球的1 500多个站点测量收集得到,测量海拔为地表至对流层顶,提供1970年至2017的海量数据,可以作为很好的数据来源。测量值包括气压、温度、海拔、露点、风向和风速等特征数量,涵盖高层风功率预测物理模型推导所需要的所有特征量。全球数据采集站点如图1所示。其中风速单位为米每秒(m/s),风向单位为度(°),稳定单位为摄氏度(℃),高度单位为米(m),露点的单位为摄氏度(℃),气压的单位为帕(Pa)。

通过对数据分析研究,发现收集到的数据涵盖高差大,时间长,因此需要对所收集的数据进行预处理,主要依据以下两个方面进行处理。其一是高度问题,所需要的大气数据高度主要在10 km左右,对于不同站点因为纬度的不同所对应的高度也有所不同,因此首先将筛选的数据高度约束在9 km到12 km之间。同时,由于数据涵盖的时间较长,存在部分数据缺失问题,因此需要剔除数据缺失较大的站点。经过筛选过后的数据总量为14.1 GB。中国某站点的数据如图2所示,可以发现高层大气风速的变化存在较强的规律性。

2 大数据平台hadoop的搭建

为分析高层风资源的特征并开展高层风资源的预测,面向海量高层大气数据,本文主要采用大数据平台开展分析与预测工作。首先是大数据集群的搭建,本研究采用六台计算机,在linux平台上搭建了包括一个Master节点和五个Slave节点的hadoop集群。Hadoop是一个由Apache基金会所开发的分布式系统基础架构,是最早应用于商业和科学研究的大数据处理架构。Hadoop有许多元素构成,其最底部是 hadoop distributed file system(HDFS),它存储 Hadoop 集群中所有存储节点上的文件[12]。HDFS的上一层是MapReduce引擎,该引擎由JobTrackers和TaskTrackers组成。

HDFS就像一个传统的分级文件系统。可以创建、删除、移动或重命名文件。存储在HDFS中的文件被分成块,然后将这些块复制到多个计算机中(DataNode),块的大小(通常为64MB)和复制的块数量在创建文件时由客户机决定。NameNode可以控制所有文件操作。DataNode通常以机架的形式组织,机架通过一个交换机将所有系统连接起来。HDFS架构如图3所示。

MapReduce框架是由一个单独运行在主节点上的JobTracker和运行在每个集群从节点上的TaskTracker共同组成[13]。主节点负责调度构成一个作业的所有任务,这些任务分布在不同的不同的从节点上。主节点监视它们的执行情况,并重新执行之前失败的任务。从节点仅负责由主节点指派的任务。当一个Job被提交时,JobTracker接受到提交作业和配置信息之后,就会将配置信息等分发给从节点,同时调度任务并监控TaskTracker的执行。JobTracker可以运行于集群中的任意一台计算机上。TaskTracker负责执行任务,它必须运行在DataNode上,DataNode既是数据存储节点,也是计算节点。JobTracker将map任务和reduce任务分发给空闲的TaskTracker,这些任务并行运行,并监控任务运行的情况。如果JobTracker出了故障,JobTracker会把任务转交给另一个空闲的TaskTracker重新运行。

Hadoop 框架可在单一的Linux平台上使用(开发和调试时),也可以由多台Linux操作系统组成一个一个Hadoop集群,这样能够发挥Hadoop结构的最大运行效率。

通过终端或者网页查看所搭建的hadoop集群运行情况如图4、图5所示。

3 物理模型的建立

3.1 大气运动方程组

在高空的理想化环境,可以忽略大多数影响因素,只专注于形成风的主因,即气压梯度力在高层大气中的变化。不过大气在运动过程中,不仅速度会发生变化,空气状态参数也要发生变化,描述大气运动的基本方程组包括运动方程、连续性方程、状态方程、和热力学方程、其球坐标系下表示如下[14]:

(1)

3.2 大气运动方程组修改

很显然,大气运动方程组无法直接应用于数据分析中,为得到风速变化的物理模型,具体推导过程如下:

(2)

(3)

(4)

(5)

(6)

(7)

同样可以推出:

(8)

(9)

(10)

(11)

同样的变化可得:

(12)

(13)

(14)

符号的含义如下:

其中u表示为纬向风速,v为经向风速,u和v可以由数据中风速正交分解的到。

纬度由φ表示,数据中有f=2Ωsinφ

(15)

地球半径r取值为,r表示空气密度,

(16)

(17)

P0=101 324.999 663 Pa,即标准大气压,其中,m为气体分子的相对质量:取29h为高度,g为重力加速度:取9.8

k为普适气体常数:取值k=8.314 32

T0表示地表温度单位:k数据中不含有可以通过Th=T0=0.006 5求得,但求出来的数值单位是摄氏度需要加273.16。

α为温度下降梯度,取值0.006 5。

Md取值为0.028 964。

Rd取值为287.058。

Rv取值为461.495。

Mv取值为0.018 016。

δ为空气相对湿度,可由查表和度焓湿图求得:

4 案例分析

为有效验证上文推导出的大气运动对提高中长期风功率预测的效果,本节采用支持向量机算法,对中国西南某地的风资源数据进行预测。

支持向量机SVM(support vector machine)是一种监督式学习方法[15],适用于回归分析,本文采用SVM作为数据分析的算法。支持向量机将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面。分隔超平面使两个平行超平面的距离最大化。假定平行超平面间的距离或差距越大,分类器的总误差越小。

两个数据点之间经纬向风速的加速度随时间变化的结果,可以分别由实际数据求出也可以根据物理模型求出。如果两者的趋势相同就可以利用SVM的方式改变参数前的系数达到数据拟合的目的。

由于物理模型和实际数据计算的结果存在差距,所以需要按照一个步长去修改参数前的系数,目标为距离和最小。距离和的计算方法可以有不同方式。将离群点单独挑出,分析数据的规律可以得到极端天气的规律可以达到预测的目的。然而,经过数据分析之后发现得到的理论值和实际值相差很大。

大气运动方程组中出现许多“常量”,这些“常量”在其对应的周围不断变化。令公式计算的加速度的值与实际数据相等或者与实际值相差尽量小,但必须满足的约束条件是与公认的真值相差尽量小。由于各个常量的数量级相差很大需要采用标幺值的方法,将公认真值作为基值,将这些值相加使其和相加的结果最小,就是最合理的一组修正值。

对该风电场高层大气分资源历史上12个月中的前9个月的高层大气风速数据作为模型的训练数据,后3个月的风速数据作为测试数据对模型进行预测,高层大气风速数据预测模型的预测效果如图6所示。

将高层大气风资源实测数据和预测数据作为风电场电功率预测的辅助数据源,采用支持向量机算法,构建风电场电功率的预测模型。由于需要建模的数据较多,所以对该风电场历史上12个月中的前9个月的风速数据以及该风电场高层大气风速数据作为模型的训练数据,风电场后3个月的风速数据作为测试数据对模型进行预测。支持向量机的的输入神经元为5个。在得到后3个月的预测风速时间序列后,将此3个月的风速预测值作为风电场出力特性拟合曲线的输入,对应得到输出即为3个月的风电功率预测值。风电功率预测结果和实际数据如图7所示。其中,预测结果1号为仅采用风电场历史数据的预测结果,其均分误差为5.79。计及高层大气风资源数据的风电功率预测模型的预测效果如图7中预测结果2号所示,其均方误差为2.01。可以发现,考虑高层大气风资源数据可以有效提高风电场中长期风电功率预测精度。

5 结论

基于高层大气受地表因素影响较小,规律性较强的特点,建立了高层大气运动的物理模型,通过大数据等分析手段,对物理模型进行训练和修正,得到高层大气发展模型,对高层风功率进行预测。高层大气的资源特性将影响底层风电场风功率,通过构建计及高层大气风资源的风电场风功率预测手段,实现对风电场风中长期功率的预测。通过对中国西南某地的风资源进行预测,验证了该方法的有效性。

猜你喜欢

电功率高层风电场
高层动态
基于PCC-CNN-GRU的短期风电功率预测
轻松上手电功率
你会计算电功率吗
解读电功率
基于PSS/E的风电场建模与动态分析
某超限高层结构设计
含风电场电力系统的潮流计算
高层楼宇灭火装备
探求风电场的远景