基于权重算法筛选无效测风数据的方法研究
2020-10-16李长亮
文 | 李长亮
测风数据的处理直接关系到风电场发电量的测算,进而影响整个项目的决策。国标GB/T18709-2002《风电场风能资源测量方法》和GB/T18710-2002《风电场风能资源测量方法》中规定了风能资源测风数据的一些原则,具体指标如表1所示。
国标中规定的参数是小时平均值,而实际中获取的测风数据是10分钟平均值,所以,根据国标参数进行处理时首先需要进行时间转化。此外,国标发布时间较早,随着近15年风电的发展,测风高度和地点发生了较大变化,在较为复杂的山地地形得到的测风数据也是非常复杂的,单独使用国标方法处理已经不能满足要求。
在实际工作中,对于测风数据中的无效数据,一般都是工程师根据经验手动进行剔除,这种方法对工程师的数据处理能力要求较高。本文提出了一种筛选无效数据的新方法,将风切变规律运用于逐时刻数据,并采用权重算法对每个通道每个时刻数据(10分钟平均)进行权重计算,筛选无效数据,使数据更具有可信度,并采用某项目测风塔验证了其可行性。
表1 测风数据合理性判断原则
方法说明
在风能资源研究中,风切变指数表征风速随高度的变化程度,由于受地形与大气层稳定度等因素的影响,风速随高度变化的程度不同,风切变指数的大小也各异。因此,风切变是当今测风数据分析中的一项重要指标。一般情况下,风速同测风高度的关系如式(1)所示:
假设z0=1,那么,以上公式就转化为:
基于权重算法筛选无效测风数据的方法是采用逐时刻数据(10分钟平均)计算风切变值,然后依次去除本时刻某个通道的值,对剩余的通道求取风切变,通过计算这两个风切变的差值,得到本通道的权重值(表征这个通道对风切变影响的程度)。若是影响程度过大,则表示此数据严重偏离统计规律,应视为无效数据。具体步骤为:
假设现有一组测风数据,时间序列为10分钟,每组数据包括N个高度通道的风速信息(其余风向、湍流等实测信息与本处理方法无关,因此不提及),下面的数据处理不包含同一高度上有两个通道的情况。
一、对测风数据进行数据范围判断
按照国标规定,对小时平均风速≧40m/s的数据进行标记,并删除标记所涉及的10分钟数据的异常值。
若是测风数据由机械风杯测得,则测风数据最小值一般为0.4m/s(具体精确值查询标定值),因此,对测风数据中小于0.4m/s的数据进行删除。
二、分类筛选各个时间序列通道
对每个时刻的各个通道进行处理判断:
a.若是数据覆盖个数小于等于3,对此通道不做处理;
b.若是数据覆盖个数大于3,则采用以下方法进行数据处理。
(一)求取每一时刻的风切变
直接对10分钟原始数据进行处理:对风速数据和高度数据进行取自然对数操作,x轴代表高度lnz,y轴代表速度lnv,采用最小二乘法拟合直线。根据公式(2)得知,直线的斜率代表测风数据本时刻的风切变α,如图1所示。
(二)求取每一个通道的权重值
对于给定的m个通道数据,有m个权重值。下面是针对每一时刻各通道数据进行操作(同理以图1中4个点为例进行说明)。
去除通道a的数值,对剩余的通道b、 c 、d求取风切变α1。
求取本时刻本通道数据的权重值:
同理求取本时刻其余三个通道b、c、d的权重值Δi2、Δi3、Δi4。
(三)筛选无效数据
通过对测风数据每个时刻的处理,得到测风数据所有点的权重值,规定一个合理值Δi,将超出合理值Δi范围的值标记为异常值,将所涉及的测风数据定义为无效数据。
图1 风切变计算示意图
图2 a通道风切变计算示意图
(四)对数据进行插补
去除无效数据后,为了保证数据完整性,对缺失数据进行插补。
项目验证
本文采用基于权重算法筛选无效测风数据的方法对1#测风塔(本测风塔位于江苏,数据截取范围为2016年6月6日-2017年6月5日,数据有90m、80m、70m、50m、30m、10m共6个通道。由于30m通道数据损坏,质量较差,因此,处理过程中去除了该通道值)测风数据进行处理,首先对测风数据进行无效数据剔除,然后在Windographer里进行数据插补,数据处理结果如图3-图12所示。
可以看出70m通道数据偏离风切变统计曲线较多,这种现象一般由几种原因引起:(1)本地区真实风速确实是这种现象。(2)测量装置发生漂移。(3)测量数据中某部分的时间数据异常。在实际处理中,因为使用统计规律,要依靠风切变数值进行后续的计算以及评判,所以,会手动对偏离统计的数据进行剔除(一般是目测数据,然后剔除异常值,以及目测相关性,并剔除相关性较差的数据)。
图3 处理前风切变
图4 处理后风切变
图5 处理前90m与80m相关性
图6 处理后90与80m相关性
图7 处理前90m与70m相关性
图8 处理后90m与70m相关性
通过采用本方法进行处理后,各通道数据质量明显提高,数据相关性也显著提高。同时,各个通道的风速略有变化,90m通道风速降低了0.11m/s,80m通道风速降低了0.13m/s,70m通道风速升高了0.1m/s,50m通道风速降低了0.15m/s,10m通道风速降低了0.04m/s。风切变规律更加符合统计规律。
图9 处理前90m与50m相关性
图10 处理后90m与50m相关性
图11 处理前90m与10m相关性
图12 处理后90m与10m相关性
表2 1#测风塔处理前风速信息
表3 1#测风塔处理后风速信息
结论
本文提出的方法,重点在于基于统计规律思想,识别和剔除质量较差的测风数据。从现在工程师的目测和手动剔除方式转变为机器识别和自动处理,是一种新的自动识别方法,可以大幅度提高工程师的工作效率。通过项目验证可知,本方法可以显著提高测风数据的质量,增加通道相关性,快速剔除无效数据,得到较好的处理效果。需要注意的是,本方法具有一定的适用范围,适用于少数无效数据分散在众多测风数据的情况,对于某个时刻多个通道数据无规律异常的情况,从原理上讲本方法是不适用的。另外,由于尚未经过大量的样本验证,因此,对于如何设定约束条件及适用何种类型的测风数据等内容,都需要进行深入研究。