APP下载

基于机器学习的阵风预警方法与应用

2020-05-19黄小光史晓鸣潘东浩周民强周书锋

可再生能源 2020年5期
关键词:阵风风电场风速

黄小光, 王 杏, 史晓鸣, 潘东浩, 周民强, 周书锋

(1.浙江运达风电股份有限公司, 浙江 杭州 310012; 2.浙江省风力发电技术重点实验室, 浙江 杭州 310012;3.华电电力科学研究院有限公司, 浙江 杭州 310030)

0 引言

根据 GB/T 18451.1-2012 (即 IEC 61400-1-2005,以下简称 IEC 规范)[1]对阵风的定义,阵风是短暂的风速突变,可用上升时间、幅值和持续时间来表述。 典型的极端运行阵风(EOG)在风速小幅度下降之后会骤然上升, 容易引起风电机组过转速停机, 而频繁地启停机会影响到机组可利用率,进而减少机组的发电量。解决此类问题的一般方法是为风电机组设定更加严苛的控制参数。 如果这些专门为了应对阵风问题而设定的参数在所有时间段都保持固定不变, 又会导致安全隐患的存在和发电效益的降低。

一般而言,在风速比较稳定时,机组的任务是稳定运行、最大化发电效益,此时,要求降低控制参数的灵敏度, 使其在风速小幅度波动时仍能保持稳定。在风速波动较大时,机组的首要目标是应对阵风、保证安全,尽量避免由于风速突然上升导致的超限停机和过载,此时,要求控制参数更加灵敏,以快速应对骤然变化的外部环境,保证机组安全。因此,有必要提前预知接下来一段时间的阵风发生概率,以便采取差异化的参数设置,兼顾效益和安全。 根据阵风预测原理,现有方法分为3 类,基于物理模型的方法、 基于统计的方法和基于机器学习的方法。

物理模型方法将阵风看做大气湍流、 边界层风速等物理量的函数[2]。 Hans A[3]提出了一种放缩方法对阵风进行预测。 Stucki P[4]比较了COSMO阵风判定模型和标准WRF 阵风参数模型。

统计方法一般基于极值统计原理, 统计模型通常用于确定特定气候中破坏性阵风的返回期。Palutikof J P[5]对该类方法进行了综述。 Hofherr T[6]使用给定模型网格点的最大阵风, 构建了极值分析模型。

机器学习的方法是阵风预测的研究热点,其优势在于该类方法能够建立阵风相关变量和阵风之间的非线性关系, 而不必依赖于某些特定的参数。 Chaudhuri S[7]使用自适应神经模糊推力系统(ANFIS)对加尔各答地区每日的极值阵风进行预测。 Mercer A[8]使用某个给定高度的风速、温度和湿度作为SVR 模型的输入,预测美国十个城市的日最大阵风。Sprenger M[9]使用AdaBoost 分类树的方法对阵风进行预测。

以上研究基本是针对气象领域的阵风预测。本文采用基于机器学习的方法, 并结合风电机组的特点和实际需求, 探讨阵风预警在机组上的应用。 使用真实的机组历史运行数据,参考风速、风向和气温等多种信息, 使用机器学习算法对单台机组进行建模。考虑了场级优化,加入整个风电场其他机组的影响, 对未来阵风发生的概率进行预测,为机组差异化设定参数提供参考,缓解效益和安全之间的矛盾。阵风预警并不直接对过转速、故障、温升等机组相关问题做出预警,而是选择了阵风作为预测对象。 这是由于基于机器学习的数据预测模型, 能学习到的只是来自过去数据中的某种统计规律或经验,并不是严格的定律、定理。 机组是人为控制的, 其参数和状态在未来很可能会发生变化。预警对象选择由自然规律支配的阵风,一定程度上可以避免人为干扰, 使得离线训练的模型在相当一段时间内保持原有的准确性, 而不需要频繁更新。

1 单机建模

1.1 建模流程

以某风电场2016 全年的历史运行数据建立阵风预警建模。流程的主要步骤包括数据预处理、被解释变量(y)和解释变量(X)的生成、算法选择和建模等。 详细流程如图1 所示。

图1 阵风预警建模流程图Fig.1 Gust early warning modeling flow chart

1.2 y 的生成

y 的生成是对样本中有阵风的时段进行标注的过程。 基本步骤如下。

①字段筛选。 阵风一般指风速或者风向的剧烈变化,因而须要专注于风速/风向字段。

②确定阵风模式和参数。 阵风模式可以参考IEC 规范, 如EOG、 方向变化的极端相关阵风(ECD)等模型,也可以参考现场经验自行定义。阵风参数,例如上升幅值,可根据需要和机型表现进行选择。

③搜索阵风。 根据阵风模式和参数,结合历史运行数据的采样周期,搜索符合要求的阵风时段。

④标注阵风。 为便于训练建模,须对原有数据进行整合。 可以将原有的采样周期5 s 的数据整合为1 min 样本。 在1 min 内含有一个、多个或部分阵风的样本标注为1(有阵风),在1 min 内没有阵风的样本标注为0(无阵风)。

⑤时序偏移。 原有的数据形式标注了当前时段是否有阵风,而阵风预警是对未来时段阵风发生概率的预测,因此,须将标注结果进行时序偏移,便于模型训练。

仔猪白痢传染速度快,严重影响仔猪生长,如果不进行及时治疗与防治,就会发展成为流行痢疾导致死亡,甚至可能出现全部死亡。因此,必须对仔猪白痢发生的原因进行合理分析,并结合实际情况掌握仔猪白痢的临床症状,找到治疗与防治的综合措施,保证仔猪的健康成长,进而保障养殖户的经济效益最大化。

图2 阵风下的风速Fig.2 Wind speed under gust

图2 为在历史运行数据中标识出来的一次阵风的风速曲线。 发生时刻为2016 年1 月24 日7点24 分20 秒, 阵风持续过程在图中显示为第15~20 秒。 该阵风模式参考了EOG 的形式(风速下降,接着陡然上升,又陡然下降,然后上升到初始值)。 本文做了一定简化,只考虑先下降又上升的左半部分。

图3 为图2 风速所对应的发电机转速曲线。由图3 可知,由于该阵风的影响,机组因发电机转速超限而停机。

图3 阵风下的发电机转速Fig.3 Generator speed under gust

按照图2 所示的阵风模式,以阵风幅值10 m/s 为分界线,将历史运行数据中的各个1 min样本划分为有阵风和无阵风两部分, 再将样本中的转速最大值绘制成如图4 所示的核密度曲线。由图4 可知:有阵风时,机组的转速在1 700~2 000 m/min 内呈正态分布;没有阵风时,机组转速分布在1 000~1 900 m/min 内。可见该阵风模式和参数设置, 能够很好地区分机组在有无阵风状态下的转速分布。

图4 有阵风和无阵风时段的发电机转速和密度分布曲线Fig.4 Core density distribution curves of generator speed during gust and non-gust periods

本文参照IEC 规范中的EOG 阵风定义,并依据实际情况稍作改动。 阵风模式和参数也可以从现场经验总结,既可以是风速骤升的,也可以是风速骤降的;既可以是风速变化的,也可以是风向变化的。只要能从运行或仿真中总结更多的实例,并且这些实例确实引起了风电机组的某些问题,就可以归纳到阵风预警平台, 并设计出不同阵风模式的预警模型。

1.3 X 的生成

为了完成y 的预测,须要为其提供输入信息,这里称之为X,其生成包含以下步骤。

①字段筛选。阵风是一种外部的自然因素,是引起风电机组各种问题的原因而非结果, 所以选择风速、风向、气温3 类字段作为X 的原始数据。

③特征变换。根据业务经验进行特征变换,为特征构建提供更丰富的字段, 以便对阵风进行更准确地预测。例如:通过正弦、余弦,将风向分解为两个正交方向;通过时序上的差分,将风速转变为风速变化率等。

④特征构建。 通过统计不同周期内各个字段(及其差分)的均值、标准偏差、最大值、最小值、峰度、偏度等信息,供算法学习,可以有效地提高预测精度。

⑤抽样。 为了与y 对应, 须将样本抽样成1 min 间隔的数据集。

将特征变量按照重要性排名, 并计算相关矩阵,可以发现y 与之前的阵风情况(如在8 min 周期内发生阵风与否的标准偏差) 以及风速的变化率的离散程度(如在16 min 周期内风速的差分的标准偏差)等变量的相关性更高。

1.4 算法比较

本文使用了4 种机器学习算法, 分别为逻辑回归 (LR)、 随机森林 (RF)、 梯度提升决策树(GBDT)、深度神经网络(DNN),测试不同算法在数据集中的表现。 将2016 全年数据集以10 月为界限划分为两部分:10 月之前(含10 月)的数据为训练集, 用于模型训练;10 月之后的数据为验证集,用来评估模型的优劣。 模型训练好后,输入验证集的X,会输出介于0~1 的预测概率。依据不同的概率阈值划分, 得到不同的0/1 分类结果,0即为预测无阵风,1 为预测有阵风。

图5 为以箱线图的形式给出了某风电场30台风电机组的验证集曲线下面积 (AUC) 分布情况。 AUC 是有监督分类问题中最常见的评估指标,它最大的特点是考虑了所有的预测概率情况,对模型的预测精度给出综合的评价。 AUC 等于0.5 时,说明模型处于随机猜测,是没有分类能力的。 AUC 越接近1,说明模型的分类能力越好。

图5 不同算法的AUC 表现Fig.5 AUC performance of different algorithms

由图5 可知,GBDT 的 AUC 分布更高更集中,其次是RF,LR 与DNN 表现相当。近年来流行的DNN 表现不佳, 这一方面可能是由于DNN 的网络架构和参数更加复杂,要求调参技巧更高,另一方面可能是由于数据规模仍然不够庞大, 不能体现深度学习在大数据中的优势。 下面对GBDT算法的结果给出了详细的评估。

1.5 评估结果

表1 依据GBDT 算法, 给出了某风电场1 号机组在不同概率阈值下的准确率、 精确率、 召回率、F1 得分、误报率和 AUC。 由表1 可知,在 0.1的概率阈值下,召回率达到0.956 7,也就是说,不到5%的阵风处于漏报状态。

表1 某风电场1 号机组GBDT 算法模型评估Table 1 Evaluation of GBDT algorithm model for turbine 1

依据GBDT 算法,给出了某风电场30 台机组的模型评估结果,所有机组的AUC 均达到了0.96以上,说明预测模型对阵风具有良好的区分能力。表2 列举了其中前10 台机组的评估结果。

表2 某风电场10 台机组GBDT 算法模型评估结果Table 2 GBDT algorithm model evaluation of 10 turbines

2 场级优化

一个风电场内的多台风电机组, 由于地理位置相近,风资源情况总体比较接近,但由于微观地形的差异,以及风向上下游的关系,使得各个机组的风资源存在微妙的差异。 一部分机组在空间位置上处于主风向的上游方位, 在时间尺度上能更早地感受到阵风变化, 另外其尾流也可能形成阵风,对下游机组产生影响。 因此,为了更精确地预测阵风, 将邻近机组的运行数据加入到预测模型中,对阵风预警模型进行场级优化。图6 为某风场的机组分布图。

图6 机组分布图Fig.6 Unit distribution map

为了研究加入邻近机组数据对阵风预测精度是否具有提升作用,本文以2 号机组作为目标风电机组,其它29 台机组作为数据来源机组,用两台机组的数据进行组合计算。 将组合计算的结果与单台计算的结果进行对比,表3 为前10 台机组的组合计算对比结果。

以表3 第一行数据为例对其内容进行说明:将2 号和1 号机组的X 组合起来,对2 号机组的y 做出预测,可以观察到单台计算的AUC、两台组合计算的AUC 以及两种计算之间的AUC 变化情况。 若AUC 变化为正值,说明来源风电机组对目标风电机组的阵风预测精度具有提升作用,若AUC 变化为负值,说明来源风电机组对目标风电机组的阵风预测造成了干扰。

表3 组合计算的AUC 变化Table 3 AUC changes in combined computation

在整个风电场中, 用以上方法依次选择一台机组作为目标风电机组, 以剩余的机组作为来源风电机组,进行组合计算。 筛选出AUC 有所提升的组合,绘制了图7 所示的组合计算网络图。

图7 组合计算网络图Fig.7 Combined computing network diagram

图7 中每一个圆点代表一台风电机组, 箭头所指向的是目标风电机组, 箭头所背离的是来源风电机组。 受到越多指向的机组,圆点面积越大,说明组合计算方式对该机组的阵风预测精度提升更有利。可以发现该风场的16,24,10 号机组是受到提升作用比较多的机组。

将每台机组利用组合计算所能提升AUC 进行累加, 记为该目标机组的AUC 累计提升量,可知24,16 号机组获得的累计提升较为明显, 说明组合计算对这些机组的阵风预测精度提升效果最明显。 将每台机组在组合计算中帮助其他机组提升的AUC 进行累加, 记为该来源机组的AUC 累计提升量,可知22,8 号机组给予的累计提升较为明显, 说明这些机组的数据对其他机组的阵风预测精度的提升贡献更大。

3 结论

本文根据EOG 阵风定义,使用风电机组历史运行数据,阐述了构建阵风预警模型的基本步骤,分别采用了 GBDT,RF,DNN 和 LR 算法进行阵风预测。依据场级优化的思路,利用邻近机组的数据来提升单机的阵风预测精度, 尝试将两台机组的数据组合作为模型输入,对模型进行优化。

①针对本文的数据源,GBDT 算法的AUC 分布更高、更集中,可达到0.96 以上,预测精度更高。

②经过场级优化, 组合计算方式对风电场中某些机组的阵风预测精度有明显的提升作用,具有较高的研究价值。

③基于机器学习的阵风预警是风电行业应用大数据和数据挖掘的积极探索, 它不需要额外增加测风硬件, 只须采集SCADA 历史运行数据就可以完成建模。 它所带来的可变的、可预测的、定制化、 差异化设定参数的思路和理念具有一定革新意义。

猜你喜欢

阵风风电场风速
高速铁路风速监测异常数据判识方法研究
阵风战斗机
法国阵风战斗机
邯郸市近46年风向风速特征分析
数字化风电场后评估指标体系研究
《海上风电场设施施工检验指南》(GD01—2020)发布
基于PSS/E的风电场建模与动态分析
2006—2016年平凉市风速变化特征分析
阵风劲吹
我国离岸最远的海上风电场并网发电