APP下载

基于机器学习算法与SCADA系统的风电机组变桨系统变频器的故障预警方法研究

2021-03-04孟宪梁冯文新尹立军

太阳能 2021年2期
关键词:残差变频器风电

孟宪梁,梁 伟,杨 志,冯文新,柯 超,尹立军

(1. 国电电力新疆新能源开发有限公司,乌鲁木齐 830000;2. 华风数据(深圳)有限公司,深圳 518110)

0 引言

由于风电机组长期处于复杂的工作环境中,因此开展风电机组故障预警可以有效降低风电机组的维护成本,提高风电机组的可用性,进而提高风力发电项目的经济效益。变桨系统是风电机组的关键设备,其可在不同工况下控制风电机组功率与转速的平衡[1],而变桨系统故障是风电机组故障中最常见的故障之一。

当前,针对风电机组变桨系统故障预警的研究主要集中在对SCADA系统数据进行分析[2],以及机器学习算法可有效应用于风电机组变桨系统的故障预警这些方面[3]。河北工业大学的学者成功使用SCADA系统数据进行了变桨系统的状态预测[4];南京理工大学的学者利用支持向量机进行机器学习,实现了对齿形带断裂故障的智能检测[5];北京交通大学的田彤彤[6]采用SCADA系统与机器学习算法结合的方法,针对风电机组变桨系统的状态评估与预测进行了研究,为消除风电场的环境随机因素对风电机组运行的干扰,其采用滑动时间窗的方法处理模型残差,并以残差阈值作为变桨系统状态的判断依据。上海机电学院的梅晓娟[7]研究和分析了变桨系统的SCADA系统数据,对机器学习算法SVM进行了改进,并将其应用于变桨系统的SCADA系统数据建模方面。

变桨系统变频器是变桨系统中故障发生率最高的部件,为了减少因变桨系统变频器故障而导致的变桨系统故障,研究变桨系统变频器的故障预警十分必要。针对电动变桨系统变频器的故障预警,本文提出一种基于机器学习算法与SCADA系统结合的方法,建立变桨系统变频器故障预警模型,并采用滑动时间窗残差估计方法处理模型温度残差,计算得出故障预警的温度残差值阈值,依此判断变桨系统变频器的状态,进而评估变桨系统的运行状态;然后以新疆维吾尔自治区某风电场实际的运行数据为例,验证了该方法对风电机组变桨系统变频器故障预警的可行性,从而可为风电机组的检修提供依据。

1 电动变桨系统的工作原理及变桨系统变频器的相关参数

风电机组当前的风速及电机转速与其历史风速、电机转速存在着关联关系。本研究以北京华电天仁电力控制技术有限公司生产的电动变桨系统为例,其分别给每个叶片配备单独的变频器。根据风电专家和相关资料的指导,选取SCADA系统的相关变量作为算法的特征变量,将风速、转子转速、发电功率、3个变桨轮毂温度、3个叶片偏角、3个变桨轴承箱柜温度、3个变桨电机温度、3个变桨电池温度、3个变桨电机电流、3个变桨电容温度,共计24个特征参数作为机器学习模型输入参数,以各个变桨系统变频器的温度作为机器学习模型输出参数。使用先进的机器学习算法进行模型训练,从而对变桨系统变频器的运行状态进行预测,通过与实际的风电机组SCADA系统数据进行对比,验证该方法的可行性。

2 基于机器学习算法和SCADA系统的风电机组变桨系统变频器的故障预警模型的建立

当前所有机器学习算法中,Xgboost算法与LightGBM算法为2种热门的机器学习算法。在很多应用中,2种算法都表现出了优异的性能。但在风电领域,利用LightGBM算法的研究较少,因此,本研究尝试使用2种算法并进行对比分析。

Xgboost算法是组合算法中的提升方法,是一种可扩展的强大的机器学习算法,应用非常广泛。LightGBM算法是基于直方图的决策树算法,其支持并行学习,学习速度快。

本文提出的故障预警模型是基于机器学习算法和SCADA系统的风电机组变桨系统变频器故障预警模型。该故障预警模型的逻辑示意图如图1所示。

图1 本故障预警模型的逻辑示意图Fig. 1 Logic schematic diagram of fault early warning model proposed in this paper

对于筛选好的特征参数,从SCADA系统中抽取相关的数据输入机器学习算法中进行机器学习模型训练。在故障预警时,从SCADA系统中抽取相关的数据输入训练好的机器学习模型,得到变桨系统变频器的温度预测值;另外,从SCADA系统获取变桨系统变频器的温度实际值;以预测值减去实际值,可得到温度残差值;将温度残差值与提前计算得到的温度残差值阈值(即预警阈值)进行比较,从而可得出当前变桨系统状态的结论;为了消除由于风电机组复杂的工作环境带来的随机因素对该模型计算结果的影响,采用滑动时间窗残差估计方法对温度残差值分布进行计算和处理。

3 基于滑动时间窗的预警阈值的设定方法

风电场的工程师通过将变桨系统变频器的实际温度曲线与由故障预警模型计算得到的温度曲线进行对比和分析,来判断变桨系统变频器的工作是否正常。然而实际的风电场环境复杂,风电机组工作时会受到多种随机因素的干扰,进而会影响风电机组变桨系统的工作状态,导致变桨系统变频器的实际温度曲线与由故障预警模型计算得到的温度残差曲线均会受干扰信号的影响,这就为利用变桨系统变频器故障预警模型对变桨系统故障进行预测带来了困难。

滑动时间窗残差估计方法可以消除上述多种随机因素对风电机组的干扰,提高模型的可靠性,并提高预测的准确度。因此,本文提出的基于机器学习算法和SCADA系统的风电机组变桨系统变频器故障预警模型采用滑动时间窗残差估计的方法来反映其温度残差分布特性的变化。

基于滑动时间窗的预警阈值的设定方法(以Xgboost算法为例)具体为:

1)通过计算风电机组变桨系统变频器温度的历史观测向量Xi与由Xgboost模型得到的回归预测向量得到温度残差。假设在某段时间内,Xgboost模型得到的变桨系统变频器的温度残差ε的序列ε=[ε1,ε2,ε3, …,εN],对该序列取1个宽度为n(n为1个窗口内温度残差数据的数量)的滑动窗口;对窗口内的连续n个温度残差计算温度残差均值和温度残差标准差Sε,公式为:

式中,i为第i个时间窗;εi为第i个窗口的均值。

残差滑动窗口的示意图如图2所示。

图2 残差滑动窗口的示意图Fig. 2 Schematic diagram of residual sliding window

2)确定温度残差均值和温度残差标准差的故障预警阈值,记为EY和SY。假设风电机组正常工作时故障预警模型的温度残差绝对值的均值的最大值为ET,温度残差绝对值的标准差的最大值为ST,则变桨系统变频器的故障预警阈值为:

式中,k1和k2均为系数,取值由实际的实验数据计算得到。

4 基于机器学习算法和SCADA系统的风电机组变桨系统变频器的故障预警模型的算例分析

为了验证本文所提出的故障预警方法的准确性,选择新疆维吾尔自治区某风电场中1.5 MW风电机组的SCADA系统历史数据进行验证。数据的持续时间为2017年1月~2019年12月,共计3年的历史运行数据,数据采集频率为1 min。经过去噪、过滤异常状况数据后,共剩余40万条数据,按照8:2的比例将所有数据划分为训练数据集和测试数据集。另外,还选取了包含该风电机组故障运行状态的数据共计1810条作为故障检测数据,这些数据取自风电机组发生故障停机前30 h的数据。

4.1 Xgboost模型训练

Xgboost模型涉及树的深度、树的数量、叶子节点、学习率等参数的调优。本文是利用强大的网格搜索的方法寻找潜在最优参数组合,首先通过人为设定一些参数组合,从中找寻最佳组合,然后再通过人工微调该最佳组合中的参数,最终确定最优参数组合。Xgboost模型的最优参数组合如表1所示。

表1 Xgboost模型的最优参数组合Table 1 Optimal parameters combination of Xgboost model

4.2 LightGBM模型训练

LightGBM模型涉及树的深度、树的数量、叶子数等参数的调优。本文经过多次参数调优,最终选定相对较优的参数,如表2所示。

表2 LightGBM模型的参数组合Table 2 Parameters combination of LightGBM model

4.3 模型评价

为了评价机器学习回归模型的准确度,引入了实际均值(指某段时间内变桨系统变频器温度的实际值的均值)、预测均值(指某段时间内变桨系统变频器温度的预测值的均值)、均方差(MSE)、平均绝对误差(MAE)、平均绝对误差百分比(MAPE)、决定系数R2共6项评价指标。这6项评价指标的计算公式分别如式(5)~式(8)所示。

MSE的值越小越好,其公式为:

式中,yi为测试数据集的第i号数据;yi为测试数据集第i号数据的预测值。

MAE的值越小越好,其公式为:

MAPE的值也是越小越好,其公式为:

R2的取值在0~1之间,且在此范围内越大越好,其公式为:

5 结果及分析

5.1 测试数据集的结果及分析

在正常运行的40万条数据中,按照8:2的比例选取其中的8万条数据作为测试数据集样本,将这些数据分别输入到Xgboost模型与LightGBM模型,提取模型输出,然后对比模型输出与从SCADA系统获取的变桨系统变频器温度的实际输出。

分别将8万条测试数据集样本输入Xgboost模型和LightGBM模型后,计算得到机器学习回归模型的评价指标,具体如表3所示。

表3 回归模型的评价指标Table 3 Evaluation index of regression model

从表3可以看出,由Xgboost模型得到的回归模型的评价指标均优于由LightGBM模型得到的。因此,本文提出采用Xgboost算法作为风电机组变桨系统变频器故障预警模型的机器学习算法。

5.2 基于滑动时间窗的Xgboost模型的结果及分析

由式(3)、式(4)可知,确定预警温度残差均值阈值和温度残差标准差阈值与滑动时间窗的大小有关。查阅文献[8]后,将滑动时间窗的宽度n设为20,将测试数据集样本输入模型,通过滑动时间窗残差估计方法计算得到了滑动时间窗内温度残差均值最大值ET和温度残差标准差最大值ST,结果如表4所示。

图3、图4分别为经过滑动时间窗残差估计方法处理后得到的温度残差均值直方图和温度残差标准差直方图。

表4 测试数据集中的滑动时间窗最大值Table 4 Maximum value of sliding time window in test dataset

图3 滑动时间窗残差估计方法处理后的温度残差均值的分布Fig. 3 Distribution of temperature residual mean value obtained by residual estimation method of sliding time window

图4 滑动时间窗残差估计方法处理后的温度残差标准差的分布Fig. 4 Distribution of temperature residual standard deviation obtained by residual estimation method of sliding time window

由图3、图4可以看出,经过滑动时间窗残差估计方法处理后得到的温度残差均值分布和温度残差标准差分布均接近高斯分布。由于正常训练数据样本集足够大,使用3σ原则能够达到理想的处理效果。

测试数据集的滑动时间窗温度残差分布如表5所示。

表5 测试数据集的滑动时间窗温度残差分布Table 5 Temperature residual distribution of sliding time window in test dataset

根据3σ原则,结合式(3)、式(4),可以得到系数k1的取值为0.7,k2的取值为0.65。因此,EY的取值为0.51,SY的取值为1.35。

将异常运行数据输入故障预警模型,经过滑动时间窗残差估计方法处理后,得到异常运行数据的残差均值和残差标准差的分布情况,分别如图5、图6所示。图中,横实线为预警阈值线,数据间隔时间为1 min。

图5 滑动窗口残差估计方法处理后的异常运行数据残差均值分布Fig. 5 Distribution of residual mean value of abnormal data obtained by residual estimation method of sliding time window

图6 滑动窗口残差估计方法处理后的异常运行数据残差标准差分布Fig. 6 Distribution of residual standard deviation of abnormal data obtained by residual estimation method of sliding time window

根据该风电场检修记录表中的记录,该风电机组由于变桨系统故障,于2019年9月18日14:29停机检修,故障原因是IGBT组件损坏。观察图5和图6可以看出,从第1500号数据开始,残差均值超过了均值预警阈值,残差标准差也超过了标准差预警阈值,可说明变桨系统变频器将出现故障。由此可以得出,本文提出的基于Xgboost算法和SCADA系统的风电机组变桨系统变频器的故障预警方法能在风电机组发生事故停机前5 h预测出变桨系统故障。

6 结论

本文基于SCADA系统,分别应用2种机器学习算法Xgboost和LightGBM进行了风电机组变桨系统变频器的故障预警模型的训练,对2种算法模型的效果进行对比后,选取了Xgboost算法作为故障预警模型的算法;然后结合滑动时间窗残差估计方法,分析处理模型的温度残差分布,得到了预警阈值。

故障预警的意义在于提前发现、提前处理、将损失最小化,但现行的“响应式维护”和“定期维护”方式所产生的维护成本,严重影响了风力发电产业的经济效益和技术进步。与其他的故障预警方法相比,本文提出的基于Xgboost算法和SCADA系统的风电机组变桨系统变频器的故障预警方法简洁、结果可信,且排除了人为因素的影响,更适用于风电机组变桨系统的故障预警。

猜你喜欢

残差变频器风电
10 上海电气风电问鼎全球整机商海上新增装机量冠军
变频器在电气自动化控制中的应用研究
基于残差-注意力和LSTM的心律失常心拍分类方法研究
融合上下文的残差门卷积实体抽取
风电建设项目全过程造价控制探讨
2020 年上半年欧洲风电新增装机统计
基于残差学习的自适应无人机目标跟踪算法
风电新景
三菱FX系列PLC与E系列变频器的RS-485通信研究
基于深度卷积的残差三生网络研究与应用