APP下载

PCA-CLUSTER和EMD-CNN相结合的光伏发电设备故障诊断方法

2021-07-30裴刘生周双全王海峰赵华鸿

太阳能 2021年7期
关键词:聚类故障诊断电流

裴刘生,周双全,王海峰,赵华鸿

(北京金鸿泰科技有限公司,北京 100081)

0 引言

随着光伏发电并网规模的不断增大,针对光伏发电设备故障诊断方法[1]进行研究变得尤为重要。光伏电站中光伏发电设备的类型众多,包括逆变器、汇流箱、光伏组件等基本的电气单元。由于光伏发电设备在运行过程中长期暴露在各种自然环境条件下,会造成设备的损坏,尤其是光伏组件会因遮挡、热斑等情况导致其故障频发;而且光伏发电设备在运行过程中还存在老化、失配、性能衰减等问题。这些问题会严重影响光伏发电设备的使用寿命和光伏电站长期、安全、稳定、高效地运行,设备一旦发生故障,势必会增加维护成本并造成发电量的损失。因此,通过光伏发电设备的输出特性研究光伏发电设备故障的诊断方法,并将诊断方法运用于设备的实际工作中,对于防止因设备故障造成的严重事故,降低电站的收益损失,实现光伏电站安全、稳定、持续、高效地运行,具有极其重要的意义。

各种光伏发电设备的输出特性表现出典型的时间序列[2]特征。在太阳辐照度、环境温度、遮挡等自然及人为因素影响下,光伏发电设备输出特性的时间序列呈现出不同的变化趋势;而且,光伏发电设备输出特性的时间序列趋势会与其匹配的光伏发电设备之间存在强相关性,比如,完全被阴影遮挡的光伏组件的输出电流普遍低于未被遮挡的光伏组件的输出电流;同时,失配会造成逆变器的输出功率降低[3]。

目前,传统的基于时间序列的光伏发电设备故障诊断方法普遍存在以下3方面的问题:

1)传统的数学建模方法是通过建立输入与输出之间的数学关系,利用统计学和阈值来进行故障诊断,在复杂条件下很难完成对所研究系统的精确建模,具有很大的局限性;

2)对于传统的人工智能故障诊断方法,可能存在弱化时间序列之间的相关信息及时间序列随时间变化的时序信息的情况,导致模型的诊断能力下降,引起误诊、漏诊等现象;

3)在技术方面,针对单个光伏发电设备的输出特征提取方法,通常是采用快速傅立叶变换(FFT)和小波变换技术,而这2种技术一般用于处理平稳的时间序列,难以挖掘光伏发电设备运行时的时间序列的深层次特征[4]。

针对以上问题,本文提出一种主成分分析-聚类算法(PCA-CLUSTER)和经验模态分解-卷积神经网络(EMD-CNN)相结合的光伏发电设备故障诊断方法。为弥补传统的人工智能故障诊断方法经常弱化光伏发电设备之间的相关信息从而导致存在误诊、漏诊的缺陷,本方法对光伏发电设备输出特性的时间序列进行主成分分析(PCA)[5],从冗余特征中提取主要成分,降低聚类输入维数,再利用K-Means算法对时间序列进行聚类分析,初步识别光伏发电设备的故障分类集合;在技术方面,针对非平稳的时间序列的特性,利用经验模态分解(EMD)提取故障分类集合中的时间序列的特征,继而使用卷积神经网络(CNN)作为分类器对时间序列特征进行训练和分类,以最终判断光伏发电设备具体的故障类型。

1 本文所述方法的介绍

1) PCA-CLUSTER。光伏发电设备输出特性的时间序列趋势特性是设备潜在故障的外在表现,每1个时间序列可以理解为多个维度的集合,且对应1种故障分类。但是,时间序列具有维度高、时间长、噪音多等特点,大量时间序列数据会导致聚类算法的效率低下、干扰因素过多,使时间序列失去了聚类趋势,也不易于进行聚类。因此,本文提出的PCA-CLUSTER方法的基本思路是:当研究的时间序列包含高维度、多噪音数据时,并且数据体现的信息存在交叉重叠情况时,应用PCA[6]来提取时间序列的关键特征维度,然后利用K-Means算法[7]对经过PCA后得到的时间序列进行聚类分析。以光伏发电设备输出特性的时间序列为例,先通过PCA对时间序列进行特征降维,尽量在不损失原有模型质量的情况下,将包含相同信息的特征维度从时间序列中剔除,以减少时间序列的特征维数;在此基础上,再进行时间序列的聚类。

2) EMD-CNN。光伏发电设备的输出特性是在设备受到包含环境温度、太阳辐照度、遮挡等外界环境的干扰信号及设备自身故障形成的干扰信号后生成的,因此,属于典型的非线性、非平稳时间序列。本文提出的EMD-CNN方法的基本思路是:通过采用EMD[8]和CNN[9]技术实现时间序列的特征提取、模型训练和异常判断;在对时间序列的原始数据进行预处理之后,首先利用EMD对预处理后的时间序列进行计算,提取时间序列的特征,并将其作为CNN模型训练的输入集;然后,由于CNN可以实现在一定数量的训练集中寻找到最优的分类效果,因此,采用CNN作为分类器对时间序列的特征进行训练和分类;最后,在CNN模型的基础上,针对待识别的时间序列进行异常判断。

2 采用本文所述方法时的具体步骤

本文提出的PCA-CLUSTER和EMD-CNN相结合的光伏发电设备故障诊断方法的具体流程如图1所示。

图1 本文所述光伏发电设备故障诊断方法的流程图Fig. 1 Flowchart of PV power generation equipment fault diagnosis method described in this paper

本文所述光伏发电设备故障诊断方法的具体步骤为:

步骤1):定义n个光伏发电设备t个时刻的时间序列S,用于反映光伏发电设备的输出特性,如式(1)所示。

步骤2):定义光伏电站中t个时刻的太阳辐照度集合G,如式(2)所示。

步骤3):以太阳辐照度集合为参考标准,对时间序列S进行归一化处理,得到归一化时间序列S′,如式(3)所示。

步骤4):利用PCA对归一化时间序列S′进行处理。首先,计算S′的相关数矩阵R;然后,求解t个特征值λ1,λ2,…,λt(其中λ1≥…≥λt≥0)和与其对应的标准正交特征向量e1,e2,…,et。求解主成分对总变差的累积贡献率,即并取得适当的z值,其中1<z≤t。

步骤5):基于步骤4)计算得到的主成分对总变差的累计贡献率,从而确定S′的主要成分因素,然后利用PCA-CLUSTER对S′进行聚类,获得k个聚类子集的集合C,如式(4)所示。

步骤6):基于集合C,利用EMD依次对k个聚类子集分别进行特征提取,经过处理获得不同故障情况下S′对应的特征数据集合,然后将S′按照一定的比例划分为训练样本和测试数据,为后续样本训练和模型验证提供基础数据。

步骤7):利用Spark技术搭建基于CNN的并行化模型训练应用架构,以实现对S′的快速和批量样本训练,并且通过不断对大量光伏发电设备的时间序列样本进行训练,逐步优化和提升故障诊断模型。

步骤8):利用Spark技术搭建基于CNN的并行化分类计算应用架构,基于步骤7)的故障诊断模型,对光伏电站中大量光伏发电设备输出特性的时间序列进行实时分类和计算,从而获得时间序列的分类结果,判断光伏发电设备的故障类型。

3 实验结果和实际应用效果

3.1 实验结果

3.1.1 数据来源

本次实验数据来自于某100 MW光伏电站中环境监测仪、逆变器、汇流箱、光伏组串等设备的2019年全年的数据,包括输出电流、输出电压、输出功率、太阳辐照度等;数据具备典型的时间序列特征,采样周期为1 min。现仅以2019年10月12日某个汇流箱汇集的12路(1#~12#)光伏组串的输出电流数据为例,阐述PCACLUSTER和EMD-CNN相结合的光伏发电设备故障诊断方法的实现过程。

3.1.2 数据预处理

由于光伏发电设备所处环境复杂,获得的数据量庞大且干扰因素较多,因此光伏组串输出电流的时间序列表现出不同的变化趋势。例如,若采集设备出现通信故障时,光伏组串输出电流的时间序列是恒值;若出现遮挡时,光伏组串输出电流的时间序列数值明显偏低等。10月12日某个汇流箱中1#~12#光伏组串的输出电流数据情况如图2所示。

从图2中可以看出,7#光伏组串的输出电流曲线反映了采集设备存在通信故障,3#光伏组串的输出电流曲线反映了该组串受到了遮挡。

图2 10月12日某汇流箱中1#~12#光伏组串的输出电流数据Fig. 2 Output current data by 1#~12# PV strings in a combiner box on October 12

当光伏组串的输出电流受到太阳辐照度的影响后,其会随着太阳辐照度的变化而产生波动,在环境温度、大气质量等其他条件保持不变的情况下,光伏组串的短路电流基本和太阳辐照度成正比。因此,为剔除太阳辐照度对光伏组串输出电流的影响,将输出电流归一化处理为单位太阳辐照度下的光伏组串输出电流。归一化处理后的光伏组串输出电流曲线如图3所示。

图3 归一化处理后的1#~12#光伏组串的输出电流曲线Fig. 3 Output current curve of 1#~12# PV strings after normalization treatment

3.1.3 降维和聚类

首先,对归一化处理后的1#~12#光伏组串输出电流的时间序列进行PCA,利用PCA来优化算法的输入维数,从而降低聚类分析时的复杂度,提高识别准确率。利用PCA进行特征降维,在确保累计贡献率不低于99%的情况下,提取时间序列中的前3个主成分的数据作为聚类算法分析时的输入数据,其得到的贡献率依次为62.11888%、34.531165%、2.509278%,此时的累计贡献率达到了99.159323%;由于其他时间序列的贡献率很小,因此将不作为聚类算法分析时的输入数据。

然后,利用K-Means算法对时间序列进行聚类,此时输入维数大量减少,极大地提高了计算效率和准确率。K-Means算法将1#~12#光伏组串的输出电流数据分成正常、恒值、偏低、偏低且下降、偏高5类。

3.1.4 特征提取和深度学习

针对聚类算法分析得到的5类结果,分别进行EMD-CNN析型,以提取故障特征、训练CNN模型和识别故障类型。在通过聚类算法分析得到的5类结果的基础上,对时间序列进行EMD,以提取时间序列特征。对不同分类结果进行EMD后的结果分别如图4~图8所示。

1)输出电流为正常类型时进行EMD后的结果如图4所示。

图4 输出电流为正常类型时进行EMD后的结果Fig. 4 Results of EMD when output current is normal type

由图4可见,原始信号(Signal)经过一小段时间的上升后,最终达到一个相对平稳的状态;Signal中的各频率分量(即IMF分量)大部分表现出相对平稳的状态,但有部分IMF分量呈现出上升趋势;残余项分量(res.)呈现先升后降的趋势。

2)输出电流为恒值类型时进行EMD后的结果如图5所示。

图5 输出电流为恒值类型时进行EMD后的结果Fig. 5 Result of EMD when output current is constant value type

由图5可见,Signal一开始时呈现逐渐下降的趋势,但经过一段时间的稳定运行后,又呈现逐渐上升的态势;IMF分量大部分表现出平稳的状态,只有IMF4分量出现较大幅度下降后又呈现平稳状态;res.呈现先降后升的趋势。

3)输出电流为偏低类型时进行EMD后的结果如图6所示。

图6 输出电流为偏低类型时进行EMD后的结果Fig. 6 Results of EMD when output current is low type

由图6可见,Signal经过一小段时间的上升后,最终达到一个相对平稳的状态;IMF分量大部分表现出平稳的状态,小部分IMF分量有上升趋势;res.呈现下降趋势。

4)输出电流为偏低且有下降类型时进行EMD后的结果如图7所示。

由图7可见,Signal出现明显的变化趋势,IMF分量的波动性较大,res.呈现先升后降的趋势。

图7 输出电流为偏低且有下降类型时进行EMD后的结果Fig. 7 Result of EMD when output current is low and declining type

5)输出电流为偏高类型时进行EMD后的结果如图8所示。

图8 输出电流为偏高类型时进行EMD后的结果Fig. 8 Result of EMD when output current is high type

由图8可见,Signal出现大幅下降趋势,IMF分量表现出或上升或下降的波动趋势,res.呈现下降趋势。

基于以上EMD提取的时间序列特征,利用CNN算法和Spark技术进行样本训练和测试,并利用某100 MW光伏电站中的14400个光伏组串进行故障诊断验证。

验证结果表明:仅采用PCA-CLUSTER方法时的故障诊断准确率为78%;仅采用EMDCNN方法时的故障诊断准确率为85%;而采用PCA-CLUSTER和EMD-CNN相结合方法时的故障诊断准确率可达到95%。由此可知,PCACLUSTER和EMD-CNN相结合的方法可使故障诊断的准确率显著提高。不同故障诊断方法的准确率情况如表1所示。

表1 不同故障诊断方法时的准确率情况Table 1 Accuracy of different fault diagnosis methods

由此可见,PCA-CLUSTER和EMD-CNN相结合的故障诊断方法可以实现对光伏发电设备故障的精准诊断,且对光伏组串进行故障诊断时切实有效。

3.2 实际应用效果

本文提出的PCA-CLUSTER和EMD-CNN相结合的光伏发电设备故障诊断方法目前在光伏电站的使用规模已达到3 GW,取得了良好的应用效果,具有巨大的使用价值和广阔的应用前景。

4 结论

本文提出了一种PCA-CLUSTER和EMDCNN相结合的光伏发电设备故障诊断方法,并以某100 MW光伏电站中的14400个光伏组串为例,采用该方法进行了故障诊断验证。结果显示,此方法的准确率可达95%,高于仅采用PCACLUSTER方法时78%的准确率和仅采用EMDCNN方法时85%的准确率。

本文提出的光伏发电设备故障诊断方法在不损害光伏组串输出电流时间序列特征的前提下,利用PCA方法剔除了光伏组串输出电流的时间序列之间的冗余性和相关性,降低了高维度时包含的噪音影响,提高了PCA-CLUSTER方法的性能,从而取得良好的聚类效果;PCA和K-Means相结合的PCA-CLUSTER算法具有极大的创新性,且提升了聚类算法的准确率。将EMD方法提取的时间序列特征作为CNN的训练样本和测试数据,利用Spark技术搭建基于CNN的并行化模型训练和分类计算应用架构,极大地提升了样本训练的效率和故障类型识别的准确性。

猜你喜欢

聚类故障诊断电流
一种傅里叶域海量数据高速谱聚类方法
比亚迪秦EV充电系统故障诊断与排除
基于神经网络的船舶电力系统故障诊断方法
迈腾B81.8T起动机无法启动故障诊断分析
一种改进K-means聚类的近邻传播最大最小距离算法
AR-Grams:一种应用于网络舆情热点发现的文本聚类方法
标定电流与额定最大电流的探讨
交变电流基本知识汇总
交变电流高考真题赏析
基于Spark平台的K-means聚类算法改进及并行化实现