基于聚类算法的光伏发电设备故障诊断方法
2022-11-10朱小超
朱小超
(国网宁夏电力有限公司银川供电公司,宁夏 银川 750011)
0 引言
光伏发电设备中的电气构成主要包括汇流装置、光伏组件。通常情况下,光伏发电设备会在自然暴露的环境下使用,因此,设备极易受到外界环境的干扰出现故障运行行为。倘若不及时采取有效的措施对此种故障行为进行处理,不仅会导致设备故障频发,还会使其中的光伏组件在运行中出现老化、磨损、性能衰退等方面的问题[2],进而不同程度地影响光伏发电设备的使用年限,甚至会增加设备后续投入使用的经济成本。为防止设备故障造成的运维成本增加,应做好对设备故障的诊断工作。基于以上分析,在现有研究成果的基础上,引进聚类算法,设计一种针对光伏发电设备的故障诊断方法,掌握设备在不同运行条件下的输出信号时间序列,并通过仿真建模的方式对故障诊断的过程进行迭代,保证故障诊断结果高精度。
1 基于聚类算法的光伏发电设备故障诊断方法设计
1.1 光伏发电设备故障特征与训练样本选择
为实现对光伏发电设备故障的精准诊断,在设计故障诊断方法前应选择一些具有特征性的参数,用于描述设备的运行工况与运行状态。所选的故障特征参数不仅应具备描述设备运行状态的特点,还应当具备泛在性。考虑到光伏发电设备的运行会受到外界环境的干扰而出现异常,因此,对参数在选择前进行仿真模拟[3],根据实际需求,设定光伏发电设备在运行中的故障状态属于空间状态,将其故障特性用I-V与P-V两条曲线表示,为确定I-V与P-V曲线在空间状态下的具体形状,需要选择设备运行中的样本,确定至少三个数据点,分别为(0,Isc)、(Voc,0)、(Vm,Im),实现对上述三个点的定位后,即可绘制I-V与P-V两条曲线的近似形状。上述提出的点坐标中,Isc为光伏发电设备在运行中的短路电流切换点,Voc为设备在运行中的开路电压,Vm为设备在运行中的最大功率点电压值,Im为设备在运行中的最大功率点电流值。将提出的四个参数作为特征参数,输出特征参数,构建光伏发电设备故障特征集合,将其以特征向量的方式表达,具体为(Vm,Im,Voc,Isc)。
完成上述研究后,将光伏发电设备在运行中的光伏阵列单元作为故障仿真建模的基本单元,按照设备的不同运行工况,将其故障表现形式划分为五类,分别为常态化工作模式(正常工况)、组件开路运行模式、组件短路运行模式、阴影故障与多重组合故障[4]。其中多重组合故障是指在光伏阵列中由两种或两种以上故障共同构成的故障形式,对故障表现方式进行划分,使用子故障表示,按照子故障类型进行标号,分别为F1、F2、F3、F4…FC,其中C为故障的不同种类型。
为获得光伏发电设备故障训练样本,可对设备在运行中的C种故障类型进行仿真,通过此种方式,可以得到设备在不同故障形式下的样本数据。按照上述提出的故障向量特征,对C种故障类型进行仿真,形成如下计算公式所示的样本数据集合,表达式如下:
式中:X为光伏发电设备故障训练样本;n为训练样本数量(规模);xi为第i个故障的训练样本,其计算公式为
按照上述方式对不同故障样本进行描述,对应样本的空间维度数即可用于表示设备故障特征分量。
1.2 基于聚类算法的故障信息归一化处理
完成上述研究后,为保证对故障诊断的高精度,本章引进聚类算法,对光伏发电设备故障训练样本与特征集合进行归一化处理[5]。在此过程中,对所有故障信息进行离散,根据离散点在空间中的分布,将C种故障类型进行专项处理,使其成为C种不同的数据表现方式。考虑到离散数据集合存在若干个中心点,因此,可在提取若干个中心点后进行不同中心隶属度的划分,并将故障值归一化处理的过程作为最大隶属度模糊识别的过程。假设在多种故障模式下,光伏发电设备的聚类中心为J,此时由于原始数据不同分量级别存在差距,且数据纲量不同,因此,可以认为J的具体值完全依赖于不同故障的差异度。在以J为中心进行故障的识别与诊断时,应进行不同数据尺度的校正与统一,只有满足此方面需求,才能保证对数据之间纲量误差的消除。以J为聚类中心,对故障特征值进行归一化聚类处理,可将处理过程描述为以下计算公式:
式中:J'为故障信息归一化处理结果(聚类结果);Jmin、Jmax分别为特征数值中的最小值与最大值。
为确保对数组聚类的完全化,可在完成上述研究后,使用聚类算法中的距离阈值,对聚类结果与聚类中心的距离进行计算与判别,通过此种方式,降低或减少由于人为设定因素对聚类结果造成影响的问题发生。在此过程中,定义两个变量参数,将其设为FS与D,其中FS为聚类中心最优值(距离所有故障离散点直线最近距离),D为固定训练次数,对FS与D的关系进行描述,如图1所示。
图1 聚类中参数FS与参数D的大致对应关系
从图1中可以看出,抛物线中存在一个最小值点,将此点定义为A,则A点可以作为故障值聚类的最优点。将A点作为中心,参照上述方式,对故障信息进行处理,以此实现对故障的归一。
1.3 构建光伏发电设备故障诊断模型
完成上述研究后,引进3D CNN技术与卷积网络,构建光伏发电设备故障诊断模型,基础模型结构如图2所示。
图2 光伏发电设备故障诊断模型架构
在建模时,先进行聚类中心的降维处理,得到一个更加优化的故障信息聚类中心,将构建的故障矩阵信息导入作为测试数据集合,将数据集合导入三维卷积网络中进行数据测试。
在光伏发电设备运行数据集合中圈定未被分类的数据集合,定位距离聚类中心较远的数据,整理所获取的数据,对其进行标注,将其设为M,对M中的元素与可代表位置的向量进行累加计算,得到故障点的偏移距离,将聚类中心点沿着偏移方向进行移动,当两点发生重合后,将移动的距离作为偏移向量的模量。重复上述步骤,直到故障中心与模量中心的阈值差匹配或所有的测试数据集合都被归类[6]。使用Tensortflow框架,建立一个卷积神经网络,将矩阵数据作为测试数据集合。在此基础上,读取或在构建的模型中录入训练数据,对数据的上限值与下限值进行初始化处理,得到一个数据种群,根据数据种群的所属类别进行数据是否在阈值范围内的识别与判断:当识别为“Y”时,说明数据在安全阈值范围内,即可跳转下一数据种群进行继续判别;当识别为“N”时,说明数据不在安全阈值范围内,需要提取此数据进行空间定位与故障仿真模拟,评价数据是否为故障发生点数据。当确定该点数据为故障点数据时,直接输出此数组,将数据对应的时序与光伏发电设备的运行时序进行对照与匹配。通过此种方式,实现对光伏发电设备故障诊断模型的构建。
1.4 模型仿真训练与故障诊断结果匹配
为进一步提高光伏发电设备故障诊断模型对故障诊断的精度,需要在上述研究内容的基础上,对构建的模型进行仿真训练,确保诊断的结果与故障真实结果匹配。在此过程中,使用Shift数据均值漂移算法,沿着高密度数据方向,持续进行数据的上升处理,寻找并定位数据的聚类簇族线,在一个样本为α的特征空间内,引进核函数,对模型进行高维度映射,赋予诊断行为在空间中更高的权值。
式中:mα为光伏发电设备故障诊断模型仿真训练过程;G为偏移带宽;γ为高斯核函数表达式;D为样本数量;d为样本在空间中距离聚类中心的直线距离;r为聚类中心安全阈值半径。
按照上述方式,对光伏发电设备故障诊断模型进行迭代与训练,直到模型中可变参数在迭代后成为一个极小数值后完成对模型的迭代。在此基础上,输出基于模型的光伏发电设备故障诊断结果,确定诊断结果中不同参数在空间中的正态分布,根据参数的空间分布得到一个可用于表示故障的隶属度函数。将测试样本数据代入隶属度函数中计算故障诊断结果中不同数值的隶属度大小,将其作为特征分量的计算结果值。取计算结果中的加权平均值,采用累加计算的方式对加权平均值的总隶属度数值进行计算,按照计算结果的大小对其进行次序排列,根据排列的顺序定义不同故障在诊断结果中的重要性,按照此种方式完成对光伏发电设备故障的诊断。此外,应进行空间故障点的匹配,即将模型诊断的结果导入空间结构模型中进行故障的仿真,当故障表现形式与故障诊断结果一致时,说明模型诊断的设备故障结果准确。当导入空间结构模型后发现故障诊断结果与故障表现形式存在不一致的现象,需要进行故障点的继续排查说明设备中存在其他未发现的故障。按照此种方式完成对设备运行中所有数据的排查,确保诊断的故障结果与真实故障匹配。
2 对比实验
为了检验本文设计的故障诊断方法是否能在实际应用中发挥既定的效果,通过设计仿真对比实验的方式,对此次设计的成果进行检验。
2.1 实验数据来源
为确保实验数据的可靠性与实验结果的真实性,此次实验选择某地区大型光伏发电厂作为研究对象。本次实验中涉及的样本数据与训练数据均来自某180 MW光伏发电站中的传感器记录数据。为避免连续数据存在偏差,在完成对基础数据的获取后,从该发电厂中的环境监测仪、组件串中获取测试设备的全年运行数据,包括设备在运行中输出电流、设备额定功率、不同时段的太阳辐射照度等数据。在进行数据采样时,采用典型的时间序列进行采样,设定数据采样的频率为每分钟1.0次。整理并汇总所获取的数据,现以2021年11月12日该设备汇流装置8路光伏组件的输出电流为例,展开故障诊断方法的实验研究。将此次研究所采集的样本数据用时间序列表示,表达式如下:
式中:S为采集样本数据的时间序列表达方式;N为光伏发电设备种类;t为采样时刻;s为某特定时刻下的样本数据。
按照上述方式,完成对此次实验中样本数据的采样处理。
2.2 实验样本数据预处理与本文方法可行性检验
完成对此次实验样本数据的获取后,考虑到光伏发电设备的运行环境较为复杂,在此种环境下获取的数据集合中存在大量冗余数据或干扰性信息,因此,时间序列数据极易呈现出异常变化趋势。例如,当采集装置在进行光伏发电设备运行中信息的采集时,极易出现故障行为信息为恒值或正常行为数据为突变值的情况。为避免采样数据出现异常现象影响设备故障诊断结果,应在完成对数据的基础处理后对样本数据进行归一化处理,在此基础上构建光伏发电设备故障诊断模型,并通过模型的仿真训练对故障诊断结果进行不断的迭代处理,直到诊断的故障值中无异常干扰数据。
按照本文设计的方法对光伏发电设备8路光伏组件的输出电流进行故障诊断。诊断时,将电流传感器集成在8路组件的电流输出端,采集一天从8:00开始到18:00结束的组件输出电流变化情况,将电流传感器反馈的结果呈现在监测终端显示屏上,通过此种方式,实现对光伏组件异常现象的可视化诊断。实验结果如图3所示。
图3 8路光伏组件全天运行输出电流情况
根据光伏组件的常规运行状态可知,光伏发电设备的输出电流与当日光照情况呈现正比例关系,即太阳辐射照度越强烈,光伏组件输出电流越高;反之,太阳辐射照度越微弱,光伏组件输出电流越低;因此,在8:00到18:00的监测范围内,光伏组件应在12:00输出电流值最高,并在14:00后输出电流呈现下降趋势。根据图3所示的实验监测结果可以看出,1~7路光伏组件的输出电流符合常规规律,均在上午处于持续上升阶段,到12:00达到输出电流最大值,此后的电流输出值开始出现下降趋势,但第8路光伏组件的输出电流变化趋势却与常规变化规律存在显著差异,由此可以判断在本文研究的光伏发电设备中,第8路组件的运行存在故障,无法在光伏发电厂中达到预期的发电效果。综上所述,此次研究设计的基于聚类算法的故障诊断方法可以实现对光伏发电设备故障的诊断。
2.3 对比分析
完成对本文设计方法可行性的检验后选择基于经验模态分解-卷积神经网络(empirical mode decomposition and convolutional neural network,EMD-CNN)技术与主成分分析-聚类算法(principal component analysis and cluster,PCACLUSTER)的光伏发电设备故障诊断方法[3]作为传统方法,对两种方法在实际应用中的效果进行对比分析。
选定测试数据样本集合,在使用传统方法进行光伏发电设备的故障诊断时需要先进行设备输出特性时间序列的定义,根据实验需求对固定时刻下的太阳辐射照度集合进行定义处理。根据此集合的表达方式对光伏发电设备的输出电流数据进行时间序列匹配处理,再使用PCACLUSTER数据并行处理技术,对时间序列进行降维处理,根据数据的降维结果选择一个贡献度较高的因素作为故障诊断中的主成分因素。按照上述处理方式对所选的因素进行归一化处理,根据处理后数据的聚类方式对数据进行综合聚类。在此基础上,使用EMD-CNN技术构建故障仿真诊断模型获取故障聚类结果的特征值,得到光伏发电设备在不同运行情况下的特征表达式。使用CNN技术对模型进行并行训练,输出迭代训练后的最小故障值信息,将输出的信息作为故障诊断结果。按照上述方式,实现基于传统方法的设备故障诊断,再使用本文设计的故障诊断方法,按照所设计的步骤对光伏发电设备的故障进行诊断。输出两种故障诊断方法诊断得到结果并对其进行离散化处理,处理后对空间中的离散点进行仿真聚类,根据聚类结果可以掌握此方法对故障的诊断与识别情况。将两种方法在故障诊断中的模型迭代次数作为对比指标,对迭代过程进行描述,如图4所示。
图4 两种诊断方法中模型迭代次数分析
从上述图4所示的实验结果可以看出,在进行光伏发电设备的设备诊断时,本文方法可以在30 s时完成基于故障诊断模型的迭代处理,即在30 s时完成对设备故障的诊断。传统方法在60 s时完成基于故障诊断模型的迭代处理,即在60 s时完成对设备故障的诊断。因此,在完成实验后,得到如下所示的对比实验结论:相比基于EMD-CNN技术与PCA-CLUSTER数据并行处理技术的故障诊断方法,本文设计的基于聚类算法的光伏发电设备故障诊断方法可以在更短的时间内完成对故障的诊断。在进行设备同一故障的诊断时,本文设计的方法用时更短、效率更高。
3 结语
从光伏发电设备故障特征与训练样本选择,故障信息归一化处理,光伏发电设备故障诊断模型构建,模型仿真训练与故障诊断结果匹配四个方面开展基于聚类算法的光伏发电设备故障诊断方法设计。以某地区大型光伏发电厂作为研究对象,选择基于EMD-CNN技术与PCA-CLUSTER数据并行处理技术的故障诊断方法作为传统方法,通过对比实验证明,本文此次研究设计的方法在实际应用中,对故障的诊断效率更高,保证了光伏发电厂工作人员对故障处理的及时性。