基于高斯核函数的支持向量机光伏故障诊断研究
2021-06-19张晓鹏张兴忠
张晓鹏,张兴忠
(1.国网山西省电力公司大同供电公司,山西 大同037008;2.太原理工大学,山西 晋中030600)
0 引言
近年来,随着单晶硅提取成本的降低以及逆变器效率的升高,光伏发电度电成本不断下降,已能接近于平价上网[1]。然而,光伏组件的生命周期较长,光伏阵列使用过程中的故障不可忽视。及时诊断光伏阵列故障,对提高发电收益、降低运维成本具有实际意义[2],[3]。
车彬等[4],[5]通过K均值聚类并改进径向基神经网络(RBF)进行光伏组件故障诊断,但基于MATLAB平台,没有很好的实时检测效能。刘恒[6]通过仿真和实验模拟得到光伏组件在不同失配情况下输出的I-V曲线,利用I-V曲线阶梯特征判别故障类型。李光辉等[7],[8]利用光伏阵列输出参数(电压、电流),应用半监督机器学习算法分析光伏阵列工作点状态,识别故障类型。宋文海[9]在传统光伏阵列串并联(SP)结构基础上,设置传感器分布区域,将光伏阵列串并联结构改为TCT结构进行检测,该方法可以及时检测故障,但应用成本较高,难以实现规模化应用。
本文依据所建立的光伏阵列仿真模型,通过模拟不同故障I-V曲线,提取重点故障特征,依据改进的支持向量机(SVM)核函数和惩罚因子进行训练,最终获取故障诊断结果。
1 仿真分析
本文10 kW光伏阵列按照串并联结构10×4进行布置,并基于MATLAB/Simulink模块建立光伏阵列仿真模型,模拟典型故障条件下的I-V,PV曲线,通过总结并提取故障特征进行建模。光伏阵列故障主要包括阴影遮挡、短路、断路、黄化、老化等,这些故障特征表现为阵列I-V曲线阶梯、P-V曲线多峰问题;组串电流减小;组串电流为0;串联电阻(Rs)增大、填充因子(FF)减小。
1.1 模拟阴影遮挡故障
在模拟阴影遮挡实验中,设定第三组串25%、第四组串50%被阴影遮挡,其余组串正常,仿真结果见图1。从图1(a)中可以看出,正常组串I-V曲线较为平滑,而阴影遮挡I-V曲线出现阶梯状,并且故障越严重,“膝”状阶梯越为陡峭。从图1(b)中可以看出,相对于正常组串,故障组串的P-V曲线出现多峰现象。从图1(c),(d)中可以看出:阴影遮挡故障光伏阵列I-V曲线出现多个阶梯状,且故障越严重,“膝”状阶梯越为陡峭;阴影遮挡故障阵列的P-V曲线出现多峰现象。
图1 各类故障组串、阵列的I-V,P-V曲线Fig.1 The I-V and P-V curves of various fault strings and arrays
1.2 模拟黄化、老化故障
为研究黄化、老化故障对整个光伏阵列输出功率的影响,在试验中设定第三组串25%、第四组串50%的组件老化,其余组串正常。相应仿真结果如图2所示。
图2 模拟黄化故障组串、阵列的I-V,P-V曲线Fig.2 I-V and P-V curves of simulated yellowing fault string and array
1.3 模拟组件短路、断路故障
为研究组件短路故障,模拟第三组串中1组件短路,相应示意图如图3(a)所示。为研究组件断路故障,设定第四组串断路,相应示意图如图3(b)所示。
图3 模拟短路、断路故障示意图Fig.3 Schematic diagram of analog short circuitand open circuit fault
需要进一步指出的是,光伏阵列在实际工况中,由于组件之间采用串并联(SP)连接,组串之间电压相等,从功率减少的角度,电压相等导致故障组串电流减小,因此组件短路意味着整个光伏组件失效,可等同于被完全遮挡,亦会造成I-V曲线出现“膝”状的现象。同理,短路故障时阵列I-V,P-V曲线出现的特征与阴影遮挡类似,仿真曲线如图4所示。断路故障是短路故障的严重情形,图像较为简单,本文不再给出。
图4 模拟短路故障I-V,P-V曲线Fig.4 The I-V,P-V curves of simulated short circuit faults
2 特征提取及建模
2.1 光伏阵列故障特征提取
根据搭建的光伏阵列模型,对在不同辐照强度、不同环境温度以及不同故障状态下的I-V,PV曲线进行分析发现:I-V,P-V曲线充分反映了光伏阵列运行时的状态,且同时包含着大量的运行环境信息;不管是阴影遮挡还是短路故障,光伏阵列I-V,P-V曲线在一定程度上都会表现出异常状态。光伏阵列的短路电流和开路电压可以很明显地体现环境的变化状态,具体如表1所示。
表1 典型故障下故障特征参数Table 1 Fault characteristic parameters under typical faults
根据表1可构建典型故障下的特征参数,本文用1,0,-1表述,带入构建的线性核函数支持向量机的数学矩阵,各参数对应不同特征的特征值可按表2设置。
表2 典型特征参数的特征值Table 2 Eigenvalues of typical characteristic parameters
根据表2,可获得各自故障条件下的特征矩阵,如表3所示。
从表3可以看出,七维特征矩阵能很好地表征各类故障,且故障特征的区分度具有唯一性,避免故障特征参数之间的耦合,是提高故障辨识能力的重要支撑。如阴影遮挡故障特征矩阵为(1,1,1,0,1,1,0)。
表3 不同故障下特征参数的特征值Table 3 The eigenvalues of typical characteristic parameters
2.2 支持向量机理论基础
支持向量机是一种经典机器学习方法,对于线性分类有较好的实用性。设已知训练集为
T={(x1,y1),(x2,y2),…,(xi,yi)}∈(X×Y)l(1)式 中:xi为 特 征 向 量,xi∈X;yi∈Y={1,-1};i=1,2,3,…,l。
对于非线性结构,需要通过高维空间变换,将非线性分类变成高维的线性分类问题。光伏故障特征由于涉及参数较多,是一个非线性多分类问题,因此需要将低维空间映射到高维空间,利用核函数对其整体计算量进行简化计算。考虑到支持向量机核函数较多,有多项式核函数、高斯核函数等,本文选择高斯核函数K(x,x')和适当的参数C,构造并求解最优化问题。
相应的决策函数为
2.3 具体步骤
①采集光伏阵列数据,获得训练样本集。由于实际光伏阵列本身未必表现出各类故障,因此在采集光伏阵列故障样本数据进行试验时,需要注意模拟故障的典型性。如阴影遮挡故障,遮挡范围、遮挡程度须要加强一些,否则难以获得故障特征。此外,采集各种典型特征条件下的特征数据的样本量要达到一定数量,以满足智能训练要求。
②数据预处理。这是一个重要的步骤,须对采集的样本数据进行平滑处理和归一化处理。
③训练数据故障特征匹配。根据2.1 节,分别将各类故障定义成一个特征向量,并作为支持向量机的故障特征参数标签。
④参数寻优。使用粒子群寻优算法对高斯核函数的惩罚因子和参数进行调整和选择,以获得最佳参数。
⑤进行故障诊断模型训练和学习。
⑥测试准确性。
3 试验验证
本文基于所搭建的10 kW电站,对阴影遮挡、短路、断路故障进行试验,考虑到黄化故障通过原始光伏组件自然老化或者加速老化试验对光伏电站的影响,采取串联等效电阻的方式进行。试验模拟故障情况如图5所示。
图5 试验模拟故障Fig.5 The simulated fault diagram of actual test
选择阴影遮挡、黄化、短路、断路4类故障共6 000份数据及正常状态1 500份数据作为训练集;阴影遮挡、黄化、短路、断路4类故障各30份,共120个样本作为测试集。利用粒子群算法对核函数参数γ与惩罚因子C进行寻优,获得最佳参数,确定最终的测试结果。试验表明:当γ=1,C=1时,除断路故障准确性较高以外,其余故障的准确性在80%左右;通过不断调整γ,C,可以适当提高测试准确性。当γ=12.23 ,C=68.6 时,准确性达到95%以上,对应的检测结果如图6所示。不同参数因子下的准确性如表4所示。
图6 故障检测结果Fig.6 The fault detection results
表4 不同参数下各类故障测试准确性Table 4 Test accuracy of various faults under different parameters %
4 结论
本文通过搭建光伏阵列模型模拟不同故障,分析不同故障的特性曲线,提取相应的故障特征值,建立故障特性矩阵。为解决传统支持向量机不能解决多分类的问题,对数据进行高维映射,同时引入高斯核函数进行求解,并引入粒子群算法对惩罚因子等参数进行寻优,最终选择最佳核函数参数γ和惩罚因子C,获得较为精准的光伏阵列故障诊断模型。试验表明,采用本文所提出的方法,阴影遮挡故障辨识率为93.9%,黄化故障辨识率为96.7 %,短路故障辨识率为96.7 %,断路故障辨识率为100%。