能量特性与随机森林的孤岛辨识模型
2021-03-24孟祥云
付 华,韩 冰,崔 鹏,孟祥云
(1. 辽宁工程技术大学 电气与控制工程学院,辽宁 葫芦岛 125105;2. 国网辽宁省电力公司 盘锦供电公司,辽宁 盘锦 124000;3. 国网辽宁省电力公司 锦州供电公司,辽宁 锦州 121000)
0 引言
随着社会对清洁能源的不断需求,分布式发电[1](Distributed Generation,DG)已成为重要发电方式之一.在非计划状态下,光伏并网发电系统产生的孤岛效应[2-3]会对供电设备以及人员安全造成严重损害.孤岛检测[4-5]的准确率易受到外部扰动影响,从而将外部扰动运行状态误判为孤岛运行.因此,辨识孤岛和外部扰动是孤岛检测必须具备的能力,快速有效的孤岛辨识模型具有重要的现实意义.
当前,主动式[6]和被动式[7]是最主流的两种光伏发电孤岛检测方法.主动式检测方法通过向逆变器注入一定扰动量[8],当发生孤岛时,形成扰动积累,从而判断出孤岛运行状态.主动式[9]具有检测盲区小,检测速度快的优势,但会影响发电系统的电能质量;被动式检测[10]方法通过对公共耦合点的电压、电流或频率的检测进行孤岛状态辨识,对发电系统的电能质量不产生影响,但有检测盲区大,检测时间过长的缺点.
文献[11]、文献[12]利用小波变换对提取的公共耦合点(Point of Common Coupling,PCC)电压信号进行处理,并将结果与设定的阈值进行比较,但在无其他技术配合下阈值的设置不当可能会降低识别的准确率.为解决此类问题,文献[13]采用小波变换与BP 神经网络结合的方法进行孤岛辨识.BP神经网络有较强的容错能力,以及较好的自学习、自适应能力,但同时也存在结构选择不一、收敛过程慢等问题.文献[14]、文献[15]应用小波变换和支持向量机(Support Vector Machine,SVM)进行孤岛与扰动辨识.SVM 的分类能力强,可以有效提高孤岛检测的收敛速度,但对于处理大量训练样本具有一定难度,影响孤岛检测结果.
针对上述方法的不足,提出将能量特性与随机森林结合的孤岛辨识模型.利用小波包变换[16]对PCC 电压信号进行分解和重构,同时保留高、低频信息[17],可以根据检测信号特征自动地选择对应频带,消除冗余和漏检,提高时频分辨率.随机森林[18]作为经典的机器学习算法之一,既弥补了BP 神经网络局部极小化等缺点,又可以解决支持向量机难以处理大规模训练样本的问题,同时可以包含多种特征向量,提高辨识模型的准确率.
1 孤岛辨识信号的特征量提取
1.1 孤岛辨识信号的变换
光伏并网发电系统进入孤岛运行后,系统参数发生改变,孤岛辨识信号也会出现波动.当逆变器的输出功率与负载功率匹配时,PCC 电压、频率变化微小,使用传统孤岛检测方法会出现很大盲区.应用小波包变换对PCC 电压信号进行处理,可以保留更全面的运行信息.对所提取的PCC 电压信号进行三层小波包分解,其分解过程见图1.
图1 三层小波包分解过程Fig. 1 three-layer wavelet packet decomposition process
1.2 PCC 电压信号的分解和重构
利用小波包变换,PCC 电压信号分解过程为
1.3 PCC 电压信号的特征能量提取
PCC 电压信号经变换后得到分解、重构系数,并进行特征能量求取,最后组成输入特征向量,送入孤岛辨识模型进行判别,算法流程见图2.
图2 PCC 电压信号特征能量提取流程Fig.2 PCC voltage signal characteristic energy extraction process
PCC 电压重构系数的特征能量为
式中,E(j,i)为第j层上的第i个节点的分解能量值;Ps(n,j,k) 为变换系数.
PCC 电压信号经小波包三层分解后共得到14个节点,将第三层的8 个节点的特征能量E0-E7进行组合,构造特征向量T为
对特征向量T归一化处理,得到特征向量
2 建立孤岛辨识模型
2.1 基于随机森林的孤岛辨识算法
孤岛辨识算法是一个包含多个决策树的组合分类算法,并且输出结果是由随机森林的多个决策树通过投票机制获得.
假设随机森林[19]是由一组决策树分类器{h(X,θk),k=1,2,…,n}组合的集成分类器,其中序列{θk,k=1,2,…,K}相互独立且分布相同,K是决策树的数目.当原始样本集X确定时,通过各决策树分类器共同投票决定最终结果为
式中,H(x)为组合分类模型;I(•)为示性函数;hi(x)为单个决策树分类模型;Y为输出变量.
基于随机森林的孤岛辨识算法具有一定的收敛性,确定一组决策树{h1(X),h2(X) ,…,hk(X)},从服从随机分布的原始样本集(X,Y)中进行随机抽样,定义余量函数为式(7).应用余量函数[20]反应分类准确率,随着余量值的增大,分类准确率越高.
随机森林的泛化误差和收敛表达式可以表示为
因此,基于随机森林的孤岛辨识算法不会因为决策树分类器数量增多而出现过拟合问题,提高了分类结果的准确率.
2.2 孤岛辨识模型的构建
孤岛辨识模型由随机森林分类器构成,分类过程见图3.
(1)利用Bootstrap 方法,从训练样本集X中随机抽取K个样本,并分为训练集和测试集.
(2)通过CART 算法构造K棵决策树分类器.根据式(10)计算基尼系数(Gini index)值.
式中,TS为所选特征量;n为样本对应的类别数;Pj则为样本j占总样本的概率;样本的基尼系数Gini(s)代表样本集S的不确定性.
设定某一特征量A的划分值为a,依据是否存在A>a,将样本集S分为S1、S2两部分,得到划分基尼系数为
划分基尼系数Gini(S,A)用来表示当特征量为A且划分值取a时,样本集S分解后集合的不确定性,Gini(S,A)越大划分后的样本集不确定性越大.因此,将最小划分基尼系数作为选择划分阈值的依据,其对应的特征量为最优属性,并根据最优属性和最优划分阈值对节点进行分裂,直至满足最大深度和最小基尼系数才停止分裂.
(3)将生成的K棵决策树组成随机森林辨识模型,并对测试数据进行分类,并依据决策树分类结果的众数做出最终投票决定.
图3 孤岛辨识模型构建过程Fig.3 construction process of islanding identification model
3 仿真分析
3.1 仿真参数及样本集确定
在Matlab 中搭建见图4 的仿真电路,其中U1、U2、i1、i2分别为PCC 电压、电网电压、逆变器输出电流及电网电流.仿真电路参数设置见表1.
表1 仿真电路参数Tab.1 simulation circuit parameters
图4 光伏并网发电系统仿真电路Fig. 4 simulation circuit of photovoltaic grid-connected power generation system
用于生成特征向量的样本集分为孤岛与扰动两种.考虑到外部扰动对辨识结果的影响,设计了正常运行和孤岛运行状态以及3 种外部扰动运行状态,包括负载投入、谐波扰动、本地负载短路,共计提取600 组训练样本、800 组测试样本,见表2.
表2 样本集Tab.2 sample set
3.2 PCC 点电压信号的小波包分析
设定采样频率为10 kHz,采样时间为0.2 s,对孤岛辨识信号进行采集,并随机抽取一组正常状态、本地负载短路状态及孤岛状态下的PCC 点电压信号进行对比分析.选择db5 作为小波包基函数,对PCC 点电压信号做3 层小波包分解,得到各频段的小波包分量信号,见图5.图5 中a3表示逼近信号,对应频段0~625 Hz;d1、d2、d3表示细节信号,d1对应频段2 500~5 000 Hz,d2对应频段1 250~2 500 Hz,d3对应频段625~1 250 Hz.
图5(a)是正常状态下分解所得的分量信号,在采样时间内各频段分量信号保持稳定,无高频分量出现.图5(b)是负载短路干扰下的分解信号,0.1 s 发生短路后,高频细节信号出现波动,但幅度较小.图5(c)是孤岛状态下分解后的分量信号,对比图5(a)、图5(b)可知,a3中的低次谐波分解后并无明显变化,且采样点数在1 000 之内时,辨识信号中不含高频分量,d1、d2、d3也呈平稳状态.但当0.1 s 时孤岛效应发生,辨识信号中出现高频分量,d1、d2、d3呈大幅度波动,此时获取的输入特征量更易被孤岛辨识系统识别.
图5 PCC 点电压信号3 层小波包分解的分量信号Fig. 5 component signal decomposed PCC 3-layer wavelet packet of point voltage signal
3.3 孤岛仿真分析
分析PCC 电压、电网电压、逆变器输出电流及电网电流的变化,对应Matlab 仿真结果如图6.
(1)图6 中(a)是光伏并网发电系统在正常工作状态下的运行波形,此时PCC 电压、电网电压、逆变器输出电流、电网电流波形均无变化,幅值保持稳定.
(2)图6(b)中是负载突然投入时的孤岛检测波形.由于负载的投入,电网电流在0.1 s 时迅速变大,此时逆变器仍处于并网状态,因此PCC 电压、电网电压、逆变器输出电流保持不变.
(3)图6(c)中是谐波扰动时的孤岛检测波形.在0.1s 时电网电流出现一定畸变,说明0.1 s 时电网电压加入了谐波扰动,但此时PCC 电压、逆变器输出电流均保持不变,该状态属于孤岛扰动状态.
(4)图6(d)中是本地负载短路的孤岛检测波形. 0.1 s 时电网电流突增,PCC 点电压大幅衰减,形成强干扰状态,但逆变器输出电流仍保持恒定,此状态为非孤岛状态.
(5)图6(e)中是孤岛产生时的检测波形.电网电流在0.1 s 时迅速降为0,表明此时孤岛已经产生,光伏发电系统处于离网状态,PCC 电压幅值保持稳定,逆变器输出电流有微小波动,这是由于电网脱离瞬间,光伏发电系统不能迅速达到完全稳定状态所致.
图6 仿真结果Fig.6 simulation result
3.4 辨识模型准确率分析
为验证孤岛辨识模型的分类能力,设计在不同训练样本数的情况下进行测试,计算辨识结果的准确率.测试结果见表3.
表3 辨识结果准确率Tab.3 accuracy of identification results
随着训练样本的增加,辨识结果的准确率逐渐提高,在训练样本超过200 组且测试样本超过300组的情况下,准确率都高于98.5%.
3.5 不同分类方法的辨识结果对比
从样本集中随机抽取300 组训练样本和400 组测试样本,将孤岛辨识模型辨识结果与传统分类方法SVM 和BP 神经网络进行对比,结果见表4.本文所提出的孤岛辨识模型准确率同时高于另外两种分类方法,且分类时间最短.
表4 不同分类方法辨识结果Tab.4 identification results of different classification methods
4 结论
在被动式检测的基础上,提出基于能量特性与随机森林的孤岛辨识模型.得出如下结论:
(1)PCC 电压信号经过小波包变换,可以同时提供高、低频分解重构信息,所提取的特征能量能更全面地反映孤岛与扰动运行状态.
(2)通过随机森林进行样本训练和测试,生成孤岛辨识模型.具备了处理大规模训练样本的能力,同时提高了收敛速度.适当增大训练样本数,可以提高孤岛与扰动辨识模型的准确率,降低因扰动做出误判的可能.
(3)将孤岛辨识模型的分类结果同BP 神经网络和SVM 进行比较,结果表明提出的孤岛辨识模型准确率更高,检测速度更快.