基于模糊匹配的配电网短路故障区段定位方法
2023-01-30高艺文1呈1苏学能1高红均
高艺文1,龙 呈1,苏学能1,石 铖,高红均
(1.国网四川省电力公司电力科学研究院,四川 成都 610041;2.四川大学电气工程学院,四川 成都 610065)
0 引 言
配电网直接面向终端用户,和生产生活息息相关,担负着重要责任。然而,随着中国配电网规模的不断扩大,短路故障发生的次数也在不断增多,若未及时识别并处理故障,可能会造成设备烧毁、大面积停电等危害。但是,目前市面上的各类终端质量良莠不齐,且施工水平和安装环境都有较大的差异。这导致一部分终端可能会在配电网发生故障后漏报故障信号或在配电网正常运行时误报误传故障信号[1]。因此,如何在不完备信息的状况下快速准确地辨识、定位和处理配电网短路故障亟需研究。
文献[2]提出一种基于粗糙集与决策树的配电网故障诊断算法,实现了对故障样本决策表进行无教师的规则提取。文献[3]基于时序贝叶斯知识库建立了故障定位模型,提出了一种故障元件与保护动作之间的时序信息表达,充分地利用了报警和时序信息。文献[4]利用最小故障判定区域这一概念构建了故障指示器故障诊断模型,该模型可以一定程度上克服故障定位中信号漏报误报的问题。文献[5]对故障指示器的特点进行了相关的分析,基于此提出了一种组合信号故障诊断方法;文献[6]通过对配电网故障后2 ms的零序电流进行经验模态分解,提取其暂态分量中的高频信号作为特征量,通过模糊神经网络实现中性点非有效接地的中低压配电系统的故障分类。文献[7]提取了故障电流及电流变化率作为特征量,通过BP神经网络实现电网的故障辨识与定位。但上述文献仍存在一些问题:单一数据源会导致故障定位的准确率不高;传统神经网络算法可以达到比较高的准确率,但容易陷入局部极小值,而且存在迭代时间过长、收敛速度慢等问题。
随着10 kV配电网数据实时监测系统的不断完善,诸多区域的大量运行电气量数据、故障数据等各类信息均可以实时上传至各类系统。从配电侧到用户侧的大量历史数据,为配电网的行为分析、负荷预测、故障区段定位奠定了坚实的基础。若能通过深度挖掘同类型数据中蕴含的特征信息以及不同类型数据间隐藏的关联信息得知故障发生的原因和位置,甚至预知网络中可能发生的故障,就可以为抢修工作提供一定的理论依据,达到更快更准确排除故障、恢复供电、减少停电损失的目的。但是,配电网大数据研究中数据库值过多会导致数据过剩、故障诊断效率过低等问题,这些难题都会给配电网及时准确的故障定位带来巨大的挑战。
因此,下面基于配电网故障的非健全信息环境,提出将配用电信息系统所采集的多类数据与具有模糊匹配能力的Elman神经网络相结合,进行10 kV配电网短路故障的区段定位。首先,以配用电信息系统中的多源数据为基础,分析与配电网短路故障相关的各信号和电气量,建立故障区段定位的数据特征库。其次,针对数据特征库过于庞大的问题,利用I-Relief算法来进行特征降维和筛选,选择最佳的故障区段定位特征;然后,利用Elman神经网络进行故障诊断与定位训练,得到短路故障区段定位的模糊匹配模型;最后,通过实际算例证明了所构建模型的可行性。
1 配用电信息系统及配电网故障区段定位数据特征库
配用电信息系统涵盖了供电电压检测、配电变压器负荷检测、电能质量、用户信息采集、可靠性分析等系统。这些系统实时搜集各类数据并上传至数据中心,运用这些数据可以更加有效准确地对故障进行诊断及定位。配用电信息系统中所记录的数据来源较为丰富,不仅包括电压、电流、有功和无功功率等电气量数据,还包括发生故障时的停电时间、停电区域、保护开关动作、告警信息等故障数据。
在传统的故障区段定位中,往往只依据断路器动作和保护动作来定位。但当故障电流较小时,很有可能难以捕捉信号从而不发生跳闸动作,若长期未发现故障,会导致电压过高,加剧配电网的运行风险。并且当故障发生后,由于各种原因可能会导致监测数据缺失或者不准确。所以应当扩充故障诊断的数据源,通过挖掘多类数据找到可以直接或者间接反映故障位置及发生原因的数据类型,从而在不完备信息的前提下进行配电网故障区段定位。这里将故障区段定位的特征分为断路器跳闸及保护信号与电气量。
1)断路器跳闸及保护信号
保护信号分为母差保护、电流保护、距离保护和差动保护信号等。当配电网发生单相接地故障时,若中性点有效接地,会产生较大的电容电流,此时相应的断路器和保护装置便会发生动作来切除故障转移供电,此类信号较为明显,可以有效地反映故障的发生。但是,当接地方式为非有效接地时,保护装置很难察觉其微弱的变化,便需要结合其他电气量数据来进行综合判断。
2)电气量
配电网在发生各类故障后,即使断路器和保护装置未动作,但各系统所采集到的馈线侧、配电变压器侧和用户侧的电流、电压、有功和无功功率等电气量数据都会发生不同程度的变化。当主线发生故障后,馈线侧与配电变压器侧由于离故障位置距离更近,数据变化程度更加明显;用户侧位置虽较远,但结合多类数据的特征,也可以反映故障的位置和类型。上述电气量的数值可以有效反映故障情况,其随时间的变化率也是故障的重要表征之一。由于故障后的暂态信息量采集困难,只考虑稳态数据。
以断路器跳闸及保护信号和电气量作为故障诊断特征量,构建了数据特征库,如表1所示。
表1 配电网短路故障诊断特征库
2 基于I-Relief算法的故障区段定位主要特征筛选机制
配电网短路故障与网络中的运行参数及设备质量等多类数据有着复杂的关联。为了挖掘其关联规则,首先需要选择最佳特征以表征故障的发生及其类型。但由于故障诊断特征库数量庞大,必然会出现故障特征较低或者特征冗余的现象,因此要选出特征性最强且特征之间相关性最弱的主要特征。
I-Relief算法是以特征与类别相关程度为基础进行特征权重的计算,若某个特征在异类的样本中差异度较大而在同类样本差异度较小,则该特征有良好的表征能力。对于一个训练数据集D,算法会从其中任意选择一个样本X,从和X同类以及异类的样本中分别寻找k个最近邻样本集,之后对X和同类最近邻样本集、X和异类最近邻样本集在不同特征上的间隔进行比较。如果间隔越小,则该特征表征能力强,应加大其占比;反之,则减小其占比。I-Relief算法克服了传统Relief算法在配电网短路故障区段定位应用中存在的弊病:1)传统算法只能解决二分类问题,然而实际配电网中短路故障是一个典型的多分类问题,而I-Relief算法可以良好地解决多分类问题;2)由于特征库中存在大量无用特征,若目标函数中的间隔采用的是平均间隔,当存在异常值时,平均间隔可能出现与预期不符的负值,导致算法性能大大削弱;而I-Relief算法通过引入概率加权平均间隔向量βi代替平均间隔向量αi,将最近邻样本视为一种潜在变量,采用期望最大化算法来解决近邻信息的不确定性,可以良好地解决无关特征大量存在的问题。
将单相接地故障作为同类样本,三相短路、两相短路、两相短路接地以及未故障作为异类样本,I-Relief算法流程如下:
1)输入的样本集合D和特征集合A
(1)
式中:Xi为样本;N为样本总数;yi为样本类别;C为类别数;a(j)为特征,I表示特征数,j=1,2,3…,I。
2)对特征值进行归一化处理,且将样本根据时间升序分为故障后样本和故障前样本。
3)初始化特征权重ω、样本抽样次数T、核参数ε、容许误差γ。
4)任意选择一个样本Xi,在同类样本集中找到近邻样本Hi,从异类样本集中找到近邻样本Mi,且|Hi|=k,|Mi|=k。
5)计算加权平均间隔向量βi
(2)
(3)
(4)
式中:Xi,NM为样本Xi的同类近邻样本;Xi,NH为样本Xi的异类近邻样本;P(Xt=Xi,NM|ω)和P(Xt=Xi,NH|ω)分别为样本Xt是样本Xi异类最近邻和同类最近邻的概率;ω为特征的权重向量,ωT为向量转置。
6)计算各个特征的权重
ωg=ωg-diff(g,Xi,Hi)/kT+diff(g,Xi,Mi)/kT
(5)
(6)
(7)
式中:Xig,NHn为样本Xi的第n个同类近邻的第g个特征值;Xig,NMn表示样本Xi的第n个异类近邻的第g个特征值。
7)利用线性规划模型不断更新权重,直至权重误差小于核参数,输出结果,作为下一步Elman神经网络的输入项来进行配电网故障区段定位。
3 基于Elman神经网络的配电网短路故障区段定位模糊匹配方法
3.1 Elman神经网络
神经网络是通过对人脑的模拟,通过抽取样本的重要特征,实现从输入数据到输出结果的连接,具有容错性好以及自学习和自动匹配等信息处理能力。因此,神经网络被广泛应用于配电网的故障监测与诊断中。
与传统的二分类器不同的是,Elman神经网络面对非线性曲面仍然具有良好的逼近效果。且不同于一般的神经网络,Elman神经网络在第一层设置有反馈节点,可以记录过往时刻的数据,并运用于下一时段的计算,正因为这个特点,导致了即使两个Elman网络拥有相同阈值和权值,也会因反馈节点的存在导致反馈具有较大差异,相同输入的前提下也会有不同的输出结果。
配电网短路故障区段定位具有动态性时空变化的特点,若使用本质为静态空间建模的BP神经网络必然会出现诸多问题。而Elman神经网络这种反馈型网络的特性在于其拥有一个中间层,它的输出会到达状态层,在这一层里进行信息存储,再将输出连接至中间层的输入形成反馈,使得Elman神经网络对输入层数据的轨迹具有较高的敏感性。且由于网络具有内部反馈特性,Elman神经网络对动态信息的处理能力也变得更强,解决了BP神经网络在反复迭代过程中速度较慢的问题。
图1 Elman神经网络模型
Elman神经网络模型见图1,包括输入层、隐含层、连接层和输出层。隐含层为tansig神经元,输出层为purelin神经元,在这两类神经元的特殊组合下形成的网络传递函数,在隐含层的神经元数目足够多时,可以在连续的有限时段内以足够高的精度逼近复杂性较高的函数,从而满足训练需求。
Elman神经网络的数学模型为
(8)
式中:w1、w2和w3分别为不同层之间的连接权矩阵;y(k)、x(k)和xc(k)为神经网络、隐含层和承接层的输出;u(k-1)为神经网络的输入。
Elman神经网络的目标函数为误差函数,通过反馈不断调整权值参数和阈值参数从而最终输出精度最优的结果。假设该神经网络的输出在第k步为yd(k),计算公式为
(9)
式中,T为转置矩阵或转置向量的表示符号。
3.2 基于Elman神经网络的故障区段定位方法
Elman神经网络在配电网故障区段定位的应用流程如下:首先,基于配电网短路故障的各类样本对Elman神经网络进行训练;然后,确定其具体结构(传递函数和神经元数量)和参数(权值和阈值);最后,根据故障特征来对故障进行分类,完成故障集到特征集的连接映射。
基于Elman神经网络的配电网短路故障区段定位方法如图2所示。
图2 配电网短路故障区段定位方法流程
4 算例分析
为验证所提方法的有效性,采用西南某地区近两年所采集的数据进行10 kV配电网短路故障区段定位的算例分析。该地区电网共有358条10 kV母线和1976条10 kV馈线,其中,网络的拓扑结构、终端数量和位置以及线路区段划分均未发生变化的10 kV母线有304条,10 kV馈线有1542条。采用这些未变化的线路进行算例分析。10 kV 馈线侧的数据来源为调度自动化系统和配电自动化系统;10 kV 变压器侧数据来源为配电变压器负荷监测系统;用户侧数据来源为用户信息采集系统。经过数据筛选与清洗后,将信息不完整和错误的数据剔除,提取出近两年发生的具有完整、准确的特征数据、故障位置和故障类型的1000条配电网短路故障记录,基于此构建挖掘库和测试库。这两个库中分别包括500条数据记录。挖掘库中故障类型包括三相短路、两相短路接地、两相短路和单相接地故障。挖掘库和测试库中具有完全相同的数据样式,唯一的区别是挖掘库含有故障的具体类别和位置信息,用于分析获取规则,而测试库中并未包含任何故障具体信息,用于测试模型的可行性。
4.1 主要特征筛选
首先以前面所建立的断路器跳闸及保护信号和电气量等条件特征作为候选特征量,构建了数据特征库,利用I-Relief算法对特征库中各特征的故障表征能力进行刻画与筛选,得到权重较高即表征能力最强的6个关键特征及其权重如表2所示。其中,配电变压器故障相电流变化率、配电变压器故障相电压、馈线电流、配电变压器非故障相电压、用户非故障相电流变化率和用户故障相电流变化率的候选特征权重都在0.12左右,因此选择这6个候选特征量作为Elman神经网络的输入。
表2 特征权重
4.2 故障区段定位及诊断精度
对比所提基于挖掘库数据的训练分别得到的Elman神经网络模型和BP神经网络模型,利用两者分别进行配电网短路故障区段定位测试,诊断准确率对比如表3所示。
表3 Elman和BP诊断准确率对比
在本算例测试下,基于所提方法的配电网短路故障区段定位的准确率较高,全部达到95%以上,均高于BP神经网络模型。
从时间上来看,由仿真的迭代训练曲线(图3)知,Elman网络训练次数只要130次就到达设置的误差精度,而从输入数据进行训练到输出测试结果,BP神经网络模型花费24 s,而Elman神经网络模型仅花费6.9 s,定位速度大大提升。综上所述,不论是在短路故障区段定位的准确率上,还是收敛速度上,Elman神经网络比BP神经网络所用时间更少,速度更快、更高效。
图3 Elman神经网络训练曲线
为了进一步测试所提方法在出现各类特征数据信息错误、不完整以及故障定位漏报、误报情况下的准确率,从近两年的历史数据中挑选出160条不完备信息,分别添加80条至原来的挖掘库和测试库中,每条不完备信息的不完备率保持在10%到25%。在此情况下再次进行测试分析,准确率对比如表4所示。
表4 不完备信息下Elman和BP诊断准确率对比
在本算例中,由于存在数据错误或缺失的情况,BP神经网络模型准确率下降到了85%以下。同样,Elman神经网络模型准确率也下降至90%左右,虽然两者准确率均有一定幅度的下降,但Elman神经网络模型进行故障研判的准确率仍在可接受范围之内。
而从时间上来看,从输入数据进行训练到输出测试结果,BP神经网络模型花费40 s,而Elman神经网络模型花费10.4 s,都花费了更久的时间。
综上所述,当原始数据信息正确时,用所建模型进行故障诊断不仅准确率高且速度较快;而当原始数据存在不完备的情况时,虽然与数据完备时相比准确率有所下降且速度变低,但依然在可接受范围内,说明所做模型具有良好的容错性和实用性。
5 结 论
快速、精确的配电网短路故障区段定位对提高供电可靠性具有重要意义。上面基于配电网的多类数据,提出了配电网短路故障区段定位方法:
1)以配用电信息系统中的数据为基础,构建了兼具电气量、保护量与开关量特征的10 kV配电网短路故障诊断特征库。
2)所提主法不像传统故障研判方法一样只采用单一指标来进行判断,而是在故障诊断特征库的基础上,采用I-Relief算法从特征库中筛选出6个权重最高的故障诊断关键特征量,作为神经网络的输入项。采用具有模糊匹配特性的Elman神经网络进行模型训练,利用多源数据不断挖掘其内部信息得到配电网短路故障区段定位模型。
最后,以西南某地区电网为例进行数据计算验证,从仿真结果分析可知,所建的模型能高效地对10 kV配电网短路故障进行区段定位,相比于BP神经网络,其具有较高的速率和准确度。在数据不完备的环境下具有良好的容错性,能够为故障的及时发现提供一定的理论依据。