基于机器学习算法的电力系统故障诊断
2023-12-06姜泽苗
姜泽苗 袁 喆
(国网山东省电力公司超高压公司)
0 引言
在任何一个国家的发展中,能源都扮演着重要的角色。电能是最精炼的能源形式,被认为比其他所有形式的能源都优越,它清洁、无污染,并且易于从一个地方运输到另一个地方。能源部门扮演着重要的角色,因为对电力的需求呈指数级增长,这需要在电力部门进行巨额投资,以满足这一需求。这种由于电力需求的增加而增加的发电量,使我们的电力电路变得更加复杂。为了提供持续可靠的电能,系统中的故障应在最短时间内被切除。
不同类型不良条件的存在会导致各种类型的故障,从而导致电力系统故障。因此,当系统的任何部分发生故障时,都会降低用户端对电力系统的信任,为了提供可靠和不受干扰的潮流,电力部门必须熟练地对不同类型的故障进行分类和检测。准确识别和确定系统中故障的发生将有助于快速恢复因故障引起的干扰[1-3]。计算方法具有快速响应能力,随着计算技术的发展,机器学习技术中的故障分类和分析开辟了更广泛的应用和评估解决方案,近年来,人们对电力系统中不同路段即输配电系统的故障分类进行了大量的研究工作。其中一种方法是阻抗测量技术,使用单侧阻抗测量方法来查找和检测故障的位置。机器学习技术使用不同的算法从给定的输入数据中进行训练和理解,而不需要针对不同的故障进行编程,能对所提供的大量数据进行提取并将其用于训练。
1 技术性分析
电力系统是一个复杂的系统,由于受到多种因素的影响,如天气、负荷、设备状况等,可能会出现各种故障,如短路、设备失效等。这些故障不仅会对电力系统造成损失,还会对市民的生活生产带来影响。因此,对电力系统故障的诊断分析非常重要。
传统的电力系统故障诊断方法主要依靠专家经验和模型模拟,但这种方法存在缺陷,即对专家经验依赖度高,不能发现复杂的故障类型。另外,由于电力系统的复杂性,使用传统方法进行分析和处理需要耗费大量的时间和经费。机器学习技术的出现,为电力系统故障诊断分析提供了一种新的思路。目前,用于电力系统故障诊断分析的常见机器学习算法包括:支持向量机、神经网络、朴素贝叶斯、决策树和随机森林等。
支持向量机(SVM)是一种用于分类和回归分析的算法。当电力系统出现故障时,SVM可以对系统中的各类变量进行分类预测,从而发现故障的产生原因。此外,SVM还可以处理大量的数据,同时避免过拟合问题。神经网络是一种常见的机器学习算法,它是一种由多个神经单元组成的计算模型,类似于人脑的神经网络。通过训练神经网络,可以让其自主学习并识别电力系统中的不同类型故障。此外,神经网络可以处理非线性数据,对于电力系统中复杂的故障类型有很好的处理效果。朴素贝叶斯是一种基于贝叶斯定理的分类器,该算法在电力系统故障诊断分析中,可以利用历史数据的统计信息来估计故障发生的概率。与其他机器学习算法相比,朴素贝叶斯具有模型简单、计算速度快的优点。决策树是一种基于树形结构的分类器。在电力系统故障诊断分析中,决策树可以根据电力系统中各类变量的关系,构建出一个树形模型来预测故障类型。决策树可以处理数据缺失和噪声干扰的情况,对于电力系统中噪声较多或者数据不完整的情况具有很好的处理效果。随机森林是一种集成学习算法,它通过随机选取一定数量的特征和样本来构建多个决策树,然后将多个决策树集成为一个强分类器。在电力系统故障诊断分析中,随机森林可以通过多个决策树的集成,提高模型的准确性和稳定性。
机器学习算法的出现为电力系统故障诊断分析带来了新的机遇和挑战。通过使用机器学习算法,我们可以更准确、快速地发现电力系统中存在的各种故障,并及时采取有效措施予以解决。
2 系统及理论分析
2.1 系统分析
为了分析不同类型的故障,考虑了IEEE-14总线系统,该系统有14条总线、2个发电机、3个同步补偿器和不同的负载[4-5]。借助14总线数据,根据给定的每单位值计算出每条总线之间的实际长度,然后在Matlab仿真中对14总线系统进行建模。将系统电源连接到每个母线示波器上,得到不同类型故障的电压和电流波形。
根据计算出的两母线之间的线路长度,将线路分为三部分。短传输线:如果两母线之间的线路长度小于80km,则称该线路为短传输线,在这种情况下,我们忽略该线路的电容效应。中等传输线:如果线路长度在80~200km之间,则称为中等传输线,在这种情况下,考虑线路的容性效应,忽略导电效应。长传输线:如果线路长度超过200km,则称为长传输线。
经计算后,母线1和母线2之间的长度为120km,表示该线路为中等传输线。对于母线之间产生的不同类型故障(对称和不对称),使用三相故障。14母线系统的单线框图如图1所示。
图1 IEEE-14母线单线框图
(1)对称故障
众所周知,电力系统在正常运行时是平衡的。在这种类型的故障中,系统在故障发生后仍然保持平衡状态。三相接地故障属于对称故障类型,系统中有许多不同的因素导致故障,例如环境因素,如雨、闪电、雪、地震等。故障的计算和类型研究对于获得电力系统中保护设备的额定值(如继电器和断路器的额定值)是非常重要的。对称故障虽然发生的比较少,但却是各类故障中最为严重的。
(2)不对称故障
在对称故障情况下,系统在故障发生后仍处于平衡状态,而在非对称故障情况下,系统在故障发生后处于不平衡状态。由于系统在故障发生后变得不平衡,因此对不对称故障的研究是借助森林定理进行的,该定理认为任何N相量不平衡系统都可以分为N-1相量平衡系统和1相量共相量系统。利用森林定理,将3相不平衡相量分为2相平衡相量和1相共相量。将不平衡电压和电流分为3个序分量,称为正、负和零序分量,系统中存在不同类型的不对称故障,主要有以下几种:
①单线接地故障:这是其中一相与地发生短路的故障,这种故障可能是由其中一相与地之间的绝缘断开而引起的,也可能是由其中一相导体断开并落在地上而引起的。在线对地(LG)故障的情况下,所有电流序列分量(正极、负极和零极)都相等,因此等效电路串联。
②双线接地故障:这种故障是指任意两个相量与地之间发生短路。在双线接地故障时,所有顺序电压相等,因此在制作等效图时,所有序列分量并联连接。
③线对线故障(LL):在这种故障中,任何两相导体都会短路,电流的零序分量始终为零。
2.2 理论分析
数据来自IEEE-14总线系统,通过对不同类型的故障进行仿真,获得该数据用于生成两组数据集。该数据集分为两部分,一个数据集包含75%的数据,另一个数据集包含25%的数据。第一组数据(75%)在机器学习算法SVM的帮助下进行训练,第二组数据(25%)用于测试通过训练75%的数据获得的算法是否能够精确地对不同类型的故障进行分类。
主要使用监督学习算法,它是一种分类器,用于分离数据,以便可以轻松地将新的传入数据放入其所属的类别中。SVM在不同类别的数据之间建立边界或直线,称为超平面。该算法分为不同的部分,其中首先提取数据,然后制作数据集,在训练部分数据(这里是75%)之后,测试剩余的数据 (这里是25%),以检查该系统是否可以对数据进行分类并将其精确地放入所需的类别中。
3 实验分析
对IEEE-14总线的Matlab仿真模型和不同类型故障的数据提取进行适当标注,结果见表。
表故障案例仿真参数
不同类型故障的电压波形如图2~5所示。其中,图2为单线对地故障波形,从图中可以看出,故障后电压值几乎为零,电流几乎不变。同样地,图3为双线对地故障波形,图4为线对地故障波形,图5为对称故障波形。
图2 单线对地故障波形
图3 双线对地故障波形
图4 线对地故障波形
图5 对称故障波形
另外,在机器学习算法的帮助下,得到了SVM分类器的混淆矩阵,它基本代表了真实值和预测值之间的偏差,系统对故障的分类准确率达到99.40%。如图6所示,其中,AUC为曲线下面积,ROC为接受机工作特性曲线。
图6 接受工作机特性曲线
接受机工作特性曲线基本上代表了SVM分类器在所有分类阈值处的性能。图7为借助机器学习算法得到的散点图,它代表了不同变量之间的关系。
图7 SVM 分类器散点图
4 结束语
本文利用机器学习算法对电力系统故障进行分类,提出了基于支持向量机的故障类型和距离估计技术。该方法产生了10种不同类型的短路故障事件,需要快速、正确、彻底地进行故障分类和定位评估。该技术的独特之处在于利用暂态数据分析故障,利用小波包变换收集大量特征,采用前向特征选择方法去除冗余特征,从而提高预测精度,利用支持向量机的优化值,并考虑多种仿真条件来建立测试数据矩阵。利用IEEE-14总线测试系统对两种场景进行了测试,提取了不同场景下的电流和电压波形。从得到的结果中扣除混淆矩阵、散点图和ROC曲线,找出系统的精度和准确度,得到的准确率为99.40%,因此发现SVM分类器是性能、评估和故障分类的最佳分类器。