基于分类模型的配电线路故障研判方法研究

2018-03-17李伟明

浙江电力 2018年2期

袁丹，王谊，李伟明，吴明

（国网浙江宁波市鄞州区供电有限公司，浙江宁波 315100）

0 引言

配电线路故障主动抢修流程的有效实施，是供电企业提高供电服务质量的必由之路，执行速度快是该流程保持“主动性”的基本要求。

故障及时准确的发现是保证抢修速度的第一步。目前，国内外对配电网故障定位方法研究较多，文献[1]对常用的几种故障定位方法进行了对比。“S”信号注入法[2-3]可对单相接地进行检测与定位，文献[4]提出结合FTU（馈线终端设备）和“S”信号注入法相结合的方法来提高配电网单相接地故障定位准确性。文献[5]基于同步相量测量单元采集的数据进行配电网故障位置研判，但仅能判断故障区域，无法精确定位，因此文献[6]提出基于微同步相量的配电网故障定位法，达到精确定位故障点位置。也有学者提出基于矩阵算法[7]，遗传算法[8]，免疫算法[9]进行配电网故障定位。

近年来，大数据及数据挖掘技术在各行业的应用发展迅猛，也在电力行业形成了研究热点。通过大数据技术分析电力通信传输网设备的温度情况[10]，提前发现设备温度异常并及时解决，提高了系统安全性。文献[11]运用数据挖掘技术对多源监测数据进行分析，评估电力设备的运行状态，诊断设备缺陷。文献[12]通过挖掘分析用电信息采集系统、营销业务应用系统的数据，智能甄别采集异常、智能派发异常工单，达到了采集系统高效运维的目的，大数据技术和数据挖掘技术在配电网系统也有应用和研究[13-16]。

目前配电线路上各类监测设备故障率高，实际情况真伪难辨，通过引入大数据分析技术对故障信号进行分析，可以相对准确地研判故障，为主动抢修提供技术支持，提高抢修效率。

1 业务背景

1.1 配电线路主动抢修

配电线路故障主动抢修包括故障的发现、确认、定位、抢修，以及报备和用户通知等环节，执行速度是主动抢修的核心因素，如果没有速度，主动抢修就会退化为被动抢修。主动抢修所需的信息来自智能化监测设备，以往由于配电网分级保护装置的普遍应用，供电企业普遍缺乏对局部配电线路故障的可靠感知能力。当前，随着配电网智能监测设备的大量安装和使用（包括配电线路在线监测、配变终端、智能总保），以及配电网营配贯通工作的深入开展，还有地县两级配电网运营管控体系的逐步建立，主动抢修工作已经基本具备了开展的条件。

1.2 故障研判的信息来源

配电线路故障主动抢修基于配电网智能监测设备的故障信号，包括配电自动化、配电线路在线监测、配电变压器（简称配变）监测、智能总保、智能电表等。配电自动化主要对城市区域的电缆线路进行监测，无法覆盖广大农村区域的架空线路；配电线路在线监测装置仅能对短路和接地故障进行大致的定位，无法显示实际停电设备信息；智能总保只适用于TT接线方式的低压系统，覆盖面及其有限；智能电表数量庞大，受信息系统性能所限无法进行及时高效地处理。目前来说，只有配电变压器的监测信号具有覆盖面广、时效性强的特点，是判别配电线路故障情况的有效信号来源。

1.3 主动抢修存在的困难

作为国网浙江电力主动抢修模块试点单位，国网宁波市鄞州区供电公司在主动抢修过程中遇到的最大难题还是故障“判不准”。因为配电网设备点多面广，运行环境极其复杂，监测设备故障率高，故障信号真实度差，所以实际情况真伪难辨。设备、通信、系统等故障都会引起信号的失真，另外电力用户自行操作甚至其他人为因素也会产生故障信号，使得主动抢修工作无法正常开展。如果对每个故障信号都开展人工研判和现场派工核实，将付出巨大的人力、物力和时间成本，一方面对于误信号的疲于应付会严重挫伤职工的工作积极性，另一方面如果对故障信号的人工研判耗时过长也会使主动抢修退化成被动抢修。

2 基于配电变压器停电信号的故障研判模型

2.1 总体思路

首先，用户停电是配电线路故障的最终表现形式，而配电变压器是直接向终端用户供电的电力设备，因此可以从配变变压器的停电信号着手研究配电线路故障的研判方法。其次，既然目前无法对具体的每一个故障进行精确的因果分析，那么引入大数据分析技术对信号进行总体、关联、高效地分析是非常有必要的。最后，通过对配电变压器停电信号各种属性的分析来预测配电线路故障属于分类预测的范畴，可以使用各种分类模型来实现。

2.2 方法步骤

基于大数据挖掘技术，通过对海量的配变停电信号以及配电线路实际故障的关联分析，建立分类模型，并利用该模型对实时发生的停电信号进行在线研判，以相对可靠地对故障进行识别，为主动抢修提供了技术支持。具体做法是：以配电线路为单位，按照一定的时间间隔统计配变的停电信号，并将停电变压器的属性和停电信号的数量与配电线路的故障进行关联，运用大数据挖掘技术建立起关联算法，并利用该算法自动研判配电线路故障概率，以此作为主动抢修派单的参考。通过该模型对配变停电信号进行实时在线分析，得到故障真实发生的概率，为故障派单提供了技术依据，解决故障判不准的难题。

3 故障研判模型的建立和应用成效

3.1 自变量的获取和处理

利用用电信息采集系统，导出2015年1月—2016年6月的专用和公用配电变压器有效停电数据，所提取的字段信息包括：线路、户号、户名、终端停电时间、终端复电时间等，并人工添加配变专用、公用类型属性，明细清单导出形成专用和公用配变停电信号明细如表1所示。

表1 专用和公用配变停电信号明细

按照1～5 min的时间间隔，整理出10 kV线路停电事件，得到数据如表2所示。

从表2可知，随着时间间隔的增加，停电事件没有明显增加，事件的平均停电信号数也未有明显减少，综合考虑到终端时钟不同步产生的数据稳定性问题，以及抢修工作时效性的需要，选用按5 min时间间隔整理的停电事件数据作为自变量，共得到有效数据48 939条。

利用PMS（设置管理系统）查询并导出2015年1月—2016年6月的配电网检修计划信息，所提取的字段信息包括：工作日期、主线路名称、实际工作开始时间、实际工作结束时间、执行情况描述和电压等级等，明细清单导出形成配电网检修计划停电线路明细如表3所示。

表2 专用和公用配变停电事件整理

表3 配电网检修计划停电线路明细

对检修计划的3 311条记录进行整理，排除非停电和取消的计划，合并重复的计划，共获得2 263条有效数据。

以线路名称和停电时间对专用配变（简称专变）和公用配变（简称公变）停电明细表和配电网检修计划停电线路明细表进行关联，完成计划内停电数据的剔除。

3.2 因变量的获取和处理

登录营销系统，查询并导出2015年1月—2016年6月的95598工单信息，所提取的字段信息包括：工单编号、受理时间、处理结果等，明细清单导出形成95598工单信息明细如表4所示。

人工整理运行单位的故障处理记录，所整理的字段信息包括：工作日期、实际工作开始时间、实际工作结束时间、主线路名称，整理清单导出形成配电线路运行故障明细如表5所示。

通过比对95598工单信息明细表中的“受理时间”、“线路名称”和配电网运行故障细表中的“实际工作时间”、“主线路名称”进行关联，合并得到因变量整理表（95598工单+故障记录），获得2 481条有效数据。

表4 95598工单信息明细

表5 配电线路运行故障明细

3.3 分类模型总体描述

通过对专用和公用配变停电明细表和配电网检修计划停电线路明细表的关联和剔除，以及专用和公用配变停电明细表和因变量整理表的关联。整理实际数据发现，按照日期进行关联和剔除，与按照具体时间进行关联和剔除效果类似。按此方法得到最终的信号、故障对应明细表，共关联成功1 676条数据。该表字段如表6所示。

表6 信号、故障对应明细

以2015年的信号故障记录作为训练数据，从2016年中随机筛选500条故障记录，以及500条非故障记录作为测试数据。分析发现2015年共有26 897条数据，其中关联为故障的为1 155条，而未关联为故障记录为25 742条。

样本分布的不对称会严重影响模型的训练效果，而本次数据挖掘的目标是识别故障并指导主动抢修，因此对故障记录进行加权（惩罚）处理，将故障记录乘以20倍作为训练数据，最终训练数据中共有49 997条记录，其中故障记录为24 255，非故障记录为25 742。

运用WEKA软件进行数据分析，通过量化对比Logistic模型、决策树模型、神经网络模型，从而选择最佳模型。

（1）Logistic 模型。

通过设置不同的临界值P，得到如表7所示。

表7 不同概率P的训练结果明细

其中P为分类的临界值，当Logistic预测概率大于P，则判定为故障，否则判定为非故障，Hit表示命中真实故障的数量，Ni-j表示把i识别成 j的数量（i=0， 1； j=0，1）。经过综合平衡准确率和命中率关系，选用P=0.5作为模型参数，达到即能识别故障，又能尽量减少对非故障的误判的目的。得到模型的函数表达式如下：

式中：自变量X1为10 kV线路下专变停电信号数量，其系数为0.001 9，自变量X2为10 kV线路下公变停电信号数量，其系数为0.179 8。

其中X1，X2的系数均大于0，说明随着专变和公变停电信号数量的增加，故障概率也相应的增加，而公变停电信号数量的变化对故障概率影响更大。利用该模型就能根据10 kV线路下专变和公变的信号数量预测线路故障发生的概率，若预测概率大于0.5则视为故障，否则视为非故障。

从2016年中随机筛选500条故障记录及500条非故障记录对模型进行测试，该模型的故障的命中率达到了89.519 7%，识别准确率为68%。

（2）决策树模型。

对模型进行剪枝，剪掉小于170的节点，最后得到模型含有11个节点，21个枝。该模型的训练命中率为74%，测试命中率为79%，识别准确率为69%。

（3）神经网络模型。

设置最多训练500次，选用三层网络进行建模,该模型的训练命中率为71%，测试命中率为70%，识别准确率为69%。

经过比较，选用在训练和测试结果中表现更加优异的Logistic模型作为故障研判模型。

3.4 应用成效

国网宁波市鄞州区供电公司通过故障研判模型的实时在线数据挖掘，大大提升了对局部配电线路的有效感知能力，同时还结合移动互联网技术实现对疑似故障设备的路径规划和位置导航，加快到达现场的速度。在主动抢修流程得到了有效加速后，国网宁波市鄞州区供电公司故障发现时间平均从30 min减少到了5 min，故障查勘确认时间平均从45 min减少到了15 min，故障报备和通知到户时间平均从30 min减少到了10 min，效果明显。

4 结语

通过大数据挖掘技术自动研判配电线路故障发生概率并指导实际主动抢修，可以大大减少人力物力的投入，提高职工的工作积极性，将有限的资源投入到真正需要抢修的地方，从而进一步提高供电可靠性和用户满意度，可为企业带来实际的经济和社会效益。在此选择Logistic模型用于建立故障研判模型，针对现有采集的数据，模型的验证与选择相对不够全面。因此从数据维度、数量等多方面补全数据，全面的对比各模型的优劣，选择出一个或多个研判模型，能够更准确地研判故障，是今后的研究方向。

另外，建议在浙江省电力有限公司配电网智能运维管控平台中建立配电线路故障主动抢修全过程管理流程，实现包括故障信号的接入、过滤、研判，故障设备的定位，故障范围的自动分析，用户的通知服务等功能，并制定相应的标准和制度，使主动抢修能够全面加速，真正落到实处。

[1]芦兴，王瑞闯．配电网故障定位方法研究[J]．电网与清洁能源，2013，29（7）∶26-30．

[2]王昭杨.配电网单相接地故障定位S信号法的研究[J].电力科学与工程，2010，26（3）∶14-17.

[3]齐郑，郑朝，刘占波，等.“S”信号定位方法的有效性分析及改进研究[J].电力系统保护与控制，2012，40（8）∶101-104.

[4]杜刚，刘迅，苏高峰.基于FTU和“S”信号注入法的配电网接地故障定位技术的研究[J].电力系统保护与控制，2010，38（12）∶73-76.

[5]戴志辉，崇志强，李川，等．基于电压偏差向量2-范数的主动配电网故障定位新方法[J]．电力系统自动化，2015，39（15）∶96-102．

[6]周治国，高文焘，刘文亮.基于μPMU的主动配电网故障定位方法研究[J].电网与清洁能源，2016，32（3）∶72-77.

[7]刘健，倪建立，杜宇.配电网故障区段判断和隔离的统一矩阵算法[J].电力系统自动化，1999，23（1）∶31-33.

[8]郭壮志，陈波，刘灿萍，等.基于遗传算法的配电网故障定位[J].电网技术，2007，31（11）∶88-92.

[9]郑涛，潘玉美，郭昆亚，等.基于免疫算法的配电网故障定位方法研究[J].电力系统保护与控制，2014，42（1）∶77-83.

[10]贺琛，王彦波，王云烨.基于电力通信传输网大数据的温度监测系统研究[J].浙江电力，2016，35（7）∶65-68.

[11]郑一鸣，孙翔.基于多源监测数据挖掘的电力设备状态诊断[J].浙江电力，2016，35（5）∶1-6.