基于支持向量机算法的输电线路故障诊断研究
2019-09-10齐金定孙涛单岩郑少华于振洪孙静
齐金定 孙涛 单岩 郑少华 于振洪 孙静
摘要:输电线路具有距离长、覆盖区域广等特点,容易受天然环境及人为成分的影响较多,致使线路的运作维护工作存在较大困难,如何从海量数据中挖掘出有效信息,实现对输电线路的故障诊断,是急需要解决的问题。提出一种基于支持向量机(Support Vector Machine,SVM)算法的数据挖掘方法,将其应用于输电线路故障诊断方面,可以从输电线路海量信息中找出潜藏的模式和其中的规则,成为调度人员处理事件的协助工具,起到降低事故处理耗时、防止事故扩大的作用,提高输电线路运行和维护的质量。
关键词:大数据;数据挖掘;SVM算法;故障分析
中图分类号:TP393文献标志码:A文章编号:1008-1739(2019)23-68-4
0引言
输电线路是电力系统的重要组成部分,将发电、变电、供配电的厂站设备和用户有机地联接成一个整体,具有线长、点多和面广的特点。它的运行状态直接关系到电力系统的可靠运行,影响着电力用户的用电安全和良好的用电体验。并且,随着现代电网的规模、容量和覆盖范围越来越大,输电线路在国民经济和人民生活中占有重要地位,电网故障停电将会给社会生产和人民生活造成重大的经济损失。输电线路因为具有运送距离长、覆盖区域广等特点,容易受自然环境及人为因素的影响较多,致使线路的运维工作存在较大困难[1],同时随着信息化的建设,输电线路每年都会产生大量数据,因此,如何从海量数据中挖掘出所需要的知识,使现代电力系统在完成日常生产管理工作的基础上,实现对电力系统的实时监测、故障诊断以及故障预测等功能,是现代智能电网需要解决的问题。数据挖掘技术是大数据分析中的关键技术,其实质是从海量数据中挖掘出隐含的知识,并将发现的数据转化为信息,信息转化为知识,知识转化为行动,行动转化为价值。
1数据挖掘技术
数据挖掘(Data Mining,DM)的概念由美国计算机学会在1995年提出,是指从海量的、随机的、不完整的、模糊的数据中,提取出人们所需信息的过程。与这一术语相近的有许多,例如从数据库中发现知识、数据分析、知识抽取、模式分析、数据采集和信息收割等[2]。总的来说,DM可以被认为是机器学习和数据库衍生的产物,主要作用就是利用这二者对海量数据进行分析和管理。本文选取SVM算法进行研究。
1.1 SVM算法
SVM算法由Vapnik等学者提出,是近些年来机器学习、模式识别以及神经网络等学术界公认的最有影响力的成就之一。SVM是统计学习理论中较新的理论,采用结构风险最小化原理,兼顾训练误差和泛化能力,在解决小样本、非线性和高维数局部极小值等问题中表现出特有优势[3]。
SVM自提出以來,经过近二十年的发展,已经在许多领域取得了丰硕成果。现有SVM发展方向主要分为4个方面:
①改进SVM的运算速度,使其适应大规模数据集的研究,例如序列最小化算法等;
②对原有的SVM的形式优化,简化其中的计算过程;
③根据结构风险最小化原则以及SVM的一些原理而提出的新算法,例如广义SVM等;
④根据结构风险最小原则以及核函数思想,在传统的线性算法上构造出相应的核形式,例如核主成分分析。
1.2 SVM基本原理
SVM的核心内容就是升维、线性化和核函数,最终目的是寻找一个定义最优线性超平面,使得训练样本集中类型不同的点处于超平面的两侧,与此同时,超平面两侧的空白区域必须达到最大。SVM理论能完美地支持二维2类线性可分数据。
1.3 SVM算法求解过程
SVM优化的实质是对其参数进行优化。SVM分类器的好坏判别标准,主要取决于其泛化能力和机器学习的复杂程度,简而言之就是所构建模型对未知数据测试的精准程度,SVM模型的确定主要在于惩罚系数与核函数参数的选择。
传统SVM参数分类问题寻优需要对,(分别表示惩罚系数、核函数参数)组合在给定范围(2个参数范围)一般为lb =-1:1:14,lb =-8:-1:-23内进行穷尽搜索,搜索次数等于2个参数向量长度的乘积,搜索总耗时等于搜索次数与训练样本个数的乘积。
SVM算法求解过程如图2所示。
2输变电系统大数据分析概述
电力系统的整个运行过程中会产生海量多源异构数据,也就是大数据,保证现代电网安全运行的前提是能够及时处理这些海量数据。其中,输变电设备状态监测数据占绝大部分,既包含设备的基本信息,也包含设备运行中的在线状况监测信息,数据量十分巨大,这对数据处理能力的可靠性和实时性要求很高[5]。
2.1输变电系统大数据特点
输变电系统中的数据具备大数据标志性的“4V”特征,即规模大、类型多、价值密度低和变化快[6],具体特点如下。
①规模大
输变电设备状态数据规模很大,量级一般都是以TB,PB为单位。例如,数据采集与监视控制SCADA系统,按10 000个遥测点,采样间隔为3~4 s计算,每年将会产生1.03 TB数据(1.03 TB=12字节/帧* 0.3帧/s*10 000遥测点*86 400 s/d*365天)。
②类型多
输变电设备状态数据类型呈现多样化的特点,包括各种历史数据、实时数据、文本数据、多媒体数据等结构化、半结构化以及非结构化数据。对于不同类型的数据处理方式以及处理要求也都是不一样的。例如,输电线路系统中线路的台账信息通常是以文本数据的形式被记录,而线路的运行状况则往往是以图片或者视频的方式被记录。
③价值密度低
输变电设备状态数据存在价值密度低的特点。输变电设备运行过程中记录了海量数据,而其中绝大多数都属于正常数据,仅有非常稀少的故障数据,然而这些极少量的故障数据比正常数据更具有价值,它能够有助于操作者了解设备的真实状况。例如,输变电设备状态监测连续24 h的监测数据中真正有价值的可能仅仅只有1~2 s。
④数据处理速度要求快
由于电力系统的特殊性,操作者往往需要在极短暂的时间内做出正确的操作,这就需要系统能在数以ms的时间内对海量数据进行有效分析,以辅助操作者做出决策[7]。
3基于SVM算法的故障诊断分析
选取某地一条输电线路的连续4个月的运行数据作为训练样本,以第5个月的运行数据作为基础测试样本,由于输电线路实际运行中出现的故障极少,而故障样本数量较少将会使实验结果展现不够直观,因此在训练样本以及测试样本中添加了该等级线路历史数据中的故障数据,扩充了故障数据量,使实验展示的结果更加直观,增强了实验的说服力。
实验选取输电线路的有功功率、无功功率、电流和电压4个指标作为故障判断依据。运用SVM模型进行实验。此外,实验过程中针对不同的故障类型,分别建立了训练模型,并利用测试样本数据进行了实验。将SVM模型的参数设定为lb =-1:1:14,lb =4:-1:-11能搜尋到最优参数组合,以得到最优的时间效率和精确度。
通过算法验证表明,训练样本数据在经过训练之后,使该模型实现智能故障诊断功能,用测试样本数据进行故障诊断时,测试样本中的输电线路故障类型已被检测,基本实现了输电线路智能化诊断功能,达到了实验预期效果,达到了将大数据技术运用到输电线路故障诊断的目的。
4结束语
通过介绍大数据分析中的DM、SVM算法等技术,输变电系统大数据的特点和关键问题,提出的SVM算法在处理回归和模式识别等问题上具有独到的优势,使其非常适应于输电线路故障诊断研究,可以从输电线路海量的信息中,找出潜藏的模式和其中的规则,成为调度人员处理事件的协助工具,能够起到降低事故处理耗时、防止事故扩大的作用,提高输电线路运行和维护的质量,提高电力系统的运行稳定性,保障大电网稳定安全运行。
参考文献
[1]张东霞,苗新,刘丽平,等.智能电网大数据技术发展研究[J].中国电机工程学报,2015,35(1):2-12.
[2]邵峰晶,于忠清.数据挖掘原理与算法[M].北京:中国水利水电出版社,2003.
[3]芮璋现,肖海波.支持向量机(SVM)及其应用[J].福建电脑, 2007(4):110.
[4] Vapnik V N, Golowich S E, Smola A. Support Vector Method for Function Approximation, Regression Estimation, and Signal Processing [J]. Advances in Neural Information Processing Systems, 1997: 281-287.
[5]周志华.机器学习与数据挖掘[J].中国计算机学会通讯, 2007,3(12):27-37.
[6]夏火松.数据仓库与数据挖掘技术[M].北京:科学出版社, 2004.
[7]宋亚奇,周国亮,朱永利.智能电网大数据处理技术现状与挑战[J].电网技术,2013,37(4):927-935.
[8]金澈清,钱卫宁,周傲英.流数据分析与管理综述[J].软件学报,2004,5(8):1172-1181.