APP下载

基于MATLAB的东辽县电网累年故障数据处理与分析

2017-11-09杨涛

农业科技与装备 2017年6期
关键词:关联分析聚类分析

杨涛

摘要:整理现有8 a(2009—2016年)电子版数据,对所收集的2 628条有效数据进行必要的预处理,根据工作习惯和故障因素特征具体分成六类。采用现今流行的数据挖掘技术,即数据的聚类分析和关联分析,探索各类故障因素的相关联系,进行排序,寻找工作重点和优先方向,为确保电网坚强进行有益探索,并借助MATLAB平台使数据分析模型得以实现。

关键词:累年故障数据;聚类分析;关联分析;东辽县

中图分类号:TM715 文献标识码:A 文章编号:1674-1161(2017)06-0018-04

东辽县位于长白山余脉与松花江平原结合部,地势以山地为主,多山丘沟壑和草原林地,雷雨、大风等恶劣天气多。国网吉林东辽县供电有限公司配网线路分布其间,设备布点多、线路覆盖面积广,延伸路径复杂,有多处线路位于采煤沉降区,公司电网极易受到自然环境等外界因素的影响。近几年,东辽公司的配网设备经历了严峻考验,除了受到自然灾害的影响外,设备老化严重,结构缺员,致使配网设备故障频发,改造治理和管理提升需求迫切。随着地方经济不断发展,产业结构逐步优化升级,电力需求和供电质量要求同时不断上升。面向农村地区的配网线路不仅结构复杂,而且覆盖地域较广,因此,对配网线路故障进行全面分析和有益探索,采取积极有效的应对措施,对于提高线路供电可靠性意义重大。

1 数据收集整理情况

故障数据分析治理项目小组接到任务后,联系公司调度室,整理现有8 a(2009—2016年)电子版数据,对所收集到2 628条有效数据进行必要的预处理,根据工作习惯和故障因素特征具体分成六类(如表1、图1和图2所示)。采用现今流行的数据挖掘技术,即数据的聚类分析和关联分析,探索各类故障因素的相关联系,进行排序,寻找工作重点和优先方向,为确保电网坚强进行有益探索,并借助MATLAB平台使数据分析模型得以实现。

2 数据处理与分析

2.1 数据审核

从不同渠道获得的原始数据,在审核的内容和方法上是不同的。对原始数据应主要从数据完整性和数据准确性两个方面着手观察。数据完整性审核主要是检查应调查的数据样本个体是否有遗漏,所有的调查数据特征或指标是否填写齐全。数据准确性审核主要包括两个方面:一是检查数据资料是否符合客观实际情况;二是检查数据是否有原发性错误,数值记录等是否正确等。

2.2 数据筛选

原始数据的筛选主要包括两方面:一是将某些不符合特征的数据或有明显错误的数据剔除;二是将符合某种特定条件的数据筛选出来,对不符合特征的数据予以剔除。

2.3 数据排序

原始数据的排序是按照某种要求的顺序将数据排列,便于使用者通过浏览数据排序情况发现一些明显的特征或趋势。除此之外,数据排序还有助于对原始数据检查纠错,为数据的重新归类或排序分组等提供充分的依据。

2.4 处理方法

数据处理方法主要有4种:数据清理、数据集成、数据变换和数据归约。本研究主要采用数据归约。数据挖掘时往往需要操作的数据量非常大,即便是在少量数据上进行挖掘分析,也需要耗时较长。数据归约技术可以用来得到数据集的归约表示,它量级小得多,但却保留了原有的数据特性,并使归约后结果与归约前结果相同或近乎相同。

数据预处理技术是数据挖掘的一个热门的研究方向,也是数据挖掘的必经环节,对所收集到2 628条有效数据进行必要的预处理,将经过处理的数据整理成10 kV配网线路故障分类统计表。

2.5 数据聚类分析

数据聚类分析是将待处理的数据分到不同的类或簇中的过程,所以同一个类或者簇中的数据对象有着极大的相似性(同質性),而不同类或簇间的数据对象又有很大的相斥性(相异性)。

按照数学观点来说,数据聚类分析是通过用数据建模来简化数据计算的一种分析方法。数据聚类分析是在一种无监督规则下的探索性分析,在分类的过程中不必事先给出一个分类的标准,数据聚类分析能够从样本数据实际情况和客观要素出发,自动进行分类。聚类分析因所使用数学模型算法的不同,常常会得到不同的结论;不同使用者对同一组待处理数据进行数据聚类分析,所得到的结论也未必完全一致。

从数据分析实际应用的角度看,数据聚类分析也是数据深度挖掘的主要任务之一。数据聚类分析能够作为一个较为实用的数学工具获得数据的分布状况,观察每一类或簇数据的特征,集中对特定的聚簇集合做进一步分析。聚类分析还可以作为其他算法(如分类和定性归纳算法)的预处理步骤。

利用聚类分析四次划分得到分类顺序,即极端天气、配电设备故障、线路树障、外力破坏、管理不到位和用户设备故障(如图3所示)。

2.6 数据灰色关联分析

灰色关联分析方法是灰色系统理论的一个重要分支,应用灰色关联分析方法对受多种因素影响的事物和现象从事物整体角度出发进行综合评价,是一个被广为接受的方法。

灰色关联分析法是将研究对象及影响因素的因子值视为一条直线上分布的各个点,是假定的理想标准参考值,与待识别对象及影响因素的因子值所绘制的曲线点进行比较,将其之间的拟合程度通过绘图函数分别量化显示,计算出研究对象与待识别对象各影响因素之间的拟合程度的关联度,通过比较各关联度的大小来判断待识别对象对研究对象的影响程度。灰色关联度分析法是一种实用的数学分析技术,能够发现存在于大量数据集中的关联性或相关性,从而发现描述一个事物中某些属性同时出现的规律和模式。

灰色关联分析从大量数据中发现项集之间有趣的相关联系并进行综合评价(注意对表格转置),如图4和图5所示。

由灰色关联度排序可以看出,极端天气>线路树障>配电设备故障>外力破坏>管理不到位>用户设备故障。即极端天气因素与虚拟最具破坏力故障因素的关联度最大,可断定极端天气因素为最具破坏力故障因素;按照排列次序关联度降低,其他故障因素对公司电网的破坏与影响逐渐减小。endprint

2.7 数学模型及不同分析方法的评价

对比两种方法的计算过程可以发现:层次分析法概念直观、计算方便、容易理解,但该方法最大的缺点是主观性强、客观性较差。由于样本的重要性本身就是个模糊的概念,所以对于样本的重要性比较,不同的人可能给出不同的结论,而且根据个人的素质、学识、能力与价值观等,难免会对某些样本产生过于偏爱的倾向。另外,该方法在实际操作中需要请相关方面的专家、有经验的人员等进行判断,同时还要考虑到专家的结构和素质。所以该方法虽然计算方便,但其实际操作过程却比较复杂。而灰色关联分析法的最大优点是客观性强,避免了人的主观判断带来的影响。该方法利用样本数据经过一系列的数学计算,得到权重,实际上结论完全是由数字信息得来的。相对于层次分析法来说,该方法的操作比较简单,应用者一旦掌握,可以自己对数据进行处理,得到结论。但该方法的计算相对较为复杂,如果不熟悉,建议采用层次分析法。综上所述,层次分析法简单直观,计算过程可调用函数,容易理解,但主观性强,客观性较差,且计算结果精确度不高;灰色关联分析法结论客观性较强,计算结果精确度较高,但计算过程比较繁琐,需要编写大量代码。

3 措施及建议

1) 根据以上分析,对6个不同方面的故障因素,采取积极的应对措施,有的放矢,有针对性地解决问题。除极端天气需要做好风险转移报案理赔外,其他因素均需要业务部门进行前瞻性解决。

2) 通过数据分析可知,线路树障和外力破坏是影响配网稳定的不可忽略故障因素,除采取积极的技术措施外,还应寻求地方政府和司法帮助。电力法和电力设备保护条例在现实环境中是保护电力设备权益的重要武器,但常常遭遇挑战,建议公司寻求地方立法和司法帮助是非常必要的。

3) 通过数据审核发现,配电设备故障易发时间多为早晚时段,特别是农村用户负荷集中,此时也是电压低、电压不稳等问题的多发时段。建议各基层供电所提醒农村广大用户“错峰”用电,避免用电拥堵带来的不便。

4) 通过数据分析发现,管理不到位因素虽然排在倒数第二位,但经仔细分析,除极端天气外,其他的故障因素都可以划分在管理范畴,这说明打造坚强电网不仅需要对电力设备进行改造治理,还需要大幅提升管理水平,转变管理方式。

参考文献

[1] 张斌,张薇薇.机械設备故障诊断技术概述[J].建筑机械化,2005,8(15):14-15.

[2] 朱大奇,于盛林.基于知识的故障诊断方法综述[J].安徽工业大学学报,2002,19(3):197-204.

[3] 王海彬.农村配电变压器防雷措施的应用[J].沿海企业与科技,2008(12):149-150,148.

[4] 王益明,王永德,薛庆国,等.大学新生学科选择结果与人格特征关系的研究[J].心理科学,2000,40(5):586-589,639.

[5] 张文颖,施久玉.基于聚类分析的当代大学生学习心理研究[J].黑龙江高教研究,2009(4):113-115.

[6] 徐凤银,朱兴珊,颜其彬,等.储层含油气性定量评价中指标权重的确定方法[J].西南石油学院学报,1994(4):11-17.

[7] 兰海,史家钧.灰色关联分析与变权综合法在桥梁评估中的应用[J].同济大学学报:自然科学版,2001,29(1):50-54.

[8] 穆瑞,张家泰.基于灰色关联分析的层次综合评价[J].系统工程理论与实践,2008,28(10):125-130.

[9] 申卯兴,薛西锋,张小水.灰色关联分析中分辨系数的选取[J].空军工程大学学报:自然科学版,2003,4(1):68-70.endprint

猜你喜欢

关联分析聚类分析
玉米骨干亲本及其衍生系中基因的序列变异及与株高等性状的关联分析
玉米骨干亲本及其衍生系中基因的序列变异及与株高等性状的关联分析
基于随机函数Petri网的系统动力学关联分析模型
关联分析技术在学生成绩分析中的应用
农村居民家庭人均生活消费支出分析
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
基于关联分析的学生活动参与度与高校社团管理实证研究
“县级供电企业生产经营统计一套”表辅助决策模式研究
不同的数据挖掘方法分类对比研究