APP下载

数据挖掘技术在电力系统中的应用

2017-03-05李新原李连峰

河南科技 2017年23期
关键词:粗糙集数据挖掘故障诊断

田 拯 李新原 李连峰

(1.河南金荣电子科技有限公司,河南 郑州 450000;2.国网乌鲁木齐市供电公司,新疆 乌鲁木齐 830000)

数据挖掘技术在电力系统中的应用

田 拯1李新原2李连峰2

(1.河南金荣电子科技有限公司,河南 郑州 450000;2.国网乌鲁木齐市供电公司,新疆 乌鲁木齐 830000)

目前,大部分电力管理系统只停留在业务处理层,这一模式不能为电力企业提供更加便利、智能的决策。一直以来,我国电力企业已经在行业信息化建设中积累了大量历史数据,将数据挖掘技术引入到电力行业中来,进行电力分析决策,为电力企业提供更加科学的管理决策,对防范、控制和化解电力企业生产风险具有现实的意义。本文详细介绍了数据挖掘的具体方法及其在电能质量分析、输变电管理、负荷预测以及电网智能调度中的应用。

数据挖掘;负荷预测;输变电;电能质量

数据挖掘(Data Mining,DM)目前已经被应用于各个不同的领域,其中包括电力行业。数据挖掘通过整合历史数据,利用各种分析工具发现模型和数据间关系的过程,其可以帮助决策者寻找数据间潜在的某种关联[1],通过发现被隐藏的、被忽略的因素,就能够在数据存储和管理过程中,挖掘出重要的情报信息,作为决策和行动的依据。

1 国内外对数据挖掘的研究现状

1.1 国外研究现状

1995年,国际知识发现(Knowledge Discovery inDa⁃tabases,KDD)组织委员会在加拿大蒙特利尔市召开了首届KDD国际学术会议。近年来,KDD在数据挖掘的研究和应用上发展很快,尤其是在商业和银行领域。目前,国外数据挖掘的研究方向及趋势主要集中在对数据挖掘方法研究的进一步提高优化上,如Bayes方法和Boosting方法的研究和提高;传统统计学回归法在数据挖掘中的应用;KDD与数据库的紧密结合等。

1.2 国内研究现状

与国外相比,国内在数据挖掘方面的研究起步晚且不成熟。国内的最新发展有:在分类技术研究中建立集合理论体系,对海量数据进行处理;基于粗糙集和模糊集理论,并将二者融合用于KDD,构造模糊系统辨识方法和知识模型,建立智能专家系统;研究中文文本的数据挖掘的理论与实现方法;利用概念格式进行文本挖掘。目前,我国数据挖掘技术主要应用在互联网、金融服务及农业等领域,在电力系统中的应用也逐年增加,尤其在火力发电方面,部分系统已经率先得到应用,而在其他领域的应用亦在逐步进步。可以说,数据挖掘技术在我国还是有相当大的发展潜力。

2 数据挖掘过程

数据挖掘主要包括数据准备、数据挖掘及对挖掘结果的评估与表示3个阶段。

①数据准备阶段。在进行数据分析前,需要从相关数据源中选取所需的数据进行数据预处理,整合成有利于进行数据挖掘的数据集。对此阶段进行详细划分,可分为选择、预处理和转化。

②数据挖掘阶段。将数据准备阶段整合的数据集用某种方法找出其所暗含的规律。此阶段可细化为确定数据挖掘的目标、选择算法、数据挖掘等。

③结果评估与表示。找出数据集暗含的规律后,数据挖掘得到的模式或方法并不是真正的知识,需要尽可能以简单明了、用户可理解的方式将找出的规律表示出来,并对其进行评估后才能形成实际知识。最终形成的结果或者知识才是数据挖掘的目的所在,能被用户理解且能用于实际生产。

3 数据挖掘方法

国内外对数据挖掘技术的研究历经20年,期间提出了不少算法,最主要、应用最广泛的方法主要有以下几个。

3.1 分类分析法

分类分析法常用包括神经网络分类、贝叶斯分类算法及决策树归纳等算法。分类就是找出一个类别的概念描述,其代表了这类数据的整体信息,即该类的内涵描述,并用这种描述来构造模型。

3.2 时序分析法

时序分析法常用包括灰色模型GM(1,N)和Arima模型等算法。按时间序列搜索出重复、高概率发生的模式,用历史数据预测趋势、发现周期或前后数据之间的递进关系。

3.3 聚类分析法

聚类分析法[2]常用的算法包括DBscan密度算法、K-均值算法及EM最大期望算法等。聚类是找出数据的相似性并归纳成若干类别,不同类中的数据相异。聚类分析可以发现数据的分布模式,构建宏观概念,得出数据属性之间可能的相互关系。

3.4 关联分析法

关联分析法常用的算法包括FP-树频集算法、Apriori算法及基于划分的算法等。关联是指两个以上变量的取值之间可能暗含某种规律。关联分析法的最终目标是找出数据间的关联。

3.5 决策树

决策树分析法最大优点是直观,能有效解决高维数据分类问题。国际上最有影响和最早的决策树方法是由J.R.Quinlan提出的ID3方法,后人又延伸至如ID4、ID5和C4.5等算法。但此算法存在随着数据复杂性的提高,分支数将增加,管理的难度越来越大的局限及数据的缺失值处理问题。

除上述几种算法外,粗糙集方法、神经网络法等也是当前数据挖掘的主要方法之一。数据挖掘在近年来越来越受到人们的关注。

4 数据挖掘在电力系统中的应用

近年来,数据挖掘在电力系统应用中取得了一定的发展成果,从电力设施规划、系统安全动态评估、线网负荷预测、故障诊断及电力调度等方面开展数据挖掘和分析,并在发电厂设备、变配电设备及高压输电线路的检修中都得到广泛应用[3-7]。例如,分析汽轮机轴系振动的数据,采用模糊聚类和粗糙集理论,进而辅助机组的故障诊断;高压输电线路的故障诊断采用粗糙集技术;在变电站的电气设备在线监测中可使用决策树算法[8]分析。

在电力系统中,数据挖掘处理及分析要求工作人员具有扎实的电力系统理论指导和知识,这样才能使设备设施状态检修和挖掘算法密切结合,使数据挖掘更加有效[9-12]。

根据研究成果的对比来看,电厂的发电设备具备较完善的检测系统,是数据挖掘应用集中所在。现在主要介绍数据挖掘的具体应用。

4.1 数据挖掘在负荷预测中的应用

为更好地安排电力生产,电力部门日常最关键的工作就是对电力的负荷进行预测,传统的负荷预测方法存在很多局限和不足,一般很难真实地反映系统负荷的变化规律。数据挖掘技术可以从海量的电力系统信息和数据中发现有价值的规律并进行系统实际负荷的特性分析,选用合适的算法,构建准确的模型,以此得出精确的预测结果。

杨静[13]提出了利用数据挖掘技术来实现负荷预测的方法,揭示了在海量相关数据后隐藏的一些规律,并对其建立了相应的模型,进而实现可靠预测。数字化、智能化及现代化是现今电力系统发展的主流趋势,将数据挖掘技术有效应用于电力负荷预测有助于电力部门克服各种困难,更准确、更高效地实现经济和社会价值。

胡士[14]针对数据挖掘技术在神经网络方法的优化及预测电力负荷关键属性的选择等方面做出改进和尝试,并在此基础初步建立了一套行之有效、功能完善的负荷预测系统。

4.2 数据挖掘在输变电管理系统中的应用

电力输变电系统时刻都会产生海量数据,而其中隐藏了很多规律规则,分析这些数据规则,能对电力企业制定生产决策提供诸多助力。在输变电系统管理中应用数据挖掘技术,自动分析、归类系统产生的数据,得出利于生产的信息和规律,可以大大提高电力生产的效率和效益。

张勤[15]主要介绍了数据挖掘技术常用算法的概念和基本原理,包括关联规则分析技术、粗糙集方法及决策树方法等,还着重阐述了数据挖掘技术在输变电管理系统中包括设备故障诊断、缺陷预测等方面的应用。

当前,数据挖掘技术主要应用于发电厂设备检修、变压器检修、高压输电及配电设备等方面。何友全[4]论述了电力变压器油中溶解气体分析通过粗糙集数据挖掘实现的方法,可以有效地对电力变压器进行故障诊断。在电力系统中,多数电力变压器的数据及信息等存在不完备性和复杂性,采用粗糙集理论可以为这种情况建立一种较好的变压器故障诊断模型[16]。

廖志伟和孙雅明[17]主要探究粗糙集和神经网络组合在故障诊断模型方面的容错性能,掌握各种不同组合模型的关联关系、互补性及存在的局限性。同时,对构造出的组合诊断模型进行详细阐述,基于定位诊断配电网故障的研究目标,仿真测试了所构造的5类诊断模型,进行了结果比较和评估。

在输电线系统的故障诊断及实时输入信息的畸变方面,李凡生和陈庆吉[6]提出利用基于粗糙集理论的数据挖掘模型来处理和实现。

4.3 数据挖掘在电能质量分析中的应用

电能质量分析环节一般需要对电能的质量数据进行数据压缩和去噪等预处理,目的是提高质量分析的效率[18]。当前,基于小波信号分析是质量分析的主要方法。随着技术的发展,数据挖掘将被逐渐应用到电能质量数据去噪和分析环节。

在现有的数据挖掘分析技术中,信号相关性处理可以为跨小波尺度空间去噪,交叉验证方法实现质量信号的白噪声抑制[19]。利用电能质量信号的二阶导数的似然比判决准则可以判决突变点[20]。陈红坤和黄娟[21]研究了应用模糊C均值聚类和粗糙集理论中的属性与属性值约简算法,以此获得判断电能质量分类的核心规则知识。

5 结语

数据挖掘是集统计学、数据自动分析处理和数据库技术及人工智能和相关应用领域等各门学科于一体的新兴技术。该技术的发展使大量隐藏在数据背后的知识可以被人们触及,人们还可以利用大量真实数据检验验证相关假设或者是模型。数据挖掘技术在电力系统负荷预测、输变电管理、电能质量分析及电力决策系统中的应用主要是预测和表述这两方面。根据大量历史数据来预测未知信息,着眼于找到一个可被理解的模型来描述数据之间的相互关系。从电力系统丰富的历史数据中,经过预处理挖掘出有用的信息并加以分析,为电力系统管理和决策提供参考,这是我们以后着重研究的方向。

[1]王光宏,蒋平.数据挖掘综述[J].同济大学学报,2004(2):246-252.

[2]顾敏奕,杜海舟.数据挖掘技术在电网企业中的应用需求分析[J].上海电力学院报,2012(5):481-484.

[3]陈超金.基于数据挖掘的电力设备状态检修技术研究综述[J].广东电力,2009(9):21-24.

[4]何友全.数据挖掘方法及其在电力系统故障诊断中的应用研究[D].成都:西南交通大学,2004.

[5]仇晓智,乔宗良,邱凤翔,等.火电厂数据分析系统的开发与应用[J].华东电力,2009(4):669-671.

[6]李凡生,陈庆吉.决策树分类算法在发电设备状态检修中的应用研究[J].电网技术,2003(12):67-70.

[7]陈星莺,张晓花,瞿峰,等.数据挖掘在电力系统中的应用综述[J].电力科学与技术学报,2007(3):51-56.

[8]王晓磊.浅析数据挖掘技术在电力行业中的应用[J].新疆电力技术,2007(4):67-68.

[9]高智,徐政.数据挖掘技术在电力系统中的应用[J].华东电力,2001(12):4-7,73.

[10]纪怀猛.电力系统中的数据挖掘技术[J].长春工业大学学报(自然科学版),2014(2):143-147.

[11]袁哲,王彦文.数据挖掘在电力系统负荷预测中的应用[J].电子制作,2015(11):235-236.

[12]李耀池.数据挖掘技术在电力负荷预测系统中应用的研究[D].阜新:辽宁工程技术大学,2006.

[13]杨静.数据挖掘在输变电管理系统中的应用研究[D].北京:华北电力大学,2005.

[14]胡士.数据挖掘技术在电力设备状态检修中的应用研究[D].北京:华北电力大学,2007.

[15]张勤.基于数据挖掘技术的汽轮机性能分析系统的研究与实现[D].北京:华北电力大学,2007.

[16]孙雅明,廖志伟.基于不同RS与NN组合的数据挖掘配电网故障诊断模型[J].电力系统自动化,2003(6):31-35.

[17]廖志伟,孙雅明.基于数据挖掘模型的高压输电线系统故障诊断[J].电力系统自动化,2001(15):15-19.

[18]杨耿煌,温渤婴.一种新的电能质量扰动信号去噪方法[J].电力系统及其自动化学报,2008(1):89-94.

[19]李天云,陈昌雷,程汪刘.交叉验证方法在电能质量信号白噪声抑制中的应用[J].电力系统自动化,2007(16):75-78.

[20]唐良瑞,尚飞,祁兵.基于似然比判决准则的电能质量去噪算法[J].中国电机工程学报,2006(23):49-54.

[21]陈红坤,黄娟.数据挖掘及其在电能质量分析中的应用[J].电力系统及其自动化学报,2009(5):51-55.

The Application of Data Mining Technologyin Power System

Tian Zheng1Li Xinyuan2Li Lianfeng2
(1.Henan Jinrong Electronic Technology Co.,Ltd.,Zhengzhou Henan 450000;2.State Grid,Xinjiang Electric Power Company,Urumqi Power Supply Company,Urumqi Xinjiang 830000)

At present,most of the power management systems only stay in the business processing layer,which can not provide more convenient or intelligent decision-making for the power companies.All along,the Chinese power company has accumulated a lot of historical data,and introduced data mining technolo⁃gy into the power industry for the power analysis and decision-making.It provides a more scientific man⁃agement decision-making to the enterprises and is of practical significance to prevent,control and settle production risks in power enterprises.This paper introduced in detail the concrete method of data mining and its application in power quality analysis,transmission and distribution management,load forecasting and intelligent dispatching of power network.

data mining;load forecasting;power transmission;power quality

TM76

A

1003-5168(2017)12-0131-03

2017-11-01

田拯(1990-),男,本科,研究方向:电气自动化。

猜你喜欢

粗糙集数据挖掘故障诊断
基于包络解调原理的低转速滚动轴承故障诊断
基于Pawlak粗糙集模型的集合运算关系
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
基于二进制链表的粗糙集属性约简
优势直觉模糊粗糙集决策方法及其应用
数控机床电气系统的故障诊断与维修
多粒化粗糙集性质的几个充分条件
因果图定性分析法及其在故障诊断中的应用
一种基于Hadoop的大数据挖掘云服务及应用