基于数据挖掘的预警技术在一体化输电设备监测中的应用研究
2014-12-20王红斌陈扬高雅耿大庆
王红斌,陈扬,高雅,耿大庆
(1. 广东电网公司 电力科学研究院,广东 广州 510080;2. 快威科技集团有限公司,浙江 杭州 310027)
伴随现代传感及科学技术的发展,数据库的规模不断扩大,产生了大量数据,大量的数据往往使人们无法辨别隐藏在其中的能对决策提供支持的信息,传统的查询报表工具无法满足挖掘这些信息的需求,数据挖掘技术应运而生。数据挖掘技术又称为知识发现,它能自动地分析数据仓库的海量数据,做出归纳性的推理,从中挖掘出隐含的模式,并运用于预测,是目前人工智能和数据库领域研究的热点。一般的流程为通过收集数据把数据放到数据库或数据仓库中,对数据进行清理和转换,清除数据集中的“噪声”,开始构建模型选择不同的算法,最终达到对这些模型预测的目的,满足各种需求。如能将这些知识合理运用于预警系统,将能突破传统的预警系统知识获取困难的瓶颈,具有重要的理论意义和应用价值。
输电线路设备的监测技术,作为一种智能电网安全的重要实现手段,对整个输电线路安全运行起着重要的作用。输电线路在线监测的重点在于线路运行与周边环境的适应性上,主要有雷电定位系统、微气象监测系统、输电线路覆冰在线监测(监测覆冰重量等)、微风振动监测(监测导线与线夹最后接触点外一定距离处导线相对于线夹的弯曲振幅和频率等)、导线舞动监测(监测振动半波数、摆动频率和摆动幅度等)、风偏在线监测(监测绝缘子串导地线出口处或转角塔跳线最低点的风偏角和仰角等)、导线温度监测、绝缘子污秽度监测及杆塔倾斜监测[1]等。如何从在线监测的各类设备产生大量的数据中提取挖掘有用的信息提供预警,避免因故障的发生或进一步扩大而导致严重事故的发生具有重要的经济意义。
目前基于数据挖掘的预警技术已广泛地应用于电力、医学、航空、核工业等领域,同时也取得了较多有意义的成果[2-8]。文献[9]采用信号检测的方法,结合江苏省药物自发报告系统中成药不良反应数据,探讨了数据挖掘的预警方法在双黄连注射剂不良反应监测中的表现特点。黄小红等人根据高速铁路牵引供电SCADA系统的特点,及当前SCADA系统的不足,提出了用数据挖掘技术分析和预测变电所设备故障,改善系统的综合性能[10-15]。胡杰等探讨了数据挖掘在设备状态监测中的应用研究,将数据挖掘技术应用到水蒸汽发电机系统也取得较好的效果。但是目前数据挖掘在输电设备的监测应用还比较少,伴随数字电力的深入,各个监测设备的监测数据呈爆炸性增长,常规方法已经捉襟见肘,将数据挖掘技术引入到电力系统分析中势在必行,所以探讨数据挖掘的预警技术在输电设备的应用具有很大的发展潜力,具有实际意义。
本文旨在讨论数据挖掘的预警技术在输电设备检测中的应用,首先通过改进的层次聚类算法对输电设备监测的历史数据挖掘,获得设备运行状态的运行库,对于实时的在线监测数据利用回归方法得到设备运行状态的实时预测值,然后利用相关的报警规则实现输电设备监测的预警,最后给出了基于输电设备运行状态挖掘的预警系统设计。
1 状态监测的实现途径
实现状态监测通常有3条主要途径,分别为利用冗余信号、参考通道、多种信号实现状态监测[16]。一般输电设备通常有多个监测点,采集到的数据为一个含有多个向量的分量,不同的监测点监测的数据存在很大的差异,因此需要对数据进行归一化处理,通常可采用最大最小值方法、Z-分布方法。
由于输电设备监测的系统类型较多,会产生大量的历史数据,本文采用聚类的方法,聚类结果中每个类代表着不同的设备运行状态历史数据的集合,通过聚类构成设备的总的正常状态集。当实时的数据进来后,首先会定位到相应的类,为下面的预测诊断做准备。图1所示为基本的实现过程。
设备回归预测模块是实现设备状态监测最为关键的一步,直接关系到监测结果的准确性与有效性,为后续的设备故障诊断、预警提供了依据。
图1 状态监测实现过程Fig.1 Implementation process of the condition monitoring
2 算法描述
本文给出的设备状态监测实现算法基于海量历史数据的学习,得到关于设备运行状态的知识,然后结合设备实时监测数据进行状态预测。利用其预测结果和一些根据实际需要设定的预警规则实现状态预警。
算法的实现分为两大步骤,一是利用设备运行的历史数据建立起设备运行状态模型,这一步通过聚类算法实现;二是利用经聚类过程得到的设备运行状态模型,结合设备运行的实时状态数据对当前运行状态进行回归预测。再结合一些预警规则实现设备的在线实时预警。
2.1 聚类算法
传统的树聚类算法效率比较低,需要检查和估算大量的对象或类,并进行反复的迭代,为O(tn2),t是迭代次数,n为数据样本个数,它是一种层次的架构方式,通过对数据的反复聚合或分裂,最终形成了层次序列的聚类问题解[17]。由于在监测的各种输电设备中,通常包括各种类型设备的海量数据样本量,如果采用传统的层次聚类方法将耗费大量的时间无法满足实时性的要求,因此本文采用一种改进的层次聚类算法,它能在短时间内对海量数据实现聚类,为下一步的回归预测做准备。它将历史数据样本作为训练数据集,依次读入训练数据集中的数据向量,根据最大值最小值向量作归一化处理,确定其所在的类(或属于当前类,或自成新类),仅当所有数据向量扫描一遍,聚类过程结束。这样就避免了需要把全部数据一次性全部读入内存后才聚类的弊端,仅遍历一次训练集就生成了聚类模型,降低了时间复杂度,提高了效率。
2.2 回归预测
利用改进的聚类算法,海量的历史数据被聚集成一系列类簇。当实时监测数据经过预处理模块后,根据聚类模型,得到预测的系统状态数据,进而根据预警规则预警。这里采用改进的聚类算法进行回归预测,把每个类的上下线作为相应状态的边界值,判断实时数据是否在边界值内以及差值的大小,从而也避免了对类数据逐个处理耗时的弊端,保证了预警系统的快速响应。
这里假定通过聚类,聚类模型已经覆盖了设备正常运行的全部状态,并且每个类代表了设备运行的一种正常状态。当正常的实时数据输入时,根据改进的聚类模型得到的预测值与自身相差不大,而当实时数据向量异常时,预测值会有较明显的差距,无法把它合并到任何一个正常的类中,及时给出设备运行状态分析,预警模块根据预先设定的预警策略综合匹配生成预警消息。
3 系统设计
预警工作可分为训练阶段和预警阶段。在训练阶段,预警系统接受输电设备监测的历史数据,从中获取系统所需的预警规则。在预警阶段,系统根据实时监测的数据,按照所设计的预警策略发布预警消息,预警消息可以采用一步预警的方法。
图2描述了基于预警知识挖掘的输电线路预警机制。预警系统由输入/输出接口、预处理模块、预警信息输出接口、预警模块。其中监测的历史数据,根据改进的聚类算法生成设备运行状态模型,保存在运行状态库中。通过挖掘系统原始的历史数据和不断更新的实时监测数据可以自动更新运行状态库。对于监测数据,预警模块根据预警知识运行状态库进行回归预测,结果进入预警模块和所设计的预警策略决定是否生成预警消息。该模块和预警信息输出接口一起可以提供实时控制接口,协助进程所需的消息,联动预警功能。
在实际的预警过程中,当系统处理一个监测数据时,总是先通过预处理模块将其转变为系统规定的标准格式,根据本文所设计的预警系统可以实现输电设备的监测预警。
图2 基于预警知识挖掘的输电线路预警机制Fig. 2 Early warning mechanism based on warning knowledge discovery of transmission lines
输电线路在线监测系统一体化是未来线路运行管理的趋势,数据平台采用B/S架构,集成数据库、Web发布和管理系统,在线分析线路运行状态参数,具有多参数的预警等功能。为了实现一体化设计与实现,系统软件方面以独立、标准的方式进行设计、开发。向数据采集单元发送指令的接口,作为总的系统平台的一部分组件,可采用独立的开发与设计,不依赖于硬件设备的设计。对于主站,任何采集单元设备都可以发送到同一主站进行数据的接收解析,接受同一主站指令,不同的采集设备可以通过同一主站控制。综合数据平台与主系统同一风格相互集成交互,作为一个单独的子模块运行,不需要主系统平台支持。在系统设计时采用统一的数据接口实现,可以保证数据库的安全,具有标准性和易扩展性。
4 结论
伴随架空输电线路的迅速发展,输电设备急剧增加,人力资源也凸显不足,因此科学的一体化输电监测方法势在必行,数据挖掘技术能够帮助掌握线路的运行情况,及时发现设备缺陷和隐患。本文是基于数据挖掘技术在输电设备监测的初步探讨。首先通过改进的层次聚类算法对输电设备监测的历史数据挖掘,获得设备运行状态的运行库,对于实时的在线监测数据利用回归方法得到设备运行状态的实时预测值,然后利用相关的报警规则实现输电设备监测的预警,最后给出了基于输电设备运行状态挖掘的预警系统设计。
[1] WANG Shaohua,YE Ziqiang,MEI Bingxiao. Application status of online monitoring and live detection technologies of transmission and distribution equipment in electric network[J].High Voltage Apparatus,2011,47(4):84-90.
[2] 潘洁珠,吴共庆,胡学钢,等.基于领域知识的预警规则发现研究[J]. 计算机技术与发展,2008,18(7): 66-69.PAN Jiezhu,WU Gongqing,HU Xuegang,et al. Research of mining early warning rules based on domain knowledge[J].Computer Technology and Development,2008,18(7):66-69(in Chinese).
[3] GE Xiaoxia,BI Xiaolong,SI Fengqi,et al. Application of data checking method of principal component analysis in power plant[J]. East China Electric Power,2010,38(5):745-749.
[4] HASHEMIAN H M. On-line testing of calibration of process instrumentation channels in nuclear power plants,NUREG/CR-6343,US Nuclear Regulatory Commission,1995.
[5] ZHANG Xiaochun. Application of on-line detection technologies on transmission and distribution equipment in Yunnan electric network[J]. Yunnan Eleceric Power,2009(9):37-38.
[6] LIU Hongbin,LIU Lianrui,LIU Shaoyu,et al. Application of on-line detection on transmission and distribution equipment in north china grid[J]. North China Electric Power,2009(8): 35-37.
[7] CHEN Yuru,HUNG Mingchuan,YANG Donlin. Using data mining to construct an intelligent web search system[J].International Journal of Computer Processing of Oriental Languages,2003,16(2).
[8] RAKESH AGRAWAL,TOMASZ IMIELINSKI,ARRANSWAMI. Mining association rules between sets of items in large dtabases. In Proc. of the ACM SIGMOD Conference on Management of Data,Pages 207-216,May1993. Washington,D. C.
[9] 陈炯华,魏永越,孙骏,等. 基于数据挖掘的预警方法在双黄连注射剂不良反应监测中的应用研究[J]. 中国中药杂志,2010,35(3): 308-312.CHEN Jionghua,WEI Yongyue,SUN Jun,et al. Research on signal detection methods based on data mining in adverse drug reaction of Shuanghuanglian injection[J].China Journal of Chinese Materia Medica,2010,35(3):308-312(in Chinese).
[10] 黄小红,王倩. 数据挖掘技术在高速铁路SCADA中的应用研究[J]. 工业控制计算机,2006,19(1): 6-7.HUANG Xiaohong,WANG Qian. Application of data mining to high speed railway SCADA systems[J]. Industrial Control Computer,2006,19(1): 6-7(in Chinese).
[11] 张东利. 决策树分类方法在水轮机组故障诊断的应用研究[J]. 电网与清洁能源,2013,29(6): 92-94.ZHANG Dongli. Decision tree classification for fault diagnosis of hydro-turbine generating unit[J]. Advances of Power System & Hydroelectric Engineering,2013,29(6):92-94(in Chinese).
[12] 王明疆. 地质结构面分组的聚类方法及EXCEL实现[J].西北水电,2007(4): 83-84,89.WANG Mingjiang. Clustering algorithm of geological structural plane in groups and its realization of EXCEL[J].Northwest Hydropower,2007(4):83-84,89(in Chinese).
[13] 范波. 数据挖掘技术在电力数据集成应用的研究[J]. 陕西电力,2010,38(9): 55-57.FAN Bo. Application of data mining technology in data integration of power system[J]. Shaanxi Electric Power,2010,38(9): 55-57(in Chinese).
[14] 谷鹏,石国萍. 基于遗传算法的电力系统综合负荷模型的建模与仿真[J]. 节能,2010,29(9): 4,11-15.GU Peng,SHI Guoping. Power system load modeling and simulation based on improved genetic algorithm[J]. Energy Conservation,2010,29(9): 4,11-15.
[15] 李智勇,曹静,吴为麟. 决策树算法在某地区电网安全评估中的应用研究[J]. 能源工程,2009(5): 5-9.LI Zhiyong,CAO Jing,WU Weilin. Application of decision tree algorithm in power grid security assessment of a certain area[J]. Energy Engineering,2009(5): 5-9.
[16] ZHOU Ping,SHEN Wei,SHI Hui. Assessment of sustainable development of cogeneration plant based on AHP and fuzzy comprehensive evaluation[J]. East China Electric Power,2010,38(9): 1421-1424.
[17] 孙吉贵,刘杰,赵连宇. 聚类算法研究[J]. 软件学报,2008,19(1): 48-61.SUN Jigui,LIU Jie,ZHAO Lianyu. Clustering algorithms research[J]. Journal of Software,2008,19(1): 48-61.