APP下载

基于数据挖掘的电厂优化运行

2017-04-03刘宗歧王玉华郑文卓

电气自动化 2017年6期
关键词:数据挖掘电厂关联

刘宗歧, 王玉华, 郑文卓

(1.华北电力大学 电气与电子工程学院,北京 102206;2.山东交通学院,山东 济南 250023; 3. 国网浙江杭州市萧山区供电公司,浙江 杭州 311200)

0 引 言

随着我国国民经济的飞速发展,能源需求也日益增长。电力工业作为一个耗能大户,其运行的经济性及安全性成为我国节能减排工作的一项重要内容。电厂的优化运行[1]是在电厂各性能指标监测的基础上提出并发展起来的。基于数据挖掘的电厂优化过程如图1所示,通过电厂分布式控制系统(DCS)、厂级监控信息系统(SIS)以及厂级管理信息系统(MIS)等数据库对机组特征参数进行提取,经过预处理、检验后利用数据挖掘算法模型进行综合研究,并依据离线学习得到的知识积累对在线数据进行分析,实时提出安全经济运行决策,指导机组调整方向。

图1 基于数据挖掘的电厂优化

数据挖掘[2-3]是伴随着信息技术的迅猛发展而广泛深入的一个研究领域,美国麻省理工学院将其列入未来可能对人类产生革命性影响十大新兴技术的第三位,现已广泛的应用于金融风险分析、气象预报、生物工程等各个领域。数据挖掘汇集了统计学、模式识别、建模技术、面向对象方法、人工智能、机器学习、搜索算法等多学科最新技术的研究成果,其在整个电站优化运行过程中核心作用是分析庞大的历史数据以建立相应关联规则,基于关联规则来确定相应的机组过程参数优化的目标值。

1 现阶段电厂运行优化方法和存在的问题

电厂运行经济性的好坏,不仅在于电厂主辅机设备的性能优劣,更多的在于运行水平高低。因此电厂运行的优化是一个亟待解决的问题。现阶段通常的运行优化方案为:(1)通过重要过程参数的设计基准值或者维修可达基准值指导运行优化;(2)建立针对机组煤耗等反映机组经济性的函数,通过机组变工况的理论计算来得到相应的目标设计值,进而指导机组运行优化;(3)通过机组优化试验的方式,得到各负荷工况下的相应目标设计值,来指导运行优化。

但是上述优化方法都存在一定问题,方案一中,每个设备的设计基准值或者维修可达基准值都是针对单一设备的,未能考虑实际运行时各设备间的影响配合,而且实际电厂运行条件工况和设计计算的存在一定的差别,包括煤种、循环水入口温度等等都是变化的,这些都导致了方案一的不合理。方案二中,由于电厂中制粉系统、燃烧系统、风烟系统等涉及的系统参数和设备参数间联系紧密复杂,所处理的数据量极大,很多影响都是高维的,这就导致了计算的复杂以及模型的准确程度较差,想要得到合理的优化目标值非常困难。方案三中,首先实验工况和实际工况之间是有差距的,而且由于电力生产要求,不可能允许大量的机组优化试验,这就使得方案三的实施具有很大的局限性。

为了较好的解决上述问题,基于数据挖掘的电厂优化运行成为近几年的研究热点,运用关联挖掘算法建立电厂运行参数间的关联,来进行优化目标值的确定,并依据此,进行相应的设备运行值调整,优化运行。

2 基于数据挖掘的电厂优化

2.1 电厂运行参数的相关性

火电厂在实际的生产过程中可以描述为能量和物质传递的过程。煤的燃烧将工质水加热成蒸汽,蒸汽驱动汽轮机转动,带动发电机发电完成了热能向电能的传递,涉及的燃烧系统、汽水系统以及相应的辅助系统环环相扣,燃料被磨制成粉与空气混合燃烧,蒸汽凝结成为凝结水经过各加热器成为给水等物质流动过程涉及的制粉系统、风烟系统也互相影响。这种电厂设备、系统间直接和间接的联系,使得电厂成为一个有效的整体。而描述这一联系的电厂各运行参数之间也随之具有极强的相关性,而使用数据挖掘就能够建立起电厂各参数的关联规则。

2.2 关联规则

关联规则的挖掘是数据挖掘近几年来最热门的研究方向之一,关联规则的概念和经典算法最早由Agrawal等人在1993年提出[4]。

2.2.1关联规则定义

关联规则的数学基本描述可以简单概括如下:

设I={i1,i2,…,im}是一个包含n个子项目的全局项目集合,事务数据库D={t1,t2,…,tn}是由一系列事务构成,其中每个事务ti是I的一个子集。这时我们设定I的两个子集X、Y满足X⊂I,Y⊂I,X∩Y=φ,则一条在全局项目集I和数据库D上建立的一个关联规则可以表示为:

X⟹Y;S=s%,C=c%

(1)

式中:C表示该规则的置信度,即在D中包含X的事务至少有C的同时也包含Y,S表示该规则的支持度,即D中至少有S的事务隶属于X∪Y。

和支持度相关的一个重要概念为频繁项目集,它的定义是在给定的全局项目集I和数据库D中指定一个最小支持度,而大于或等于最小支持度的非空子集称为频繁项目集。与此类似,定义一个最小置信度,同时满足最小支持度和最小置信度的关联规则,称为强关联规则。

2.2.2关联规则挖掘算法

关联规则挖掘算法包括经典关联挖掘算法、大规模数据集关联规则算法。

经典关联规则挖掘算法包括Apriori算法、Close算法、Fpgrowth算法、神经网络关联算法。特别对于神经网络关联算法,由于理论上神经网络算法能够用作对任意函数的逼近,故其在处理电厂中高维、复杂的参数关联有越来越广泛的应用。

与此同时,针对当前大数据时代,提出了相应的大规模数据集关联规则挖掘算法,例如基于采样的方法、基于数据分解的方法、基于约束信息的方法等。

2.3 电厂运行参数关联规则的量化

2.3.1电厂数据挖掘目标确定

电厂供电煤耗受很多因素的影响,这其中有可控因素和不可控因素。可控因素还分为运行可控因素和运行不可控因素。根据挖掘对象也就是电厂运行优化来说,一般选用运行可控因素作为数据挖掘的目标,从而确定不同负荷下使机组供电煤耗率最低或者相应优化设备的过程参数的可控参数调节值,指导运行优化。

2.3.2电厂运行参数数据准备

为了建立相应电厂运行参数关联规则,必须首先对电厂运行参数进行相应的处理。根据相应的数据变换进行坏点、冗余等不良数据的查询和剔除。将得到的预处理数据,进行相应的模糊处理,将不同的数据类型统一到0、1之间的数。设置一定的条件,进行数据的采样,分析采样数据,通过分布情况和质量进行数据筛选并进行相应的变换处理。

2.3.3电厂运行参数的关联规则建立

电厂关联规则的建立一般思路如下:首先输入上述已经处理好的数据样本,设置事务项集,利用给定的隶属度(模糊关联)或者其他函数(其他改进算法)将事务项集转化为所选用挖掘算法要求的集合形式。对转化的事务项集进行扫描,对每个属性分区的支持度进行计算并存储,增大频繁集的包含的元素,进一步计算,不断的迭代找出满足设定支持度的最大频繁集,计算置信度并产生规则。电厂常用的关联规则挖掘算法包括:改进的Apriori算法、模糊关联算法、神经网络关联算法等。

2.4 确定电厂相应的优化目标值及优化运行

由于优化目标值影响因素很多,关联规则知识总结的数据量很大,单纯的根据数据挖掘关联规则得到的优化目标值不一定完全合理准确,故一般将其归属为一个半结构化的问题。根据2.3建立起的规则,取不同的负荷,得到对应负荷下的运行可控参数的目标优化值,综合有经验的运行人员提供的实际调节数据,设定一定的权重综合得到相应参数优化目标值。通过得到的一系列值,利用回归分析,从而得到优化目标值曲线。

通过以上数据挖掘形成的知识库,对运行的机组在线数据进行提取、预处理、采样,输入到知识库,通过关联规则计算,并依据目标值曲线,得到各参数实时的最优值,从而完成了电厂的优化运行。

3 实际应用举例

下面将数据挖掘技术应用到保障过热器减温水量调节最优。一般认为,和过热器减温水量调节有关的参数是负荷、主汽压、主汽温、除氧器氧含量、主燃料流量、排烟温度。

提取4 380组该电厂机组负荷、主汽压、主汽温、除氧器氧含量、过热减温水流量、主燃料流量、排烟温度数据。按上述顺序做出7个变量的时间序列曲线如图2所示。

图2 按时间序列的参数曲线

图3 排烟温度与负荷关系散点图

主汽压力降低,负荷除氧器含氧量增加(一般是因为给水温度有所降低),主燃料流量和排烟温度的降低都会导致过热器减温水量的减少,反之亦然。而机组主汽温基本保持不变。由于主燃料流量和负荷趋势一致,故基于定性的考虑和避免数据的冗余,本文在不同负荷基准下建立过热器减温水量、负荷、除氧器含氧量、主汽压力、排烟温度的关联关系。对数据进行检验去除坏点,得到用于建立、验证关联规则的有效数据。以排烟温度为例得到其与负荷对应的散点图,如图3所示。

根据数据分布规律和运行经验设定相应的阈值(如图中两条水平线),去除阈值外的曲线。不同的负荷范围其阈值设定不同。而后再对剩下的数据进行残差分析,找到故障点并排除。

通过上述步骤选取出4 000组数据,将这些有效数据进行归一化处理到[0,1]之间,利用前3 000组建立如下关联规则:

〈L,l1~l2〉,〈TP,tp1~tp2〉,〈DO,do1~do2〉

,〈FT,ft1~ft2〉,⟹〈F,f1~f2〉

(2)

式中:L为机组负荷,TP为主汽压,DO为除氧器氧含量,FT为排烟温度,F为过热减温水流量。

将3 000组数据输入,利用神经网络建立规则。在两层神经网络中,由于该规则的建立属于数据量较大的因果预测逼近,所以将隐层节点设置为15个,同时考虑逼近时间和准确度,将学习速率设为0.01。

对输入按照负荷进行分类,得到了相应规则,对数据进行反归一化得到具体规则表示如表1所示。

得到此规则后,将余下的1 000组数据进行相应的检验发现过热器减温水量根据规则的预测与实际优化运行结果的最大误差为30 t/h,平均误差仅为 2.4 t/h,部分数据如图4所示,符合工程要求。

表1 过热器减温水量调节规则

图4 预测数据与实测数据对比

在得到此关联规则后,将其嵌入到优化系统中,实时的判断机组运行最优减温水量,保证机组的安全和良好的经济性。

4 基于数据挖掘电厂运行优化应用情况和存在的问题

基于数据挖掘电厂运行优化在国内外都取得了广泛的应用。在国外,英国的皇后大学Tony Ogilvie等人利用数据挖掘技术开发了电厂全工况条件下的参数关联模型,利用该模型能够为运行人员实时提供电厂运行参数调节指导[5];美国的Elagh Bailey、德国的Siemens等公司都在研究基于数据挖掘的电厂优化管理系统。在国内,华北电力大学李建强[6]、翟少磊[7];东南大学王培红[8];国家电力公司江浩[9];大连海事大学裘国相[10]等人都对数据挖掘电厂运行优化进行相应研究,并在实际电厂进行了相应的运行对比试验,取得了很好的优化结果。

但是当前的数据挖掘指导的电厂优化仍然存在很多问题:

(1)缺乏一种数据挖掘建立关联规则的证实机制。电厂关联规则的产生通常依赖于数据以及相应的关联算法,但是很多时候数据本身可能存在错误,关联算法也可能选取不当,这样使得得到的电厂参数间的关联规则很难被证明而成为一种通用的知识。

(2)由于机组运行工况经常会发生变化,这样使得原先建立的规则需要经常的进行更新。但是现在的技术无法满足完全的动态维护,很多情况下原先建立的有效规则会被淘汰,整个数据库要重新进行挖掘。

(3)由于电厂运行优化数据挖掘是一个新兴领域,很多算法内部函数和系数的选取往往需要根据经验或者实际运行对比验证,所以算法的实用性也需要进行大量研究。

5 结束语

本文从分析电厂运行参数的特点开始整体介绍了基于数据挖掘的电厂优化运行的方案,其涉及数据处理、建立关联规则知识库、确定优化目标值等各个方面。利用数据挖掘指导电厂优化运行能够解决传统优化运行方法存在的诸如数据量大,关联度强等问题。而数据挖掘方法在优化应用本身也要解决诸如建立证实机制、更新机制以及算法通用性等问题。虽然如此,基于数据挖掘的电厂优化运行仍然体现了其巨大优势和发展潜力。

参考文献:

[ 1 ] 李蔚, 刘长东, 盛德仁,等. 国内火电厂运行优化系统的现状和发展方向[J]. 电站系统工程, 2004,20(1): 59-62.

[ 2 ] J HAN, M. KAMBER. 数据挖掘:概念与技术[M]. 北京:高等教育出版社,2001.

[ 3 ] 申彦. 大规模数据集高效数据挖掘算法研究[D]. 江苏:江苏大学, 2013.

[ 4 ] R AGRAWAL, T IMIELINSKI, A SWAMI. Mining association rules between sets of items in large databases[R]. Proceedings of the 1993 ACM SIGMOD Conference, Washington D C, USA, May 1993: 207-216.

[ 5 ] TONY OGILVIE, B W HIGG. Use of data mining techniques in the performance monitoring and optimization of a thermal power plant[R]. IEEE colloquium on knowledge discovery and data mining, 1988.

[ 6 ] 李建强. 基于数据挖掘的电站运行优化理论研究与应用[D]. 北京:华北电力大学, 2006.

[ 7 ] 翟少磊, 黄孝彬. 数据挖掘在电站中的应用[J]. 控制工程, 2007,14(7): 174-177.

[ 8 ] 王培红, 陈强, 董益华,等. 数据挖掘及其在电厂SIS中的应用[J]. 电力系统自动化, 2004,28(8): 76-79.

[ 9 ] 江浩, 徐治皋. 电站运行优化决策支持系统及优化值的确定[J]. 动力工程学报, 2003,23(3): 2480-2485.

[10] 裘国相, 汪思源, 王文标. 数据挖掘在火电厂运行优化目标值确定中的应用[J]. 控制理论与应用, 2006,4(3): 6-9.

猜你喜欢

数据挖掘电厂关联
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
探讨人工智能与数据挖掘发展趋势
“一带一路”递进,关联民生更紧
世界上最大海上风电厂开放
智慧电厂来袭
智慧电厂来袭,你准备好了吗?
用Citect构造电厂辅网
奇趣搭配
基于并行计算的大数据挖掘在电网中的应用
智趣