基于遗传算法与支持向量回归的发电机运行参数趋势预测
2018-03-29董亚明谢晓龙
董亚明,李 辉,谢晓龙
基于遗传算法与支持向量回归的发电机运行参数趋势预测
董亚明,李 辉,谢晓龙
(上海电气集团股份有限公司中央研究院,上海 200070)
针对支持向量回归(SVR)模型在设备运行参数趋势预测中。根据人为经验选取模型参数导致预测精度不高的问题,提出了一种使用遗传算法(GA)优化SVR模型参数的方法(GA-SVR)。将该方法应用于发电机定子线圈出水温度的实时趋势预测中。结果表明,相较于SVR模型,GA-SVR具有更高的预测精度,能够满足电厂对发电机运行参数变化的趋势预测精度要求。
发电机;遗传算法;支持向量回归;趋势预测;运行参数;定子线圈出水温度
0 前言
发电机运行参数趋势预测主要是基于发电机的多种实时运行参数,综合其他因素,对影响发电机健康状况的重要参数进行实时预测与分析。现代火电厂的安全运行意义重大,如电厂不能安全运行,可能会造成人员伤亡、设备损坏和事故,并且不能连续向用户供电,造成重大经济损失[1]。为了保证发电设备的安全可靠运行,减少设备故障的发生,提早发现设备运行状态的异常和故障,监测和预测设备主要运行参数的变化趋势是非常必要的[2]。因此提高发电设备运行参数趋势预测的准确度具有重要意义。现有的发电机运行参数趋势预测方法主要分为两类。其中一类是基于时间序列模型的预测方法[3],该类方法主要基于设备参数在过去一段时间内的运行变化规律来预测参数未来的变化趋势,因为其只考虑参数自身的影响因素而忽略了其他可能的因素,因此模型相对简单,运算速度快,但是由于模型忽略了其他可能的影响变量,因此对模型预测精度有较大影响。另一类是基于智能模型的预测方法,该类方法主要基于智能模型(如人工神经网络(Artificial Neural Network,简称ANN)[4-6]、支持向量回归(Support Vector Regression,简称SVR)[7-9],通过建立设备多种实时运行参数与重要运行参数之间的关联模型,以此来预测重要参数的运行变化趋势。该类方法的模型较为复杂,可以较好地拟合变量间的非线性关系,具有较高的预测精度。但是由于多数智能模型中包含需要预先选取的未知参数,例如SVR模型中的惩罚参数、核参数等需要预先选取,目前一般通过人工经验进行选取,容易增加预测误差[10, 11]。为了提高SVR模型的预测精度,本文提出基于遗传算法(Genetic Algorithm,简称GA)优化SVR模型参数的方法(GA-SVR),即使用GA来优化SVR的模型参数,以及核参数,最终采用最优的参数来进行SVR模型构建。将此方法应用于发电机定子线圈出水温度的趋势预测,实际数据表明,GA-SVR方法预测精度高,可满足实际工程应用。
1 SVR模型
基于统计学习理论,Vapnik[12,13]提出了SVR模型,对于具有个输入输出数据的训练样本集,是一个维的输入变量,是输入变量对应的一维输出变量。SVR的目标是建立一个模型[13]来满足回归函数,使模型的输出可以准确地对应经过映射后的输入变量。模型的数学形式可以写成一个凸优化问题:
以上凸优化问题可以转化为较简单的对偶问题来进行求解[13,14]。转化后的对偶问题如下:
常用的核函数有线性核,多项式核和高斯核。高斯核函数(RBF)的形式见以下公式:
式(3)中,表示RBF的核宽度。在本文中,使用高斯核作为SVR的核函数。
求解出拉格朗日乘子之后,SVR回归方程可以写成如下形式:
其中,偏置值可以通过Karush-Kuhn-Tucker(KKT)条件进行计算得出:
2 GA-SVR算法
GA[15]是由美国的Holland教授于1975年首次提出的,算法通过借鉴生物界自然选择和自然遗传机制,采用人工进化的方式对目标进行随机优化搜索,启发式地搜索全局最优解。使用GA进行启发式搜索,主要包括初始种群确定、编码、遗传操作(选择、交叉、变异)、适应度函数等步骤[16]。
针对SVR模型的三个参数、和,首先进行参数初始化,对参数进行二进制编码形成初始种群。确定好初始种群个数以及迭代次数。之后对SVR模型进行训练。基于训练后的模型,计算适应度函数值,判断是否满足要求。如果符合要求,则、和为最终优化得到的最优参数;如果适应度函数值不符合要求,则算法进行选择、交叉、变异以及种群再生等操作,继续迭代,直至满足算法终止条件。
GA-SVR模型的算法流程图如图1所示。
图1 GA-SVR模型算法流程图
3 试验结果与分析
3.1 样本选择
使用某电厂发电机运行参数DCS数据进行分析,选取2016年4月1日至2016年5月31日两个月的数据进行模型训练及验证。从电厂拿到的数据时间间隔为10min,即每10min获取一条数据,数据总数为8784条。考虑到部分时间机组停机或不在额定工况等原因,最终获取数据条数为8770条,其中4月份为4319条,5月份为4451条。考虑到定子线圈出水温度在发电机运行状态监控中的显著作用,使用GA-SVR模型来预测发电机定子线圈出水温度的趋势变化情况,选取发电机有功功率、发电机定子线圈进水温度、发电机定子线圈冷却水流量、发电机励端空侧密封油回油温度、定子边端铁心及端部结构件温度、发电机铁心中部齿和轭部温度、汽端冷氢温度、励端冷氢温度8个变量作为模型的输入变量。使用4月份的数据作为模型的训练数据集,5月份的数据作为测试数据集。
数据在进行建模和预测之前,首先使用下式进行标准化处理:
3.2 模型参数选取
选用均方误差(Mean Squared Error,MSE)作为GA的适应度函数:
3.3 预测结果分析
选用MSE和平方相关系数(Squared Correlation Coefficient,2)作为模型性能的最终评估指标。
使用GA对SVR模型的参数进行优化,适应度函数值随进化代数的变化情况如图2所示。从图2中可以看出,最佳适应度函数值大约在50代以后降到最小。经过优化后的SVR参数值为:=99.1597,=0.0082,=0.0394。
使用GA-SVR对发电机定子线圈出水温度4月份数据进行训练建模,训练结果如图3所示。图3展示了定子线圈出水温度的预测值与真实值之间的分布关系。经过训练,模型对4月份的拟合结果是MSE=0.0157,2=0.9969。可以看出,模型的拟合误差较小。
图2 GA的适应度函数值随进化代数变化曲线
图3 GA-SVR模型的训练结果
使用训练好的模型对5月份定子线圈出水温度值进行预测,挑选5月1日、5月8日、5月23日结果进行展示,预测结果如图4~6所示。模型对5月份的预测结果是MSE=0.0718,2=0.9862,预测精度较高。
图4 GA-SVR模型对定子线圈出水温度5月1日的预测结果
图5 GA-SVR模型对定子线圈出水温度5月8日的预测结果
图6 GA-SVR模型对定子线圈出水温度5月23日的预测结果
选用未经参数优化的SVR模型对样本数据进行训练和测试,模型的训练结果是MSE=0.0489,2=0.9903,模型的预测结果是MSE=0.4831,2=0.9263。SVR和GA-SVR模型对5月份31天的预测MSE值对比结果见表1。通过结果对比可以看出,GA-SVR模型预测效果优于SVR模型,其预测效果好,精度高,可以满足正常工程需求。
4 结论
本文提出了一种基于GA与SVR相结合的预测模型,使用GA来优化SVR模型的三个参数、和,然后使用最优的模型参数进行SVR建模。将此方法应用于发电机定子线圈出水温度的趋势预测,预测效果好,预测精度高,与传统的SVR模型相比较,效果优于未经参数优化的SVR模型。GA-SVR模型预测结果满足正常的发电厂运行需求,可以用来预测电厂发电机定子线圈出水温度的趋势变化情况。
表1 SVR及GA-SVR模型预测的MSE结果对比
[1] 张淑艳, 卢国斌. 发电设备安全可靠性分析及治理措施[J]. 黑龙江科技信息, 2009(35):39-39.
[2] 符晓, 刘超, 蒋东翔. 发电设备运行参数预测方法研究[C]//第十二届全国设备故障诊断学术会议论文集.沈阳, 2010: 69-71.
[3] 李辉, 郭双全, 张梦航. 基于时间序列的发电机温升趋势分析方法[J]. 上海电气技术, 2016, 9(1): 49-52+58.
[4] 许允之, 韩丽, 方永丽, 等. 基于神经网络算法的感应电机故障诊断方法[J]. 大电机技术, 2013(1):15-18.
[5] 田质广, 张慧芬, 郎立国. 基于遗传算法的神经网络在发电机定子超高频局部放电模式识别中的应用[J]. 大电机技术, 2006(1):36-40.
[6] 田录林, 韩彬, 田亚奇. 基于核主元分析与模糊神经网络的汽轮发电机振动故障诊断方法[J]. 大电机技术, 2016(6):16-21.
[7] 仲亚飞, 韦红旗, 姚卫刚, 等.基于粒子群算法和支持向量机的锅炉排烟温度建模[J]. 热力发电, 2016, 45(1):32-36.
[8] 朱永祥. 基于支持向量机的多喷嘴斜击式水轮机性能预测研究[J]. 大电机技术, 2013(6):55-58.
[9] 王莉, 李伟伟, 张强. 基于AACA-LSSVM的同步发电机滚动轴承故障分类[J]. 大电机技术, 2015(1):21-23.
[10] 曾勍炜, 徐知海, 吴键. 基于粒子群优化和支持向量机的电力负荷预测[J]. 微电子学与计算机, 2011, 28(1):147-149.
[11] 梁妮晓. 基于改进果蝇算法优化支持向量机的短期负荷预测[D]. 南宁:广西大学, 2014.
[12] Cortes, C., V. Vapnik. Support-vector networks[J]. Machine learning, 1995, 20(3):273-297.
[13] V. Vapnik. The nature of statistical learning theory[M]. Springer Science & Business Media, 2013.
[14] Smola, A. J., B. A tutorial on support vector regression[J]. Statistics and computing, 2004, 14(3):199-222.
[15] Holland, J. H., Adaptation in Natural and Artificial Systems: An Introductory Analysis with Applications to Biology, Control and Artificial Intelligence[J]. The Quarterly Review of Biology, 1994, 6:126-137.
[16] 臧淑英, 张策, 张丽娟, 等. 遗传算法优化的支持向量机湿地遥感分类——以洪河国家级自然保护区为例[J]. 地理科学, 2012, 32(4): 434-441.
Trend Prediction of Generator Operating Parameters Based on Genetic Algorithm and Support Vector Regression
DONG Yaming, LI Hui, XIE Xiaolong
(Shanghai Electric Group Co., Ltd., Central Academe, Shanghai 200070, China)
In the trend prediction of equipment operating parameters, the prediction accuracy will descend with the empirical parameters selection in support vector regression (SVR). A method that genetic algorithm (GA) uses to optimize the parameters of SVR (GA-SVR) is proposed in this paper. This method was used for the real time trend prediction of stator coil outlet temperature of the generator, results show that the prediction accuracy of GA-SVR was higher than SVR, and it can meet the requirement of generator operating parameters trend prediction accuracy in power plant.
generator; genetic algorithm; support vector regression; trend prediction; operating parameters; stator coil outlet temperature
TM301
A
1000-3983(2018)02-0022-05
2017-05-15
上海市科委企业合作专项项目(15dz1180400)
董亚明(1987-),2016年1月毕业于华东理工大学信息学院控制科学与工程专业,博士,主要研究方向:工业数据分析,大型设备状态监控及故障诊断,复杂过程建模,工程师。