APP下载

基于优化模糊C均值聚类选取相似日的燃气负荷预测

2017-09-18,,,

关键词:燃气聚类向量

, , ,

(上海师范大学 信息与机电工程学院,上海 200234)

基于优化模糊C均值聚类选取相似日的燃气负荷预测

邱 静,徐晓钟*,邓松,王婷

(上海师范大学 信息与机电工程学院,上海200234)

针对短期负荷预测方法中传统的模糊C均值(FCM)聚类容易陷入局部最优和对初始聚类中心敏感的问题,提出利用粒子群优化(PSO)算法的全局搜索特性来优化此缺点.通过优化的FCM聚类来选取与预测日相似的日期作为支持向量机的训练样本,既强化了训练样本的数据规律,又保证数据特征的一致性.实验结果表明,优化预测模型的预测精度优于BP神经网络和支持向量机算法.

短期负荷预测; 相似日; 相似性; 模糊C均值(FCM)聚类; 粒子群优化(PSO)算法; 支持向量机(SVM)

0 引 言

提高燃气负荷的预测精度,既是为了工业用气和居民生活用气得到合理分配和调度,也是燃气工业自身健康发展的需要.燃气负荷预测对燃气工业乃至整个国民经济的发展都有着十分重要的意义[1].

目前负荷预测大致可以分为传统方法和智能方法.用传统方法所建的模型由于难以表达负荷与其影响因素的非线性关系,其预测精度难以进一步提高,限制了它在短期负荷预测中的应用[2-3].作为智能方法主要代表的人工神经网络,以其强大的自主学习能力、非线性处理能力等特性,较好地克服了传统方法的缺点[4-5],但在实际运用中还存在着网络结构选择困难,泛化能力较差,易陷入局部极小,收敛慢等缺陷[6-7].支持向量机作为数据挖掘的一项新技术,在模式识别、处理回归问题等方面已得到了成功应用,被认为是神经网络的替代方法[8-9],文献[10-11]将支持向量机和聚类算法相结合,以改善支持向量机在短期负荷预测中的应用效果.

模糊C均值聚类存在两个严重的缺陷[12]:1) 算法的性能依赖于初始聚类中心的选取,同时聚类的效果受初始值的影响较大;2) 模糊C均值(FCM)聚类算法在迭代寻找最优解的过程中使用的是梯度下降的方法,会不可避免地导致陷于局部最优值.针对这些问题,本文作者结合粒子群算法的全局搜索特性优化FCM聚类.通过优化后的FCM聚类,获取历史负荷样本的最优模式分类,再通过模式识别抽取出与预测样本相似的样本,作为最优训练样本集,强化了参与支持向量机(SVM)训练建模的样本数据规律性,使训练样本都具有相同或相近的输入、输出数学关系,实现了FCM聚类分析和SVM的有效结合,同时也改善了SVM算法的预测效果.

1 FCM算法

设样本空间X={x1,x2,…,xn},聚类数为c,且2≤c

(1)

FCM算法是通过梯度下降方法寻找最优解,即使其目标函数达到极小值.算法的目标函数为:

‖xk-zi‖,

(2)

式中dik为第k个样本到第i类的中心距离,zi为第i类的中心.目标函数具有极小值的必要条件为:

(3)

式中l是迭代次数,m是加权指数.

FCM聚类算法的迭代步骤如下:

1) 确定聚类数目c,加权指数m,一般m=2;随机生成聚类中心矩阵Z(0),并令迭代次数l=0.

2) 利用式(3)分别计算隶属度矩阵U(l),并修改聚类中心Z(l+1).

由于FCM聚类算法是基于目标函数的聚类过程,其本质上是一种局部寻优的求解过程,如果初始化不当,就会导致算法陷入局部收敛达不到全局最优解.为此,可以采用粒子群的全局搜索特性优化.

2 基于粒子群优化FCM聚类算法

2.1粒子群优化(PSO)算法

PSO算法是一种基于群体智能的随机全局优化技术,粒子群由许多粒子组成,每个粒子的位置代表优化问题在搜索空间中的候选解,粒子的速度决定它们飞行的方向和距离,并且有一个适应度函数来决定每一个粒子在群体中的适应度.群体中每一个粒子在迭代过程中,通过跟踪两个“最好的位置”来不断更新自己,一个是粒子本身目前所找到的最好位置pi_best,另一个是目前整个群体中所有粒子发现的最好位置gbest,更新公式如下:

(4)

(5)

每个粒子本身最佳位置更新公式为:

(6)

所有粒子的全局最佳位置更新公式为:

n.

(7)

2.2粒子群优化FCM聚类算法

由于FCM聚类算法使用梯度下降方法寻找最优解,存在对初始值敏感和容易陷入局部最优解的缺陷.利用PSO算法的优化搜索能力对FCM聚类算法改进,能保证得到问题的全局最优解.

2.2.1 粒子编码

FCM聚类算法的核心就是聚类中心的确定,因此可以选取聚类中心作为种群的个体,一个粒子表示待求解的聚类中心的集合.则每个粒子xi编码为

xi=(s11,s12,…,s1d,…si1,si2,…,sid,…,sc1,sc2,…,scd),

(8)

式中(si1,si2,…,sid)表示第i类的聚类中心,d为样本的维数.

2.2.2 适应度函数

对FCM聚类,最优聚类结果即是其目标函数取得最小值对应的结果.由于每一个粒子代表的是一种聚类中心的选取,所以每个粒子适应度的大小表明了在这种聚类中心的选取下其聚类效果的好坏.可以把FCM聚类目标函数的倒数作为对每个粒子适应度的评价:

(9)

从式(9)可以知,如果目标函数Jm越小,则个体适应度f(xi)就越大,聚类效果就越好.

2.3基于粒子群优化的FCM聚类算法的步骤

步骤1:确定聚类数目c,群体规模N,学习因子c1,c2,惯性权重w范围,最大迭代次数itermax.

步骤2:从n个样本中随机的选取c个不同的样本向量作为染色体的初始聚类中心,每个粒子代表各类的聚类中心.

步骤3:根据式(9)计算初始种群中个体的适应度值.

步骤4:根据式(6)计算粒子当前的位置,并根据式(5)更新粒子的位置,产生下一代种群.

步骤5:计算种群中个体的适应度值,若满足终止条件,算法结束,输出整个搜索空间找到的最小适应度值所对应的类的聚类中心,并通过FCM算法得到最终划分结果;否则返回到步骤4.

图1 FCM聚类优化前后的目标函数值图

FCM聚类优化前后目标函数值与迭代次数的关系如图1所示.可以看出粒子群优化后的FCM聚类具有更强的全局搜索能力.

3 基于优化的FCM聚类选取相似日

3.1相似日

人们在进行短期负荷预测时,发现如果预测日在气象状况、日类型等影响因素上与某历史日比较相似,则预测日的负荷与该历史日的负荷也比较接近,通常把该历史日称为相似日.在实际运行中,很多负荷预测工作人员就是通过寻找相似日来进行负荷预测的.但该方法过度依赖于工作人员的经验,合理选择相似日对于提高短期负荷预测的精度非常重要,没有太多工作经验的预测人员往往无法找到与预测日相似的历史日,降低预测效果.

3.2特征向量的选取

利用优化的FCM聚类算法选取相似日时,首先需确定显著影响燃气负荷变化的特征因素:温度(日平均温度,日最高温度,日最低温度)、星期类型(周一到周日)、天气类型等.

3.3映射数据库的设计

由于各个特征因素的量纲各不相同,因此需要把各个物理量作适当的映射,把不同的量纲映射到特定的区间,使得各个量之间具有数值上的可比性.根据文献[13]的思想建立符合上海市的映射数据库,如表1所示.

表1 各特征量的映射数据表

4 基于优化FCM聚类选取相似日的燃气负荷预测

4.1最小二乘支持向量机算法

对于训练样本集T={(xi,yi)|i=1,2,…,l},其中xi∈Rn为输入向量,yi∈R为相应的输出目标值,l为训练样本的个数.SVM先采用非线性映射φ(x):Rm→RM将低维输入空间映射到高维特征空间,再在高维特征空间进行线性回归,达到原线性空间非线性回归的效果.决策线性回归函数为:

f(x)=wφ(x)+b,

(10)

式中w是特征空间中的权系数向量,b∈R是常数.SVM采用结构化风险最小化准则来确定参数w和b,即

(11)

式中Rstr是结构风险,Remp是损失函数,

(12)

(13)

(14)

式中K(xi,xj)=[φ(xi),φ(xj)]为核函数,其作用是不必知道从低维输入空间到高维特征空间非线性映射φ(x)的具体形式,通过引入核函数就可得到决策回归方程.

求解上述问题,可得到支持向量机回归函数:

(15)

4.2样本输入量的选择

本文作者把影响燃气负荷的特征因子作为输入向量包括:1) 预测日前K日预测日的负荷数据A=[a1,a2,…,ak];2) 预测日的气象数据B=[b1,b2,…,bi],包括最高温度、最低温度、平均温度和天气类型等;3) 预测日的日属性D=[d1,d2,…,d7],代表周一至周日.

4.3燃气负荷预测流程

用基于PSO算法的FCM聚类与SVM算法进行燃气负荷预测时,先将用于确定预测因子与预测负荷之间非线性关系的历史数据用基于粒子群算法优化的FCM算法聚类,得到最佳聚类中心.通过计算待预测样本到各个聚类中心的距离,选择最小距离对应的类包含的数据找到与待预测样本的相似日,并将这些相似日作为SVM算法的训练样本,从而进行燃气负荷预测,如图2所示.

4.4实验结果分析

图3为上海市2011~2014年的燃气负荷聚类结果,每一种颜色代表一种类别,共6个类.由图3可知,不同年中相同的燃气负荷值都在一个类中,即每一类都代表了相似的燃气负荷值.

图2 燃气负荷预测流程

图3 上海市2011~2014年的燃气负荷分类结果

根据图3,分别采用BP神经网络、传统的SVM及提出的基于优化的FCM聚类及SVM结合的算法对2014年8月1到9月30日的燃气负荷进行仿真预测,结果对比如图4所示.

图4 三种预测算法仿真值与实际值对比图

平均相对误差

(16)

5 结 论

利用PSO算法的全局搜索能力优化FCM聚类算法.并将改进后的FCM聚类与SVM结合建立新型的燃气负荷预测模型,对燃气负荷数据分类,依据分类结果选取训练样本,选用同类特征的数据作为预测输入,保证了数据特征的一致性,强化了历史数据的规律.而且充分发挥了SVM算法结构风险最小化及小样本、高泛化能力的优势.实验结果证明了该方法的有效性,该方法比传统的SVM算法和BP神经网络都具有更高的预测精度.

[1] Apergis N,Payne J E.Natural gas consumption and economic growth:A panel investigation of 67 countries [J].Appl Energy,2010,87:2759-2763.

[2] 张昀,周湶,任海军,等.改进人工免疫网络算法在电力短期负荷预测中的应用 [J].重庆大学学报,2013,36 (4):33-39.

Wang J,Zhou Q,Reng H J,et al.Application and research of improved artificial immune network to power short-term load forecasting [J].Journal of Chongqing University,2013,36 (4):33-39.

[3] 虞尚智.机器学习算法在短期负荷预测中的应用 [J].科学技术与工程,2013,13 (18):2231-2236.

Yu S Z.Application and research of improve artificial immune network to power short-term load forecasting [J].Science Technology and Engineering,2013,13 (18):2231-2236.

[4] Ding N,Benoit C,Foggia G,et al.Neuralnetwork-based model design for short-term load forecast in distribution systems [J].IEEE Transactions on Power Systems,2016,31 (1):72-81.

[5] Szoplik J.Forecasting of natural gas consumption with artificial neural networks [J].Energy,2015,85 (1):208-220.

[6] Grant J,Eltoukhy M,Asfour S.Short-term electric peak demand forecasting in a large government building using artificial neural networks [J].Energies,2014,7 (4):1935-1953.

[7] Cecati C,Kolbusz J,Rozycki P,et al.A novel RBF training algorithm for short-term electric load forecasting and comparative studies [J].IEEE Transactions on Industrial Electronics,2015,62 (10):6519-6529.

[8] Ren F,Hu C,Tang F Z,et al.Load forecasting based on self-organizing map and support vector machines [C].Proceeding of the 11th World Congress on Intelligent Control and Automation,2015:3148-3150.

[9] Kavousi-Fard A,Samet H,Marzbani F.A new hybrid modified firefly algorithm and support vector regression model for accurate short term load forecasting [J].Expert Systems with Applications,2014,41 (13):6047-6056.

[10] 刘永光,孙超亮,牛贞贞,等.改进型模糊C均值聚类算法的电力负荷特性分类技术研究 [J].电测与仪表,2014,18:5-9.

Liu Y G,Sun C L,Niu Z Z,et al.Research on the improve fuzzy c-means clustering algorithm based power load characteristic classification technology [J].Electrical Measurement & Instrumentation,2014,18:5-9.

[11] Duan P,Xie K,Guo T T,et al.Short-term load forecasting for electric power systems using the PSO-SVR and FCM clustering techniques [J].Energies,2011,4:173-184.

[12] Khalialia M A,Bezdek J,Popescu M,et al.Improvements to the relational fuzzy c-means clustering algorithm [J].Pattern Recognition,2014,47 (12):3920-3930.

[13] 廖宗明.基于K均值聚类与支持向量机的电力系统短期负荷预测 [D].广州:华南理工大学,2012.

Liao Z M.The research of short term load forecasting of power system based on fuzzy-means clustering and SVM [D].Guangzhou:South China University of Technology,2012.

(责任编辑:包震宇)

Gasloadforecastingbasedonoptimizedfuzzyc-meanclusteringanalysisofselectingsimilardays

Qiu Jing,XuXiaozhong*,DengSong,WangTing

(The College of Information,Mechanical and Electrical Engineering,Shanghai Normal University,Shanghai200234,China)

Traditional fuzzy c-means (FCM) clustering in short term load forecasting method is easy to fall into local optimum and is sensitive to the initial cluster center.In this paper,we propose to use global search feature of particle swarm optimization (PSO) algorithm to avoid these shortcomings,and to use FCM optimization to select similar date of forecast as training sample of support vector machines.This will not only strengthen the data rule of training samples,but also ensure the consistency of data characteristics.Experimental results show that the prediction accuracy of this prediction model is better than that of BP neural network and support vector machine (SVM) algorithms.

short term load forecasting; similar days;similarity; fuzzy c-means (FCM) clustering; particle swarm optimization (PSO) algorithm;support vector machine (SVM)

2016-05-04

邱 静(1990-),女,硕士研究生,主要从事人工智能数据挖掘方面的研究.E-mail:572148690@qq.com

导师简介: 徐晓钟(1964-),男,高级工程师,主要从事人工智能数据挖掘及计算机软件架构设计方面的研究.E-mail:xxz_edu@shnu.edu.cn

TP315.69

:A

:1000-5137(2017)04-0560-07

*

猜你喜欢

燃气聚类向量
拧紧燃气“安全阀”
近期实施的燃气国家标准
向量的分解
探讨燃气工程的造价控制及跟踪审计
聚焦“向量与三角”创新题
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线
一种层次初始的聚类个数自适应的聚类方法研究