基于模糊C均值聚类的居民用户中期用电需求预测模型
2016-06-07蔡秀雯杨加生国网泉州供电公司福建泉州362000
蔡秀雯,杨加生(国网泉州供电公司,福建泉州 362000)
Residents mid⁃term electricity demand forecasting model based on fuzzy C⁃means clustering
CAI Xiu⁃wen,YANG Jia⁃sheng(State Grid Quanzhou Electric Power Supply Company,Quanzhou 362000,China)
基于模糊C均值聚类的居民用户中期用电需求预测模型
蔡秀雯,杨加生
(国网泉州供电公司,福建泉州362000)
近年来,随着我国人民生活水平的不断提高,对电力的需求越来越大,电力供应和节能减排压力也随之越来越大。为了缓解当前能源压力和改善我国电价结构,2012年7月全国除新疆和西藏以外的29个省份均开始全面实施居民用电阶梯电价机制。居民阶梯电价自实施以来,已在一定程度上增强了居民的节能意识,改变了一些不良的用电习惯。在新的阶梯电价制度下,用户群的某些特征(如:不同的收入、家庭结构、生活习惯等)对阶梯电价将产生不同的响应,这所引起的用电行为差异将逐步显现出来,这也使得阶梯电价下的居民用电需求预测变得更加复杂。准确的用电需求预测能科学指导电网的改造与建设,有效降低电网建设成本,提高经济效益和社会效益。
阶梯电价的科学理论基础是通过市场细分的方法区分出不同特征用户群,针对不同用户群采用不同电价机制,以提高资源配置效率。传统的用电需求预测建立的是用户的平均行为模型,这类模型无法揭示各个顾客群体的不同行为,忽略了不同类型用户的用电行为差异性。因此,准确的用户聚类及捕捉各类用户用电行为特征是现阶段居民用户中期用电需求研究的2个重要方面。
本文提出了一个新的基于模糊C均值聚类的居民中期用电需求分类预测模型。提取出阶梯电价机制下居民用电行为的不同属性特征,通过聚类分析识别出这些特征,将具有相似用电行为特征的用户聚成一类,再针对每个用户类别分别建立起相应的中期用电需求预测模型。本模型将为科学合理地开展智能配电网建设与改造提供一系列决策支持。
1 预测精度评价指标
预测精度的测定是指预测模型拟合的好坏程度,即由预测模型所产生的模拟值与实际值拟合程度的优劣。本预测模型的准确性由常用的平均绝对百分比误差(MAPE)衡量与最大绝对百分误差(ME)进行衡量,计算公式如下
2 模糊C均值聚类分析
2.1基本思路
模糊C均值聚类分析的基本思路是通过不断优化目标函数来获得各样本点对于所有聚类中心的隶属度,进而确定样本点的类属,最终达到自动对样本数据聚类的目的。
2.2聚类个数确定
最佳聚类个数确定的流程图如图1所示。
图1 最佳聚类个数的确定
为了客观地确定合适的聚类个数,本文主要通过计算每一个试探类别数的误差平方(SSE)和Mean Index Adequacy(MIA)值,通过对比分析找出最优的聚类个数参数。SSE和MIA计算公式如下
假设样本集合为U,n为样本总数。将其分为C个模糊聚类组,并且求出聚类中心集为V={v1,v2,…,vC},依据最小二乘法原理,采用以下优化目标函数来划分数据
此外,在模糊聚类之前,需将提取出的特征属性进行归一化,即将这些的属性值映射到[0,1]之间,以去除不同量级对用户用电量特征的影响。通常采用极大极小值法对数据集进行归一化处理,处理方法如下
3 居民中期用电需求分类预测模型
3.1模型的构建
用电需求分类预测模型通过对单一用电需求预测模型所包含的信息先进行分类,不同的行为采用不同的预测模型,这有助于提供更精确的预测结果。比如:有2个不同的用户群,分别为价格敏感度高的和价格敏感度低的用户群,分类预测可以知道每个用户群的不同用电行为,而传统的总量的平均模型则会导致对价格敏感度高的用户群预测过高,而价格敏感度低的用户群预测过低。
本文提出的用电需求分类预测模型首先把数据按不同的行为特征分成n个类,其结果是一组n个具有不同输入输出的数据集,然后对每个数据集建立起相应的模型,最后对预测结果进行汇总。模型框架结构如图2所示。
本文基于模糊C均值聚类的方法建立了居民中期用电需求分类预测模型。相较于传统的K⁃means聚类算法,模糊C均值聚类加入了模糊的概念,使得每一个输入向量(用户特征)不再仅隶属于某一个特定的聚类,而是以其隶属度来表示其属于不同聚类的程度。
本文将对所收集的数据经数据预处理后,利用聚类算法捕捉和识别不同用户在分析期内用电行为的特征性,将用电行为类似的用户聚成一类,然后对数据进行分类,即每个数据类的输入和输出都不同。接着,对不同类型的用户(即不同数据集)分别建立最适合的负载预测模型。进行预测时,首先要识别预测用户属于哪个聚类,然后选择对应的预测模型进行负载预测,最后,汇总单个预测结果得到最终总体预测结果。
图2 分类负载预测模型框架
本文所提出的分类预测模型和传统的组合预测不同之处在于:首先在分类模型中,每一个子模型都是预测一类负载,但所预测的输入输出都是不同的;其次,分类模型能方便地获得2类输出,除了传统的总量预测结果外,还可以获得各个用电类别的预测结果,但组合预测模型只能获得总量预测结果。
3.2用电行为特征提取
特征提取主要包括聚类属性选择与预测输入变量提取2个部分。
经过数据分析和预实验,本文提取了各用户日均用电量、月电量达到第2档的比例、月电量达到第3档的比例与高温敏感性4组聚类属性,来反映居民一定时间段内的负荷变化规律。日均用电量主要取决于家庭所拥有的各类电器设备的数目,借此可推测居民的收入水平[1]。而收入水平接近的居民用电行为往往比较相似。月电量达到第2档的比例、月电量达到第3档的比例可以反映用户在过去几个月内用电的波动性以及对阶梯电价机制的反应,捕获阶梯电价机制下各用户长期的用电规律。比如:对价格较为敏感的用户,在快进入下一阶梯时,会有意识地减少用电量,以避免进入下一阶梯,从而减少总电价。高温敏感性指标反映用户在高温天气用电量的波动情况。本文所定义的高温日是指平均温度大于等于25℃的日子。根据福建省现行阶梯电价机制,各档电价与电量如表1所示。
表1 福建省居民生活用电价格表
同时,所有预测模型的输入变量主要提取出过去7天的用电量与当天的气温共计8个输入属性。其中,应用历史负荷数据对预测有益,因为可以使用滚动预测方式进行。而如果气温未知且需要预测,可以使用天气预报数据或该地区过去几年同一日的平均气温进行估计。
3.3应用自组织模糊神经网络进行用电需求预测
通过模糊C均值聚类对用户进行分类后,应用自组织模糊神经网络进行居民中期用电需求预测。自组织模糊神经网络学习过程主要包括参数学习与结构学习。参数学习通过在线递推最小二乘算法使得网络快速收敛[2]。结构学习则是通过自动地增加、修改或删减EBF层中的神经元的自组织的方式,找到最为合适的神经网络规模。结构学习主要包括3个关键步骤[3]:①增加神经元;②修剪神经元;③合并隶属函数与规则。而通过SOFNN中的参数学习与结构学习算法,可以为每个聚类寻找最优的网络结构进行预测。
4 算例分析
4.1数据和数据准备
本文以泉州某区2 372户居民为对象进行实例分析。数据准备阶段主要任务主要包括:①缺失值处理:预处理后需检测数据中是否存在缺失的现象。通过计算用电缺失时间段前后一天的累计电量之差,并按照缺失的天数进行平均,将缺失的数据补齐;②异常值处理:对超出设定的指标阈值范围的数据样本进行过滤,例如:路灯、工业用户与长期无主的住户等。因路灯、工业用户按照工业电价收费,均不属于居民用户。
4.2样本最佳聚类个数分析
根据指标变化走势选取最优聚类数,所得到的聚类结果(如图3所示)。当聚类类数超过6时,随着类数的增加,曲线越来越平坦,SSE和MIA指标值的减小趋势明显减弱。
图3 不同类别的SSE和MIA指标测试结果
同时,为了保证每一个聚类中心均有一定数量的样本,因此,将聚类个数设定为6,聚类结果如表2所示。
表2 样本6个聚类中心结果
观察聚类中心的数值,结合每一类的样本特征,可以总结出以下特征:
(1)第一类用户日均用电量最少,每一类用电量依次增加,第六类用户日均用电量最多。
(2)第一类用户月用电量基本停留在第一阶梯电价规定的用电量之内,到达第2档、第3档的比例很少;第二类用户月用电量平均分布在第1档、第2档电价规定的用电量之内;第三类用户月用电量基本停留在第2档阶梯电价规定的用电量之内,月用电量为第1、第3档的比例很少;第四、五类的用户月用电量则主要停留第2档、第3档中。其中,第四类用户的月用电量更经常落在第2档;第五类用户的月用电量更经常落在第3档;第六类用户月用电量基本停留在第3档电价规定的用电量之内,月用电量为第1、第2档的比例极少。
(3)第一类、第三类用户对高温天气不敏感,而其余类别的高温敏感性指标较高,这些类别中的用户对于高温天气比较敏感。
4.3居民中期用电需求分类预测
将居民用电数据按照聚类结果进行加总,再分别搭建起相应的自组织模糊神经网络模型。自组织模糊神经网络分为训练阶段和测试阶段,训练阶段每次训练会有对应的误差值,再根据误差值来调整相应的参数值。
通过多次模拟实验与跟踪误差矫正,估计较优的自组织模糊神经网络预实验参数为δ=0.01,krmse=0.01。其中,δ的取值意味着是否创建神经元,增大δ的取值,更容易归结到一个细胞而不易创建,但精度变低;krmse的取值意味着剪枝的情况,数值越小越不容易被剪。
各个聚类所对应模型的滚动误差如表3所示。整体来看,除了模型1外,各模型的滚动预测误差均在可接受的范围内。原因在于,模型1所对应的聚类1中存在着一些用户,他们的用电行为随机性特别强,其用电规律难以甄别。在分类预测模型中,这类用户的用电行为和其它有规律的用户用电行为差别较大,往往会将这类用户归为一类。但由于随机性强等特点,这类用户的用电行为往往无法精确预测。所幸,模型1所预测的用电量相对于总用量的比例较小,对分类预测模型的预测精度影响并不大。
将各模型预测结果进行汇总,得到最终分类负载预测模型结果。单一负载预测模型与分类负载预测模型的MAPE值分别为3.34%与2.78%,均在4%以内,精度结果令人满意。相比于单一负载预测模型,分类负载预测模型整体预测精度提高了0.56%。
表3 聚类所对应模型的滚动预测误差%
5 结束语
本文创新之处在于:①提出了一个新的分类负载预测方法,从模型机理上和传统的总量负载预测模型是不同的;②创新性地将阶梯电价相关的指标引入聚类模型中;③利用智能电能表所提供的更精确、更全面的数据,更好地进行中期负载预测。同时,相比传统的每15 min数据采集,在保证精度要求的前提下,本文利用较少的数据采样点(每日数据)进行中期预测。
通过实例分析表明,该模型不仅能够高效、准确地进行用户聚类,捕捉阶梯电价机制下各类用户用电行为的特征性,还能显著提高该区域总体负载预测的精度。
参考文献:
[1]黄麒元,王致杰,朱俊,等.基于模糊聚类的电力系统负荷分类分析[J].电力学报,2015(3):200-205.
[2]Leng G,Prasad G,Mcginnity T M. An on⁃line algorithm for creating self⁃organizing fuzzy neural networks[J]. Neural Networks,2004,17(10):1 477-1 493.
[3]Mao H,Zeng X J,Leng G,et al. Short⁃Term and Midterm Load Forecasting Using a Bilevel Optimization Model[J]. IEEE Transactions on Power Systems,2007,24(2): 1 080-1 090.
[5]李玲玲,朱博.基于混沌时间序列的短期电力负荷预测[J].信息技术,2009(3):44-46.
[6]翟永杰,王静娴,周黎辉.基于模糊支持向量机的电力系统中期负荷预测[J].华北电力大学学报(自然科学版),2008,35(2):70-73.
[7]赵宇红,唐耀庚,张韵辉.基于神经网络和模糊理论的短期负荷预测[J].高压电技术,2006,32(5):107-110.
(本栏责任编辑管永丽)
◆能效与负荷管理◆
Residents mid⁃term electricity demand forecasting model based on fuzzy C⁃means clustering
CAI Xiu⁃wen,YANG Jia⁃sheng
(State Grid Quanzhou Electric Power Supply Company,Quanzhou 362000,China)
摘要:随着智能电网的加快建设和居民阶梯电价机制的实施,居民用电需求预测变得更加复杂。从现行居民阶梯电价机制下用户动态需求的特征出发,提出了一个新的基于模糊C均值聚类的居民用电需求分类预测模型。通过模糊C均值聚类对某地区居民用电行为进行聚类分析、数据分类,建立基于自组织模糊神经网络的用电需求预测模型,提高了中期用电需求预测精度。
关键词:聚类分析;中期用电需求;预测模型;阶梯电价
Abstract:With speeding up of smart grid construction and the implementation of the residents step tariff mechanism,residen⁃tial electricity demand forecasting has become more complicated. From the current residents step tariff mechanism and according to the characteristics of dynamic demand,this paper has proposed a new fuzzy C⁃means clustering based on the classification of resi⁃dential electricity demand forecasting model. By fuzzy C⁃means clustering for residential electricity behavior in order to clustering analysis and data classification,this paper has established electrici⁃ty demand forecasting model based on the self⁃organizing fuzzy neural network,and has improved the medium⁃term demand fore⁃cast accuracy.
Key words:clustering analysis; mid⁃term electricity de⁃mand; prediction model; step tariff
DOI:10.3969/j.issn.1009-1831.2016.03.005
收稿日期:2016-02-22;修回日期:2016-04-07
作者简介:蔡秀雯(1983),女,福建泉州人,工程师,研究方向为电网规划、电力市场分析与预测;杨加生(1982),男,福建泉州人,工程师,研究方向为电力智能量测。
中图分类号:TM715.1
文献标志码:B