短期负荷预测的解耦决策树新算法
2013-07-05李响黎灿兵曹一家李龙程子霞吕素
李响,黎灿兵,曹一家,李龙,程子霞,吕素
(1.郑州大学电气工程学院,郑州 450001;2.湖南大学电气与信息工程学院,长沙 410082;3.郑州航空工业管理学院机电工程学院,郑州 450015)
短期负荷预测的解耦决策树新算法
李响1,3,黎灿兵2,曹一家2,李龙2,程子霞1,吕素1
(1.郑州大学电气工程学院,郑州 450001;2.湖南大学电气与信息工程学院,长沙 410082;3.郑州航空工业管理学院机电工程学院,郑州 450015)
短期负荷预测是电力系统调度的重要工作之一,但影响因素众多,完全由算法形成决策树易误判。为提高精度,结合决策树和解耦法将负荷预测分解为标幺曲线和平均负荷预测,根据不同预测条件分别对预测日的标幺曲线和平均负荷形成决策树,决策树前两层由实际经验指定,其余节点自动形成。充分考虑影响负荷的不同因素,越重要的影响因素越靠近决策树上层,能适应各种情况下的负荷预测。在我国北方某市的实际应用表明,该法预测精度较高。
短期负荷预测;决策树;解耦;标幺曲线;平均负荷
短期负荷预测是指预测未来数日不同时间段的负荷,是电力系统调度的基础工作[1,2]。目前短期负荷预测常用的方法主要包括以下几种:时间序列法、回归分析法[3,4]、数据挖掘法[5,6]、支持向量机法[7,8]、专家系统法、人工神经网络法[9~11]等。大量文献针对各种方法的特点和适应性结合负荷预测的特点,针对性的进行了众多改进。例如文献[12]提出解耦法,将短期负荷预测分为平均负荷预测和标幺曲线预测两个问题,分开处理可更准确地考虑不同因素的影响。文献[13]介绍了决策树是一种通过比较事物属性的信息增益来提炼相关信息的有效方法,并介绍了它在短期电力负荷预测中的应用;文献[14]将决策树与专家系统相结合;文献[15]提出属性-值对的二次信息增益优化算法,通过对熵阈值的设定采用预剪枝技术克服ID3(interative dicremiser version3)算法对噪音敏感缺陷;文献[16]引入了信息理论来研究和处理负荷变化的不确定性,提出了基于最大信息熵原理的短期负荷预测综合模型。决策树方法引入短期负荷预测中,有效地提高短期负荷预测方法的适应性,已被广泛证明是提高负荷预测精度、结果可信度的有效工具。
虽然以上方法均已在各自领域取得了相应的比较丰硕的研究成果,但影响负荷变化的随机因素众多且规律不同,负荷受相关因素影响的规律不断变化,不同地区呈现不同的负荷变化规律,因此,短期负荷预测仍然是电力系统研究的难点、热点问题,同时随着智能电网建设,大量间歇性电源并网,负荷预测进一步受到广泛重视[17]。
本文提出基于解耦决策树的短期负荷预测新算法,并对决策树的形成方法进行了改进,进一步提高算法的适应性,有利于提高负荷预测准确率。
1 解耦决策树新算法的基本原理
解耦是将短期负荷预测问题分解为标幺曲线和平均负荷的分析预测两个内容。标幺曲线反应负荷变化形状,是指当天各时段负荷除以当天平均负荷后得到的无量纲标准化曲线;平均负荷代表了负荷水平[18]。由于标幺曲线和平均负荷受相关因素影响的规律不同,因此,分开处理能得到更高的准确率。基于解耦决策树短期负荷预测流程如图1所示。
图1 基于解耦决策树短期负荷预测流程Fig.1Flow chart of short-term load forecasting based on decoupling mechanism and decision tree
首先将历史数据(气象、负荷数据)进行预处理,利用这些数据形成标幺曲线预测决策树和平均负荷预测决策树,然后结合预测日的实时数据分别选取标幺曲线和平均负荷的相似日,最后利用相似日的数据进行短期负荷预测,分别考虑平均负荷和曲线形状,能够有效提高预测精度。
2 形成决策树的新方法
在各种决策树学习算法中,ID3算法最具影响,该算法选择信息增益最大的属性作为测试属性,但偏向于多值属性[19,20]。为避免在构建决策树的过程中ID3算法忽视一些属性的位置合理性所带来的预测偏差,本文在构建决策树时指定前两层、其他层由ID3算法自动形成,针对平均负荷及标幺曲线分别形成决策树的新负荷预测方法。
2.1 基本思路
在进行电力系统负荷预测时,需要考虑众多影响因素:如日类型、气温、湿度、风速、降雨量、气压等;由于ID3算法偏向于多值属性,因此会忽视一些属性在决策树上的位置合理性。而以上因素对负荷预测精确度的影响各不相同,所以对负荷影响越大的因素(即主导因素),应越靠近决策树顶层。如果主导因素选择错误,就会影响相似日的选取,从而影响预测精度[21]。
ID3算法的基本原理:设S是n个数据样本的集合,将样本集划分为m个不同的类Ci(i=1,2,…,m),每个类Ci含有ni个样本,则S划分为m个类的信息熵或期望信息为
式中,pi为S中的样本属于第i类Ci的概率,pi=ni/n。
Sv是S中属性A的值为v的样本子集,即Sv= {s∈S|A(s)=v},选择A导致的信息熵为
式中,E(Sv)为Sv中的样本划分到各个类的信息熵。
A相对S的信息增益为
文献[22]提出了基于信息熵的多因素权重分配方法并验证了其可行性。文献[23]以保定市负荷与气象数据为例,得出了日类型的权重值最大,即日类型对负荷影响最大,这也符合我国的实际情况,因为正常日的负荷模型具有按工作日和休息日呈周期性变化,节假日不同。如采用ID3算法自动生成决策树,在修剪的过程中会自动修剪数据上影响较小但实际影响较大的因素,并误将风速或者气温作为主导因素,则可能把不同日期划分到了同一片树叶下,但它们的负荷并不相似。
为了避免在构建决策树时错误选择主导因素所带来的误差,本文进行了如下改进。
(1)正常日和特殊日电力负荷变化规律完全不同,故在决策树划分中将正常日和特殊日作为决策树的第1层。
(2)由于同一地区不同月份的气候状况相差很大,整个社会的用电特征也有很大不同:比如在中国大部分地区,1、2月份低温季节,温度和湿度较低,表现为湿冷天气;整个5月份气温逐渐升高,负荷水平呈现出一个逐步上升的趋势,为一个负荷上升沿;9月份和5月份正好相反,负荷水平呈现出一个逐步下降的趋势,为一个负荷下降沿。故把月份作为决策树的第2层(即正常日的下一层);由于不同地区在节假日时负荷成分、大小变化都有各自的特点,所以将每个节假日划为第2层(即特殊日的下一层)。
(3)综合气温、湿度等气象因素利用ID3算法在第2层各个节点下面自动形成决策树的其他节点,划分至不同的节点进行预测。
需要说明的是,前两层的特殊日和月份的节点可由用户根据当地实际情况选取。
经过改进后的决策树顶层节点模型如图2所示。
图2 决策树顶层节点模型Fig.2Model of the top leave node of decision tree
2.2 平均负荷预测的决策树
平均负荷预测决策树用于预测待预测日的平均负荷,在构建标幺曲线的决策树预测模型时的步骤如下。
步骤1按图2所示指定决策树前两层,第1层节点为正常日和特殊日,第2层的节点可指定为月份和节假日,第2层节点的选取可以由用户结合当地气象等具体情况自定义。
步骤2对第2层的每个节点在历史负荷数据中选取样本数据,为了保证分类规则的正确率,要选取最近几年的历史数据,根据计算得出历史日负荷数据平均负荷为
式中:Pav为日平均负荷;Pi为一天的第i次采样所得负荷数据;n为一天所采样的负荷数据次数,一般每间隔15 min采样一次,一天共采样96次,如果工作人员下午5∶00进行预测的话,则n取68。
步骤3将历史日平均负荷与气象数据随机分为多组,选取任一组做为训练集,其他组作为测试集进行交叉验证,利用ID3算法自动形成平均负荷预测决策树第2层各个节点以下的其他节点,形成平均负荷预测决策树。
做平均负荷预测时,充分考虑日类型、历史日与预测日之间的时间间隔、气温等因素,对各个历史日与待预测日进行相似度评价,评价方法可随着新的影响因素的出现进行修订,将各个历史日按照相似程度高低进行排序,并赋以权重系数。同时考虑历史日与待预测日之间的比例关系,以保证预测值符合发展规律。
平均负荷预测模型为
式中:P为待预测日的平均负荷;ri为待预测日比历史日高出的比例;α为平均负荷曲线平滑系数,取值区间为(0,1),αi为α的i次方,表示历史负荷的权重呈指数衰减,防止较大幅度修正导致较大误差;n为评价相似度中取最为相似的前n天。
2.3 标幺曲线预测的决策树
已有的决策树形成方法往往用历史负荷的有名值作为形成决策树的样本集,本文将历史数据标幺化后再以这些标幺值来构建决策树。构建标幺曲线预测的决策树模型的步骤如下。
步骤1按图2所示指定决策树前两层。
步骤2选取最近几年的历史负荷数据作为样本数据,将历史日负荷数据进行标幺化,计算公式为
式中,Pi*为一天第i次采样所得负荷数据标幺值。
步骤3将历史日标幺曲线与气象数据随机分为多组,利用ID3算法自动形成平均负荷预测决策树第2层各个节点以下的其他节点,交叉验证后形成标幺曲线预测决策树模型。
标幺曲线决策树预测模型的基本思想可概括如下:
(1)将历史数据的标幺值作为形成决策树的样本集和预测待预测日标幺曲线的历史值;
(2)按照与预测日的相似程度高低,对各历史日进行排序;
(3)考虑平滑系数,将历史日的标幺值按照一定的权重系数进行加权平均,相似度低,历史日标幺曲线的权重系数小,相似度高,权重系数大。
标幺曲线预测的模型为
式中:B为待预测日的标幺曲线;β为标幺曲线平滑系数,性质同α;m表示历史日个数。
2.4 负荷预测
根据待预测日的平均负荷P及标幺曲线B,则得出预测日的负荷预测值P′为
平均负荷的稳定性往往低于标幺曲线的稳定性,平均负荷波动会影响曲线预测精度及其潜在规律,采用解耦决策树法可以避免平均负荷对曲线形状预测的不利影响,从而提高预测精度。
3 应用情况介绍
本解耦决策树算法用JAVA程序实现,并对北方某城市2004—2008年的负荷进行了预测,年平均准确率均超过95%。
3.1 公共参数及意义
在算法中使用的参数应该用变量统一表示管理,减少程序代码中的冗余代码,可以把这些参数提供给预测函数接口,可以从调用预测函数时传进来,也可以进一步用其他人工智能方法自动根据一个地区的负荷数据特性自动确定这些参数。算法中的公共参数及其意义如表1所示。
3.2 决策树模型
依据本算法,所建立的决策树如图3所示,决策树中节点数字所代表的含义如表2所示。以节点211为例说明其含义:节点211是节点21的一个分支,节点21是节点2的一个分支,表示1、2月份,节点2表示正常日。预测日划分到节点211意味着预测日若属于1、2月份的正常日,当最低气温大于低温门槛(对应表1中的5℃),则不用考虑温度的影响。
由于ID3算法偏向于多值属性,而影响决策树的因素众多,单纯采用ID3算法自动形成难免出现误判,为了防止在决策树上层的主导因素误判所带来的影响,故在决策树形成过程中人工指定前两层。
表1 公共参数的处理Tab.1Processing of common parameters
图3 决策树模型Fig.3Model of decision tree
以预测2006年10月1日(国庆节)负荷为例说明。当天的湿度为25%,平均温度为19.775℃,最高温度为29℃,最低温度为14℃。若ID3算法自动形成决策树,会选择2006年9月30日为相似日,因为该天的气象数据为:湿度为25%,平均温度为20.896℃,最高温度为27℃,最低温度为16.7℃,与当天的气象数据较为相似,作出的负荷预测曲线如图4所示。因10月1日为节假日,而9月30日为工作日,电力负荷变化规律差异较大,故预测精度不高。采用解耦决策树算法预测曲线如图4所示,预测准确率为99.8%。
3.32008 年1月份短期负荷预测准确率统计表
对北方某城市2008年1月份做短期负荷预测,信息日取96点时,平均准确率为97.54%,每日预测精度见表3。
表2 节点编号的含义Tab.2Meaning of node numbers
图4 两种决策树形成方法的负荷预测准确度比较Fig.4Load forecasting precision comparison of two kinds of the decision trees conformations
3.4 特殊日预测举例
2008年春节为2008年2月7日,预测准确率为97.93%。预测结果如图5所示。
3.5 正常日预测举例
以2008年3月17日为例,预测准确率为98.31%,预测结果如图6所示。
表3 2008年1月预测准确率Tab.3Precision rate of the load forecasting in January,2008%
图5 2008年2月7日的预测曲线和历史曲线Fig.5Predication curve and historical curve on February 7th,2008
图6 2008年3月17日的预测曲线和负荷曲线Fig.6Predication curve and historical curve on March 17th,2008
4 结语
本文提出的基于解耦决策树的短期负荷预测新算法将解耦法与决策树相结合,针对平均负荷和标幺曲线的变化规律分别采用不同的决策树对负荷进行预测。实际负荷预测工作表明,各地负荷均受日类型和月份的影响较大,故在决策树形成的过程中采用人工和ID3算法相结合的方法,人工指定决策树的前两层,而以下若干层采用ID3算法形成。这种人工与ID3算法相结合的处理方式,既保证了算法的准确性,又保证了算法的适应性。
利用该算法对北方某城市2008年的负荷数据进行虚拟预测的结果表明了该算法能够有效地克服在决策树顶层由于偏向于多值属性而忽略主导因素的缺点,并能够解决预测中试图仅用单一方法对所有情况进行预测、调整数以适应一个地区的负荷特性、一些日期准确率升高的同时另外一些日期准确率却下降了的矛盾,有效地提高了预测方法的合理性和预测准确率。决策树作为人工智能的基本框架,对于提高负荷预测的合理性和精确度具有重大意义。
[1]康重庆,夏清,张伯明(Kang Chongqing,Xia Qing,Zhang Boming).电力系统负荷预测研究综述与发展方向的探讨(Review of power system load forecasting and its development)[J].电力系统自动化(Automation of Electric Power Systems),2004,28(17):1-11.
[2]康重庆,夏清,胡左浩,等(Kang Chongqing,Xia Qing,Hu Zuohao,et al).电力市场中预测问题的新内涵(New connotation of forecasting issues in electricity market)[J].电力系统自动化(Automation of Electric Power Systems),2004,28(18):1-6.
[3]康重庆,周安石,王鹏,等(Kang Chongqing,Zhou Anshi,Wang Peng,et al).短期负荷预测中实时气象因素的影响分析及其处理策略(Impact analysis of hourly weather factors in short-term load forecasting and its processing strategy)[J].中国电机工程学报(Proceedings of the CSEE),2006,30(7):5-10.
[4]汪峰,于尔铿,阎承山,等(Wang Feng,Yu Erkeng,Yan Chengshan,et al).基于因素影响的电力系统短期负荷预报方法的研究(Study of short-term load forecasting based on influencing factors)[J].中国电机工程学报(Proceedings of the CSEE),1999,19(8):54-58.
[5]朱六璋,袁林,黄太贵(Zhu Liuzhang,Yuan Lin,Huang Taigui).短期负荷预测的实用数据挖掘模型(Applied data mining models for short-term load forecasting)[J].电力系统自动化(Automation of Electric Power Systems),2004,28(3):49-52.
[6]刘敦楠,何光宇(Liu Dunnan,He Guangyu).数据挖掘与非正常日的负荷预测(Data mining and short-term load forecasting for abnormal days)[J].电力系统自动化(Automation of Electric Power Systems),2004,28(3):53-57.
[7]李元诚,方廷健,于尔铿(Li Yuancheng,Fang Tingjian,Yu Erkeng).短期负荷预测的支持向量机方法研究(Study of support vector machines for short-term load forecasting)[J].中国电机工程学报(Proceedings of the CSEE),2003,23(6):55-59.
[8]王奔,冷北雪,张喜海,等(Wang Ben,Leng Beixue,Zhang Xihai,et al).支持向量机在短期负荷预测中的应用概况(Application profiles of support vector machine in short-term load forecastting)[J].电力系统及其自动化学报(Proceedings of the CSU-EPSA),2011,23(4):115-121.
[9]张志晟,段晓燕,李伟婕,等(Zhang Zhisheng,Duan Xiaoyan,Li Weijie,et al).优化动态递归小波神经网络短期负荷预测模型(Short-term load forecasting model based on optimized dynamic recurrent wavelet neural network)[J].电力系统及其自动化学报(Proceedings of the CSU-EPSA),2009,21(5):30-35.
[10]尤勇,盛万兴,王孙安(You Yong,Sheng Wanxing,Wang Sun′an).基于人工免疫网络的短期负荷预测模型(Short-term load forecasting using artificial immune network)[J].中国电机工程学报(Proceedings of the CSEE),2003,23(3):26-29,98.
[11]周佃民,管晓宏,孙婕,等(Zhou Dianmin,Guan Xiaohong,Sun Jie,et al).基于神经网络的电力系统短期负荷预测研究(A short-term load forecasting system based on BP artificial neural network)[J].电网技术(Power System Technology),2002,26(2):10-13,18.
[12]黎灿兵,刘梅,单业才,等(Li Canbing,Liu Mei,Shan Yecai,et al).基于解耦机制的小地区短期负荷预测方法(Short-term load forecasting method of small region based on decoupling mechanism)[J].电网技术(Power System Technology),2008,32(5):87-92.
[13]葛宏伟,杨静非(Ge Hongwei,Yang Jingfei).决策树在短期电力负荷预测中的应用(Application of decision tree on short-term load forecasting)[J].华中电力(Central China Electric Power),2009,22(1):15-18.
[14]于希宁,牛成林,李建强(Yu Xining,Niu Chenglin,Li Jianqiang).基于决策树和专家系统的短期电力负荷预测系统(Electric load forecast based on decision tree and expert system)[J].华北电力大学学报(Journal of North China Electric Power University),2005,32(5):57-61.
[15]栗然,刘宇,黎静华,等(Li Ran,Liu Yu,Li Jinghua,et al).基于改进决策树算法的日特征负荷预测研究(Study on the daily characteristic load forecasting based on the optimizied algorithm of decision tree)[J].中国电机工程学报(Proceedings of the CSEE),2005,25(23):36-41.
[16]朱成骐,孙宏斌,张伯明(Zhu Chengqi,Sun Hongbin,Zhang Boming).基于最大信息熵原理的短期负荷预测综合模型(A combined model for short term load forecasting based on maximum entropy principle)[J].中国电机工程学报(Proceedings of the CSEE),2005,25(19):1-6.
[17]胡子珩,刘顺桂,邱利斌,等(Hu Ziyan,Liu Shungui,Qiu Libin,et al).深圳电网智能化自动运行短期负荷预测系统(An auto-operating intelligent short-term load forecasting system for Shenzhen power network)[J].电网技术(Power System Technology),2005,29(23):74-79.
[18]莫维仁,张伯明,孙宏斌,等(Mo Weiren,Zhang Boming,Sun Hongbin,et al).短期负荷预测中选择相似日的探讨(Method to select similar days for short-term load forecasting)[J].清华大学学报:自然科学版(Journal of Tsinghua University:ScienceandTechnology),2004,44(1):106-109.
[19]翟俊海,张素芳,王熙照(Zhai Junhai,Zhang Sufang,Wang Xizhao).关于ID3算法的最优性证明(Verification on optimal ID3 algorithm)[J].河北大学学报:自然科学版(Journal of Hebei University:Natural Science Edition),2006,26(5):547-550,556.
[20]邵峰晶,于忠清.数据挖掘原理及算法[M].北京:中国水利水电出版社,2003.
[21]黎灿兵,李晓辉,赵瑞,等(Li Canbin,Li Xiaohui,Zhao Rui,et al).电力短期负荷预测相似日选取算法(A novel algorithm of selecting similar days for short-term power load forecasting)[J].电力系统自动化(Automation of Electric Power Systems),2008,32(9):69-73.
[22]黄定轩(Huang Dingxuan).基于客观信息熵的多因素权重分配方法(Means of weights allocation with multi-factors based on impersonal message entropy)[J].系统工程理论方法应用(Systems Engneering-Theory Methodolgy Applications),2003,12(4):321-324.
[23]栗然,曹磊,李莉,等(Li Ran,Cao Lei,Li Li,et al).影响电力系统短期负荷预测因素的权重分析方法(Analysis for weights allocation with influence factors in power system short-term load forecasting)[J].华北电力大学学报(Journal of North China Electric Power University),2007,34(5):32-37.
New Algorithm of Short-term Load Forecasting According to Decision Tree and Decoupling
LI Xiang1,3,LI Can-bing2,CAO Yi-jia2,LI Long1,CHENG Zi-xia1,LÜ Su1
(1.School of Electrical Engineering,Zhengzhou University,Zhengzhou 450001,China;2.College of Electrical and Information Engineering,Hunan University,Changsha 410082,China;3.School of Mechatronics Engineering,Zhengzhou Institute of Aeroncuctional InclustryMangement,Zhengzhou 450015,China)
Short-term load forecasting is an important foundational work for the power system dispatching.Because there were many influence factors,it was easy to produce misjudgment if the form of decision tree depended entirely on a algorithm.A new algorithm for load forecasting according to decision tree and decoupling was proposed.Short-term load forecasting was divided into the per unit curve forecasting and average load forecasting to improve precision.A new method of decision tree was raised.The layers before of decision tree were designated according to experience,and the rest was formed automatically.According to different forecasting conditions,it formed the decision trees of per unit curve forecasting and average load forecasting respectively with different forecasting formulas.The new algorithm took fully into account the discipline of different factors that influenced power load and the more important factors were near the top of tree,so it was suitable for short term load forecasting in all circumstances.The practical application in one northern city shows that this method has a higher forecast precision.
short-term load forecasting;decision tree;decoupling;the per unit curve;average load
TM715
A
1003-8930(2013)03-0013-07
李响(1979—),男,硕士研究生,讲师,研究方向为负荷预测。Email:nomad0729@163.com
2012-03-28;
2012-05-17
国家高技术研究发展计划(863计划)项目(011AA050203);国家自然科学基金项目(51107036)
黎灿兵(1979—),男,副教授,博士生导师,研究方向为电力系统综合节能、电网分析与控制。Email:licanbing@139.com
曹一家(1969—),男,教授,博士生导师,研究方向为电力系统稳定与控制、信息技术在电力系统中的应用等。Email:yjcao@hnu.edu.cn