APP下载

基于月度用电量的行业分类及用电量预测算法

2017-03-24宋艺航冷媛陈政林庆文

中国高新技术企业 2017年1期
关键词:神经网络

宋艺航 冷媛 陈政 林庆文

摘要:文章基于贝叶斯聚类方法,对某地市30个用电行业2008年1月到2015年10月的月度用电序列进行K-Means聚类分析,结果表明,前三个类别的行业涵盖了用电占比最高的10个主要用电行业,该三个类别的行业总用电量占全社会用电量约80%,最后基于ARIMA、神经网络、灰色预测模型对主要行业类别的用电量进行测试。

关键词:月度用电量;用电量预测;神经网络;ARIMA;灰色预测系统 文献标识码:A

中图分类号:TM715 文章编号:1009-2374(2017)01-0190-03 DOI:10.13535/j.cnki.11-4406/n.2017.01.090

1 概述

常用的电力系统负荷预测方法包括人工神经网络法、回归分析法和时间序列分析法等,但影响用电量的因素尤其是经济因素是复杂多变的,仅仅依靠某单一因素来对用电量进行预测具有很大局限性。

参考文献[4]和参考文献[5]介绍了人工神经网络法在负荷预测中的应用,其原理是利用训练函数调整网络中的权值与阀值,最终拟合数据样本函数。该方法的缺点在于无法给出明确且具有实质意义的模型表达式,同时其预测结果对初始值等因素较为敏感。回归分析法是负荷预测的一种重要方法,采用该方法所建立的模型的数学意义明确,数理性较强。由于该方法是基于长期稳定的回归关系而建立的预测模型,其短期预测精度在一定程度上受到限制,且该方法经常无法避免伪回归问题,其模型可能无法真实地表示负荷的变化趋势。

聚类分析已经渗入到图像处理、行业研究、预警体系等每个领域。针对神经网络的局限性,有许多学者把聚类分析和神经网络相结合,刘兴杰等利用模糊粗糙集与聚类方法,对模型输入参数进行优化,对训练样本实现优选,从而有效地提高了华北地区某风电场的风速预测。代倩等在光伏系统短期无辐照度发电预测过程中,采用自组织特征映射由云量预报信息对天气类型聚类识别,继而对各天气类型采用相应的预测网络,避免了单神经网络的过拟合问题。

本研究将参照以上方法,通过对某地市行业用电大数据进行分析挖掘,提出基于用电量的预测和行业分类方法,并识别出关键用电行业,为进一步的行业用电预测及后续研究奠定基础。最后,针对以自回归移动平均(Autoregressive Moving Average,ARMA)法为代表的时间序列分析法能够提高短期负荷预测的准确度,对于某地市的地区用电序列,本文提出一种把贝叶斯聚类方法和自回归移动平均模型相结合的方法,在行业预测基础上实现地区预测。该方法可以应用到具有层次结构的单维及多维度时间序列分析,为现实问题提供一种新的解决途径。

2 基于贝叶斯聚类的行业用电量分析

2.1 数据来源

本研究的数据来源是某地市从2008年1月到2015年10月的用电分类报表,用电分类报表中的行业划分包括多个层次,研究过程中可能存在重复选择的问题。基于行业全覆盖与避免重复的考虑,最终选择了表1所示的30个分类作为最终的研究对象。按照上述30个分类,对月度用电报表进行合并和整理,并只保留报表中的“本年本月”数据列,形成研究所使用的行业分类月度用电序列数据。

2.2 聚类结果及分析

对30个用电行业从2008年1月到2015年10月(其中个别月份数据缺失,不影响聚类有效性)的月份用电序列进行K-Means聚类,结果如表2所示:

聚类结果的BSS/TTS达到94.45%,说明类别的区分度较好,聚类的有效性较高。从聚类的结果可以看出,属于同一类别的行业,用电量级较为相近。类别1、类别2和类别3中的行业涵盖了用电占比最高的10个主要用电行业,这三个类别的行业总用电量占全社会用电量

约80%。

3 行业用电量预测模型

3.1 预测模型介绍

预测模型研究,首先,需要对数据进行整理,包括有效性检查、错误数据剔除与修改等。针对月度数据间隔较短特点,运用经济计量方法对数据进行初步统计,对趋势规律、不规则变动等因素进行分析,对序列做初步的自相关分析;其次,结合模型适用性条件库信息,通过参数检验(或仿真)初次筛选模型;最后,通過综合评价体系检验,形成最终兼具经济含义与统计含义的用电量月度需求的预测模型、预测结果、预测区间。采用的预测模型包括ARIMA、BP神经网络、灰色预测

模型。

3.2 行业用电量预测结果

本研究综合考虑数据的合理性及无效值出现的比例,对于月度数据拟采用的拟合区间(训练模型的数据)为2010年1月到2015年9月共69期数据,检验预测区间为2015年10月到2015年12月共3期数据。

针对月度数据时间间隔短,季节波动最为明显的特点,研究中分别尝试用灰色系统模型、BP神经网络、ARIMA模型训练用电数据并给出拟合误差和预测,结果如表3所示。图1至图5分别为五个行业类别的预测结果图(ARIMA结果)。

从表3可以看出,ARIMA模型相比于灰色系统和神经网络精度更高。五个行业的神经网络与灰色预测结果。灰色系统模型对于季节波动较明显的数据无法进行拟合,对于神经网络,由于训练样本不足或存在某些质量较差的数据节点等原因,无法收敛到较准确的精度,故月度用电数据预测拟采用ARIMA模型。

基于ARIMA模型,进一步给出各分类行业未来3个月(2016年1月到2016年3月)的预测结果,如表4所示。

4 结语

首先,基于贝叶斯聚类方法对各行业用电量进行分析,最终选取了5类具有行业代表性的行业类别,分析表明5类行业的用电特征具有较好的区分度;其次,根据不同用电数据的特征,分别利用月度预测模型库中几个有代表性的模型对关键用电行业数据进行预测并比较各模型精度,研究结果表明,对于月度分类行业用电序列,用ARIMA模型预测的精度较高;最后,按照与行业用电模型选择的过程,对某地市月度用电量预测模型进行构建。研究结果表明,针对月度地区用电序列,某地市月度用电量预测用ARIMA模型预测的精度较高,最后构建基于分类行业的预测模型,结果表明对于该地市用电序列而言,行业分类的预测模型要比直接运用ARIMA模型预测精度高。

参考文献

[1] 何永秀,王冰,熊威,等.基于模糊综合評价的居

民智能用电行为分析与互动机制设计[J].电网技术,

2011,36(10).

[2] 郝洪星,朱玉全,陈耿,等.基于划分和层次的混合

动态聚类算法[J].计算机应用研究,2011,28(1).

[3] 应劭霖.数据挖掘中的聚类算法的综述[J].江西化

工,2014,(2).

[4] 楼巍.面向大数据的高维数据挖掘技术研究[D].上海

大学,2013.

[5] 陶雪娇,胡晓峰,刘洋.大数据研究综述[J].系统仿

真学报,2013,(S1).

[6] 王骏,王士同,邓赵红.聚类分析研究中的若干问题

[J].控制与决策,2012,27(3).

[7] 娄银霞,程铭,文高进,等.基于FCM和遗传算法

的图像模糊聚类分析[J].计算机工程与应用,2010,

46(35).

[8] 劳兰珺,邵玉敏.中国股票市场行业收益率序列动态

聚类分析[J].财经研究,2004,30(11).

[9] 刘兴杰,岑添云,郑文书,等.基于模糊粗糙集与

改进聚类的神经网络风速预测[J].中国电机工程学

报,2014,(19).

[10] 代倩,段善旭,蔡涛,等.基于天气类型聚类识别

的光伏系统短期无辐照度发电预测模型研究[J].中国

电机工程学报,2011,31(34).

[11] 杨建萍.基于ARIMA模型的用电量时间序列建模和

预报[J].工程数学学报,2008,25(4).

[12] 毛玉凤.基于时间序列分析的电力需求预测及季节

调整模型的研究[D].北京工业大学,2013.

[13] 宋强,赵彪,刘文华,等.智能直流配电网研究综

述[J].中国电机工程学报,2013,22(25).

[14] 袁旭峰,程时杰,文劲宇.基于CSC和VSC的混合多

端直流输电系统及其仿真[J].电力系统自动化,

2006,30(20).

基金项目:本文系中国南方电网公司科技项目(K-KY2014-035)。

作者简介:宋艺航(1982-),男,南方电网科学研究院副研究员,博士,研究方向:电网系统预测。

(责任编辑:周 琼)

猜你喜欢

神经网络
基于递归模糊神经网络的风电平滑控制策略
BP神经网络在路标识别上的应用研究
神经网络抑制无线通信干扰探究
基于Alexnet神经网络的物体识别研究
基于BP神经网络的旋转血泵生理控制
基于神经网络MRAS的速度辨识仿真研究
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定
基于神经网络分数阶控制的逆变电源