基于大数据技术的广州市台风负荷影响分析和预测
2019-04-04林恒毅邢竟王文静庞朝曦罗微
林恒毅 邢竟 王文静 庞朝曦 罗微
【摘 要】论文通过研究台风期间天气气象指标的变化规律,分析各气象指标变化对广州市日最大负荷的影响,进而建立台风负荷预测模型,研究台风期间气象变化对广州市小时最大负荷的影响。论文分别从台风气象、广州气象及广州电力负荷三个维度构建了台风预测模型,通过相关分析技术筛选台风期间对广州电力负荷有显著影响的指标,最后采用多种机器学习方法进行预测。实验结果表明XGBOOST方法优于其他机器学习方法且模型也通過假设检验,模型对数据的拟合程度达到68.1%,台风期间负荷的外推预测平均准确率能达到85.22%。
【Abstract】Through studying the variation rule of weather and meteorological indexes during typhoon, the paper analyzes the influence of the changes of meteorological indexes on the maximum daily load in Guangzhou, and then establishes a typhoon load forecasting model, so as to study the influence of meteorological changing on the maximum hourly load in Guangzhou during typhoon. The typhoon forecasting model is established from three dimensions: typhoon meteorology, Guangzhou meteorology and Guangzhou power load. Through correlation analysis technology, the index has significant influence on Guangzhou electric power load is filtered. Finally, a variety of machine learning methods are used to predict the power load. The experimental results show that XGBOOST method is superior to other machine learning methods and the model also passes hypothesis test. The fitting degree of the model to data reaches 68.1%, and the average accuracy of load extrapolation during typhoon can reach 85.22%.
【关键词】电力负荷;台风;特征工程;机器学习
【Keywords】power load; typhoon; feature engineering; machine Learning
【中图分类号】TP391 【文献标志码】A 【文章编号】1673-1069(2019)01-0154-03
1 引言
广州由于其特殊的地理位置关系是一个台风频繁发生的地区,台风影响广州的时间大多集中在每年6到9月份,此时恰是天气比较炎热的季节,空调等制冷电力设备的用电负荷居于全年最高峰。由于台风到来的前后往往会伴随着以气温和降雨为主的显著的气候变化,此时会对广州用电负荷造成显著的叠加影响,给广州电力系统正常用电调度带来不小挑战。本文收集了广州近三年台风气象数据,广州市气温数据和电网运行各级负荷数据。利用气温,湿度,风速、降雨量,广州日用电负荷等数据,分析研究台风期间的不同气象特征对广州电网日最大负荷的影响建立台风用电负荷模型,为以后掌握台风期间用电负荷变化情况提供参考,为广州负荷调度安排提供决策参考意见。
2 研究综述
对于现代人类生活来说,电力已经成为人们生活中不可分割的一部分,因此,对电力负荷特性变化研究也一直是学术界关注的重点。目前,国内外许多研究表明电力负荷变化是与气候因素变化息息相关的。然而,虽然关于电力负荷特性与气候因素变化的相关研究比较多,但是具体到电力负荷特性与台风气候的相关研究就比较少了。其中,刘思捷等[1]通过描述统计方法分析了广东省从2006年到2010年对广东有影响台风期间并广东电力负荷特性分析,该文章用数据展示了台风登陆前后电力负荷波动趋势。莫若慧等[2]研究在台风天气下海南电网对气象因素的敏感度,文中通过会灰色关联理论筛选了影响电网的主要气候因素,在此基础上进行多元回归分析从而得到海南电网在台风条件的下用电规律。李小燕等[3]认为在台风期间现有负荷预测方式在大部分情况下预测程度一般不高,该文章首先分析了气象因子与系统负荷的相关性,从总负荷重分解出趋势分量,周期分量和气象敏感分量,在此基础上提出了基于相似日气象负荷修正的短期负荷预测方法。刘晶[4]也进行了类似的研究。
从现有关于台风期间电力负荷特性研究成果来看,研究对象粒度最小到日用电负荷,而对气候因素筛选往往只会考虑气温。然而,在实际情况中,对电力系统调度造成巨大困扰往往是台风期间某几个小时而非一段连续时间。此外,台风期间,降雨量、风力和湿度也会对电力系统负荷造成比较大的影响。本文通过研究台风期间天气气象指标的变化规律,分析各气象指标变化对广州市日小时最大负荷的影响,进而建立台风负荷预测模型,研究台风期间气象变化对广州市小时最大负荷的影响。
3 建模步骤
3.1 基本思路
因台风负荷是指在台风期间,仅由台风引起的负荷。本研究中台风负荷=台风期间总负荷-基准负荷,其中基准负荷是指采用台风前一个月的对应星期,对应小时的数据与台风后一个月的对应星期、对应小时的数据的平均值。台风期间总负荷与基准负荷的差值就代表由于台风影响所造成的负荷变化值[5]。因此,所有指标的值都是台风期间总值与基准的差值。为了选择找出对最大负荷有显著影响的指标,本研究采用基于相关分析的特征选择技术,筛选出台风期间跟广州负荷显著相关的指标,最后采用多种机器学习方法对台风负荷进行预测。
3.2 模型建立
将广州市的总负荷分成台风负荷、基准负荷两个部分,即广州市总负荷=台风负荷+基准负荷。为提高广州市总负荷预测的准确率,将台风负荷和基准负荷分开建模。
台风负荷预测模型:台风负荷预测是指仅考虑台风引起的各项气象指标变化,进而产生的负荷变化量。台风对广州市负荷的影响可分为台风前、台风中、台风后三个阶段,分开建模。台风负荷预测模型可采用分段回归方法实现预测。
其中,Yt是台风期间负荷值,Yb是台风期间基准负荷,ΔY即为台风负荷,Xt-是台风期间天气因素向量,Xb是台风期间天气因素基准负荷向量。
基准负荷预测模型:基准负荷预测模型是指剔除除台风影响的其他因素影响的负荷,包括节假日、周末、经济因素等其他因素。基准负荷采用台风生成前一个月,台风消失后一个月中剔除含有台风的日期和时间,与台风中每个时刻对应的星期、对应的时刻的点的均值来代替[6]。
3.3 实验结果及分析
3.3.1 基于相关分析建模的特征选择
探究台风对广州系统负荷波动的影响,研究范围从台风生成到台风结束为台风的生存周期,在台风生成前,广州系统负荷在自身状态下平稳运行,在台风期间,考虑到广州处于亚热带板块的内陆地带而且广州沿海线短且狭小,一般不容易受到台风的正面袭击,因此,认为台风对广州系统负荷的影响是通过台风影响广州气候从而进一步影响广州负荷。在台风过后,台风气候影响因素消失,广州气候系统和生产系统慢慢恢复,广州生产负荷回归到台风前状态。
本文考虑三个大类别指标,分别是跟台风气象有关数据指标,跟广州气候有关数据指标,建模构造指标。其中跟台风气象有关的指标包括:台风强度,风力等级,台风最大风速,台风移向,台风移动速度,台风气压,7级风圈半径,10级风圈半径,12级风圈半径,台风持续天数,台风开始第几天,是否台风记录数据,台风状态,行政区域是否在风网外,台风经度,台风维度,是否覆盖半径[7]。跟广州气候有关指标包括:最大温度,平均温度,最低温度,最大潮湿度,平均潮湿度,最低潮湿度,最大气压,平均气压,最小气压,最大风速,平均风速,最低风速,最大负荷,最小负荷,平均负荷,广州经度,广州维度,人体舒适度指数。建模构造指标包括最大负荷与基准负荷做差,最大温度与基准温度做差,最大潮湿度与基准潮湿度做差,最大气压与基准气压做差,最大风速与基准风速做差,最小负荷与基准负荷做差,最小温度与基准温度做差,最小潮湿度与基准潮湿度做差,最小气压与基准气压做差,最小风速与基准风速做差,平均负荷与基准负荷做差,平均温度与基准温度做差,平均潮湿度与基准潮湿度做差,平均气压与基准气压做差,平均风速与基准风速做差,人体舒适度是否过60,台风与广州距离(km)。
从物理气象学角度分析以下指标对最大负荷的变化均有影响,故建立最大负荷与各气象指标的相关分析模型。指标包括最大负荷(1.0,0.0000)、最大温度(0.563,0.000)、最大潮湿度(-0.302,0.000)、最大气压(-0.233,0.000)、最大风速(-0.085,0.0000)、最小溫度(0.537,0.000)、最小气压(-0.235,0.000)、最小风速(-0.062,1.3E-0.8)、平均温度(0.557,0.000)、平均气压(-0.235,0.000)、平均风速(-0.077,1.17E-12)、距离(0.058,1.03E-07)、人体舒适度(0.185,0.000),其中括号表示(相关系数,显著性检验P)。
各气象指标与最大负荷的相关系数绝对值排行情况如下:最大温度(0.56)> 平均温度(0.55)> 最小温度(0.53)> 最小潮湿度(0.53)> 平均潮湿度(-0.30)> 最大潮湿度(-0.291)> 最小气压(-0.29)。所有气象指标与最大负荷的相关系数在95%的置信度下,均拒绝原假设,通过统计显著性检验,即认为所有指标与最大负荷均具有显著的相关性。
3.3.2 各算法预测精度对比
为了提高结果的准确度和稳定性,采用多种集成学习方法实现台风负荷的建模和估计,主要包括随机森林(Random Forest)、自适应提升(AdaBoost)、梯度提升(GBDT)、袋装(Bagging)、XGBOOST。本次建模过程中,采用样本随机划分的原则,采用的训练集和测试的比例为4:1。模型对判定系数、平均绝对误差、均方根误差等指标进行评价结果如表1。
由表1可知,最好的模型是XGBOOST,模型对数据的拟合程度达到68.1%,台风期间负荷的外推预测平均准确率能达到85.22%。为了验证模型是否稳定,需要对最优算法的前提假设进行检验。
3.3.3 最优算法预测结果
为了从直观上观察预测结果与真实结果的差距,做了真实值与预测值的对比图,从下图可以看出从整体上看,预测值与真实值相差不多,误差较大的时间集中在每年的中秋节和国庆黄金周。从台风期间系统负荷预测的图可以看出,误差基本分布在1000以下,2015年和2017年的预测误差基本在1000以内,但是在2016年10月份左右的时候会出现波动在2000以上的情况。平均误差率为11.63%,准确率88.37%左右。误差最高的时段均出现在每年的中秋和国庆(20150926-27,20160915-17,20161001-03, 20171001-03),误差呈现小幅周期性波动(可能是周末因素)。
4 结论
本文通过研究台风期间天气气象指标的变化规律,分析各气象指标变化对广州市日小时最大负荷的影响,进而建立台风负荷预测模型,研究台风期间气象变化对广州市小时最大负荷的影响。本文首先根据台风生成特点和影响机制,通过收集近三年来对广州有显著影响的台风气象数据及台风期间的广州气象数据,广州用电负荷数据,搭建了一个涉及台风气象,广州气候和电力负荷衍生指标三个维度56指标特征工程。接着通过相关分析方法筛选出台风期间对广州每小时最高负荷有显著影响影响的指标,分别为指标包括最大负荷、最大温度、最大潮湿度、最大气压、最大风速、最小温度、最小气压、最小风速、平均温度、平均气压、平均风速、距离、人体舒适度等。最后通过多种机器学习方法对筛选后指标做回归分析,其中集成学习方法XGBOOST明显优于其他算法,对数据的拟合程度达到68.1%,台风期间负荷的外推预测平均准确率能达到85.22%。通过本文建立算法模型能够对台风期间用电负荷情况进行大体预测,为台风期间用电负荷变化提供参考,从而为广州负荷调度安排提供决策参考意见。
【参考文献】
【1】刘思捷, 刘昌, 李小燕,等. 台风对广东电力负荷特性的影响[J]. 云南电力技术, 2012, 40(1):91-93.
【2】莫若慧, 符子星, 曾炎,等. 台风天气下电网负荷对气象因素的敏感度分析[J]. 南方电网技术, 2015, 9(2):79-83.
【3】李小燕, 文福拴, 卢恩,等. 基于相似日负荷修正的台风期间短期负荷预测[J]. 电力系统及其自動化学报, 2013, 25(3):82-89.
【4】刘晶. 基于相似日和支持向量机的短期负荷预测研究[D]. 广州:华南理工大学, 2010.
【5】林辉, 刘晶, 郝志峰,等. 基于相似日负荷修正的节假日短期负荷预测[J]. 电力系统保护与控制, 2010, 38(7):47-51.
【6】于龙, 郑益慧, 王昕,等. 基于SVM与相似日的短期电力负荷预测[J]. 电工技术学报, 2013, 28(1增):217-223.
【7】Taylor J W, Buizza R. Neural Network Load Forecasting with Weather Ensemble Predictions[J]. IEEE Power Engineering Review, 2007, 22(7):59-59.