基于迁移学习的电力负荷预测研究
2021-09-14陈雪薇张继东田园王振宇徐正安
陈雪薇张继东 田园 王振宇 徐正安
摘要:电力负荷预测是智能电网建设的基础,对我国未来碳计量工作具有重要作用。基于智能算法的电力负荷预测需要大量的历史数据作为模型训练样本,而新建城区或电力计量基础较为落后地区,难以收集大量准确的历史数据用于训练模型,导致难以准确进行电力负荷预测。现通过深度学习网络构建电力负荷预测模型,并基于迁移学习算法构建既有建筑电力数据和新建建筑电力负荷间的联系,通过既有建筑负荷历史数据训练所得模型来预测新建建筑电力负荷,以南京市某办公建筑为例验证所构建的负荷预测模型,预测误差可保持在7.8%以内,所提出的电力负荷预测方法可为实际电力负荷预测计量提供参考。
关键词:电力负荷预测;深度学习;迁移学习;建筑能耗
0 引言
电力负荷预测是智能电网的基础性功能,对未来智慧城市发展具有重要作用,对城市稳定高效运转具有重要意义,直接影响城市未来发展和人民生活水平的提升[1]。同时,电力负荷预测有助于碳计量工作的开展,是实现我国2060碳中和大计的重要环节[2]。然而,基于现代智能算法的电力负荷预测需要大量的历史数据作为模型训练的基础,而对于新建城区或电力计量基础较为落后地区,难以收集大量准确的历史数据用于训练模型,导致难以准确进行电力负荷预测。
本文针对这一难点,研究基于迁移学习的电力负荷预测模型,以两个大型办公建筑为例,首先基于已有大量历史数据的既有建筑负荷,使用深度学习算法构建电力负荷预测模型,再利用新建办公楼的有限数据结合迁移学习算法,通过迁移学习算法挖掘电力负荷和影响因素间的特征关系,构建新型建筑的电力负荷模型。
本文算法可以在历史数据不足的情况下构建智能预测模型,为新建城区或电能计量基础较为落后地区准确预测电力负荷提供参考。
1 电力负荷预测概述
电力负荷可以认为是随机的时序数据,也可以当作受其他特征影响的函数,前者可处理为时序预测问题,而后者可认为是回归分析问题。因此,常用的时序预测与回归模型都可以用于电力负荷预测[3],例如以自回归移动平均模型与多变量时间序列受控自回归为代表的时间序列模型,以支持向量机与神经网络为代表的机器学习回归分析方法,以及近年来广泛流行的基于深度神经网络的预测模型。尽管将用电量视作仅具有纯粹的时序依赖来处理,即通过历史用电数据来预测未来用电量可取得较为准确的结果,但建立决定用电量的外部因素和用电量数据的回归分析模型可为后续电力政策调整提供更多决策依据。
实际电力负荷预测时,对于新建城区或电力计量基础设施较差地区,准确的历史负荷数据难以获取,传统的基于数据驱动智能模型难以建立。针对这一难题,采用迁移算法可有效对新建建筑用电量进行预测。
Mocanu等人[4]使用迁移学习算法构建了智能电网的无监督能量预测模型,所提出模型可实现91.42%的准确预测。
Ribeiro等人[5]考虑了建筑负荷的季节性特性并结合迁移学习算法在不同建筑间构建負荷预测模型,所提出模型可提升11.2%的预测精度。
后续科研人员不断改进算法[6-10],利用迁移学习算法实现不同的负荷预测。
2 基于迁移学习的电力负荷预测方法
深度学习是学习样本数据的内在规律和表示层次,学习过程中获得的信息可对数据进行有效解释。深度学习由人工神经网络组成,这些网络以人脑中存在的类似网络为模型。当数据通过这个人工网络时,每个层处理数据的一个方面,过滤异常值,找到合适的实体,并产生最终输出。深度学习模型如图1所示,一般包括输入层网络、隐含层网络和输出层网络,经过大量数据训练的深度学习模型可达到理想的预测精度。
但实际工程中,训练数据经常不足,也可能无法收集历史负荷数据,有些应用中数据分布随着时间推移会有变化,如何充分利用之前建立的深度学习模型,同时又保证在新的任务上的模型精度,基于这样的问题,开展了对于迁移学习的研究,如图2所示。图2(a)描述的是传统机器学习,包括深度学习过程;图2(b)为迁移学习过程,迁移学习不仅利用目标任务中的数据作为学习算法的输入,还利用源域中的所有学习过程(训练数据和所建立模型)作为输入,即通过从源域获得的知识来解决目标任务中缺少训练数据的难题。
基于深度学习模型和迁移学习,本文所构建的数据驱动模型首先根据既有建筑电力负荷和相关影响因素(包括内部因素:人员特征、建筑运行管理机制、室内温度控制等;外部因素:气象参数等)建立基于深度学习的负荷预测模型,在此基础上,固定预训练模型中的部分网络参数,结合既有建筑的负荷预测模型与新建建筑的有限历史用电数据对预训练模型进行微调,以对其未来用电量进行准确地迁移预测,如图3所示。
此模型可在不收集大量历史负荷数据的基础上实现对用电量的准确预测,为实际负荷预测任务提供便利,因此将其作为主要研究模型M1。为对比本文使用的方法,设置对比模型M2和M3,M2为基于既有建筑负荷数据的深度学习模型,M3为基于一年新建建筑历史数据的深度学习模型。
3 结果与分析
3.1 数据源介绍
本文使用的数据集为2016—2020年南京市办公建筑用电量数据与气象数据的关系,数据逐时记录,分析建筑对象分为两类:B1为既有办公建筑——1995年建成使用,B2为新建建筑——2019年正式使用。气象数据涉及温度、相对湿度、降水、风速等天气特征,其中相对湿度、温度均为连续数值型数据,风速用风力等级表示,云量使用离散型数据。用电量数据为计量电能表实时记录(单位:MW)。图4展示了南京市全年气象参数变化趋势。
3.2 误差分析及计算配置
由于用电量是连续数值型数据,因此使用回归模型中常用的评估方法对模型效果进行评价。考虑到用电量的实际意义,相对误差比绝对误差更值得关注,因此使用平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)指标度量预测模型的效果。其计算方式为: