基于时间序列模型的校园宿舍用电量分析
2022-11-23楼启航郭依婷戴渝杰马宇凡
楼启航 郭依婷 戴渝杰 马宇凡
(厦门大学嘉庚学院,福建 漳州 363105)
0 引言
科技的快速发展和新技术的出现使人们对电力有着持续性增长的需求,能源短缺问题也日益凸显。中国电力企业联合会于2021年底发布的《电力行业碳达峰碳中和发展路径研究》显示,电力行业正迎来重大机遇与挑战,对于电力数据的价值挖掘研究与应用已经成为未来发展的必然趋势,充分发挥电网基础设施的作用,提高资源配置能力是应对该现状的有效方式之一[1]。
当前,发电方式存在不稳定性,用电高峰期无法保证有效持续供电。部分地区电网网架结构薄弱、送电通道容量上限不高,供电量受限,未来一段时期我国部分地区电力供需紧张态势仍将持续[2]。在高校中,供电需求量大,用电高峰期的电量峰值较其他区域高,供电压力大,对电力资源进行合理配置显得尤为重要[3]。本文通过采集学生用电数据,对学生宿舍用电情况进行分析,建立模型对校园宿舍用电量进行学习和预测。预测未来几天内的用电需求,不仅能够给学生作为参考,也可对电力供需提供预警功能,保障宿舍电力供需平衡,加强高校的节电管理,从源头上减少能耗[4]。
1 模型理论
1.1 时间序列
时间序列预测是根据历史时间序列数据建立模型的方法,被广泛应用于经济学、管理学、气象学等领域。对某一个或者一组变量x(t)进行观察测量,将在一系列时刻t1,t2,…,tn所得的离散数字组成的序列集合,称之为时间序列[5]。时间序列预测方法首先考虑的是事物的趋势性,通过历史数据来预测事物的发展趋势;其次考虑的是事物的季节性,如气候条件、节假日等各种周期性因素,根据事物发展的季节性变化预测事物的周期变化;最后考虑随机因素的影响,不规则波动通常夹杂在时间序列之中,以致时间序列产生波浪式或振荡式变动。基于电量序列的特性以及数据量,本文基于自回归滑动平均模型(Auto-Regressive and Moving Average Model,ARMA)建立模型。ARMA模型是研究时间序列的常用方法,用于研究平稳随机过程有理谱,适用性很强。
1.2 神经网络
神经网络作为机器学习方法之一,起源于人类对大脑的研究,是一种仿生的网络结构。通过大量简单的生物神经元之间的相互连接,来构造复杂的网络结构,以模拟生物神经网络的智能行为,从而克服传统算法处理智能信息的困难。基于长短期记忆人工神经网络(Long-Short Term Memory,LSTM)独特的设计结构,LSTM作为一种特殊的递归神经网络,不仅可以利用时间序列对输入进行分析,还不会像普通的递归神经网络忽略长时间前的有用信息,因此,本文根据电量序列的特性选择基于LSTM建立模型。
2 模型建立与求解
2.1 数据采集
本文以厦门大学漳州校区的学生作为调查对象,厦门大学漳州校区宿舍用电情况作为主要调查内容,采用问卷调查法和实地观察法两种数据采集方法。
2.1.1 问卷调查法
本项目组前期通过查询相关资料制订了本次调查问卷,调查问卷设计分为三大部分:第一部分为被调查者基本情况,第二部分为被调查者对宿舍用电器的使用情况,第三部分为被调查者夏冬两季用电量及电费支出情况,总计包含12个问题。在本次调查中,共发出问卷168份,收回问卷168份,有效问卷154份,有效回收率为91.7%。对调查问卷的数据进行分析,总结了影响本校大学生宿舍用电量情况的因素,并对校园节电管理及大学生节电意识培养提出了相关意见和建议。
2.1.2 实地观察法
本文以厦门大学漳州校区为例,对校园内各个园区共58幢宿舍楼采取随机抽样调查的方法,通过学校的电费网站采集了每个园区各一个宿舍从9月7日至12月7日的每日用电量。数据可视化如图1所示。
2.2 影响因素分析
为了探究用电情况是否受性别影响,抽样统计不同宿舍楼同宿舍号的9、10、11和12月的用电量情况,结果如表1所示。
为了更直观地进行对比,基于表1数据绘制图2。
统计北区不同宿舍楼同宿舍号的9、10、11和12月的用电量,发现用电量情况是受性别影响的,从图2中可以看出,女生宿舍在9月—11月的平均用电量都明显高于男生宿舍。将该结论与168份调查问卷的结果对比来看,在耗电最多的电器中有14.29%的男生选择了日常电器这一选项,而选择这一选项的女生有29.39%。经过实地走访调查发现,女生宿舍备有电器的数量比男生来得多,并且功率也相对更大,可以推断出这是造成男女生宿舍用电量差异较为关键的部分。
2.3 ARMA模型建立
ARMA的基本思想是把AR和MA模型结合起来,使得所用参数个数保持很少。模型形式为:
式中:{ϕi}为自回归系数;{θi}为移动平均系数;{γt}为时间序列;{at}为白噪声序列;p和q为非负整数[6]。
本文通过观察PACF、ACF截尾以及AIC、BIC准则来分别判断p和q的值,以进行模型定阶。
从预测日期开始,利用ARMA模型对不同园区宿舍电量进行预测,预测值作为新的样本加入预测模型,逐日增加样本量,计算预测值yˆ与实际值y的累计差异率s,公式为:
通过观察差异率变动趋势,对预测数据进行有效修正,最终确定选择ARMA(9,1)作为预测模型。
2.4 LSTM模型建立
LSTM是一种特殊的RNN,可以学习到长期记忆信息,解决长时依赖问题,并且在反向传播求导时梯度几乎保持为常量,避免了梯度消失或爆炸,模型收敛速度更快。LSTM神经网络模型的循环单元内部包括三个结构:遗忘门、输入门和输出门。遗忘门决定了上一时刻的工作状态需要保留多少到当前时刻,可由tanh函数实现;输入门决定当前时刻网络输入哪些信息来更新长期记忆状态,该阀门筛选出有用信息喂入网络,可由Sigmoid函数实现;最后一个是输出阀门,它置于网络的输出之后,用于控制单元状态,可以自动提取输出信息中的重要部分,它也由Sigmoid函数实现。
LSTM网络的基本单元如图3所示,ft,it,ot分别为遗忘门、输入门、输出门;xt,gt,ht,Ct分别为t时刻的输入、输入节点、中间输出和细胞单元的状态;σ、tanh分别为Sigmoid和tanh函数变化。
本文先将数据转换为平稳数据,再将序列构造为一个有监督的学习问题,并把数据集以2∶1的比例分成训练数据集和测试数据集。为了达到较好的训练效果,本文将batch size设置为1 000轮,以进行模型训练。
3 实验结果与分析
本文以YX园区宿舍的数据为例分别进行模型训练,将实际值与两种预测模型得到的预测值进行可视化,结果如图4所示。由图4可知两种模型预测效果都较为不错,走向与实际值大致相同。
为了更好地评价并对比模型效果,本文分别计算了LSTM的平均绝对值误差MAE与平均绝对值百分比误差MAPE,这两个指标都经常被用于时间序列分析中来评价衡量预测误差和准确性。
MAE公式为:
MAPE公式为:
结果如表2所示。
表2 模型综合评价表
从结果可以看出,LSTM模型的MAE与MAPE均小于ARMA模型,所以LSTM模型略优于ARMA模型。
4 结论
(1)本文通过不同的时间序列模型预测对照,得出LSTM模型的预测效果优于ARMA模型,机器学习相较传统的时间序列模型更加精准。
(2)本文通过对厦门大学漳州校区宿舍用电量进行调查,得出性别是影响宿舍用电量的重要因素之一,原因是女生总体使用电器更多。此外,电量可能也与气温有关。
(3)根据用电量情况的预测既可以合理规划各地区配电网,也能为宿舍用电预警提供实践依据,避免因忘缴电费引起停电,造成生活不便。
(4)时间序列模型还可用于动植物种群数量逐月或逐年的消长进程、某证券交易所每日收盘指数等等,还能够用在国民经济宏观操纵、区域综合进展计划、企业经营治理、市场潜量预测、气象预报、水文预报、地震预兆预报、农作物病虫灾害预报、环境污染操纵、生态平稳、天文学和海洋学等方面。
(5)神经网络模型预测具有一定的可行性及可靠性,电网公司可以根据研究资料与成果,基于事故在范围、时间等方面的信息,快速预估停电造成的影响,还可以结合已经掌握的信息快速制订解决方案。