改进鲸鱼算法优化的多维度深度极限学习机短期负荷预测
2023-02-20唐晓陈芳许强李乐萍郭嘉
唐晓,陈芳,许强,李乐萍,郭嘉
(1.国网山东省电力公司聊城供电公司,山东 聊城 252000;2.天津大学智能电网教育部重点实验室,天津 300072)
0 引言
电力系统纵贯各行各业,是支撑工业发展的骨骼,电力系统的每一次发展革新,都将会带来工业行业的进步[1-2]。随着“双碳”目标的提出,大规模清洁能源接入电网,电力行业向“低碳”、“绿色”方向转型[3-4]。短期负荷预测是指对未来几小时或者几天固定时间点(多为整点)的负荷量进行预测,是电力企业进行负荷管理的基础。基于此,负荷的短期精准预测对提升电能质量,降低发电成本,保证电网经济、安全的运行有十分重大的意义[5]。
负荷预测的传统方法是对历史数据进行线性回归处理:文献[6]针对预选的可能影响负荷变化的因素,采用回归分析法与时间序列分析法等方法分别计算相关程度,分析并选择日最高温度为影响负荷变化最关键因素,提高了传统负荷预测方法的精度;文献[7]验证了自回归滑动平均混合模型在季节性电力负荷预测的精确度优于灰色模型。但基于统计学模型的传统预测方法受限于缺乏一定的自适应能力,通常仅能在一些特定的负荷数据中保持较好的预测精度,针对不同地区的普适性和预测精度并不理想,因此基于机器学习的短期负荷预测模型是普遍的研究热点。文献[8]应用BP 神经网络算法,收集天气因素,经过神经网络正向与反向传递得到期望值,结合历史负荷数据进行训练并验证了其有效性,但是考虑到BP 神经网络存在寻优时间长、预测精度低等问题,文献[9]通过粒子群算法对每层预设不同权值和阈值的BP 网络进行优化,在BP 网络的基础上加快了收敛速度、提升了预测精度。文献[10]首次在短期负荷预测中采用了支持向量机(Support Vector Machine,SVM)预测模型,考虑温度等影响因素,聚类分析历史数据,寻优得到与预测点相似的数据进行训练预测,弥补了常规神经网络模型针对节假日等特殊日期预测精度不够的问题,实验验证其预测精度相对BP 神经网络模型和传统预测方法提升明显。文献[11]对SVM 模型的惩罚参数、核参数通过蚱蜢算法进行寻优,验证了蚱蜢算法比遗传算法在SVM 负荷预测模型上有更强的寻优能力。文献[12]构建了基于ELM 可以提升负荷预测精度的短期负荷预测模型;文献[13]通过鲸鱼算法对ELM 的初始权值和偏置寻优,相比文献[12]提升了短期负荷预测精度。
短期负荷预测对电力系统的安全稳定运行具有重要意义,如何提高预测精度一直是相关领域研究者的关注重点,由于深度极限学习机具有计算速度快、预测精度高的特点,本文将用引入Tent混沌映射的改进鲸鱼算法(Improved Whale Optimization Algorithm,IWOA)优化的深度极限学习机进行短期负荷预测,相比于其他优化过后的算法,所提方法预测精度更高,更适用于短期负荷预测。在预测时,将综合考虑当天的气候因素与历史负荷数据进行预测,并通过对比说明了考虑气候因素的多维度负荷预测模型的预测效果更好。
1 模型寻优算法
1.1 鲸鱼算法
Mirjalili 和Seyedali 等人于2016 年提出了一种模拟自然界鲸鱼种群捕食过程的全局优化寻优算法[14]。
鲸鱼优化算法(Whale Optimization Algorithm,WOA)的核心有3部分:包围猎物、攻击猎物、再搜索猎物。
1)包围猎物。
在第一次迭代过程中,需先判断当前最优个体位置,并以其作为所有鲸鱼个体目标猎物位置,根据此位置进行位置更新。即:
式中:X为当前鲸鱼的位置向量;t为迭代次数;A和C为系数向量;X*为当前最优位置鲸鱼的位置向量。
A和C计算方法为:
式中:a为可变系数向量,与迭代次数成线性递减关系,由2线性递减至0;r为[0,1]之间的随机向量。
2)攻击猎物。
WOA 算法模拟座头鲸螺旋冒泡网攻击猎物的行为,根据鲸鱼与猎物的距离,以螺旋状路线逐渐靠近猎物发起攻击,即:
式中:b为用来定义螺旋攻击路线形状的常数;l为[-1,1]区间内的一个随机数。
3)再搜索猎物。
在实际搜索过程中,当|A|>1 时,易陷入局部最优的问题,因此此时需要再全局中再随机选择一个鲸鱼位置,以其作为最优位置更新其他鲸鱼位置,重新捕猎。即:
式中:Xrand为当前鲸群随机选择的位置向量。
1.2 IWOA
初始种群在全局分布是否足够广泛将很大程度上影响到鲸鱼算法的寻优结果优劣。若初始种群随机化较为集中,算法本身很容易陷入局部最优解导致后续负荷预测模型预测结果差。为了充分发挥WOA 算法结构简单且寻优效率高的特点,选择基于Tent 混沌映射选择机制的IWOA 来对负荷预测模型进行参数寻优。
Tent 映射是一种分段混沌映射函数,其数学表达式为
式中:z为[0,1]的常数;n为数列序号;Xn为系统变量。若Xn+1>1,则Xn+1的返回值为1;若Xn+1<0,则Xn+1的返回值为0。
Tent 混沌映射结构简单且遍历均匀性较好[16]。IWOA 算法以Tent 混沌映射生成的序列作为鲸鱼种群个体的出生位置,有助于使首次迭代寻优中鲸鱼个体的分布更具多样性,从而以最佳初始位置作为第一次寻优位置更具代表性。
2 负荷预测模型
2.1 极限学习机
极限学习机(Extreme Learning Machine,ELM)是2006 年由Huang 等人提出的一种新型前馈神经网络[17]。由于训练ELM 网络时随机产生输入权重等参数,不需要人工设置大量参数,因此其具有设置简单、学习速度快等特点,而且其可以将输入数据随机映射至Hilbert 空间,泛化能力强[18]。假设有N组不同的样本(xi,t)i,xi=[xi1,…,xin]T∈Rn,ti=[ti1,…,tim]T∈Rm。具有L个隐藏节点、激励函数为G(x)的ELM 可以通过式(10)表示。
式中:βi=[βi1,βi2,…,βim]T为连接第i个隐藏层节点的输出权值;ai=[ai1,ai2,…,ain]T为连接输入层和第i个隐藏层的输入权值;bi是第i个隐藏层节点的偏置;G(ai,bi,xj)是第i个隐藏层的输出。
式(11)所示为等式(10)的矩阵形式。
ai和bi是随机设置的,则使ELM 算法输出最优解的βi可由H和T计算得到。
其中H+为H的广义逆矩阵。
采用正交映射法[19]求解可得:
再引入正则化系数α,其解如式(14)所示。
式中:I为单位矩阵。
2.2 深度极限学习机
ELM 的结构简单,学习效率较高,但在处理包含多种逻辑的数据中存在无法充分学习深层相关信息从而导致预测结果差的缺点。深度极限学习机(Deep Extreme Learning Machine,DELM)可以将深度学习与ELM 的特点相结合实现深度关系的挖掘。
DELM 是以极限学习机自编码器(Extreme Learning Machine as Autoencoder,ELM-AE)为元组成的多层次神经网络。ELM-AE 是一种特殊的ELM,其特点是输入等于输出且权重和偏置均正交化。可表示为
基于此,权重β可以由式(14)转化为
根据ELM-AE 的正交特性和特点,它可以加速神经网络的训练过程、减少传递过程中的数据损失,还可以将输入数据映射到各种维度的空间中以实现特征表达。
DELM 的每一层都相对独立,根据其逻辑特点将每层的特征信息逐层传递到高层次的稀疏矩阵中并最终提取到输入数据中包含的深层逻辑关系。图1 是DELM 模型的训练结构,第一层ELM-AE 采用原始数据求解得到输出权值矩阵β1,提取过程中,每一层的输入权重矩阵Wi都为βi的转置矩阵。此后对于DELM 的每一隐藏层,都以前一层的Hi-1作为下一层的输入矩阵,直至最后一层,最后通过式(16)来得到输出矩阵,训练完成。
图1 DELM训练结构
由上述原理可知原始DELM 中的权重采用随机初始化的方式进行初始化,而初始权重对于整个模型的预测结果影响比较大,因此需要通过IWOA 寻优算法对DELM的初始权重进行优化。
2.3 多维度IWOA-DELM模型建立步骤
短期负荷预测总体主要有以下几个步骤:
步骤1)收集数据。确定所要进行负荷预测的地区范围,采集所选区域的各时间节点的负荷值,同时以天为单位收集该区域的气象信息。
步骤2)预处理数据。由于无法保证每个数据点都是准确或者完整的,所以需要对缺失或者异常的数据提前进行处理,确保后续模型学习时的数据都合理恰当,即填补缺失数据、删除错误数据。
步骤3)选择并搭建负荷预测模型。搭建负荷预测模型并随机选择部分数据对所选模型进行预训练,观察其能否满足精度要求。
步骤4)进行负荷预测并评价模型优劣。通过大量负荷数据测试所选负荷预测模型,根据其折线图或者选定的模型评价标准来对其优劣进行评价,可将几种模型进行对比评价。
由于已经选择IWOA-DELM 短期负荷预测模型,收集数据以后,建立IWOA-DELM 负荷预测模型流程如图2所示。
图2 IWOA-DELM 负荷预测流程
IWOA-DELM负荷预测模型流程具体为:
步骤1)预处理负荷数据并将负荷数据分成训练集和测试集,归一化处理负荷以外的变量,如温度、湿度等。
步骤2)设置WOA 的参数:鲸鱼种群规模、迭代次数、变量维数、变量上、下限。以Tent 混沌映射随机初始化所有鲸鱼个体的位置,每个鲸鱼个体的位置代表DELM模型的初始输入权重。
步骤3)构建DELM 模型,利用训练集预训练DELM 并选择模型训练集的均方根误差作为目标函数计算每个鲸鱼个体的适应度值。
步骤4)排序鲸鱼个体的适应度值,找出适应度值最小的个体位置作为此次迭代的最优位置,再根据式(11)驱动鲸鱼个体改变位置,然后搜寻下一只猎物。
步骤5)重复步骤3)和步骤4),直到最大迭代次数,得到最佳初始输入权重,带入到DELM 模型中,用模型测试集进行对比验证。
2.4 数据预处理
对数据预处理的方法主要有以下三部分:
1)补充缺失数据。工程实际中某些无法避免的因素经常会导致负荷数据缺漏。由于相似日的负荷常具有一定的规律性与可推广性,可以对缺失数据取若干个相似日同一时刻的负荷的平均值补充该时刻的缺失数据,计算如式(17)所示。
式中:L(t)为t时刻缺失的负荷数据;Li(t)为相似日t时刻的负荷数据;k为相似日的天数。
2)修正错误数据。对错误(异常)数据的有两方面的评价标准,分别是某一时刻的负荷值与相邻时刻负荷值差异过大或者某一时刻的负荷值与相似日同一时刻的负荷值差异过大[20]。针对第一种情况,需通过相邻两个取样时刻点的负荷值对数据进行平滑处理,即以两点负荷值的平均值修正异常数据;针对第二种情况,需要预先判断数据的异常程度是否达到了需要修正的程度,如果某天某时刻的负荷与相邻几个相似日同一时刻的负荷平均值之差的绝对值超过了设定的阈值,此数据就被判定为异常数据。此时,若异常数据大于平均值,以平均值与阈值之和修正异常数据,反之,若异常数据小于平均值,则以平均值与阈值之差修正异常数据。
3)归一化数据。由于负荷数据与温度、湿度等气象数据量纲差别较大,在进行机器学习时,会强化或弱化各因素对负荷值变化的影响程度,因此在进行负荷预测时,需要将各影响变量统一到一个相同的数域范围内,再作为预测模型输入量进行学习和预测。采用归一化方法为
式中:Yi为样本中某一值;Y为该值归一化以后的值;Ymin为选定样本范围内最小值;Ymax为选定样本范围内最大值。
在模型训练后,为了数据的直观性,需要再对归一化后的值进行反归一化,即为
3 算例分析
为了验证所提出的IWOA-DELM短期负荷预测模型在预测精度上的优势,选取2016年第九届电工数学建模竞赛A 题中数据为算例,首先将多维度IWOADELM 模型与WOA-DELM 模型在MATLABR2020b软件中进行仿真对比。
预测结果的优劣以平均绝对百分误差(Mean Absolute Percent Error,MAPE)和均方误差(Mean Squared Error,MSE)的大小来评价。MAPE 和MSE指标数值越小,表明模型预测精确度越高。指标的具体公式为:
式中:v为样本数量;yi为负荷预测值;为负荷实际值。
算例数据包含某地2012 年1 月1 日至1 月30日,每日的最高温度、最低温度、平均温度、相对湿度以及每日整点时刻的负荷数据,共计720 个负荷数据记录点。选取前28天的672个负荷数据点作为训练集对模型进行训练,最后2 天的48 个负荷数据点作为测试集进行测试,训练集预测结果与误差如图3所示,测试集预测结果与误差如图4 所示,两种负荷预测模型的MSE与MAPE如表1所示。
图3 多维度训练集预测结果与误差
图4 多维度测试集预测结果与误差
由图3 可以看出在训练集中是否使用Tent 混沌映射优化鲸鱼算法所得到的负荷误差都相对较小,从图中无法直接判断出两种模型的预测效果。根据表1 的评价指标可以看出,IWOA-DELM 模型的MSE与MAPE 值相较WOA-DELM 模型都更低,表明IWOA-DELM 模型在训练集中预测结果更好,更加贴近真实数据。
表1 多维度负荷预测模型误差对比
由图4 可以直观看出,在测试集的预测结果中,不论是从整体还是波峰波谷来看,IWOA-DELM 模型相较WOA-DELM 模型预测结果要更加准确,表1 的误差评价指标中也反映了IWOA-DELM 模型的预测精度要远远好于WOA-DELM模型。
图5 为仅考虑历史负荷因素的IWOA-DELM 模型与WOA-DELM 模型的测试集预测曲线与误差。根据误差曲线可以直观看出,与考虑气象因素的预测模型相比,虽在第二日凌晨区间其结果会拟合的稍准确一点,但是从整体看,在负荷波动较大时的波峰波谷处预测效果却差得多。
图5 单一维度测试集预测结果与误差
表2 所示为仅考虑历史负荷因素的IWOADELM模型训练集与测试集的MSE和MAPE。
表2 单一维度负荷预测模型误差对比
从表2 误差评价指标也可以直观看出,在测试集中不论是MSE 还是MAPE,考虑气象因素的多维度的IWOA-DELM 负荷预测模型都更低,即其整体的预测效果表现更好。
4 结语
针对DELM模型预测精度低、受初始输入权重影响大等缺陷,使用引入Tent混沌映射优化的IWOA算法对DELM初始输入权重进行寻优,同时考虑温度、湿度等气象因素对负荷的影响,建立了多维度IWOADELM短期负荷预测模型。通过引入Tent混沌映射,使WOA算法初始种群的分布更合理,有效地提高了算法寻优精度和效率,大大提高了其优化的DELM模型的负荷预测表现;通过考虑气象因素对负荷的影响,提高了IWOA-DELM负荷预测模型的整体预测效果。通过实例验证了所提出的负荷预测模型相比WOADELM 预测模型和仅考虑历史负荷数据的单一维度IWOA-DELM模型的误差波动更小、预测精度更高,具有更好的应用前景,可以为电力企业进行需求侧响应或虚拟电厂的规划提供可靠的数据依据。本文局限于没有实地对负荷数据进行采集,对实际情况中某些突发情况的考虑可能不够充分,后续可以与电力企业进行对接,进行实地数据的采集与处理。