基于CNN-GAN与半监督回归的电动汽车充电负荷预测
2023-03-09闫威李南沈月秀施力欣胡滨周舟
闫威,李南,沈月秀,施力欣,胡滨,周舟
(国网浙江省电力有限公司嘉兴供电公司,浙江 嘉兴 314000)
0 引言
随着石油、煤炭等资源的大量消耗,生态环境所受到的负面影响日益严重。在美国,三分之一的温室气体排放来自交通运输[1],为减少温室气体排放,大多数国家开始注意到电动汽车这一绿色交通工具。电动汽车与电网之间的联系也愈加紧密。由于电动汽车用户充电行为的随机性以及电动汽车充电功率的波动性,电动汽车充电行为对电力系统安全稳定运行提出了重要挑战[2]。而可靠的电动汽车充电负荷预测技术可以帮助电力系统调度中心有效应对电动汽车随机充电所带来的影响。因此,研究可靠稳定的电动汽车充电负荷预测技术具有重要意义。
另一方面,由于电动汽车用户的习惯需求不同,电动汽车的充电行为也会出现一定的差异。不同的电动汽车充电行为以及驾驶规律会对电动汽车日充电负荷产生很大的影响。因此,对不同电动汽车用户的不同充电行为进行聚类分析,可以建立更有针对性的电动汽车充电模型,便于提取典型用户。由此可见,合理的电动汽车用户聚类分析工作可以提高对于不同用户群体的特征分析水平,有利于更好地搭建不同群体的充电负荷模型。
目前,许多学者已经在电动汽车充电负荷预测和电动汽车用户聚类分析领域取得了很大的进展。文献[3]提出了一种基于随机森林算法的模型,用于充电站电动汽车充电负荷预测。文献[4]展示了一种考虑用户后悔心理影响的充电负荷预测方法。文献[5]提出了一种基于出行起讫点矩阵、考虑时空分布的电动汽车负荷预测方法,由于采用蒙特卡洛法建立负荷预测模型,如参数选择不合适,会出现误差过大从而降低预测准确度的情况。文献[6-7]考虑气象等多种因素对于充电负荷变化的影响。文献[8-9]采用Bass模型,考虑汽车保有量、季节特性等因素进行电动汽车充电负荷预测,而Bass 模型通常用于中长期充电负荷预测,在短期、日前预测中表现并不突出。近年来,机器学习领域发展迅速,各种机器学习方法被应用到各类功率、流量、负荷预测中。同时,部分学者使用机器学习方法搭建电动汽车负荷预测模型,取得了一定的成果。文献[10]提出了基于图WaveNet 的模型,考虑电动汽车充电桩节点信息进行电动汽车充电负荷预测。文献[11]搭建LS-SVM(最小二乘支持向量机)、LSTM(长短期记忆)网络进行充电负荷预测。文献[12]中利用谱聚类对电动汽车负荷曲线进行聚类,针对每一组曲线进行对应预测。但上述模型在面对复杂信息时难以挖掘分析数据之间的深层关系,并且网络中参数较多,训练网络模型时待优化参数过多,使得训练时间过长。
目前,GAN(生成对抗网络)是机器学习领域新兴的的神经网络算法,GAN可有效捕捉输入信息之间的深层联系,面对复杂信息的输入时,拥有较强的特征分析能力。文献[13]中使用GAN实现压缩采样马赛克图像的颜色恢复。文献[14]搭建了用于股票价格信息预测的GAN 模型。文献[15]提出了一种轻量级actor-critic 的生成对抗网络,将GAN 模型与actor-critic 相连,使得GAN有着更好的动态性能以及在线学习能力,提高微电网的鲁棒性与适应性。
GAN 已经在其他领域取得了大量的应用成果,但是在电动汽车充电负荷预测领域的研究并不深入。因此,考虑到充电负荷受到用户群体充电习惯差异、气象信息、历史负荷等因素的影响,建立了基于CNN-GAN(卷积神经网络-生成对抗网络)的电动汽车充电负荷预测模型,通过对比多种机器学习算法,验证本文所提出方法的可行性。
1 GAN
GAN是由生成模型G与判别模型D组成的神经网络模型[16]。其中,生成模型目标是分析真实样本的深层分布信息,模拟真实样本的详细分布,制造与真实样本极其相似的虚拟样本;判别模型的目标是能够准确识别输入样本是虚拟样本或真实样本,并输出对应结果。GAN结构如图1所示。
图1 GAN结构Fig.1 GAN structure
生成模型和判别模型通过最大、最小博弈,在更新优化过程中,对生成模型和判别模型分别进行更新,最终达到纳什均衡状态。由于当输入数据是x或G(z)时,判别模型的最后结果只能为1或0,所以判别模型基于交叉熵的损失函数如式(1)所示:
式中:E为期望函数;log为自然对数。
生成模型目标为生成能过“骗过”判别模型的虚拟样本,因此其损失函数如式(2)所示:
生成模型与判别模型持续进行最大最小博弈,不断提高对应的生成能力或判别能力,直到完成更新优化练过程,因此GAN基于交叉熵的损失函数为:
2 基于CNN-GAN 的电动汽车负荷预测模型
基于CNN-GAN 的电动汽车负荷预测流程如图2所示,主要包括GMM(高斯混合模型)聚类分析、数据集构建、GAN更新训练过程。
至于太阳中为何为会有“鸡”呢?自宋代以来,更有不少学者曾试图为其寻找可能的说解与答案。如在《云笈七籖》卷五十六《诸家气法》中说:
图2 预测流程Fig.2 Prediction flow
GMM聚类分析是针对大量电动汽车充电样本进行聚类分析。数据集构建过程依据GMM 聚类分析结果,针对每一组进行对应数据预处理,选择多种对于充电负荷预测影响较大的元素,确定输入数据形式以及训练样本与测试样本个数。在GAN更新训练过程中,由完成数据预处理的训练样本作为真实样本,将一组随机高斯噪声向量作为生成模型初始输入;生成模型将生成虚拟样本与真实样本共同送入判别模型,判别模型输出判别结果,通过半监督回归得到预测值;根据各模型的损失函数计算各层网络误差,反向传递误差,顺序更新D与G,最终获得各参数最优权重。
完成训练后,使用各组对应GAN预测模型进行预测,并与其他方法进行对比。在对比验证环节,各对比方法使用相同的测试样本数据集,采用百分比偏差λMAPE与均方根误差λRMSE两项指标评价各方法准确性。
2.1 GMM聚类分析
电动汽车充电负荷的时间分布主要由充电电量、充电速度和充电时间3个方面决定。因此,选取上述3种因素作为GMM聚类分析的特征向量。
GMM由多个高斯分布函数线性组合[17]。其基本形式如式(4)所示:
式中:u代表三维特征向量;λ代表GMM 模型参数,包括均值、协方差、权重;K代表子高斯分布个数;Ck为第k个模型概率,ϕ(x|λk)为第k个子模型高斯分布密度函数。
通过EM(期望最大化)算法计算得到各项参数,该算法分为E和M两个步骤。
在E 步骤中依据当前参数计算第j个数据uj来自于模型k的概率rjk,即:
在M 步骤,计算新一轮迭代参数,包括更新均值、协方差矩阵和权重系数,可分别表示为:
式中:N为样本数量。重复E 步骤与M 步骤,直到│λi+1-λi│<ε,结束迭代。
完成GMM聚类分析后得到3组聚类结果,根据不同的用户标签,分别计算第一、二、三组的日充电负荷;重复计算得到多周的各组充电负荷日数据。
2.2 数据集构建
根据聚类结果,构建每组数据集。多数用户的出行存在一些周期性规律,同时与气温、降雨量等气象因素密切相关。因此,为了提取用户出行规律与预测日充电负荷的内在关系,选择气温、降雨量、湿度、历史负荷等信息作为输入数据,如表1所示。
表1 输入数据构成Table 1 Input data composition
表中预测日日期周一至周五设置为0.2~0.6,周六、周日为2.2 与2.7,可以更好区分工作日与非工作日。
2.3 GAN模型结构
传统的深度学习模型由于网络架构较为复杂,导致网络待训练参数过多,出现优化时间较长甚至网络崩溃的问题。CNN 拥有较强的特征提取能力,共享卷积核以及权值共享技术,很大程度上减少了待训练参数的个数,因此采用CNN搭建生成模型与判别模型,可以提高GAN模型的特征提取能力以及面对陌生样本时的泛化能力,提高模型训练效率及充电负荷的预测准确性。
2.3.1 生成模型
生成模型目标为学习模拟x的深层特征信息,提高自身的模拟能力,使得其生成的虚拟样本G(z)可以混淆判别模型的识别,因此使用反卷积层搭建生成模型,便于放大样本的真实分布。同时考虑到二维卷积模型在面对大量样本时,抗噪能力优于一维卷积模型,因此采用全连接层以及重组层将输入数据转换为二维数据,然后利用多个反卷积层以及ReLU(线性整流函数层)[18]提取深层特征信息,增强虚拟样本的真实性,最后通过全连接层以及tanh 函数激活转换为虚拟样本的输出规格,获得虚拟样本。生成模型的具体结构如图3所示。
图3 生成模型结构Fig.3 Structure of the generative model
本文生成模型的目标为模拟真实输入样本,生成与真实样本相似的虚拟样本,因此,生成模型的损失函数如式(9)所示:
式中:f(·)为判别模型中间层对应输出。生成模型将通过不断优化减小LG使得虚拟样本与真实样本差别不断缩小。
2.3.2 判别模型
判别模型同样采用CNN进行搭建,由于判别模型主要进行特征提取的工作,方便判别模型识别x与G(z)之间的差别,增强其对于输入样本的识别能力,因此在网络结构中采用卷积层进行搭建,如图4所示。首先,将输入的虚拟样本与真实样本通过全连接层与重组层转换为二维数据,便于二维CNN计算;然后通过多个卷积层,池化进行卷积计算,提取样本关键特征信息;最后通过全连接层输出判别模型结果,通过半监督回归输出充电负荷预测值。
图4 判别模型结构Fig.4 Structure of the discriminative model
在判别模型中,输出分为两部分,第一部分为传统判别模型输出,其损失函数表示为Lunsup;第二部分为半监督回归输出,损失函数表示为Lsup;则总损失函数LD表示如下:
2.3.3 更新训练
本文GAN 预测模型通过Adam 交替更新训练D与G,其中学习率设定为0.01,迭代次数设置为50,训练步骤如下:
1)一组噪声向量输入至生成模型,得到一组虚拟样本。
2)将虚拟样本及其对应的真实样本送入GAN判别模型,利用半监督回归得到充电负荷预测结果。
3)通过式(12)与链式法则计算判别模型中各层的误差,判别模型的参数将通过Adam算法进行更新。
4)将判别模型的预测误差反向传回至生成模型,计算G各层误差,更新生成模型的各层网络参数。
5)进行下一批训练样本,并重复步骤1—4,直到所有电动汽车充电负荷训练样本遍历一次。
6)当完成预设的迭代次数时,可以结束模型的训练更新。否则,再次重复步骤1—5,更新训练GAN模型,结构如图5所示。
图5 训练结构Fig.5 Training structure
3 结果评价与分析
3.1 评价指标
本文采用平均百分比偏差λMAPE与均方根误差λRMSE两项评价指标评价各方法预测效果,具体形式如下:
式中:与分别为i时刻充电负荷预测值与真实值。
3.2 结果分析
为验证本文所提出的CNN-GAN 预测模型的可行性,采用华东某地8 周的电动汽车充电样本,将其分为两部分,其中前6周电动汽车样本作为训练样本,用于训练CNN-GAN 预测模型,后2 周电动汽车样本作为测试样本,测试模型预测效果。首先通过GMM聚类分析,得到3组聚类结果,构建数据集。针对每1组用户,将对应数据集送入各方法预测模型,各方法预测模型所输入的训练样本集与测试样本集完全相同。其中,负荷数据的时间步长为15 min,即每日可分为96 个时刻,采用本文所提出的预测方法与ANN(人工神经网络)、SVM(支持向量机)和ELM(极限学习机)3种预测方法进行对比,各组预测结果如图6—8所示。
图6 第一组预测结果Fig.6 The first set of prediction results
图7 第二组预测结果Fig.7 The second set of prediction results
图8 第三组预测结果Fig.8 The third set of prediction results
由图6—8 可以看出,第一组与第三组用户充电时间主要集中在白天,夜间存在少部分用户,其中,第一组用户充电负荷峰值出现在12:00 左右,充电负荷峰值较大,同时,该组用户快充比例较大,充电时间较短并且主要集中于午间;第三组用户充电负荷峰值出现在2:00 左右,相比第一组用户,该组慢充用户比例略有上升,充电时间主要集中于下午,夜间存在部分用户;第二组用户充电负荷变化趋势与其他两组相反,在白天出现低谷,该组用户更倾向于长时间慢充,充电时间多集中于夜间。在预测效果方面,由图6可以看到,第一组黑色区域中,ELM方法出现了较为明显的偏差,同时ANN 方法相比SVM 与CNNGAN方法也存在较大的偏差。在第二组预测效果方面,图7 中黑圈范围内ANN 方法存在较大的预测波动,SVM方法预测波动较为频繁,而本文所提出的CNN-GAN 方法与实际充电负荷曲线较为贴近,实际负荷偏差较小。在第三组中,由于样本数量较少,导致各方法预测精度出现一定的下降,但CNN-GAN 方法相比其他方法与真实曲线更为贴近。
表2为各项指标的对比,可以发现,本文所提出方法的λMAPE、λRMSE明显优于其他预测方法。各组用户群体预测中CNN-GAN模型的λMAPE分别为3.69%、3.41%、4.34%,对比ELM 方法的λMAPE最大提升7.7%,λRMSE也低于其他3 种预测方法,由此可见,CNN-GAN 预测方法的精度高于其他方法。
4 结语
本文考虑电动汽车用户的充电习惯对于充电负荷的影响,采用GMM 对电动汽车充电样本进行聚类分析,分析不同电动汽车用户群体之间的充电行为差异区别,提取典型用户行为特征;针对各组用户群体建立基于CNN-GAN 与半监督回归的模型进行电动汽车充电负荷预测,该模型以天气因素及历史负荷数据为输入,经过生成模型与判别模型的对抗训练,最终通过半监督回归输出预测结果,提高了预测准确率。在结果分析中,本文对比了多种方法在各组用户群体充电负荷预测的结果,证明了本文提出的方法在预测精度上的优势。电动汽车负荷影响因素较多,本文用户数据样本仅考虑了充电电量,充电速度以及充电时间3个主要因素的影响,后续工作将针对用户不同的驾驶需求进行分析研究。