APP下载

基于图像编码与深度学习的非侵入式负荷识别方法

2021-08-20郇嘉嘉汪超群洪海峰余梦泽潘险险

科学技术与工程 2021年21期
关键词:精度负荷矩阵

郇嘉嘉,汪超群,洪海峰,隋 宇,余梦泽,潘险险

(1.广东电网有限责任公司电网规划研究中心,广州 510080;2.浙江大学电气工程学院,杭州 310007)

非侵入式负荷识别(non-intrusive load monitor-ing,NILM)是分析居民用户用电行为的主要工具,其通过安装于用户电源入口处的数据采集与通信装置,完成重要电气信息的采集、存储与分析等功能,进而实现用户内部各用电设备运行状态和能耗大小的准确感知[1-2]。相对于传统侵入式监测为每台电器设备安装分析装置,NILM无须深入用户内部即可掌握各类设备的用电情况,一方面减少了相关硬件的投资,另一方面也免去了对现有电器线路的改造及维护工作,在很大程度上保护了用户的隐私[3]。NILM在能效监测、故障诊断、负荷建模以及需求响应等领域均有大量应用[4],特别是其提供的用能信息对于用户了解自身能耗构成、引导其合理用电进而实现节能降损、减少电费开支具有重要价值[5-6]。因此,近年来NILM受到了业界的广泛关注与大力支持,相关研究工作也取得了重大进展[7-8]。

NILM的流程可分为数据采集、特征提取、模型训练以及在线识别等环节。其中,特性提取与模型训练直接影响算法的识别精度。特征提取是指利用数字信号处理技术或电路分析理论从采集的电气信号中提炼出有价值的指标,用以区分不同类别的电器设备。常用的指标包括数值特征和图像特征两类[9]。数值特征通常分为电压、电流、谐波和功率等指标,图像特征则以电压-电流(V-I)轨迹为主[10]。模型训练的作用是根据提取到的特征以及对应的设备标签,利用逻辑回归、机器学习等工具建立输入与输出之间的关联,从而驱动在线识别环节对用户负荷进行实时细分。模型训练一般有随机森林、决策树、支持向量机、k-近邻、神经网络等分类方法[11],各方法的训练和识别效果各异,除与方法自身性质有关外,主要受所采用的电气特征的影响。

文献[12]根据电流的可加性原理,建立了负荷分离模型,然后利用贝叶斯分类网络和自动寻优技术实现了负荷的在线精准辨识。文献[13]在分析各类电器设备功率、电流和谐波等特征的基础上,采用主成分分析方法对高维特征空间进行降维处理,然后与整数线性规划方法相结合,建立了考虑多特征目标函数的NILM模型。文献[14]基于离散傅里叶变换提取了电流的基波和各次谐波特征,并对比了4种负荷分类模型。计算结果验证了将谐波用于负荷分类的有效性,但是该特征仅反映负载的非线性特性,导致多状态负荷的识别效果较差[9]。文献[15]利用局部平均分解算法对采集到的混合信号进行负荷分离,并通过智能学习方法提取了独立负荷特征。考虑到传统分类方法的局限性,该文献将电流波形转化为二维图像,通过卷积神经网络的强大学习能力,有效提升了负荷辨识的准确性。相对于文献[15]采用电流特征,文献[16]则将电压和电流采样数据绘制为二维V-I轨迹,然后采用归一化方法将其映射为二值灰色图像。虽然二值图像所蕴含的电气信息更加全面,但是低分辨率图像和归一化处理方式仍不可避免地会丢失大量有用信息,特别是传统浅层学习方法无法充分挖掘图像的高级特征,因此其负荷识别的准确率仍有进一步提升的空间。

区别于以上特征提取和辨识方法,现提出一种基于图像编码与深度学习的非侵入式负荷识别方法。该方法将数值特征与图像特征相结合,利用深度学习在图像识别领域的突出优势,尽可能挖掘电气信号中蕴含的重要信息。主要做法是:首先在灰色V-I图像的基础上,利用双线性插值实现V-I像素点的连续,并采用图像编码技术分别构造电流(R)、电压(G)和相位(B)3个通道,从而形成像素连续的彩色V-I图像。然后,采用AlexNet算法[17]对彩色V-I图像进行深度学习,通过多层卷积、池化等操作逐层提取V-I图像的高级抽象信息,进一步提高负荷识别的准确率。最后,采用PLAID公共数据集对所提方法进行有效性测试。

1 像素点连续的V-I彩色图像编码

V-I轨迹是指稳态周期内由一系列电压、电流采样点绘制而成的二维图像。对于大多数不同工作原理的电器设备,V-I轨迹呈现的形状存在较大的差异,因此可从中提取各种形状参数(例如面积、曲率、自相交点数量、循环方向等)并将其作为区分不同类别电器设备的依据。由于形状参数的提取难度较大,且降维后的参数无法全面反映其原始信息,鉴于此,文献[16]通过网格化的方法在尽可能保留形状信息的同时将V-I轨迹映射为二值灰色图像,利用该图像直接进行负荷识别。相比提取形状参数,构造二值灰色图像的过程更简单,同时对原始信息的保留程度更高,因而负荷识别的准确率也得到了进一步提升。

1.1 连续V-I图像映射方法

考虑到V-I图像在映射过程中可能出现像素点间断的现象,不利于进行后续训练和识别。为此,采用双线性插值技术对传统映射方法进行了改进,具体流程如下。

(1)利用电流钳、电压探针以及高频示波器组成的采样系统对某台电器设备的电压、电流波形进行高频采样,得到稳态运行周期内M个电压-电流采样点(vm,im),m=1,2,…,M。

(2)给定网格或图像的分辨率为N×N,若将所有样本点映射到网格中,那么每个单元格(像素点)的尺寸为

(1)

式(1)中:imin、imax分别为电流采样值的最小和最大值;vmin、vmax分别为电压采样值的最小和最大值;Δi、Δv为每个单元格(像素点)的尺寸。

(3)根据式(2)计算映射后相邻两个采样点之间的距离Dm(m=1,2,…,M)。若Dm>1,表明两点之间的距离大于单元格的长度或宽度,即出现不连续的现象。此时需要进行插值以补全两点之间的间隔。为简便起见,采用双线性插值技术实现间断点的填充,具体见式(3)、式(4)。填充后新的样本点集合记为(vj,ij),j=1,2,…,J。

(2)

(3)

(4)

式中:Km=⎣Dm」为第m和(m+1)个采样点之间需补充的插值点个数,⎣」表示向下取整;(v′m+k,i′m+k)为填充的第k个插值点,k=1,2,…,Km。

(4)根据式(5)计算样本点(vj,ij)的映射坐标,即

(5)

(5)构造维度为N×N的零矩阵,然后从第一个样本点开始逐一取出所有点的坐标,并将矩阵中第rj行第cj列元素置1,直至最后一个样本点。所得到的矩阵即为像素点连续的坐标矩阵。

依据上述方法,可得到某台荧光灯设备的灰色V-I图像如图1所示,图像分辨率为32×32。可以看到,采用传统映射方法得到的V-I图像出现了像素点不连续的现象,而采用本文方法得到的图像则不存在这一问题。该结果说明了上述图像构造方法的有效性。

图1 某荧光灯的二值V-I灰色图像

1.2 彩色V-I图像的编码方法

分析1.1节可知,各类电器设备在形成V-I图像的过程中均对电压和电流信号进行了归一化处理[式(1)],且每个像素点仅用0或1两种状态表示。这种处理方式导致所形成的V-I图像仅保留了电压-电流信号的形状特征,无法体现设备之间的数值差异,尤其是设备的平均电流、电压、功率以及相位等数值特征根本无从体现。例如洗衣机、空调的平均电流较大,而白炽灯、计算机等设备的平均电流较小。当采用归一化和映射处理后,所有设备的电流值均为0或1。显然,灰色V-I图像丢失了大量有价值信息,仅依靠其进行负荷识别难以大幅提高识别的精度。因此,有必要将灰色V-I图像与数值特征相结合,利用两者之间的互补性,增强算法的识别能力。

如前所述,灰色V-I图像是一个单通道的二维像素矩阵。矩阵中每个点为0或1,分别代表该点是否有V-I轨迹经过,而有关轨迹的大小和方向等信息则无法体现。相比之下,对于一张彩色图像,如图2所示,它由电流(R)、电压(G)、相位(B)3个通道叠加而成,每个通道对应一个二维矩阵,矩阵中每个元素可在0~1连续变化。可见,彩色图像蕴含的信息远比灰色图像更加丰富。若能结合V-I轨迹的形状特征同时将数值信息嵌入RGB通道中,那么就可以将灰色V-I图像转化为对应的彩色图像。利用该图像进行分类,无疑会提升整个算法的识别精度。

彩色图像编码的核心在于R、G、B矩阵的形成。主要将电流、电压(功率)以及相位等数值特征嵌入到对应的通道中,从而形成彩色V-I图像。

(1)初始化N×N维的A、R、G、B零矩阵。

(2)根据(vj,ij)和式(5)统计每个坐标点出现的次数A(rj,cj)。

(3)构造电流R矩阵。逐一取出样本点(vj,ij),按式(6)计算R矩阵中的元素。计算完成后,按式(7)求每个坐标点的平均值。

R(rj,cj)=R(rj,cj)+f(ij)

(6)

R(rj,cj)=R(rj,cj)/A(rj,cj)

(7)

式中:f(ij)=1/(1+e2ij),该式用于对电流信号进行缩放,以保证元素在0~1连续变化。缩放后,不同设备之间的电流差异仍能得以保持,同时避免了因部分设备电流过大而导致其他设备电流信息被淹没的情况出现。

(4)构造电压G矩阵。逐一取出样本点(vj,ij),按式(8)计算G矩阵中的元素。计算完成后,按式(9)求每个坐标点的平均值。

G(rj,cj)=G(rj,cj)+vj/V

(8)

G(rj,cj)=G(rj,cj)/A(rj,cj)

(9)

同样,V为所有设备电压最大与最小值之差取最大。若采用功率特征,则vj和V分别替换为功率pj和P。其中,pj由pj=vjij计算得到,P为所有设备功率的最大值。

(5)构造相位B矩阵。逐一取出样本点(vj,ij),按式(10)、式(11)计算B矩阵中的元素。计算完成后,按式(12)求出每个坐标点的平均值。

B(rj,cj)=B(rj,cj)+θj/2π

(10)

(11)

B(rj,cj)=B(rj,cj)/A(rj,cj)

(12)

式中:θj为相邻点间相位差;δj=arctan(Δvj/Δij),Δvj=vj+1-vj,Δij=ij+1-ij,δj∈[-π/2,π/2]。

求得R、G、B矩阵后,将三者叠加即可得到彩色V-I图像。依据上述方法,对图1中荧光灯设备各通道矩阵进行构造,结果如图2所示。图2中,各通道像素点明暗不一致反映了该点所代表数值(电流、电压、相位)的大小和差异。正是由于这种差异,合成后的彩色图像可以蕴含更多信息。为进一步说明该问题,绘制了PLAID数据集中随机选取的11类电器设备的彩色V-I图像,如图3所示。可见,虽然图中大部分设备的V-I形状不同,但仍有少数设备相似,例如空调、电风扇、吹风机以及白炽灯的V-I形状较为接近。仔细观察可以发现,上述4类设备V-I图像的颜色分布存在较为明显的差异。这是因为四类设备的平均电流、相位等数值特征不一致,导致对应图像存在色差。

图2 某荧光灯各通道V-I图像及合成后的彩色图像

图3 各类电器设备的彩色V-I轨迹图像

2 基于改进AlexNet的负荷识别方法

2.1 算法改进

近年来,随着机器学习的快速发展,图像识别领域涌现出了一系列性能优异的算法。特别是在2012年,由Alex开发的卷积神经网络算法AlexNet一举夺得ImageNet大规模视觉识别挑战赛冠军,这一事件标志着图像识别领域取得了重大突破。

AlexNet是一类大型、多层卷积神经网络算法,其基本结构如表1所示。该算法大约有6 000万个参数和65万个神经元,共分8层,其中前5层为卷积层,后3层为全连接层。在Cifar10、MNIST、ImageNet等数据集上,AlexNet均有不俗的表现,尤其是在MNIST手写数字识别中,分类准确率达到了99.9%以上。AlexNet出色的性能一方面得益于其通过卷积、池化操作逐层捕获图像中的细节特征,另一方面则归功于其应用了Dropout、LRN以及最大池化等创新技术。

表1 AlexNet算法结构

利用AlexNet算法对V-I图像进行训练识别。不同于原始算法结构,基于AlexNet的负荷识别需要从两个方面加以改进:一方面,本文负荷识别的分类数为11,即对11类家电设备进行分类,因此需要将表1中输出神经元个数由原来的1 000改为11,以适应训练集和测试集的输出维度;另一方面,AlexNet默认的输入图像维数为224×224,而所构造的彩色V-I图像像素为N×N。当N不等于224时,需要对V-I图像的大小进行缩放,以匹配其输入维度。此外,虽然AlexNet最初被设计用于识别ImageNet数据集,但是其学习到的高级抽象特征仍可以用于辅助识别不同类型设备的V-I轨迹。故此,采用迁移学习的方法将预先训练好的网络参数进行复用,以加快算法的收敛速度。改进后的负荷识别算法结构如图4所示。

图4 改进AlexNet负荷识别方法

2.2 训练方法

选取交叉熵函数为最小损失函数,优化方法为自适应矩估计,学习速率取1.0×10-3,丢弃率为0.2,批次数量为100。具体训练步骤如下。

(1)加载预训练AlexNet模型,并根据负荷分类数,重新配置其输出神经元个数。

(2)根据第1节中方法,构造V-I彩色图像数据集,同时采用最近邻方法调整图像尺寸,将数据集划分为测试集和训练集。

(3)将训练集送入AlexNet模型中,以电器类别为标签进行有监督的学习,直至满足终止条件。

(4)训练完成后,利用测试集对算法的识别能力进行有效性检验。

3 算例测试及分析

3.1 算例说明

采用PLAID公共数据集对所提负荷识别算法进行测试。该数据集由55户家庭的11类共235台电器设备的电压、电流运行采样数据组成,采样频率为30 kHz,总样本数为1 074组。考虑到PLAID数据集中各类电器设备的样本数相差较大,容易导致部分设备的识别效果较差。为此,采用人工少数类过采样法(synthetic minority over-sampling technique,SMOTE)对少数类样本进行合成扩充,扩充后的样本数为1 925。随机选取其中220个样本(每类设备20个样本)组成测试集,剩余1 705个样本作为训练集。训练的环境为IBM 64位兼容机,内存8.0 GB,CPU为Intel Core i7-7700,主频2.80 GHz。

为评价算法的识别能力,定义了负荷识别准确率(精度)指标ε。该指标表示分类正确的样本数与总测试样本数之比,即

(13)

式(13)中:ntrue为分类正确数;ntest为总样本数。

3.2 参数优选

为获得负荷识别算法的最佳参数,以训练时长和识别准确率为衡量标准,通过纵向对比的方法对算法的训练次数和V-I图像的像素进行了优选。当分析其中一项参数对识别结果的影响时,将另一项参数固定。

为定量分析训练次数对算法性能的影响,绘制了某次测试过程中识别精度和损失值随训练次数的变化曲线,如图5所示。整个测试用时约12.5 h,迭代次数为300次。可以看到,在计算初期,随着训练次数增加,损失函数值不断减小,测试集的识别精度也随之快速增加。当训练次数达到30次左右,识别精度即已超过90%,并在后续训练中开始缓慢增加;当训练次数达到200次,无论是损失函数还是测试集的精度均趋于稳定,算法的分类性能将不再发生大的变化。基于上述分析,将训练次数设置为200次,即可在相对短的时间内获得较为满意的识别效果。

图5 训练次数对算法性能的影响

不同分辨率下负荷识别精度盒须图如图6所示。由图6可以直观地展示负荷识别精度的统计信息,因此能够客观地评价所提算法的分类性能。盒须图由“盒”与“须”组成,盒中的横线表示中位数,其上下边界分别表示75%和25%的值。两条须线分别代表最大和最小值,离群的点则单独绘制,用“+”表示。

图6 不同分辨率下的负荷识别精度

分析图6可知,当彩色V-I图像的分辨率由32增加至128时,负荷识别的精度从95.5%增加到97.7%,而随着图像分辨率进一步增加,负荷识别的精度却随之下降,甚至低于分辨率很小时的精度。这是因为在一定范围内图像分辨率越高,其所蕴含的信息越丰富,较大分辨率相比较小分辨率可以获得更高的识别精度。但是过高的图像分辨率也会增加随机噪声和扰动的影响,从而淹没有价值信息,致使负荷识别精度不增反降。鉴于此,将V-I图像的分辨率N设置为128。

3.3 结果分析与比较

相对以往使用灰色V-I图像进行负荷识别,提出了基于彩色V-I图像的负荷辨识方法。为说明其优势,对比了这两种测试场景的识别结果,并将其绘制成了混淆矩阵,具体如图7所示。图7中,设备标签1~11分别对应空调、荧光灯、电风扇、冰箱、吹风机、加热器、白炽灯、计算机、微波炉、吸尘器以及洗衣机11类常用家电设备。矩阵中的元素代表设备的数量,横坐标表示设备的预测类别标签,纵坐标表示设备的真实类别标签。混淆矩阵的每一行之和表示测试集中相应设备的样本数,每一列之和表示被预测为该类设备的样本数,对角元则表示被正确识别的样本数。

图7 不同特征方案下的混淆矩阵

由图7可知,使用灰色V-I图像识别时的准确率为89.1%,而使用彩色V-I图像识别时的准确率则高达97.7%。对比这两种场景不难得到,空调、电风扇、吹风机、加热器以及白炽灯的错误分类数高是导致灰色V-I图像识别准确率低的直接原因。而结合图3可以进一步发现,上述5类设备的V-I轨迹形状(即灰色V-I图像)相似是产生该现象的根本原因。相较而言,使用彩色V-I图像识别时,由于图像不仅包含了V-I轨迹的形状信息,而且还嵌入了电流、电压、相位等数值信息,因此可以从多个指标维度对V-I形状相似的设备进行更加细致的区分,从而在极大程度上避免了错误分类事件的发生。以上结果对比,有力证明了基于彩色图像编码的负荷识别方法可以充分利用多特征互补的优势,有效克服单一形状特征无法全面反映设备自身属性的缺点,对于提高负荷识别的准确率具有重要作用。

负荷识别的精度与算法的自身性质有关。选取了6种常见负荷分类算法,并与本文方法进行对比,结果如图8所示。图8中,KNN、GNB、LR、SVM、DT、RF分别为k-近邻、贝叶斯、逻辑回归、支持向量机、决策树和随机森林算法,所有算法均采用128×128像素的彩色V-I图像作为负荷分类的依据。可以看到,AlexNet算法的识别精度最高,其次是LF和KNN算法。DT、GNB和RF算法的精度相对较低。SVM在所有分类算法中识别精度最低,其精度不足40%。以上7种算法的识别精度对比验证了AlexNet在负荷分类中的有效性。

图8 不同分类算法的负荷识别精度

为进一步说明本文方法的优势,将设备分类结果与其他文献中的结果进行比较,具体如表2所示。其中,文献[18]以奇次谐波为特征进行负荷分类,所采用的算法为多层感知机模型;文献[19]基于随机森林算法,利用缩减后的有效特征集实现用能监测;文献[20]将暂态与稳态特征相结合,提出了PCA分类辨识算法;文献[9]融合了功率与V-I图像特征,并成功构建了Softmax分类网络。由表2可知,除本文方法外,其余文献对于空调、风扇以及冰箱等设备的识别精度均较低。其原因在于上述三类设备可以在多种工作模式之间切换,导致其电气特性复杂,进而增加了负荷识别的难度。考虑到文献[18]仅依靠谐波特性进行分类,未能利用其他特征辅助识别,因而其识别精度最差。不同于使用单一特征识别,文献[9,19-20]分别提出了多特征融合的负荷识别方案,提高了算法的识别精度。相比以上文献,本文方法从特征提取和模型训练两方面加以改进,利用彩色图像编码与深度学习技术实现多维、高级特征的提取与融合,显著增强了算法的辨识能力,因此本文方法的负荷识别效果优于其他4种方法。

表2 不同文献的设备识别精度

3 结论

提出了一种基于图像编码与深度学习的电力负荷智能感知方法。该方法采用双线性插值技术实现了V-I像素点的连续,同时结合多特征互补的优势,将电流、电压、相位等数值特征以不同通道的形式嵌入灰色V-I轨迹中,从而形成了高分辨率的彩色V-I图像。此外,所提方法借助AlexNet图像识别技术,通过卷积、池化等操作对彩色V-I图像进行了高级特征提取。

采用PLAID数据集对本文方法进行了测试。通过测试,优选了负荷识别算法的结构参数,分析了灰色与彩色V-I图像对识别结果的影响,并进一步对比了本文方法与其他方法的优劣。测试结果表明,相对于传统负荷识别方法,基于图像编码与深度学习的负荷识别可以将形状特征与数值特征以不同通道在高维空间进行深度融合,从而更加全面、立体地揭示了各类电器设备的本质属性,并最终实现了负荷识别精度的大幅提升。

猜你喜欢

精度负荷矩阵
基于DSPIC33F微处理器的采集精度的提高
初等行变换与初等列变换并用求逆矩阵
防止过负荷时距离保护误动新判据
主动降负荷才是正经事
GPS/GLONASS/BDS组合PPP精度分析
负荷跟踪运行下反应堆一回路控制系统仿真与验证
矩阵
矩阵
矩阵
改进的Goldschmidt双精度浮点除法器