基于孪生分支网络的非侵入式冲击负荷辨识方法
2022-11-23宋磊徐永进刁瑞朋李亦龙陆春光王思奎
宋磊,徐永进,刁瑞朋,李亦龙,陆春光,王思奎
(1.国网浙江省电力有限公司营销服务中心,杭州311121; 2.青岛鼎信通讯股份有限公司,山东 青岛 266000)
0 引 言
冲击负荷是较大功率设备在启动或者工作过程中功率峰值变化为正常运行时几倍甚至几十倍的负荷,具有非线性、动态时变性、波动频繁性等特点。冲击负荷对电力系统的影响不容忽视,它不仅会引起电力系统频率的连续震荡,威胁电网安全运行,而且会破坏电力设备的稳定性。在边缘测对大型用电企业不同冲击负荷设备的启停规律进行研究、识别与统计,结合大数据技术,可以为电力负荷预测、电力系统运行分析、电网规划和检修计划安排提供定量化的理论依据。
目前许多学者对冲击负荷的特性加以研究分析,并提出了多种冲击负荷建模方法,旨在推动对冲击负荷的检测识别及其功率特性的分析和掌握。文献[1]提出使用最小二乘支持向量机对冲击负荷进行建模分析,并使用粒子群优化算法进行模型参数辨识。文献[2]提出使用区域控制偏差滤波的方法对冲击负荷进行建模与识别。文献[3]基于小波能量熵和自组织竞争性神经网络冲击负荷的特征提取和分类训练,实现了冲击负荷电压暂降源的识别。
以上方法主要对冲击负荷的特性进行了研究与建模,但鉴于冲击负荷的产生具有随机性,产生时刻和强度的大小无法实现准确识别,给模型的应用带来了困难。而且传统的冲击负荷监测需要在每个负载上面加装监测装置,在设备投切的时候通过人工等方式将信息发送到控制中心。此方式虽然简单方便,但在大量负载上都加装监测装置需要巨大的人力与物力,并不现实。
非侵入负荷监测是最新的智能电网高级量测技术,此类方法只采样用户总进线处的电压和电流,通过智能算法来分解辨识电器的工作序列,具有不需要入户施工、建设和维护成本低等显著优点。该技术的核心是非侵入式识别算法。文献[4]提出应用最优方法求取一组合理的权重系数,使负荷估计电流与负荷真实电流最为接近,从而确定电力负荷中不同类型用电设备的功率消耗比例。文献[5]提出了通过微分进化算法求解不相容线性代数方程组形式的估计方程与相应的目标函数,以非侵入式的方式对电力负荷分解与监测,但这两种方法一般针对家用电器识别,并没有针对冲击负荷进行识别研究。文献[6]通过加权CUSUM双边变点检测算法和基于S变换提取特征量的SVM自动分类算法结合进行冲击负荷的监测识别,但识别率不高且无法实现有效的负荷功率分解。
上述所提算法均为在电脑端进行仿真,没有实际部署与测试。针对以上问题,文章引入人工神经网络理论,提出了一种基于孪生分支网络的非侵入式冲击负荷辨识方法。首先通过提取不同类别设备的冲击负荷数据的V-I轨迹特征和定制化的对角高斯谐波特征进行网络预训练;其次设计一种基于孪生分支结构的卷积神经网络模型,同时引入功率先验信息进行网络训练;最后使用非侵入式的方式,在嵌入式平台上对模型进行了部署,并对不同冲击负荷设备辨识准确度进行了对比验证。
1 冲击负荷及其辨识
1.1 典型冲击负荷设备
冲击负荷设备按规模可以分为三类,分别为大型、中型和单一型[7]。大型非线性负荷包括高铁、铁路牵引变电站和光伏发电厂等;中型包括电动汽车充电站、轧钢机、电弧炉和中频炉等;单一型包括矿热机、CT机和强流试验站等[8]。
文章从三类冲击负荷设备中选取常见的四种作为典型负荷进行研究,使用录波设备在现场采集变比后的高频数据,分析其功率、电压、电流变化,在此基础上提取其高级特征并输入到所设计的卷积神经网络中进行离线训练,最后在嵌入式端进行部署和测试识别效果。
以中频炉为例,中频炉是一种中频无芯感应炉,其将三相工频交流电进行整流,再通过逆变电路输出为单相的中频交流电作为电源,由于整流设备的影响,中频炉启动运行时会产生大量谐波,电压电流和功率显示出冲击特性,常见的轧钢机在变压器低压侧电压一般为0.4 kV ~0.9 kV,主要设备采用直流电机拖动,由三相交流整流后供电,整流后的直流电同样存在脉动并在交流测产生谐波。电弧炉是一个非线性随机负载,电弧炉精炼期工作时,电弧工作状态相对比较稳定,其谐波主要以奇次谐波为主[9]。CT机是典型的大功率医用设备,当对医院病人使用大型CT机X射线扫描穿透时,设备投切产生大功率突变电流。以上设备的运行电流波形变化特点和谐波特性如图1所示。
图1 典型冲击负荷波形特性
1.2 冲击负荷辨识流程
基于V-I轨迹特征和电流频谱特征的孪生分支网络整体负荷辨识流程示意图如图2所示。
图2 基于孪生分支网络的冲击负荷辨识流程
典型设备的冲击负荷特性分为冲击特性和负荷特性。冲击特性为设备启动后短时间达到峰值功率的过程,负荷特性为设备从冲击时刻达到稳定运行的电压电流特性。文中所提算法可在检测到冲击特性发生后对总线电流特性进行辨识,其实现流程按如下步骤:
(1)对电网用户侧总线处的电压和电流采样,并进行降噪和去直流等预处理;
(2)提取电压和电流产生突变前后时段的特征,同时根据文献[9]所提方法进行功率求解并制作目标标签;
(3)将提取到的特征输入到所设计的孪生分支神经网络中,借助卷积神经网络强大的学习能力进行冲击负荷设备特征离线训练和学习;
(4)以非侵入式的方式,将训练模型在智能物联网电能表外接模组上部署,通过孪生分支网络实时分析高频ADC采样数据,获取设备辨识结果并对冲击功率进行回归。
2 基于孪生分支神经网络的冲击负荷辨识
2.1 冲击负荷特征工程
卷积神经网络属于半监督学习,因此尽可能提供更多的先验信息是必要的,先验信息通过特征的方式输入到网络进行训练与学习,特征的好坏很大程序上决定了网络的辨识效果,在嵌入式设备部署网络模型时,受限于硬件资源,可设计的网络层级十分有限。因此选择或设计合适的特征有利于节约资源,最大程度发挥卷积神经网络的辨识能力。
2.1.1 V-I轨迹特征
在非介入式辨识方面,设计特征的本质即采样数据重塑。二维电压电流(V-I)轨迹特征是文献[10]提出的一种简洁高效的特征表征方法,该方法抽象了负载之间电压电流轨迹的相似性,并将该轨迹映射到二值单元特征矩阵中,其计算方法如下所述。
对于设备的每个采样周期,有电压Vk(V1,V2, … ,Vk)和电流Ik(I1,I2, … ,Ik)共2k个采样点的序列,其中Vk和Ik代表每个点的采样值,首先对采样序列去直流:
(1)
然后对电压电流采样值标幺化并填充至N×N大小的波形轨迹坐标空间:
(2)
其中「⎤代表向上取整,对于每一个标幺化后的电压电流采样序列对,映射到坐标空间的值为1,其他值为0,由此生成N*N的V-I轨迹图像,以CT机为例,其V-I轨迹特征如图3所示:
2.1.2 对角高斯谐波矩阵特征
由于工作原理不同,大多数电器设备之间的V-I轨迹差异十分明显,有利于冲击性负荷的辨识。但由于V-I 轨迹是由归一化的电压与电流值绘制,无法反映设备的功率大小,不能有效区分部分V-I轨迹相似但功率差异较大的设备[11]。
文章定义一种基于电流的对角高斯谐波矩阵(Gaussian Diagonal Harmonic Matrices,Gauss-DHM)特征,该特征具有明显的幅值特性,能弥补V-I轨迹特征的缺点以实现更好的辨识效果,并且可以直接送入神经网络训练。对角高斯谐波矩阵通过离散傅里叶变换得到,对于周期电流采样序列Ik(I1,I2, … ,Ik),计算其离散傅里叶变换ID(n):
(3)
根据欧拉公式展开可得:
(4)
得到n次谐波序列ID(n)后,将其映射到二维坐标空间,中心处为基波幅值,谐波次数依次沿着对角线延伸由高到低分布,谐波幅值分别填充到对应位置,即组成二维高斯谐波特征矩阵,其示意图如图4所示。
2.2 基于孪生分支神经网络的设计与训练
2.2.1 网络结构设计
现有的非侵入式卷积神经网络负荷辨识思路只进行了设备的类别的分类,没有考虑功率的回归[12]。文章设计了两种轻量级卷积神经网络框架,训练时融合V-I轨迹特征和Gauss-DHM特征,在实现冲击负荷设备类别辨识的同时进行了功率回归,模型含有两种前向模式,均可以在硬件资源不超过1 MB的RAM和ROM上部署。
模式一为输入两通道、骨干网络单分支前向通道以及输出双分支的结构,如图5所示。输入层对双通道样本的特征直接进行融合计算,称为Single-Arch模式,该模式包含三个卷积块和双分支输出的全连接层,其中输入特征大小为24×24×2,最后一层全连接层的输出类别根据识别种类的需要进行设置,两个分支分别输出类别和功率预测结果。
模式二为输入双通道、骨干网络孪生(Siamese)[13]双前向通道以及输出双分支的结构[14],如图6所示,即前向推理时以双通道的方式提取输入样本特征、输出双分支的Siamese Dual-Arch模式。两个分支输入特征大小均为24×24×1,分别对应V-I轨迹特征和Gauss-DHM特征,两种特征经过卷积层进行深度特征提取,在全连接层之前进行特征融合,卷积块数和全连接层结构与Single-Arch模式保持一致。
图6 模式II网络结构示意图
对于输入的电压电流波形,首先进行V-I轨迹特征和Gauss-DHM特征提取,然后根据网络模型结构的不同,将特征送入不同的通道进行深度特征提取,网络前向推理时,由三个卷积块组成骨干网络,每个卷积块包含卷积层、激活层、池化层和Dropout层,该前向推理过程可表示为:
Refc(F)=fConcatenate[ζMaxpool(δReLu(Conv(F))),
ζMaxpool(δReLu(Conv(F)))]
(5)
其中Conv代表卷积操作,ReLu[15]为防止梯度爆炸或消失的激活层函数,Maxpool[16]对卷积输出进行降维压缩来加快运算速度,Dropout[17]减少网络对局部神经元依赖以防止模型过拟合,Concatenate操作将不同输出通道的特征拼接,用于全连接层的判别,两种模式的参数设计见表1和表2。
表1 模式I网络结构与参数列表
表2 模式II网络结构与参数列表
上述所设计的两种网络模型,模式一使用两种特征直接融合训练,输入通道共享网络权重,可减少网络参数;模式二设计了一种孪生分支结构,用于两输入通道数据分别提取特征经骨干网络前向推理后融合,两种模式输出时,模型能够同时进行逻辑分类和功率回归。
2.2.2 孪生分支多标签分类与功率回归设计原理
在卷积神经网络训练时,模型通过对比最后一层全连接层的输出与训练集预设标签的差值定义损失,即输出误差,并通过梯度下降法迭代寻优。在进行分类任务时,使用交叉熵(Cross Entropy)[18]表示预测的结果和真实的结果的差异:
(6)
式中p(x)代表真实标签;q(x)代表网络最后一层的激活输出,x代表网络输出的维度数;q(x)通过Sigmoid激活函数获取:
(7)
式中z为激活层的前一层输出,文章所设计的孪生分支神经网络实现多标签多分类与回归的关键在于训练时和前向推理时使用的损失函数,其中多分类多标签损失函数使用二分类交叉熵损失函数(Binary Cross-Entropy Loss,BCE Loss),该损失函数使得每个类别的输出独立且不相互排斥,最后一层全连接层后通过多个Sigmoid输出实现预测结果的多标签的多分类。其形式和误差反向传播时的导数如下:
(8)
式中C代表可识别的冲击负荷设备类别数;真实标签p(x)的值为0或1;网络Sigmoid激活层的输出q(x)∈(0,1),在进行误差反向传播时,其形式简单,有利于网络训练加速,故分类任务选择该激活函数,在实现功率回归时,选择最小平方误差(Minimum Squared-Error,MSE)损失函数为:
(9)
2.2.3 冲击负荷训练数据采集
由于冲击负荷类的公开数据比较少,文章所用训练和测试数据通过专业设备获取。其中数据采集使用MR1200系列波形监测记录仪,采集了烟台市、哈尔滨市某大型工业企业及青岛市李沧区某医院改装台区总线侧经变比后的中频炉、电弧炉、轧钢机、CT机等设备单独工作和部分设备混合工作的场景。训练数据分为15组,包括单一冲击设备场景和混合冲击设备使用的场景,每组800个数据。测试集3组,每组1 000个数据,涵盖了常见的冲击负荷设备场景。
2.2.4 冲击负荷训练标签制作
训练卷积神经网络模型,需要提供大量带有预设标签的样本,文章所设计的孪生分支网络算法除了可进行冲击设备类别识别外,还可以对其功率进行回归。制作功率信息的训练标签时,冲击负荷有功功率的计算通过电压电流单个周波离散采样点乘积积分的平均值确定:
(10)
式中k为单周波采样点数;i为单个周波第i个采样点,Vi和Ii分别为该点电压电流值。
3 基于孪生网络的非侵入式算法部署与算例分析
3.1 非侵入式孪生网络训练
文章所提孪生网络使用Python3与Keras深度学习框架进行设计和训练,硬件为:CPU为Intel i5-8300H,RAM为8GB;GPU为Nvidia GTX 1060Ti,显存为6GB,网络计算机端离线训练参数按表3进行配置。
表3 网络模型训练参数设置
其中,Validation Split[19]为训练数据中的验证集比例,Pooling Stride为池化步长,Weight of Branches为网络最后一层输出计算损失函数时不同分支的损失权重,Adam为训练时随机梯度下降法的动量优化方法[20]。训练过程中的损失变化曲线如图7所示。
图7 训练精度与损失变化曲线
由图7中曲线,训练过程分类和回归损失逐渐变小,可见训练是收敛的。
3.2 非侵入式平台部署与测试
基于ARM Cortex-M4的嵌入式平台的MCU主频为120 MHz,RAM为1 MB,Flash存储器为1 MB,计算机端离线训练,其完成后,模型导出为“h5”格式文件,由于硬件资源有限,需要对其进行固定位宽定点量化后导出到嵌入式设备上部署,当网络调用时,进行参数加载,参数量与资源占用如表4所示。
表4 网络模型参数与计算量占用
其中Param代表网络模型的参数所占用的字节数,为网络的权重和偏置信息,FLOPs[21]表示浮点运算次数,用来衡量模型的计算复杂度。Period代表模型部署时单个样本在周期任务中运行的耗时。由表格可知,Single-Arch模式的参数量更少,运算速度更快, Siamese Dual-Arch将输入特征分开学习,参数量大,运算速度略慢于前者。
在嵌入式设备上运行时,首先对采样数据缓存,时域上分析电压幅值的突变点也即系统发生暂态时间的时刻,并判断是否为冲击负荷投切暂态事件,在监测到时域事件发生后,缓存一段时间的数据,在非周期中断任务中进行后台分析,判断是否为冲击负荷并判断冲击负荷的种类、功率,模型分析速度可达到毫秒级,冲击发生时,可在1 s内完成所有冲击数据分析。表5为两种网络模式对典型测试场景下冲击负荷功率的分解结果(变比1∶800),与真实测试标签(Ground Truth)对比可知,模型实现了功率分解并达到了一定的准确度。
表5 功率预测结果对比
图8为所设计的网络加入功率信息训练前后在实测冲击负荷录波数据组成的测试集中的表现。
图8 高斯谐波特征引入前后网络负荷设备投切辨识测试结果
其中横轴代表冲击设备类别的真实标签,纵轴为算法实际预测冲击设备的类别,因此当辨识结果分布在对角线上时,识别类别越好[22]。由图8测试结果可知,加入高斯谐波特征后,模型学习了与冲击负荷设备幅值和频域相关特性,对于波形易混淆的中频炉和电弧炉有了更好的辨识效果,整体识别准确度由86.25%提升到97.81%。
3.3 算法识别率横向对比测试
为验证算法整体识别性能,对比测试其他文献中的负荷辨识算法。选取文献[23-25]中算法仿真冲击负荷辨识,对辨识准确率性能进行横向测评,各算法参数使用文献[23-25]所用到的实验参数,测试数据为现场录波数据。其中文献[23]通过卷积神经网络提取V-I轨迹深层特征来直接辨识用电设备;文献[24]利用K近邻(K-NN)算法和Fisher判别相结合的算法对用电设备分类;文献[25]使用CNN训练V-I轨迹特征,单独使用多层感知机(MLP)提取谐波特征向量,融合两组特征进行识别。各类算法总体辨识准确度结果如表6所示。
表6 录波数据分项辨识准确度
由表6辨识结果可知,文献[23]算法直接使用卷积神经网络对V-I轨迹特征进行进一步特征提取和判别,由于中频炉和电弧炉的V-I轨迹特征相近,产生了较多的误判。文献[24]算法使用KNN进行判别,对误判风险大的样本通过核Fisher进行判别,使得对特征相近的样本识别取得了一定效果,但整体识别率不高。文献[25]算法引入谐波特征组成谐波向量,但使用感知机训练获取的有效信息较少,精度仍有提升的空间。融合了V-I轨迹特征和高斯谐波特征的Single-Arch CNN比单一特征的CNN具有更好的表现,而基于孪生分支的Dual-Arch CNN网络识别精度最高,其对冲击负荷波形特征和幅值特性的学习更为深刻,泛化能力更强,使得该算法辨识效果要好于传统的机器学习方法与单通道、单分支网络等模型。
4 结束语
典型冲击负荷对电力系统稳定有较大的影响,为了识别和掌握这种动态负荷的波动,文章提出了一种基于孪生分支网络结构的非侵入式冲击负荷辨识方法。首先对于电网高频采样数据,设计了一种对角高斯谐波特征,使用该特征与V-I轨迹特征相配合进行冲击负荷辨识,能够有效弥补V-I轨迹特征无法表征幅值信息的不足。同时设计了一种孪生分支结构的神经网络,分为单输入通道和孪生输入通道两种模式,其中单通道模式运算速度快,孪生输入通道模式精度高。该网络结构不仅能融合训练V-I轨迹和对角高斯谐波特征,而且可以同时输出类别预测和功率分解结果。算法能够在算力较低的嵌入式边缘设备部署且运算速度达到ms级。实测数据表明,文章设计的网络模型和特征组合方式能够有效地提升冲击负荷的辨识效果。
文章以四种典型设备为例展开,结合了冲击负荷监测现实需求、孪生分支网络强大的学习能力以及非侵入式负荷监测理论优势。文中所提算法可根据实际应用场景的需要,学习并扩展至更多大中型冲击负荷类设备。同样地,模型经过训练学习可用于家用电器投切识别等多种场景。
值得一提的是,大型负荷的数据资料较少,基于人工智能的智慧电网建设依赖于数据驱动,往往需要电网公司和企业合作去采集大量的负荷样本数据,分类建设并不断完善相关的数据库,运用基于人工智能的算法,对重点地区和企业实行定点监测,统计数据后进行云端汇总,利用大数据技术分析冲击负荷总体运行规律,进而推动智能电力调度和电能质量优化,降低冲击负荷对电网的影响。