APP下载

基于BP神经网络分类器增强的非侵入式负荷辨识方法

2022-11-21何恒靖周尚礼张本松谢文旺连新凯徐浩田

电气传动 2022年22期
关键词:投切分类器种群

何恒靖,周尚礼,张本松,谢文旺,连新凯 ,徐浩田

(1.南方电网数字电网研究院有限公司,广东 广州 510663;2.河南许继仪表有限公司,河南 许昌 461000)

近年来,随着新一代智能电表嵌入非侵入式负荷感知技术(non-intrusive load monitoring,NILM)的发展,国家电网、省电力公司等单位于2018年起便开始着手布局并相应地开展了部分试点以推动负荷感知技术的进一步发展[1]。该技术的发展和成熟不仅有助于促进电力公司和用户之间的良好互动,同时可以通过大数据分析,为用户提供方便、快捷的用电指导以及科学合理的用电建议,从而为推进资源节约型社会的发展奠定基础。

NILM技术最早于20世纪80年代由麻省理工学院的HART教授提出[2],目前,负荷辨识技术已经成为一个新型的研究领域,引起了国内外研究者的广泛关注。相比于国外,国内的高校和研究单位起步相对较晚,天津大学的余贻鑫院士团队最先开始从事这方面的研究[3-4],随后武汉大学、东南大学等[1,5-6]高校学者也针对NILM进行了深入研究。总的来讲,该领域的研究核心在于负荷特征的构建和辨识算法的开发,这也是当前研究的热点。负荷特征是直接反映负荷的运行状态,是实现负荷分类和辨识的依据。早期,有功功率和无功功率是负荷辨识最为常用的特征,例如文献[4]中选取了有功功率和无功功率作为负荷特征进行负荷分解。然而,对于小功率设备或者对于具有特征混叠的负荷,通常需要借助其他负荷特征进行细分辨识,例如文献[7]中选用稳态电流幅值、瞬态电流波形以及电流谐波等特征进行负荷辨识。尽管这些特征在一定程度上避免了辨识过程中因特征少的局限性,然而,多维特征容易引发高维灾难,从而影响负荷辨识效率,因此文献[8]将多种负荷特征构造成特征集,通过降维处理得到最佳辨识特征。此外,为了能够进一步解决负荷特征混叠问题,文献[9]通过分析设备的高频采样数据提取了V—I轨迹图像特征与功率数值特征,以复合特征作为设备新的特征训练BP神经网络进行非侵入式负荷辨识。

随着可选辨识特征的增多,选择高效的辨识算法成为了当前亟待解决的难点。同时随着人工智能的快速兴起,各种监督型算法因其适用性广、寻优能力强的优点成为了研究热点[10]。神经网络作为一种具有学习能力和构建非线性的复杂关系模型,因此在NILM算法开发中得到了进一步研究与应用,文献[11]提出采用弹性BP(resilient back propagation,RPROP)模型对实验室7种设备有效辨识;随着深度学习神经网络的发展,双向长短时记忆(Bi-directional long short-term memory,Bi-LSTM)模型、循环神经网络(recurrent neural network,RNN)模型等[12-13]相继也应用在该领域,并取得了较好的成果。此外,还有一些模式识别的经典算法,例如Adaboost算法[14],它将同一训练集训练出的不同的分类器通过线性叠加的方式,构成一个更强的分类器,具有简单、高效等特性。

考虑到BP神经网络在智能电表负荷感知模块上易于实现以及具备自学习、容错性好等特点,本文利用Adaboost算法核心思想,建立一个基于BP神经网络分类器增强的负荷辨识方法。首先,本文在有功、无功功率特征这一最基本的电量特征基础上,引入与用户用电行为习惯密切相关的非电量特征,然后利用思维进化算法(mind evolutionary algorithm,MEA)[15]优化BP神经网络内在参数,使得分类器性能得到提升。同时,结合Adaboost框架理论对BP神经网络分类器进行增强。最后,在AMPds公开数据集进行训练和测试,验证文中方法的有效性。

1 负荷特征选择及建模

1.1 有功功率-无功功率

有功功率P和无功功率Q是反映各电器运行最直接且有效的特征。通常该特征是根据采样得到的一个周期内的瞬时电压V(t)、瞬时电流I(t)信息计算得到,即

式中:T为一个周波内的采样点数;t为周波内的采样点时刻。

作为典型的负荷特征,有功和无功特征的结合可以对一些大功率负荷进行有效区分,即采用P—Q图的方式进行聚类实现对用电负荷的辨识。然而,对于具有P—Q特征混叠的用电设备,则需要引入其他特征进行细分。

1.2 用户投切设备时间

在普通用户家庭中,用电行为通常潜在地存在一些规律,例如电饭煲等具有比较规律的投切时刻点。令某个用电设备i在投切时刻为ti,则负荷i关于用电设备投切时刻分类函数可表示为

式中:ti,kL,ti,kR分别为用电设备i投切时刻的下限和上限。

投切时刻上、下限值的确定要求满足在该区间范围内的负荷i占该负荷总统计次数90%以上。

1.3 负荷运行时长

运行时长是反映电器的“固有属性”和用户的“生活属性”的一项重要参数,也是电能能耗计量的基础。由于不同电器的运行时长不仅与电器自身构造相关,也与用户的行为习惯密不可分,因此可建立特征分类函数为

其中,FL(i)表示针对负荷特征的分类函数;Li表示某种用电设备时长,当其运行时长在这种用电设备规定的范围内[Li,min,Li,max]则认为是该种负荷。Li,min和Li,max分别表示负荷i运行时长的下限和上限,通常在确定Li,min和Li,max值时要求满足在该区间范围内的负荷i占该负荷总的统计次数的90%以上。

2 BP神经网络分类器增强的电力负荷辨识算法

从上述特征中不难发现,由于特征的量纲不一致性以及分类器设计的差异性,使得仅通过传统分类器方法难以满足高负荷辨识准确度的需求。为此,本文利用模式识别中BP神经网络分类作为分类器,通过Adaboost算法理论框架,搭建BP神经网络分类器增强的非侵入式负荷辨识方法。同时,针对BP神经网络内部参数,采用MEA算法进行优化,提升辨识性能。

2.1 Adaboost辨识算法

Adaboost算法[16-17]的核心思想是将多个弱分类器通过权值线性组合成一个强分类器,从而增强分类性能。

假定任意一个样本可表示为(xi,yi),其中,xi是样本的特征向量,yi是样本的标签向量,yi=[yi1,yi2,...,yik,...,yiK],其分量定义为

式中:K为类别数,当K=2时,即属于二分类。

在Adaboost算法中,各个分类器采用加法模型,假定训练好的分类器记为fm(x),如下式:

式中:h(ix)为基分类器(弱分类器);αi为分类器h(ix)的权重。

针对K分类,fm(x)可表示为fm(x)=[fm(1x),fm(2x),…,fmK(x)]。为了能够确保求解得到的fm(x)唯一,这里通常需要添加一个对称约束条件:

此外,为了能够更好地求解模型,Adaboost的指数损失函数沿用传统的指数损失函数,即

其中

式中:ωi为权重分布。

由于yi和hm(x)i都是 1×K维向量,当它表示第j类时,则第j个分量为1,其余分量为-1(/K-1),因此当分类器预测正确时,有:

反之,当预测错误时,有:

将式(10)、式(11)代入损失函数式(8),并对变量αm求导可得:

得到:

其中

式中:re为分类器的错误率。

由此,通过对各个弱分类器的分类错误率计算以及权重ωi的分布,最终得到各个分类器的权重αi,从而得到一个强分类器:

功能性便秘主要以老年人为高发人群,病情较轻的患者可出现腹胀不适且容易影响营养的吸收,病情较重的患者有可能发生结肠溃疡及癌肿,可严重威胁患者生命安全[1] 。本研究针对本院收治80例老年功能性便秘患者采取不同护理措施进行分析,报告如下。

2.2 BP神经网络分类器

BP神经网络作为一种能够通过学习带正确答案的实例集自动提取“合理”的求解规则,在分类等领域得到了广泛的应用。为此,本文利用经典的BP神经网络作为分类器,并且为了能够避免BP神经网络存在因训练过程中收敛速度慢和容易陷入局部极小值等缺点,提出采用MEA[15]寻找全局最优值,从而得到MEA改进后的BP神经网络(以下简称为MB神经网络)。

具体地,整个MB神经网络流程如下:

1)产生初始化结构群体。在MEA中进行种群初始化,确定初始种群总数r,优胜子群体个数m和临时子群体个数p,则可确定子群体大小SG:

2)将BP神经网络的初始权值和阈值映射到MEA编码空间。本文采用三层BP神经网络,即输入层、隐含层和输出层,其中输入层、隐含层以及输出层中的节点个数分别设置为S1,S2和S3,则MEA中每个个体的编码长度L为

3)选择最优个体。针对子群体内部,建立得分函数func进行计算,得分函数如下式:

式中:T为期望输出;A2为每次迭代后神经网络输出层的输出;mse()为均方误差计算函数。

然后,在局部公告板上记录所有个体得分。显然,均方误差越小,得分越高,即作为优胜者。当子种群不再产生新的优胜者,则表示趋同过程完成。在全局公告板上,记录每个子种群的得分,优胜子种群和临时子种群不断进行比较、替换,实现异化。最终,在整个种群中搜索得分最高的个体。

2.3 实现流程

图1给出了BP神经网络分类器增强的流程框架。在该框架中,首先利用MEA寻求BP神经网络的最佳参数,得到改进后的MB神经网络,然后基于MB神经网络构造多个分类器,并采用Adaboost算法对各分类器进行训练并赋予权重,最后线性加权得到最终的强分类器。

3 实验结果与分析

在测试中,采用AMPds公开数据集,并选取8种可用电器作为数据源,提取在2012年4月至2012年5月之间各个负荷使用时的有功功率、无功功率、投切时间、运行时长等特征信息,共816个样本,并从所提取的样本特征数据中随机选取90%作为训练集,剩余10%作为测试集。图2给出了有功和无功功率所组成的P—Q图。从图中可以看出,卧室电器、照明以及电火炉具有一定的相似性;洗衣机和电冰箱具有相似性,因此分类辨识时容易发生错误。相比之下,其他设备则具有一定的可区分性。

图3为各个用电设备投切时间统计分布图,每个用电设备都划分到区间[0,50],[50,150],…,[1 250,1 350],[1 350,1 400]中进行统计。不难看出,有些时间用电设备基本上不会投入使用,例如卧室电器,其投切时间主要集中在第250~850 min内,而有些用电设备则可能全天候出现投切,例如冰箱(压缩机启动被认为是负荷投入,压缩机关闭则认为是该负荷切除)。

图4给出了各个用电设备的每次投入时整理的使用时长数据,每个用电设备使用时长都划分到区间[0,5],[5,15],…,[85,95],[95,100]中。显然,这些用电设备均有一定的时长分布特性,例如,卧室电器是在区间[0,15]内;照明设备则基本上大于45 min;洗衣机分布在区间[35,55]上;洗碗机分布在区间[0,45]上;由于冰箱是由压缩机工作决定,因此每次时长都分布在[5,25]之间;电火炉因天气等原因,但其使用时长最长也在85 min之内;暖泵使用的区间在[15,55]内;干洗机则在区间[5,45]内。

为了能够有效地辨识,本文方法中需要对模型参数进行配置。MEA的参数设置为:初始种群600个;优胜子种群10个;临时子种群10个;MEA的迭代次数50次。BP神经网络的参数设置为:5个节点隐含层;最大训练次数200次;学习速率0.01 s;最小确认失败次数5次;训练精度0.01%。

由于每个设备在不同特征下的区分度存在差异,表1给出了各个特征采用神经网络训练的结果。从表中可以看出,投切时刻的辨识准确率较低,而有功—无功特征的准确率较高,表明有功—无功特征具有较好的区分度。

表1 MB神经网络训练结果Tab.1 Result of MB neural network

为了评估所提辨识方法的效果,以下从用户行为特征和算法性能比较两方面展开论述。

1)非电量特征有效性。

从图2中可以看出,仅通过有功、无功特征无法高效地区分卧室电器、照明和电火炉,也无法区分洗衣机和电冰箱。为此,需要结合非电量特征。图5给出了卧室电器、照明、电火炉的特征分布图,图6给出了洗衣机和电冰箱的特征分布图。可以看出,随着非电量特征的加入,这些设备的区分性得到了较大提升。

表2给出了本文模型和BP-Adaboost模型的测试结果。不难发现,针对这些在有功功率—无功功率具有相似性的用电设备,通过增加非电量特征,辨识准确率可以接近90%及其以上,且相比于未优化的BP神经网络分类器增强方法(BPAdaboost),本文方法获得的性能更优,从而验证了MEA方法改善BP神经网络的有效性。

表2 有功—无功辨识准确率Tab.2 Accuracy of identification using active power and reactive power

2)算法模型对比分析。

将本文所提出的MB-Adaboost方法和RPROP神经网络算法[11]在同一训练集进行实验,结果如表3所示。相比之下,本文方法具有较高的辨识准确率。

表3 本文方法与RPROP辨识准确率比较Tab.3 Comparison with RPROP method in terms of accuracy of identification

4 结论

为了进一步在智能电表上推广和应用非侵入式负荷辨识技术,本文提出以电器投切时间、运行时长和投切次数为代表的用户用电行为特征和传统电气负荷特征相结合的特征组合作为辨识依据。同时,提出了BP神经网络分类器增强的非侵入式负荷辨识算法模型,该模型融入的思维进化算法改善了BP神经网络;然后采用Adaboost理论框架对BP神经网络分类器进行训练,得到最终的强分类器。最后,在AMPds公用数据集中进行测试,通过分析以及与现有的神经网络辨识算法进行比较,验证了非电量特征对辨识性能提升的有效性和本文模型的可行性,为NILM在智能电表上的推广应用奠定基础。

猜你喜欢

投切分类器种群
山西省发现刺五加种群分布
学贯中西(6):阐述ML分类器的工作流程
一种新型的拓扑识别设备
基于朴素Bayes组合的简易集成分类器①
一种自适应子融合集成多分类器方法
“最大持续产量”原理分析
投切过电压累积作用下干式空心电抗器匝间绝缘局部放电特性
由种群增长率反向分析种群数量的变化
云广直流阀冷系统主泵异常投切策略优化研究
浅谈多分类器动态集成技术