基于K-means聚类与PSO特征优选KNN的分级负荷识别方法
2022-07-14安琪梁宇飞王耀强王占彬李争李峥安国庆
安琪 梁宇飞 王耀强 王占彬 李争 李峥 安国庆
摘要:針对非侵入式负荷辨识中,单一V-I轨迹特征无法对相似的轨迹特征进行有效识别以及所提取特征易出现冗余甚至噪声特征的问题,提出了一种基于K-means聚类与PSO特征优选的分级非侵入式负荷识别方法。首先,利用K-means算法对负荷V-I轨迹的HOG特征进行初步分类,将轨迹相似的电器分为一类;然后,对每一类中的电器电流数据进行多维特征提取并采用PSO算法选取最优特征子集;最后,利用KNN模型进行二级负荷识别。实验结果表明,该方法有效提高了负荷识别准确率;提取V-I轨迹的HOG特征解决了同一电器V-I轨迹波动的问题;对一级分类后的每一大类单独进行PSO特征优选KNN二级分类,解决了部分电器对特征子集适应性差的问题。所提方法在一定程度上解决了冗余特征甚至噪声特征对辨识准确率的影响,为负荷特征的选取提供了新的思路,对负荷辨识的实际应用具有重要的参考意义。
关键词:电气测量技术及其仪器仪表;非侵入式负荷辨识;V-I轨迹;HOG特征;K-means聚类分析;特征优选
中图分类号:TM933文献标识码:A
DOI:10.7535/hbkd.2022yx03004
Hierarchical load identification method based on K-means clustering and PSO feature optimization KNN
AN Qi LIANG Yufei WANG Yaoqiang WANG Zhanbin LI Zheng LI Zheng AN Guoqing
(1.School of Electrical Engineering,Hebei University of Science and Technology,Shijiazhuang,Hebei 050018,China;2.Hebei Institute of Intelligent Distribution and Electric Equipment Technology [JP2](Shijiazhuang Kelin Electric Company Limited),[JP]Shijiazhuang,Hebei 050222,China)
Abstract:In order to solve the problem that a single V-I track feature can not effectively identify similar track features and the extracted features are prone to redundacy or even noise features in non-invasive load identification,a hierarchical non-invasive load identification method based on K-means clustering and PSO feature optimization was proposed.Firstly,K-means algorithm was used to initially classify the HOG features of load V-I trajectories,and the appliances with similar trajectories were classified into one category.Then,multi-dimensional features are extracted from electrical current data in each category and the optimal feature subset is selected by PSO algorithm.Finally,KNN model was used for secondary load identification.The experimental results show that this method effectively improves the accuracy of load identification.Extracting the HOG feature of V-I trajectory solves the problem of fluctuation of the same electrical appliance.PSO feature optimized KNN secondary classification is carried out for each category after the first level classification,which solves the problem of poor adaptability of some electrical appliances to feature subset.The proposed method solves the influence of redundant features and even noise features on the identification accuracy to a certain extent,and provides a new idea for the selection of load features,which has important reference significance for the practical application of load identification.
Keywords:
electrical measuring technology and its instrumentation;non-invasive load identification;V-I trajectory;HOG features;K-means clustering analysis;feature selection
根据中国政府提出的“碳达峰”、“碳中和”的发展要求,建设清洁低碳、安全高效的能源体系已经迫在眉睫。随着居民用电量在国民经济总用电量占比的不断增加,对能源的精细化管理显得极为重要。非侵入式负荷监测(non-invasive load monitoring,NILM)技术不仅可以帮助居民掌握详细的家庭用电信息,还可以为电力公司的电力部署以及新能源并网提供数据支撑,有助于更精准地对用户行为进行建模,实现对用户的差异化、精准化服务[1-2]。近年来NILM受到了业界的大力扶持,相关工作也有了很大进展。
NILM的基础是通过提取负荷的特征来实现负荷识别。目前常用的负荷特征分为稳态特征和暂态特征2类,主要包括电压和电流波形、有功和无功功率、电流谐波、电压-电流轨迹(V-I 轨迹)等[3]。文献[4]使用K-means聚类算法对负荷的有功和无功功率进行初步分类,并将初步分类后的“非唯一”类包含的负荷进行V-I轨迹构建和颜色编码处理,生成带颜色的V-I轨迹,运用AlexNet神经网络对负荷进行训练和分类,但由于“非唯一”类过多,导致需要训练很多AlexNet网络,造成算力资源的浪费。文献[5]根据不同负荷内部电路的拓扑结构将负荷分为7大类,对比分析了不同类别负荷V-I轨迹的差异,并使用自组织映射网络对从V-I轨迹中提取的特征进行负荷分类,但在对模型进行训练时,需要提前人为对负荷进行分类,工作量较大。文献[6]对用电的电流、有功功率和谐波电流进行数据预处理和降噪处理后,绘制三维立体图并将其投影到平面,提取投影面的方向梯度直方图(histogram of oriented gradient,HOG)特征,使用支持向量机(support vector machine,SVM)进行负荷识别,但SVM参数是根据经验选取的,有一定的主观因素,不具备普遍性。文献[7]提取电流的峰值因数、裕度因子和谱熵作为负荷特征,并结合粒子群(PSO)优化SVM参数的方法实现负荷辨识,将振动领域的特征引入到负荷识别领域中,然而所提取的3个特征并未在更多的电器上进行验证,无法证明其是否具有普适性。文献[8]将V-I轨迹作为负荷特征,使用基于变样本权重的K最近邻(K-nearest-neighbor,KNN)算法进行负荷识别,但是对于V-I轨迹相似的负荷无法准确识别。文献[9]以功率变化作为事件检测的准则,通过平滑和插值提取差值的V-I轨迹,并基于物理意义量化出10个V-I轨迹特征,最后采用支持向量机多分类算法进行负载识别,但对多负荷识别有一定的局限性,即若2个负荷投切时间过短时则无法判断事件是否发生。文献[10]基于V-I轨迹的曲率尺度空间,提出了曲率尺度空间局部极值检测和直接曲率尺度空间2种二维稳态特征作为新的负荷特征。文献[11]在对V-I轨迹的图形模板进行了裁剪和图像金字塔缩减的基础上,利用主成分分析和K最近邻算法设计并实现了一套多阶段的负荷分类算法,并在实际数据集上验证了该算法的有效性。
电器的V-I轨迹作为一种有效的负荷特征,广泛应用于非侵入式负荷识别中,但由于V-I轨迹图是由归一化的电流、电压数据绘制的,从原理上无法表征电器工作时电流的大小,因此,利用单一的V-I轨迹对V-I轨迹相似的不同电器无法进行有效区分。基于此,本文提出一种结合K-means聚类和PSO特征优选KNN算法的二级特征分类负荷辨识方法。该方法首先使用稳态电流和电压构建V-I轨迹二值图并提取其HOG特征,使用K-means算法对HOG特征进行一级分类;然后在一级分类的结果上,分别对每个分类中包含的电器稳态电流进行多维波形特征提取,利用PSO算法进行特征优选,得到最优特征子集进行KNN模型的负荷识别。
1基于HOG特征的K-means一级分类
1.1构建V-I轨迹图
1.2HOG特征提取
HOG特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子,HOG特征描述子对梯度和方向敏感,可以很好地描述图像轮廓[14]。同时,HOG特征对几何形变可以保持很好的不变性[15]。其基本原理:将目标图像分成若干个很小的细胞单元(cells),再把小的cells单元组合成1个块单元,接着采集每个cells中各像素点梯度,最后将这些特征组合起来构成HOG 描述器[15-16]。
V-I轨迹图虽然具有很好的区分度,但有些电器的V-I轨迹图存在相似的情况,如此便无法准确识别V-I轨迹相似的电器,故将轨迹相似的电器划分为一类后再进行后续的精细化识别。HOG特征可以维持几何形变的特性,因此可以很好地描述V-I轨迹的轮廓,基于此,提取V-I轨迹的HOG特征后,使用K-means聚类算法对电器进行一级分类。
1.3K-means聚类算法
2基于PSO特征优选的KNN二级分类
2.1电流波形特征提取
2.2KNN算法
KNN算法是一种经典的机器学习算法,简单且易实现。KNN通过对比训练样本与待测样本之间的距离或相似度来对待测样本进行分类[19-20]。其具體步骤如下:
1)计算待测样本与训练样本之间的欧氏距离;
2)找出训练样本中与待测样本最邻近的r个点;
3)统计r个点中每个类别的个数;
4)将r个点里出现频率最高的类别,作为该样本点的预测类别。
由于KNN算法对数据依赖较大,同时2.1中所提取的特征可能存在维数过多、冗余特征甚至噪声特征等,都会导致KNN分类准确率的下降[21],故采用PSO进行特征优选,寻找最佳特征子集。
2.3基于PSO特征优选的KNN算法
PSO算法是基于群体智能的启发式算法,常用于求解多目标、非线性和多变量。粒子群优化过程从随机产生的初始粒子开始,不断对粒子的位置、速度进行更新,并用适应度值来表示粒子的优劣,通过追踪最优粒子找到最优解[22]。
通过PSO进行最优特征子集的选取,可以有效提高KNN算法分类的准确率,同时也降低了特征维数和KNN分类的空间复杂度[23-24],算法实现过程如下。
3.1实验数据采集
实验采集了空调(制冷)、微波炉、热水器、热水壶、电热炉、电饭煲、电磁炉、洗衣机、油烟机共9种电器运行时的电流、电压数据,采样频率为6.4 kHz。
3.2基于PSO特征优选的KNN负荷辨识
通过对比图1 a)和图1 b)可知,经PSO特征优选后,电器的识别率明显上升,但洗衣机和油烟机仍存在较大的识别错误。
各电器的具体识别率如表2所示。由表2可知,经PSO特征优选后,各电器平均识别率从89.56%上升至92.28%,其中空调(制冷)、微波炉和热水壶的识别准确率均上升至100%,洗衣机和油烟机的识别率分别从89.5%和31%上升至93%和40.5%。实验结果说明,针对大部分电器,通过PSO特征优选可以有效选出最优特征子集,提高识别模型的性能。
然而油烟机的识别率虽有所上升,但仍远不及预期,这可能是因为所选出的特征子集在部分电器上的适应性差造成的。故提出基于K-means聚类与PSO特征优选的分级负荷识别方法。先对电器从V-I轨迹图的特征上使用K-means进行大类划分,然后对每一类电器分别进行基于PSO特征优选的KNN二级分类。[LM]
3.3基于K-means聚类和PSO特征优选的KNN二级分类
3.3.1基于HOG特征的K-means一级分类
使用3.2所获得的稳态电流和电压数据构建V-I轨迹图,并提取轨迹图的HOG特征,100组训练集用于K-means聚类寻找聚类中心,200组测试集用于验证聚类中心的有效性。其中,所采集电器的V-I轨迹图图2所示。为确定K-means聚类中心数k的取值,对测试集进行k=1~7的聚类试验,并计算不同k值下聚类结果的误差平方和(sum of the squared errors,SSE),通过SSE值确定聚类中心数k的取值。实验结果如图3所示。
3.3.2KNN二级分类
由表4可知,在K-means聚类结果的基础上,对A,B,C 3类电器分别进行PSO-KNN建模识别,可以有效选出更加适应某类电器的特征子集,提高负荷辨识的准确率。
在实际应用中,6.4 kHz的采样频率会增加设备成本,基于现实应用考虑,对3.2 kHz采样频率的数据进行所提算法的验证。
3.4降低采样频率时的二级分类结果
采样频率的降低会导致轨迹图断点增多,降低轨迹图的连续性,影响聚类结果。为解决这一问题,将轨迹图的像素从32×32降为20×20,如图5所示。
由表5可知,采样频率的降低导致电器的V-I轨迹连续性变差,造成所提取的HOG特征聚类效果变差。通过减小轨迹图的像素至20×20,改善了轨迹的连续性,将K-means聚类的平均准确率从94.9%提高至98.9%。
在聚类结果的基础上,对A,B,C 3类电器分别进行二级建模识别,A,B,C 3类电器中具体电器的识别率如表6所示。
由表6可知,当采样频率为3.2 kHz时,各类电器的识别率虽有所下降,如洗衣机和油烟机分别下降至92.5%和90.5%,下降幅度最大,但仍基本满足所需要的识别精度。
当采样频率降为1.6 kHz时,将轨迹图像素也相应降低至12×12,其K-means聚类结果如表7所示。由表7可知,随着采样频率的降低,V-I轨迹图的像素也随之变小,导致像素信息缺失,使得聚类效果变差,由于此时的聚类结果不再满足实际应用的需要,故未进行后续实验。
上述结果表明,该算法对3.2 kHz的采样频率仍具有较好的适应性,可以有效降低实际应用的设备成本。
4结语
本文提出了一种基于K-means聚类与PSO特征优选KNN的二级分类非侵入式负荷辨识方法,首先使用K-means聚类算法对V-I轨迹的HOG特征进行一级大类划分;然后对各大类中的电器电流提取波形特征,使用PSO进行最优特征子集的选取,采用最优特征子集进行KNN二级分类。该方法有以下优势。
1)即使同一电器的V-I軌迹也会存在差异,而HOG特征对几何形变可以保持很好的不变性,基于HOG的这一特性,可以确保聚类结果的准确性。
2)随着电器的增多,PSO特征优选得到的最优特征子集适应性会降低。而本文提出的二级分类方法,对一级大类划分后的每一大类分别进行PSO特征优选,可以针对性地选出该大类中可分性较好的特征子集,降低KNN模型的空间复杂度,提高负荷识别准确率。
3)该方法在采样频率降低的情况下,也具有较好的适应性,对实际应用具有一定参考价值。
在实际应用中,由于数据采样频率要求较高且样本库的构建工程较大,导致本文方法的应用场景有限。未来需进一步研究其在低采样频率下性能的提升方法,拓宽该方法的应用范围。
参考文献/References:
[1]邓晓平,张桂青,魏庆来,等.非侵入式负荷监测综述[J].自动化学报,2022,48(3):644-663.DENG Xiaoping,ZHANG Guiqing,WEI Qinglai,et al.A survey on the non-intrusive load monitoring[J].Acta Automatica Sinica,2022,48(3):644-663.
[2]邵琪,包永强,张旭旭.基于分数阶Hilbert倒谱特征提取的非侵入式负荷监测研究方法[J].电子器件,2020,43(6):1314-1319.SHAO Qi,BAO Yongqiang,ZHANG Xuxu.Non-intrusive load monitoring research method based on fractional Hilbert cepstrum feature extraction[J].Chinese Journal of Electron Devices,2020,43(6):1314-1319.
[3]程祥,李林芝,吴浩,等.非侵入式负荷监测与分解研究综述[J].电网技术,2016,40(10):3108-3117.CHENG Xiang,LI Linzhi,WU Hao,et al.A survey of the research on non-intrusive load monitoring and disaggregation[J].Power System Technology,2016,40(10):3108-3117.
[4]解洋,梅飞,郑建勇,等.基于V-I轨迹颜色编码的非侵入式负荷识别方法[J].电力系统自动化,2022,46(4):93-102.XIE Yang,MEI Fei,ZHENG Jianyong,et al.Non-intrusive load monitoring method based on V-I trajectory color coding[J].Automation of Electric Power Systems,2022,46(4):93-102.
[5]DU Liang,HE Dawei,HARLEY R G,et al.Electric load classification by binary voltage-current trajectory mapping[J].IEEE Transactions on Smart Grid,2016,7(1):358-365.
[6]程丽娟.基于HOG和SVM的非侵入式负荷识别[J].安徽师范大学学报(自然科学版),2021,44(1):17-21.CHENG Lijuan.Non-Intrusive load identification based on HOG and SVM[J].Journal of Anhui Normal University(Natural Science),2021,44(1):17-21.
[7]安国庆,梁宇飞,蒋子尧,等.基于CF-MF-SE联合特征的非侵入式负荷辨识[J].河北科技大学学报,2021,42(5):462-469.AN Guoqing,LIANG Yufei,JIANG Ziyao,et al.Non-intrusive load identification based on CF-MF-SE joint feature[J].Journal of Hebei University of Science and Technology,2021,42(5):462-469.
[8]延菲,张瑞祥,孙耀杰,等.基于改进kNN算法的非侵入式负荷识别方法[J].复旦学报(自然科学版),2021,60(2):182-188.YAN Fei,ZHANG Ruixiang,SUN Yaojie,et al.Non-intrusive load identification method based on improved kNN algorithm[J].Journal of Fudan University(Natural Science),2021,60(2):182-188.
[9]WANG Longjun,CHEN Xiaomin,WANG Gang,et al.Non-intrusive load monitoring algorithm based on features of V-I trajectory[J].Electric Power Systems Research,2018,157:134-144.
[10]de PAULA RODRIGUES R,da SILVEIRA P M.Curvature scale space-based signatures for electrical load classification in NILM[J].Electrical Engineering,2021,103(2):1239-1252.
[11]YANG C C,SOH C S,YAP V V.A systematic approach in load disaggregation utilizing a multi-stage classification algorithm for consumer electrical appliances classification[J].Frontiers in Energy,2019,13(2):386-398.
[12]GAO Jingkun,KARA E C,GIRI S,et al.A feasibility study of automated plug-load identification from high-frequency measurements[C]//2015 IEEE Global Conference on Signal and Information Processing (GlobalSIP).Orlando:IEEE,2015:220-224.
[13]郇嘉嘉,汪超群,洪海峰,等.基于圖像编码与深度学习的非侵入式负荷识别方法[J].科学技术与工程,2021,21(21):8901-8908.HUAN Jiajia,WANG Chaoqun,HONG Haifeng,et al.Non-intrusive load monitoring method based on color encoding and deep learning[J].Science Technology and Engineering,2021,21(21):8901-8908.
[14]薄文嘉,倪受东.结合HOG与SVM的电子元件多位姿目标检测研究[J].机械设计与制造,2021(10):76-80.BO Wenjia,NI Shoudong.Research on multi-position target detection of electronic components combined with HOG and SVM[J].Machinery Design & Manufacture,2021(10):76-80.
[15]李小勇,韦泽贤,杨玉琳.HOG与SVM在动态称重轮轴识别中的应用研究[J].公路交通科技,2021,38(7):145-151.LI Xiaoyong,WEI Zexian,YANG Yulin.Study on application of HOG and SVM in weigh-in-motion and axle recognition[J].Journal of Highway and Transportation Research and Development,2021,38(7):145-151.
[16]徐超,高夢珠,查宇锋,等.基于HOG和SVM的公交乘客人流量统计算法[J].仪器仪表学报,2015,36(2):446-452.XU Chao,GAO Mengzhu,ZHA Yufeng,et al.Bus passenger flow calculation algorithm based on HOG and SVM[J].Chinese Journal of Scientific Instrument,2015,36(2):446-452.
[17]李秉晨,于惠钧,刘靖宇.基于Kmeans和CEEMD-PE-LSTM的短期光伏发电功率预测[J].水电能源科学,2021,39(4):204-208.LI Bingchen,YU Huijun,LIU Jingyu.Prediction of short-term photovoltaic power generation based on Kmeans and CEEMD-PE-LSTM[J].Water Resources and Power,2021,39(4):204-208.
[18]孟华,孙浩,裴迪,等.基于聚类及优化集成神经网络的地铁车站空调负荷预测[J].同济大学学报(自然科学版),2021,49(11):1582-1589.MENG Hua,SUN Hao,PEI Di,et al.Air-conditioning load prediction of subway station based on clustering and optimization algorithm ensemble neural network[J].Journal of Tongji University(Natural Science),2021,49(11):1582-1589.
[19]毋雪雁,王水花,张煜东.K最近邻算法理论与应用综述[J].计算机工程与应用,2017,53(21):1-7.WU Xueyan,WANG Shuihua,ZHANG Yudong.Survey on theory and application of K-nearest-neighbors algorithm[J].Computer Engineering and Applications,2017,53(21):1-7.
[20]谢妙,林泳昌,朱晓姝.一种基于信息熵的自适应k值KNN二分类方法[J].合肥工业大学学报(自然科学版),2021,44(11):1483-1486.XIE Miao,LIN Yongchang,ZHU Xiaoshu.An adaptive k-value KNN bisecting classification method based on information entropy[J].Journal of Hefei University of Technology(Natural Science),2021,44(11):1483-1486.
[21]陈茜,李录平,刘瑞,等.基于PCA-KNN融合算法的风力机变桨角度故障诊断方法[J].中国电力,2021,54(11):190-198.CHEN Xi,LI Luping,LIU Rui,et al.Fault diagnosis method of wind turbine pitch angle based on PCA-KNN fusion algorithm[J].Electric Power,2021,54(11):190-198.
[22]刘冬梅,霍龙龙,王浩然,等.基于PSO-SVM的电流放大器故障诊断研究[J].传感器与微系统,2021,40(8):50-52.LIU Dongmei,HUO Longlong,WANG Haoran,et al.Study on fault diagnosis for current amplifier based on PSO-SVM[J].Transducer and Microsystem Technologies,2021,40(8):50-52.
[23]李科.基于PSO-KNN的变电站设备三维点云识别方法研究[J].电力系统保护与控制,2021,49(18):182-187.LI Ke.3D point cloud research on an identification method based on PSO-KNN substation equipment[J].Power System Protection and Control,2021,49(18):182-187.
[24]任江涛,姚树宇,纪庆革.一种基于PSO同步进行特征选择及参数优化的核K近邻分类算法[J].小型微型计算机系统,2007,28(8):1461-1464.REN Jiangtao,YAO Shuyu,JI Qingge.Kernel KNN algorithm based on simultaneous feature selection and parameter optimization by PSO[J].Journal of Chinese Computer Systems,2007,28(8):1461-1464.