基于多特征融合的窃电识别算法研究∗
2018-01-04邓明斌徐志淼邓志飞迟艳杰
邓明斌 徐志淼 邓志飞 张 卓 迟艳杰
(广州供电局有限公司 广州 510620)
基于多特征融合的窃电识别算法研究∗
邓明斌 徐志淼 邓志飞 张 卓 迟艳杰
(广州供电局有限公司 广州 510620)
针对目前专变大用户窃电手法多样化,而传统的防窃电技术可行性较低。基于国内外研究现状,提出一套基于多特征融合的异常用电智能分析模型的实施方案。通过对异常用电的表现行为进行特征提取,基于每个特征采用机器学习方法学习用电异常的判决阈值,针对每一个具体特征均进行了独立的异常检测后,采用多特征融合的方法对独立的检测结果进行融合,获得综合的结果。将该结果通过异常指数分析模型计算异常指数,最后通过异常阈值筛选出异常用电户。通过该方法,基本能够做到将用电行为异常的窃电用户筛选出来。
用电行为;特征提取;多特征融合;窃电识别
1 引言
反窃电一直是供电企业关注的问题。特别是针对专变大用户,由于其用电量普遍较大,当发生窃电行为时,电量损失极为严重[1~2]。随着科技的发展,窃电行为更直接导致用电行为异常的表现形式多种多样。由此可见,不同的窃电手段会表现出完全不同的电气特征和行为特征,如果仅采用单一特征模型进行异常行为的检测必将会产生较大偏差,难以决策。
因此,通过综合分析目前窃电行为的多样化及其表现特征的差异性,将建立一种基于多特征融合的异常用电智能分析模型。图1给出了基于多特征融合的异常用电分析模型组成。根据不同窃电手段可能导致的不同电气特征和行为特征进行独立检测评估,然后采用特征融合算法将独立评估结果进行融合,形成最终的评估结果,并基于综合评估结果展开异常用电行为的检测与定位[3~4]。
图1 基于多特征融合的异常用电分析模型
2 反窃电异常特征
根据窃电行为和用户窃电特点,并参考供电行业同行对专变用户的窃电嫌疑系数产生影响的指标,拟从电气特征和用电行为特征对用户进行窃电嫌疑检测。用电行为特征主要有日用电量离散系数、用户/行业月用电量离散系数比[5],各项特征具体描述如下[6~7]:
1)额定电压偏离度。由于用户电压总能保持平稳,当采集的电压数据发生大幅向下波动,必然产生用电异常。因此,采集的电压数据与报装的额定电压的偏离程度,可以较好地体现用电异常的程度。
2)电压不平衡度。三相电压不平衡率指三相电压间的差异,其可以反映出电压欠压现象,电压不平衡度计算式为[8]
式中,avedev为三相电压的平均绝对偏差;mean为三相电压的平均值。电压不平衡度越低,表明电压异常的概率越低,反之越高。
3)电流不平衡度。类比于电压的不平衡度,三相电流的不平衡率能够很好地反映电流的欠流现象,计算式如下:
4)电流相关系数。电流相关系数主要考察三条相线上负载同步工作的程度,用电异常的三相电流数据的运行轨迹差异较大,各相线上测量到的电流数据的相关性减弱。因此,电流相关性数值越大,表明电流异常的概率越低,反之电流异常的概率越高。
5)日用电量离散系数。该特征主要观察用电户用电行为的长期一致性,如果用电行为稳定,则波动率在一个较小的幅度内波动,否则将出现剧烈波动。日用电量波动率主要由日用电量标准差和均值进行计算,具体计算式如下:
正常用户的日用电行为应保持平稳,日用电量离散度系数具有较小的波动率,反之则具有较大的波动率。
6)用户/行业月用电量离散系数比。
正常用户/行业月电量离散度系数比较稳定、规律,而且值相对较小。相反异常用户/行业月电量离散度系数则变化很明显,波动较大,而且值相对偏高。
对于每一种特征,特征阈值的设定需要通过对历史正常用户和窃电用户的用电数据采用数据挖掘中的聚类分析技术,针对每一项特征都进行聚类分析(具体采用基于欧氏距离的K-means),得出各项特征的正常类、嫌疑类和异常类三类,并继续用机器学习技术对各项特征的上述三类分别进行学习,学习出各类判决阈值。
3 基于多特征融合的用电模型
通过定义多种用电特征,并分别提供了各项用电特征的计算公式与异常检测算法,得到每个特征在检测周期内的判决结果。由于多种用电特征为独立的评估结果,需要进行多特征融合,形成最终的评估结果,并基于综合评估结果展开异常用电行为的检测与定位。因此,基于广泛应用于智能决策、专家系统以及工业控制领域的证据理论,设计了用电异常行为检测的多特征融合算法。
基于多特征融合模型的训练框架为概率分布,因此需要将各个特征依据各自的判决阈值转化为对应的正常、嫌疑、异常的概率分布。假设检测周期为一天,特征1、特征2、特征3为每一个小时对应一个特征,特征4、特征5、特征6为每一天对应一个特征,因此需要通过不同的方法将每个特征的判决结果转化为对应的概率分布。
针对特征1、特征2、特征3,通过判别阈值分别判别每小时每个特征属于正常类、嫌疑类还是异常类,并统计检测周期内的每个特征属于N(正常)、N(嫌疑)、N(异常)的小时数,按照式(5)即可将每个特征转换为对应概率分布。
针对特征4、特征5、特征6,通过判别阈值分别得到每天每个特征属于正常类、嫌疑类还是异常类,按照反距离加权法即可将每个特征转换为对应概率分布,具体计算如式(6)所示。
其中,d(正常)、d(嫌疑)、d(异常)分别为特征训练阈值时聚类的正常,嫌疑异常中心点的距离。
将用电行为是否异常视为需要判决的问题,用电特征异常检测算法的输出所有可能结果的集合为正常、嫌疑、异常三部分,该集合即为一个用电异常辨识框架。由于m(Ø)=0,m(正常)+m(嫌疑)+m(异常)=1,因此完全符合证据理论的模型条件。多特征融合算法描述如下[9~10]:
1)首先将所有用电户的用电行为均划分为三类,即{正常,嫌疑,异常},将此组合作为多特征融合算法的用电异常识别框架;
2)基于用电异常识别框架,借助用电特征异常检测算法输出的每一个用电户的每一项用电特征的属于正常、嫌疑、异常的概率分布,即m(正常)、m(嫌疑)、m(异常),将它们组成一个用电异常可信度分配;
3)对于每一个用电户的多项用电特征,借助用电特征异常检测算法就可以获得多个对应的用电异常可信度分配;
4)由于多项用电特征的用电异常可信度分配在统一的用电异常识别框架内,即可以用改进的D-S合并法则完成多项特征的用电异常可信度分配完成合并,具体的合并如下:
(1)对n个用电特征,每个用电特征正常、嫌疑、异常的概率分布为{m(A1),m(A2),m(A3)},设特征i和j的冲突大小为kij,则:
(2)定义k为n个特征集中每对特征冲突总和的平均,它反映了证据两两之间的冲突程度,定义ε为特征的可信度,其计算公式为ε=e-k;当证据之间的冲突增大时,证据的可信度将降低。
(3)定义 p(A)和q(A)分别对应n个特征的乘积、平均值具体计算如下:
(4)设归一化常数:
新的合成公式如下:
经过上述多特征融合算法步骤后,输出的m(正常)、m(嫌疑)、m(异常)、m(x),即为多个用电特征异常检测结果的融合评估结果,其中m(x)为不确定百分比。但该结果无法直接用于判断用电户的用电行为异常程度。
需要采用用电行为异常指数算法对多特征融合结果进行评估。用电异常指数:
异常用电指数的数值越高表明用户的用电行为异常程度越高,窃电的可能性越高;反之,则越低。通过对正常用户和窃电用户的历史数据评估得到的用电异常指数,采用Kmeans算法进行聚类分析,将所有历史综合评估聚为两类正常与异常,设定窃电阈值。
4 案例分析
以广州市2016年10月17日这一天20个专变大用户的用电数据为例,分析多特征融合算法对于异常用电行为分析的检测效果。将这20个专变用户的用电数据分别进行特征提取,基于训练阈值判决,然后将各个特征的判决结果基于多特征进行融合,得到融合后正常、嫌疑、异常、不确定的百分比,最后按照异常指数算法将融合的结果转化为异常指数。具体融合结果如表1所示。
通过对历史正常用户和异常用户综合评估,采用Kmeans算法进行聚类分析,确定异常指数的判决阈值为0.45,依据该阈值可判断在20个用户中,有6个用户是窃电用户,14个用户是正常用户。通过对比正常用户和异常用户该天基于多特征融合的结果,正常用户的正常百分比远大于嫌疑和不确定百分比,异常百分比极小,而异常用户的正常百分比较小,异常和不确定百分比偏大。对比用户的用电行为异常指数,用户用电行为越正常,用电异常指数越趋近于0;当用户用电行为出现异常时,则异常指数越趋近于1。
表1 广州市部分专变大用户基于多特征融合的用电行为分析表
因此,基于多特征融合算法能够较好地筛选出用电行为异常的用户,最终通过现场检查、锁定查获窃电户。
5 结语
基于多特征融合的异常用电智能分析模型的实施方案,通过对异常用电的表现进行特征提取,基于每个特征采用机器学习方法学习用电异常的判决阈值,针对每一个具体特征均进行了独立的异常检测。不同于常规的加权求和方法,而是采用多特征融合的方法对独立的检测结果进行融合,获得综合的、便于理解的评估结果。当然在实际的应用中,还需要对经现场确认存在窃电行为,或存在误报的用电数据分析结果反馈至分析模型,对各类阈值进行不对的训练和优化,使分析模型不断提高精度,且稳定工作。
总而言之,综合运用基于多特征融合的异常用电模型分析,能够将符合上述特征的窃电用户及时准确地筛选出来,更好地维护正常的供用电秩序。
[1]蔡淞,鲁帅.基于多特征融合的人脸识别研究[J].计算机应用与软件,2015,32(12):140-144.CAI Song,LU Shuai.The face recognition based on multi-feature fusion[J].Computer Applications and Soft⁃ware,2015,32(12):140-144.
[2]战扬.融合纹理特征和形状特征的医学图像分类方法[J].信息技术,2013(6):44-46.ZHAN Yang.The medical image classification method of fusion texture features and shape features[J].Information Technology,2013(6):44-46.
[3]王大伟,陈定荣,何亦征.面向目标识别的多特征图像融合技术综述[J].航空电子技术,2011,42(2):6-12.WANG Dawei,CHEN Dingrong,HE Yizheng.A Survey of Feature-level Image Fusion Based on Target Recognition[J].Avionics Technology,2011,42(2):6-12.
[4]戴雯惠.一种基于多特征融合的彩色图像检索方法[J].电脑与信息技术,2011,19(5):15-17.DAI Wenhui.A color image retrieval method based on multi feature fusion[J].Computer and Information Tech⁃nology,2011,19(5):15-17.
[5]杨丽召.基于多特征融合的行为识别算法研究[D].成都:电子科技大学,2013:16-17.YANG Lizhao.Research on behavior recognition algorithm based on multi feature fusion[D].Chengdu:University of Electronic Science and Technology,2013:16-17.
[6]刘涛,杨劲锋,阙华坤,等.自适应的窃漏电诊断方法研究及应用[J].电气自动化,2014(2):60-62.LIU Tao,YANG Jinfeng,QUE Huakun,et al.Study and Application of a Self-adaptive D iagnosis Method for Elec⁃tricity Stealing and Leakage[J].Electrical Automation,2014(2):60-62.
[7]谭致远.基于用电行为分析的在线用电异常及风险监测系统的设计与实现[D].广州:华南理工大学,2015:23-24.TAN Zhiyuan.The design and implementation of the on⁃line power consumption anomaly and risk monitoring sys⁃tem based on the analysis of the use of electricity[D].Guangzhou:South China University of Technology,2015:23-24.
[8]黄朝凯,林锐涛,姚伟智,等.基于准实时数据的反窃电在线监测及诊断分析模型的研究[J].电子设计工程,2015,23(14):155-157.HUANG Chaokai,LIN Ruitao,YAO Weizhi,et al.The re⁃search of expert decision system of online anti-electricity stealing monitoring based on analysis of electrical behav⁃iors[J].Electronic Design Engineering,2015,23(14):155-157.
[9]张良,刘晓胜,戚佳金,等.一种低压电力线通信改进分级蚁群路由算法[J].电工技术学报,2014,29(2):318-323.ZHANG Liang,LIU Xiaosheng,QI Jiajin,et al.Study of Improved Hierarchical Ant Colony Routing Algorithm for Low-Voltage Power Line Communication[J].Transactions of China Electrotechnical Society,2014,29(2):318-323.
[10]刘博,刘晓胜,徐殿国.基于新距离测度的电能质量测量数据压缩算法[J].电工技术学报,2013,28(9):129-136.LIU Bo,LIU Xiaosheng,XU Dianguo.Power Quality Measuring Data Compression Based on New Distance Measurement[J].Transactions of China Electrotechnical Society,2013,28(9):129-136.
Study on Stealing Recognition Model Based on Multi Feature Fusion
DENG Mingbin XU ZhimiaoDENG ZhifeiZHANG ZhuoCHI Yanjie
(Guangzhou Power Supply Bureau Co.,Ltd.,Guangzhou 510620)
For the present situation,the stealing power methods of specialized users are various.At the same time,the feasi⁃bility of traditional anti-stealing power measures is low.A scheme of abnormal electricity intelligent analysis model based on multi-feature fusion is provided for this phenomenon.This scheme extracts the features of abnormal power performance and then judge the feature with threshold which is trained by machine learning methods.By fusing the judged result of each feature with the multi-feature fusion,the result can be transformed to abnormal exponent for screening of abnormal based on abnormal threshold.By this method,abnormal electricity users will be screened out basically.
electrical behavior,feature extraction,feature fusion,stealing recognition
Class Number TP391
TP391
10.3969/j.issn.1672-9722.2017.12.016
2017年6月4日,
2017年7月16日
邓明斌,男,硕士,工程师,研究方向:营销稽查与反窃电技术。徐志淼,男,硕士,助理工程师,研究方向:营销稽查与反窃电技术。邓志飞,男,助理工程师,研究方向:营销现场检查工作。张卓,女,硕士,工程师,研究方向:营销现场检查工作。迟艳杰,女,助理工程师,研究方向:营销稽查工作、大数据分析和反窃电技术。