基于遗传算法优化BP神经网络的窃电分析
2017-12-07许均星李英娜
许均星,李 川,李英娜
(昆明理工大学 信息工程与自动化学院,云南 昆明 650500)
基于遗传算法优化BP神经网络的窃电分析
许均星,李 川,李英娜
(昆明理工大学 信息工程与自动化学院,云南 昆明 650500)
目前我国存在着严重的窃电现象,窃电手段繁多而且隐蔽,这使得工作人员的反窃电工作越来越难。基于供电企业能够采集用户用电数据,本文通过选取用户的相关历史数据进行处理和分析。根据对窃电数据特性的分析研究,挑选出月用电量、台区线损值、最大线损值、功率因素、三相不平衡率、合同容量比六个电气参量作为窃电数据的分析指标,采用遗传算法优化BP神经网络算法构建窃电分析模型,对指标样本数据进行分析,得到用户的窃电嫌疑系数,筛选出用电情况异常用户。本方法能够较方便、全面、智能的分析用户的用电情况,为供电企业实施反窃电工作指明了大致的方向,简化了反窃电的许多工作。
窃电;遗传算法;BP神经网络;数据分析
0 引言
现今许多用电用户通过各种各样的高科技手段来达到窃电的目的,这给电力企业带来了许多麻烦,阻碍了电力公司电力规划工作的进行[1],大量电能的流失给国家经济带来了巨大损失[2],据统计每年有超过十亿千瓦时的电量因用户窃电而损失。另外,这几年来有25%伤亡和火灾用电事故是因用电用户不规范用电引发线路出现问题造成的,给社会安定和谐带来了许多麻烦。因此,供电公司应该加大力度进行反窃电工作,如今用户的用电数据可以通过较成熟的用电信息采集系统集中采集[3-4]。那么通过什么方式更加全面、智能、方便、准确的对用户用电历史数据进行分析,找出用电异常用户,成为一个具有极大现实意义的研究课题。本文以电网中影响计量电量的电气参量作为研究对象,筛选出月用电量、所在台区线损、最大线损值、功率因数、三项不平衡率和合同容量比六个电气参量作为分析窃电特性的指标,引入遗传算法优化的神经网络算法建立用户窃电分析模型,得到用户窃电嫌疑系数。对于窃电嫌疑系数高的用户,视为可能存在窃电的用户,可派遣工作人员到现场稽查。根据现场的实践操作,该方法具有现实意义,大大减少了反窃电的工作量,方便了工作人员。
1 窃电方式分析
电量和功率是成正比的关系,单相的有功功率为[5]:
式中,Uφ是相电压;Iφ是相电流;cosφ为功率因数。
三相三线二元件有功功率为:
由上述公式可知电流I、电压U、功率因数cosφ三个要素和用户用电时间的乘积决定了电能表所计量的用电量,因此,改变电流、电压和功率因数中的任何一个要素都能够使得电能表所计量的用电量数据出错,成功的实现窃电的目的。另外,用户可以通过改变电能表的内部结构和电能表自身设定的一些参数来使得电能表计量出误,也能够实现窃电。
欠压法、欠流法、无表法、移相法和扩差法是现如今最主要的五种窃电方式[6-7]。现实使用过程中,用电用户并不会单独使用其中的某一方法,通常会将其中的几种方法相结合使得他们的窃电手段相当隐秘,再加上窃电方式和一些高科技技术的结合使得窃电方式不仅繁多而且不易被发现,这些阻碍了供电公司反窃电工作的进行。
2 研究理论
2.1 BP 神经网络理论
图1是BP神经网络[8-9]的结构拓扑图,BP神经网络将输入变量通过激励函数和不断调整每层连接的权阈值最终非线性映射到输出变量,为了使网络的输出变量与期望相一致,BP神经网络的学习一般需要多次的重复训练,使得到的误差值趋向于零,最终达到零[10]。BP神经网络是一种根据误差方向传播训练的多层前馈网络。
图1 BP 网络结构拓扑图Fig.1 Topological graph of BP network structure
BP神经网络算法的实现过程[11-12]:假设X = ( xij)是一个样本输入矩阵(i=1,2,…,n;j= 1,2,…,p),样本输入矩阵的每一行数据表示一组输入样本,每一组输入样本会对应一组输出样本,所有输入样本对应的实际输出样本为 Y =[y1, y2,… ,yn]T,每一列看作为样本的一个指标,那么输入层的输入样本 I1即为X。
如果网络的隐含层含有m个神经元,权值矩阵W = ( wij)(i = 1 ,2,… ,m; j = 1,2,… , p),阈值矩阵 B = [b1,b2,… ,bm]T,那么隐含层的输入:
其中,1onesn×表示1×n元素全部为1的矩阵。隐含层激励函数的选取为单极S型函数,其表达式为:
那么可以得到隐含层的输出为: O2= f( I2)。输出层的输入:
因为传递函数是线性函数,所以对于输出层的输出可以认为 O3= I3。为了得到各层之间的连接权阈值的调整量,使用链式微分法则来计算,计算得到的结果为:
其中, o nesn×1表示 n ×1元素全部为 1的矩阵。由公式(2)可知 f ′(x ) = f( x) [1 - f( x)],隐含层间的权阈值调整量进一步计算为:
根据公式(4)~(7)可以发现,因为BP算法选取的初始权阈值决定了从第二次到第n次调整权阈值时的权阈值,所以初始权阈值的选取决定了BP网络训练的准确度,如果初始权阈值的选取不当,就极有可能使网络在训练的过程中出现收敛速度慢且容易陷入局部最优解的陷进中去的情况,所以BP网络训练结果的好坏是跟初始权阈值的选取有很大关系的。
2.2 GA 优化BP神经网络
遗传算法[13](Genetic Algorithm,GA),也被称为进化算法,它是一种受生物的进化过程启迪而提出的启发式全局搜索算法。参考生物进化论,遗传算法将需要解决的问题模拟成生物进化的过程,通过选择、交叉、变异来产生下一代的解,通过计算个体的适应度,将适应度低的个体淘汰掉,增多适应度高的个体,经过n个的迭代找出适应度函数值最优的个体解。由于遗传算法是一种启发式全局搜索算法能够找出全局的最优解,这一特性正好可以弥补 BP神经网络容易陷入局部最优解的缺陷,所以本文使用遗传算法来优化 BP神经网络建立窃电分析模型,来提高模型预测结果的准确度。
通过以下几个步骤来实现遗传算法优化 BP神经网络[14]:
(1)编码与种群的初始化
使用遗传算法的前提是将问题的解编码成字符串的形式,采用二进制编码这种最简单的编码方式,将问题的解编码成二进制串结构数据的形式,不同组合的串结构数据构成了不同的点。随机产生N个初始串结构数据,每一个穿结构数据代表一个个体,这N个个体构成了一个种群,算法以这个种群作为初始种群开始进化。
(2)适应度评估。
适应度表明了个体解的优劣性,将预测结果输出与实际结果输出之间的均方误差作为个体适应度评估值,计算公式为:
式中,n为样本输入的数量;iy为网络的预测结果;io为实际结果,mse表示均方误差函数。
(3)选择操作
遗传算法的选择是通过选择一些适应性强的个体来繁衍下一代,本文采用一种“比例选择”选择策略,假设种群的个体总数为N,那么个体i的适应度值为:式中k为系数。
(4)交叉操作
本文采用单点交叉方式使染色体间交换其中的部分基因。
(5)变异操作
将染色体的某个基因进行变异,对于二进制编码的个体而言,具体的操作方式就是将1变成0或0变成1。
(6)将遗传算法搜索到的最优权阈值带到 BP神经网络中训练,遗传算法优化 BP算法的流程图如下图2所示。
2.3 GA - BP网络窃电预测模型
2.3.1 模型的建立
用电用户通过各种手段改变电能计量的相关参数,从而达到少缴电费的目的。本文根据能够影响电能表计量的电气参量和电能表计量出错给一些电气参量带来的变化,选取了月用电量、所在台区线损、最大线损值、功率因数、三相不平衡率和合同容量比这六个电气参量构成窃电评价指标系统,构建GA - BP神经网络窃电分析模型,将窃电评价指标的样本数据作为模型的输入样本,以用户窃电嫌疑系数作为输出变量,用窃电嫌疑系数表现用户用电情况,1表示用电情况异常,0表示用电情况正常。
2.3.2 模型的训练
在对模型进行训练之前,需要对窃电指标数据进行预处理来生成数据样本,由数据样本划分训练集和测试集,通过遗传算法搜索全局最优解作为网络初始权阈值,具体分为以下几个步骤来完成[15]:
(1)数据预处理
首先需要对电力计量数据进行关于窃电评价指标的计算,得到各个评价指标的数据,然后为了消除各指标数据之间的数量级与量纲差异,通过公式:
对各个窃电评价指标系统数据进行归一化处理,将各个窃电评价指标数据归一化至区间[,]a b上,这里x′表示归一化后的数据,x表示各指标的原始数据,maxx 表示各指标数据的最大值,minx 表示各指标数据的最小值,本文采取[0,1]归一化处理。
(2)划分训练集与测试集样本
实验数据来源于云南省某供电公司,数据为低压非居民用户数据,选取2012年8月该地区的56名用户的数据作为研究对象。这56名用户中,编号第25、26、27名的用户存在窃电现象,其他均未出现窃电现象。对研究对象的数据进行相关计算并归一化处理,处理后的数据样本如下表1所示,本文随机选取56组数据中46组数据作为训练集,剩下的10组数据作为测试集。
(3)遗传算法寻优
本文使用北卡罗来纳大学遗传算法优化工具箱,遗传算法具体参数的选取为:种群规模为500,遗传算法最大迭代次数为100,选择概率为0.9,交叉概率为0.5,变异概率为0.09。在算法迭代的过程中,种群个体的最佳适应度与平均适应度变化如图3所示。
由图3可以看出,在模型刚开始迭代的时候,种群个体的适应度值离最优适应度较远,个体适应度值大幅度上升,到了模型迭代的后期,由于模型的不断收敛,种群个体适应度值越来越靠近最优适应度。
完成上述的工作后,可以得到遗传算法搜索到的全局最优初始权阈值,将初始权阈值带入到网络中对BP网络进行训练。设定BP网络的训练参数:输入层的神经元个数为6个,隐含层的神经元个数为9个,输出层的神经元个数为1个,选取单极S型函数作为传递函数,选取梯度下降的 BP训练算法函数traingd作为训练函数,最大训练次数为2000次,学习速率为0.1,学习最小均方差目标为0.003。
2.3.3 模型的测试
经过训练测试,优化后的 BP神经网络可以准确预测训练集窃电嫌疑系数,但这预测结果可能是由于网络优化后处于过拟合状态下产生的,所以需要将测试样本数据带入模型,通过测试结果与实际结果对比来验证模型的准确性。导入测试集数据对模型进行验证,预测结果如图4所示。
从图4可以看出,经遗传算法优化后的BP神经网络的预测结果比未优化的 BP神经网络预测结果会更加贴近于真实的用户窃电嫌疑系数,但两者的预测结果精度都不是很理想,这主要可能由于以下原因导致的:①由于训练样本的数量不够多,网络并不能实现对特征数据波动趋势的充分学习;②窃电嫌疑的评价指标体系存在缺陷,影响电能表计量的因素有许多。所以供电公司在进行反窃电工作时,可以利用本文建立的模型对用户的用电情况做一个大致的判断,得到用户用电情况的大致信息,可以减少工作人员的工作量。
图2 遗传算法优化BP网络流程图Fig.2 Optimization of BP network flow chart based on genetic algorithm
表1 归一化后样本数据表Tab.1 Normalized sample data table
图3 适应度变化图Fig.3 Fitness change diagram
3 结束语
本文首先利用具有全局优化能力的遗传算法来搜索一组良好的 BP网络初始权阈值,然后根据窃电数据特征,选取了基于月用电量、所在台区线损、功率因数、三相不平衡率、最大线损值、合同容量比作为窃电评价指标系统,构建了遗传算法优化的BP神经网络模型,将评价指标的数据作为输入变量,以用户窃电嫌疑系数作为输出变量。最后经过模型对测试集的预测结果与实际结果的对比分析,证实了经遗传算法优化后的 BP神经网络在对用户用电情况的预测结果上有一定的提高。
本文建立的 GA-BP窃电分析模型虽然可以实现对用户窃电嫌疑系数的大致预测,但无法做到对用户是否窃电的精确预测。这主要是因为训练数据集过少,窃电嫌疑评价指标系统并不能完全概括用户窃电的手段带来的影响。所以,本文所建立的模型只能帮助反窃电工作人员反映用户大致的用电情况,给工作人员指引方向,减少工作人员的工作量。
图4 BP与GA - BP模型测试结果图Fig.4 BP and GA - BP model test result chart
[1] 赵兵, 吕英杰, 邹和平. 一种新型防窃电装置的设计[J].电力系统保护与监控, 2009, 37(23): 116-119.Zhao Bing, Lv YingJie, Zou HePing. Design of a new type of anti-theft device[J]. Power system protection and monitoring,2009, 37(23): 116-119.
[2] 王珏昕, 孟宇, 殷树刚, 等. 用电信息采集系统反窃电功能现状及发展趋势[J]. 电网技术, 2008, 32(增刊2): 177-178.Wang YuXin, Meng Yu, Yin ShuGang, et al. The status quo and development trend of the anti-theft function of electricity information acquisition system[J]. Power grid technology,2008, 32 (supplement 2): 177-178.
[3] 牟龙华, 朱国锋, 朱吉然. 基于智能电网的智能用户端设计[J]. 电力系统保护与控制, 2010, 38(21): 53-56.Mou LongHua, Zhu GuoFeng, Zhu JiRan. Intelligent client design based on smart grid[J]. Power system protection and control, 2010, 38 (21): 53-56.
[4] 高强, 张保航, 谷海青. 用户端电能管理系统的研究现状与发展趋势[J]. 电力系统保护与控制, 2012, 40(7): 148-155.Gao Qiang, Zhang BaoHang, Gu HaiQing. Current research status and development trend of client power management system[J]. Protection and control of power system, 2014,40(7): 148-155.
[5] 曹峥, 等. 反窃电系统的研究与应用[D]. 上海交通大学, 2011.Cao Zheng, et al. Research and application of anti-theft system[D]. Shanghai jiaotong university, 2011.
[6] 陈乐培. 智能计量监控在反窃电工作中的应用[J]. 城市建设理论研究, 2013(9): 1-3.Chen Le Pei. Application of intelligent metering monitoring in anti-theft work[J]. Research on urban construction theory,2013(9): 1-3.
[7] 戴俊峰. 电能表错接线远程诊断系统[D]. 北京: 北京交通大学, 2006.Dai JunFeng. Remote diagnosis system of power meter wrong wiring[D]. Beijing: Beijing jiaotong university, 2006.
[8] CHEN Q, HUANG K M, YANG X Q, et al. A BP neural network realization in the measurement of material permittivity[J]. Journal of Software, 2011, 66: 1089-1095.
[9] MEN H, ZHANG J, ZHANG L H. Intelligent recognition for microbiologically influenced corrosion based on hilberthuang transform and BP neural network[J]. Journal of Computers, 2012, 7(9): 2 283-2 291.
[10] ZHANG H S, XU D P, ZHANG Y. Boundedness and convergence of split-complex back -propagation algorithm with momentum and penalty[J]. Neural Processing Letters, 2014,39(3): 297-307.
[11] 张敏, 徐启华. 基于改进BP的神经网络模型参考自适应控制[J]. 软件, 2015, 36(7): 118-123.Zhang Min, Xu QiHua. Neural network model reference adaptive control[J]. software based on improved BP, 2015,36(7): 118-123.
[12] 王宏涛, 孙剑伟. 基于BP神经网络和SVM的分类方法研究[J]. 软件, 2015, 36(11): 96-99.Wang HongTao, Sun JianWei. Research on classification methods based on BP neural network and[J]. software SVM,2015, 36(11): 96-99.
[13] 薄钧戈, 苏红旗. 一种基于遗传算法的排课方法研究[J].软件, 2014, 35(1): 43-45.Bo JunGe, Su HongQi. A class scheduling method based on genetic algorithm[J]. software, 2014, 35(1): 43-45.
[14] 聂敬云, 李春青, 李威威, 等. 关于遗传算法优化的最小二乘支持向量机在MBR仿真预测中的研究[J]. 软件, 2015,36(5): 40-44.Nie JingYun, Li ChunQing, Li WeiWei, et al. Research on least squares support vector machine optimized by genetic algorithm in MBR simulation and prediction[J]. software,2015, 36(5): 40-44.
[15] 黄宏运, 朱家明, 李诗争. 基于遗传算法优化的BP神经网络在股指预测中的应用研究[J]. 云南大学学报: 自然科学版, 2017, 39(3): 350-355.Huang hongyun, Zhu jiaming, Li shizheng. Research on the application of BP neural network based on genetic algorithm optimization in stock index prediction[J]. Journal of yunnan university: natural science edition, 2017, 39(3): 350-355.
Power Stealing Analysis Based on Genetic Algorithm Optimized BP Neural Network
XU Jun-xing, LI Chuan, LI Ying-na
(Faculty of Information Engineering and Automation, Kunming University of Science and Technology, Kunming 650500, China)
At present, there is a serious theft phenomenon in our country, and the theft of electricity is various and hidden, which makes it more and more difficult for the staff to work against the theft of electricity. Based on the ability of power supply enterprises to collect user data, this paper deals with and analyzes relevant historical data of users.According to the analysis and study the characteristics of the power data, choose here electricity consumption,area line loss value, maximum line loss, power factor, three-phase imbalance rate, contractual capacity than six electrical parameters as power data analysis indicators,The genetic algorithm is used to optimize the BP neural network algorithm to construct the model of the electric theft analysis, analyze the data of the indicators and obtain the user's suspicion coefficient, and screen out the abnormal users of the electricity situation.This method can be convenient,comprehensive and intelligent to analyze the electricity situation of the users, which indicates the general direction of the anti-theft work for the power supply enterprises, and simplifies many work of the anti-theft electricity.
Electricity-stolen; Genetic algorithm; BP neural network; Data analysi
TP183
A
10.3969/j.issn.1003-6970.2017.11.003
本文著录格式:许均星,李川,李英娜. 基于遗传算法优化BP神经网络的窃电分析[J]. 软件,2017,38(11):18-23
国家自然科学基金(51567013)
许均星(1993-),男,硕士研究生,研究方向:电网能量与电气参量分析;李川(1971-),男,教授,研究方向:光纤传感研究;李英娜(1974-),女,副教授,研究方向:传感网组建与信息集成和智能分析。