基于大数据分析的电网窃电行为特征自动提取模型
2023-10-05马占海张俊超田光欣
马占海,张俊超,田光欣
(国网青海省电力公司信息通信公司,青海西宁 810008)
电力系统影响着人们的生活,关系着国家的发展。目前,工业企业及生活用电需求不断攀升。在利益的驱使下,存在通过不合法的手段来获取电量的情况[1]。近年来,窃电手段变得越来越多样化,高科技的窃电手段会干扰计量装置,破坏电子式电能表的计量装置,导致装置出现误差[2]。目前,大量学者针对用电窃电行为进行了研究,刘海等人[3]提出了基于C-lightGBM 的用户窃电检测方法,建立窃电检测模型,设置轻量级提升决策树分类器,利用分类器进行检测,同时使用CNN 深度特征进行电力检测,从而达到快速分类的目的,该方法能够有效提高检测精度,但不具备自动检测能力。赵云等人[4]提出了一种相关性与聚类自适应融合技术的窃电检测方法,将最大互信息系数技术和密度峰值快速聚类实现融合检测,分析用户之间的相关性,提高检测的适用性,但是这种方法的自动化能力相对较差。
大数据分析技术具有数据量大、速度快、种类多和价值丰富的优点。因此,文中提出基于大数据分析的电网窃电行为特征自动提取模型,并通过实验验证了模型的实际应用效果。
1 大维随机矩阵电力预处理
以时间序列对电力数据进行存储,通过合理的变换方式实现电力大数据矩阵随机分析,利用预处理方法确定矩阵的随机条件。在大维随机矩阵理论中,电力数据会有更加灵活多样的表现方式,变量处于随机分布状态,能够有效提高窃电识别效果。[5-6]。
在电力系统中确定观测点,设定共有N个,建立时间序列维度并统计显示,电力系统共有m个维度。设定电力系统工作时间为t,则在t时刻中,共有m个参量[7],则观测点i(i=1,2,…N)在时间序列的电力数据样本可以表示为:
在得到每个观测点的矩阵后,使用叠加方式确定原始大维度随机矩阵,行列比计算公式如下:
其中,c为得到的行列比。由于在正常状况下,Nm的数值小于t,因此必须通过变换处理使原始矩阵更具多样性。
选取观测点i(i=1,2,…N),拆分矩阵,设定拆分段为k段,则有:
对得到的N个矩阵进行叠加,叠加处理后,能够得到大维随机矩阵,在N个观测点内部的大维随机矩阵可以表示如表1 所示。
利用大维随机矩阵能够很好地监测电力系统用户状态,对用户信息进行存储,通过共享的方式反映用电的电流和电压数据,在得到合适的参量后,利用预处理实现分析[8-9]。
矩阵需要去量纲化和数值归一化处理,在统一处理后,不同的矩阵具备可比性,根据极限谱分布理论对数据进行预处理[10]。通过标准化处理使数据矩阵从二维矩阵转换成三维矩阵。由于元素内部数据都为实数,因此需要对样本协方差矩阵进行奇异化处理,在复平面上完成处理。
2 电网窃电行为特征识别
在完成信息预处理后,对电网窃电行为特征进行识别。在对电网窃电行为特征进行识别后,首先确定线路是否存在线损异常,然后逐个台区进行检测,分析台区是否存在异常[11]。在确定异常后,对不同用户的窃电嫌疑程度进行判断,通过全方位的分析确定窃电时间区段,最后根据窃电分析确定重点嫌疑用户,从而更好地实现识别和监测。在对电网窃电行为特征进行识别时,要采用针对性的方式,不断寻找窃电用户,从而实现识别,识别采用递进的方式[12-13]。首先寻找所有线路中线损较高的线路;然后对线路上的台区进行锁定,确定电量异常高的台区[14];最后在台区内部缩小到用户单位,寻找台区内部窃电嫌疑最大的用户,依次排序,寻找窃电时间数据,从而能够实现快速识别窃电行为特征。
3 电网窃电行为特征自动提取
若用电用户都属于正常用户,则线路处于正常状态,即使存在线损,波动值也在恒定值附近。一旦有用电用户存在窃电行为,线路的线损就会瞬间陡增,本来呈现曲线变化的线损值会出现峰值[15]。
除了窃电行为之外,如果用户在用电过程中存在负载三相不平衡或者电力设备异常,则会出现线损增加。因此线损异常只是判断用户存在窃电行为的一个指标,而并不是唯一指标,用户可以通过分析线损异常状况进行筛选,寻找窃电嫌疑大的用户,通过逐步分析,使分析结果更加准确,提取的电网窃电行为特征更具有代表性。
分析图1 滑动窗口构造可知,利用正向有功电量分析用电参数,确定不同采样时刻的不同时间区段内电表示数差值,从而得到累积量,反映不同时刻用户的用电情况。
利用大数据挖掘技术在电力系统中提取不同的线路,计算线损时间,并将计算结果输入到样本内部,建立随机矩阵,通过预处理得到有效的矩阵数据,再进行标准化处理,计算线路特征,得到复平面上的分布圆环,从而得到不同台区线损的异常率,判断异常程度,筛选出异常状态较高的线路。
对异常状态较高的线路进行台区划分,设定线路上共有M个台区,一旦用户存在窃电行为,该用户的窃电量必然会减少,则证明用电总量有可能存在异常情况。基于大数据分析的电网窃电行为特征主要有视在功率、三相电压不平衡率、三相电流不平衡率和功率因数,分析用户的用电量和用电负荷,由于二者蕴含的信息相同,因此可以相互转化两个指标,利用这两个指标来反映用户的用电行为状态,在大维随机矩阵中寻找功率参量,从而更好地构建大维随机矩阵。设定视在功率为随机矩阵内部的参数,将视在功率分为有功功率和无功功率,从而更好地完成大数据挖掘[16-18]。
分别计算三相电压不平衡率和三相电流不平衡率,根据计算结果判断用户是否存在欠流或者欠压的情况,欠压判别计算公式如下:
其中,ua、ub、uc表示A相、B相、C相对应的电压;max{ua,ub,uc} 表示三相电压最大值;min{ua,ub,uc} 表示三相电压最小值;ξUt表示欠压判别结果。
欠流判别计算公式如下:
其中,ia、ib、ic表示A相、B相、C相对应的电流;max{ia,ib,ic} 表示三相电流最大值;min{ia,ib,ic} 表示三相电流最小值;ξIt表示欠流判别结果。
在分析上述特征排序后,处理分离函数,分析不同时间区段内圆环点,从而比较窃电时间区段。识别内部特征,从而判定用户的用电量是否存在异常,如果存在异常,则需要对现场状况进行勘察,及时解决问题。
4 实验研究
为了验证文中提出的基于大数据分析的电网窃电行为特征自动提取模型的有效性,进行实验研究,选取某省级电网作为研究对象,分别部署基础数据平台,比较线损,实现窃电预警。将提出的自动提取模型接入到省级电网中,电网的存储容量为12 TB,每条记录400 个字节,每日数据量的增长为8 GB。
建立的物理节点配置环境如图2 所示。
图2 物理节点配置环境
根据图2 可知,当节点发展到一定模式后,出现窃电现象,分析各种不同节点的运行参数,得到时间序列矩阵。实验运行参数如表2 所示。
使用文中自动提取模型对电网正常运行状态和窃电状态,得到的协方差特征值谱分布方式如图3所示。
根据图3 可知,在不存在窃电行为时,电网的特征值全部集中在圆环内部,内环和外环中间值与特征值谱半径相吻合,一旦发生窃电行为,线损方差矩阵特征值以集中地方式分布在圆环中心。
表2 实验运行参数
图3 窃电发生前后特征谱分布实验结果
发生窃电前后方差特征值密度函数如图4所示。
图4 窃电发生前后方差特征值密度函数
根据图4 可知,电网的运行状态为正常状态时,特征值谱密度函数的规律为M-P 规律。而一旦出现窃电行为,电网内部数据存在异常,分布方式不再是独立分布,特征谱函数偏离M-P 定律。因此文中研究的特征自动提取模型,通过分析特征值谱密度函数与M-P 规律的重合度,判断是否发生窃电行为。
电网窃电时间实验结果如图5 所示。
图5 电网窃电时间实验结果
观察图5 可知,当电力系统不存在窃电现象时,特征值平均谱半径以平稳的方式进行波动。而在出现窃电现象后,特征值平均谱半径会产生两个非常显著的突变点,这两个突变点正好对应窃电的起始时间和终止时间。因此,文中研究的特征提取模型能够更好地反映出电网的运行状态,确定分析平均谱半径的变化状况后,可以确定系统运行的异常点。
5 结束语
文中利用大数据分析技术研究了电网窃电行为特征自动提取模型,对数据进行预处理,实现信息分析,从而完成特征自动提取。设计的特征自动提取模型同时分析了多个参数,实现数据采集、数据存储和数据处理,分析线损状况和台区状况,完成电力数据的实际应用。文中研究的特征自动提取模型能够充分利用大数据技术优势,更好地实现窃电。但是文中对电网实时运行分析的研究较少,难以更好地完成负荷预测,因此未来需要进一步深入研究这一问题。