基于实时多维数据的窃电行为分析平台
2021-12-14赵长军傅瑶
◆赵长军 傅瑶
基于实时多维数据的窃电行为分析平台
◆赵长军 傅瑶
(重庆工业职业技术学院 重庆 401120)
本文设计基于实时多维数据的窃电行为分析平台,利用大数据分析建模技术,将与用户相关的生产、生活、信用多维数据通过流水线方式注入,进而利用全景窃电行为分析模型进行计算,得到有效的窃电嫌疑用户数据、窃电特征等结果,为电力企业精准的窃电定位提供支持。
多维数据;窃电行为;大数据
1 引言
随着社会用电量的增大,各种用户的用电费用增加,窃电问题变得越来越突出。科学技术的发展也让窃电手段日益高明,方法更加隐蔽,给查处带来了很大的难度。每年因为偷电,导致供电单位损失巨大。据统计,上海一年经过查处的窃电损失超过3000万元,且还存在大量无法稽查到的情况;天津市2016年查处偷电案2256件,挽回经济损失七千万。
本文设计基于实时多维数据的窃电行为分析平台,通过Hadoop大数据分析,将与用户相关的生产、生活多维数据通过流水线方式实时注入系统中,进行全景窃电行为模型计算分析。分析模型考虑了用户的家庭情况、气候、信用等多种参数,从而得到更为精准的窃电嫌疑用户数据、窃电特征等结果,为电力企业进行准确的窃电定位提供支持,提升企业的经济效益,保证社会用电安全。
2 基于实时多维数据的窃电行为分析平台架构
本文利用云平台的计算服务实现多维度窃电行为分析的大数据计算,采用部署于云端的Hadoop大数据平台构建分析系统,作为供电企业现有的本地数据中心的扩展;利用服务总线(Service Bus)实现服务共享,整合与其他系统如气候系统、电商系统、企业经营数据系统的服务与数据共享。通过数据共享方式,实现几个分析维度数据的整合。平台架构见图1。
多维度的数据通过数据服务共享方式统一获取到系统中,进一步进行窃电行为大数据分析。基于Hadoop,将几个维度的数据建立窃电分析模型。窃电分析模型设计基于上述几个维度的数据,模型采用几个策略:
(1)用户用电历史:颗粒度分别到天、月、年,以及多年的历史用电数据。此维度作为用电情况的参照数据。
(2)近期/实时用户用电数据:与历史同期同颗粒度用电情况进行对照分析,分析是否有变化、变化的幅度、方差等。
(3)水表、气表数据:家庭的用水用气情况基本能够反映家庭的人口情况,例如人口的增加,一般会带来持续的用水、用气增加,反之亦然。此维度数据可作为判断家庭人口变化的基准,而人口增加,必定也会带来用电量的增加。当一个家庭的用水持续激增,而用电量反而在下降,同样存在一定的窃电嫌疑。
(4)气候数据:参与对历史同期用电量的分析。例如同日期、同天气、同气温的情况下,历史同期的用电变化情况。分析的粒度可以为天、周、月。特别是夏、冬两个季节,因为制冷和取暖会使用高功率设备,如果在家庭情况不产生大的变化情况下,同期连续用电量差异较大,则嫌疑增加。
(5)电商信用数据:获取此用户消费信用数据、消费力数据。电商一般对用户的消费、退货、纠纷情况建立了对应的信用制度,可以作为个人信用的参考。同时从总体上来说,消费力较好的用户,窃电概率也会降低,依次为一定权重的参照系数,分析用户情况。
(6)企业产量、营业数据:对企业用电用户来说,产量与营业数据仍然反映了用电的情况。可以获取同类型企业用电-产量比,得到单位产量的用电情况,进而分析此企业/用户用电是否偏离正常。
图1 平台架构图
3 数据分析与建模
根据上述接口,获得全量多维数据后,可加载入系统,可按照防窃电分析模型进行嫌疑分析等。例如,对几个代表性的用户进行了数据采集,多维数据如表1所示。
表1 用户数据表
从气象系统获取历年每月平均气温数据。在采集了上述数据后,加载窃电行为分析计算模型到Hadoop大数据分析引擎中。分析步骤为:
(1)计算每月平均气温偏离比,得到每月用电影响气温因子:
即计算出当前月份往前12个月的平均气温与上轮对应12个月份的平均气温偏离比。例如当前为6月,平均气温为25度,而对应偏离比为|(26.5-25)/26.5| = 0.0566。
(2)获得用户信用值
每个用户都有自己的信用值,主要参考阿里提供的芝麻信用。芝麻信用是一个综合的信用评估报告值,结合了各个的资产、贷款、信用卡、生活缴费等多个维度的信用情况,具有很好的参考意义。
(3)计算家庭人口变化系数
用户家庭的水、气的使用情况往往随着人数变化而变化,根据抽样,可近似为线性增长。
(4)计算预估用电值
预估用电值,主要反映用户在气温变化、人口变化情况下,预计的本月用电量。是根据过去两年对应月份用电量,及家庭人口变化系数和每月用电影响因子,计算出预估本月用电量。
(5)计算窃电嫌疑评估值
根据预估的用电量,对比当月用电量,结合用户信用值,得到每个用户嫌疑评估值。
通过上述验证数据,可得出用户的窃电行为评估值结果。
4 结论
本文通过设计基于实时多维数据的窃电行为分析平台,将各类系统的数据进行数据集成,利用云计算大数据模型进行分析。构建窃电行为分析模型,将数据分析过程与结果提供给供电单位,让他们能够从中提取到自己关心的具有窃电嫌疑个体信息,开展针对性的稽查工作。利用大数据与云计算技术的优势整合现有的各类数据,建立云端的窃电行为分析系统,其有别于传统的部署大量用电计量防窃终端的方式,也有别于拉网式的人工稽查方式,让数据分析为工业生产服务。平台不仅仅基于现有的用电数据,更是引入了多维度的信息,包括天气变化对用电的影响、个人信用因素的影响、生产经营数据的影响等,这些数据让分析的结果更准确,更有实用价值。
[1]张素香,刘建明,赵丙镇,等. 基于云计算的居民用电行为分析模型研究[J]. 电网技术,2013(6).
[2]郝然, 艾芊, 肖斐. 基于多元大数据平台的用电行为分析构架研究[J]. 电力自动化设备,2017(8).
[3]徐磊, 杨秀, 张美霞. 基于数据挖掘的工业用户用电行为分析[J]. 电测与仪表, 2017(16).
[4]李端超, 王松. 基于大数据平台的电网线损与窃电预警分析关键技术[J]. 电力系统保护与控制,2018(5).