基于神经网络模型的场景式稽查方法研究
2022-03-26田雪松付瑶王欣王萱陈莹
田雪松,付瑶,王欣,王萱,陈莹
(国网天津市电力公司营销服务中心,天津 300120)
0 引言
随着电网营销服务工作的深入推进,营销工作日益面临着业务快速变化、用电客户数量激增、供电服务半径增大、客户需求差异增大、客户与电力信息交互频繁等方面的挑战。客户对供电服务要求也越来越高,电力客户对电网企业的服务方式、服务内容和服务质量不断提出新要求[1]。
通过加强营销稽查管控工作,防范企业经营与服务风险,促进营销转型升级和高质量发展,通过开展基于用户用电大数据的稽查甄别技术的探索,有效解决依赖人工排查带来的效率低、不准确等问题[2]。
1 研究目标及思路
研究基于大数据的场景式稽查主要是基于电量类指标、负荷类指标,电压电流类指标,线损类指标和报警类指标等信息,进行智能用电异常分析,需根据建模要求有选择性地从用电信息采集系统及电力营销业务系统中抽取电量、负荷、电压、电流、报警及线损等数据,基于数据预处理后的数据,结合用电异常评价指标体系,构建专家样本库[3]。在样本数据准备完成后,即可以进行模型预测、模型构建、模型评估,并结合机器学习技术自动对模型进行优化和重构,对评价指标进行调整,使整个电智能诊断模型更智能,分析的结果更精确(图1)。
图1 研究思路
2 场景式稽查研究数据来源
2.1 电力数据来源
在电力侧资源下,依托用电采集系统和营销业务系统。主要包括以下信息,如表1所示。
表1 内部数据信息表
2.2 外部数据来源
基于Python获取不同类别的用户用电异常外部数据信息,进行交叉验证。对于使用民电对外经营类违约用户,通过开放的商户数据源以及地图软件开放数据接口,获取用户的地理位置、营业时间、经营范围等数据,作为商业行为证据。对于使用民电办公类用电异常用户,通过工商部门企业注册的地址、运营状况等数据,对照居民用户电力数据分析比对,得到验证结果。
3 基于神经网络技术的稽查分析模型
电力营销稽查需要遍历全部关联数据,对用电采集数据进行抽取与存储,通过采集数据治理实现数据预处理,包括数据格式管理、数据完整性检查、营销数据格式校验、档案问题管理、电压电流缺失数据管理、重复数据管理、电压电流错误数据管理、换表行为分析、用户电表异常事件分析等[4]。
大数据建模采用深度学习框架TensorFlow搭建,利用GPU设备加速训练。采用K折交叉验证对模型效果进行验证,其中异常用电识别模型采用准确度、召回率、AUC等指标进行效果评估。模型部署后通过离线分析和线上分析同时进行模型评估。离线部分,针对带标签的测试集合,利用AUC指标计算用电异常识别模型的准确性,AUC越大,表示用电异常识别模型越准确。线上实际运行过程中,对接入用户数据进行近实时预测,将超过在建模过程中选择的概率阈值的疑似用户结果提供给业务人员使用,辅助进行用电异常核实,根据核实结果计算用电异常识别模型的查准率,进而评估实际运行过程中的准确性[5-6]。
用电历史核查记录中各种用电异常的标签y=1,其他用户作为负样本y=0。针对公变低压用户和专变用户分别建立用电异常分析模型。对比并选择梯度上升决策树、LSTM神经网络时序模型、SVM等模型,通过模型训练,建立X与y的关联。其中,LSTM模型结构图如下图2所示。
图2 用电异常稽查分析模型图
每一个时刻,神经网络模型的输入包含当前时刻的多维特征X,通过各隐藏层的变换,得到当前时刻t的n个状态节点St=<S1,S2, S3,…,Sn>。在此DNN网络基础上,结合时序长短期记忆模型(long short-term memory,LSTM),时刻t的输出为当前时刻状态St和前一时刻状态St-1的函数Ot=f(St+W×St-1)。LSTM能够同时建模客户长期和短期数据中依赖关系,并随着时间发展迭代训练、预测。模型最终输出稽查异常的概率Pi=1/(1+e-Ot)。
稽查模型根据人工核实结果,反馈到模型的训练过程中,形成数据优化闭环,持续优化模型效果。考虑到不同地区的样本数据千差万别,在优化过程中对特定地区的用户特性相应建模方法单独进行优化。针对不同用电量规模的用户,其用电行为有显著差异,不同用电量等级的用户的模型建模结果会有所不同。对于不同用电量的用户,应基于其电能表日冻结数据、用电用户档案、电能表规格等信息,分析其用电行为,判断用电量不同对用电异常识别带来的影响,将用电异常识别模型不断完善及优化,使得对不同特点的用户识别更加准确。针对不同承载用户量的台区,其线损特性不同,其模型需要进一步优化和适配,不同地区的大用户数台区因供电半径和用户负荷特性不同,需针对具体情况进行优化和适配,并针对现场核查结果进行不断适配,对模型进行调优,不断提高模型计算的准确性。
4 基于稽查分析模型的窃电场景应用
4.1 窃电稽查分析
(1)反向电量分析:经过对计量装置在线监测、线损、用户电量等数据分析,高压通过反接A、C相电流的窃电方式会在系统中产生反向电量异常,同时结合用户用电量的变化和所属线路的线损变化进行分析,在窃电期间会直接导致用电量下降和线损率上升,以此综合判断疑似反接A、C相电流窃电用户。
(2)电流不平衡分析:用户通过短接电流线的方式窃电,系统数据反映出特征是电流不平衡,同时从用户用电量下降和线损上升的变化综合判断疑似短接电流线的方式窃电。
(3)电表异常事件特征:全面梳理电能表倒走、电能表停走、电能表费率设置异常、电压断相、电压越限、电压不平衡、高供高计B相异常、电流失流、电流不平衡、电能表开盖、计量门开闭、恒定磁场干扰、电量差动异常、功率差动异常、负荷持续超下限、反向电量异常、相序异常、潮流反向和剩余金额异常等事件,针对每种事件建立统计量特征,以及复合事件相关性特征。
(4)相似用户用电特征:针对不同类型用户、用户行业、容量、电压、台区位置等档案数据和用户历史用电量数据,对用户进行聚类,得到每个用户的相似用户。利用用户本身的用电数据和相似用户的用电数据,进行特征衍生,构建用户和相似用户群体的差异性特征。
4.2 违约用电稽查分析
(1)用电量水平分析:针对专变用户,输入每15分钟的电量数据;针对低压公变用户,输入其日总计电量和尖、峰、平、谷电量数据。针对这些数据构建电量最大值、最小值、平均值、中位数、电力波动相关统计特征(包含方差、斜率等)。
(2)用电量分时占比分析:针对专变用户的每日96个点的电量采集数据和低压用户尖峰平谷电量数据,进行特征衍生,构建不同时间段的电量占比以及相关变化统计特征。
(3)台区电量占比分析:针对低压用户,根据其用户电量数据和台区供电量数据,构建用户用电台区占比相关统计特征和变化特征。
(4)台区线损相关性:针对低压用户,根据用户电量数据和台区供电量、售电量、线损电量、线损率等数据,构建多个统计量,得到相关性特征。
(5)相似用户用电特征:针对不同类型用户、用户行业、容量、电压、台区位置等档案数据和用户历史用电量数据,对用户进行聚类,得到每个用户的相似用户。利用用户本身的用电数据和相似用户的用电数据,进行特征衍生,构建用户和相似用户群体的差异性特征;
(6)电表异常事件特征分析:输入用户电能表异常事件记录,如三相不平衡、潮流反向、电能表开盖等,针对每种事件建立统计量特征,以及复合事件相关性特征。
5 结语
通过建设用户稽查大数据模型,从海量数据中挖掘计量异常及违约用电窃电嫌疑用户。指导现场进行反窃电及用电检查工作,并通过电费追补和违约用电处罚,对窃电行为形成有效的震慑,有效降低电网管理线损,提升企业经济效益。
(1)用电异常稽查信息主动推送。系统定期对用户的用电信息进行识别分析,并将用电异常用户主动推送至业务人员工作桌面,且提供简洁、高效的工具快速定位和确认异常行为。
(2)用能异常处理闭环管理。对于通过用户用能稽查模型提交的异常用电客户明细,生成预警排查任务,进行排查任务的拆分、派工、处理、审核。支持单户派工、批量派工、对排除处理任务回退的任务进行重新派工。
(3)用能异常精准排查支撑。解决目前人工进行反窃电监控、分析、排查工作量大、精准度低的瓶颈,为一线用电检查及反窃电人员精准、高效开展反窃电分析和查处工作提供可靠的技术支撑。