电力计量运维的数据中台设计与实现
2022-11-23谢颖文
谢颖文
(广东电网有限责任公司江门供电局,广东 江门 529000)
0 引言
目前,“由电能量数据人员通过对电力数据的巡检、分析、监测,发现计量设备故障或潜在故障,通过相关故障工单下发至现场计量运维人员,运维人员处理完成后进行结果反馈”的链式工作模式基本已经实现,但这种高度依赖人工处理的方式难以建立故障数据库,并且导致一系列问题:
(1)容易造成故障排除滞后、工单反馈不及时等问题。
(2)在大量同类故障发生的前提下,无法进行专项分析,及时发现批量计量装置质量问题、线路技术故障以及批量SIM卡信号问题等同质问题;无法将易发生故障区域以及窃电嫌疑用户纳入观察库;无法直观方便地总结故障类别,在运维信息统计归纳上存在困难。这就导致运维效率低,可能产生无效工单或重复工作。
这一系列问题会影响线损指标、计量装置抄表率和完整率,甚至导致漏计、少计电量,造成电量追补困难,影响计量差错率。
1 系统设计
电力计量运维数据中台作为电子化供电服务数据分析发布平台,依托大数据分析机器人,实现数据分析自动化、智能化,打通数据分析和现场运维“高速通道”,建立用户计量点“病历库”,全方位展示计量运维信息,搭载工单管理平台,实现工单流程闭环管理信息化转型。系统设计上分为负荷巡检规则库、客户需求分析库、待办计划库等。
如图1所示,系统中各库间交互数据生成带指导性意见的工作任务给现场运维人员,现场处理结果再返回至系统中参与下一次数据交互。
1.1 系统数据基础
对万级数量用户的数据进行分析,每天均需要下载百万级行数据。在上班时间,系统普遍繁忙,此时进行数据下载往往是事倍功半,甚至得到的是存在问题的数据包。因此,为了分析准确,必须保障基础数据的准确性。如能实现机器自动获取营销系统、计量自动化系统的数据,得以在网络空闲时段、人员休息时间完整快速地下载所需要的大量数据,则能很好地解决这个问题。
1.2 负荷巡检规则库
有了数据,接下来就得对数据进行清洗、处理、分析,这就需要将日常电能量数据巡检工作的人工智慧传授给系统,并且不能只限于某一种维度的分析,那样无法得出正确的结果。所以这里需要思考如何从多维度分析判断依据出发,集成各种单一简单分析结论,由简单的正确结论,推导出复杂的判断结果。这与日常巡检的碎片化思维是完全相反的方向。
1.3 客户需求分析库
在数据价值上,只对设备的异常进行分析显然是不够的。从客户服务的角度来看,用户的基本信息在某种程度上暗示着他们一些个性化的服务需求。在用户档案信息基础上,需要突破已成文的客户性质定义,通过将自身代入客户角色,感同身受去寻找客户真实的需求。知道了客户所想所需,才能知道对客户的工作中有何风险,知道了风险就能相应地制定应对措施。客户需求与相应的应对策略则构成了客户需求分析库。
1.4 待办计划库
对于计量装置定期检验、轮换、已有故障处理计划,若不作统计,容易出现短期内多次往返同一用户现场的重复性工作。通过自动关联异常用户当前所有待办工作,生成待办计划库。对应于万级数量用户,其待办工作计划数据量可达千万行,需要使用一些专业处理大型数据的工具来实现。
1.5 工作计划下发
经过系统统筹后,下发工作计划,并及时传递给设备责任人。现场运维人员在处理前还需要查询一些相关情况,以判断具体如何完成现场处理,包括携带的工器具、作业的步骤、所需人力等。如果现场运维人员需要自行在营销系统或计量自动化系统重新查询的话,将耗费很多时间,甚至被迫推迟工作进度。但其实系统在分析的过程中就已经对相关数据进行了提取并得出了一系列简单的小结论,现场运维人员可直接查询这些小结论。
1.6 现场结果反馈
单向的数据分析对于分析结果的准确度来说显然是不够的,这对于分析的算法模型的改进也是无益的。系统需要得到每一次分析结果的评价反馈,然后回溯原来的分析有何不足,通过一个学习的过程完善自我。同时,数据巡检的分析员也可通过反馈的现场实际情况发现一些批量问题,如设备质量问题、软硬件兼容问题、运营商误操作等。反馈的结果需要自动对号入座,避免人工处理的错漏或增加人力工作负荷。
2 系统实现
中台通过B/S架构开发,使用Python语言开发,数据库采用MariaDB。数据分析人员可通过Web访问中台并根据相关业务进行人工核验、计划工单下发,现场运维人员通过即时通信软件接收计划工单、查询相关计划的其他详情、反馈现场情况及处理结果,如图2所示。
2.1 系统数据获取
中台利用Python的PyAutoGUI模块[1],模拟真实人工操作:模拟鼠标的移动、点击、拖拽,键盘按键输入操作,鼠标和键盘热键的同时操作,实现控制消息框、截图、定位等。通过这个自动化工具,可全天24 h不间断地获取营销系统、计量自动化系统数据,并在网络空闲时段、人员休息时间完整快速地下载所需要的大量数据。
2.2 数据分析及处理
中台主要利用Python自带的科学计算库Pandas模块[1]进行数据科学相关操作。因为Pandas纳入了大量库和一些标准的数据模型,提供了高效的操作大型数据集所需的工具,特别适合上述数千万行数据量的库。例如,离线分析[2]的过程如图3所示。
2.3 前端应用
利用Web技术完成前端交互界面,允许分析员对系统分析结论进行核验、修正或新增、反馈。运维人员也可在前端获得相关工作计划的其他详情(系统分析过程中形成的简单准确的小结论)。
2.4 即时通信软件的连接
同样利用Python的PyAutoGUI模块,中台在即时通信软件中下发工作计划至相应的现场运维人员。现场运维人员通过回复不同指令代码,进行工作计划详情查询、现场情况反馈、处理结果反馈。中台通过即时通信软件传回的数据自动进入下一轮分析。
2.5 数据自改善的实现
中台并不是孤立的,通过Python的PyAutoGUI模块在即时通信软件对现场计量运维人员自动派发待处理异常工单,现场人员在通信软件中进行回复,中台自动收集现场处理结果,形成监控业务闭环;通过Python的NumPy+SciPy+scikit-learn模块根据反馈的现场实际情况比对原分析结果,探索多维度筛查规则,持续改进系统算法,形成迭代闭环。
3 结语
本中台通过电能量数据的深度应用,推动计量管理从表计管理向装置管理转变、从设备管理向数据管理转型,因地制宜探索开发基于远程监测的计量装置异常监控闭环管理,为快速精准开展计量运维提供全过程数据分析支撑。
下一步,将考虑对中台赋予更高实践经验型的智能,向它传授计量运维经验,使它不再局限于发现异常,还能够直接指挥、指导现场工作,把“发现问题了,怎么办?”解决在出现场工作之前。这将极大地提高计划报送的准确率,优化人力资源配置,为计量运维提质增效。