浅谈大数据分析技术在电费核算业务中的应用
2020-12-14邓松云
邓松云
摘 要:随着我国互联网信息技术的发展,人工智能与大数据技术已经逐渐应用于各行各业的生产与管理工作之中,在电力行业中也不例外.电力企业的大数据时代已然到来。本文从电费核算业务中遇到的具体问题入手,探讨电费核算业务中的大数据分析系统的架设、分析等流程的关键节点,探讨大数据技术对电费核算工作起到的促进作用,分析其中存在的应用意义,为电费核算业务提供工作的新方法与新路径。
关键词:大数据;大数据分析;电费核算;电力技术
时代在发展、社会在进步,如今互联网的建设成本越来越低,覆盖的面积也越来越广,如今绝大多数的电力业务尤其是电费核算业务已经步入了无纸化、网络化、信息化时代。这为后续的大数据分析技术工作提供了大量的一手数据。在电费核算业务中,应用大数据技术,不仅可以提升电费核算的精度,保障公司与用户双方的利益;还可以很好的分析正常电费数据的规律,评估用户的信用与行为模式,对异常数据进行警报和排查,更加精准的排查疑偷电、私搭电线、室内架设灯光种植毒品等违法犯罪的现象。
1.大数据技术的概念与定义
大数据指的是在传统数据处理应用软件不足以处理的大或复杂的数据集,这些数据很难用通用数据管理和处理软件来处理。通过这一技术,可以操纵和管理以TB、PB、EB为单位的巨型数据集。
具体而言,大数据技术包括信息收集、选择、存储、搜索、共享、传输、分析和可视化。如今,大数据技术在各行各业中都有着广泛的应用,通过对数据的科学计算和分析可以做到业务可预测、疾病可预防、犯罪可预防。
大数据早在多年前就已经在数据工作中的一个重要名词,在2010年,随着世界互联网的高速发展逐渐被广泛应用。如今,大量的企业、政府部门都有与之合作或自建的分布式数据中心、数据仓库和云存储中心,并给他们的工作带来了巨大的利好。
2.电费核算工作中存在的问题和难点
2.1核算流程复杂
传统的电费核算工作由抄表、汇总、数据验算、上报、确认、反馈等流程组成。在工作中需要使用人工框定的具有可调电量的验证规则,对每一个数据使用统一的标准进行统一核算,并筛选出异常数据。在筛选出异常数据后需要生成《电费异常符合清单》,并再次下发回区(县)供电局进行确认与核查,最后通过市局客户服务中心这项整体的确认和批准、下发电费清单。这一整套电费核算业务流程体系,虽保障了电费核算工作的准确性,极大地降低了电费核算清单中可能存在的问题和纰漏。但因其流程复杂、涉及部门众多,因此需要大量繁杂的数据传递、沟通报备、批准等工作,这无疑降低了工作的速度,不能很好的迎合如今信息化时代即时查询个人电费、即时网络缴费的大趋势。
2.2电费核算规则阈值难以确定
在传统的电费核算工作中,框定可调变量是否正常的验证规则阈值是由人工计算所设立的,其设置的依据是较为简单的浅层次数据分析,其虽也是对整体数据的一种概括和提炼,但因其收集的数据量较少,且在一定程度上依赖于计算人员的业务经验,因此其具有一定的局限性与片面性。甚至导致系统使用这一规则阈值过滤出的疑似异常数据大部分是误判断。经过实践中的统计,每期所筛选出的异常数据大都超过了10万条,但经过多层人工筛选与拨再次核算,筛除掉的非异常数据突破了98%,既只有不到2%的数据是真实的异常数据。这导致电费核算中异常数据排查工作的效率极其低下,误判断数据巨大,耗费了大量的人力和物力。
2.3数据应用效率低
随着电力系统无纸化信息化推进,电力企业已经积累了大量的费用、耗电相关的数据,这些数据作为电费核算工作的原始数据,必然会被长期保留和储存。但传统的电力核算工作,更不会对这些数据进行深度处理,这就使了大量的存档数据变为了冷数据。这样闲置数据,不仅耗费了大量的储存和维护成本,还使得电费核算、电力系统建设等工作的推进缺乏有力的数据保障。
3.架设大数据核算硬件系统
3.1建设高质量内部通讯网络
要开展大数据的分析工作,首先打造高质量、高保密的内部通讯网络,保障不同网点、上下层级之间能够及时的进行数据汇总、提交、调取。要严格控制不同权限管理员、经办人员能够调取的数据范围,既要满足不同人员在日常工作中应用大数据的需求,又要严防死守,杜绝涉及居民个人信息尤其是核心隐私信息的外漏。要保证内部通讯网络的速度与质量,打造多线路互为备线、多服务器互为备份的内部通讯网络体系,确保内部通讯系统7x24小时的连续稳定运行。
3.2建立稳定的高性能数据服务器
大数据,顾名思义要对大量的数据进行处理和分析,这首先需要对大量的数据以及计算结果进行安全的海量储存,其次需要高性能高效的计算处理。因此,需要建立一套稳定且高性能的数据服务器体系。出于对客户隐私、商业机密和國家安全以及成本和效益的考虑,可以采取自建服务器与租用大数据服务平台服务器相结合的方式,打造安全稳定的高性能数据服务器体系。对重点内容、涉隐私涉密内容使用自建服务器进行计算,对清除个体特征且不涉密的内容,可借助合作机构的服务器进行计算。此外,相关数据也可以在进行加密和或无去特征化处理后,交由第三方云存储数据机构进行备份储存,以提升本地数据的安全性和可靠性。在自建服务器平台时,也要通过异地备份、脱机备份等方式,防止因服务器硬盘故障、自然灾害等原因造成的数据丢失、损坏而导致的数据计算终止乃至经济财产损失。
4.借助大数据技术开展电费核算工作
通过专业的数据处理系统和软件,对居住在城市不同区域、不同性质不同分工的用电用户进行划分,计算出各行业、各用途不同的用电正常值和用电行为习惯。确定其合理的波动范围和插值区间,一般而言,可以使用“超出中位数2倍4分位差”这一标准设置正常变量的阈值。将超出这一标准的数据进行提出,并进行进一步的纵向大数据分析。通过对比异常用户在不同计费周期的用电规律,判断其此次用电量的骤增或骤减是否符合其所在行业的季节性周期规律,若其增减过于异常、不合常理,就应提交人工手段,进行具体的排查与复合。
结束语
大数据为各行各业带去了便利与高效,在电力行业也不例外,有必要建设一整套大数据储存与计算网络体系,以提高电力冷数据的应用效率。在电费核算业务中应用大数据工具,对负责区域内的用电行为模式进行分类和建模,可以更为科学的确定用户异常行为的阈值,对异常行为进行更为精准的判断和筛选,以提升人为排查异常电费的效率。
参考文献:
[1]舒叶辉,程炜东,陈晓君.基于大数据的电费“形式走收”与电费资金安全智慧监督[J].科技经济导刊,2020,28(15):186-187.
[2]余诗博.基于移动互联网技术与大数据分析下的电费回收探索[J].农电管理,2019(09):46-47.
[3]陈晓健.大数据分析技术在电费核算业务中的应用实践[J].科技创新导报,2018,15(21):144-145.