基于云计算的电力大数据分析技术与应用*
2021-11-27马旭东姜姝宇曹永娇
刘 超,王 宇,马旭东,姜姝宇,曹永娇
(国网吉林省电力有限公司信息通信公司,吉林 长春 130000)
随着网络和计算机技术的快速发展,办公信息化在社会各个行业中得到了广泛应用,为了更好地适应社会发展步伐,电力行业也开始朝着大数据时代发展。面对迅猛发展的电网,电力客户需求不断增多,为了更好地满足客户需求,电网公司需不断提升电力公司生产效率,确保电网可以持续稳定运行。可以在电力企业中积极引入云计算机电力大数据分析技术,使电力企业可以长久稳定发展。
1 云计算和现代电力大数据的主要特征
1.1 云计算的定义
云计算是在互联网技术基础上开展的增值服务,实现交付、增加和使用的模式。通常情况下,需要借助于互联网模式提供对应的动态扩展,进而转化为具有虚拟特征的网络资源。云计算的运算能力较为强大,每秒达到了10万次,不仅可以完成超乎传统概念的运算模式,同时还能对市场发展变化和经济规律进行模拟,甚至可以对核爆炸的形式进行模拟。用户通过个人PC端或手机等移动终端,可以与数据中心链接进行直接接触,以个人需求的方式进行云计算。由于云计算的运算能力强大,现已成为本世纪学术界研究的课题,但是对其的定义却有不同的解释,运算对象包含的种类较多,因此在众多学术范围内均有定义。其中NIST美国国家标准与技术研究院提出的定义则是被广为认知的,云计算是结合数量开展的付费统计模式,该模式可以根据用户需求提供可用性强、便捷度高的网络访问,将其与网络服务、服务器、应用软件、数据处理、储存分析等配置的计算资源进行共享,在快速提供资源的同时,只需要投入较少时间的管理或者是完成较少的交互,就能很容易达成最终的服务模式。
1.2 大数据概述
大数据是指不能在特定时间范围内,通过常规软件采集的数据合集,在新处理模式能力多样化的信息资产,能力表现为流程优化能力、决策力和洞察发现力。海量数据的存储能力、多样化和高增长率能力均是大数据的本质。电力大数据主要包括以下几方面的特征。
数量化。随着智能电网的普及范围不断扩大和搭建面积的扩增,不同网络节点设备的数量也开始增多,这就形成了庞大的数据资源体系。由于这些数据量大且较为烦琐,进一步增加了数据搜集和分析的难度。为了全面了解海量数据的变化规律,需要相关部门对这些数据进行分析。当前,我国的电力大数据从开始的TB级别上升到了PB级别,若是某地区有两千多万的电力客户均设置现代化的智能电表,在每15 min搜集一条数据的情况下,每天就会有21亿条的电力数据出现,说明电力数据较为庞大,使得现代电力大数据的数量化特征较为明显。
高速化。不管是数据采集还是数据分析方面,现代电力大数据均具有高速化特征,因用户终端数量的不断递增,国内电网的大数据分析设备可以满足每秒数十万次的计算和分析,该过程需要以高速状态完成。
多元化。现代电力大数据的多元化特征主要表现在数据种类多元化方面,因科学技术水平的增强,各种现代化的技术和设备在电力行业中得到了广泛应用,使得计算机数据从传统单一化结构性数据逐渐发展成为具有现代化水平的各类数据并存的数据体系,主要涵盖有非结构性数据和结构性数据,其中前者的数据数量呈现出逐年增加的趋势,凸显了现代电力大数据的多元化特征,说明传统数据分析方式同当前多变的数据不相适应,急需要加大创新和改革现有的数据分析技术,进而提升电力大数据分析技术的应用效果。
2 电力大数据分析技术
2.1 数据分析技术
因科学技术水平的快速发展,电力行业技术水平也得到了很大程度的提升,发电可以选择火力、风力、水力、太阳能、核能等不同的发电方式,数据分析技术在推动发电领域多元化发展方面发挥着积极作用。在电力领域中引入电力大数据分析技术,可以关联分析一般电能和新型清洁电能,进而找出两者的契合点,以准确合并电力资源。如风电并网的过程中,普遍会有谐波、线损等情况出现,不利于各项工程的正常开展,同时还会影响电力使用者的正常用电。自引入电力大数据分析技术以来,可以对电并网过程的影响因素进行深入分析,并采取有针对性的处理对策,降低不利因素的影响,确保风电并网可以顺利开展。
2.2 电力大数据的可视化技术
可视化是电力大数据分析技术的主要特征,可以为工作人员了解数据信息反映的问题提供帮助,并作出科学合理的判断,确保各项工作可以顺利推进。电力大数据的可视化应用主要从图标可视化和SVG可视化两方面进行分析。前者对数据信息进行展示的过程中主要是以图形或表格的方式,可以帮助工作人员对其中存在的问题进行充分了解,并结合数据的变化规律制定出科学有效的处理办法。在对该系统进行构建的过程中,需要综合运用表格、柱状图、折线图等几种可视化的展示方法,其中表格可以有效记录相关数据,通过搜索的方式来获取数据信息;柱状图则能表现出数据间的差异性特征;折线图则能描述数据的变化趋势;后者则是可以显示不同颜色的电力数据,进而帮助工作人员对这些数据进行更为直观的了解。如为了了解各单位的生产情况,可以通过不同颜色来显示数据,或者是利用SVG对某个数据进行调用,以快速查询和利用数据信息,进而增强数据资源的使用效率。
2.3 混合存储技术
若是数据储存的过程中选用Hive系统,需要利用重写的方式对数据进行更新,这种方式很难保证可以及时对数据进行更新。随着电力大数据的快速发展,需要处理的数据信息量不断增多,在删除和更新数据方面提出了更高的要求。为了提升数据信息质量,需要及时处理数据信息,以对其进行充分利用。因各个操作数据占据的比例相对较小,若是更新过程中仍旧选用传统方式,将会有过度占用数据资源的情况出现,很难确保整个系统的高效稳定运行。若是引入混合存储技术,可以将主附表的作用充分发挥出来。通过实时更新数据信息,可以保证数据处理与系统运行要求相符,在提升数据处理能力的同时,还能充分利用数据资源。
2.4 数据库索引技术
传统的数据分析主要选用Hive等技术,该技术很难全面、准确地搜索电力大数据,在造成资源浪费的同时,还很难确保数据分析工作可以顺利推进。为了解决该问题,需要对电力大数据特点进行准确把握,从不同维度快速有效地查询数据信息。具体来说,可以在电力大数据为基础的多维索引下,以时间和单位为标准,通过不同维度辅助电力大数据进行索引,快速找出有用的数据信息,以保障数据索引的整体销量。与此同时,通过该技术可以构建较为完善的系统,并借助于Hive命令合理运用解析技术,保证在最短的时间内完成代码解析,进一步丰富数据索引的维度区间,以提升数据查询和利用效率。
2.5 数据仓库技术
电力企业发展过程中,其生产能力也得到了质的飞跃,整个生产过程中涉及的数据量不断增多,使得系统数据运算能力中的不足逐渐显现,为了解决该问题需要对先进的技术手段进行利用,推动数据分析工作的有序开展。作为电力大数据的重要组成部分,数据仓库技术不仅可以提升数据运算能力,还为数据采集和处理各项工作的开展提供了有力条件。针对一些不能直接分析的数据资源,可以在该技术的基础上转换处理,使其成为可以分析的数据资源。在数据转化处理完成后需要加载,使其可以更好地对应数据资源,以更好地利用数据资源。结合以往对数据仓库技术的应用实际,不难发现该技术进一步提升了系统运行性能,是电力大数据中不可或缺的技术。
2.6 分层次处理技术
在数据分析处理的过程中,可以对分层数据处理技术进行利用,以提升数据处理效率。随着智能电网的持续发展,现已形成了具有多功能的一体化管理体系,主要包括数据采集、存储和利用等,只有对电力系统运行情况进行充分了解,才能构建出较为完善的大数据分支管理系统,进而凸显不同电力供应系统的独立性和关联性水平,以实现资源方面的共享,充分体现出资源的使用价值。另外,应重视起SQL技术的应用,通过该技术可以同步分析和计算电力大数据,以确保整体的数据分析效率,为工作人员提供准确可靠的分析结果。自分层次处理技术应用以来,不仅可以有效提升数据分析效率,还能进一步缩短工作人员的数据管理时间,不断提升企业的经济效益。
3 云计算的电力大数据分析技术的应用
由于计算机技术的快速发展,在现实生活中以云计算的电力大数据分析技术得到了充分应用,进一步推动了电力企业持续健康发展。电力系统中的云计算电力大数据分析取得了显著成效,通过云计算技术,使得电力系统的智能化特征愈发明显。在云计算的作用下,电力系统中的各项数据得到了集中,且数据分析中结合计算机,可以有效提升数据结果的准确性水平。根据该项数据结果,可以确保电力工作人员对电力系统中存在的问题不断进行完善,增强电力系统运行的稳定性水平。另外,基于云计算的电力大数据分析,可以有效满足用户对数据的分析处理需求,计算的过程中传输电流需依靠电力平台。在档案中会储存有分析处理后的数据信息,因数据的改变,档案库内的信息也会发生变化,可以实时更新。传统档案库的信息大都是存储在两台小型机器上,信息储存的过程中需要通过高速网络完成。现阶段储存档案库信息则需要连接多个服务器,运行速度得到了大幅度提升。这种连接方式经济实惠,可以有效降低成本、人工和物力投入。
4 结论
综上所述,随着信息化时代的到来,在人们日常生产生活中信息技术发挥着十分重要的作用,但同时还存在很多亟待处理的数据信息。电网建设的智能化特点愈发突出,其规模和管理的信息内容不断扩大。如何提升电力大数据的处理效率和质量成为当前电力企业发展的重点。由于云计算处理数据的速度快、兼容性强且可以存储海量的数据信息,在对智能电网电力大数据进行分析处理时,对云计算技术进行充分利用的过程中,可以将数据本身的价值充分发挥出来,提升数据分析和储存能力,进而实现电力信息共享,增强电力系统的整体性能。