电力大数据基础体系架构与应用研究
2019-09-10杨凤玖
杨凤玖
【摘 要】在当今大数据和互联网的时代,数据资源已经被公认为是和自然资源一样具有重要的价值,也是推动经济与社会发展的重要战略资源。大数据不仅是引导国家经济建设转型的信息引擎,更是企业通过数据分析发现机会、抢占市场的制高点,大数据之于企业经营的重要性不言而喻。电力行业是国民经济以及国家发展战略的重要支撑行业,随着信息技术与电网建设的快速融合与发展,电力大数据已经成为电力行业未来发展的核心。基于此,本文主要对电力大数据基础体系架构与应用进行分析探讨。
【关键词】电力大数据;基础体系;架构;应用
1、前言
随着电网企业信息化建设的不断推进,电网企业数据量、数据类型、来源等都有了巨大变化,数据量以几何级爆炸式速度增长,同时数据类型越来越复杂、多样。利用大数据的概念和技术,深度分析利用电网企业大容量、类型繁多的数据,能够获取大量的数据附加价值,为电网企业在大数据背景下的发展、管理、规划提供有效支撑。
2、电力大数据基础体系框架的研究方法
2.1 现状及发展趋势研究
从技术、产品、应用3个维度对业界大数据研发情况进行梳理,提炼不同层面的研发方向及要点,依据梳理及提炼的调研要点,对业界大数据的技术、产品、案例进行深入分析,结合业界大数据技术的实际成果,进行深入分析和研讨,对各家厂商分别编写调研分析报告,形成《业界大数据技术现状与发展趋势调研汇总表》以及《大数据技术现状与发展趋势调研分析报告》。
2.2 应用现状、方式与需求
从软硬件基础环境、应用、业务、数据现状和技术现状5个维度对国家电网公司内“三集五大”體系中大数据的应用情况、应用方式及业务需求进行调研,综合现阶段调研取得的主要成果,对各业务需求调研分析的整体情况进行汇总,并将应用分析结果和示范建设内容写入《国家电网公司大数据应用研究报告》。
2.3 制定大数据发展规划
总结提炼出契合国家电网公司的大数据概念和技术研究方向,确定公司大数据总体目标与原则,明确大数据技术研究和业务应用方向,确定大数据研究的主要任务和典型应用场景,确定公司大数据应用分析及大数据总体架构与技术路线,并统筹制定大数据工作开展的相关保障措施。
2.4 大数据基础框架与演进路线
1)技术筛选:结合电力大数据的定义和内涵,选取大数据所包含的详细技术。
2)分层技术研究:从管理层、计算层和应用层梳理电力大数据涉及的关键技术以及各种技术之间的关系。
3)基础框架提出:对业界大数据技术路线进行比对,结合业务系统数据现状和需求,分析并提出电力大数据基础体系框架。
2.5 大数据管理规范
在国家电网公司层面形成电力大数据统筹管理机制和规章规范制度,保障公司各业务部门及省(市)电力公司在进行电力大数据建设时,满足国家电网公司大数据相关政策、总体规划及基本要求,保证电力大数据建设的高效管控与有序开展;建立公司级跨部门协调、决策机制,公司各部门统筹协调,统一组织内部科研产业单位、省(市)电力公司开展电力大数据的研究、建设和推广。
2.6 大数据相关应用标准
通过梳理国内外大数据相关标准,深入分析公司信息通信、智能电网和“三集五大”已有的相关标准,并结合电力大数据技术研究、产品研发、试点建设,总结凝练形成大数据标准规范,覆盖数据计算、数据存储、数据安全、数据挖掘等层面。
2.7 大数据建设与应用规范化模式
综合分析公司业务对大数据应用需求的成熟度和紧迫度,拟定未来大数据应用的主要业务领域。研究并分析业界大数据应用建设的成功经验,结合公司大数据建设情况,对技术研究、组件研发、标准制定、应用验证等进行全局统筹把控,制定电力大数据建设的模式,同时开展各业务典型场景的应用规范化研究工作,实现电力大数据对各业务场景应用流程的全程把控,从而对电力大数据的广泛应用提供指导依据。
3、电网大数据应用关键技术
3.1集成管理技术
电网企业数据集成管理技术是将多个应用系统数据合并,建立拥有更多功效的企业应用程序的过程。从集成的角度来讲,便是把不同来源、方式、特征的数据在逻辑上或者存储介质上有机地集中,针对系统中存储的一系列面向主题、集成化、相对稳定、体现历史的数据集,从而提供一个全面的数据共享系统。借助数据挖掘技术,提供对业务状况和趋势精细化的监测分析手段,在大数据存储管理的最重要的技术是NoSQL数据库技术,采用分布式数据存储模式,消除了关系数据库的关联特性,具有良好的可扩展性,解决了海量数据的存储难题。
3.2数据分析技术
基于大数据挖掘的客户用电行为分析,以庞大海量的客户用电行为数据为基础,通过识别不同客户群体的行为特征,从而达到科学的客户认知、风险管理、个性化营销和服务的目的要求。数据挖掘和机器学习算法在大数据环境下,可以从3个方面入手:一是从大数据治理与采样、特征选择角度,将大数据小数据化;二是对大数据进行聚类,分类算法研究。
3.3数据处理技术
电力大数据的数据处理技术包括分布式计算技术,内存计算技术,流处理技术等。分布式计算技术是为了解决大规模数据的分布式存储与处理。内存计算技术就是为了解决高效的数据读取和处理问题。流处理技术是处理数据的实时到达、速度和尺度。分布式计算是研究如何将计算能力强的问题分解成许多小部件的一种新的计算方法,最后将结果结合起来,得到最终的结果。问题库建设为包含运营重大问题、运营问题根源、管理措施的多维知识库,其设计分为结构设计、标准设计和分类框架设计。主要汲取卓越绩效、精益管理、全面质量管理、标准化、价值链、BPR等先进管理思想和理念,并结合电网企业运营特征进行提炼和总结。
4、结语
随着电力系统的快速发展,数据量的增加,专业需求的变化,电力企业大数据将依托应用体系架构实现统筹管控、汇聚共享,为企业高效运营、战略决策提供有力支撑。
参考文献:
[1]张吉生,张波,于烨.基于大数据架构的变电设备运行质量智能评价[J].贵州电力技术,2017,20(09):37-41.
[2]陈武.基于多类数据及模型融合的设备评价分析研究[J].电力大数据,2017,20(09):14-16.
(作者单位:国网蒙东供电服务监管与支持中心)