APP下载

电力大数据视角下的天津区域工商业经济发展大数据应用设计开发

2018-06-07张耀于田田郭延凯程凯

移动信息 2018年3期
关键词:用电量天津预测

张耀 于田田 郭延凯 程凯



电力大数据视角下的天津区域工商业经济发展大数据应用设计开发

张耀 于田田 郭延凯 程凯

国网天津市电力公司信息通信公司,天津 300010

随着智能配电网建设的日趋完善,电力公司掌握着海量、实时、全面的各行业用电数据。以这些电力数据为核心,结合经济相关数据实现了“电力看经济”和“经济看电力”。本文以用电量海量数据为基础,基于用电量与经济增长的相关性,归纳精细化到各行业用电量的关于时间和空间的典型模式曲线,建立各行业经济指标及其相应用电量回归模型,对天津经济发展趋势和结构变化模式进行归纳和预测,为天津市经济发展规划部门、电力能源监管部门,以及全市各行业的经营者和投资者及时掌握全市宏观经济、各重点行业走势提供准确的数据支持,为政府的相关电力经济决策,同时通过分析,还可以反向为公司在电力体制改革的大背景下与国民经济新常态下的战略转型提供有益的决策依据。

大数据;系统总体设计;技术实现

1 背景知识

1.1 主要依据

2015年国网信通部下发的《国家电网公司大数据应用指导意见》中,明确提出“融合公司内部业务系统数据、实时采集数据、外部社会经济和气候气象等数据,集成数据采集、存储、计算、分析和展现等工具,逐步构建形成公司统一大数据平台,为电网生产、经营管理和优质服务领域实时采集类、在线监测类、计算分析类和决策支持类应用提供等统一的数据和工具服务”。同时也将“政府辅助决策支持”作为国家电网大数据应用的35个典型应用场景之一。

2014年,天津公司提出“两个排头兵”战略目标,其中即有“服务美丽天津建设”排头兵。随着智能配电网建设的日趋完善,电力公司掌握着海量、实时、全面的各行业用电数据。这些数据具备大数据的“3V”特征,同时以这些电力数据为核心,结合经济相关数据,可为天津市经济发展规划部门、电力能源监管部门,以及全市各行业的经营者和投资者及时掌握全市宏观经济、各重点行业走势提供准确的数据支持,为政府的相关电力经济决策提供有力的保障。通过分析,还可以反向为公司在电力体制改革的大背景下与国民经济新常态下的战略转型提供有益的决策依据。

1.2 必要性

自第二次工业革命以来,社会生产进入了电气时代,现代工业生产与能源消耗密切相关。因此,用电量被认为是经济增长的先行指标,是预测经济发展的重要参考[1]。工业用电量在经济研究中常被用于评估和预测经济一国或地区经济增长情况。在花旗银行编制的“克强指数”中,工业用电量增速占40%,用电量的总量变化情况,可以准确反映我国工业生产的活跃度。目前,我国经济增长已进入一个由高速增长向中高速增长转型调整的新周期,正处于增长速度进入换挡期,结构调整面临阵痛期,前期刺激政策消化期的“三期”叠加的关键阶段,用电量与经济增长放缓趋势明显。在此背景下,主要受产业结构调整和行业内部结构调整等因素的影响,用电量与经济增长呈现短期内的背离。

天津公司基于运营工作的开展,积累了海量的用户数据和用电量数据。为了进一步挖掘数据关系,实现数据价值,全面提升公司大数据处理能力,以用电量海量数据为基础,基于用电量与经济增长的相关性,归纳精细化到各行业用电量的关于时间和空间的典型模式曲线,建立各行业经济指标及其相应用电量回归模型,对天津经济发展趋势和结构变化模式进行归纳和预测,为天津地方政府制定经济政策,为下游用电企业制定企业运营策略,也为天津公司整体运营顺利开展提供决策依据。

1.3 效益分析

目前公司向政府提供的电力统计数据颗粒度、精细度不足,并且与统计局统计口径间仍存在一定差异,导致无法充分发挥电力对经济的前导指示功能,不利于公司服务美丽天津建设工作的开展。

本文成果可主动向政府提供统计局统计口径的电力数据,帮助政府在经济统计数据发布前及早洞悉经济发展状况,为政府的相关电力经济决策,如为政府就产业调整、经济调控等做出合理决策提供有力的保障;同时主动发布天津工商业经济电力地图,凸显公司履行社会责任和技术创新,提升公司的社会形象,并可反向为公司在电力体制改革的大背景下与国民经济新常态下的战略转型提供有益的决策依据,提升公司整体决策分析水平,为国网大数据试点提供有价值的应用参考。

2 系统总体设计

2.1 业务需求

以公司用电信息采集系统、营销SG186系统记录的数据以及全市各工商行业经济数据、生产运行数据为平台接入数据来源,在保证公司运营数据的保密性、完整性和可用性的前提下,有效利用软硬件环境并结合大数据分析技术,对全市宏观经济形势走势、全社会用电量、全市各主要工商行业的产值进行专项预测分析,并固化推广应用分析成果。具体原则如下。

(1)以分析所用基础数据为基础,明确数据质量提升方向

针对分析过程中收集的用电信息采集系统、电能量采集系统以及营销SG186系统等信息系统以及线下数据,通过数据清洗,发现数据质量问题,明确数据质量提升方向。

(2)以业务需求为导向,创新模型的适用性

坚持以业务需求为导向,坚持以大数据全样本替代抽样,结合现有宏观、微观经济分析现状,制订合理、适用、实用的电力大数据经济分析总体需求和单个行业/区域的微观经济预测分析方案,注重信息化分析模型的实际应用效果。

(3)以数据挖掘技术为支撑,提高预测的准确性

随着大数据处理、分析、展现技术的发展,项目将进一步探索应用新技术、新工具、新方法,创新数据处理分析实践。针对具体的分析需求甄选有效的数据挖掘和分析方法,提高分析预测结果的准确性和实用性。

(4)以可视化工具为依托,提升成果的可阅读性

根据预测分析成果设计可视化展示场景,并利用可视化软件工具进行场景配置,确保分析成果的展现直观清晰,可阅读性强,为成果在经济预测中的实践应用奠定基础。

研究首先通过对天津经济发展特点和电力消费特点进行深入分析,全面分析天津经济发展整体情况和用电量消费情况。在此基础上,本文通过电力视角解读天津经济发展,主要包括趋势分析和结构分析两方面的分析内容,全面解读天津经济发展形势和整体情况。

趋势分析:以天津公司海量用户数据为基础,以用电量与GDP相关关系为依据,采用计量分析方法,建立基于用电量的GDP回归模型,分析GDP增长趋势,对中短期经济发展形势进行预测分析。

结构分析:通过分析天津公司区域用电量数据分析天津区域经济发展形势,通过分析天津各行业发展情况及其用电量情况分析天津产业发展形势。

最后,通过用电情况分析政府政策的制定依据及落实情况并对下一阶段工作开展提出建议。

具体来说,以所有高压工商业用户采集数据和统计局企业分类数据为基础,利用模糊匹配技术理顺电力统计口径与统计局统计口径间的对应关系,消除因抄表日期造成的异步电量,建立分行业、分行业细类和行政区划的售电量与工业产值的统计映射关系,自动计算基于统计局口径的电力统计数据。在此基础上,将纳入统计范围用户的地址文字描述翻译为经纬度,并按用电量用热点的形式投影到GIS地图上,配以时间轴,建立天津区域工商业经济发展电力地图,直观反映当地工商业经济发展水平和演进情况。

2.2 功能需求

依托大数据平台实现与各业务系统的集成,实现对海量数据处理能力的同时,确保数据定义的一致性、完整性、准确性,为数据的深层应用、分析和挖掘提供便利。在页面展现方面,平台页面应保持风格一致、色调统一;平台应明确功能分区,并以分割线或背景色进行区分;针对不同的功能分区,应遵循“从上到下、从左到右”的原则将功能重要性、用户使用频率与用户的视觉习惯顺序相匹配;原则上菜单不超过三级。

3 系统功能建设

基于大数据平台提供的数据库管理、储存与计算、应用与展现等平台支撑,设计并开发电力大数据视角下的天津区域工商业发展分析应用。通过参照标准数据挖掘理论,基于用电信息采集系统、营销SG186系统以及外部经济运行数据,应用R语言设计并筛选模型特征量,构建出用电数据与经济运行数据的分析模型,并开展验证调优工作,最后将分析过程、分析结论基于Tableau软件平台进行业务应用展示。

3.1 系统架构

3.1.1 业务架构

本文建设内容主要用于支撑公司向政府提供电力视角的决策数据的业务需求,实现大数据的业务应用落地。系统业务架构总体上遵从SG-ERP相关领域业务架构,保持SG-ERP体系架构原则不变。

3.1.2 应用架构

基于业务架构,定义相应的应用功能、应用划分和分布。项目范围内包括数据转换、数据计算、可视化展现等基础功能和区域经济发展预测、行业经济发展预测、政策影响分析等业务功能。

3.1.3 数据架构

基于业务架构和应用架构,按照国家电网公司数据架构的设计与划分,构建相应的数据模型。所需数据从内部业务应用系统及外部单位获取。系统业务数据遵循SG-CIM模型原则,保障数据的一致性、完整性、准确性。

3.1.4 技术架构

遵循国家电网公司对于大数据应用的技术架构要求,结合业界大数据技术发展趋势以及公司现有技术的现状,充分考虑公司大数据平台架构体系融合,确保项目成果具有可移植、可扩展的技术特性。

3.2 技术实现

3.2.1 外部数据的收集和统计口径的对应

将外部经济数据引入统计模型中的首要难点在于外部经济数据的获取途径及各数据的颗粒不一致性。本文首先梳理数据需求并调研可能获取数据的渠道,通过统计局等单位的对接获取最新的统计数据。此外,我们将外部经济数据与电力数据建立统一的口径,为后续的统计分析做好充分的准备。

3.2.2 数据清洗与缺失值处理

数据清洗旨在对数据准确性、完整性和有效性进行核查。在检查数据准确性的时候,应对某些字段设置规则,再按照这个规则进行,主要检查标准是数据是否符合事件发生的逻辑。完整性核查需要根据信息的关联信息和维度信息进行。有效性核查,主要是通过对特定的信息字段内的取值是否有效,取值范围是否在预定的范围之内等。此外,对于外界数据源中的数据,应采用参考业界相关的信息标准,遵循业务系统影响最小化和实现大多数数据自动化批量或实时采集原则,确定数据采集方式和策略。

具体说来,针对填补遗漏的数据值、消除噪声、识别或除去异常值,并纠正数据中的不一致问题的需求,可利用平均值填充、K近邻法填充、回归、朴素贝叶斯、决策树等基于预测的填充等数据补录方法,以及业务判别法、分箱法、聚类法和统计分析法等识别异常数据的方法,减少数据质量对大数据应用的影响。

3.2.3 分析模型搭建

基于公司已有的关于经济活动预测分析成果,结合业务需求,梳理出可预测分析的业务内容,细化搭建预测分析框架。

结合适用于预测分析的数理统计方法以及数据挖掘方法的梳理,对具体的预测分析点设计相应的方法,并基于R开发数据分析模型。项目基于模型实际应用情况,将模型预测结果与实际结果进行比对,根据结果差异程度,分别对模型参数、建模特征量以及建模算法选择进行不同的调整,再基于调整结果开展验证工作,得出最优模型。

3.2.4 可视化展示工具设计及开发

一方面,结合大数据实证分析工作成果,梳理散点图、直方图、箱线图、时间序列图、热点图等可视化展示手段,同时研究如何将可视化展示与GIS进行叠加,形成基于地图的可视化展示方式;另一方面,将Tableau等可视化展示工具应用于大数据应用成果的展示上,并向业务部门进行推广应用[2]。

3.2.5 数据集成

依托公司大数据平台,根据数据模型梳理数据集成需求,并充分考虑数据类型、数据量、更新频度等因素,合理制定数据集成方案,并开展数据集成工作。

3.3 关键技术

3.3.1 电力大数据与经济发展状况相关性分析统计模型构建

通过大量用电与经济历史数据,按时间、区域、行业等进行特征量的提取工作,可采用BP神经网络、贝叶斯模型、决策树算法、逻辑回归以及时间序列等等数据挖掘技术分析历史数据之间内在关联关系,并对未来做出预测。具体来说以所有高压工商业用户采集数据和统计局企业分类数据为基础,利用模糊匹配技术理顺电力统计口径与统计局统计口径间的对应关系,消除因抄表日期造成的异步电量,建立分行业、分行业细类和行政区划的售电量与工业产值的统计映射关系,自动计算基于统计局口径的电力统计数据。在此基础上,将纳入统计范围用户的地址文字描述翻译为经纬度,并按用电量用热点的形式投影到GIS地图上,配以时间轴,建立天津区域工商业经济发展电力地图,直观反映当地工商业经济发展水平和演进情况。

项目基于预测模型详细设计方案,设计分析场景。分析场景主要包括两大部分内容:第一部分展示全市宏观经济趋势预测分析;第二部分展示全市微观经济趋势预测分析,可按照区县、行业等业务维度下钻展示。

3.3.2 模块集成及可视化界面展示

利用MFC搭建友好的用户交互界面,通过数据调取模块调用各个数据源的数据,并通过数据筛选和清洗存储到新建的数据表中。再通过调用R语言编写优化后的分析模型对数据进行进一步统计和梳理,最终调用Tableau等数据展示软件对分析结果进行可视化展示,最终提供交互式的分析结果展示。

3.4 软硬件设计

本文设计实现的软硬件主要基于本次项目实际功能需求,结合软件的擅长功能领域,以实现宏观、微观经济预测分析应用与展现场景为目标。

(1)软件:R以及Tableau最新64位版本;Windows 7以上64位系统。

(2)硬件:使用既有服务器与终端电脑。

项目开发的业务分析应用将部署在公司大数据平台的存储、计算及应用、展现相应服务器节点上,并通过大数据平台实现与数据源业务系统的集成。部署架构图如图1所示。

图1 部署架构图

4 结语

本文设计实现的满足公司在新形势下的管理需要,支撑公司“两个排头兵”战略目标实现。通过整合电力营销数据和其他数据实现对全市宏观与微观经济发展进行预测分析,通过对历史供电、用户用电数据、区域与行业经济数据内在关联关系的挖掘,预测未来经济发展趋势。项目成果可以指导帮助政府在经济统计数据发布前及早洞悉经济发展状况,为政府的相关电力经济决策,如为政府就产业调整、经济调控等做出合理决策提供有力的保障;同时主动发布天津工商业经济电力地图,凸显公司履行社会责任和技术创新,提升公司的社会形象,并可反向为公司在电力体制改革的大背景下与国民经济新常态下的战略转型提供有益的决策依据,提升公司整体决策分析水平,为国网大数据试点提供有价值的应用参考。

[1]姚建国,杨胜春,高宗和,等. 电网调度自动化系统发展趋势展望[J]. 电力系统自动化,2007,31(13):7-11.

[2]杜贵和,王正风,等. 智能电网调度一体化设计与研究[J]. 电力系统保护与控制,2010,38(15):127-131.

Development of Big Data Application Design and Development of Tianjin Regional Industrial and Commercial Economy from the Perspective of Power Big Data

Zhang Yao Yu Tiantian Guo Yankai Cheng Kai

State Grid Tianjin Electric Power Company Information and Communication Company, Tianjin 300010

With the development of smart distribution network becoming more and more perfect, power companies have mastered massive, real-time and comprehensive power consumption data in various industries. With these power data as the core, combined with economic related data to achieve “power to see the economy” and “economy to see power” Based on the electricity consumption data and the correlation between electricity consumption and economic growth, this article summarizes the typical model curves of time and space for electricity consumption in various industries, and establishes economic indicators and their applications in various industries. The quantitative regression model will summarize and predict the economic development trend and structure change model of Tianjin, and timely grasp the city’s macroeconomic and key industries for the economic development planning department, the power energy supervision department, and the operators and investors of the various industries in the city. The trend provides accurate data support for the government's relevant power economic decision-making, and at the same time, through analysis, it can also provide useful decision-making basis for the company’s strategic transformation in the context of power system reform and the new normal of the national economy.

big data; overall system design; technical implementation

TP311.5;F427;TM63

A

猜你喜欢

用电量天津预测
01 国家能源局:3月份全社会用电量同比增长3.5%
如果天津有“画”说
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
国家能源局:3月份全社会用电量同比下降4.2%
天津卷
《天津之眼》
天津