APP下载

基于大数据挖掘的运营监测分析研究

2016-02-16李小兰田小蕾倪志坚

东北电力技术 2016年3期
关键词:数据挖掘监测指标

李小兰,田小蕾,倪志坚,冯 柳

(1.国网沈阳供电公司,辽宁 沈阳 110003;2.国网辽宁省电力有限公司,辽宁 沈阳 110006)

基于大数据挖掘的运营监测分析研究

李小兰1,田小蕾2,倪志坚1,冯 柳1

(1.国网沈阳供电公司,辽宁 沈阳 110003;2.国网辽宁省电力有限公司,辽宁 沈阳 110006)

随着电力行业工业化与信息化的融合发展,电力数据呈现爆炸式增长,电力大数据时代已经到来。以国家电网某地市公司运营监测(控)中心为应用对象,依托运营管控系统,研究利用数据挖掘手段探寻指标潜在关联,构建运营监测指标体系,建立公司风险预警防控体系,并引入数据挖掘技术开展精细化运营分析,快速准确地定位管理漏洞,为提高经济效益和管理效率提供保证。

大数据;数据挖掘;供电企业;运营监测;运营分析

随着互联网和信息行业的飞速发展,大数据吸引了人们越来越多的关注。在以数据为核心资源的信息社会,大数据已经成为新时代最具价值的宝藏之一。作为关系国计民生的基础能源支撑体系,电力行业在大数据时代也面临着新的挑战和难得的发展机遇。深入挖掘分析数据更深层次的价值,积极推进电力系统大数据应用,将有利于供电企业精细化运营管理,全面管控各种经营风险,提高公司管理水平和运营效率,以此推动供电企业的转型发展。近年来,电力行业工业化与信息化融合发展,电力数据呈现爆炸式增长,供电企业每天都在产生海量的运营数据,但数据处理能力的落后与数据快速增加之间的矛盾更加凸显。本文基于当前供电企业信息化发展现状,以地市供电公司运营监测(控)中心为应用对象,探索利用大数据挖掘技术开展运营监测分析业务,以实现中心“千里眼、顺风耳、铁算盘、预警机”的作用。

1 应用背景

1.1 电力大数据的应用

目前在电力行业,欧美等发达国家对电力大数据的应用已经处于发展初期,如澳大利亚国家电力市场曾利用数据挖掘方法来预测电力价格的均值[1];德国通过电网收集用电数据以预测客户的用电习惯,从而推断在未来2~3个月时间里整个电网大概需要多少电量;丹麦维斯塔斯风力系统依靠BigInsights软件和IBM超级计算机对气象数据进行分析,优化风力发电机的放置位置。而我国的大数据应用才刚刚起步。

1.2 数据挖掘技术

大数据时代为企业带来了获取更丰富、更深入和更准确地洞察市场行为的大量机会,但传统的数据处理方法多停留在查询、统计、简单分析等最基本的层次。专家系统靠人工获取知识这一“瓶颈”问题,在与日俱增的数据面前无能为力[2]。“数据海量,知识匮乏”是大数据时代很多企业的通病。运用相关的技术手段对大量的数据进行深加工,发现隐含的信息并加以利用,进而指导电力企业做出正确的决策,这样电力大数据的作用才能充分发挥出来[3]。

大数据分析的理论核心就是数据挖掘算法,各种数据挖掘的算法基于不同的数据类型和格式才能更加科学地呈现出数据本身具备的特点。数据挖掘就是从大量数据(包括文本)中挖掘出隐含的、未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程[4]。它能代替专家从大量数据中挖掘出隐含于其中的知识,利用数据库的存储功能,找出数据之间的潜在关系和数据本身固有的规律[5]。充分发掘电力大数据的价值,能够在提升运营管理水平、提高用户服务水平、支撑未来电网发展、提供政府决策支持等方面取得长足的进步。

数据挖掘技术的基本任务主要体现在分类与回归、聚类、关联规则、时序模式、偏差检测5个方面[4]。

1.3 国家电网运营监测(控)中心

为确保电力安全清洁可持续供应,全面管控各种经营风险,不断满足客户日益增长的多样化需求,2010年国家电网公司开始深化人财物集约管理(简称“三集”),推进“大规划、大建设、大运行、大检修、大营销”体系建设(简称“五大”)。2012—2014年,按“三集五大”体系建设要求,总部、省(市)、地市三级运营监测(控)中心陆续成立,通过对公司核心资源、主营业务活动、关键业务流程开展实时监测分析,建立闭环管理、横向协同的协调控制机制,实现对公司运营状况事前、事中及事后的全面预测、监控及分析。按照职能定位,运营监测(控)中心也是国家电网公司的数据资产管理部门和大数据分析应用部门,依据公司相关制度负责开展数据质量管理和大数据分析应用工作。

随着电网规模的扩大和复杂性的提高,信息系统成为保障电力系统安全稳定运行不可或缺的一部分[6]。近年来,国家电网公司深入推进信息化建设,搭建了数据纵向贯通、横向集成的一体化企业级信息集成平台,建成了多个业务应用系统,囤积了海量电力数据资源,为大数据挖掘技术的应用提供了先决条件。

基于以上,研究利用大数据挖掘技术在运营监测(控)中心的应用既是大势所趋,也十分必要。

2 利用大数据挖掘开展供电企业运营监测

国家电网公司运用已有信息化建设成果和技术手段建设运营管控系统。该系统基于公司数据中心、关口电量计量信息系统、财务资产管理信息系统、GIS系统、营销稽查系统、规划计划信息一体化系统、ERP等系统实现运营关键指标和跨部门业务流程的综合展现。运营监测(控)中心依托该系统,基于大数据挖掘技术,对公司核心资源和主要经营活动开展监测,有利于公司精细化运营管理,提高管理水平和运营效率。

2.1 构建层级监测体系

深入挖掘涉及公司综合绩效、核心资源、运营状况的所有指标数据,横跨专业、贯穿流程,结合公司实际运营情况选取关键监测对象,充分考虑监测指标对公司经营管理水平的影响程度,按关注重点进行监测等级分类,确定重点监测和辅助监测指标,并随时更新,构建一套有重点、有层次、符合实际的运营监测指标体系。

如图1所示,运营监测指标体系由综合绩效、核心资源、运营状况3大核心要素构成,每个核心要素又细分为多个关注维度,进而分解为不同关注点,根据关注点涵义设置监测指标,考虑到指标的重要性程度、指标数据来源的可靠性程度、指标的层级关系,原则上将业务重要性高、数据来源可靠性高且层级高的指标划分为重点监测指标,其余指标则划分为辅助监测指标。例如“综合绩效”下的关注维度“电网状况”,下设关注点“电网结构”,包含6项监测指标。其中容载比、城市配电线路联络率,通过监测反映公司经营执行情况,设置为重点监测指标;单线单变比例、平均供电半径,数据采集频度为年,日常监测业务价值较低,设置为辅助监测指标;单条电源进线或单台主变的变电站数量、城市配电网线路条数,均为指标的计算因子,主要用于支撑父级指标的溯因分析,因此也设为辅助指标。

图1 运营监测指标体系

参考行业技术标准、公司目标计划以及该指标历史数据变化趋势或波动范围,为每项监测指标设定预告警规则和阈值,一旦指标落入预告警区间,运营管控系统及时产生异动、发布预告警。其中针对重点监测指标,在已有阈值规则的基础之上,从纵向历史数据比较、横向各单位比较、关联分析等方面拓展监测方法,以定位异动原因、发现业务问题。

2.2 建立指标关联网络

为避免对指标的独立监测导致得出片面的分析结论,充分利用数据挖掘手段探寻各项数据间的潜在关联。考虑各项指标间显性算法关联及隐性业务关联关系,构建指标关联网络。

某项指标发生变化会影响与之相关联的其他指标,比如售电量与售电收入、市场占有率等指标均存在明显的正相关性,因而售电量的波动会引发其他指标发生变化。所以,通过采取有效措施提升售电量,其他指标也会相应提升,或者在进行指标异动分析时,这些显性关系能帮助我们快速定位异动原因。实际上,除了这些已知的显性关联,不同指标间可能存在某些未知的隐性业务关联。有效利用这种隐性关系,则对于公司打破专业壁垒、提升业绩指标、控制风险,必能起到事半功倍的效果。基于以上分析,我们利用大数据挖掘技术开展了探寻指标隐性关联关系的工作。

以层级监测体系中的所有指标为分析对象,按月度为周期,从业务应用系统中提取近5年指标值,通过数据清洗去除部分缺失、不准确等问题数据,最后确定9个专业共346项指标参与计算。经过论证后采取回归分析方法,建立回归分析模型,计算相关系数。

回归分析是确定2种或2种以上变量间相互依赖的定量关系的一种分析方法,按照自变量的多少,分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。它基于观测数据建立变量间适当的依赖关系,以分析数据内在规律,并可用于预报、控制等问题。为计算两两指标之间的关联关系,采用一元线性回归分析。它的任务就是根据若干个观测值(xi,yi)(i=1,2,…,n)找出描述2个变量x、y之间关系的直线回归方程y∗=a+bx,其中y∗是变量y的估计值。a称为截距,b为回归直线的斜率,也称回归系数。求直线回归方程y∗=a+bx,实际上是用回归直线拟合散点图中的各观测点。常用的方法是最小二乘法,也就是使该直线与各点的纵向垂直距离最小,即使实测值y回归直线之差的平方和达到最小,也称为剩余(残差)平方和。

线性回归方程中的相关系数r就是线性相关度的大小,r绝对值越靠近1,线性相关越好,拟合的直线与描点所得图线也更相近。其计算公式为

利用回归模型开展相关性分析,将指标逐个循环比对运算。认为相关系数r绝对值在0.8及以上的指标具有线性相关关系,对此类指标开展定量分析、业务关联分析,重点关注跨部门隐性关联指标。

确定指标关联关系后,构建预警防控网络,一旦关联网络内有指标异动,其关联的其他指标按一定的逻辑判断自动提前预警,达到牵一发而动全身的效果,将传统的事后监测分析模式向事前风险预警、有效防控方式转变。另一方面通过控制过程数据(即指标影响因子),及时纠偏,以确保重点监测指标达到预期值。

通过构建大数据背景下的指标监测体系,实现对公司主要经营活动和管理绩效的全天候监测;实现对规划、建设、运行、检修、营销、人资、财务、物资等业务的全方位监测;实现对企业生产、建设、经营、物资等环节的全流程监测。最终以两手抓方式构建公司风险预警防控体系,为公司依法治企、安全稳定运行保驾护航。

3 开展基于大数据挖掘的精细化运营分析

充分利用各项信息系统积累的海量数据,以数据挖掘为手段,通过对准确的过程性、明细数据和历史数据的挖掘和分析,形成有价值的分析成果,使公司管理层全面了解企业的运营状况,准确把握运营工作的优势劣势,为公司经营决策提供有力支撑,为提升运营效率和经济效益提供有力保障。

3.1 综合分析

开展对外部环境及主要运营活动的综合分析:客观评述外部环境变化,综合反映本单位月度运营活动的基本情况和运营特点,揭示异动、剖析问题,提出有关建议。

通过深度挖掘分析运营规律和趋势,针对营销、运检、财务、人资、基建、调度、后勤、品牌建设等各专业的薄弱环节、存在问题,每月及时提出风险预警,制定相应措施,为公司管理层牢牢掌握全局、科学决策提供了有力支撑,同时推动了各业务部门全面开展数据挖掘分析工作,打破专业壁垒,形成了高效的协同机制,横向协同效率明显提升。

3.2 专题分析

针对与公司运营密切相关的重点、热点、难点问题,开展深入分析,引入分类、估值、聚类、关联规则、预测等数据挖掘技术,应用到供电企业经营分析、用电市场营销分析、客户关系管理等领域,构建评价模型,开展问题原因分析,提出解决问题的对策建议,并明确责任主体。

以“业扩报装流程效率专题分析”为例,通过对营销业务应用系统中业扩报装所有相关明细数据的挖掘分析,总结数据规律,提出了多项分析结论用于指导公司业扩业务运行。一是对低压居民、低压非居民、高压3类客户的业扩完成时间进行分类分析,据此划定了业扩流程时限“警戒线”,若超过预警线,则认为该户业扩流程有可能存在受阻情况,对超过警戒线90%的工单发出预警,对超过警戒线95%的工单发出告警,开展提前预判,防范受阻风险。二是按用电类别开展分类分析,分别定位了高压和低压非居民客户中耗时最长的3种用电类别,建议公司针对此类用户开展差异化服务以提高办电效率。三是对超期工单历史数据进行挖掘分析,发现装表接电为超期率较高的业扩环节,据此提出了相关建议加以防范。四是对业扩投诉数据进行聚类分析,将投诉工单类型分为高度关注、重点关注、加强关注、一般关注等4种类型,定位不同投诉类型特征,为业扩舆情处置提供参考。

3.3 即时分析

针对公司运营过程中产生的、时效性较强的重大异动和问题开展即时快速分析。利用运营管控系统设置供电服务、营销稽查、故障抢修、配网台区低电压监测、车辆使用状况、购售电等多个监测专题,一旦出现预告警,即时分析异动和问题,快速查找原因,明确消除异动和问题责任主体。

通过开展基于大数据挖掘的精细化运营分析,形成运营监测(控)中心与专业部门协同的公司运营分析工作体系,产生管理协同效应,对公司加强预控、强化分析、支撑决策、防范风险具有重要意义。

4 结束语

运营监测(控)中心结合自身实际和业务发展需要,充分利用信息化成果,通过开展基于大数据挖掘的运营监测分析,可实现公司资源整合,提升运营水平,打破专业壁垒,实现企业经营管理关键数据指标由专业部门分散监测向公司集中监测的转变。通过多维分析和深度挖掘,能够快速准确地查找工作差错点、异常点、风险点,初步构建了公司风险预警防控体系,为提高经济效益和管理效率提供了保证。本文对于大数据挖掘在监测分析业务上的应用仅进行了初步的探索,待数据质量、分析技术进一步提高后,相信大数据挖掘技术在供电企业的应用前景更为广阔。

[1]董朝阳,张 沛.电力系统分析新兴技术[M].北京:高等教育出版社,2011.

[2]商文颖,李岩春,于胜尧.基于数据挖掘的电力系统电压稳定分析[J].东北电力技术,2008,29(10):6-8.

[3]卢建昌,樊围国.大数据时代下数据挖掘技术在电力企业中的应用[J].广东电力,2014,27(9):88-94.

[4]张良均,陈俊德,刘名军,等.数据挖掘实用案例分析[M].北京:机械工业出版社,2014.

[5]谭小野.数据挖掘在电网安全中的应用[J].东北电力技术,2005,26(8):40-44.

[6]刘国民,宋 雨,周庆捷.智能电网信息化体系架构研究[J].东北电力技术,2012,33(2):15-17.

Study on Operation Monitoring and Analysis Based on Big Data-mining

LI Xiao⁃lan1,TIAN Xiao⁃lei2,NI Zhi⁃jian1,FENG Liu1
(1.State Grid Shenyang Power Supply Company,Shenyang,Liaoning 110003,China;2.State Grid Liaoning Electric Power Co.,Ltd.,Shenyang,Liaoning 110006,China)

With the combination development of power industry industrialization and informatization,electric power data is showing the scale of explosive growth,big data era of power industry has arrived.This paper chooses operation monitoring and controlling centre for given power supply company as the subject,relying on its operational management systems,potentially relevant indicators are explored by using data-minin,building operation monitoring system and risk warning prevention system can locate loopholes in management quickly and accurately by introducing data-mining technology to carry out intensive operations analysis.It provides a guarantee for eco⁃nomic efficiency and management efficiency.

Big data;Data-mining;Power supply company;Operation monitoring;Operation analysis

TP311.13

A

1004-7913(2016)03-0038-04

李小兰(1986—),女,硕士,工程师,从事供电企业运营监测与数据分析工作。

2016-01-09)

猜你喜欢

数据挖掘监测指标
一类带临界指标的非自治Kirchhoff型方程非平凡解的存在性
特色“三四五六”返贫监测帮扶做实做细
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
最新引用指标
莫让指标改变初衷
网络安全监测数据分析——2015年12月
网络安全监测数据分析——2015年11月
一种基于Hadoop的大数据挖掘云服务及应用
制造强国的主要指标