基于电力历史应急大数据的应急情景规则分析与发现方法研究*
2019-06-05荣莉莉
荣莉莉,李 群,于 振
(1.大连理工大学 系统工程研究所,辽宁 大连 116024;2.全球能源互联网研究院,北京 102209)
0 引言
近几年,随着我国各类突发事件的不断发生,尤其是造成严重人员伤亡、财产损失以及国际不良影响的重特大事故,各级政府与企业对应急管理水平的不断提高提出迫切需求,而作为应急管理工作的重要抓手,以应急预案为核心的应急管理体系建设则是重中之重,自2006年国务院颁发国家突发事件总体预案以来,全国各地方和企事业单位相继开展应急预案的编制工作,初步形成了以“总体预案—专项预案—部门预案—企事业单位预案”为主线的应急预案体系[1],在近几年突发事件应急过程中发挥了重要作用。但是,在现有应急管理体系中,应急预案可操作性差,应急演练与培训缺少实战性,应急处置缺少前瞻性、较为被动的问题在应急管理实践中不断暴露出来,为了进一步提升现有应急管理体系的效率,很多学者从不同角度和层面开展相关研究。在应急预案方面,刘铁民[2]在总结国内外应急预案体系发展过程与经验的基础上,针对现有应急预案的顶层设计需求,分析并提出应急预案体系总体结构、功能分类及其相互关系,并建议在首先完成顶层愿景设计基础上,再逐渐分阶段实现并形成循环持续改进机制;薛元杰等[3]探究对照法在应急预案充分性、可行性、完整性、可接受性、符合性评估中的应用,并将应急准备能力提升作为应急预案修订的目标。在应急准备方面,李湖生[4]提出以定性评估指标为主、定量评估指标为辅,并综合考虑基础风险水平差异的区域应急准备能力评估体系及其归一化的综合评分方法;江田汉等[5]建立突发事件应急准备脆弱性评估指标体系,并引入简单加权求和法、秩和比法,并最终计算得出突发事件应急准备脆弱性指数。在情景构建与推演方面,刘铁民[6]提出适用于我国重大突发事件情景基本概念、分类矩阵、构建程序、情景框架结构与要素内容等一些理论与方法;王永明[7]设计事故灾难类重大突发事件情景构建概念模型,分析概念模型中的“机会窗”和“准备效益”等重要理念;盛勇等[8]从系统复杂性、开放式预先设想以及序贯性3个主要原则的角度理解突发事件情景演化的机理,构建了突发事件情景演化系统模型,并以此为基础设计了突发事件情景网络关键要素的提取方法;朱晓寒等[9]从自然灾害链情景态势组合推演框架构建、自然灾害链情景描述、自然灾害情景要素组合推演途径3方面开展针对性研究。在电网因灾(自然灾害)受损方面,陈鹏云等[10]根据高压电网故障统计资料,分析了中国电网中自然灾害概况,并结合主要自然灾害对电网损毁性影响的特征及其时空分布特征,指出目前中国高电压主网的安全风险(大范围冰灾、大面积污闪、大面积线路覆冰舞动);门永生等[11]针对典型自然灾害对电网重要设施影响的特征,构建了基于8类典型自然灾害的电网重要基础设施脆弱性评价指标体系;王兴发等[12]在分析风灾、洪涝、雷害、火烧山、污闪、地质灾害和覆冰7类自然灾害对电网造成主要影响的基础上,从电网自然灾害预警系统的目标与功能、预警指标体系、系统结构、信息资源的整合、预警事故集的生成5个方面进行系统构思和设计。
综合以上现有研究成果可知,从应急预案、应急准备、情景构建、情景推演、事故后果模拟等角度开展针对性研究,进而提高整体应急管理水平,是目前业界的共识,但进一步分析可以发现,针对突发事件,尤其是电力突发事件这种夹杂着大量危险源、承载体与应急响应行为的复杂突发事件,开展相关演化过程的分析与预测始终是各项工作的前提与基础,现有研究成果大多从对突发事件本身的类型和特点入手,借助相关行业经验(定性为主),实验、计算与仿真建模(定量为主)等手段,去总结归纳相关突发事件的演化规律,这种方法不但存在由于各种假设条件带来的误差,而且对于影响因素种类和数量均较多的复杂突发事件来说,具有较大的应用局限性。而近几年,随着大数据研究领域的快速发展,以大数据管理与应用为代表的相关方法、技术与工具逐渐成熟,已广泛应用于各行各业[13-16]的相关指标分析与预测,本文即在以上业务与技术背景基础上,提出将大数据方法与技术应用于电力突发事件应急情景规则的分析与发现上,为电力突发事件情景演化规则的获取提供参考与借鉴。
1 情景构建与大数据技术结合的理论基础与逻辑关系
1.1 情景构建技术路线与产出
总结并分析目前应急情景构建方面的研究与应用成果,情景构建的大体过程可以分为如下3个阶段:
1)情景的筛选与确定阶段:主要是站在安全与应急业务需求的角度,经过相关资料收集与分解、以事件为中心的收敛与评价、情景的集成与描述等过程[6],最终形成相关的事件情景规划。
2)情景的细化与应用阶段:主要是在第1阶段确定的情景规划基础上,围绕具体情景开展的细化与应用,侧重于“情景-任务-能力”的提炼与对比应用。
3)情景的评估与改进阶段:主要是在之前2个阶段成果的基础上,结合实际的事故处置以及应急演练,从情景设置、任务分解、能力准备等多个角度进行针对性评估,进一步完善相关情景构建的成果。
从以上情景构建的技术路线可知,相关“情景-任务-能力”内容是情景构建的主要产出。
1.2 数据分类与预测
一般来说,数据挖掘的算法主要包括分类、预测、聚类、关联4种类型,而目标变量的类型(离散型或连续型)则是分类与预测的主要区别。从对突发事件应急情景推演的角度来说,大量事故案例数据、应急演练数据等以及情景构建产出的“情景”与“任务”数据,显然可以作为监督学习的训练集,目前主要的分类算法包括决策树、逻辑回归等,预测算法包括线性回归、SVM、神经网络等,而以上模型算法在相关数据挖掘工具或平台下的实现主要包括:IBM SPSS Modeler、Mahout、Spark MLlib等。
1.3 大数据与情景构建的对接模式
近几年,随着大数据技术,尤其是相关存储与管理平台的快速发展,大数据与各行各业的结合速度明显加快,为了将先进、成熟的大数据技术应用于应急行业,从业务层面上,构建大数据与情景构建的对接模式,如图1所示。
图1 大数据与情景构建间的业务逻辑说明Fig.1 Business logic illustration between big data and scenario construction
由图1可知,安全与应急大数据是所有业务开展的基础,主要由案例数据、演练数据以及相关“情景构建”数据3方面组成;而经过相关针对性的案例分析、过程评估以及情景分析,生成典型突发事件案例的情景数据集,每个情景数据集均需从情景的时间顺序和情景状态2方面进行描述;在经过预处理的情景数据集上,综合运用相关的数据挖掘方法与技术,最终得出典型突发事件的情景演化规则。
2 基于电力历史应急大数据的应急情景库设计与实现
基于电力历史应急大数据的应急情景库是开展“情景—构建”和“情景—应对”的基础和前提,也是开展情景规则发现的数据基础和物理前提条件,本文在大量历史电力应急数据的基础上,利用相关的数据挖掘和分析技术,实现对电力突发事件发展和影响规律进行分析,进而从事件演化层面(主要指自然灾情的变化和发展)、事件后果层面(主要指电力行业相关的事故后果)和突发事件应对层面(包含:应急指令的发布、应急资源的调度等)进行相关应急情景库的设计与构建。
2.1 应急情景库的总体架构设计
应急情景库的总体架构如图2所示。
图2 应急情景库总体架构Fig.2 Overall architecture of emergency scenario library
由图2可知,电力突发事件的应急情景库主要由“事件演化情景库”、“事件后果情景库”和“事件应对情景库”3部分组成;“事件演化”导致了“事件后果”,而“事件后果”和“事件演化”一同导致了“事件应对”行为的产生;而“情景集成”主要是通过“事件演化”、“事件后果”以及“事件应对”3类数据中的“时间”维度进行关联,最终得到的“应急情景库”即是进一步开展“情景规则发现”(汇总统计和数据挖掘模型)的对象(输入),故在数据结构和数据质量2个方面均需符合相关方法和模型的要求。
2.2 应急情景库的实现关键要点
在明确了应急情景库的总体架构后,需要在逻辑层面、物理层面分别设计与实现“事件演化情景库”、“事件后果情景库”和“事件应对情景库”,而在此过程中,既需要采用关系模型设计数据“实体—关系”结构,还需要选择具体的关系数据管理系统(如:SQLSERVER或ORACLE)进行物理实现,同时,有关业务数据的抽取、转换与加载(ETL)也是相关实现的关键要点,限于篇幅本文给出相关库表的逻辑结构说明并简要说明ETL过程。
2.2.1 应急情景库的逻辑结构说明
1)事件演化情景库
事件演化情景库主要描述电力突发事件的发生、发展与结束的全过程,按照时间轴和一定的时间间隔进行存储和表达,此外,由于本文所指的电力突发事件主要是指自然灾害,故还需要有一定时间区间、一定空间区域范围的气象监测数据,因此,可以概括为“事件演化情景索引表”和“极端天气事件演化情景信息表”2个表。其中,事件演化情景索引表包括:事件编号、事件名称、事件类型、事件开始时间、事件结束时间、事件影响区域等数据项;极端天气事件演化情景信息表包括:气象站站点id、最高温、最低温、天气类型、湿度、风力、风向、气压、降水量等数据项。
2)事件后果情景库
事件后果情景库主要描述电力突发事件发生后给电网的正常运行带来的不良后果,按照后果类型可以大体划分为:人员伤亡、重要客户断电、变电站受损、输电线路受灾等,按照时间轴对某次突发事件的后果进行存储和表达,包括:后果发生时间、后果发生地点、后果发生地点坐标、事件后果类型、死亡人员数量、重伤人员数量、轻伤人员数量、断电重要客户名称、受损变电站名称、故障输电线路名称等数据项。
3)事件应对情景库
事件应对情景库主要描述电力突发事件发生后,各级应急单位(部门)所采取的相应应对措施,具体表现为相应应急指令的下达,按照时间轴对某次突发事件发生后的不同应急主体所下达的应急指令进行存储和表达,这里所说的应急指令涵盖了应急预案的启动、应急预警级别的确定和发布,应急响应级别的确定和发布,应急资源的调动等所有应对措施,包括:应急指令下达的时间、下达应急指令的主体、接受应急指令的受体、应急指令的内容、应急指令的类型、应急资源调动类型、应急资源调动数量等数据项。
2.2.2 基于应急情景库的数据抽取、转换与载入
在应急情景库的逻辑设计和物理结构实现基础上,需要在不同来源的数据基础上进行抽取、转换,最终得到一定质量标准的集成数据进行批量导入,以气象监测数据为例说明如下。
1)数据准备:电网现行的防台抗台业务系统中,有多个粒度、多个时间区间、多个地理范围的气象信息,为了与相关的台风信息、电网因灾(受损)信息等进行集成,需要确定“地理区域”和“时间区间”2个维度的具体取值范围,为下一步ETL工作提供数据提取的条件,如以2016年9月登陆我国的某台风为例,选择的“地理区域”为“福建省”、“时间区间”为“2016-09-10 14:00”到“2016-09-16 23:00”。
2)基于Kettle的ETL:在上一步得到的气象监测数据以及“地理区域”、“时间区间”的条件基础上,利用Kettle辅助工具开展相关ETL工作,共获得126条记录数据,如图3所示。
3 基于电力应急情景库的情景规则发现方法
在应急情景库的构建实现以后,以“时间”为索引的“灾情事件—气象监测数据—灾损数据—事件应对数据”的数据主线即建立起来,而通过相关的情景规则发现方法进一步分析、获得这些数据之间的逻辑关系(规则)则是电力应急工作更为迫切需要的。为了更清晰地表达基于应急情景库的情景规则发现方法,本文首先提出1个基础性的电力应急情景库整体逻辑视图,如表1所示。需要说明的是:表1中的气象监测数据、电网灾损数据以及应急投入数据等大类下的具体数据项可以根据实际应用过程中掌握的数据进行扩展,如:在进行雨雪冰冻灾情的情景规则发现时,可能会增加“湿度”、“天气类型”等气象监测数据项,以及“融冰装置”等应急投入数据项。
图3 气象监测数据ETL结果Fig.3 ETL results of meteorological monitoring data
表1 电力应急情景库整体逻辑视图Table 1 Overall logical view of electric power emergency scenario library
从表1可以看出,按照表1结构存储、载入的各类业务数据在“时间”维度上进行了统一和集成,这些数据往往来自于灾后的汇总统计,具有良好的数据质量,这就为后面的情景规则分析与发现提供了基础,本文提出的情景规则分析与发现方法主要包括:基于数据统计的规则发现和基于数据挖掘的规则发现2类。
1)基于数据统计的规则发现
基于数据统计的规则发现是指在表1结构下存储的各类业务数据基础上,进行多角度的数据汇总和统计,并重点提取各类汇总统计结果在“时间”维度上的实际业务意义。如:以某次台风为例,根据收集到的台风导致的变电站故障数据,可以汇总得到如图4所示的时序图,其中,横轴表示时间距离(起始时间为:2014-07-20 02:01:00),单位:h;纵轴表示变电站故障的总数,单位:个。从图4可以看出,在最初的80 h左右(以2014-07-20 02:01:00的故障记录为原点),故障变电站的总数基本在100个左右,且发展较为缓慢;但从大约80 h以后,故障变电站的数量激增,直至120 h左右的400个故障点,台风导致的变电站故障数量增长迅速,相应故障点增速可以达到18.69个/h,这种故障点数量的增长速度可以为以后同类、相似强度的台风应急提供故障点数量的初步预测。
图4 基于时间序列的变电站故障数量变化(某次台风影响)Fig.4 Quantity change of fault transformer substations based on time sequence (affected by a certain typhoon)
2)基于数据挖掘的规则发现
基于数据挖掘的规则发现是指在表1结构下存储的各类业务数据基础上,应用相应的数据挖掘模型和算法,对相应的目标项进行分类和预测。譬如:用聚类分析模型算法进行气象监测数据的分类预测,进而得到相应的灾损和应急投入预测,如图5~7所示。其中,如图5所示,进行聚类分析的台风信息数据项包括:登陆时强度等级、登陆最大风力(级)、登陆最大风速(m/s)、持续时间(h)和过程降雨量(mm)等;如图6所示,采用的聚类分析模型算法包括“两步模型算法”和“K-means模型算法”,模型算法的实现借助IBM SPSS Modeler工具实现;如图7所示为最终的聚类分析结果,从中可以看出,本文假设的“虚拟台风1”被分类为“聚类-1”,可以参考的台风包括“云娜”、“麦莎”等台风。
图5 用于聚类分析的台风基本信息数据集Fig.5 Dataset on basic information of typhoon used in cluster analysis
图6 台风聚类分析模型构建Fig.6 Construction of cluster analysis model on typhoon
图7 台风聚类分析结果Fig.7 Result of cluster analysis on typhoon
4 结论
1)在充分分析现有情景构建理论与方法的基础上,提出将电力历史大数据相关分析与挖掘技术应用于复杂电力突发事件的情景规则分析与发现领域,并从业务层面给出相关逻辑对接模式。
2)提出基于电力历史应急大数据的应急情景库设计与实现方法,并围绕相关历史数据的抽取、转化和加载(ETL)提供了具体技术方案。
3)在电力应急情景库的基础上,提出“基于数据统计的规则发现”和“基于数据挖掘的规则发现”2类情景规则发现方法,并分别进行了举例说明。