基于大数据挖掘的地震前兆台网观测数据跟踪分析
2016-10-20李正媛熊道慧刘高川刘春国梁毅强叶
李正媛熊道慧刘高川刘春国梁毅强叶 青
1)中国北京100045中国地震台网中心
2)中国北京100036中国地震局
基于大数据挖掘的地震前兆台网观测数据跟踪分析
李正媛1)熊道慧2)刘高川1)刘春国1)梁毅强2)叶 青1)
1)中国北京100045中国地震台网中心
2)中国北京100036中国地震局
地震前兆台网观测数据跟踪分析工作应用数据挖掘、大数据分析等信息技术,基于中国数字化地震前兆台网,探索创建由数据分析模型、软件硬件设备、数据库、网络通讯等构成的挖掘处理系统。对海量前兆观测数据进行挖掘处理,获得地震前兆观测事件记录信息,并行于前兆台网观测数据产出流程,形成常态化地震前兆观测事件记录产出流程,为推进智能化地震前兆监测、提升数字化地震台网信息处理能力奠定基础。
观测数据跟踪分析;地震前兆观测事件记录;大数据分析;数据挖掘
0 引言
中国数字化地震前兆观测台网实现自动化观测、观测数据准实时汇集,全网2 800余套观测仪器、测项分量8 000余项,每日产出数据信息量近2 GB,台网监测能力显著提升。数字化观测技术对传统观测、分析方式形成冲击,主要表现为:①处理海量数据工作量成数倍增加,传统分析方式难以为继;②城镇化建设的快速发展,对地震台站观测环境的人为干扰破坏日益严重,高密采样数据的干扰信息难以分辨;③自动化观测替代模拟观测使台站观测作用弱化,如何发挥技术专长、突出监测实践优势作用难以体现。
2008年汶川8.0级地震发生后,《中国地震局关于加强地震监测预报工作的意见》提出“地震台站在完成保证观测质量、良好运行维护等主体任务的同时,应发挥在异常核实、分析预报等方面的积极作用”①《中国地震局关于加强地震监测预报工作的意见》[中震测发〔2010〕94号),明确地震台站职能转变的任务与内容。另一方面,信息技术、网络技术、大数据技术、数据挖掘技术等新技术的快速发展,为推进数字化地震前兆台网数据的深度处理奠定了基础。
地震前兆台网观测数据跟踪分析是涉及中国前兆台网的系统性专项工作,主要工作内容概括为3方面:①建立模型,研发地震前兆台网观测数据挖掘处理软件平台;②组织全台网(站)开展观测数据跟踪挖掘分析,提取观测事件记录信息并存储入数据库;③利用地震信息网络实现全台网挖掘事件信息汇集、存储、共享。
开展地震前兆台网观测数据跟踪分析工作,推进了数字化地震观测向信息化的转变,有利于克服数字化技术应用过程中产生的矛盾,提升地震前兆台网数据产出能力。得到的地震观测事件记录信息降低数据维度且物理意义明确:①可以直接、有效地支持和满足深度应用、台网管理、信息重组等使用需要;②为地震预报分析提供更具针对性的事件记录信息,减轻直接处理海量数据的工作强度;③以地震台站监测一线人员为主体,分析提取观测事件记录,有利于发挥专业能力,促进地震监测工作职能由观测为主,向观测、应用并重转变。
自2010年起,国家地震前兆台网中心组织各省地震局区域前兆台网中心、学科台网中心和地震台站,围绕数据挖掘处理方法、分析软硬件与网络支撑、全网技术推广与组织机制等方面开展专题研究与工作创新,完成地震前兆台网观测数据跟踪分析各环节的专项任务。在方法探索(2011年,甘肃、新疆、山西省地震前兆台网)、扩大实验(2012年,河北、云南等17省(直辖市)地震前兆台网)、分布式网络化系统流程构建(2013年)3个研究阶段后②③《关于组织开展地震前兆台网观测数据跟踪简报编写工作的通知》中震测函[2012]165号,历经2014年、2015年的应用检验,形成常态化地震前兆台网观测数据跟踪分析工作模式与组织机制。
1 技术途径
1.1 数据挖掘技术与知识信息
数据挖掘技术又称为数据库中的知识发现,通过对海量数据的挖掘处理及目标函数的信息重组、模型解释等,获取未知的、有价值的知识信息(陈晶等,2011;李正媛等,2011)。在信息科学中,信息是加以排列和处理的数据;知识信息则是有意义的信息集合(王秀英等,2015;张晁军等,2015)。基于大数据的挖掘技术,提供了新的认识视野(维克托·迈尔·舍恩伯格等,2012;涂子沛,2013),近年来数据挖掘技术在地震分析研究中的应用,已初步显现前景(程陈等,2013)。
地震前兆台网能够观测到地壳运动、环境变化、人类活动等事件,并表达为一组量化观测数据记录集合。观测事件记录知识信息(以下简称为观测事件记录)是观测数据记录与事件属性的结合,是基本信息单元。跟踪分析工作的核心是从海量观测数据中挖掘观测数据记录集合,通过事件属性知识的“数据泛化”重构观测事件记录。虽然观测数据记录集合与观测事件记录的数字特性具有一致性,但由于知识信息维度更广且属性意义明确,在数据挖掘、大数据应用中更易于直接传递和广泛使用(维克托·迈尔·舍恩伯格等,2012;涂子沛,2013)。
1.2 学科方法及观测基础
观测数据记录集合挖掘、观测事件记录重构具备科学性、真实性及地震台网观测实践基础。各学科理论技术方法与各项量化指标,是数据挖掘模型、用户目标函数及异常阈值确定的重要依据。一方面,形变、电磁、流体学科理论与处理算法,是数据分析、异常确定的基本参考背景,包括:重力、形变、水位等的潮汐模型,电磁场、电磁扰动模型及抽水、载荷等干扰模型等④地震前兆台网观测数据跟踪分析技术指南(征求意见稿),2013.12;另一方面,学科台网的观测数据质量控制指标体系,构成台网变化态势分析与噪声水平大小判定的指标依据,例如:地球潮汐理论模型拟合误差指标、非潮汐变化稳定性误差指标、长期趋势变化稳定性指标等;第三方面,对地震前兆台网各类观测手段、观测技术的实践经验及认识成为重要的分析佐证(GB/T 19531.2—2004,GB/T 19531.3—2004,GB/T 19531.4—2004)。
1.3 观测事件记录确定
地震前兆观测事件记录定义准确客观,兼顾观测能力与后续应用的需要,符合以下原则:①由1组观测数据集合量化表示;②与发生的运动、变化、台风、爆破、抽水等事件具有时空关联性;③符合地震台网观测能力。
根据上述原则,通过全面分析总结形变、电磁、地下流体台网观测数据演变规律与特征,结合事件的物理性质、学科认知程度,地震前兆台网观测事件记录归纳确定为下述7类,即:正常演变背景、观测系统故障、气象因素干扰、场地环境干扰、人为活动干扰、地球物理事件和不明原因变化⑤⑥地震前兆观测数据跟踪分析技术规范系列之分析记录(征求意见稿),2014.9。其中,正常演变背景记录是观测数据变化规律分析的基准,反映台站的地球物理(化学)观测数据序列居于正常变化状态,观测量值特征符合理论预期或长期正常态变化趋势;观测系统故障记录反映由于观测系统的故障或异常状态下,引起的观测数据偏离;场地环境干扰记录、人为活动干扰记录则反映在观测数据正常态下,叠加的场地环境、人为活动的干扰影响信号;地球物理事件记录主要反映前兆台网响应的短期地球运动与变化过程;不明原因变化记录是指无法判定观测数据变化原因或判定证据不足,有待继续观测探明确切诱因的事件。
1.4 构建事件记录知识信息
如上所述,观测事件记录知识信息由前兆观测数据记录集合和事件属性信息组成。通过对观测数据的挖掘处理,获得发生变化的观测数据记录集合;事件属性信息则通过一系列观测信息提炼得到,经过定性概念描述、数字参数刻画、图形绘制展示等信息重构实现⑥,这些信息阐述事件记录的诱发因素、变化过程、变化特点、关联情况等,规范约定的信息内容包括:①台站参数(台站名称、代码)、测点代码、测项名称等信息;②时间参数(事件记录的开始、结束时间);③观测事件记录类型、干扰源及干扰特征(干扰过程、强度、周期、影响方式)等,如:受台风影响时,应说明台风名称、级别、登陆及移动路线、时间过程与测站距离等;④数据记录变化参数及特征(变化幅度大小、变化周期、变化过程、变化特点等);⑤辅助测项及关联变化;⑥图像绘制展示等信息。
2 网络流程创建与工作实现
地震前兆台网观测数据跟踪分析软件设计为分布式架构,部署在各信息节点上,并行开展数据挖掘处理,结合监测日常运行工作流程,发挥数字化台网技术优势,提高数据挖掘处理效率。在技术构架和组织形式上,地震前兆台网观测数据跟踪分析软件符合大数据的“5V”特点,即“大量”(Volume)、“高速”(Velocity)、“多样”(Variety)、“价值”(Value)、“真实性”(Veracity)(维克托·迈尔·舍恩伯格等,2012;涂子沛,2013)。
2.1 跟踪分析软件研制
地震前兆台网(站)观测数据跟踪分析软件由国家地震前兆台网中心组织研制,支撑各级节点基于观测数据库准实时事件记录挖掘处理工作。在2013—2015年,观测数据跟踪分析软件经过雏形研制、功能扩展、操作完善等版本的升级研发,初步满足多种类型前兆事件记录的数据挖掘分析功能。通过人机交互判定,完成观测数据记录挖掘提取、观测事件记录重构、图件绘制、审核与修改、入库存储等工作,具备自动快速生成相关报表、图集、报告及信息查询等功能,满足地震前兆台网数据跟踪分析处理的基本需要,保证各项工作顺利开展。
2.2 网络化流程创建
针对数字化地震地震前兆台网的分布式技术系统结构(周克昌等,2013),利用各节点具有的软硬件、数据库及地震信息网络资源,将观测数据跟踪分析软件、观测事件记录数据库分别部署在台站、区域前兆台网中心、学科台网中心和国家地震前兆台网中心4级信息节点上,形成中国地震前兆台网观测数据跟踪分析工作系统。依托地震信息网络,实行全网观测事件记录的交换汇集,满足节点之间的交互处理需求,按约定任务并行开展全国前兆地震台网观测数据跟踪分析挖掘工作。在地震台站,使用跟踪分析软件进行数据挖掘,提取观测数据记录集合,重构观测事件记录,并存储于台站观测事件记录数据库;在区域地震前兆台网中心、学科台网中心和国家地震前兆台网中心,分级汇集观测事件记录,检查记录质量,开展综合分析,编制观测月报、年报。国家地震前兆台网中心负责中国地震台网跟踪分析系统架构与推进协调工作,及时总结工作情况,优化模型应用并完善软件。
地震前兆台网观测事件分析与观测数据产出并行开展,在保证数字化地震台网观测数据正常产出的同时,得到对应的观测事件记录信息,形成衔接数字化地震台网观测系统信息处理的应用系统雏形。地震前兆台网观测事件分析流程见图1。
图1 地震前兆台网观测事件分析流程Fig.1 Workflow of seismic precursor network monitoring and data tracking analysis
2.3规范与组织实施
为推进地震前兆台网观测数据跟踪分析工作开展,中国地震局、监测预报司印发相关工作通知、组织办法等文件①②③;国家地震前兆台网中心牵头组织、区域地震前兆台网中心、学科台网中心协同参与,围绕地震前兆观测事件挖掘开展长期探索与研究工作,针对地震前兆台网观测数据跟踪分析工作、技术指南、事件描述要素标准、技术要求与评比方法等,制定相关技术约定与规范④—⑦,密集组织开展专题培训与工作交流,在技术操作与组织机制方面落实,有效推进地震前兆观测数据跟踪分析工作。
2.4 工作成果
地震前兆台网数据跟踪分析工作于2014年纳入地震前兆台网监测日常工作任务,各级节点产出前兆观测事件记录、前兆台网观测事件报告(月、年)和观测事件图集等成果,其中2014年获得25 920条、2015年获得30 763条地震观测事件记录,均存储在地震前兆台网观测事件记录数据库,是地震前兆数据跟踪分析工作的基础及核心成果。根据存储的观测事件记录,各区域地震前兆中心、学科台网中心和国家地震前兆台网中心编制月报844份、年报80份,获得大量数据跟踪分析图集等成果,上传至国家地震前兆台网中心网站共享服务;部分报告提交至所属单位地震预报部门,为地震预报应用研究提供佐证。此外,通过设定事件选择条件,从事件知识库中抽取典型事件信息,编纂2014年、2015年地震前兆台网典型观测事件图集,成为数据跟踪分析工作示范实例,为快速、准确识别海量观测数据的基本态势及异常变化积累经验。
3 结束语
中国地震前兆台网观测数据跟踪分析工作2010年起步探索,在全台网齐力推进下,步入常态化、规范化试行工作阶段。中国地震前兆台网开展观测数据跟踪分析,提升了地震监测一线专业人员的数据分析能力需求,推动了数字化地震前兆台网海量观测数据的信息化处理进程,发展了地震前兆台网观测数据处理与产出能力,适应了数据挖掘、大数据等信息技术创新发展的方向。另一方面,系统挖掘地震前兆台网中直接反映学科现象与演变规律的各种前兆观测事件记录,有利于夯实数字化地震前兆台网的基础处理能力,发挥地震前兆台网监测效能。
开展地震前兆台网观测数据挖掘,探索新系统下地震前兆监测与地震预报工作结合的分析应用模式,建立数字化地震前兆台网的数据挖掘、信息处理工作体系,需要经历不懈的研究探索、实践检验、升级完善的长期过程,需要地震前兆监测、台网管理、地震预测预报等同仁的支持、参与及共同推进。
中国地震前兆台网观测数据跟踪分析工作在中国地震局领导下,在中国地震台网中心支持下,由国家地震前兆台网中心牵头,联合形变台网中心、重力台网中心、地磁台网中心、流体台网中心、地电台网中心、各省地震局(直辖市)前兆台网中心、各前兆台站、预报部门等相关专家共同推进开展,在此表示衷心感谢。
陈晶,李正媛,王丽娜,等.一种地震目录中基于兴趣度的关联规则分析方法[J].计算机应用研究,2011,28(6):2 078-2 081.
程陈,史文博.大数据挖掘分析在地震科研中的应用[J].信息系统工程,2013,12(20):27-28.
李正媛,陈晶,王丽娜,等.一种基于误差和关键点的地震前兆观测数据异常挖掘算法[J].计算机应用研究,2011,28(8):2 897-2 901.
涂子沛.大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活[M].南宁:广西师范大学出版社,2013.
王秀英,张玲,张聪聪.探讨地震前兆观测中的大数据挖掘与应用[J].震灾防御技术,2015,10(1):39-45.
张晁军,陈会忠,李卫东,许洪华,彭远黔.大数据时代对地震监测预报问题的思考[J].地球物理学进展,2015,30(4):1 561-1 568.
周克昌,赵刚,王晨,等.中国地震前兆台网观测技术系统整合[J].中国地震,2013,29(2):270-275.
维克托·迈尔·舍恩伯格,肯尼思·库克耶著,盛杨燕,周涛译.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2012.
Abstract
Using big data and data mining technology,basing on the national digital precursor network,we explore a set of mining processing system which is composed of data analysis model,software and hardware equipment,database,network communications.we mining and process these massive data and obtain the information of the precursor observation event record.This work parallel to the network observation data output flow and form the normalized output flow of precursor observation event record.Also,this work can lay a foundation for the construction of intelligent earthquake precursor monitoring and enhance the processing ability of digital network information.
The application of large data mining techniques in Earthquake Precursory Network Observation Data Tracking Analysis
Li Zhengyuan1),Xiong Daohui2),Liu Gaochuan1),Liu Chunguo1),Liang Yiqiang2)and Ye Qing1)
1) China Earthquake Networks Center,Beijing 100045,China
2) China Earthquake Administration,Beijing 100036,China
observation data tracking analysis,precursory observation event record,big data analysis,data mining
10.3969/j.issn.1003-3246.2016.03.001
李正媛(1959-12—),女,研究员,中国地震台网中心前兆台网部负责人,长期从事地震地壳形变研究、前兆台网技术管理等工作