APP下载

数据挖掘技术在地震预报中的应用

2015-03-31王征商亮张闯

地球 2015年10期
关键词:分类法遗传算法数据挖掘

■王征 商亮 张闯

(抚顺市地震局 辽宁抚顺 113006)

数据挖掘技术在地震预报中的应用

■王征 商亮 张闯

(抚顺市地震局 辽宁抚顺 113006)

随着数据挖掘技术的不断发展,其逐渐引起了信息产业界的广大关注。显然,这是相对贫乏的信息量与快速增长的数据量之间在矛盾运动作用下所产生的必然结果。那么,对数据挖掘技术的全面、深入、系统的研究,即成为了全球信息化发展的客观需求。而针对于地震分析预报工作而言,数据挖掘技术也能够起到一定的推动作用。本文首先详细的阐述了我国地震预报工作的研究现状以及地震数据的一些特点,其次系统的分析与探讨了数据挖掘技术应用于地震预报工作的常用方法。

地震预报数据挖掘技术应用

1 我国地震预报研究现状

长期以来,在地震预测研究方面,我国始终都以经验型统计为基础来开展工作,在历史上也取得过较大的成就,比如成功预报1975年的海城地震即是一个很好的例子。随着我国社会、经济的不断发展,近年来我国对于地震预报的准确性要求越来越高,虚报、错报所导致的社会成本越来越高昂。显然,如果还采用经验型统计为基础的地震预报,其准确性显然不能够满足于现代社会的实际要求。随着国际上对地震发生物理机制研究的不断深入,人们对地震发生规律的认识得到了进一步的发展。近年来,我国在这方面的研究上(尤其是基于地震发生机理的地震预报研究)也获得了很大的成功,如加卸载响应比的地震预报模型,其获得了国际上的认可。但是,就整体来说,我国在这方面的研究并不成熟,依旧与很多发达国家存在着一定的差距。

2 地震数据的特点

长期研究实践证明,地震数据有着相当显著的特点。首先,数据量极大。地震前兆观测的数据是从传感器获取的流数据,一般情况下,其采样的频率都为每秒钟采样一次,数据量极大。其次,经验型知识较多。由于绝大部分预报知识都与相关领域有着密切的联系,所以得出的结果往往都是地震预报专家根据自身的经验总结而出。再次,具有较强的时间性。具体来说,一方面是时序性,由于地震数据都与时间相关,数据间就必然会具有较强的时间约束关系。也就是说,地震数据属于时间序列数据。另一方面是实时性,其对异常现象能够及时的做出反应。最后,空缺多、干扰多,且随机性较强、不确定因素较多。

3 数据挖掘技术应用于地震预报工作中的常用方法

3.1 聚类分析

所谓聚类分析,即根据某一种相似程度的度量来将数据对象进行分组,分成若干类或簇。一般情况下,不同簇中的对象之间具有较大的差异,而同一簇中的对象之间则具有较高的相似度。其实,聚类分析源于很多研究领域(如生物学、统计学等)。如今,聚类分析已经被广泛的应用到地震预报工作之中,比如有(无)震样本的聚类、地震正常(异常)数据的聚类、地震知识的获取、地震序列类型的划分等[1]。

3.2 神经网络

“MP”模型与“Hebb”学习规则,是神经网络的基础,神经网络就是以此来建立起了多种神经网络模型,主要氛围三大类,即自组织网络、反馈式网络、前馈式网络[2]。总的来说,神经网络是一种以训练来学习的非线性预测模型,其能够较好的完成多种数据挖掘任务,如聚类、分类、回归、关联、模式识别等。就目前的情况来看,很少有人涉及自组织网络或反馈式网络,但在地震预报工作中则可以使用自学习、自组织、自适应等功能。另外,通过自组织网络的应用,能够让网络实现聚类、特征提取以及知识学习等。

3.3 遗传算法

作为一种模拟生物进化过程的方法,遗传算法是通过对三个基本算子,即复制、交叉、变异的利用来实现优化求解的技术。在遗传算法当中,规则群体往往都是通过交叉与变异来实现进化操作的,这样的操作一直会延续到群体中所有规则都满足于制定阈值为止。从某种角度上来看,遗传算法与统计学有着极为相似的特征。具体而言,遗传算法模型的形式必须预先确定出来,在算法实施时,首先就应该对求解的问题进行编码,以此产生初始的群体,然后对个体适应度进行计算,最后再对染色体进行复制、交叉、变异等操作,直到出现最佳方案为止。在执行遗传算法的过程中,每一代都会存在很多不同的种群个体。而对于环境的适应能力,这将直接决定着这些染色体中的个体是否能够保留下来。显然,针对于那些适应性较强的,其将具有更多的保留机会,而适应性较弱的则是由计算适应性函数f(x)的值来决定的,而这样的值也被称为适应值。在这其中,不得不引起注意的是,适应函数f(x)的构成和目标函数始终都保持着相当密切的联系,可以说起就是目标函数的变种[3]。另外,遗传算法还能够起到产生优良后代的作用,通过若干代的遗传,必然会得到满足要求的后代(即问题的解)。就目前的实际情况来看,遗传算法主要应用于分类、优化等问题上。针对于地震预报工作来说,陈琪福等通过对遗传算法的应用,初步建立了地震预报分类的体系。而王海军等人也通过遗传算法优化参数的使用,对1994年台湾海峡地震的震源过程进行了成功的反演。

3.4 分类

在数据挖掘过程中,“分类”是一项应用及其广泛的任务。所谓分类,就是对已分类资料的特征进行深入的研究,通过对对象属性的分析来建立起一个分类模型或分类函数,然后通过对这种函数或模型的运用来计算总结出相关数据的特征,最终将那些没有经过分类的数据或新的数据分派到不同的组中。在实际的地震预报工作中,分类的应用领域十分广泛,比如地震序列类型的划分、有震(无震)样本的区分、地震正常(异常)数据的区分等,都将涉及到分类的应用。具体来说,分类的常用方法有贝叶斯分类法、决策树分类法、遗传算法分类法、神经网络分类法、支持向量机分类法、粗糙集理论分类法等。

4 结语

总之,数据挖掘技术目前在与自然灾害预报、地震预报、医疗保健等应用领域的交叉结合中得到了迅猛的发展。针对于地震预报当中的数据挖掘而言,其具有十分深远的研究意义。因此,我们必须基于数据挖掘基础来不断探求解决问题的新思路与新方法。只有这样,地震预报的准确性才能够得到实质性的提升。

[1]郭淑文,程然,祝文亮等.数据挖掘技术在地震属性降维中的应用 [J].天然气地球科学,2010,04:670-677.

[2]项月文.基于SOM自组织神经网络的地震预报技术研究 [D].南昌大学,2012.

[3]宋维琪,杨晓东.解域约束下的微地震事件网格搜索法、遗传算法联合反演 [J].石油地球物理勘探,2011,02:259-266+160.

P315[文献码]B

1000-405X(2015)-10-341-1

猜你喜欢

分类法遗传算法数据挖掘
探讨人工智能与数据挖掘发展趋势
分类法在高中化学中的应用
K 近邻分类法在岩屑数字图像岩性分析中的应用
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于并行计算的大数据挖掘在电网中的应用
基于遗传算法和LS-SVM的财务危机预测
软件发布规划的遗传算法实现与解释
基于改进的遗传算法的模糊聚类算法
一种基于Hadoop的大数据挖掘云服务及应用
基于贝叶斯分类法的股票选择模型的研究