地震的一般分类方法
2019-03-08何敏童威
何敏 童威
摘 要:在对地震事件进行分类的过程中,采用K-means聚类分析法、K-means++算法按照震级、震源、深度分类标准对发生维度、深度、震级参数不同的地震进行合理有效的分类。
关键词:K-means K-means++
Abstract: In the process of classifying seismic events, K-means cluster analysis method and K-means++ algorithm are used to classify earthquakes with different dimensions, depths, and magnitudes according to magnitude, source, and depth classification criteria.
Key word: K-means、K-means++
引 言
据统计,地球上每年会发生500万起天然地震事件,每天都会发生1万起以上的地震事件。绝大多数的地震事件都与板块构造相关,发生在构造缝合带附近。将中国境内2012年至2016年(近五年)的各个参考地点地震发生维度、深度、震级等数据,作为我们研究震级、震源、深度这几个类别关系的较为标准的参考数据进行数学模型的建立和求解。
根据分类的特点,采用K-means聚类分析法,对三个要素进行一个聚类分析,最终得到近五年的地震事件按照这三个要素分类的一个结果。
1. K-means经典算法
K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K-means算法以歐式距离作为相似度测度,它是求对应某一初始聚类中心向量V最优分类,使得评价指标J最小。算法采用误差平方和准则函数作为聚类准则函数
K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。
K-means算法接受输入量 k ;然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。而求群中心点的方法可由以下三种公式求得:
(1) Minkowski Distan
(2) Euclidean Distance
(3) CityBlock Distance
按照MATLAB既有的经典算法,用收集到的数据进行计算得到的仿真结果图如下:
分析可得:红、绿、蓝色点均代表了发生的地震事件,图2中三个带×的圆圈则是按照不同的聚类中心点进行的最终一个分类,地震事件多发生于经度在80-120度的范围,纬度在25-40度的范围。图3则是按照震级和震源深度对地震事件进行分类的一个仿真图,可以看出红点代表的绝大部分地震事件、蓝点代表的少数地震事件以及绿点代表的极少数事件在不同经度和纬度之下的震级和震源深度分布情况。
2.K-means++算法
K-means算法有两个重大的缺陷,都和初始值有关为了优化该模型的效果,我们采用K-means++算法对随机种子的问题进行一个改进。步骤如下:(1)从地震事件中随机挑选种子点;(2)计算每个点和最近的一个种子点的距离保存与一个数据库中,再将这些距离求和得sum;(3)接着取一个随机值,按权重方式计算下一个种子点;(4)重复(2)和(3)直到k个种子点都被选取出来;(5)进行K-means算法。
我们自行选取随机的几组数值,用GO语言对K-means++算法进行计算得到仿真图如下:
我们发现利用K-means++算法对初始随机种子的优化之后,将会得到非常好的效果,因此起到了对模型优化的效果。
参考文献
[1] 张玮玮. 基于聚类分析的BP神经网络短时交通流预测方法研究[D].重庆邮电大学,2016.
[2] 肖锦成,欧维新,符海月. 基于BP神经网络与ETM+遥感数据的盐城滨海自然湿地覆被分类[J]. 生态学报,2013,(23):7496-7504.
[3] 张辉. 基于BP神经网络的遥感影像分类研究[D].山东师范大学,2013.等。