APP下载

海量水文地质时间序列数据相关性算法设计

2020-12-23徐翠萍盛文婷侯雪娇

装备维修技术 2020年13期
关键词:时间序列

徐翠萍 盛文婷 侯雪娇

摘要:针对水文地质时间序列数据分析,本文提出以相关性算法为核心思想的算法设计,简单介绍并且研究了时间序列的定义、公式和降维方法以及相似性算法的概念、公式、特点和用法。并通过对海量水文地质数据的相关性分析,对矿井突水进行预测。

关键词:时间序列;相似性算法;水文地质数据

1相关知识背景简介

1.1时间序列定义

时间序列其实就是以时间顺序为依据进行相关排列,且是有顺序的值, 表示时间序列,子时间序列就是连续的一个片段,它用 来代表,子时间序列的长度用 来表示。

时间序列数据的降维主要有以下方法:时间序列基于域变换的描述、分段线性表示PLR的描述[1]、分段聚合近似PAA的描述[2]、符号化表示方法描述、奇异值分解SVD 的描述[3]。

1.2皮尔森相关系数

本文主要用皮尔森相关系数来对时间序列的相关性进行表示。它是线性相关系数。对统计量关于变量之间线性相关程度进行反映。定义如式:

相关系数用corr表示,样本量用n来表示,均值以及方差用 来表示两者。corr所描述的是关于两个变量间线性相关强弱的程度。如果corr的绝对值越大,则证明具有越强的相关性

2水文地质数据

2.1水文地质参数

水文地质地质参数主要有以下几点:渗透系数、释(储)水系数(给水度、弹性释水系数的定义)、其他参数、参数的测定。

2.2造成地质灾害的水文地质因素

造成地质灾害的水文地质因素有:不是稳定的关于矿区地下矿物层、地质灾害的形成关于沙土液化现象、地面沉降的生成对于水文因素、地基变形因素的描述、地质灾害由地裂缝造成、灾害由地面塌陷造成。矿山地质灾害危险等级分类如表1。

3 某矿的相关性分析

1)矿井基础条件

在矿井初步设计中,预计正常涌税量为240 ,最大涌水量为600 。中央泵房安装四台MD500-57×9型矿用耐磨多级离心式水泵(500 ),预留有一台水泵位置,副井敷设Φ325×12mm排水管两趟,主井筒内安装两趟Φ325×12mm强排管路。中央泵房主副水仓总容量4588 ,系统排水能力1619 。矿井水文地质条件,各含水层抽水试验如表2所示,矿井突水量变化曲线图如图1所示:

依据突水系数公式推导含水层顶界到巷道底板最大距离为:

按照隔水层厚度公式计算:

计算结果表示含水层顶界到巷道底板的距离是10~57m。由上可得,正常情况下的突水水量为60m3/h,最大突水水量为93m3/h。当超过正常涌水量时就会容易发生突水水害。

2)矿井水文地质相关性算法

本研究中选择用到的是Pearson相关系数:

选择两组数据,X为安全时候的數据集,Y数据集为实际测量数据。数据X、Y的折线图如图3所示,得到两组数据集的相关系数r=0.0312。

3)矿井水文地质相关性分析

相关系数的绝对值越大,相关性越强;相关系数越接近1或-1,相关度就越强;相关系数越接近于0,相关度越弱。

由此可以看出r=0.0312为弱相关/无相关,两数据集之间为正相关关系,发生矿井突水危害的可能性还是很高的,应及早做好预防措施,以避免不必要的伤亡和损失。

4结论

本文首先通过对时间序列数据、相似性算法以及水文地质数据等知识进行简要介绍,通过对结果进行预测分析,求出相关系数,对相关系数进行分析,估算水害发生的概率,以便于及早预防,减少不必要的人员和财产损失。

作者简介:徐翠萍,新疆米泉人,1979年5月生,本科,研究方向移动数据网运维;

盛文婷,甘肃武威人,1983年10月生,硕士,研究方向大数据分析;

候雪娇,新疆木垒县人,1997年4月生,本科,研究方向为轨道交通信号与控制。

猜你喜欢

时间序列
基于分布式架构的时间序列局部相似检测算法
基于嵌入式向量和循环神经网络的用户行为预测方法
医学时间序列中混沌现象的初步研究
基于时间序列分析南京市二手房的定价模型
基于Eviews上证综合指数预测
上证综指收益率的影响因素分析
基于指数平滑的电站设备故障时间序列预测研究
基于时间序列的我国人均GDP分析与预测
基于线性散列索引的时间序列查询方法研究
基于组合模型的能源需求预测