海量水文地质时间序列数据相关性算法设计
2020-12-23徐翠萍盛文婷侯雪娇
徐翠萍 盛文婷 侯雪娇
摘要:针对水文地质时间序列数据分析,本文提出以相关性算法为核心思想的算法设计,简单介绍并且研究了时间序列的定义、公式和降维方法以及相似性算法的概念、公式、特点和用法。并通过对海量水文地质数据的相关性分析,对矿井突水进行预测。
关键词:时间序列;相似性算法;水文地质数据
1相关知识背景简介
1.1时间序列定义
时间序列其实就是以时间顺序为依据进行相关排列,且是有顺序的值, 表示时间序列,子时间序列就是连续的一个片段,它用 来代表,子时间序列的长度用 来表示。
时间序列数据的降维主要有以下方法:时间序列基于域变换的描述、分段线性表示PLR的描述[1]、分段聚合近似PAA的描述[2]、符号化表示方法描述、奇异值分解SVD 的描述[3]。
1.2皮尔森相关系数
本文主要用皮尔森相关系数来对时间序列的相关性进行表示。它是线性相关系数。对统计量关于变量之间线性相关程度进行反映。定义如式:
相关系数用corr表示,样本量用n来表示,均值以及方差用 来表示两者。corr所描述的是关于两个变量间线性相关强弱的程度。如果corr的绝对值越大,则证明具有越强的相关性
2水文地质数据
2.1水文地质参数
水文地质地质参数主要有以下几点:渗透系数、释(储)水系数(给水度、弹性释水系数的定义)、其他参数、参数的测定。
2.2造成地质灾害的水文地质因素
造成地质灾害的水文地质因素有:不是稳定的关于矿区地下矿物层、地质灾害的形成关于沙土液化现象、地面沉降的生成对于水文因素、地基变形因素的描述、地质灾害由地裂缝造成、灾害由地面塌陷造成。矿山地质灾害危险等级分类如表1。
3 某矿的相关性分析
1)矿井基础条件
在矿井初步设计中,预计正常涌税量为240 ,最大涌水量为600 。中央泵房安装四台MD500-57×9型矿用耐磨多级离心式水泵(500 ),预留有一台水泵位置,副井敷设Φ325×12mm排水管两趟,主井筒内安装两趟Φ325×12mm强排管路。中央泵房主副水仓总容量4588 ,系统排水能力1619 。矿井水文地质条件,各含水层抽水试验如表2所示,矿井突水量变化曲线图如图1所示:
依据突水系数公式推导含水层顶界到巷道底板最大距离为:
按照隔水层厚度公式计算:
计算结果表示含水层顶界到巷道底板的距离是10~57m。由上可得,正常情况下的突水水量为60m3/h,最大突水水量为93m3/h。当超过正常涌水量时就会容易发生突水水害。
2)矿井水文地质相关性算法
本研究中选择用到的是Pearson相关系数:
选择两组数据,X为安全时候的數据集,Y数据集为实际测量数据。数据X、Y的折线图如图3所示,得到两组数据集的相关系数r=0.0312。
3)矿井水文地质相关性分析
相关系数的绝对值越大,相关性越强;相关系数越接近1或-1,相关度就越强;相关系数越接近于0,相关度越弱。
由此可以看出r=0.0312为弱相关/无相关,两数据集之间为正相关关系,发生矿井突水危害的可能性还是很高的,应及早做好预防措施,以避免不必要的伤亡和损失。
4结论
本文首先通过对时间序列数据、相似性算法以及水文地质数据等知识进行简要介绍,通过对结果进行预测分析,求出相关系数,对相关系数进行分析,估算水害发生的概率,以便于及早预防,减少不必要的人员和财产损失。
作者简介:徐翠萍,新疆米泉人,1979年5月生,本科,研究方向移动数据网运维;
盛文婷,甘肃武威人,1983年10月生,硕士,研究方向大数据分析;
候雪娇,新疆木垒县人,1997年4月生,本科,研究方向为轨道交通信号与控制。