APP下载

基于CEEMD_GRU模型的矿井涌水量预测

2021-08-05李占利邢金莎靳红梅李洪安

北京工业大学学报 2021年8期
关键词:涌水量分量矿井

李占利,邢金莎,靳红梅,李洪安

(西安科技大学计算机科学与技术学院,西安 710600)

矿井涌水量是指矿井开采过程中,地表水或地下水通过裂隙、断层等各种通道在单位时间内涌入井巷系统的水量.当矿井涌水量超过矿井自身排水能力时会导致矿井水害事故的发生[1],涌水量直接关系着煤矿采掘方案和排水能力设计的合理性,更决定了煤矿是否能够安全生产,因此,矿井涌水量的准确预测具有重要意义[2].

在矿井生产过程中,形成了许多关于涌水量预测的方法.解析法运用地下水动力学原理,对一定边界条件和初始条件下的地下水流动问题建立定解方程,以此预测涌水量,实现较为简便,但在大降深、不规则的条件下,涌水量预测结果误差较大[3].水均衡法通过对矿井内的补给、径流、排泄及源汇等补排条件关系的研究,建立水均衡方程以预测涌水量,该方法需要的参数较少,但难以计算地下水均衡的各个组成部分[4].数值法通过求解渗流偏微分方程获得涌水量的近似值,它适用于解决许多复杂条件下的矿井涌水量问题,但由于开采条件变化大、不确定因素多,方程的建立是在一定假设和地质结构简化的基础上,预测结果只是近似值[5].水文地质比拟法以现有生产矿井的实际水文地质资料类比计算预测水文地质条件相同矿井的涌水量,该方法计算简单,但精度低,应用范围受限制[6].反向传播(back propagation,BP)神经网络通过训练学习涌水量相关因素和涌水量实测值间的非线性关系来完成涌水量的预测[7].要保证上述方法预测的准确性,必须满足各方法的适用条件并提供可靠的参数,而现场地质及水文地质资料很难满足这种要求,因此,此类方法难以推广,不具备通用性[8].部分学者对一维涌水量数据本身进行问题分析,归纳规律.乔美英等[9]提出利用(genetic algorithm,GA)优化的支持向量机(support vector machine,SVM)模型实现涌水量的预测.王猛等[10]以模型定阶、参数估计和假设检验等过程建立合适的差分整合移动平均自回归模型(autoregressive integrated moving average model,ARIMA)对涌水量进行预测.施龙青等[11]对原始涌水量数据进行一次累加生成、均值生成、光滑性检验等处理后建立涌水量与时间的灰色预测模型.以上方法对原始数据进行分析处理,通过建模发现涌水量变化规律,进一步实现预测,提高了模型的通用性.但涌水量数据受水文地质参数和各方面因素影响,具有随机性、非平稳性等特点,使得模型预测精度不高[12].

本文旨在提出一种通用性强、预测精度高的涌水量预测模型.首先,通过互补集合经验模态分解(complementary ensemble empirical mode decomposition,CEEMD)算法将一维涌水量分解为从高频到低频的多维子分量,其中最后一个子分量反映长期趋势特征,剩余子分量反映原始数据在不同时间尺度上的波动特征,通过CEEMD分解使得原始数据蕴含的信息充分显露出来;其次,通过偏自相关函数(partial autocorrelation function,PACF)确定各分量的滞后期数,从而确定各分量输入神经元个数;然后,利用门控循环单元(gated recurrent unit,GRU)适合处理时序数据的特点,通过GRU神经网络学习各子分量变化规律并进一步预测;最后,将各分量预测结果融合得到最终的涌水量预测值.

1 基于CEEMD_GRU的预测模型

本文提出的基于CEEMD_GRU的矿井涌水量预测模型流程图如图1所示.

图1 CEEMD_GRU预测模型流程图Fig.1 Flow chart of CEEMD_GRU prediction model

该模型通过CEEMD将涌水量数据进行分解,因为分解后的各子分量拥有不同的特征尺度,所以它们之间的相互影响被隔离,利用这种隔离可以减小涌水量本身的非平稳性和非线性在预测中带来的误差.

GRU神经网络对各分量分别建立子模型,学习各分量的变化规律.因为涌水量作为时序数据,用传统的BP或SVM神经网络进行预测,存在网络结构难以确定、预测精度低等问题[13],而GRU网络作为具有记忆能力的循环神经网络,能够有效地利用长时序信息.并且本文引入PACF来确定各分量当前时刻与滞后k个时刻之间的相关性,不考虑中间时刻的影响,从而确定GRU神经网络输入层神经元个数,减少人为主观因素影响,进一步提高涌水量预测精度.

基于CEEMD_GRU的涌水量预测模型具体步骤如下:

1)将涌水量通过CEEMD算法分解,得到各本征模态函数(intrinsic mode function,IMF)分量和残差余量.

2)引入PACF来确定各分量的滞后期数,从而确定各分量输入神经元个数.

3)对各分量分别划分为训练集和测试集,通过GRU神经网络学习各分量变化规律并进行预测.

4)将各分量预测结果融合,得到最终的预测值.

1.1 CEEMD算法原理

CEEMD是针对经验模态分解(empirical mode decomposition,EMD)和集合经验模态分解(ensemble empirical mode decomposition,EEMD)提出的改进方法[14].EEMD在EMD的基础上添加白噪声使信号在不同时间尺度上具有连续性,从而更好地抑制EMD在分解过程中由于IMF不连续造成的模态混叠现象[15].但由于EEMD分解过程中引入的噪声会存在残余,对原始数据产生不良影响[16],CEEMD在EEMD基础上引入互补的噪声,不仅解决了模态混叠现象,同时提高了原信号重构的精度,提升了计算效率[17].CEEMD算法分解步骤如下.

1)对原始数据加入正、负成对的白噪声,得到新的信号

(1)

式中:S为原始数据;N为白噪声;M1、M2分别为混入正、负白噪声的原始信号.

2)通过

(2)

对M1、M2进行分解.式中:cij为第i次加入白噪声分解后得到的第j个IMF分量;cj(t)为C1、C2在第j个IMF分量的平均值;r为残差余量;λ为加入白噪声的次数.分解后得到2组IMF分量,将2组IMF分量表示为C1、C2,然后对每组分量对应的同一阶IMF分量求平均值,得到最终的分解结果H.

1.2 GRU神经网络

GRU和长短时记忆(long sort-term memory,LSTM)网络的内部单元很相似,不同之处在于GRU将LSTM中的输入门和遗忘门合并成一个单一的更新门,因此,GRU中只有2个门结构,分别为更新门和重置门.更新门用于确定是否保留上一时刻状态的信息以及保留的程度,更新门的值越大表示前一时刻的状态信息保留越多.重置门用于确定是否要结合当前状态与先前的信息,重置门的值越小说明忽略的信息越多[18].

图2 GRU网络的单元结构Fig.2 Unit structure of GRU network

GRU神经网络的计算过程为

zt=σ(Wz[ht-1,xt])

(3)

rt=σ(Wr[ht-1,xt])

(4)

(5)

(6)

1.3 PACF

PACF是确定自回归滑动平均模型中滞后阶数的常用方法,可以反映一维数据中任意2个时刻在排除中间时刻影响后的纯相关性[19],比如:在t-3对t的影响中,不会考虑t-2和t-1时刻对t的影响.本文通过PACF确定xt与k个时间单位xt-k之间的相关性,从而确定各分量的滞后期数,进一步确定各分量建立GRU神经网络的输入层神经元个数.

1.4 模型搭建

本文建立的GRU神经网络模型如图3所示.基本结构包括输入层、隐藏层和输出层.

图3 GRU网络模型Fig.3 GRU network model

1)输入层:通过PACF确实各分量滞后期数k,将一维数据s根据滞后期数k将前k个时刻数据作为特征、第k+1时刻数据作为标签构造样本对X,将样本对划分为训练集和测试集.

2)隐藏层:GRU层的作用是为了记住重要的信息,忽略不重要的信息.因为目前没有具体的计算标准来确定隐藏层神经元的个数,本文通过多次实验最终确定GRU层神经元个数为32时误差最小.

4)优化器:是用来更新和计算影响模型训练和模型输出的网络参数,使其逼近或达到最优值.模型训练的优化器为Adam优化器,它结合了AdaGrad和RMSProp两种算法的优点,计算高效,对内存需求少,参数的更新不受梯度的伸缩变换影响.

5)损失函数:是神经网络训练时试图最小化的目标函数.训练过程中损失函数的选取取决于输入标签数据的类型,因为本文输入的是数值,所以将损失函数参数设置为均方误差(mean square error,MSE).

2 实例分析

2.1 数据处理

本文实验验证采用的数据包括2组:一是山东省郓城煤矿1301开采工作面在2017年实测的涌水量数据,每天统计一次,共170条;二是开滦集团东欢陀煤矿在2019年1月11日至26日实测的明渠流量数据,每5 min统计一次,共4 473条.通过CEEMD对数据进行分解得到各子分量.将各分量分别划分为训练集和测试集,然后根据各子分量不同的变化规律和多次实验尝试将训练集构造样本对{xt-k,xt-k-1,…,xt-1,xt},共k+1列.k为步长,即前k个时刻数据作为模型的输入向量,第k+1时刻数据作为模型的输出值,通过GRU模型学习前k个时刻的数据与第k+1时刻的非线性映射关系.对每个分量的数据集都做同样的处理,但因为各分量数据变化规律不同,所以k的设置不同,即GRU神经网络输入层神经元个数也不同.

例如:将第1个本征模态分量输入神经元个数确定为3,前3列作为特征,最后一列作为标签,然后通过

(7)

构造样本对,将数据输入神经网络学习标签和特征的关系,即学习前3个时间点的数据和第4个时间点的非线性映射关系.

2.2 评价指标

为了更好地评估模型预测结果,本文采用预测评价指标:均方根误差(root mean squared error,RMSE)和平均绝对百分比误差(mean absolute percentage error,MAPE).值越小代表预测精度越高,预测指标为

(8)

式中:xa为真实值;xf为预测值;n为预测值和真实值个数.

2.3 实验

本文实验在Win10 64位系统下进行,处理器为Inter(R)Core(TM)i5-8300H CPU @2.30 GHz 2.30 GHz,基于python3.6环境和keras框架,keras版本为2.2.4.通过CEEMD将涌水量和明渠流量进行分解,分解结果如图4、5所示.

图4 涌水量CEEMD分解结果Fig.4 CEEMD decomposition results of water inflow

图5 明渠流量CEEMD分解结果Fig.5 CEEMD decomposition results of open channel flow

为了进一步说明CEEMD_GRU模型的实用性,将涌水量各分量预测结果进行融合,并分别与现有的预测模型GRU、BP和SVR神经网络进行对比实验.基于涌水量数据集的各模型预测结果如图6所示.

该位置是操纵列车常用制动,使列车正常缓慢停车或调整运行速度所使用的位置。包括初制动位和全制动位,两者之间是制动区。

从图6可以看出,CEEMD_GRU模型对涌水量的预测效果具有很好的跟随性和波动性,预测趋势与实测数据基本一致,未存在预测滞后,而单一BP、SVM和GRU神经网络模型的预测结果均有滞后的现象,说明模型未能及时预测出下一时刻的数值,预测效果不佳.

图6 涌水量各模型预测结果Fig.6 Prediction results of each model of water inflow

将明渠流量数据集各分量预测结果进行融合,同样与现有的预测模型GRU、BP和SVR神经网络进行对比实验.基于明渠流量数据集的各模型预测结果如图7所示,并将图7中[480,600]的部分预测结果放大,如图8所示.

图7 明渠流量各模型预测结果Fig.7 Prediction results of each model of open channel inflow

从图7、8可以看出,CEEMD_GRU模型对明渠流量数据集同样具有很好的预测效果,更能预测出原始数据的波动特性,如:对应图8原始数据在[27,37]和[51,59]范围内,CEEMD_GRU模型预测效果均好于其他单一模型.将涌水量和明渠流量各预测模型的预测误差进行对比,分别如图9、10所示.

图8 480~600区间明渠流量各模型预测放大结果Fig.8 Prediction and amplification results of each model of open channel inflow in 480-600 interval

图9 涌水量各模型预测误差Fig.9 Prediction error of each model of water inflow

从图9、10可以看出,BP、SVM和GRU神经网络模型的预测误差范围波动较大,而CEEMD_GRU模型的预测误差相对平稳,说明CEEMD_GRU模型的预测精度和平稳性较好.针对各预测模型采用预测评价指标RMSE对预测结果进一步分析,各模型预测性能评估如表1所示.

图10 明渠流量各模型预测误差Fig.10 Prediction error of each model of open channel inflow

从表1中各模型预测性能评估值来看,本文所提出模型在涌水量和明渠流量预测中的均方根误差分别比单一预测模型BP神经网络降低了58.9%、42.4%,比单一预测模型SVM降低了70.0%、38.0%,比GRU降低了53.7%、29.3%.依据误差指标来看,本文所提模型预测精度最高,说明将数据通过CEEMD分解转换为多个子分量,然后建立GRU模型进行预测可以在原有GRU的基础上提高预测精度.

表1 各模型预测误差值对比Table 1 Comparison of prediction error values of each mode

3 结论

1)通过CEEMD将数据分解为一系列较为平稳的IMF分量和残差余量,将对一维数据的研究转换为对多维子分量的研究,从而进行建模.与BP、SVM、GRU神经网络相比,涌水量和明渠流量的均方根误差平均分别降低了60.8%、44.7%.结果表明,基于CEEMD_GRU模型预测效果最好.利用GRU模型进行预测可以在原有GRU的基础上提高预测精度.

2)基于CEEMD_GRU模型利用矿井水文数据历史信息,通过CEEMD分解将数据中蕴藏的信息充分显露出来,可以准确预测未来趋势,为矿井生产过程中水害防治和排水系统设计提供新思路.

3)CEEMD_GRU模型是假定水文数据的未来趋势仍基于现有历史数据变化所建立的预测模型,矿井水文数据是区域水文地质条件和采掘动态过程复合作用的结果,虽然涌水量和明渠流量在一定程度上可以反映地质参数影响下水文数据变化的规律,但它仍然受其他突发因素的影响,需考虑如何将随机、突发的因素引入模型.

猜你喜欢

涌水量分量矿井
赵各庄矿矿井涌水量预测方法分析
突出矿井大采高综采工作面过断层风险管控研究
矿井建设中的现场施工管理
画里有话
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
山西平遥县兴盛佛殿沟煤业有限公司
论《哈姆雷特》中良心的分量
废弃矿井变成主题公园
隧道衬砌结构水作用概述