基于LLE与BA-Elman的瓦斯涌出量动态预测研究*
2016-10-21付华代巍
付华,代巍
(1.辽宁工程技术大学电气与控制工程学院,辽宁葫芦岛125105;2.辽宁工程技术大学安全科学与工程学院,辽宁阜新123000)
基于LLE与BA-Elman的瓦斯涌出量动态预测研究*
付华1*,代巍2
(1.辽宁工程技术大学电气与控制工程学院,辽宁葫芦岛125105;2.辽宁工程技术大学安全科学与工程学院,辽宁阜新123000)
针对瓦斯涌出量受诸多因素影响,彼此间存在复杂的非线性关系导致预测精度不高这一问题,提出基于相关分析理论和局部线性嵌入理论的Elman网络瓦斯涌出量动态预测方法。在对监测指标进行相关性分析的基础上,用局部线性嵌入理论实现瓦斯涌出量影响因素从高维空间至低维空间的映射,进而重构影响瓦斯涌出量的有效因子,并将其作为Elman网络预测模型的输入矢量,以降低模型结构的复杂度,同时用蝙蝠算法全局优化Elman模型以提高预测的精度和泛化能力。试验结果表明该动态预测模型泛化能力强,预测精度高,适用于实际工作中对瓦斯涌出量的预测。
瓦斯涌出量;动态预测;相关分析;局部线性嵌入理论;蝙蝠算法;Elman神经网络
EEACC:7230doi:10.3969/j.issn.1004-1699.2016.09.015
瓦斯是煤矿瓦斯事故的重要危险源之一,随着开采深度和开采规模的不断延拓,瓦斯对煤矿的安全生产起着至关重要的作用。国内外诸多学者在煤矿瓦斯涌出量预测方面进行了大量的研究,如文献[1]研究了主成分回归分析法实现对回采工作面瓦斯涌出量进行预测;文献[2]研究了混沌-时间序分析法实现对回采工作面瓦斯涌出量进行预测;文献[3]研究了卡尔曼滤波的预测方法;文献[4-5]运用灰色理论建立瓦斯涌出量预测模型;文献[6-7]研究了BP、RBF神经网络在回采工作面瓦斯涌出量预测中的应用。上述这些方法对矿井瓦斯涌出量的预测基本已经达到预期效果。但是矿井瓦斯涌出量受到煤层瓦斯含量、煤层厚度、煤层倾角、煤层埋藏深度等诸多因素的影响,影响因素之间及其与瓦斯涌出量之间呈现出复杂的非线性、相关性特征,为瓦斯涌出量的预测带来了一定的影响,为降低预测模型网络结构复杂度,本文提出了一种基于相关分析理论和局部线性嵌入LLE(Local Linear Embedding)理论的Elman网络动态预测模型。影响因素之间存在着相关性,并且有些因素之间会呈现出显著的相关性,因此,先用Person相关分析法分析影响因素之间的相关性,以便降低数据冗余对给后续工作带来的不利影响,提高预测系统的整体预测精度;在此基础上,用局部线性嵌入算法对具有显著相关性的因素指标进行降维,由于LLE理论是针对非线性数据提出的一种降维方法,与传统的线性降维方法-主成分分析法相比,该方法能够使降维后的数据更好的保留原始数据的拓扑结构及其内在的关系,因此,可以较好地将具有显著相关性的因素指标组成的样本数据从高维空间映射至低维空间。进而重新构造新的有效影响因子样本作为Elman预测模型的输入变量。同时利用蝙蝠算法BA(Bat Algorithm)优化Elman网络模型的参数矢量,以提高预测模型的精度和泛化能力。
1 LLE算法
LLE算法一种非线性降维方法,其基本思想是在样本点和它的邻域点之间构造一个重构权向量,并在低维空间中保持每个邻域中的权值不变,重构这些点,使重构误差最小[8]。
LLE算法的输入数据样本有m个,即X={x1,x2,…,xm∈RD},并且这些数据样本都足够稠密,能够覆盖整个流形。输出为低维嵌入Y={Y1,Y2,…,Ym∈Rd},且d≪D,其具体步骤如下:
①以欧式距离度量数据集中每个点xi(i=1,2,…,N)与其他样本点距离,根据k近邻或ε邻域寻找xi的k个最近邻点xi1,xi2,…,xik。
②在样本点xi的邻域内求出该样本点的权值wij,求解局部重构权值矩阵W,并且每个样本点满足的条件,使用最小二乘法重构误差函数
③在低维空间中,根据样本点的局部重构权值矩阵W和其近邻点计算出每个样本点的低维嵌入向量Yi,使重构误差最小。
由于实现了从高维特征向量向低维特征向量的映射,因此得到了新的低维特征向量,在降低了数据维数的同时保持了其原有的拓扑结构和局部关联性。
2 Elman动态反馈神经网络
Elman神经网络具有动态递归性,其隐含层的关联反馈功能使得网络能够探测和识别时变模式。承接层具有对历史数据存储、记忆和延迟的作用,提高了网络处理动态信息的能力,形成了其所特有的动态记忆特性。其网络结构简单,运算量小,可以在适应时变特性的同时,实现动态系统的映射,适合用来建立时序数列的预测模型[9]。
设在t时刻,输入层输入为u(t)、输出层输出为y(t);关联层输出为c(t);隐含层输出为s(t)。则Elman的状态空间表达为:
式中,ωcs、ωus和ωsy分别为关联层到隐含层、输入层到隐含层、隐含层到输出层的连接权值;f(·)与g(·)分别表示隐含层与输出层的神经元激励函数;ξs、ξy分别为隐含层阈值与输出层阈值。
对于有N个实际样本的瓦斯涌出监测数据,Elman网络对其进行反向传播方式训练,在训练的过程中寻找最优的网络参数矢量U,使得瓦斯涌出预测系统的实际输出与期望输出误差平方和指标达到最小。则定义系统的适应度函数为:
式中,ε(t,U)为期望输出y(t)与网络实际输出yN(t,U)的误差值。
3 BA算法优化Elman模型
蝙蝠算法(Bat Algorithm)是2010年剑桥大学学者YANG以微蝙蝠回声定位行为为基础提出的一种新的元启发式优化算法,具有更好的寻优能力、更快的收敛速度[10-11]。
BA算法的基本步骤可以总结如下:
①初始蝙蝠种群规模size,搜索脉冲频率范围[χmin,χmax]、脉冲频度r0、最大声音响度A0、响度衰减系数α和脉冲频度的增强系数γ,最大迭代次数Itermax,随机初始化蝙蝠的位置Pi(i=1,2,…,size)。
②在迭代过程中,蝙蝠搜索脉冲频率、空间位置P和速度V按如下公式进行更新:
式中:χq表示蝙蝠个体q搜寻猎物时的脉冲频率,分别表示蝙蝠个体q在n维空间的第t次迭代时的空间位置和飞行速度,表示当前全局的最优位置,rand∈[0,1]是一个服从均匀分布的随机向量。
③生成一个随机数β1,如果β1>rq,选择最优蝙蝠个体,按照式(9)更新该个体,即通过随机扰动的方式得到局部新解。
式中:μ∈[-1,1]是一个随机数,At是所有蝙蝠在当前迭代时的平均响度。
④生成一个随机数β2,如果β2<Aq且χ(Pq)<χ(P*),则接受这个新的解,并根据式(10)、式(11)增大rq减小Aq。
⑥按照步骤③~步骤⑤进行迭代,直至判断满足结束条件,算法终止。
4 建立瓦斯涌出量动态预测模型
4.1构建有效影响因子
影响瓦斯涌出量的因素有很多,综合考虑选取以下影响因素指标:煤层厚度Z1(m)、开采层原始瓦斯含量Z2(m3·t-1)、邻近层厚度Z3(m)、煤层倾角Z4(°)、煤层埋藏深度Z5(m)、层间岩性Z6、煤层与邻近煤层的层间距Z7(m)、工作面长度Z8(m)、采高Z9(m)、日工作进度Z10(m·d-1)、邻近层原始瓦斯含量Z11(m3·t-1)、开采强度Z12(t·d-1)、工作面采出率Z13,筛选出了18组数据如表1所示,y表示瓦斯涌出量(m3·min-1)。
不仅瓦斯涌出量与其影响因素之间存在相关性,影响瓦斯涌出的因素指标彼此之间也存在着相关性,因此先用SPSS21.0对样本数据中的影响因素Z1~Z13作Person相关分析,根据相关系数矩阵可知,指标层间岩性Z6与其他指标之间的相关系数较小,并且Sig.均大于0.05不具有显著性;其他12个影响因素之间具有明显的相关性,如Z1与Z9之间相关系数为0.987,Z5与Z10之间相关系数为0.899,并且Sig.均小于0.05。直接用样本数据对预测模型训练、预测,模型的预测精度则会受到影响因素指标之间相关性和信息冗余的影响,根据相关分析的结果,用局部线性嵌入算法将除Z6以外的其余12项影响瓦斯涌出因素指标组成的样本数据从高维空间数据点映射到低维嵌入空间,选取合适的k个邻近点和d维嵌入以保持样本点在低维空间的拓扑结构和局部关联性,文中k为8,维数d为6得到降维后的数据样本Y1~Y6,并构造影响矿井瓦斯涌出量的有效因子如表2所示,将Z6、Y1、Y2、Y3、Y4、Y5、Y6作为Elman神经网络的输入变量,降低了网络模型的结构复杂度,亦减少了计算特征向量之间的相似性度量的运算量。
表1 绝对瓦斯涌出量与影响因素的数据统计
表2 重构有效因子
4.2建立BA-Elman网络预测模型
①Elman网络的激励函数采用Sigmoid函数,将不同量纲的有效因子网络输入数据样本按式(12)归一化,预测的结果则需要按式(13)进行反归一化处理。
式中:X为原始数据;Xmin为原始数据的最小值;Xmax为原始数据的最大值;Y′为归一化后的数据。
②初始化Elman预测模型,设置网络参数;
输入训练样本至BA-Elman网络模型中,根据模型的实际输出yN(t)与样本期望输出y(t),得到训练误差ε(t)与适应度函数J(t)。
③采用BA算法在线全局优化Elman模型,并将求得的最优蝙蝠位置作为网络的权值、阈值反馈给Elman预测模型,如图1所示。
④用已建立的BA-Elman非线性模型对未来一段时间内的瓦斯涌出量做出精准预测,瓦斯涌出量预测模型描述为:
式中,tm,tp为预测模型的控制时域与预测时域;f为预测函数映射关系;I(τ)为τ时刻的影响因素有效因子;C(τ)为τ时刻系统控制序列;H(τ)为τ时刻模型输入序列;yp(τ+1)为τ+1时刻瓦斯涌出量预测值。
图1 瓦斯涌出预测系统模型
4.3瓦斯涌出量预测试验及分析
将表2重构的有效因子样本数据归一化,选取第1组~第13组数据用来对预测模型进行训练,第14组~第18组数据作为测试样本检验模型的预测效果。Elman网络结构参数及BA算法的参数初始化如下,输入层与输出层神经元个数分别是8和1,隐含层与关联层神经元个数相等,均为10。蝙蝠种群数size=30,搜索脉冲频率范围[χmin,χmax]=[-1,1],响度衰减系数α=0.9,脉冲频度r0=0.75,最大声音响度A0=0.25,脉冲频度的增强系数γ=0.25,最大迭代次数Itermax=1 000,规定模型训练的允许误差范围为10-4以下。
通过Matlab对瓦斯涌出量的预测进行仿真试验,结果如图2所示。
图2 瓦斯涌出量预测值与实际值对比
从图2的瓦斯涌出量实际值与预测值的对比中可见,在原始样本数据降维后,经BA优化的El⁃man网络预测模型对瓦斯涌出量的拟合精度高。
图3为BA-Elman模型优化的收敛效果图。从收敛速度曲线可以看出,BA-Elman模型有较强的收敛能力,其训练误差降至允许误差范围的10-4以下,可以满足精度的需要。
图3 BA-Elman模型优化收敛曲线
分别用RBF网络模型、Elman网络模型和BA-Elman网络模型进行预测,根据原始数据样本和重构有效因子数据样本对15组~18组作预测,并对预测结果进行比较分析如表3所示。
表3 瓦斯涌出量预测结果
从表3可以看出,而经过Person相关分析和LEE算法处理后,用重构有效因子样本数据训练Elman模型BA-Elman预测模型,预测结果的相对误差明显低于用原始数据样本直接进行预测的结果,并且经BA优化的Elman模型预测误差低于未经优化的Elman模型。因此,本文提出的瓦斯涌出量动态预测方法具有较高的预测精度和较好的泛化能力,能够准确地对煤矿瓦斯涌出量进行预测,达到理想的预测效果。
5 结论
(1)煤矿瓦斯涌出量的影响因素较多,瓦斯涌出量与其影响因素之间的存在着非线性关系,利用Person相关分析和LLE算法对监测数据进行数据挖掘,重构有效因子训练Elman预测模型,提高了模型的预测精度和准确性。
(2)采用蝙蝠算法优化Elman神经网络弥补了其学习速度慢、精度低、鲁棒性差等缺陷,因此BA-Elman瓦斯涌出量预测模型具有较好的预测精度和泛化能力。预测试验结果表明:在数据挖掘的基础上,BA-Elman瓦斯涌出量动态预测模型具有更快的收敛速度和更高的预测精度,相对误差明显低于未经数据挖掘的Elman模型,有效地实现了煤矿瓦斯涌出量动态预测。
[1]吕伏,梁冰,孙维吉,等.基于主成分回归分析法的回采工作面瓦斯涌出量预测[J].煤炭学报,2012,37(1):113-116.
[2]何利文,施式亮,刘影.基于支持向量机(SVM)的回采工作面瓦斯涌出混沌预测方法研究[J].中国安全科学学报,2009,19(9):42-46.
[3]王晓路,刘健,卢建军.基于虚拟状态变量的卡尔曼滤波瓦斯涌出量预测[J].煤炭学报,2011,36(1):80-85.
[4]伍爱友,田云丽,宋译,等.灰色系统理论在矿井瓦斯涌出量预测中的应用[J].煤炭学报,2005,30(5):589-595.
[5]肖鹏,李树刚,宋莹,等.瓦斯涌出量的灰色建模及其预测[J].采矿与安全工程学报,2009,26(3):318-321.
[6]朱红青,常文杰,张彬.回采工作面瓦斯涌出BP神经网络分源预测模型及应用[J].煤炭学报,2007,32(5):504-508.
[7]王涛,王洋洋,郭长娜,等.QGA-RBF神经网络在矿井瓦斯涌出量预测中的应用[J].传感技术学报,2012,25(1):119-123.
[8]张伟,周维佳,李斌.基于分维LLE和Fisher判别的故障诊断方法[J].仪器仪表学报,2010(2):325-333.
[9]付华,刘雨竹,李海霞,等.煤矿瓦斯浓度的CAPSO-ENN短期预测模型[J].传感技术学报,2015,28(5):717-722.
[10]Yang X S.Bat Algorithm for Multi-Objective Optimization[J].International Journal of Bio-Inspired Computation,2011,3(5):267-274.
[11]Yang X S,Hossein Gandomi A.Bat Algorithm:a Novel Approach for Global Engineering Optimization[J].Engineering Computa⁃tions,2012,29(5):464-483.
付华(1962-),女,辽宁阜新人,教授,博士生导师,博士(后),主要研究方向为煤矿瓦斯检测、智能检测和数据融合技术。主持国家自然科学基金2项、主持及参与国家863和省部级项目30余项,发表学术论文40余篇,申请专利24项,fxfuhua@163.com
代巍(1984-),女,辽宁本溪人,辽宁工程技术大学,安全科学与工程学院,博士研究生,主要研究方向煤矿瓦斯安全监测监控,daiweihld@163.com;
Dynamic Prediction of Gas Emission Based on LLE and BA-ENN*
FU Hua1*,DAI Wei2
(1.Faculty of Electrical and Control Engineering,Liaoning Technical University,Huludao Liaoning 125105,China;2.College of Safety Science and Engineering,Liaoning Technical University,Fuxin Liaoning 123000,China)
Elman network dynamic prediction method of Gas Emission based on the correlation analysis theory and the local linear embedding theory was proposed,for the gas emission affected by many factors,and there is a com⁃plex nonlinear relationship between them which resulting in low prediction accuracy.On the basis of correlation analysis on monitoring indicators,the mapping from high-dimensional space to low-dimensional space of Gas Emis⁃sion factors was realized by locally linear embedding theory,then remodeling the effective factor as the input vector of Elman network predictive model to reduce the complexity of the model structure,and at the same time,the Elman model was optimized with the bat algorithm to improve prediction accuracy and generalization ability.The experi⁃mental results show that the dynamic predictive method proposed in this paper has high generalization ability and prediction accuracy,which is applicable to the actual work of the Gas Emission Prediction.
gas emission;dynamic prediction;correlation analysis;;local linear embedded;bat algorithm;Elman neural network
X936
A
1004-1699(2016)09-1383-06
项目来源:国家自然科学基金项目(51274118)
2016-01-21修改日期:2016-03-01