基于PSO-SVR预测模型的综采工作面周期来压研究
2022-04-20吕文玉王海金伍永平杜旭峰贺雁鹏贾栋栋
吕文玉,王海金,伍永平,杜旭峰,贺雁鹏,贾栋栋
(1.西安科技大学 能源学院,陕西 西安 710054;2.西安科技大学 西部矿井开采及灾害防治教育部重点实验室,陕西 西安 710054;3.陕西小保当煤业有限公司,陕西 神木 719300)
精准预测综采面周期来压,提前做好防护措施,可以保障煤矿安全高效生产,具有良好的社会经济效益[1,2]。目前,综采面周期来压规律的分析主要包括岩层控制理论分析推导,室内物理模拟寻找潜在规律,数值计算软件在理想条件下,增加约束模拟岩层围岩破坏变形。传统采矿为消除老顶来压带来的工作面安全隐患,在顶板来压的发生机理、预测方面做了大量的工作。但由于煤岩介质非线性、复杂性、不确定等特点,且传统计算、模拟方法是建立在一定的理想条件下,因此并不能够达到理想的围岩控制效果。近年来,随着人工智能的创新与发展,基于神经网络、机器学习、深度学习的数据挖掘方法为周期来压的预测预报提供了新的解决思路。贺超峰[3]利用普通的BP神经网络对淮南潘集矿区的综采工作面的周期来压强度、步距进行预测,并取得较高的精度。杨硕[4]针对榆神府矿区的薄基梁浅埋煤层工作面,利用改进的粒子群算法优化BP神经网络对采场矿压规律进行预测,取得良好的预测效果。赵毅鑫等[5]建立长短时间记忆网络,并使用迁移学习,对大采高工作面矿山压力规律进行预测分析,得出长短时间记忆网络模型具有较强的泛化性。本文以陕北榆神府矿区80个近浅埋煤层工作面的工况为研究对象,采用粒子群优化的支持向量机(PSO-SVR)算法来预测采场上覆岩层中的矿压现象。通过粒子群算法建立了PSO-SVR预测模型,寻找支持向量机的最佳参数,改善普通支持向量机收敛速度慢、人为寻找最优参数难度较高,效率低等问题。
1 粒子群优化的支持向量机模型
1.1 支持向量机
回归型支持向量(SVR)作为支持向量机的一种,其与分类型支持向量(SVR)机区别主要是在SVR拓扑结构中引入不敏感函数[6]。支持向量机结构特征主要是利用核技巧、软间隔最大化去求解一个非线性问题,然后利用松弛变量约束使得更多的样本集符合约束条件来求解回归拟合问题,其最主要思想是利用核函数将非线性的特征向量映射到一个高维空间,在新空间内寻找最优的决策面使得所有的支持向量离该最优分决策面的距离最小[7]。标准支持向量机结构如图1 所示。
图1 SVR结构
设在高维空间的样本集(xi,yi)中,存在多元线性回归拟合函数:
f(x)=wφ(x)+b
(1)
式中,x,f(x)分别代表训练样本集的输入和输出值,其中,x=[x1,x2,…,xi];w为权向量;φ(x)为非线性映射函数;b为偏置项。
定义线性不敏感损失函数:
(2)
式中,y代表训练样本集的输入,其中,y=[y1,y2,…,yi],i为输入的样本数;ε为不敏感系数。
(3)
然后求解最优回归函数:
(4)
式中,C为惩罚因子。
同时引入Largranage函数,将其转化为对偶形式,其结果如下:
(5)
式中,k(xi,xj)=φ(xi)φ(xj)为核函数,其中,xi,xj为原始空间的支持向量。
约束条件为:
(6)
(7)
1.2 粒子群优化支持向量机参数的算法
粒子群优化算法(PSO)是一种群智优化算法,是利用不同粒子个体间相互协作来实现对整个群体信息的共享,在群体空间中寻求最优解[9]。
PSO算法首先在可解空间中初始化一群粒子,通过不断更新个体粒子的位置、速度向量,并引入适应度函数计算适应度值,比较粒子局部与全局适应度值,评选出个体极值,同时利用局部最优值与全局最优值进行比较,评选最优群体极值。其次通过不断调整粒子群位置和速度,不断更新个体极值和群体极值,最后当满足算法寻求到最优解或者达到最大迭代次数时结束计算[10]。在每次的迭代中,粒子更新位置和更新粒子速度的函数如下:
(8)
(9)
式中,ω惯性权重;d为核函数参数;k为粒子群更新代数;V为粒子群速度;θ为粒子群位置;Pbest为个体极值;Gbest为群体极值;c1,c2为学习因子;r1,r2为[0,1]随机数。
2 不同因素对周期来压的影响程度
周期来压的实质是在老顶经历过初次来压后,覆岩中“梁”和“板”等裂隙体,随工作面回采后经历“稳定—失稳—再稳定”的过程,形成了工作面的周期来压。周期来压期间,各影响因素对周期来压的变化方向、大小及速度的影响并不明确。一般因素包括围岩性质和开采条件两种类型。在本文中主要考虑埋深、煤层倾角、工作面推进速度、工作面长度、直接顶厚度、基本顶厚度、采高、煤层条件等因素对周期来压的影响。为了理清各因素对周期来压间的影响,找出最大影响因素,把握矛盾的主要方面[11],本文采用灰度理论分析各因素与周期来压的关联性。
在综采面顶板来压系统中,各个因素的量纲并不相同,如埋深的单位为m;煤层倾角的单位为(°),推进速度的单位为m/d等。这样的数据很难进行直接比较。因此需要对原始数据采用归一化变化消除各影响因素量纲,转化为可以直接比较的数据序列[12]。归一化公式见式(10):
(10)
式中,x为原始数据集中的特征值;max、min为原始数据集中的最大值、最小值;x*为归一化后数据集中特征值。
原始数据归一化变化后{Xi(t)},{Yi(t)},在i=k时刻,母序列与子序列的关联系数表达式为:
(11)
式中,Δ0i(k)为第k个样本中两比较因素的绝对差;Δmin,Δmax分别为所有比较序列在每个样本中绝对差中的最大值与最小值;ρ称为分辨系数,其目的在于消除数据间绝对误差过大而引起的数据失真,提高练习系数的可靠性,这里取0.5。
关联度分析实质上分析两相关因素在时间序列上的相关系数的平均值,即:
(12)
式中,r0i为两因素间的关联度;N为时间序列长度。
各因素对周期来压的影响程度见表1。由表1可知,在周期步距的灰度理论分析中,影响程度从大到小排序为推进速度、采高、直接顶厚度、基本顶厚度、工作面长度、埋深、顶板条件、煤层倾角、煤厚;在周期来压强度的灰度理论分析中,影响程度从大到小排序为推进速度、直接顶厚度、顶板条件、基本顶厚度、埋深、采高、煤层倾角、工作面长度、煤厚。从各相关因素对周期来压的关联程度可以看出,推进速度、工作面长度、埋深、顶板条件、煤层倾角对工作面周期来压影响较为显著,煤层厚度影响较小,推进速度影响最大,加快工作面的推进速度,可以有效改变砌体梁结构岩块间的挤压程度和水平推力,有利于关键层岩块回转失稳后快速形成自稳结构[13]。直接顶和基本顶的厚度、岩性,直接影响关键层破断后的承载能力[14];工作面长度、煤层倾角、采高的差异性变化,影响“砌体梁”空间结构大小,空间结构越小,加载层厚度越小,来压强度越小[15]。
表1 各因素对周期来压的影响程度
3 PSO-SVR的周期来压预测
3.1 预测模型数据预处理
为提高PSO-SVR预测综采面周期来压的准确性,基于灰度理论分析选取埋深、煤层倾角、工作面长度、直接顶厚度、基本顶厚度、采高、顶板条件、推进速度八个参数作为影响周期来压的输入特征,周期步距和周期来压强度作为周期来压的两个输出特征。煤层顶板条件是指工作面作顶板的控制难易程度,现为了方便机器学习,将其顶板条件按顶板控制难易程度分别用1、2、3、4代替不稳定顶板、中等稳定顶板、稳定顶板、坚硬顶板。该数据几乎覆盖了陕北近浅埋煤层所有地质条件和开采工艺。将数据分为两组,其中由Matlab中的rand函数随机选取70组作为样本数据集,10组作为测试样本数据集。由于各个特征值之间的量纲和数量级不同,容易给机器学习带来一定的困难。因此,本文采用归一化处理原始数据集。原始数据(部分)见表2[16]。
表2 各个工作面的周期来压及其主要影响因素数据(部分)
3.2 PSO-SVR在综采面周期来压中的预测
利用MATLAB仿真软件设计一种PSO-SVR组合算法,建立了综采工作面周期来压的预测模型。选取了埋深、煤层倾角、工作面长度、直接顶厚度、基本顶厚、采高、顶板条件作为输入因子,周期步距和周期来压强度作为输出因子。70组样本作为模型的训练集,10组样本作为测试集,模型采用均方误差(MSE)和决定系数(R2)作为模型的评价指标值,其公式如下:
(13)
(14)
式中,f(xi)为真实值;yi预测值。
利用Matlab编写PSO-SVR算法程序,通过测试确定其参数如下:粒子群个数80;粒子维数8;粒子群规模为10;循环次数200;学习因子c1=1.9,c2=2.0。在支持向量机算法中,鉴于径向基函数在大部分数据处理中表现出的优良性能[17],因此,本文采用径向基函数K(x,xi)作为支持向量机的核函数,标准支持向量机核函数参数σ=10,惩罚因子c=2.5。其具体公式如下:
(15)
3.3 BP神经网络的对比实验
为进一步说明粒子群优化支持向量机算法的优越性,将建立目前应用最广泛的BP神经网络模型进行对比实验分析。BP神经网络作为监督学习的一种方法,无需描述特征值之间的函数关系,就可以通过模型映射它们之间的物理关系,BP神经网络最基本思想就是通过反向传播调整输入层的权值和阈值,使误差函数沿负梯度方向下降最快[18]。
BP神经网络和粒子群优化算法(PSO-SVR)一样,采用相同的输入因子和输出因子进行模型学习,利用MATLAB编写BP神经网络模型,隐含层中的神经元采用S型传递函数tansig,输出层采用线性传递函数purelin[19]。通过多次试验验证,最终确定该模型包含两个隐含层的模型,10个神经元,学习速率0.1,最大迭代次数1000,允许最大误差0.001时,BP神经网络模型性能较佳。
4 预测结果分析
通过计算机仿真实验的 PSO-SVR、SVR 和BP神经网络模型分别对预留10组样本进行周期来压规律进行预测分析,实验结果见表3。由表3可以看出,PSO-SVR在周期来压步距和强度试验中均具有明显的优势。均方误差(MSE)反应测试集样本中实际值与预测值的平均误差,决定系数(R2)衡量模型对整体样本的拟合程度,其数值越接近1[20],表明模型对数据样本信息捕捉能力越好。对比标准SVR模型与PSO-SVR的均方误差明显较小,在预测周期来压时,PSO-SVR算法模型的预测结果较标准SVR模型更接近真实值。从决定系数来看,PSO-SVR的拟合优度大于SVR,这说明经粒子群优化后的支持向量机,较标准支持向量机更加能够解释输入因子与周期来压步距的相关关系,BP神经网络在整体实验中也表现出不错的实验性能。其各项指标在周期来压步距实验中优于标准支持向量机,但在周期来压强度试验中差于标准支持向量机,在与PSO-SVR模型性能指标对比后,BP神经网络无论均方还是收敛速度均处于劣势。
表3 PSO-SVR、SVR和BP对周期来压预测结果对比
基于PSO-SVR预测模型的来压步距和强度适应度变化曲线如图2所示,在粒子群优化支持向量机的模型实验中,随着迭代次数的增加目标函数(均方误差)越来越小。在周期来压步距实验中,当迭代至63代时,均方误差达到最小;在周期来压的强度试验中当迭代至68代时,预测值与实际值最接近,表明支持向量机选择参数达到最佳。
图2 PSO-SVR来压步距和强度适应度变化曲线
为充分显示粒子群优化支持向量机模型的优越性,PSO-SVR、SVR和BP三种模型对周期来压预测结果对比如图3所示。在周期来压规律的10组预测样本中,三种算法模型均表现出良好的拟合度,反应了选取输入因素中大部分或全部对周期来压均具有较强的关联度。但由于模型拓扑结构不同对数据的适应度不同,在周期来压强度和步距预测中表现出差异的模型性能。在周期来压步距的第四组预测中,三种模型的预测值均与实际值有较大偏差,都没能够进行充分学习;在周期来压的强度试验中,除第4组、第6组、第10组数据,由于BP神经网络在训练集中表现过拟合,在测试集中误差较大外,SVR和PSO-SVR在测试集样本中均表现良好的鲁棒性。从总体来看,PSO-SVR预测模型预测综采工作面周期来压规律中表现出良好的模型性能。
图3 周期来压步距和强度对比
PSO-SVR、SVR和BP三种预测模型的周期来压步距和强度误差对比如图4所示,从图4可以直观看出,PSO-SVR模型的波动幅度均明显小于标准SVR和支持BP神经网络,且最大误差、最小误差均小于SVR算法和BP神经网络,说明粒子群算法对优化支持向量机模型性能取得良好的效果,较普通支持向量机具有明显的优势。进一步分析,经过优化的支持向量机较SVR模型预测精度提升15%,拟合优度提升20%。较普通BP神经网络绝对百分误差减少16%,此外拟合优度大幅度提升,增幅31.5%。说明支持向量机经粒子群算法在到位空间筛选最佳模型参数后,具有较高的精确度,较强的泛化性,更好实现综采工作面周期来压的预测。
图4 周期来压步距和强度误差对比
5 结 论
1)经粒子群优化的支持向量机较标准支持向量机模型更加优良,其拟合度、鲁棒性明显优于标准支持向量机和普通BP神经网络,为预测综采工作面的周期来压提供了一条全新的思路。
2)通过灰色理论分析,埋深、煤层倾角、工作面长度、推进速度、直接顶厚度、基本顶厚、采高、顶板条件与周期来压的关联度均在80%以上,对顶板来压影响程度较大,而煤层厚度只有45%,影响较小。
3)支持向量机可以准确表达影响工作面周期来压的开采工艺和地质参数之间的非线性关系,通过粒子群优化算法寻找支持向量机的最佳参数,可以明显改善支持向量机模型泛化性能,表明该模型可以较好的描述地质条件和开采工艺影响周期来压的冗余、复杂的非线性关系。
4)采用粒子群优化支持向量机进行综采面周期来压预测中,除了影响因素较多且相互耦合外,训练集和测试集样本数据的收集需要投入大量的时间人力及物力。基于此支持向量机对于小样本数据,将非线性的原始变量在高维空间中构造为线性函数,这既保证在有限样本中“充分学习”,又解决“维数灾变”问题。因此,PSO-SVR在综采面周期来压预测中具有较强鲁棒性。