回采工作面瓦斯涌出量耦合预测模型研究
2015-04-14韩永亮李军文
李 胜,韩永亮,李军文
辽宁工程技术大学 矿业学院,辽宁 阜新 123000
瓦斯涌出是造成矿井安全事故发生和制约煤矿安全生产的灾害之一。由于我国高瓦斯矿井所占的比重较高,随着工作面机械化开采、集约化大生产以及深度开采的步伐逐步增大,瓦斯涌出量随之增加,事故危险性增大[1]。迄今为止,众多学者关于煤矿绝对瓦斯涌出量预测方法进行了深入的研究,积累了大量的研究成果,主要包括:统计预测法[2]、分源预测法[3]等线性预测法,灰色理论[4]、神经网络[5]、卡尔曼滤波法[6]、随机森林法[7]及其他耦合预测方法[8]等非线性预测方法。以上是在瓦斯涌出量预测研究中取得的有益探索,然而,绝对瓦斯涌出量预测是一个受多重因素影响的复杂动力学系统[9],通常预测算法只涉及相互关联的少数影响指标,算法在精度和泛化能力上需进一步提高。
支持向量机(SVM)[10]遵循结构风险最小化准则,在处理小样本事件具有很好的预测能力,然而,瓦斯涌出量影响指标间非线性、耦合性及信息冗余特征显著,若将影响指标直接作为模型输入向量,会干扰模型的预测精度和泛化能力,并且模型参数的选择对预测精度和泛化性能较敏感,因此,为提高模型预测精度,须采用优化算法对模型进行改进。主成分分析法避免影响指标间的信息冗余,通过提取主要因数建立不相关影响因子,可简化网络结构;果蝇优化算法(FOA)是一种先进的全局智能优化方法,适用于模型参数寻优,但算法存在易陷入局部收敛问题,须进一步改进[11]。鉴于此,笔者提出首先运用主成分分析法(PCA)对数据进行预处理,实现样本数据压缩和降维处理,使输入向量更具有典型代表性,同时,采用改进的果蝇算法优化支持向量机进行参数动态寻优,建立基于PCA-MFOA-SVM的回采工作面绝对瓦斯涌出量耦合预测模型,并通过仿真实例验证模型的优越性。
1 基本主成分分析法
主成分分析法(PCA)是应用多元统计技术将影响事物发展的多个相关因素组合为少量不相关且蕴涵大量原始信息的新变量。信息量的多少主要反映在新变量的方差上,方差越大所蕴涵的信息量就越大。通过对原始数据求取自相关矩阵,然后根据自相关矩阵求取特征值,计算贡献率和累计贡献率,并根据相应的特征向量确定主成分[12],具体分析过程如下:
(1)中心标准化处理。为消除原始变量不同量纲、数量级及数值的差异,首先对原始数据进行中心标准化处理,得无量纲数据新矩阵Y=[yij]。
(2)由新矩阵Y构建相关系数矩阵R,求解矩阵R的k个非负特征值 (λ1≥λ2≥…≥λk)及其对应的特征向量HP(p=1,2,…,k)。
(3)确定主成分个数n。特征值λ为对应主成分的方差,主成分个数n的选取取决于方差贡献率累加和即累计贡献率ϖn,通常选取累计贡献率满足85%以上作为主成分个数n选取的指标,即前n个主成分蕴涵了原始变量的绝大部分信息。
(4)构建新变量。n个主成分对应的特征向量Hn构建矩阵Z=Ym×kHk×n,代替原始变量进行后续计算。
2 支持向量机
支持向量机(SVM)在做回归预测时,其基本思路是通过采用内积函数定义的非线性映射将非线性样本空间转换为一个高维空间[13],进而在这个高维空间中对转化后的样本进行分析。
(2)引入不敏感损失系数ε、非负松弛变量ξi,ξi*,建立寻找未知参数ω,b的数学规划问题。
(3)引入拉格朗日函数,令核函数K(xi,xj)=φ(xi)φ(xj),将数学规划问题转换为对偶形式。
(4)求解最优解a,a*,并求取参数ω*和b*,进而建立支持向量机回归函数表达式:
核函数K(xi,xj)存在多种形式,在缺少先验知识的条件下,为保证算法更好地实现非线性化,通常选取正定核函数——径向基(RBF)函数K(xi,xj)=exp(-g||xi-xj||2)作为模型核函数。
3 MFOA优化SVM
SVM参数的选择对模型收敛精度和泛化能力有重要影响,而标准FOA在对参数迭代寻优过程中,所有个体只聚集在当前迭代的最优个体位置上,种群多样性特征表现不明显,降低了迭代搜索效率,若该个体不是全局最优,算法易陷入局部收敛和早熟的问题,这就会降低算法的收敛精度和效率[14]。鉴于此,本文采用三维搜索空间代替二维空间以扩大果蝇搜寻的空间自由度,利用群体味道浓度方差判定作为FOA局部收敛判定依据,根据混沌映射规则,将优化变量映射为混沌变量,利用混沌变量的遍历性和内在规律性实现全局寻优,即建立改进的果蝇优化算法(MFOA)并对参数迭代寻优,MFOA优化SVM的流程(见图1)和具体步骤如下:
图1 MFOA优化SVM流程图
(1)初始化果蝇参数,设定果蝇的初始位置X1,Y1,Z1,果蝇群体规模k,最大迭代次数n,给定方差阈值ξ和混沌遍历次数N。
(2)设定果蝇个体利用嗅觉在三维空间下寻找食物的随机方向的搜寻距离值Rvalue,鉴于优化参数为(C,g),X,Y,Z分别取为k行2列。
(3)由于先前无法确定食物源的具体位置,根据个体与原点的距离Li,计算个体味道浓度判定值Si,并对优化参数(C,g)赋值。
(4)yij为样本实际值,f(xij)为回归预测值,学习样本采用3折交叉验证,将S(i,:)带入适应度函数(fitness function),计算果蝇群体中每个个体的适应度值ft。
(5)在群体中找出味道浓度最优的个体。
(6)记录并保留最优浓度值及其对应的X,Y,Z位置,果蝇凭借其视觉向该位置飞去。
式中,VXi为第i个混沌变量,VX(m)i为变量VXi在第m步变换后的值,Xi∈(ai,bi),VXi∈[0,1]且VXi≠{0.25,0.5,0.75},Xi'为混沌变量VXi转化后获得的新的变量值,新变量值Yi',Zi'获取过程亦同。
(8)执行进程(3)~(6)计算果蝇个体新位置的味道浓度判定值Si',将其带入适应度函数计算果蝇个体的适应度值fti'。若fti'<fbest,则fbest=fti',同时记录对应果蝇个体的新位置,并转向进程(7)。否则,直接转向进程(7)。
(9)迭代执行步骤(2)~(8),达到目标精度要求阈值或迭代次数最大值n时,迭代终止。
4 仿真预测
4.1 预测模型构建
绝对瓦斯涌出量预测是一个复杂的动态系统,传统预测研究方法只考虑少量几个参数,存在模型预测精度低、泛化能力不足等现象,要达到准确预测瓦斯涌出量的目的,需综合考虑各复杂因素间的不确定关系[15]。因此,为提高算法预测精度,根据开滦集团某一矿区的实测数据,选取煤层原始瓦斯含量X1(m3/t)、煤层深度X2(m)、厚度X3(m)、推进速度X4(m/d)、采出率X5、临近层瓦斯含量X6(m3/t)、临近层厚度X7(m)、层间距X8(m)、层间岩性X9、开采强度X10(t/d)作为输入样本,瓦斯涌出量X11(m3/t)作为输出样本(见表1)。模型首先采用主成分分析法(PCA)对输入样本进行预处理,消除影响指标的相关性,实现数据压缩和降维处理;将主成分计算的样本数据作为SVM的输入向量,瓦斯涌出量作为其输出向量,结合MFOA优化算法,优化回归函数得相关参数,建立基于PCA-MFOA-SVM的回采工作面瓦斯涌出量预测耦合模型。当对未知绝对瓦斯涌出量进行预测时,根据上述主成分影响因素输入值,模型自动根据确定的回归函数预测出瓦斯涌出量,具体流程(见图2)。
图2 基于耦合模型的回采工作面瓦斯涌出量预测流程
4.2 PCA数据预处理
由于瓦斯涌出量影响因素数值间存在不同的量纲和数量级,且数值间差异性明显,因此,首先对输入样本(X1~X10)进行中心标准化转化,利用MATLAB软件对转化后的10项指标进行主成分分析,计算结果见表2。
应用残差均方根和相对误差均方根分析由主成分重建样本数据与原始数据之间的差距,用以评价信息量损失的大小。由表2可以看出,第一主成分的方差贡献率为65.386 0%,前四个主成分累积贡献率达到94.437 1%,残差均方根为0.119 8,相对误差均方根为5.316%。根据通常采用的主成分择取标准,累积贡献率达到85%可作为主成分个数选择的指标,因此,10项影响指标可用前4个主成分代替,且信息损失量较小。由表2中前4个主成分与原始变量的关系,写出主成分与原变量的线性组合:
表1 瓦斯涌出量与影响因素监测数据统计样本
表2 主成分计算结果
其中,Y为样本X按中心标准化转化后的矩阵,按照式(18)分别计算样本的主成分得分,并由主成分得分构建模型样本数据(见表3)。
4.3 模型预测及分析
以主成分作为模型输入参数,瓦斯涌出量作为输出参数,此时,模型原始输入样本经PCA处理方法由10维降为4维,将表3样本空间分为训练样本集和预测样本集,其中前1~15组数据作为训练样本集,用于进行训练学习机器和计算回归参数,后16~18组数据作为测试样本集,用以检验模型预测的精度。采用MFOA优化SVM参数C和g,模型参数确定如下:随机初始化果蝇起始位置及方向,设定果蝇群体规模为20,最大迭代次数为500,混沌遍历次数为2,方差阈值设置为0.000 01,采用三折交互验证模式,由经验一般设取C∈[0 200],g∈[0 100];SVM模型以径向基核函数为模型核函数,损失函数值设为0.01。按照图2所示的模型预测流程,经MFOA算法优化求得参数C=38.653 0,g=3.092 2,将所得参数带入SVM模型中并对训练样本集中的前15组样本进行训练,以获取参数最优训练模型。为了测试模型的优越性,对测试样本集中的3组数据进行仿真预测,训练和预测结果见图3~4。由图可知,训练后模型预测的均方误差mse为0.002 45,模型决定系数R2为0.960 59,预测结果表明基于PCA-MFOA-SVM模型预测具有较好的拟合泛化能力。
表3 瓦斯涌出量与主成分得分数据统计
图3 训练样本集预测结果
为进一步凸显模型的优越性,将该模型与PCA-FOASVM、PCA-GA-SVM[16]预测模型在相同配置条件下进行工作面瓦斯涌出量预测对比分析,选取绝对误差、相对误差、标准差、模型预测决定系数、训练时间作为模型评价指标,预测结果对比见表4。
图4 测试样本集预测结果
由表4可知,运用PCA-MFOA-SVM模型预测的平均绝对误差为0.077 5 m3/t,平均相对误差为1.323 7%,标准差为0.002 5,预测误差值明显低于其他模型,表明该模型具有较高的预测精度;模型决定系数为0.960 6,表明该模型具有很强的拟合能力;模型预测时间为22.966 5 s,预测效率须进一步提高。综合评价指标表明,基于PCA-MFOA-SVM的预测模型具有较高的预测精度和拟合泛化能力,将其应用于工作面瓦斯涌出量预测中能够实现理想的预测结果。
5 结论
本文针对回采工作面绝对瓦斯涌出量预测提出了一种新的预测方法,预测结果表明应用该模型具有显著的优越性,并在研究中得出以下结论:
(1)运用主成分分析法对10个影响指标进行主成分特征提取,通过选取4个主成分进行回归分析,消除了信息冗余,实现了模型数据压缩和降维处理,从而简化了模型结构。
表4 三种模型预测结果对比
(2)引入混沌映射准则,建立三维搜索空间下的改进的果蝇优化算法,并利用该算法训练支持向量机预测模型并进行参数动态寻优,提高了模型的预测精度和效率。
(3)仿真结果表明,基于PCA-MFOA-SVM回采工作面瓦斯涌出量模型与其他模型相比具有较高的预测精度和拟合泛化能力,且综合性能优于其他模型,可运用于瓦斯涌出量动态预测。
[1]李润求,施式亮,罗文柯.煤矿瓦斯爆炸事故特征与耦合规律研究[J].中国安全科学学报,2010,20(2):69-74.
[2]姜文忠,霍中刚,秦玉金.矿井瓦斯涌出量预测技术[J].煤炭科学技术,2008,36(6):1-4.
[3]戴广龙,汪有清,张纯如,等.保护层开采工作面瓦斯涌出量预测[J].煤炭学报,2007,32(4):382-385.
[4]李胜,宁志勇,朱小强,等.基于灰色理论预测五阳矿未受采动影响煤层瓦斯含量[J].科技导报,2012,30(32):71-74.
[5]梁晓珍,宋存义,王依.唐山矿瓦斯涌出量动态预测模型[J].北京科技大学学报,2012,34(3):260-263.
[6]王晓路,刘健,卢建军.基于虚拟状态变量的卡尔曼滤波瓦斯涌出量预测[J].煤炭学报,2011,36(1):80-85.
[7]温廷新,张波,邵良杉.煤与瓦斯突出预测的随机森林模型[J].计算机工程与应用,2014,50(10):233-237.
[8]付华,史冬冬.基于IGA-LSSVM的煤矿瓦斯涌出量预测模型研究[J].中国安全科学学报,2013,23(10):51-55.
[9]何利文,施式亮,宋译,等.回采工作面瓦斯涌出的复杂性及其度量[J].煤炭学报,2008,33(5):547-550.
[10]戴宏亮.小波支持向量回归在瓦斯涌出量预测中的应用[J].计算机工程与应用,2010,46(7):15-17.
[11]韩俊英,刘成忠.自适应混沌果蝇优化算法[J].计算机应用,2013,33(5):1313-1316.
[12]周松林,茆美琴,苏建徽.基于主成分分析与人工神经网络的风电功率预测[J].电网技术,2011,35(9):128-132.
[13]李胜,韩永亮.基于MFOA-SVM露天矿边坡变形量预测研究[J].中国安全生产科学技术,2015,11(1):11-16.
[14]杨书佺,舒勤,何川.改进的果蝇算法及其在PPI网络中的应用[J].计算机应用与软件,2014,31(12):291-294.
[15]张少帅,杨胜强,鹿存荣,等.基于瓦斯涌出量预测的近距离煤层群开采顺序优化选择[J].中国安全生产科学技术,2011,7(9):60-63.
[16]徐国祥,杨振建.PCA-GA-SVM模型的构建及应用研究[J].数量经济技术经济研究,2011(2):135-147.