基于ANNs耦合GA算法的煤层含气量预判
2015-03-21贾宝山
贾宝山, 尹 彬*
(1.辽宁工程技术大学 安全科学与工程学院, 辽宁 阜新 123000;2.矿山热动力灾害与防治教育部重点实验室, 辽宁 阜新 123000)
基于ANNs耦合GA算法的煤层含气量预判
贾宝山1,2, 尹 彬1,2*
(1.辽宁工程技术大学 安全科学与工程学院, 辽宁 阜新 123000;2.矿山热动力灾害与防治教育部重点实验室, 辽宁 阜新 123000)
为了对煤层含气量进行有效分析,以实现煤层气可靠抽采及瓦斯灾害预防,提出了遗传算法(GA)优化人工神经网络(ANNs)煤层含气量的预判方法.GA算法通过对ANNs网络的权值及阈值的寻优,构建了基于ANNs耦合GA算法的煤层含气量非线性预判模型,并结合现场实测数据进行了分析.仿真结果显示:耦合模型的预判的最大相对误差为1.47%,较之其他模型具有更高的预判精度和更好的泛化能力,能实现煤层含气量的有效预测.
神经网络(ANNs); 遗传算法(GA); 耦合模型; 煤层含气量
煤层气是生于煤层、储于煤层的非常规天然气,属洁净能源.但在煤矿中煤层瓦斯涌出和煤与瓦斯突出问题也是影响矿井安全生产的主要灾害之一.煤层含气量判断的准确度,直接影响煤层气勘探开发条件的确定,决定了开发前景,同时是影响煤矿安全生产的重要评估因子.
研究表明,煤层含气量在一定范围内呈规律性分布[1].文献[2]得出了埋深与煤层气含量的双曲线数学模型;文献[3]研究了瓦斯含量预测的数学地质技术与方法;文献[4]根据朗格缪尔方程建立了深部煤层含气量预测模型;文献[5]建立了含气量的解析计算法;文献[6]结合灰色模型对煤层含气量进行了预测;文献[7]以BP神经网络为模型对煤层气含量进行了预测;文献[8]将模糊识别与模糊聚类相结合对煤层瓦斯涌出量进行了预测.
由于煤层含气量受控因素复杂多样且各因素之间存在着复杂的非线性关系,尚没有一种理论能对煤层含气量进行准确预判.传统的方法多是建立在数学模型基础之上的回归分析,然而随着地质条件的变化,寻求复杂条件下、非线性系统中煤层含气量预判方法更加重要.考虑到计算机智能的优越性,作者提出一种基于人工神经网络(ANNs)与遗传算法(GA)耦合的预判模型,以ANNs为基本映射,经过GA优化后泛化能力及预测值可靠度均得到较高.
1 ANNs-GA耦合模型构建
ANNs是借鉴借鉴生物神经网络而发展起来的新型智能信息处理系统,具有快速的并行分布式处理结构;自身的容错性和联系性使得网络具有较强的鲁棒性,可以用来解决许多传统方法无法解决的复杂问题[9].但ANNs网络具有其自身无法克服的缺点,即收敛速度较慢且容易陷入局部极小值点而无法确保能够收敛至全局最小,网络初始连接权值和阈值的选择对网络训练的影响很大,这些无法克服的缺点使其无法实现对煤层含气量准确预测.
GA算法模仿自然界生物进化机制发展起来以实现随机全局搜索,其本质是一种高效、并行、全局搜索的方法,并依据生存法则,在潜在的种群区域中逐渐靠近最优解[10].
以GA算法优化ANNs网络,构造ANNs耦合GA的煤层含气量预判模型,能有效改善ANNs网络初始权值和阈值的可靠性,提高网络收敛速度及预测的精度.
1.1 ANNs神经网络
文中所讲的ANNs神经网络为BP网络,该网络是典型的数值前向传播、误差反向传播.经过训练的BP网络其非线性映射具有近似表示任意非线性函数及其逆的能力,具有较好的泛化能力.3层BP网络的拓扑结构如图1所示.
图1 典型BP网络拓扑结构图Fig.1 Structure of typical BP network
网络的实现程序:
Step2:在样本空间中随机选取输入X(k)=(X1(k),X2(k),…,Xn(k))与相应的输出d(k)=(d1(k),d2(k),…,dq(k)).
Step3:求解隐含层输入值hih(k),利用隐含层激活函数f求解隐含层各神经元输出值hoh(k):
Step4:求解输出层输入值yio(k),利用激活函数f′求解输出层神经元输出值yoo(k):
Step5:由ANN期望输出d(k)=(d1(k),d2(k),…,dn(k))与实际输出向量yoo(k),求解误差对输出层神经元偏导数δo(k):
δo(k)=(do(k)-yoo(k))yoo(k)(1-yoo(k)).
Step6:求解误差函数对隐含层神经元的偏导数δh(k):
Step7:连接权值ωho(k)与阈值bo(k)的修正:
Step8:连接权值ωih(k)与阈值bh(k)的修正
Step9:网络误差E
Step10:误差判断,当E<ε或者学习次数超过设定值,网络运算结束;否则,返回Step2,进行下一轮学习.
1.2 GA算法实现
GA算法基于模式理论模拟了自然界中的遗传现象,基于任意初始种群,逐渐进化到搜索空间中最优区域,最后收敛至的个体,即为最优解.
算法实现程序:
Step1:种群初始化.设置种群规模p,随机生成初始种群A=(A1,A2,…,Ap)T,给出数据取值范围,采用插值法生成种群中个体Ai的一组实数集(Ai1,Ai2,…,Ais)为GA的染色体,其中s根据具体要求而确定,为了取得较高精度的权值及阈值,对染色体数组采用二进制实数制编码作为基因组,设置最小适应度值ε'及最大进化代数T.
Step2:个体适应度函数.给定一个经过训练后的BP神经网络,将(1)中的染色体分别赋值给BP神经网络的权值和阈值,用训练数据训练网络后预测系统输出,把期望与输出的绝对值和作为适应度值F,计算公式为:
式中,N为训练样本个数;m为网络输出节点个数;yi为网络第i点期望值;oi为预测输出值.
Step3:选择操作,采用轮盘赌博法选择算子,即基于适应度的可靠性的选择策略.
式中,Fi为个体i的适应度值,k为系数.
上述各层需要两个领域将其垂直打通,在打通以后,可以进行从整体上来把握。一方面是编程以及管理工具,其方向体现在通过学习的方式,机器实现自动最优化、尽可能地不需要编程、不需要相对复杂的配置。另一方面则是确保数据安全,该领域贯穿于整体的技术体系之中。
Step4:交叉操作.基于个体采用的二进制编码,第k个染色体和第l个染色体在j位进行实数交叉,其操作为:
Akj=Akj(1-b)+Aljb,
Alj=Alj(1-b)+Akjb,
式中,b为[0,1]之间的随机数.
Step5:变异操作.选取基因位Aij进行变异,其操作为:
f(t)=r1(1-t/T),
式中,Amax为基因Aij上确界;Amin为基因Aij下确界;r为[0,1]之间的随机数;r1为一个随机数;t为当前迭代次数;T为最大进化代数.
Step6:将经过得到的个体赋予BP网络中相应的权值和阈值,进行适应度函数计算.如果满足约束条件,则输出经过GA优化的最优权值及阈值,否则返回step3进入下一轮进化.
1.3 ANNs-GA模型实现
相关研究指出BP网络只要有足够的隐含层及节点就可以以任意精度逼近,但是网络的收敛与初始权值和阈值的选择有密切的关系,如果初始参数赋值不当,极有可能会使网络迭代陷入局部最优解的死循环.基于此,文中引入了GA算法,借助其随机并行的优化方法和全局搜索能力改进BP网络.ANNs-GA模型的预测过程如图2所示.
图2 ANNs-GA耦合模型Fig.2 Coupling model of ANNs-GA
ANNs网络中选择双曲正切S型函数(Tan-Sigmoid)作为隐含层的激活函数,选择对数S型函数(Log-Sigmoid)作为输出层的激活函数.为提高网络的泛化能力和训练效率,需要对网络的输入及输出值进行规格化处理,即为提高网络敏感性采用相应方法后使数值全部落在[0,1]内,文中采用的规格方法如下式所示.
2 预判实例分析
2.1 基础样本准备
煤层含气量受生气能力和储气能力的影响[8],文献[11]通过对煤的生气量与热演化关系分析,指出煤层含气量与煤层生气能力关系不大.由于越流现象煤层气易在煤岩体中异地储存[12],这种现象主要受煤岩的吸附特征、孔隙特征、压力特征及煤层中流体的性质等因素影响,造成这些方面差异性的主要因素为构造特征和煤层厚度、埋深及煤层的地质特征等.
以东滩矿相关地质参数为对象[13],将埋藏深度(BD,BuriedDepth)、蒙阴组厚度(MF,Mengyinfm)、二叠系保存厚度(PS,PermianSystem)、基岩厚度(BT,BedrockThickness)、煤层厚度(CT,CoalThickness)、煤层倾角(CA,CoalAngle)等主控因素作为ANNs网络的输入值,以瓦斯含量(GC,GasContent)为输出值,整理后相关地质数据如表1所示.主控因素(BD,MF,PS,BT,CT,CA)共计21组,其中19组作为训练样本,用以网络的学习,2组数据作为测试样本(以*标记).
表1 样本基础数据[13]
续表1
2.2 基于ANNs-GA耦合模型训练
ANNs网络采用基于梯度下降法的学习方法,设定网络的误差目标ε为0.001,学习率η为0.1,动量系数为0.7,最大步长M为1 000.根据相关研究,三层BP网络能实现任意给定的映射[12],同时根据Kolmogorow定理经试算确定隐含层神经元个数为5,由此形成了6-5-1的网络结构.GA算法初始种群太小不易得到可行解,太大会使得因计算量大而收敛速度慢,因此确定种群规模为20.根据ANNs网络结构,由权值及阈值形成的个体变量共有6*5+5+5+1维,设定每个变量二进制位数为20,则个体基因长度为(6*5+5+5+1)*20,GA最小适应度值ε′为0.01,,最大进化代数T为100.
如图3所示,GA算法在第40代时达到进化结束条件(ε取0.01),此刻产生的20个染色体即是最优解.图4所示为第41代20条染色体的适应度值,可以看出最小值出现在第15条染色体(实点处),其值为0.009 9.表2所示为对该染色体反归一化后得到权值和阈值的解.图5所示为AANs-GA预测值与实测值的对角线图,图中以样本实
测值为横坐标,预测值为纵坐标,形成的样本原点与对角线的亲疏亦反映了样本预测的可靠与否.耦合方法预测样本最大残差为0.27,最大相对误差为3.24%,标准差为0.079 6,相关性系数(R2)为0.990 2,可以看出采用耦合方法预测值与实际值较为接近,整体预测的准确度也较高.
为了详细比对不同预判方法,将引自同一文献样本而采用不同方法下得出的预测值与现场测试值分别列入表3进行对比,其中回归方法计算值来源于文献[11],BP神经网络预测值来源于文献[7].
图3 GA适应度函数变化图Fig.3 Change map of GA fitness function
图4 最优种群个体适应度值Fig.4 Fitness value of optimum population
图5 ANNS-GA耦合模型预测Fig.5 Prediction of ANNS-GA coupling model
表2 GA优化ANNs网络后的权值及阈值
Tab.2 Weight and threshold of ANNs after optimization by GA
输入层到隐含层节点权重BDMFPSBTCTCA隐含层阈值隐含层到输出层节点权重输出层阈值-1 13650 50024 12425 6915-0 8647-0 5099-0 3640-9 10342 35946 55756 40535 90903 03585 74212 40406 35725 69158 21632 83214 34728 80510 3723-7 45178 4556-6 81670 50835 7893-8 66685 54120 43959 98457 7723-1 89117 8124-2 89666 06810 4258-7 04979 8191-3 33712 1272
表3 模型学习样本回代结果
图6中所示为多元回归方法计算与实测值得出的对角线图,由图6可知样本预测值与实际值偏差较大,预测样本最大残差为1.19,最大相对误差为51.55%,标准差为0.521 1,相关性系数(R2)为0.575 3.
图6 多元回归预测Fig.6 Prediction of multiple regression
图7所示为BP网络预测值与实测值的对角线图,采用BP神经网络预测样本最大残差为0.91,最大相对误差为28.26%,标准差为0.234 9,相关性系数(R2)为0.920 1,与图6相比较预测值与实际更加接近,但不如图5可靠度.图7与图5比较发现对于个别点(如8#样本)而言,无论哪种方法其误差均较大,表明无论是BP神经网络还是ANNs-GA耦合模型,其目的均在于提高网络的整体的预测可靠度.
图7 BP网络回归预测Fig.7 Prediction of BP Networks
由表3知,BP神经网络中有三个样本与实测完全一致,而ANNs-GA耦合方法中并没有与实际完全相符的.图8为不同方法下多评价指标参数的比对分析图,可以看出ANNs-GA耦合方法误差最小,相关性系数最大.图9为不同方法下学习样本相对误差的比对分析,多元回归分析平均相对误差为15.9%,BP网络平均相对误差为4.28%,ANNs-GA耦合方法平均相对误差为1.87%,BP网络及ANNs-GA耦合方法相对误差值均未超过5%,满足要求.考虑不同方法下学习样本回代的最大相对误差,BP网络虽有部分样本回代与实测一致,但整体波动较大(最大相对误差为28.26%);耦合方法相对误差较小(最大相对误差控制在4%以内)且整体变化不大.BP网络预测结果易发生振荡这一现象与以往有关研究结论一致[14],这也显示了ANNs-GA耦合方法的优势.
图8 不同方法多指标比对Fig.8 Compare multiple indicator of different methods
图9 预测相对误差值对比Fig.9 Comparing of relative error about prediction
2.3 预测效果检验
模型经过训练后,为检验不同方法的泛化能力,将两个预测样本20和样本21代入网络,并与经过BP网络预测和回归分析计算的结果比对,结果见表4.分析结果发现,两个样本回归分析值均小于实测值,而计算机智能方法下的计算结果其值均大于实测值;不同方法下样本的残差及相对误差数值显示耦合方法数值较小且稳定,而BP网络预测结果发生振荡.预判结果表明ANNs-GA耦合方法的泛化能力更强,从提高网络的整体预判效果及泛化性出发,对煤层含气量的预判采用耦合方法可信度更高.
表4 实测值与预测结果对比
3 结论
1)基于煤层含气量与影响因素间复杂的非线性关系,文中引入了对输入变量与输出变量间具有较强逼近能力的ANNs网络,针对ANNs网络学习收敛速度慢,且不能保证收敛到全局最小点的缺点,引入了GA算法改进ANNs网络,形成了ANNs耦合GA算法的预判新方法.
2)分析同一样本不同方法下的最大残差、最大相对误差、标准差及相关性系数,结果显示:回归分析可靠性较差,BP网络及ANNs-GA耦合模型预测精度较高,相关性系数均超过0.9,平均相对误差均小于5%.耦合方法相对误差更小且整体变化不大,平均相对误差在2%以内,预测误差整体稳定.
3)预测样本BP网络预判,显示误差较大且明显发生振荡;ANNs-GA耦合模型预测结果误差较小,泛化能力及实用性更强,说明耦合模型可以作为煤层产气量预测的新方法用于煤层气含量勘探.
[1] 彭苏萍, 段延娥, 孟召平, 等. Bayes逐步判别分析方法在煤矿瓦斯分布评价中的应用[J].煤田地质与勘探, 2003, 31(2):10-12.
[2] 崔洪庆, 张振安, 李德军. 基于一元非线性回归理论的矿井深部瓦斯含量预测[J].河南理工大学学报, 2012, 31(6):637-640.
[3] 张许良, 单菊萍, 彭苏萍. 瓦斯含量及涌出量预测的数学地质技术与方法[J].煤炭学报, 2009, 34(3):350-354.
[4] 赵丽娟, 秦 勇, 申 建. 深部煤层吸附行为及含气量预测模型[J].高校地质学报, 2012, 18(3):553-557.
[5] 王宏图, 鲜学福, 杜云贵, 等. 煤矿深部开采煤层气含量计算的解析法[J].中国矿业大学学报, 2002, 31(4):367-369.
[6] 杜卫新, 王永祥, 郝天轩. 基于灰建模的瓦斯含量多变量预测模型研究[J].中国安全科学学报, 2008, 18(5):41-45.
[7] 连承波, 赵永军, 李汉林, 等. 煤层含气量的主控因素及定量预测[J].煤炭学报, 2005, 30(6):726-729.
[8] 罗景峰, 许开立. 基于可变模糊组合方法的瓦斯涌出量预测[J].中国安全生产科学技术, 2011, 7(6):29-32.
[9] 朱大奇, 史 慧. 人工神经网络原理及其应用[M].北京:科学出版社,2006.
[10] 周 明, 孙树栋. 遗传算法原理及应用[M].北京:国防工业出版社,1999.
[11] 全裕科. 影响煤层气含量若干因素初探[J].天然气工业, 1995, 15(5):1-5.
[12] 孙培德, 万华根. 煤层气越流固-气耦合模型及可视化模拟研究[J].岩石力学与工程学报, 2004, 23(7):1179-1185.
[13] 汤友谊, 王言剑. 煤层瓦斯含量预测方法研究[J].焦作工学院学报, 1997, 16(2):68-72.
[14] 张汝波. 计算智能基础[M].哈尔滨:哈尔滨工业大学出版社,2013.
Pre-judge method of gas content based on coupled ANNs-GA method
JIA Baoshan1,2, YIN Bin1,2
(1.College of Safety Science and Engineering, Liaoning Technical University, Fuxin, Liaoning 123000;2.Key Laboratory of Mine Thermodynamic Disaster & Control of Ministry of Education, Fuxin, Liaoning 123000)
In order to effectively analyze coal seam gas content for preventing gas disasters and reliable drainage, this paper put forward a method that use genetic algorithm to optimize artificial neural networks. Genetic algorithm is merged with artificial neural networks to optimize weight and threshold. The model of nonlinear coal seam gas content prediction is established by ANNs-GA method and analyzed with the field data of mine. Through the simulation experiment, the prediction model has predicted that the maximum relative error is 1.47%. Compared with other prediction model, these results have better generalization ability and higher precision of prediction, providing effective forecast for coal seam gas content.
artificial neural networks; genetic algorithm; coupling model; coal seam gas content
2015-02-02.
国家自然科学基金项目(51174109).
1000-1190(2015)05-0715-07
TD712
A
*通讯联系人. E-mail: lngdyinbin@163.com.