基于三次B样条函数的非线性偏最小二乘的矿井涌水量预测模型
2012-03-23李武俊董贵明房云峰安润莲
李武俊 董贵明 房云峰 安润莲
摘要:矿井涌水量及其影响因素之间往往存在着复杂多重共线性和非线性,这是涌水量预测出现较大误差的主要原因之一。本文介绍了基于三次B样条函数的非线性偏最小二乘建模方法,并将其应用于白龙矿矿井涌水量的预测分析中。应用结果表明:模型拟合阶段平均误差4.6%,预测阶段平均误差5.3%,该方法能较好地处理建模过程中的多重共线性和非线性问题,能有效提高涌水量预测的准确性。
关键词:样条;偏最小二乘回归;矿井涌水量;非线性系统
中图分类号: TB112文献标识码:A 文章编号:
Mine Water Inrush Prediction of Nonlinear Partial Least-Squares Regression Based on Cubic B-spline Function
LI Wu-jun1, DONG Gui-ming2, FANG Yun-feng3
(1.Geological and Surveying Division,Huozhou Coal-electricity Group Limited Company,sahnxiHuozhou 031400;2.School of Resource and Earth Science, China University of Mining and Technology, Xuzhou Jiangsu 22116,China;3.Zhejiang East China Construction Project Limited Company,Hangzhou Zhejiang 310030,China)
Abstract: Complex multicollinearity and nonlinear between mine water inrush and its influencing factor are one of the key reasons of appearing larger error when forecasting water inrush.So the method of model establishment with nonlinear partial least-squares regression based on cubic B-spline function were introduced in this essay.Then it was used into mine water inrush forecast of Bailong Mine. The result showed that the average error of this method was4.6% in fitting stage,which was5.3% in testing stage。This method could be used to deal with complex multicollinearity and nonlinear problems and improve the veracity of water inrush prediction effectively.
Key words: splines; partial least-squares regression; mine water inrush; nonlinear systems
礦井涌水是影响矿井安全生产的重要因素,其大小决定了矿井安全生产的程度。矿井涌水量的计算和预测是矿井生产过程中一项重要的基础工作。目前,解析法、水文地质比拟法、支持向量机、时间序列分析、人工神经网络和混沌分析等方法在矿井涌水量预测方面已经得到了不同程度的应用[1-6]。矿井涌水过程受地形地貌、地质、水文地质、气候要素和采掘活动等多种因素的影响,往往具有非线性特征 [5-6],除了非线性特征,众多要素存在的多重共线性问题也是影响模型效果的另一个重要原因。目前,在矿井涌水量预测中,能同时有效地处理这两个问题的方法应用还比较缺乏。
基于三次B样条函数的非线性偏最小二乘方法是建立在线性偏最小二乘基础上的一种新的系统建模方法。线性偏最小二乘有机地结合了多元线性回归分析、主成分分析和典型相关分析,该方法可以有效地提取对系统解释性最强的综合变量,能够克服变量多重相关性对建模的不良影响[7-11]。非线性偏最小二乘借鉴了插值原理,将非线性问题转化为拟线性问题进行求解[12],其中,三次B样条是插值函数中最常用的一种。
基于三次B样条函数的非线性偏最小二乘是统计分析方法和数值分析方法的结合,具有坚实的理论基础,可以同时处理多重共线性和非线性影响问题。本文将阐述基于三次B样条函数的非线性偏最小二乘建模的基本过程,并建立白龙煤矿斜井+455m水平涌水量的预测模型,以探讨该方法应用于矿井涌水量预测的可行性。
1 基于三次B样条函数的非线性偏最小二乘建模步骤
第1步:对自变量空间的每一维进行三次B样条变换:。
(1),确定,并求得分点:
、和分别为变量上划分的区间分点、分段长度以及分段个数。
(2)对做如下的三次B样条变换:
第2步:对因变量及新的自变量进行标准化处理,即:
其中: 和分别是和样本均值;和分别是和样本方差。令新自变量经过标准化处理后为,从而得到:
第3步:对因变量和新的自变量进行线性偏最小二乘回归建模,建模过程中主成分个数的确定一般采用交叉有效性检验的方法。
第4步:将式(3)、(6)代入式(7),得到关于的非线性回归模型:
2 白龙煤矿斜井+455水平涌水量预测模型
2.1 斜井+455m水平概况
白龙煤矿位于山西省霍州市白龙镇境内,汾河自北向南流经井田东侧,核定生产能力120万t/a。矿井采用平峒和斜井开拓方式,平峒第一水平标高为+575m,斜井第一水平标高为+455m,两个水平作为独立系统。斜井+455m水平主要开采太原组2号煤层,为带压开采。地层从老至新分别为中奥陶统峰峰组,上石炭统本溪组、太原组,下二叠统山西组、下石盒子组,上二叠统上石盒子组。太原组、山西组为主要含煤岩系,新生界第三系及第四系不整合覆盖于上述各不同时期的地层之上。矿井水文地质条件复杂,断层及陷落柱非常发育。跟据《白龙煤矿生产矿井地质报告》,斜井+455m水平的矿井主要充水水源为大气降水及地表径流入渗补给、松散孔隙潜水、太原组上段灰岩岩溶裂隙水、煤层顶板砂岩裂隙承压水、煤系地层基底奥陶系灰岩岩溶裂隙水。1989年至2010年涌水量过程如图1所示。
图1斜井+455水平1989年至2010年涌水量过程曲线
2.2 涌水量预测模型
利用矿井1989年至2005年的降水量和松散孔隙潜水、太原组上段灰岩岩溶裂隙水、煤层顶板砂岩裂隙水及煤系地层基底奥陶系灰岩岩溶裂隙水的地下水位数据,结合斜井+455m水平的采掘过程进行分析。其中:因变量为斜井+455m水平当年涌水量(),根据基于三次B样条函数的非线性偏最小二乘建模步骤,结合自相关、偏相关分析和逐步回归分析最终确定自变量为当年降水量()、上一年降水量()、煤层顶板砂岩裂隙水水位()、奥陶系灰岩岩溶水水位()、开采面积()及上一年矿井涌水量(),即:
由相关分析可知,这6个自变量之间存在较强的多重共线性现象。模型中,取为1,在新自变量集合中提取4个主成分。模型拟合如图2所示,模型拟合平均误差4.6%,具有较高的精度。图3是使用相同的数据和自变量,采用多元线性回归方法得到的拟合效果图,模型拟合平均误差9.4%。因此,本例中,非线性偏最小二乘方法效果更好。
图2非线性偏最小二乘模型拟合效果图
图3 多元线性回归模型拟合效果图
3 涌水量预测
利用2006年至2010年的资料,对涌水量进行预测,以检验模型的效果。模型預测效果如图4所示,预测平均误差5.3%。图5是使用相同的数据和自变量,采用多元线性回归方法得到的预测效果图,预测平均误差12.4%。由图4和图5的对比可以看出,非线性偏最小二乘方法的预测效果比多元线性回归方法好。
图4非线性偏最小二乘模型预测效果图
图5多元线性回归模型预测效果图
4 结语
基于三次B样条函数的非线性偏最小二乘建模方法对白龙矿+455水平涌水量的预测结果表明:该方法能有效地处理涌水量建模过程中的多重共线性和非线性问题,可有效的用于涌水量预测问题。
非线性在自然界是普遍存在的,非线性分析将是深入认识问题的主要方法之一。如何分析涌水量及其各影响要素的非线性变化特征是涌水量计算预测的一个重要内容,基于三次B样条函数的非线性偏最小二乘提供了一种进行非线性分析的方法,该方法理论基础坚实,适用性广泛,具有很好的应用前景。本文首次将该方法应用于矿井涌水量的预测当中,应加强该方法的应用研究。
参考文献:
[1]陈建宏,施飞,郑海力.基于灰色神经网络的矿井涌水量预测[J].矿业研究与开发,2011,31(2): 73-75.
[2]华解明.矿井涌水量计算的非稳定流解析法[J].中国煤炭地质,2010,22(10):38-40.
[3]臧大进,刘增良,曹云峰.基于粒子群优化支持向量机的矿井涌水量预测[J].凯里学院学报,2010,28(6):26-29.
[4]唐依民,肖江.矿区地下水系统演化过程中混沌性态形成的条件及机理[J].煤炭学报,2006,31(1):45-49.
[5]汤琳,杨永国,徐忠杰.非线性时间序列分析及其在矿井涌水预测中的应用研究[J].工程勘察,2007 (5):28-31.
[6]杨永国,陈玉华.矿井涌水量混沌特征与预测[J].地球科学—中国地质大学学报, 2009,34(2):258-262.
[7]陈南祥,黄强,曹连海.基于偏最小二乘回归与神经网络耦合的岩溶泉预报模型[J].水利学报,2004,35(9): 68-72.
[8]束龙仓,董贵明,陶玉飞,等.地下河天窗水位变化分析及预测[J].水利学报,2009,40(5):529-534.
[9]郭平业,胡建兰,董贵明,等.基于样条变换的非线性PLSR流量预测[J].人民黄河,2010,32(12):79-80.
[10]王惠文.偏最小二乘回归方法及其应用[M].北京:国防工业出版社,1999.
[11]高惠璇.应用多元统计分析[M].北京:北京大学出版社,2002.
[12]王惠文,吴载斌,孟洁.偏最小二乘回归的线性与非线性方法[M].北京:国防工业出版社,2006.
基金项目:中国矿业大学青年科研基金资助项目(2009A031);中国矿业大学人才引进资助项目。
作者简介:李武俊 (1965.6—)男 山西闻喜人 地质工程师 主要从事矿井地质及水文地质工作
注:文章内所有公式及图表请以PDF形式查看。