基于Bayesian多分支岩石可钻性值估计
2014-07-02沙林秀邵小华张奇志
沙林秀,邵小华,张奇志,李 琳
(1.西安石油大学陕西省钻机控制重点实验室,陕西西安710065;2.大庆钻井集团钻井一公司,黑龙江大庆710072)
基于Bayesian多分支岩石可钻性值估计
沙林秀1,邵小华2,张奇志1,李 琳1
(1.西安石油大学陕西省钻机控制重点实验室,陕西西安710065;2.大庆钻井集团钻井一公司,黑龙江大庆710072)
针对智能优化控制过程中岩石可钻性参数估计存在非实时性和模型泛化能力差的问题,采用两层结构建立基于Bayesian多分支岩石可钻性估计模型。通过Bayesian分类器实现岩性分类以提高可钻性模型样本数据的相关性,细化可钻性估计模型;采用改进双链量子遗传算法优化的BPNN结构,根据不同的岩石类型建立相应的岩石可钻性IDCQGA_BPNN估计模型。结果表明,该方法通过算法优化网络模型增强了模型的泛化能力,加快了参数的估计速度和估计精度,能够满足智能优化控制过程中岩石可钻性参数估计的实时性需求。
岩石可钻性;Bayesian分类器;L-M算法;改进的双链量子遗传算法
岩石可钻性是指在一定的外力和钻具条件下岩石抵抗钻头破坏的能力。它表征岩石抗钻强度,是岩石物理性质在钻进时的综合表现。岩石可钻性估计是钻头选型和钻进参数设计以及合理选择钻进方式、提高钻井效率、降低成本和减小钻头磨损等优化决策的前提。因而在钻进过程中,如何实现岩石可钻性的实时估计,为钻井参数的动态优化和优化控制提供依据,是智能自动送钻技术的重要环节之一。目前,岩石可钻性表示方法[1-3]主要有岩石物理力学性质表示法、微钻速度法、分形理论法[4-6]等。然而,利用岩石物理力学性质分析可钻性受地层、钻头类型及钻进参数的影响,且条件性很强;微钻法滞后于实际钻进,不能随钻随测,周期长,费用高;分形法可避免传统方法的滞后性、周期长、费用高等不足。综上所述,笔者将可钻性指标以实际钻凿衡量,将Bayesian网络分类器实现岩性的识别和改进的双链量子遗传算法(improved double-chain quantum genetic algorithm,IDCQGA)优化BP神经网络(back-propagation neural network,BPNN)相结合,提出基于Bayesian多分支岩石可钻性值估计模型,实现岩石可钻性值估计。
1 基于Bayesian多分支岩石可钻性值估计模型结构
1.1 岩石可钻性估计模型性能
设定样本平均均方误差小于ε2,则有
采用BP网络实现输入-输出关系映射时,样本的均方差E1非常小,而平均均方差E2无法满足要求的“过拟合”现象,从而降低了网络的泛化能力,使网络失去实用价值[7-9]。因此,本文中建立可钻性模型时作以下改进:
(1)采用Bayesian网络分类实现岩性的分类识别,通过细化模型和改善模型样本数据的相关性,提高参数估计精度和模型的泛化能力。
(2)根据不同岩性建立不同的BPNN岩石可钻性估计模型,实现该模型的分支选择和可钻性值的估计。
(3)利用高速、并行的IDCQGA优化BPNN网络结构,以克服网络初始权值、阀值随机性,以及在复杂多维曲面问题求解中存在多个局部极值点时易陷入局部最优、收敛速度降低等问题。
1.2 多分支岩石可钻性值估计模型
在智能钻井优化控制过程中,实现岩石可钻性精确、实时提取至今仍是亟待解决的课题。通过分析相邻井井史数据,建立基于Bayesian多分支岩石可钻性值估计模型。该模型采用两层结构:首先,根据反映岩石岩性和可钻性的主要特征数据,建立Bayesian岩性识别模型,利用该模型实现地层岩性识别;其次,采用IDCQGA优化的BPNN结构(简称为IDCQGA_BPNN)建立不同岩性所对应的IDCQGA_BPNN岩石可钻性估计模型,实现多分支岩石可钻性估计。基于Bayesian多分支岩石可钻性值估计模型结构如图1所示。
图1 基于Bayesian多分支岩石可钻性值估计模型结构Fig.1 Rock drillability value estimating of multi-branch model base on Bayesian
图1中,若第一层基于Bayesian岩性识别种类数为C,则建立的IDCQGA_BPNN岩石可钻性值估计模型数为C,即NET 1~NET C,以实现不同岩性对应的岩石可钻性值的估计。
基于Bayesian多分支岩石可钻性值估计模型从增加样本的相关性、细化模型和优化网络结构等方面改进,以提高岩石可钻性参数估计模型的参数估计精度和增强模型泛化能力。
2 基于Bayesian岩性的分类模型
2.1 Bayesian网络的分类原理
Bayesian网络分类器建立在Bayesian统计学和网络模型基础上,而Bayesian网络是描述一组变量概率分布的有向图,具有通用性、灵活性及清晰的模块结构[10-12]。
令D={X1,X2,…,Xn,C}是随机变量的有限集,其中X={X1,X2,…,Xn}是属性变量集,用属性取值表示;C是类变量,取值范围为C={c1,c2,…,cm}。样本xi=(x1,x2,…,xn)属于ci的概率。由概率的链式法则,Bayesian公式表示为
式中,α为正规化因子;P(cj)为类的先验概率;为类cj关于xi的似然;表示属性变量Xi取值为xi且其父节点π(Xi)取值为π(xi)的概率。类变量是每个属性变量的父节点,即C∈π(Xi)(i=1,2,…,n),因此称为类条件概率。
采用Bayesian网络分类,实际上是用Bayesian网络求解式(3)。由于Bayesian网络表达了变量集的全联合概率分布,因而只要确定了变量集的Bayesian网络结构和属性变量的条件概率分布,即可求得。
2.2 Bayesian分类结构
n维模式特征向量X=(x1,x2,…,xn)T输入分类器后,分别对C类模式计算判别函数gi(X)的值,然后选值最大者作为X的归属判别。对于C类n维模式,Bayesian分类器的结构如图2所示。
图2 Bayesian分类器结构Fig.2 Structure of Bayesian classifier
判别函数gi(X)可以选用最大后验概率或最大的类条件概率密度。
2.3 参数学习
常用的Bayesian网络参数学习方法包括最大似然估计和Bayesian估计[13]。在Bayesian网络参数学习中,条件似然函数具有全局最优值[14],最大化条件似然函数必将导致好的分类性能[15],因此为得到准确率较高的分类器,应该以条件似然函数取最大值为学习目标。
在实际应用中,经常采用独立取样和处理正态分布变量,对于单值单调的对数函数的似然函数与似然函数式(5)在相同的处取得最大值。在似然函数可微时,
2.4 L-M优化方法
采用向前传播的Bayesian网络的目标误差为
式中,ti和oi分别为权值、阀值向量为ω时网络的期望输出与实际输出。
设网络的误差向量为e(ω)=[e1(ω),e2(ω),…,em(ω)],当评价函数采用平方和的形式时,LM算法使用H的近似矩阵,得到权值调整率为
式中,H=JTJ为近似海赛矩阵;g=JTe为梯度;J为雅克比矩阵,包含了网络误差相对于权值和偏差的一阶导数,J可以通过标准的方向传播方法来计算。当μ=0时,式(9)为使用了近似的海赛矩阵牛顿法;当μ较大时,式(9)为具有较小步长的梯度下降法参数。因此,L-M算法克服了梯度下降法在距离极小点较远时,函数值下降较快,越接近极小点下降得越慢以及Gauss-Newton法在接近极小点处收敛较快,远离极小点时不能保证收敛的不足,并且避免了计算海赛矩阵,加快了算法的收敛速度。用式(9)的L-M算法求解式(6),其算法的时间复杂度为O(m3/6)。
3 岩石可钻性估计模型IDCQGA_ BPNN
3.1 采用IDCQGA优化BPNN结构的数学描述
利用改进的全局寻优的IDCQGA[19-20]优化
BPNN结构,即优化BPNN的隐层节点数、权值和阀值,以提高BPNN的收敛速度和泛化能力[21]。采用IDCQGA_BPNN实现岩石可钻性估计的问题可描述为
式中w和θ分别为输入层到隐层初始的权值和阀值;v和r分别为隐层到输出层初始的权值和阀值; S1为隐层节点数。
利用IDCQGA求解式(10)的二次非线性优化问题时,岩石可钻性估计的目标适应度函数为
BPNN采用三层结构(R-S1-S2),R为输入层的节点数,由模型输入钻井参数的个数决定;S2为输出层的节点数,由待估计参数的个数决定;S1为隐层节点数。
将BPNN和IDCQGA_BPNN网络的均方差(MSE)值进行比较,比较结果如图3所示。
图3 BPNN和IDCQGA_BPNN网络的MSE值比较Fig.3 Comparison of BPNN and IDCQGA_BPNN MSE value
由图3可知,采用IDCQGA优化BPNN网络结构,提高了网络的性能,加快了收敛速度。
3.2 IDCQGA_BPNN岩石可钻性值估计步骤
根据Bayesian网络实现非均质地层的岩性识别,根据不同的岩石类型建立不同的IDCQGA_BPNN岩石可钻性值估计模型。
(1)第一层建立Bayesian岩性分类模型的参数设计:在总样本中,训练样本占80%,有效样本占15%,测试样本占5%。分类器参数设定:隐层层数为20,训练目标性能为1.0×10-10,学习率为0.1。在岩石的分类和可钻性估计中,模型的输入参数为{起始井深,进尺,钻压,转速,钻井液排量,钻井液密度,纯钻进时间,钻速}。岩性分类的输出参数为{1-细砂岩,2-灰泥岩,3-砂泥岩,4-泥砂岩,5-砂岩,6-泥岩}。
(2)第二层采用改进的双链量子遗传算法IDCQGA优化的BPNN结构,优化流程如图4所示。其中,解空间的变化、转角步长Δθ的非线性自适应调整及量子染色体的更新、变异方法见文献[20]。
图4中,w和θ为优化后输入层到隐层的权值和阀值;v和r为优化后隐层到输出层的权值和阀值。S1为隐层节点数。岩石可钻性估计输入参数与第一层输入参数相同,输出参数为{岩石可钻性值}。在已建立岩石可钻性估计的BPNN结构的基础上进一步训练BPNN,建立精确的岩石可钻性估计模型。
图4 IDCQGA优化BPNN结构流程Fig.4 Optimized flow chart of BPNN model by IDCQGA
根据钻井过程中实时测量的参数确定岩石岩性,依据岩性的不同选择对应可钻性估计BPNN模型,实现岩石可钻性估计。其中,岩石可钻性的输入层数R =8,输出层S2=1。根据优化结果隐层S1=7。
4 实验仿真
4.1 测井数据的预处理
由于钻井野外工作条件恶劣、信号的采集及传送过程动态随机干扰大,要提高建模数据的抗干扰性和参数估计精度,首先要对建模数据进行预处理。通过带时间戳的移动平均防脉冲干扰数字滤波算法和对数据进行归一化处理,消除因动态干扰和不同参数的量纲差异带来的影响[22-23]。 某井段部分数据经抗干扰处理后如表1所示。
表1 某井段分部分采样数据及可钻性值Table 1 Part of sample data and drillablity in some wells
4.2 仿真结果
根据相邻的8口井的井史数据进行预处理和特征值分析,取其中6口井的数据作为岩石可钻性估计模型的建模样本,其余2口井的数据作为岩石可钻性估计测试数据。建立的样本数据中,岩石类型主要有6种,分别为泥岩、砂岩、砂泥岩、泥砂岩、细砂岩和灰泥岩。
(1)基于Bayesian岩性分类的仿真结果中混淆矩阵如表2所示。其中,矩阵的每一列代表预测的岩石类型,而每一行代表实际的岩石类型。在主对角线上的数据则标志岩性的预测类型和实际类型一致的样本数量及预测正确的概率。
表2 基于Bayesian分类的岩性分类结果Table 2 Results of lithology classification using Bayesian classifier
表2中,分类样本为336,岩石分类总的正确率为98.5%,细砂岩的误判率为11.4%,其余5类岩石分类的误判率均为0。
(2)为了验证IDCQGA_BPNN模型,与其他方法实现的岩石可钻性估计结果进行比较[24-25],如表3所示。
其中,Kd_MR为多元回归模型、Kd_LSM为最小二乘法支持向量机、Kd_GM为灰色GM(0,N)模型、Kd_DE-SVM为差异进化的支持向量机DE-SVM模型、Kd_IDCQGA为IDCQGA_BPNN模型的实现泥岩的岩石可钻性的估计结果[21]。
表3 不同方法的岩石可钻性(Kd)估计性能比较Table 3 Performances comparison of estimating Kdby difference methods
由表3可以看出,采用IDCQGA_BPNN实现岩石可钻性估计的精确度和准确度明显较高,说明该方法建立的岩石可钻性估计模型具有较好的泛函能力。
(3)利用已建立的Bayesian多分支岩石可钻性值估计模型,根据钻井实际测量的参数实现未知地层岩性的分类和岩石可钻性估计,其结果如表4所示。其中误差是指岩石可钻性估计值与实际值之间的差值,而岩石的岩性和可钻性真实值采用井史中的值。
表4中,岩石类型判断的正确率达100%。岩石可钻性估计的相对误差为0%~4.5%。由可钻性的估计结果分析可知:可钻性估计值的精度与建模时样本数据的大小和相关性密切相关,样本数量越大(如岩石类型6),样本的相关性ROC趋近于1 (如岩石类型3),依据样本建立的模型完成参数估计的精度越高。当样本的数量少且相关性较弱时,参数估计精度就相对较差。
表4 岩石可钻性值估计结果Table 4 Estimation results of classification and drillability value
采用两层结构实现岩石可钻性估计,其仿真结果证明,该模型通过Bayesian岩性分类提高了可钻性估计速度,通过改进的双链量子遗传算法提高了参数估计的精度。本文中建立的模型具有较好的稳定性和泛化能力。
5 结 论
(1)基于Bayesian多分支岩石可钻性值估计模型,采用两层结构细化模型,通过Bayesian分类确定当前钻进地层岩性,提高第二层岩石可钻性估计样本的相关性。
(2)采用IDCQGA优化BPNN的网络结构,提高了模型的泛化能力及参数的估计精度和速度。
(3)本文中模型不仅收敛速度快、效率高,而且有效地满足了岩石可钻性估计实时性需求。
[1] 李玮.岩石可钻性的分形表示方法研究[D].大庆:大庆石油学院石油工程学院,2006. LI Wei.Research the method of fractal representation of rock drillability[D].Daqing:Petroleum Engineering College,Daqing Petroleum Institute,2006.
[2] HOSEINIE S H,AGHABABAEI H,POURRAHIMIAN Y. Development of a new classification system for assessing of rock mass drillability index(RDi)[J].International Journal of Rock Mechanics and Mining Sciences,2008 (4):1-10.
[3] HOSEINIE S H,ATAEI M,OSANLOO M.A new classification system for evaluating rock penetrability[J].International Journal of Rock Mechanics and Mining Sciences, 2009,IE:329-1340.
[4] 李士斌,李玮,由洪利,等.基于分形理论的岩石可钻性分级方法[J].天然气工业,2007,27(10):63-66. LI Shi-bin,LI Wei,YOU Hong-li,et al.Classification method of rock drillability based on fractal theory[J]. Natural Gas Industry,2007,27(10):63-66.
[5] 王培义,翟应虎,王克雄,等.分形理论及其在地层可钻性预测中的应用[J].石油钻采工艺,2005,27(6): 21-23. WANG Pei-yi,ZHAI Ying-hu,WANG Ke-xiong,et al. Fractal theory and its applications on rock drillability forecasting[J].Oil Drilling&Production Technology,2005, 27(6):21-23.
[6] 汤凤林,加里宁A Γ.岩心钻探学[M].武汉:中国地质大学出版社,2009:117-123.
[7] FUNAHSHI K I.On the approximation realization of continuous mappings by neutral networks[J].Neural Networks,1989(2):183-192.
[8] HORNI K,STRINCHCOMBER M,WHITER H.Multilayer feedforward networks are universal approximators [J].Neural Networks,1989(2):359-366.
[9] HORNI K.Approximation capabilities of multilayer feedforward neural networks[J].Neural Networks,1991 (4):551-557.
[10] FRIEDMAN N,GEIGER D.Bayesian network classifiers[J].Machine Learning,1997,29(2/3):131-163.
[11] MITCHELL T.Machine learning[M].New York:McGraw Hill,1997.
[12] GROSSMAN D,DOMINGOS P.Learning Bayesian network classifiers by maximizing conditional likelihood: proceedings of the 21st International Conference on Machine Learning,Banff,Canada,2004[R].Canada: ACM,2004:361-368.
[13] JING Y,PAVLOVIC V,REHG J.Boosted Bayesian network classifiers[J].Machine Learning,2008,73 (1):155-184.
[14] HECKERMAN D.A tutorial on learning with bayesian network,learning in graphical models[M].Cambridge, MA:MIT Press,1997.
[15] ROOS T,GRÜNWALD P,MYLLYMAKI P.On discriminative Bayesian network classifiers and logistic regression[J].Machine Learning,2005,59(3):267-296. [16] NG A Y,JORDAN M J.On discriminative vs.generative classifiers:a comparison of logistic regression and naive Bayes,advances in neural information processing systems[M].Cambridge,MA:MIT Press,2002:605-610.
[17] 黄捍东,赵迪,任敦占,等.基于贝叶斯理论的薄层反演方法[J].石油地球物理勘探,2011,46(6):919-924. HUANG Han-dong,ZHAO Di,REN Dun-zhan,et al. A thin bed inversion method based on Bayes theory[J]. Oil Geophysical Prospecting,2011,46(6):919-924.
[18] 赵弘,周瑞祥,林廷新,等.基于Levenberg-Marquardt算法的神经网络监督控制[J].西安交通大学学报, 2002,36(5):524-527. ZHAO Hong,ZHOU Rui-xiang,LIN Ting-xin,et al. Neural network supervised control based on Levenberg-Marquardt algorithm[J].Journal of Xiıan Jiaotong University,2002,36(5):524-527.
[19] 沙林秀,贺昱耀.一种变步长双链量子遗传算法[J].计算机工程与应用,2012,48(20):59-63. SHA Lin-xiu,HE Yu-yao.A variable step double chains quantum genetic algorithm[J].Computer Engineering and Applications,2012,48(20):59-63.
[20] 沙林秀,贺昱耀.基于斐波纳契数列的自适应DCQGA [J].计算机仿真,2012,29(10):273-278. SHA Lin-xiu,HE Yu-yao.Self-adaptive double-chain quantum genetic algorithm based on fibonacci sequence [J].Computer Simulation,2012,29(10):273-278.
[21] 沙林秀,张奇志,贺昱曜.基于SIDCQGA优化BPNN的岩石可钻性建模[J].西安石油大学学报:自然科学版,2013,28(2):92-97. SHA Lin-xiu,ZHANG Qi-zhi,HE Yu-yao.Modeling of rock drillability with BP neural network optimized by SDCQGA[J].Journal of Xiıan Shiyou University(Natural Science Edition),2013,28(2):92-97.
[22] 沙林秀.带时间戳的移动平均防脉冲干扰数字滤波算法[J].石油机械,2012,40(3):13-15. SHA Lin-xiu.The time stamped moving average antipulse interference digital filtering algorithm[J].China Petroleum Machinery,2012,40(3):13-15.
[23] 沙林秀.基于快速自适应量子遗传算法的钻井参数优化[J].石油机械,2013,41(2):32-36. SHA Lin-xiu.Fast self-adaptive QGA based optimization of drilling parameters[J].China Petroleum Machinery, 2013,41(2):32-36.
[24] 邢军.基于DE-SVM的岩层可钻性预测研究[J].东北大学学报:自然科学版,2010,31(9):1345-1348. XING Jun.On the DE-SVM based forecast of rock stratum drillability[J].Journal of Northeastern University (Natural Science),2010,31(9):1345-1348.
[25] 李俊萍,段隆臣,李谦.模糊综合评判法在岩石可钻性分级中的应用[J].地质科技情报,2012,31(1): 127-130. LI Jun-ping,DUAN Long-chen,LI Qian.Application of fuzzy comprehensive evaluation in classfication of rock ability[J].Geological Science and Technology Information,2012,31(1):127-130.
(编辑 李志芬)
Estimation of rock drillability based on a Bayesian multi-branch model
SHA Lin-xiu1,SHAO Xiao-hua2,ZHANG Qi-zhi1,LI Lin1
(1.Key Laboratory of Drilling Rigs Controlling Technique,Xiıan Shiyou University,Xiıan 710065,China; 2.The First Drilling Company,Daqing Drilling Corporation,Daqing 710072,China)
A two-level model was established for predicting rockıs drillability based on a Bayesian multi-branch model in order to improve the real-time calculating capability of the model and increase its generalization ability for intelligent optimization control.By using the Bayesian method for lithology classification,the correlations of different rock samples and their drillability can be refined,and consequently the rock drillability model can be improved.Using an optimized back-propagation neural network(BPNN)with an improved double-chain quantum genetic algorithm(IDCQGA),the new model of IDCQGA_BPNN can be modified according to the lithology type of rocks.The results show that this method can not only enhance the generalization ability of the model,which is optimized by an intelligent algorithm,but also can accelerate its calculation speed and improve its accuracy.The simulation results indicate that the model is satisfied for the use in real-time intelligent optimization control process for predicting the rock drillability while drilling.
rock drillability;Bayesian classifier;Levenberg-Marquardt algorithm;improved double-chain quantum genetic algorithm
TP 183
:A
1673-5005(2014)03-0073-07
10.3969/j.issn.1673-5005.2014.03.012
2013-06-25
陕西省自然科学基金项目(2012JQ8046);陕西省教育厅专项科研计划(11JK0933)
沙林秀(1978-),女,讲师,博士,主要从事智能钻井控制技术研究。E-mail:shalinxiu@xsyu.edu.cn。