APP下载

关于人工智能方法用于钻井机械钻速预测的探讨

2022-07-06石祥超王宇鸣刘越豪陈雁

石油钻采工艺 2022年1期
关键词:机械钻速单井钻井

石祥超 王宇鸣 刘越豪 陈雁

1. 油气藏地质及开发工程国家重点实验室·西南石油大学;2. 西南石油大学计算机科学学院

油气公司在科研、生产、管理、经营活动中积累了海量的结构化及非结构化数据,其数据总量仍在不断持续攀升,充分挖掘这些数据的价值是非常重要和十分迫切的,尤其是在低油价时期。据统计,非常规油气钻井作业产生的数据非常庞大,每英尺钻井产生的数据量就能达到1MB,每打一口井产生的数据量能达到1~15 TB,如何挖掘和利用钻完井大数据蕴含的价值,为钻完井提供优质方案,将是未来很长一段时间面临的科学技术问题。

随着钻井数据信息采集技术的迅速发展,钻井过程中产生的数据体量庞大,机器学习能够精准地对海量钻井数据进行分析,从中发现一定的规律,为高效率钻井提供结构化的信息和指导,目前许多新的机器学习方法都被应用于钻头优选、钻头性能评价、机械钻速的预测与优化、钻井过程中的事故预测与解决方法、钻井液的优选、综合系统的构建等方面。准确预测并优化机械钻速是缩短钻井周期、节省钻井成本的良好方法,将人工智能方法与钻井结合是目前的研究趋势[1]。笔者总结分析了人工智能方法预测机械钻速的研究进展,指出了目前研究存在的一些问题,主要针对相关性分析、数据选取及对训练和预测结果的影响开展了研究。

1 智能方法预测钻速技术发展

钻井机械钻速(ROP)预测是进行钻井优化、钻井投资测算等工作的重要技术内容,目前建立的传统机械钻速方程有几十种之多[2],但影响机械钻速的因素繁多,关系复杂,目前为止尚未建立令人信服、普遍适用的数学模型,而随着带有数据驱动特性的人工智能方法在工程领域的应用越来越广泛,使用人工智能算法预测机械钻速受到研究学者的广泛关注。Moran等[3]指出基于推测或假设出的机械钻速在未知区域估计钻井时间的传统方法可以被人工神经网络所取代;Soares等[4]揭示了传统机械钻速模型的局限性,包括Bourgoyne的机械钻速模型[5];Jahanbakhshi等[6]将影响机械钻速的不同钻井参数放入人工神经网络进行训练,得出预测结果最高的参数组合;Hegde等[7]使用了多种人工智能算法对机械钻速进行预测,表示人工智能算法的灵活性可以适用于常规井与非常规井的机械钻速预测。近年来众多专家学者基于人工智能算法预测机械钻速的研究见表1。

人工智能方法提供了预测机械钻速的新思路,但影响机械钻速的因素繁多,有些因素(如岩石强度、钻头磨损)不是很好获得,这些因素是否要作为输入参数放入模型,在已有文章中选取的输入参数是否忽略了某些重要变量也不得而知。为优化机械钻速,提高钻井效率,Graham等[22]分析了钻井效率与机械钻速的关系,表示机械钻速不等同于钻井效率,而应被视为影响钻井效率的几个因素之一;Hedge等[23]从单一的机械钻速优化模型,转为多目标的模型,将机械钻速、机械比能、扭矩3种因素交互评估,从而获得最佳的钻井方案。

以上调研文献中,大多数训练模型所用数据是基于单井或井段数据,人工智能模型很好地预测了机械钻速,且对数据采取K折交叉验证[15,19, 21]找到模型泛化能力最优的超参数组合,或是用其他方法直接优化超参数[8-9,14, 17]以提高预测精度。但若仅使用单井或少量数据训练模型,会使模型输入数据不具备代表性,因此模型无法向其他井或者整个区块进行推广,在预测其他井钻速时还需重新训练模型,不符合工程需要。

2 人工智能方法进行钻速预测的探讨

2.1 相关性分析

由表1可以看到,使用人工智能方法预测机械钻速选择的输入参数各不相同。研究表明[12,20]可以应用相关性分析找到对机械钻速影响最大的几个参数,并使用这些参数进行机械钻速的预测与优化。但在实际工程中所获得的钻井日志,可能并不会含有某些关键因素(如钻头磨损),在对这些钻井参数进行相关性分析过程中,可能会由于数据问题将一些相关性低的重要因素忽略掉。李谦等[24]分析了基于人工智能方法的钻速预测模型数据有效性下限,表明在引入足够的参数后,无论引入参数的相关性高低,都可取得较高的预测精度。笔者将原始钻井数据进行了相关性分析,发现有些相关性分析可能得出错误的结论。图1将某井的输入参数与机械钻速进行相关性分析,发现钻压、转速与钻速不是想象中的正相关。这是因为随着钻井深度的增加,井下的情况越来越复杂,虽然增加了钻压,但机械钻速仍然可能降低。图2选取了图1中某井二开井段数据做了相关性分析,可以看到全井的相关性分析与某井段的相关性分析结果差距较大。故使用相关性分析去寻找输入参数或是删除某些分析出来的相关性低的因素尚需讨论。

图2 某井二开井段机械钻速影响因素相关性分析Fig. 2 Correlation analysis of factors affecting penetration rate in the second section of a well

表1 近年人工智能预测机械钻速方法汇总Table 1 Summary of methos predicting penetration rate with artificial intelligence in recent years

2.2 训练数据选取

钻井会产生大量井数据,但在使用人工智能方法进行钻速预测与钻井优化时,许多调研的文献中仅仅只用一口井或是某一段钻井数据进行尝试。训练数据量的多少会影响人工智能方法预测的精度,从而影响对人工智能模型的选择。Korhan等[20]研究表明在训练数据有限的情况下,支持向量机可以更准确地预测机械钻速;Yavari等[25]研究表明在数据量较大时,自适应神经模糊推理系统更适合预测机械钻速。人工智能模型预测的准确度基于输入数据,将超出输入数据范围外的数据输入模型训练将会得到不确定的结果,使用单井数据或是某井段数据进行模型训练和训练是否具有良好的泛化能力值得讨论。

为了使预测模型具有泛化能力,Hedge等[26]将数据集按岩性拆分,基于不同岩性分别建立人工智能模型。该模型可以更加准确地预测对应岩性地层的机械钻速。笔者将区块数据与单井数据分别使用人工智能模型进行训练,扩大了输入数据的范围,使得模型在该地层更具泛用性。

笔者收集了四川盆地某开发区块的钻井数据,使用随机森林(RF)[27]、支持向量机(SVR)[28]、人工神经网络(ANN)[29]以及梯度提升树(GBDT)[30]等4种算法,分别对该开发区块的单井与区块的机械钻速进行预测,并且在已有钻井参数(钻压、转速、泵压、钻井液密度、黏度、排量)的基础上,引入地层参数(井深、岩性、声波时差、自然伽马)和钻头参数(钻头型号、开次)作为输入参数,对其中非结构化参数(钻头型号、岩性)进行编码,并与其他参数一样进行归一化处理。在下文所有机械钻速预测模型中,数据集将按照训练集80%、验证集20%的方式送入模型训练,并且采用可决系数R2作为模型精度的评价指标[19]。

2.2.1 单井数据训练和预测结果

4种人工智能算法对某单井数据进行机械钻速预测结果如图3所示,可以看出,随机森林与梯度提升树可决系数可以达到0.92,支持向量机和人工神经网络的可决系数分别为0.88,0.90。

图3 4种人工智能方法对某单井数据验证集的预测结果Fig. 3 Prediction results of the four artificial intelligence methods on single-well data validation set

2.2.2 区块多井数据训练和预测结果

使用4种人工智能算法对某区块进行机械钻速预测,区块数据包括在此区块的5口井,数据量为15317组。机械钻速预测结果如图4所示,可以看出,随机森林可决系数可以达到0.88,支持向量机、人工神经网络和梯度提升树的可决系数分别为0.86、0.74、0.85。结果表明,人工智能方法可以对单井或是区块的机械钻速进行良好的预测,且随机森林方法对于机械钻速的预测更为优秀。

图4 4种人工智能方法对区块数据验证集的预测结果Fig. 4 Prediction results of the four artificial intelligence methods on the block data validation set

2.2.3 单井模型与区块模型泛化能力对比

将训练好的单井与区块的随机森林模型分别保存,将新井数据输入后,对比二者模型的泛化能力。图5为使用单井数据训练出的随机森林模型预测该区块其他单井的结果,可决系数分别为0.16、0.13、0.13;图6为使用区块数据训练出的随机森林模型预测该区块其他单井的结果,可决系数分别为0.91、0.76、0.91。结果显示区块数据训练后的模型在此区块对新井数据具有更好的泛化能力。

图5 单井数据训练的随机森林模型对该区块其他井的预测结果Fig. 5 Prediction results of other wells in this block by the random forest model trained with single-well data

图6 区块数据训练的随机森林模型对该区块其他井的预测结果Fig. 6 Prediction results of other wells in the block by the random forest model trained with block data

3 结论

(1)人工智能方法在各个学科应用广泛,国内外使用人工智能方法预测机械钻速已取得良好的成效,但由于训练出的人工智能模型泛化能力低,该方法还未在工程上得到广泛应用。

(2)采用相关性分析方法分别对整个单井数据与该井二开数据进行相关性分析,发现参数之间的相关性在一口井内都有较大差异。故使用相关性分析去寻找输入参数或是删除某些相关性低的输入参数尚需讨论。

(3)将新井数据作为验证集,测试单井与区块数据训练后的随机森林模型泛化能力,得到区块数据训练的模型在此区块的泛用性远好于单井数据所训练的模型。这表明使用区块数据训练的模型具有较高的泛化能力,认为该模型能够推广至整个区块,有利于指导该区块的钻井工程技术优化。

猜你喜欢

机械钻速单井钻井
海洋石油钻井中的缺陷以及创新措施
自升式钻井平台Aker操作系统应用探讨
采油“一井一策”全员效益目标的构建与实施
单井成本核算分析
未来2年将有超过100座钻井平台报废
基于粒子群算法的钻进参数多目标优化
特高含水期油藏层系优化技术经济界限研究