APP下载

人工智能钻井技术研究方法及其实践

2021-11-12杨传书李昌盛孙旭东黄历铭张好林

石油钻探技术 2021年5期
关键词:钻井人工智能算法

杨传书,李昌盛,孙旭东,黄历铭,张好林

(中国石化石油工程技术研究院,北京102206)

近年来,新一代人工智能技术快速发展,在智慧安防、智慧金融、智慧零售等领域取得了良好的应用效果。因此,全社会掀起了“人工智能+”的研究热潮,石油行业也不例外,尽管一些报道称在某些场景取得了很好的应用结果,但总体来说,人工智能技术在石油行业的应用研究仍处在探索阶段,在钻井领域尚未取得工业应用的实质进展。从现有文献报道看,人工智能的应用场景很多,人工智能算法也很多,需要采用科学的方法加快人工智能应用技术研发。笔者从方法论入手,阐述了一条将人工智能技术应用到钻井领域的技术路径,并提出了钻井人工智能技术的发展建议。

1 钻井领域人工智能应用概况

人工智能(简称AI)是计算机科学的一个分支,是一门认知学科,它试图了解智能的实质,并生产出一种新的、能以人类智能相似的方式做出反应的智能机器。AI包括机器人、计算机视觉、自然语言处理、认知与推理、机器学习和博弈与伦理等6大方面[1],广泛应用于社交、医疗和商业等领域。支撑AI崛起的3大支柱条件是数据、算力和算法。

BP公司与IBM公司联合研发了下套管卡管智能预测系统,准确率达到了85%。沙特阿美公司利用决策树和k-邻近算法预测井涌,准确率达到了90%以上[2]。Oceanit和Shell公司合作研发了智能定向钻井系统,利用14口井的定向钻井数据进行强化学习训练,基于当前施工参数预测未来的压差和扭矩,误差分别为0.21%和2.72%,可以实现高效定向钻进[3]。Aramco公司利用人工智能方法计算基于时间的钻井液安全密度窗口,计算速度与传统的物理解析算法相比大幅提高[4]。管志川等人[5]采用神经网络方法,研究了钻井过程中的井下复杂情况,并对漏、涌、卡等风险进行识别和预测。殷志明等人[6]采用机器学习的方式研究了钻速预测过程中的离群点问题,提出了一种融合离群点的检测算法。Yin Qishuai等人[7]利用大数据挖掘技术研究实时录井数据、识别钻井状态,分析了钻井非生产时间,形成了提高钻井效率的方案。

近年来,国外油公司或油服公司纷纷与人工智能研究机构进行联合,加快了油气领域人工智能应用的研究;同时,各大公司认识到数据共享平台及开放性人工智能创新环境的重要性,斯伦贝谢公司推出的DELFI云平台和哈里伯顿公司推出的DecisionSpace®365云平台,都是具备全业务链数据管理、大数据及支撑人工智能研究的开放式云平台。国内中国石油集团发布了“梦想云”,包括云平台、数据湖、数据中台、应用商店和人工智能应用等关键技术,为加快包括钻井在内的油气人工智能技术研究奠定了基础[8]。中国石化也着手打造石化智云平台,并开展了智能油气田试点建设,但支撑钻井大数据及人工智能研究的基础仍然薄弱。

2 钻井领域AI技术方法论

工业界AI不同于人机博弈和商业营销,仅仅靠简单的数据驱动是行不通的,必须从实际问题出发,用领域知识来约束人工智能建模[9]。钻井是一项复杂的工程,必须找到合适的场景、合适的数据,并将行业知识与AI算法相融合,才能将AI技术真正应用于钻井领域。

2.1 AI建模基础

大数据是AI的基石,进行AI建模,必须确保有可用的数据。可用的数据应包含3大特征:数据量要大,只有原始数据量大,才有可能构建足够多的训练样本;数据要准确,利用错误数据和假数据无法构建正确的关联关系;数据维度全面,即数据项必须涵盖应用场景所需的主要特征量。

钻井领域的AI技术不仅依赖于各类工程数据,还依赖于井下环境数据,即岩石与地层特征数据。工程类数据包括井眼轨迹、井身结构、钻具组合、钻头、钻井液体系、钻井液性能、实时综合录井(包括工程参数、钻井液参数、气测参数)、岩屑录井、测井、故障复杂情况记录和钻时等数据,上述部分数据为时间序列,部分为深度序列,部分兼而有之,不同场合都可以用。此外,还包括一些计算数据,如环空压力、摩阻扭矩、机械比能等。岩石与地层特征数据包括岩石力学参数、岩石产状、岩石物理性质、地层三压力和地层岩性等,这些参数大多是基于测录井数据计算或解释,进而通过试验或实测校验得到的,而测录井数据的解释可以利用AI技术。

2.2 AI模型应用场景

李杰等人[10]提出,需要从以下3个方向开展智能制造系统研究:1)在解决可见问题的过程中积累经验和知识,从而规避这些问题;2)需要根据数据去分析产生问题的隐性线索、关联性和根本原因,将不可见问题显性化,进而解决不可见问题;3)通过深度挖掘知识,建立知识和问题之间的相关性,从旧知识中产生新知识,并利用新知识精确建模,从设计层面避免可见和不可见问题的发生。参考这一思路,结合钻井领域的业务特点,大致可以梳理出钻井领域AI应用场景(见表1)。

表1 钻井领域AI应用场景及解决的问题Table1 AI application scenarios and problemsto be solved in drilling engineering

2.3 AI建模的支撑技术

2.3.1 大数据支撑平台

机器学习是基于数据的科学方法,因此首先要把各类数据、海量数据组织起来,并转换成AI算法可直接调用的数据集,常规数据管理系统无法完成这一工作。大数据支撑平台主要实现的功能包括:异构数据存储、数据预处理、数据聚合、数据过滤、数据变换、特征提取、特征衍生、特征降维、样本标记和数据服务等。由于涉及异构数据,数据体量大,必须使用ETL数据提取工具、Hadoop分布式存储与计算工具、Spark大数据计算引擎等流行工具。

2.3.2 AI建模算法及工具库

成熟的AI算法非常多,且还在不断研发出新的AI算法。表2列举了钻井程领域可能用到的算法及其适用场景[11-12]。

表2 常用AI算法及其适用场景Table 2 Common AI algorithms and their applicable scenarios

我国在AI基础方面的研究比较薄弱,尚未形成可用的算法平台。目前,国内研究人员主要使用国外开源的算法库(已经把一些算法进行了程序封装,可直接调用),包括TensorFlow、Apache System ML、Caff e、Apache Mahout、Open NN、Py Torch、Neuroph、Deeplearning4j、Mycroft、OpenCog等,每个算法库都有其优缺点,需要甄别选用或组合使用[13]。

2.4 “三轮驱动”方法论

钻井领域AI项目成功的关键在于3个条件:有实际需求的业务场景、有满足条件的数据、有适用的技术工具(即AI工具)。业务、数据、技术三者欠缺任何一项,都不可能获得理想的结果,好比三轮车的3个轮子,任何1个轮子有缺陷,都影响行车速度和平稳性。确立AI项目时应遵循“三轮驱动”方法(见图1),优先选择三者交集中心区的项目。

实际研究工作中,分别从业务、数据、技术3个方面进行现状梳理,针对每种组合情形,分别归入图1的7个区:0区代表三者兼备,具备开展AI建模的条件,可启动应用研究工作;1区、2区和3区代表具备了其中2项条件,可进一步探索另一条件的可行性,比如搜集必须的数据、挖掘业务需求,或者寻找适合的AI方法,这些情形可通过努力逐渐向0区过渡;4区、5区和6区是极不成熟的情形,建议暂时放弃。

图1 “三轮驱动”方法论Fig.1"Three-wheel drive"methodology

对于0区的情形,还可对每个条件进行评估:业务场景方面,可从需求迫切程度、预期应用广度、潜在社会经济效益等方面进行量化评价;数据基础方面,可从数据完整性、数据量、准确率、可标记率等维度进行量化评价;技术工具方面,可从算法丰富程度、算法在其他行业应用成熟度、样本需求量、可迁移性、算法工具获取难易程度等角度进行量化评价。最终从中选出三者均为高分的项目开展研究,并快速应用研究成果。

3 钻井领域AI技术应用实践

3.1 项目优选

以表1所列的业务场景为纲,以“三轮驱动”方法为指导,根据笔者所在团队的技术现状,分别从3个方面进行评估,开展了项目优选,限于篇幅,表3仅列出了部分项目的评估情况(业务需求已在表1阐述,此处不再赘述)。

由表3可知,模型训练主要使用历史数据,而模型应用必须使用实际数据作为入口参数,模型训练和实际应用场景下的数据满足程度可能有差异,某些情况下即便模型可以训练出来,实际场景应用时也存在很大难度,比如随钻机械钻速的预测和监测。

表3 钻井领域AI技术部分应用项目评价Table 3 Project evaluation (example)of AI application in drilling engineering

3.2 实践案例

钻井领域亟待解决且适合应用人工智能技术的问题,包括地层特征识别、钻井参数优化、井眼轨道优化、井下故障诊断预警等。下面以钻井井下风险实时识别为例,简要阐述人工智能建模及试验验证情况。

3.2.1 数据提取与预处理

从实时分析数据集和复杂情况案例知识库中自动提取钻井复杂情况样本,包括复杂情况类型、发生时间、井深和录井参数等。由于录井实时数据存在空值、异常、重复、噪声等情况,如不处理将对模型产生影响,因此对数据进行预处理,选取多种数据处理方法,开发数据提取和预处理模块。以钻井实时数据为例,最常见的问题是数据项值缺失和数据项值异常(如超出正常值范围)、数据记录重复,对于这些异常,一般采取数据项整列删除、数据记录整条删除、利用本列均值替换等方式进行处理,通过开发数据预处理模块,预先设置每种异常的处理方式,软件即可自动批量处理数据,得到正常可用的数据;亦可在随钻过程中对动态采集的数据进行实时处理,以满足实时智能预测的应用需求。

3.2.2 业务标签

基于业务专家理论及油田历史井实钻经验,按照正常作业、故障征兆、故障发生等作业状态,对实钻录井时间域原始数据划分时间段,如以3 min为时间窗格,通过专家分析对井漏前、井漏时和井漏后的录井数据打标签,分别定义为非井漏样本、井漏样本和非井漏样本(见图2)。

图2 专家业务标签逻辑Fig.2 Expert businesstag logic

3.2.3 特征选取

根据数据相关性分析结果,确定不同钻井复杂情况的特征参数。以井漏为例,提取参数(入口流量、出口流量、钻井液池内钻井液体积、立管压力等)的绝对值、变化率、偏度、峰度和相关性等特征量,找到井漏与非井漏样本之间数据变化的差异性,利用斯皮尔曼相关性分析方法分析特征参数与井漏的相关性,形成训练井漏识别模型特征参数的选取逻辑(见图3),最终确定9个特征参数,即工况、入口流量、出口流量、计量罐内钻井液体积变化、钻井液体积变化、立管压力、立管压力变化率、套管压力和套管压力变化率。

图3 井漏特征选取逻辑Fig.3 Lost circulation featureselection logic

以卡钻为例进行分析。卡钻发生前大钩载荷、立压、扭矩及转速等参数异常波动,大量卡钻实例分析结果表明,卡钻发生时参数呈现随时间变化的规律,因此引入了平均值和峰值作为新的特征参数。由于每个参数都存在正常的波动,相邻2组数据(一般相隔5~10 s)的变化不能准确体现参数真正的变化趋势,于是将数据按连续时间窗划分为处理单元,最终确定了14个特征参数(每3 min一个数据窗格作为计算单元):工况、大钩载荷、过去30 min大钩载荷的平均值、大钩载荷变化率峰值、立压、过去30 min立压的平均值、立压变化率峰值、扭矩、过去30 min扭矩的平均值、扭矩变化率峰值、钻压、入口流量和转速。

3.2.4 算法选取与模型构建

根据复杂情况的特征参数,将钻井复杂情况识别问题处理为二分类问题,即井漏和非井漏、溢流和非溢流、卡钻和非卡钻。大数据分类算法丰富,典型算法包括决策树、随机森林和支持向量机等,目前应用较多的是以决策树为基础的集成算法,XGBoost是应用效果较好的一种集成算法。XGBoost算法由GBDT(梯度提升迭代决策树)改进而来,是由多个基学习器共同构成的整体模型,既可以用于分类问题,也可以用于回归问题。依据混淆矩阵,利用XGBoost算法进行推算,验证模型的准确率和召回率,通过反复调整模型的框架参数(比如调整最大迭代次数n、迭代步长l等),逐步得到最优模型。

钻井井下故障智能识别建模过程中,首先提取80%的案例数据集加载到算法中进行训练,用剩余的20%案例数据集进行验证;然后局部更换数据集中的案例,重复上述过程,通过验证识别结果与实际案例的吻合度,促进模型通过学习提高准确率。以某地区57口井的114个井下故障案例作为基本数据样本集,附加100个正常钻进的数据样本,共同构建了模型训练样本集。研究发现,基于XGBoost算法训练的模型,井漏识别准确率80%,溢流识别准确率82.7%,卡钻识别准确率71.2%,识别准确率和计算速度与经典GBDT相比明显提高。此外,该结果也比笔者此前基于传统方法建模的识别准确率有所提高,今后随着案例样本不断积累和增加,该模型识别井下故障的准确率会进一步提高。

4 存在的问题与发展建议

4.1 存在的问题

1)钻井领域AI应用场景很多,但国内石油企业“数据孤岛”问题较严重,而且钻井历史数据的标准化、完整性、正确性欠缺,数据的自动化采集程度较低(数据频度、准确性和时效性不足),较难构建出针对每个应用场景的高质量训练样本。

2)大数据及人工智能应用研究离不开大数据相关技术的支撑,传统技术手段难以支撑海量数据的抽取、处理、转换、服务,而针对钻井工程大数据的支撑平台刚刚起步。

4.2 发展建议

1)建立集团级数据共享中心,加快数据治理,打破油田分公司之间、专业板块之间的信息壁垒,提高数据质量,将科研单位的研发能力同生产单位的数据优势结合起来,共同促成企业数字转型和钻井的智能化。

2)借鉴国外经验,同知名的AI专业研究机构合作,首先构建一体化大数据及人工智能研究支撑平台,针对钻速预测及参数优化、井眼轨道优化、地层特征识别等场景,优选或自研人工智能算法,选择复杂疑难的钻井工区,加强工程特征研究及模型验证,注重现场的可实施性。

3)进行井场设备的数字化升级换代,大幅提高现场数据的自动化采集程度,为钻井AI技术发展积累高质量的“原材料”,促进钻井技术自动化、智能化的快速发展。

5 结束语

随着人工智能算法的不断丰富和钻井领域数据的积累,人工智能方法将为钻井技术提供新的途径和重要补充,特别是在利用传统试验方法难以构建准确物理模型的场景,人工智能技术将大有作为。在大数据及人工智能技术的推动下,钻井工程正在经历一场数字化转型革命。钻井人工智能应用场景很多,每个场景所需要的基础条件和算法各不相同,“三轮驱动”的方法论可在一定程度上帮助研究者走出“无从下手”的困境,能够快速评估优选出应用人工智能技术的场景,按照规范的步骤构建人工智能模型,并进行现场试验,从而促进钻井技术的升级转型。

猜你喜欢

钻井人工智能算法
海洋石油钻井中的缺陷以及创新措施
自升式钻井平台Aker操作系统应用探讨
Travellng thg World Full—time for Rree
扫描“蓝鲸”——观察海上钻井平台
2019:人工智能
进位加法的两种算法
人工智能与就业
数读人工智能
下一幕,人工智能!
一种改进的整周模糊度去相关算法