智能物探技术的过去、现在与未来

2024-03-16杨午阳魏新建李海山

岩性油气藏 2024年2期

杨午阳，魏新建，李海山

（中国石油勘探开发研究院西北分院，兰州 730020）

0 引言

人工智能（Artificial Intelligence，AI）这一概念首次被提出并被进行系统科学的思考，当属英国数学家阿兰·图灵在1950 年发表的《Computing Machinery and Intelligence》一书中提到：“我提议大家考虑一下‘机器能思考’的问题”。随后，在1956 年的达特茅斯学院召开的学术会议上，人工智能被正式定义为一个研究领域［1］。在工业化、信息化、科技化的今天，人类需要用智能机器去扩展和延伸自身的能力，解放体力和脑力劳动，实现人类社会的全面自动化和智能化。人工智能技术正以试图解开人类智能的本质为目标，已研发出了一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人［2-6］、自然语言处理［7-10］、计算机视觉［11-13］、图像处理［14-15］、语音识别［16-17］等。

人工智能已经成为新一轮科技革命和产业变革的核心驱动力，世界各国纷纷抢滩布局，成为彰显创新实力的必争之地。2018 年5月28日，习近平总书记在两院院士大会上指出，“要推进互联网、大数据、人工智能和实体经济深度融合，要以智能制造为主攻方向推动产业技术变革和优化升级”。在物探领域，人工智能的研究与应用是物探技术升级转型的标志，也是未来物探技术发展的标志性技术。全球各大油公司、油服公司为赢得市场竞争，抢占技术先机，纷纷开展智能化物探技术研发。近日壳牌宣布和微软扩大合作，在石油行业大规模推广人工智能，与此同时，人工智能在油气领域内的应用日益广泛，智慧油田、智慧炼厂、智慧管道、智能物探、智能测井和智能钻完井等新事物层出不穷。

通过对人工智能技术及其在地球物理勘探领域的发展历程、发展现状以及发展方向的综述，指出当前智能化物探技术发展需要解决的一些关键问题，并给出推动智能化物探技术健康发展的建议，以期为推动智能化物探技术的健康发展提供参考。

1 智能物探的发展

人工智能已经成为一个当前最活跃的具有众多实际应用场景的研究领域，并且还在蓬勃发展。深度学习（deep learning，简称DL）作为一种特定类型的机器学习，具有强大的能力和灵活性，可以将大千世界表示为嵌套的层次概念体系，由比较简单概念间的联系定义复杂概念，从一般抽象概括到高级抽象表示，是通向人工智能的有效途径之一。早期的人工智能，通常依靠对规则硬编码方式来实现，这其实是一个笨拙的过程，仅仅适合于解决明确的逻辑性问题。依靠硬编码的知识体系面临的诸多难题表明，人工智能系统必须具备自己获取知识的能力，这就是目前机器学习和深度学习应用的核心思想——“用数据编程”。

近几年来，依靠大数据集、强大的硬件算力以及卷积神经网络（CNN）、循环神经网络（RNN）、深度神经网络（DNN）等架构思想，深度学习已逐渐成为图像处理、语音识别、文本语料、地震数据等复杂高维度数据的主要分析方法。与日俱增的数据量、网络模型规模以及日渐提升的模型精度和复杂度对现实世界的冲击，优秀的容量控制方法、注意力机制、记忆网络和神经编码器、生成对抗网络（GAN）、具有强大计算能力的GPU 和并行计算能力以及深度学习框架等，是近十年来深度学习长足发展的主要原因。深度学习的另一个最大的进展就是其在强化学习（reinforcement learning）领域的扩展。

将人工智能领域的优秀研究成果与地球物理勘探（物探）领域知识相结合，促生了一门新型的研究领域——智能物探。杨午阳等［1］将以物探海量数据为基础，以强大的地震资料处理、解释能力提升为手段，以人工智能算法为突破关键，全面融合各类油气信息资源，进行数据挖掘、知识发现与共享，最终实现地震资料处理、解释等环节启发式自动化的科学决策过程称之为智能物探。下面从机器学习到深度学习、典型的深度学习框架、深度学习解决问题的基本思路、基于神经网络的早期应用和基于深度学习的应用等5 个方面分析智能物探的发展。

1.1 从机器学习到深度学习

智能物探的发展与人工智能技术的发展密切相关，人工智能技术经历了3 次较大的浪潮（图1），在第二次浪潮中开始与物探领域结合。

图1 人工智能技术发展历程（据文献［5］修改）Fig.1 Development history of artificial intelligence technology

1956 年的达特茅斯会议上，计算机科学家约翰·麦卡锡说服与会者接受“人工智能”一词作为本领域的名称，后来这次会议被看作是人工智能正式诞生的标志。这次会议后的十几年内，计算机被用来解决代数应用问题、证明几何定理、学习和使用英语等。然而，此时的人工智能技术只是具备了逻辑推理能力，还远远达不到智能化的水平，同时由于固定算法的人工智能功能局限，一旦处理事务太复杂，计算量庞大，将成为不可完成的任务，人工智能的研究遭遇到了种种质疑，发展也进入了第一个冬天。

20 世纪70 年代，随着“专家系统”的流行，人工智能迎来第二轮蓬勃发展。“专家系统”是一种针对某个特定专业领域的问题进行回答或解决的计算机程序，运用专家掌握的行业专业知识建立的逻辑规则来解决问题。用于计算机深度学习的人工神经网络在20 世纪80 年代就已经被提出，但由于其缺乏理论支撑，且计算力有限，并没有得到相应的重视。然而，得益于机器学习和神经网络的发展，在石油领域却迎来了智能化探索的第一个高潮。专家们在地震资料处理、解释等方面进行了各种尝试，但是随着20 世纪80 年代PC 的出现，人工智能的寒冬再次降临。

20 世纪90 年代末，随着计算机技术的飞速发展，摩尔定律为人工智能的发展带来了新的可能性。当飞速提升的计算能力被应用到了人工智能的研究后，显著提升了人工智能的研究效果。随后，人工智能迎来了第三个春天。

2006 年Hinton 等提出的深度置信网络开启了人工智能的深度学习时代［18］。此后，人工智能技术在各行业不断取得突破。如在自然语言处理、计算机视觉、自动驾驶、图像识别、自动机器人、医学等领域取得了显著进展。2016 年Google 的AlphaGo［19］战胜人类棋标志着人工智能概念得到普及，美国和中国先后宣布以人工智能技术为基础的国家科技发展规划，将人工智能研究提升到国家战略层面。2016 年之后，基于深度学习的智能化物探技术逐渐发展起来，发表文章的数量呈现出爆发式的增长。当前，人工智能正处于第三次发展浪潮中，是一门重点研究开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的新技术科学。作为对人的意识、思维、推理等信息过程的模拟，人工智能通常可分为3 类：一是弱人工智能，包含基础的、特定场景下角色型的任务；二是通用人工智能，涉及机器的持续学习能力；三是强人工智能，主要指超越人类智慧的机器智能。人工智能在模拟形式上主要有行为学派的机器人、联结学派的神经网络和符号学派的知识表示等，而推进人工智能浪潮的是基于联结学派的神经网络算法［20-26］，其以智能行为的生理模型为依据，通过模拟大脑的生理结构，采用数值计算的方法，模拟脑神经网络的工作过程，实现学习、记忆、联想、感知、识别、判断等能力。

人工智能的核心技术是机器学习。传统机器学习从有限的观测样本出发，试图发现原理分析不能获得的规律，实现对未来数据行为或趋势等的准确预测。根据学习方法可将机器学习分为传统机器学习和深度学习［26］，主要算法有神经网络［20-26］、逻辑回归［27-30］、隐马尔科夫链［31-32］、支持向量机［33-37］、K近邻方法［38］、AdaBoost［39-40］、贝叶斯方法［41-42］、决策树［43］、随机森林［44-45］等。传统机器学习平衡了学习结果的有效性与学习模型的可解释性，为解决有限样本的学习问题提供了一种框架，主要用于有限样本情况下的模式分类、回归分析、概率密度估计等。深度学习是基于多层神经网络，将特征学习和表示融合，经过多种层的组合，实现对任意复杂数学函数的高度逼近拟合，可以有效学习客观样本中所蕴含的空间分布和时间分布特征等内在特征。典型的深度学习算法有深度置信网络［26］、CNN［46-47］、RNN［48-49］和生成对抗网络［50］等。人工智能研究是物探技术升级转型的关键，目前全球各大油气公司、油服公司为赢得市场竞争，抢占先机，纷纷布局智能化技术研发，学术界也广泛关注智能物探技术，从近几年人工智能专题论文在物探行业SEG、EAGE 等国际会议论文中的占比就可见一斑。2017年人工智能专题在SEG 会议论文中占比2.7%，2018年上升至10.0%，2019 年达13.0%。

各种机器学习算法预测能力强，但存在描述能力不足的缺点。2012 年Google 正式提出了知识图谱的概念，其最大的优势就是对数据的描述能力非常强大，正好弥补了机器学习的不足。随着人工智能的技术发展和应用，知识图谱作为关键技术之一，已被广泛应用于智能搜索、智能问答、个性化推荐、内容分发等领域。未来，借助知识图谱的表示形式，利用图神经网络进行知识的推断或推理，实现人工智能技术从感知到认知的跨越，将是一个很有前景的研究方向。在油气领域，如能够将知识图谱和专家领域知识相结合，必将为勘探决策、风险评估提供有效的解决方案。

1.2 典型的深度学习框架

深度学习框架是为深度学习而准备的，在传播深度学习思想过程中扮演着十分重要的角色，与大数据和算力并称为深度学习技术发展的三驾马车。深度学习技术的发展很大程度上依赖于深度学习框架的发展。从目前来看，深度学习框架至少已经发展了三代。

在早期，人们需要具备C++和CUDA 等专业知识来实现深度学习算法，而深度学习框架通过利用GPU 加速过的运算替代与NumPy 类似的运算以及构建深度神经网络，抽象出了许多底层的复杂度，也屏蔽了底层的细节，极大地降低了深度学习建模的难度和入门门槛，使得那些具有脚本语言知识（如Python 等）的人也可以构建和使用深度学习算法。如今，随着诸多公司将深度学习框架开源，也让更多的行业应用者可以将精力集中于模型结构、应用场景的设计以及应用算法的开发方面。

TensorFlow 和PyTorch 是目前最流行的2 种开源框架，TensorFlow主要提供静态图构建的功能，通常具有较高的运算性能，常应用于人工智能企业的模型部署，但是模型的调试分析成本较高；PyTorch主要提供动态图计算功能，API 接近于Python 原生语法，易用性较好，构架复杂架构模型时具有更高的灵活性，因此在学术界被大量使用，目前这2 种框架正在吸收各自的优点。此外，主流深度学习开源框架还有Caffe，MXNet，Theano，CNTK，Deeplearning4j 和PaddlePadle 等，都支持多种开发语言和操作系统（表1）。近期针对大模型，也产生了一些框架，不再赘述。

表1 主流深度学习开源框架Table 1 Mainstream deep learning open source framework

1.3 深度学习解决问题的基本思路

深度学习可以完成多种类型的任务，常见的有分类、输入缺失分类、回归、去噪、机器翻译和异常检测等。从现有文献来看，深度学习的应用最早见于图像识别，这可以追溯到2012 年，据ImageNet 评测结果DNN 技术在图像识别中将错误率从26%降低到了15%。除了图像识别，深度学习在计算机视觉、语音识别、自然语言处理、音频处理、搜索引擎、地球物理以及医学等领域都取得了很出色的表现。

从理论上讲，将深度学习相关技术应用于解决实际问题，通常包含问题描述、模型和架构选择、问题的定义和构建数据管道、以模型评估为核心的模型建立、模型测试以及预测等关键环节。然而，在实际工作中，可以将问题描述、评估、特征工程和避免过拟合等结合起来，形成一个可用于解决任何机器学习问题的解决方案框架。这样，一个完整的深度学习项目（任务）通常只需要包含构建数据管道、构建网络架构、使用损失函数评估模型、使用优化算法优化网络架构的权重等关键环节。

1.4 基于神经网络的早期应用

将神经网络应用于物探领域的研究可以追溯到20 世纪90 年代，根据Poulton［51］的研究，在1994年之前，神经网络的应用主要是用模型数据训练神经网络模型，并将其用于实际数据测试和应用，而1995 年以后，则集中在一些特定的应用领域，例如储层表征等。整体而言，神经网络在物探领域的应用场景较多，如地震资料处理领域的初至拾取、静校正，解释领域的参数估计及油气检测等。

在地震资料处理方面，Murat 等［52］首次将神经网络用于地震初至拾取，利用地震道半周期的4 种振幅属性，通过神经网络拾取地震初至；Mccormack等［53］提出将反向传播神经网络用于地震初至拾取和地震道编辑，改进了反向传播神经网络，提高了网络训练的收敛速度，通过交互的人机训练方式，使得训练后的神经网络模型具备“专家系统”的能力，可用于新数据的预测和处理；Röth 等［54］试验了神经网络在地震反演中的应用，通过合成的单炮数据空间和速度空间的映射，实现了对网络模型的训练，训练后的模型预测的速度模型精度有限，可用于反演的初始模型；Chu 等［55］将模糊逻辑系统用于地震波初至拾取，将初至拾取归类为模式识别问题，将地震属性和距离相关的横向变化作为分段线性引导函数的输入，实现对地震的初至拾取，在同样的预测精度下，该方法的训练效率比神经网络高；Dai 等［56-57］将神经网络在地震初至拾取中的应用扩展到三分量地震记录，将X分量、Y分量、Z分量地震数据作为神经网络模型输入，提高了网络模型预测精度，有效识别地震初至；Wang 等［58］将Hopfield 神经网络用于误差反褶积和震源子波估计预测，通过神经网络的目标函数实现自适应最小化预测，将震源子波估计和误差反褶积分别处理，实现全部的反褶积和子波估计；Calderón-Macas 等［59］提出沿着2D 测线将控制点处的CMP 道集用前馈神经网络映射到地震速度空间，在网络训练过程中用快速模拟退火法实现网络参数更新，从而实现每个控制点的CMP 道集的自动NMO 校正。

在地震解释方面，Huang 等［60］提出利用神经网络的Hopfield 模型进行地震“甜点”识别；Poulton等［61］利用神经网络进行地下目标体的定位。陆文凯等［62-64］用神经网络自适应地外推测井资料，将神经网络与地震反演有机地结合起来，从而实现地震反演；Calderon-Macias 等［65］将神经网络用于地球物理参数估计，将垂直电测深中获得的地层电阻率和层厚度（VES）数据与从地震波形数据获得一维速度模型的数据用于预先设定的参数范围随机初始化，实现对网络模型的训练和地球物理参数的预测；朱广生等［66］利用多层感知器进行油气储层横向预测以及地震道自动编辑；Fitzgerald 等［67］研究了利用人工神经网络基于常规测井记录进行裂缝频率预测技术，将中子孔隙度、体密度、纵波、横波、电阻率等作为ANN 网络的输入参数，可用来评估测井中与裂缝有关的非均质性的信号强度以及井孔内的裂缝频率，从而实现裂缝区域的横向相关预测；Boadu［68］利用等效的不连续性裂缝模型生成的输入与输出进行神经网络训练，联合纵、横波速度进行裂缝密度反演；Alimonti 等［69］将人工神经网络、统计学和模糊逻辑等技术相结合，对单井多相流展开诊断分析和测量；William 等［70］运用常规统计分析技术和神经网络技术，构建了能对单井化学吸收率预测的模型，实现对二次采注比的预测。Maiti 等［71］提出一种基于超自适应反向传播概念的新方法用于训练神经网络模型，开发了神经网络根据测井数据对岩相边界进行分类的技术；Baronian 等［72］利用正演模拟技术合成模型数据集，制作了精确的输入和输出之间的准确映射关系，用于ANN 网络训练，这样训练后的ANN 网络模型泛化能力较强，可用于未知地区的地震速度信息分析和地层倾角预测；Maiti等［73］创新地将Bayesian 框架和神经网络结合，提出了一种基于贝叶斯神经网络（BNN）学习理论的新概率方法，用于从测井数据中解码岩相边界；Baddari 等［74］使用人工神经网络进行地震数据反演，所得结果清楚地证明了其提出的反馈神经网络地震数据反演方法的可行性；杨午阳等［75］提出了一种基于叠前AVA 同步反演的储层物性参数预测方法，在综合考虑岩石密度，纵、横波速度等弹性参数与孔隙度等物性参数的空间关系基础上，采用Kohenon自组织神经网络对储层参数进行分类，采用MLP 多层感知器对储层物性参数进行定量预测。

神经网络技术可以将数据转化为信息，找到地球物理数据和岩石物理特性之间的重要相关性，如将小波形态的细微变化与岩性的小尺度变化联系起来，并找到小波中的特征，进行断点识别、层位追踪、识别气体烟囱或识别断层，但神经网络还无法在更低成本、更高效率和更少人员投入情况下从大数据流中发现相关信息方面发挥越来越重要的作用。

1.5 基于深度学习的应用

自2016 年以来，人工智能技术与物探技术的结合日益紧密，全球大型石油公司都在加快推进数字化转型。2017 年7 月到2020 年12 月，中国石油勘探与生产分公司已组织召开了四届“智能化”专题技术研讨会，以推动发展新一代智能化地震信息处理技术；埃森哲于2017 年对石油行业高管进行的一项调查发现，70%的受访者将加大对数字技术的投资，“数据就是新石油”的说法已成为老生常谈；Geophysical Insights 公司在2017 年SEG 年会上打出了“机器学习”的宣传主题，其主要产品是Paradise 多属性分析软件包，将地震多属性分析机器学习技术应用于薄层解释、直接烃类指示（DHI）等方面；2018 年2 月油服巨头BHGE 携手NVIDIA 进军石油人工智能；2018 年4 月，道达尔宣布和谷歌云签署协议，将联合发展人工智能技术，为石油勘探开发提供全新智能解决方案；2020 年4 月15 日，中国石油集团公司会议报告强调“数字化技术催生了企业发展的新业态、新模式，已成为全球经济发展的重要驱动力和经济高质量发展的重要引擎”。

目前，智能物探技术主要应用于地震数据处理（如地震波初至拾取、微地震事件识别、去噪、地震速度分析、地震初始速度模型建立甚至反演成像等）与综合解释（如地震属性分析、断层识别、岩相识别、沉积相划分、盐丘边界拾取等）、测井资料处理与解释、重磁电非地震资料处理与解释、井孔与岩石物理数据分析、微地震资料处理与解释、油藏表征与开发数据分析等方面。其核心是“应用地球物理+AI”，通过将传统物探技术与AI 技术融合，发挥专家领域知识与AI 两者优势，突破传统物探技术的瓶颈，挖掘物探数据内在的、深层的、传统技术无法发现的联系，提升处理、解释结果的科学性。其优势体现在3 个方面：一是模糊逻辑技术能够基于“不完备”和“不完美”的数据进行有效预测；二是深度学习技术分析基础是大数据，通过对海量地震数据的实时提取，实现数据挖掘和多元信息融合利用，盘活了大量不活跃的“黑暗”数据，可以更精细、全面地描述地下储层展布规律；三是减少了人工参与度，降低了处理解释过程中的时间成本和人力成本。

近期研究表明，“应用地球物理+AI”的赋能策略［1］，在费时费力环节（如初至拾取、速度拾取、层位解释等）以及助力打破传统物探技术瓶颈、攻克应用难题方面具有重要意义。

2 主要研究进展

2.1 标签数据集建立

人工智能技术在计算机视觉、自然语言处理、语音识别等领域被广泛应用，得益于相关领域已构建的完备数据集，这些数据集规模大、类型全、检索方便，正是由于ImageNet 等数据集（表2）的出现，才推动了智能化技术的飞速发展。

表2 典型深度学习数据集Table 2 Typical deep learning dataset

构建油气领域标签数据集是突破智能物探应用瓶颈的关键，然而，准确、快速构建标签数据集合难度很大。总的来说，目前主要是通过数模合成数据方案、物理模拟合成数据方案以及实际数据专家标注方案来构建标签数据集。这3种方案各有优缺点，还需要结合应用场景来进行选择，当样本数量不足时，还可以通过对样本进行处理的数据增广方案等，但利用合成方法制作的标签数据集仅适用于间断性如断层、连续性如层位解释等方面。

为了解决油气物探标签数据集建立难题，构建物探标签数据集，中国石油勘探开发研究院西北分院组织构建了油气领域首个标签数据集及管理软件SeismicNet，形成了从高效标签数据集建立、模型训练、模型管理到迁移应用的一体化解决方案，足以满足一般科研机构及油气企业的使用场景。SeismicNet 数据集及软件具有“跨探区、多用户、实时远程”等优点，可对物探行业积累的海量数据进行有效地管理、加工，形成带标注的结构化物探大数据。该工具为标签数据的快速传输、浏览、选取、检索、标注、编辑及训练集的生成提供了便捷的管理工具，为后续智能质控、智能处理、智能解释等不同应用场景中智能技术的快速落地奠定了坚实的大数据基础，填补了国内智能物探大数据构建领域的软件空白。基于此训练集得到的不同网络模型具有优异的表示能力和泛化性能，在当前业内同类模型中精度最高，为包括智能处理、解释等在内的智能物探任务提供了强大支撑，也助力储层分类、流体识别等技术水平的提升。图2 为SeismicNet中的一个典型地震初至拾取标签数据集实例。图3为SeismicNet 中一个典型的数模合成数据标签数据集的实例，其基本思想是依据构造沉积理论，生成高度逼近实际资料的合成数据体及准确标注的河道数据体。

图2 SeismicNet 软件中地震初至拾取标签数据集Fig.2 First break picking sample data and label data in SeismicNet

图3 SeismicNet 软件中地震数模合成数据生成标签数据Fig.3 Generating label data from digital-analog composite data in SeismicNet

2.2 去噪

将深度学习相关策略应用于地震资料处理，有很多场景，如拓频、去噪、异常道识别、混采分离、速度分析、成像等，其中去噪是智能物探最早取得进展的典型应用场景之一。2016 年以来，发展了针对随机噪声、面波、强能量、邻炮干扰等噪声的智能去噪方法，在实际应用中已见到了良好效果，展示了人工智能框架与地球物理算法相结合在解决地震资料处理难题方面具有良好的发展前景。

针对叠前地震数据的噪声压制难题，李海山等［76］采用ResNet网络架构进行地震数据去噪攻关，在实际应用中取得了良好的效果，计算效率、去噪性能均得到了显著的提升。图4 为一沙漠区智能复杂三维面波去噪技术实例，该工区由于地表沙丘起伏导致面波特征极为复杂，传统的单一技术很难将其有效压制，且传统工业去噪需要分频面波压制、异常振幅压制等多个模块组合和复杂处理流程及大量参数测试，而智能去噪方法与传统方法相比极大简化了处理流程，显著提升了处理效率。提高效率应该是当前智能化方法发展的最主要的推动力之一。

图4 智能去噪与常规方法去噪结果对比Fig.4 Comparison of denoising results between intelligent denoising and conventional methods

Pham 等［77］等提出了一种将有监督方法和无监督方法结合的面波衰减方法，该方法由3 个具有物理意义和动机的步骤组成，第一步是卷积神经网络，将地震记录分解为面波和反射信号，其准则是最小化2 个子网络生成的信号和地摇之和与输入地震记录之间的残差；第二步是通过训练监督分类器，在FK 域建立反射和面波信号的最大分离；第三步是基于反射事件的卷积神经网络对面波进行模拟，克服了传统方法难以找到合适掩模的问题。该方法中的每一个分量都与面波的震动特性密切相关，并受其驱动。野外地震记录试验结果证明了各分量叠加在地震资料中防止信号泄漏和消除面波的效果。

低频信号的恢复和补偿以及拓展对地震资料处理、解释意义重大。如地震信号中低频能量可有效地缓解全波形反演中的周波跳跃问题；低频信号的拓展可有效提高分辨率，进而提高诸如地震反演的精度，并有效降低反演的多解性等。然而，低频信号的采集和记录在地震勘探中仍然是一项艰巨的任务。基于数据驱动的思想，GAN 框架为低频信号的拓展提供了一条全新的思路，其基本思想是先利用包含低频信息的模型数据进行模型训练，然后利用基于模型数据训练的深度学习模型对实际数据进行外推。Ovcharenko 等［78］提出了双频段生成学习的陆上地震数据低频拓展方法，该方法需要2 个频段的数据作为输入，而且需要对GAN 进行2个阶段的训练，第一阶段在合成数据上训练生成器，第二阶段是联合使用合成数据和实际数据训练GAN。

从现有的研究来看，智能去噪的方法很多，且技术发展很快。然而如何将人工智能技术应用于地震数据去噪面临诸多的难题，其一是由于噪声类型多样、波场特征复杂，同传统方法一样，很难构建普适性的去噪网络，需针对不同的波场类型及噪声特点构建针对性的智能去噪网络，并在网络架构选择、超参数调整、专家经验的引入等方面进行深入研究；其二，不同探区，甚至同一探区的不同工区，由于地表地下地质特征的差异，模型的泛化能力通常比较差，需要根据资料的不同特点，重新引入本地化的标签数据进行迁移学习，以提高模型的泛化性能。因此，有关迁移学习、构建高精度样本数据集是未来研究的重点，也是难点，只有构建更多具有代表性的标签数据集，才能真正推动智能化方法在去噪领域的深入应用。在去噪以及涉及相关考虑振幅变化如反演成像、流体识别等方面的应用中，标签数据集的构建应尽可能采用实际地震数据，避免采用数模或物模数据，以免带来潜在风险。此外，还需要注意传统方法和智能化方法的结合，开发传统方法+AI方法结合的处理流程和算法。

2.3 断裂检测

断裂检测是深度学习技术在油气领域应用研究最为深入的典型场景，也是最早取得进展的应用场景之一。由于断裂检测仅仅检测间断性，可以采用合成数据和物理模拟数据等作为标注数据进行学习、构建模型，且所获得的模型具有很好的泛化性。在最近的断裂检测智能化研究中主要有2 种方法，一种是利用合成地震记录数据进行网络模型训练，然后将训练好的网络模型应用于实际地震数据，该方法解决了训练数据集的标注问题；另一种方法是直接用实际地震数据进行训练，然后将训练好的网络模型应用于其他实际地震数据，该方法通常要对部分数据集进行人工解释标注，或利用其他传统方法进行标注，如计算相干体作为断层概率等。Chang 等［79］利用Unet 和Resnet 网络联合架构，整合2 种网络模型优势进行地震断裂检测，该模型经过训练以后，具备较强的泛化能力，断裂识别的准确率和检测效率显著提升；Guitton［80］使用3D 卷积神经网络在3D 地震体中有效地识别出了断裂特征，使用3D 滤波器的设计中包含尽可能多的信息，提高了地震断裂检测精度；Zhao 等［81］将深度学习技术和图像处理技术结合，实现了对断裂特征的刻画，提高了断裂检测的精度，但该方法容易出现断裂检测不全面的问题；Xing 等［82］利用转换学习方法对合成数据进行断裂检测；Di 等［83］用卷积神经网络实现了对叠后地震数据的断裂检测；Wu等［84］提出了一种使用CNN 网络的自动断层解释方法，首先用CNN 网络从小图像块中估计提取断层的方向，然后利用估计的断层方向构造各向异性高斯函数，最后堆叠所有局部断裂导向的高斯函数生成一个断层概率图像，从估计的断层方向计算的断层概率图像比传统断层属性图像的断层特征更清晰、准确，连续性更好。

目前在断裂检测领域已经取得了很好的进展，但从实际应用角度来看，还存在诸多难题：①精度还须提升；②真正的断层、岩性和物性等引起的间断性断层、由于噪声影响产生的间断性断层等不易区分；③断面组合难度大，在剖面上难以判断不同的检测结果是否属于同一个断层，这也是当前智能断层检测攻关的主要方向。

2.4 层位与层序解释

层位与层序解释是地震资料解释中最耗时的环节之一，获取高精度的层位、层序解释结果，对提高构造解释精度、油藏建模以及降低勘探风险具有重要意义。利用深度学习网络如CNN 网络实现地层解释至少需要地震特征自学习（SFSL）和地层模型构建（SMB）2 个步骤，每一步都在深层CNN 中实现，地层模型构建是监督的，而地震特征自学习则可设计为不受监督，且不需要领域专家知识。从近期的研究进展来看，对层位解释方面的研究主要集中在3 个方向：①采用多任务网络，引入专家领域知识，同时获得高精度的层位、断层、层序解释结果；②利用构造分析技术逐步细化、逐级提高层位、断层解释精度的工作流程；③基于图像分割思想，采用编码-解码器格式的卷积神经网络模型，将层位拾取问题转化为一个一维图像分割问题，用稀疏网格上的人工层位解释结果进行训练，然后用训练好的模型对整个数据体进行自动层位拾取处理。图5为Geng 等［85］利用U-Net 卷积神经网络直接由三维地震数据自动生成相对地质时间体，用于快速层位和断层解释的实例，尽管采用合成训练集，其网络仍具有较好的泛化能力。

图5 采用U-Net 卷积神经网络生成的相对地质时间体进行智能层位、断层解释Fig.5 Intelligent layer and fault interpretation based on relative geological time agent generated by U-Net convolutional neural network

如何通过多源异构且不均匀分布的稀疏数据获得在地质上合理的构造模型，使建模自由度和灵活性更高，且能用于表达数学方程难以准确描述的复杂三维几何特征和空间组合关系是将深度学习应用于地震解释领域又一个主要的发展方向。

2.5 地震相分类和异常体检测

地震相可用于推断沉积环境、沉积搬运方向及地质演变等情况。Hadiloo 等［86］采用模糊聚类方法进行地震相分析，通过考虑不同聚类方法的测井数据和评价指数来提取聚类数，采用KPCA 属性和GK 方法的样本基聚类结果可以清楚地显示地震相单元和通道模式；Zhao 等［87］引入了地震相分析的属性加权，将属性权重定义为自组织映射（SOM）响应和解释器首选项的函数，通过使用这样的权重，输入属性中的信息在SOM 相图中充分地表现出来，而在具有高对比度的属性中则更少，实现了无监督的地震相分析；Duan 等［88］提出了一种同时学习特征的聚类方法，通过使用深度自动编码器网络进行表示和集群分配，可改善聚类结果，提高地震相的精度预测；Zhao 等［89］利用编码器-解码器卷积神经网络模型对地震相进行分类，对整条地震测线中的所有样本进行分类的同时，还提供了优越的地震相质量，该方法基本实现了对全区地震相的自动划分，且保证了准确率，是深度学习在地震相划分应用中较为成功的案例。

在复杂异常体检测中，盐丘追踪解释是一项耗时的任务。基于深度卷积网络的新型自动化工作流程，可以显著减少盐丘边界的手动解释量，还可能将盐丘解释的周期从大约一个月或更长时间减少到几个小时。Veillard 等［90］基于深度学习对盐丘进行解释，不需要构建特定训练集，仅根据地震数据训练强大的解释模型就获得了精细的盐丘解释结果，岩体的连通性和边缘都得到清晰的显示（图6）。

图6 基于深度学习的盐丘解释（据文献［90］修改）Fig.6 Salt dome interpretation based on deep learning

2.6 智能岩性识别与油气藏开发

岩性识别是了解油气藏特性的关键，Zhang等［91］利用深度学习方法对成像测井图像进行岩性识别，初步实现了对岩性的预测。Emelyanova 等［92］研究了一种基于测井记录综合聚类自动识别电相的方法，这种集成聚类法展示了如何应用集成学习的优势来克服各种聚类算法中的不稳定性，并评估预测地层学中的不确定性。Bestagini 等［93］在随机森林分类器上提供一组增强特征来进行相分类。为了克服传统测井记录处理和解释工作流程中的主观性、不确定性和低效性，Wu 等［94］尝试利用机器学习使测井记录处理和解释工作流程自动化，其技术框架如图7所示，目前还处于探索研究阶段。

图7 自动化机器学习解释流程技术框架（据文献［94］修改）Fig.7 Technical framework for automated machine learning interpretation process

目前已有学者将智能化技术应用于岩石物理参数预测、流体识别等方面，但总体进展不大。Das等［95］用级联法和一步法卷积神经网络模型由时间域角度道集反演深度域岩石物理参数（纵、横波速度，密度和孔隙度，泥质含量以及含水饱和度）。Du等［96］用残差网络由叠前地震数据反演方位各向异性介质的速度和裂缝参数。

从现有的研究结果分析，将智能化方法应用于岩性检测，其难点主要在标签数据集的构建，由于不同探区、甚至同一工区地层的岩性组合都存在差异，因此模型的泛化性能难以保证。分析认为有3个方向可以开展深入的研究：①构建考虑专家知识的针对性检测网络，提高预测的准确性；②构建基于多数据源的多尺度网络，提高模型学习的能力；③构建基于知识图谱或者深度学习的风险评估方法，对预测结果进行评估分析，给出定量化的可靠性评价标准。

2.7 智能地震反演成像

将人工智能相关思想应用到反演领域有助于不同类型数据尺度融合，从理论上讲，可以较好地通过构建测井、地震、地震、岩心等不同尺度和不同类型的标签数据，结合多标签学习框架，达到融合多尺度信息的目的。此外，通过不同深度学习框架的应用，引入专家知识等先验信息，也有助于降低反演多解性、提高反演精度。2019 年之后人工智能技术在反演成像方面的论文剧增，涵盖了从反射系数到波阻抗反演、叠前弹性参数和岩性参数反演、全波形反演、地震初至旅行时层析成像反演等多方面，所用方法包括CNN、RNN、Boltzmann 机和GAN等。

近期，采用深度学习方法求解偏微分方程（PDE）取得了较大的进展，不仅能快速正演、反演，很好地解决非线性问题，对更复杂和高维的偏微分方程进行求解，也为地震成像反演技术发展带来新变革。Zhang 等［97］提出了基于RNN 网络的各向异性黏弹全波形反演方法，采用基于高阶TV 正则化的L1 范数作为目标函数，其独特之处在于采用不可微的目标函数，并结合非伴随的波算子，计算效率和精度均较高；Wang 等［98］利用Cycle-GAN 网络解决了地震数据标签不足的问题，其中包括2 个基于CNN 的生成子网络模拟地震道的正演与反演过程，2 个判别子网络用于约束合成地震道与实际地震道之间的分布一致性，试验对比显示这种方法优于一般的卷积神经网络方法；Yang 等［99］借助卷积网络发展了几种基于物理信息的数据增强技术，并使用反演网络对生成的模型进行了对比，发现基于物理模型约束的地震反演可以获得更精确的反演结果；Phan 等［100］提出了一种将玻尔兹曼机作为机器学习算法的AVA 反演方法，流程如图8 所示，其最大特点是将机器学习引入到反演流程中，并加入先验约束，该方法的潜在价值是将先验信息用于智能学习，其反演结果如图9 所示。Oh 等［101］利用U-net网络将可控电磁数据与地震数据结合的方法，实现了对盐丘的准确反演，为解决多尺度融合问题提供了参考；Kaur 等［102］提出了一种利用生成对抗网络进行叠后反射系数反演的方法，用生成对抗网络迭代近似表达逆海赛矩阵，实现偏移剖面到反射系数剖面的映射，不仅提高了计算效率，还降低了噪声、消除了偏移假象、增强了反射振幅，并通过3 个数据集训练获得的模型在另外2 个数据集上的应用结果证明了模型的泛化能力和方法的实用性；Sun等［103］基于波动方程构建具有地震波场正演模拟功能的循环神经网络模型，通过训练得到网络系数，并以此实现了全波形反演；Alfarraj 等［104］提出了一种基于半监督深度学习的叠后波阻抗反演方法，通过构建一个由卷积神经网络和循环网络组成的深度学习网络，结合测井曲线及其合成地震记录进行训练，将训练得到的网络模型用于波阻抗反演，应用效果稳定；Zhang 等［105］将卷积神经网络模型用于井间地震速度反演。总体来看，该领域发展很快，目前相关的研究主要集中在3 个方面：①引入了一种物理指引下的神经网络模型（PINN），显式地表达描述地震波动规律的偏微分方程，通过模型训练实现由地震数据反演地震速度模型。②采用卷积神经网络模型来拓展地震信号的频率成分，达到提高全波形反演的效果，从反演成像角度来看，将成像结果与角度域点扩散函数（Hessian 算子）的高维反褶积过程构造为稀疏约束的超级分辨率反演成像问题，融入深度学习算法，进一步消除波场传播效应，拓宽成像子波的频谱范围，提高成像结果的分辨率及计算效率。③采用基于深度学习方法求解偏微分方程，以提高正演、反演效率，并解决非线性问题，以适应对更复杂、更高维的偏微分方程进行求解。这些研究有望颠覆传统偏微分方程数值求解技术，引发数值模拟技术的巨大变革，为地震成像反演技术发展带来新变革。

图8 基于物理意义辅助的深度学习算法架构Fig.8 Deep learning algorithm assisted by physical meaning

图9 物理意义辅助的深度学习算法反演结果Fig.9 Inversion results of deep learning algorithm assisted by physical meaning

3 面临的难题与主要发展方向

3.1 面临的难题和对策

尽管人工智能技术在地球物理勘探领域中的应用已经取得诸多进展，但要将之直接用于生产，还有一些难题亟待解决。

其一，缺少开放的智能化算法模型训练的标签数据集。数据驱动方法要求使用大量数据，用于识别数据中的模式和趋势从而建立预测模型，以及测试模型的鲁棒性和泛化能力。智能化技术对数据要求较高，标签数据的质量直接影响智能化算法的结果。在物探领域也缺乏类似计算机视觉中开放、共享的ImageNet 数据集，更缺乏具有统一性能的测试标准，在很大程度上制约了该领域技术的发展；缺乏丰富的带标注的物探数据，用于深度学习模型的训练和测试，也限制了更多的专家学者进入该研究领域。

其二，缺少适用于解决物探领域问题的智能化框架。当前智能物探技术研究中，主要利用现有的开源框架和相关算法（如循环神经网络、字典学习算法、生成对抗网络、随机森林算法和各类聚类分析算法等），然后嫁接一些专业场景，来解决某个具体的问题（如初至拾取、断裂检测等）。然而，未来的发展存在很多变数，充满不确定性，这种“AI+应用场景”的模式可能被“应用场景+AI”所取代。随着GPT-4 以及大模型技术的发展，构建油气领域大模型应该提上日程，普惠化的人工智能时代也许要成为过去。

其三，尚未形成适用于物探领域开源的、共享的智能化开发平台。智能化技术的快速发展不仅得益于高性能计算的发展和大数据共享，开源的智能化开发平台也是一个重要的推动力。开源平台的存在，使得人工智能技术应用门槛降低，大量从事应用的科研人员也可以参与其中，形成了良性发展智能生态，促进了人工智能技术在计算机视觉、自然语言处理、智能机器人等领域的发展突飞猛进，不断获得突破。然而，在物探领域没有统一的开发平台，研究者们主要使用互联网公司开源平台，无法形成良好的社区生态，大幅降低了研究者开源共享技术的积极性，造成了资源浪费。

针对上述难题，可以从以下4个方面进行攻关：

一是构建共享的、统一标准的、满足工业化需求的大数据集。共享的大数据集有利于研究人员便捷获取需要的研究数据，节约制作训练数据集时间，提高研究人员对理论算法的研究时间，也可以吸引其他行业感兴趣的研究人员进入物探领域，促进该领域的进一步发展。数据集的建立需要采取严格的数据预处理和质量控制措施，强调数据清洗、数据标准化、数据归一化和数据校正的重要性。数据调节和特征选择会提高数据驱动模型的鲁棒性，实行标准化数据质量控制措施可以提高计算效率和模型预测能力。此外，鉴于油气问题的特殊性和投资风险性，仅有通用的标签数据集和通用模型是不够的，其智能化还必须构建本地化的标签数据集来进行迁移学习。

二是构建适用于地震数据的智能化理论和开发平台。地震数据与视频、图像等数据特征差异非常大，不仅分辨率无法与图像、视频等数据相比，数值范围和表示的特征差异也更大。此外，地震数据是非先验的，标签数据制作困难，而图像、视频等数据是先验的，可以准确的制作标签数据。因此，现有的开源平台并不完全适用于物探领域，在解决了数据基础后，应该研究适用于地震数据的智能化理论和开发平台。

三是开展基础理论、架构、网络可解释性等基础研究。开展适用于地震数据的深度学习理论和算法攻关，克服通过对地震数据进行改造来适应现有深度学习框架的缺陷，最大限度地保留地震数据的原始信息。此外，由于油气勘探是高风险行业，也更需要对深度学习网络的可解释性进行研究，进一步了解深度学习网络。

四是开展与应用场景的结合。围绕解决生产应用难题开展技术攻关，争取在一些关键场景优先取得突破，目前来看，最可能突破的场景是在诸如速度分析、初至拾取等一些费时费力的环节，而要实现流程再造则还需要漫长的研究。

3.2 主要发展方向

结合智能物探发展中面临的问题和对近年来SEG、EAGE、CPS/SEG 等国际地球物理年会相关研究的跟踪分析，其主要研究方向集中在6 个领域：①基础理论研究。重点解决如何将特定人工智能技术和地球物理勘探相结合，探索人工智能数学机理、网络可解释性以及构建适合物探领域的深度学习架构模型，进而为构建智能地球物理勘探技术新体系提供理论支撑。②开放训练数据集、智能物探数据国家标准的构建。高质量训练数据集是人工智能技术实现工业化应用、构建智能化产业生态以及国际技术引领基石，通过智能物探数据国家标准的建立，面向地球物理勘探资料采集、处理、解释以及综合决策全行业应用标签数据库建立等关键技术研究，构建并发布物探领域专业数据集与物探数据经验样本集，逐步解决业界数据封闭，打造具有分级数据开放度的海量物探数据共享平台。③智能地震成像方法。通过对现有地震成像理论进行研究，探索如何将人工智能技术和地震成像基础理论与方法相结合，实现智能地震成像，对以地震成像为核心的地震资料处理流程进行再造，提高地震成像精度。④智能物探储层成像方法。解决地球物理多尺度、多模态地质-地球物理信息匹配与融合等核心科学难题，提高储层成像、定量化解释精度。⑤油气大数据挖掘、智能风险评估与智能决策。以构建以大数据科学分析为手段，探索基于地球物理勘探大数据的智能风险评估、多学科综合决策等核心方法，实现油气大数据信息挖掘与共享，为降低勘探决策风险，提高勘探决策能力提供技术支撑。⑥智能超算软件装备研发。软件装备与系统是实现智能化物探技术产业落地的关键，通过对智能物探装备的研究，解决智能物探工业化应用最后一公里问题，实现产业落实、落地。