遗传算法与神经网络结合预测低渗透油藏产油量——以宝浪油田为例
2011-11-09董玉安高立建张红坡
董玉安,赵 蕊,叶 欢,廖 晶,高立建,张红坡
(1.中国石化河南油田分公司石油勘探开发研究院,河南南阳473132;2.中国石化河南油田分公司第二采油厂;3.中国石化河南油田分公司第一采油厂)
遗传算法与神经网络结合预测低渗透油藏产油量
——以宝浪油田为例
董玉安1,赵 蕊2,叶 欢1,廖 晶1,高立建3,张红坡3
(1.中国石化河南油田分公司石油勘探开发研究院,河南南阳473132;2.中国石化河南油田分公司第二采油厂;3.中国石化河南油田分公司第一采油厂)
基于遗传算法的全局搜索能力和神经网络算法的局部精确搜索特性,将遗传算法和神经网络算法有机结合,在提高油气产量预测精度的研究中得到了很好的应用。对宝浪油田某区块产油量的预测,验证了这种方法的正确性,结果表明该方法预测精度明显优于单纯的BP算法,证明了这种方法的有效性和可靠性。
神经网络;遗传算法;宝浪油田;产量预测
新疆宝浪油田属于典型低渗透砂砾岩储层,油藏厚度大、Ⅲ级断层较发育。宝浪油田自1997年注水开发以来,油田已进入中含水期,目前地下油水分布关系复杂,水驱效果差,产量递减较快,剩余油识别难度大,导致生产效果变差。至2009年底,年自然递减达20%左右,而且自然递减还有加大的趋势。按水驱开发趋势推算,最终采收率只能达到20%左右,比标定采收率低5个百分点。因此,如何正确预测该区块产油量,正确标定区块采收率是油田亟待解决的问题。
在油藏工程领域,对于油田产量的预测方法较多,如产量递减法、水驱特征曲线法、图版分析法、广义翁氏法、衰减曲线法、油藏数值模拟法、物质平衡法、递减曲线法等等。由于各个油田物性、开发方式、地质特征等方面的差异,上述几种预测方法都有一定的局限性[1-2]。因此,有必要从数学的角度出发,找出一种不拘泥于油藏性质的预测方法,并能成功应用于宝浪油田。
1 遗传算法与BP算法简介
人工神经网络(ANN,A rtificial Neural Network)预测方法是对人类大脑的一种物理结构上的模拟,即利用计算机仿真的方法,从物理结构上模拟人脑,以使系统具有人脑的某些智能。在众多的人工神经网络模型中,多层前馈神经网络模型是目前应用最为广泛的模型。用逆向传播网络算法(BP算法,Back Propagation Nets)可以实现多层前馈神经网络的训练,BP算法具有简单和可塑性的优点,能进行局部精确搜索,然而BP算法是基于梯度的方法,这种方法的收敛速度慢,而且受到局部极小点的困扰,而采用遗传算法则可以克服BP算法的缺陷[3]。
遗传算法 GA(Genetic A lgo rithm s)是20世纪60年代后期由美国M ichigan大学J.H.Holland教授首先提出的,它是模拟自然界生物的遗传与长期进化过程发展起来的一种搜索和优化算法。它模拟了生物界“优胜劣汰,适者生存”的机制,用逐次迭代法搜索寻优。目前,遗传算法已成为继专家系统、人工神经网络之后的又一个受人青睐的新学科[4-6]。
在对低渗油田产量的预测过程中,将BP算法的局部精确搜索能力和遗传算法的全局搜索能力有机结合起来,能做到优势互补,提高了预测的精度。
2 遗传算法与BP算法结合的方法与步骤
人工神经网络具有非常强的非线性映射能力,它不需要任何先验公式就可以通过学习(或训练)自动总结出生产历史数据间的函数关系,在油气产量预测中的应用非常有效。现有神经网络学习算法(BP算法)存在一定缺陷,往往会降低预测结果的准确性,将遗传算法与神经网络有机结合,能较好克服BP算法的缺陷。
利用以下算法步骤来实现遗传算法对神经网络的连接权值的优化[7-8]:①确定初始输入与输出样本集;②确定网络权值的编码形式(本文采用实数编码),个体的位串长度;③选定遗传算法操作,设置操作参数以及参数的调整算法;④设定种群规模为N,随机产生初始种群;⑤译码种群中每一个体位串,求得N组网络权值,得到具有相同结构的N个网络;⑥由输入样本集经前向传播算法,求得N组网络权值对应的N个网络输出;⑦设定网络的目标函数,将其转换为适应度,对N个网络进行评价;⑧依据适应度在遗传空间进行选择操作;⑨依据选定的交叉、变异及有关算法、参数,进行相应的操作,得到新一代种群;⑩返回步骤⑤,直到满足性能要求,得到一组优化的权值。
3 应用实例
本文以新疆宝浪油田某区块为例,区块1997年至2009年生产指标见表1,这些历史动态生产数据,在一定程度上本身就反映了某区块实际的开发动态变化规律。
首先利用一般的三层(输入层、隐含层和输出层)BP网络,结合遗传算法建立了预测模型,对2010年宝浪油田某区块产油量进行了预测。
表1 宝浪油田某区块历年生产指标
3.1 设计BP网络
设定输入向量为:
在油田开发指标预测过程中,x1可表示为当年的年产油量;x2可表示为当年的年产水量;x3可表示为当年的年注水量;x4可表示为油田当年的采出程度;x5可表示为油田当年的综合含水率;x6可表示为油田的剩余地质储量等。
隐含层输出向量为:
输出层输出向量为:
期望输出向量为:D=(d),表示预测年份的产油量。输入层到隐含层之间的权值矩阵用V来表示:
隐层到输出层之间的权值矩阵用W来表示:
其中Wj为输出层第j个神经元对应的权向量,BP网络拓扑结构如图1所示。接着分析分层信号之间的数学关系。
图1 BP神经网络拓扑结构图
上面两个式子中,转移函数f(x)均为单极性Sigmoid函数,表达式如下:
上述公式所建立的BP神经网络通过遗传算法学习,并按照离散时间方式运行。当网络输出层输出向量与期望输出向量不相等时,存在输出误差E,其定义表达式如下:
将上述误差定义表达式展开到隐含层,则有:
将误差定义进一步展开至输入层,则有:
遗传算法的目标函数可以定义为:在所有进化代中搜索网络误差最小的权重,相应的表达公式如下:
遗传算法是以适应度函数作为进化目标的,且是朝着适应度函数值增大的方向进化,所以,适应度函数与目标函数之间要进行适当的转换。由于进化中的网络误差是非零的正数,因此可以将目标函数的倒数作为适应度函数。为了保证适应度函数值不至于太小,引入一个较大的系数M,遗传算法的适应度函数最终形式如下:
运用网络误差的倒数形式来表达适应度函数,这就表明遗传算法是按照网络误差的随机下降的趋势来进化的,从而保证了遗传算法是朝着适应度函数增大的方向进化的。
3.2 仿真步骤
本次对区块产油量的预测过程中,应用了遗传算法与神经网络结合的仿真步骤,采用MA TLAB的神经网络工具箱进行编程计算,具体步骤可分为如下10步(见图2)。
3.3 仿真预测结果
应用上述仿真步骤和其他两种方法(单纯的BP算法和油藏工程方法),对宝浪油田某区块产油量进行了预测(图3),结果表明:BP与 GA结合的仿真模型效果要好于其他方法。
图3 区块年产油量预测曲线对比
4 讨论
(1)利用人工神经网络较强的非线性映射能力,建立了油气产量预测模型,结合遗传算法对神经网络学习过程中的网络连接值进行优化,取得了很好的效果,提高了油气产量的预测精度。
(2)文中提出的方法,不但可以应用于油气产量的预测,同时也可在油气田开发中对其他动态指标进行预测,得到的预测值精度较高。
(3)遗传算法作为一种新型的全局优化搜索算法,不存在求导和函数连续性的限定,在人工神经网络的应用上展现了其独特的优势。随着理论研究的深入以及计算机模拟工具的发展,遗传算法与神经网络结合模型将会在许多实际问题中的得到广泛应用。
[1] 李铭,李璗.三种预测油气田产量数学模型的比较[J].西安石油大学学报(自然科学版),2004,19(3):26-28.
[2] 吴新根,葛家理.应用人工神经网络预测油田产量[J].石油勘探与开发,1994,21(3):75-78.
[3] Maniezzo V.Genetic evolution of the topology and weight distribution of neural netwo rks[J].IEEE Trans On Neural Netwo rks,1994,5(1):39-53.
[4] 董明,席裕庚.基于遗传算法的干扰试井解释方法[J].石油大学学报(自然科学版),1997,21(4):33-36.
[5] 王光兰,贾永禄,柯益化,等.遗传算法在油田产量预报中的应用[J].西南石油学院学报,2000,22(2):34-35.
[6] 栾国华,何顺利,舒绍屹,等.应用人工神经网络方法预测气井积液[J].断块油气田,2010,17(5):575-578.
[7] 段永刚,陈伟,黄诚,等.有限导流垂直压裂井混合遗传自动试井分析[J].西南石油学院学报,2000,22(4):41-43.
[8] 刘铁男,陈广义,刘延力,等.模拟生物种族形成的进化算化与多峰函数优化[J].控制与决策,1999,14(2):185-188.
TE319
A
1673-8217(2011)05-0060-03
2011-05-19;改回日期:2011-06-19
董玉安,油藏工程师,1960年生,主要从事低渗透油气藏开发方案编制、动态分析等研究工作。
编辑:吴官生