抽油机井免修期影响因素分析
2024-05-06张中慧
张中慧
(中国石化胜利油田分公司石油工程技术研究院,山东 东营 257000)
0 引言
抽油机井作为油田的核心生产单元,深入分析其免修期的内在影响因素和影响规律至关重要。这不仅有助于降低作业工作量,更能有效延长免修期,为油田的稳定生产提供有力保障[1,2]。
徐丽萍[3]针对游梁式抽油机的平衡度问题,提出了电流平衡法和功率平衡法,旨在提升其工作性能,进而延长油井寿命。杨凯澜等[4]在油田现场进行了实证研究,对比了多种防蜡、除蜡技术,并从生产管理制度层面提出了改进措施,进一步提高了井筒治理的有效性,延长了抽油机井的免修期。刘春杰[5]则关注清防蜡措施,结合热洗和井口加药等方法,有效地延长了抽油机井的免修期。F.A.Aliev[6]开发了一种计算机模型,该模型能监测泵的主要运行参数和储层系统的特性,进而确定油井-油藏系统中沉积物的主要特征和有杆抽油机的参数。而T.A.Aliev[7]则基于传感器数据,提出了一种检测算法,用以观察采油器械的老化损失情况,及时采取措施延长免修期。
长期以来,研究人员从采油工程理论出发,对油井免修期过短的原因进行了深入研究,并提出了一系列延长免修期的措施。这些措施在油田的机采管理工作中起到了一定的推动作用,但由于免修期影响因素的复杂性,问题并未得到根本解决。近年来,随着大数据和人工智能技术的迅猛发展,取得了大量突破性成果[8]。在油田中,抽油机井数量众多,长期开发过程中积累了大量运行数据。这些数据中蕴含着丰富的价值信息。如果能够利用先进的数据挖掘技术对这些数据进行充分挖掘,从海量的油井历史数据中探索免修期的内在因素,并辅助配套工艺措施的决策[9],将有力地支持采油工程的技术革新。为此,本研究将抽油机井作为研究对象,广泛搜集油井免修期相关数据,通过数据挖掘方法探究影响抽油机井免修期的各种因素,以期为抽油机井长寿运行提供支撑。
1 抽油机井数据搜集
1.1 数据搜集
针对油井设计任务需求,结合专家经验,设计了面向油井设计的指标体系,并从数据库中搜集各油井数据(表1),形成特征样本库,包含抽油机井34000 余口,涵盖稠油油藏、低渗透油藏、复杂断块油藏、海上油藏、特殊岩性油藏、中高渗透整装油藏这6种不同类型的油藏。搜集的数据指标方面,包括地质数据、流体数据、机采数据、生产数据、作业数据等多个维度。
表1 原始数据表
1.2 数据清洗
为了提升数据的可靠性,将指标体系中的数据进行了数据清洗。对于缺失数据,通过填补、插补的方式进行了补充。其中包括数据异常点监测,并结合专家经验对数据进行核对和校正,对类别型的数据进行数字化处理,对指标体系中的厂名等类别数据进行数字化,使得任意两个类别数据之间的距离相同;制备得到规范化的抽油机井运行大数据集。
1.3 免修期异常低油井筛选
我们采用孤立森林算法[10]等进行数据异常点监测,孤立森林是一种基于集成学习的异常检测算法,它可以高效地识别出数据集中的异常点。其核心思想是将正常点分割成不同的区域所需要的路径长度比异常点少,因此可以通过路径长度来判断样本是否为异常点。孤立森林算法通过随机选择特征,然后随机选择特征的分割值,递归地生成数据集的分区。和数据集中正常的点相比,要隔离的异常值所需的随机分区更少,因此异常值是树中路径更短的点,路径长度是从根节点经过的边数。识别出异常数据后,结合专家认识对这些数据进行了核对和校正。
运用孤立森林算法,对区块1 的116 口油井免修期数据进行筛选,识别出10 口免修期异常低井,如图1 所示。通过识别出免修期异常低的油井,并将其纳入免修期异常井样本库,共得到1311 个样本集,从而更好地分析和管理油井的免修期情况。
图1 区块1 异常井筛选
2 免修期异常井的影响因素分析
2.1 指标相关性定量分析
从地质、流体、生产、举升系统、配套工艺等多角度开展参数分析,选取22 个指标,应用指标相关性统计方法对分析结果进行归纳统计,找出特异参数与免修期异常之间的相关程度,明确免修期的主要影响因素。我们利用皮尔逊相关性与斯皮尔曼相关性的分析方法对两者进行分析,其中皮尔逊适于正态分布或近似正态分布的数据[11],斯皮尔曼适于非正态分布的数据[12],皮尔逊相关系数仅评估线性关系,斯皮尔曼相关系数用来评估指标的单调关系。相关系数是最常用的统计度量,用一个数来描述两个变量之间的相关联的程度。相关系数的取值范围为[-1,1]。负值表示随着一个变量值的增大另一个则减小;正值表示随着一个变量值的增大另一个也跟着增大;0 则表示一个变量的增大减小对另一个的取值没有影响。
2.1.1 皮尔逊相关性
通过对皮尔逊相关性系数的研究,现将样本值代入进行检验,22 种指标间的皮尔逊相关系数如图2所示。
图2 皮尔逊相关系数热力图
依据图2 可以得出以下认识:与免修期呈正相关的指标共有15 个,呈负相关的指标共7 个;与其相关性强度由大到小排序依次为日液能力、月产水量、年产水量、排量、泵径、冲次、泵效、泵深、含水、下行最小负荷、动液面、上行最大负荷、冲程、年产气量、月产油量、年产油量、日油能力、套压、系统效率、原油黏度、原油密度、未动管柱天数。
2.1.2 斯皮尔曼相关性
通过对斯皮尔曼秩相关系数的研究,将样本值代入进行检验,具体22 种指标间的斯皮尔曼相关系数如图3 所示。
图3 斯皮尔曼相关系数热力图
依据图3 可以得出以下认识:与免修期呈正相关的指标共有16 个,呈负相关的指标共6 个;与其相关性强度由大到小排序依次为日液能力、月产水量、年产水量、排量、泵效、冲次、含水、泵径、泵深、下行最小负荷、系统效率、上行最大负荷、动液面、原油黏度、原油密度、冲程、月产油量、年产气量、年产油量、套压、日油能力、未动管柱天数。
2.1.3 差异分析
根据皮尔逊相关系数研究的结论,与免修期呈中等相关及以上的指标有6 个,分别是日液能力、月产水量、年产水量、排量、泵径、冲次。而根据斯皮尔曼相关系数研究的结论,与免修期呈中等相关及以上的指标有9 个,分别是日液能力、月产水量、年产水量、排量、泵效、冲次、含水、泵径、泵深。两种方法产生差异的原因在于皮尔逊相关系数更适用于符合线性分布的数据,对不符合线性关系或不满足正态分布的数据,皮尔逊相关系数难以准确描述其相关关系。而斯皮尔曼相关系数是基于秩次进行计算,不容易受到异常值的影响,具有更好的鲁棒性。综合来看,日液能力、月产水量、年产水量、排量、泵效、冲次、含水、泵径、泵深这9 个指标对免修期影响较为明显。
2.2 基于箱型图的定量分析
基于皮尔逊算法和斯皮尔曼算法的相关性分析明确了各参数与免修期的相关程度,而其参数在免修期异常井中的体现模式尚不直观,为此加入基于箱型图的定量分析。我们绘制区块各指标箱型图,图中包含了六个数据节点,将一组数据从大到小排列,分别计算出他的上边缘,上四分位数,中位数,下四分位数,下边缘,橙色横线为平均数,绿色三角为中位数,空心圆点是异常值,红色点为所选井数据。
样本中的参数,有些参数的数据很大,有些参数的数据则相对很小,难以将其直接整合到一起进行比对,于是将其进行标准化和归一化处理。经过数据处理,绘制出标准化后的箱型图,如图4 所示。
图4 标准化后的箱型图
定义对于各个指标绘制的箱型图,大于上四分位数的数据作为异常高的值,小于下四分位数的数据作为异常低的值,在上下四分位之间的视为正常值。例如图5 所示某井中的参数,所选井冲次数据介于下四分位数和下边缘之间,可知该参数为异常低。而所选井年产气量参数介于上四分位数和上边缘之间,则该参数即为异常高。同样地,统计各个指标异常值与正常值的个数,对比免修期异常油井与常规油井在各参数上差异性,找出免修期异常油井的特异性参数。
图5 免修期异常低井统计数据
分析了22 个指标出现异常高、正常、异常低的频次,计算了3 种情况的标准差,用于确定主控因素。
结合图6 和表2 分析可知,标准差小于6 的指标有5 个:上行最大负荷、日油能力、未动管柱天数、系统效率、泵效;各个指标异常值与正常值的个数,无太大区别,对免修期影响不大。冲次、套压、年产油量、年产水量、年产气量、日油能力、月产油量、排量、泵径、月产水量这10 个指标异常低,对免修期异常低有影响。下行最小负荷、原油密度、动液面、原油黏度、泵深这5 个指标异常高,对免修期异常低有影响。冲程、含水这2 个指标不在正常区间,对免修期异常低有影响。泵径出现频次92 次,在统计的10 个异常低指标对免修期异常低有影响中最高,泵径指标越低,对免修期异常低影响越大。泵深出现频次83 次,在统计的5 个异常高指标对免修期异常低有影响中最高,泵深该指标越高,对免修期异常低影响越大。
图6 免修期异常低井各指标标准差
表2 免修期异常低井各指标出现频次
2.3 综合分析
两种指标相关性定量分析方法明确了各参数与免修期的相关程度,即日液能力、月产水量、年产水量、排量、泵效、冲次、含水、泵径、泵深这9 个指标对免修期影响较为明显。而基于箱型图的定量分析在明确各参数相关性的基础上,进一步展现了参数对免修期的影响模式,从中可以看出冲次、套压等10 个指标异常低和下行最小负荷、原油密度等5 个指标异常高对免修期异常低有影响;冲程、含水这2 个指标不在正常区间,对免修期异常低有影响;另外,泵径、泵深等指标也对免修期异常低影响显著。皮尔逊相关系数和斯皮尔曼相关系数都是通过衡量变量之间的相关性程度来探究其变化趋势,而箱型图定量分析则是在大量的数据积累上对其进行加工处理,进而整合到一张张直观的图中,来总结其数据的分布规律。这两类方法各有长短,综合来看,日液能力、月产水量、年产水量、排量、泵效、冲次、含水、泵径都与免修期呈正相关,而泵深与免修期呈负相关。
3 结语
针对各区块免修期异常的油井,通过搜集其相关数据,并使用算法对其进行处理。利用这些数据,我们从地质、流体、生产、举升系统、配套工艺等多角度开展参数分析,重点对比免修期异常油井与常规油井在各参数上差异性,在此基础上统计归纳,明确免修期影响因素及影响规律。通过箱型图定量分析,结合皮尔逊相关性和斯皮尔曼相关性分析方法,从中发现,对免修期影响较为明显的因素有日液能力、月产水量、年产水量、排量、泵效、冲次、含水、泵径、泵深等,其中日液能力、月产水量、年产水量、排量、泵效、冲次、含水、泵径都与免修期呈正相关,而泵深与免修期呈负相关。