APP下载

浅谈数据挖掘在油田开采中的应用方法

2019-03-03高旺雄杜永波张奎峰

云南化工 2019年10期
关键词:结蜡液面油井

张 鑫,高旺雄,杜永波,张奎峰

(西安石油大学,陕西 西安 710065)

关键字:大数据;油田开采;数据挖掘;数字油田;智慧油田

数字油田到智慧油田的转变,是时代发展的新趋势,也是油田发展新的突破点。智慧油田中会产生海量的数据,这些数据体量巨大,种类庞杂,价值密度低。采用传统的数据分析方法已经无法解决这些复杂的数据,如何有效的利用这些数据资源,提高油田的效益,已经成为油田的迫切需求[1]。只有数据挖掘技术可以解决这个问题。

1 数据挖掘技术

数据挖掘技术就是从实际生产时产生的大量复杂无序的数据中挖掘出隐藏的、空前未知的、对决策决定有实际意义的关系、模式和趋势,并利用所挖掘出来的知识和规则建立支持决策的模型,提供预测性决策支持的方法、工具和过程。数据挖掘技术既可以揭示已知的事实,又可以预测未知的结果[2]。

传统的数据分析是对已知的数据范围中好理解的数据进行分析,是建立在关系数据模型之上分析,主题之间的关系在系统内已经被创立,而分析也在此基础上进行。而数据挖掘最大的优点就是针对传统手段捕捉到数据之外的非结构化数据,这意味着数据挖掘不能保证输入数据是完整的,被清洗过的,没有任何错误的。数据挖掘得到的知识更具有未先知性、有效性。

一个数据挖掘项目包括六个阶段:业务理解、数据理解、数据准备、建模、评估、部署[3]。业务理解即确定数据挖掘的目标。数据理解主要包含三个方面:首先是有关需要解决问题的明确定义,其次是对有关数据的了解,最后是数据挖掘结果对业务作用效力的预测。数据准备是数据挖掘的基础,所以足够、丰富、高质量的数据对数据挖掘结果至关重要。数据准备包括:数据的选择、数据的质量分析和数据的预处理三个环节。建模即决策模型的建立,在这一步要确定具体的数据挖掘模型,并用这个模型原型训练出模型的参数,得到具体的决策模型形式。这些模型算法包括:聚类、关联、分类、回归、预测和诊断。模型评估即检验一个模型的好坏,模型的预测精度是检验模型好坏的重要指标,但不是唯一指标,其指标还有LIFT、ROC、Gain图等。模型的部署是数据挖掘的最后一个步骤,模型通过评估后,将其部署到实际的业务系统中,这样就可以应用数据挖掘知识来提高企业的效益。

2 油田开采数据仓库搭建

油田生产中,产生的数据类型多种多样,数据规模十分庞大,原有的数据存储技术已经远远不能满足不断增加的数据量的需求,只有建立油田开采数据仓库可解决这一问题。

随着油田开采数据大幅增长,随之会出现很多数据重复、数据之间关联程度低、信息孤岛等问题。数据挖掘技术可解决这一问题,将分散的资源集中,将无序的数据整理有序。

油田开采数据仓库主要包括三部分:油田开采源数据、数据存储仓库和数据应用部分。第一个部分是油田原始数据源,该部分存放着大量的油田开采数据,这部分数据无任何更改,直接沿用外围系统数据结构和数据,不对外开放,为临时存储层,为后一步数据处理做准备;第二个部分是数据存储仓库,数据存储仓库的油田开采数据是一致的、精确的、干净的数据,是对源数据进行了清洗后的油田开采数据;第三部分是数据应用部分,该部分是前端应用直接可以读取的油田开采数据,是根据报表、专题分析需求而计算生成的数据。

3 油田开采数据挖掘方法的研究

1)调整油井开采制度

低渗透油田及常规油田开发中后期会出现油井压力不足、油井不能连续出油的情况,使得抽油泵不同程度的存在严重空抽或充满度不足的现象,这不仅造成了油田产能低下,而且会造成抽油机、抽油杆、抽油泵的无效磨损和电能的极大浪费[3]。常规的处理方法是:基于单一参数计算动液面高度,根据动液面高度变化确定间歇采油制度。但单一参数计算的动液面高度,极其依赖于原始参数的数据准确性,同时基于单参数确定的动液面高度误差率也比较高。调用油田开采数据仓库的数据,基于数据挖掘方法,对影响动液面高度的众参数进行灰色关联分析,计算各参数与动液面的相关度排名,继而选择出影响动液面的主因子,利用多个参数建立计算动液面高度模型。基于数据挖掘方法的多参数计算动液面模型,可有效提高间歇采油制度的精确性,从而降低抽油机、抽油杆、抽油泵的无效磨损,减少电能的浪费,提高油田的效益。

2)油田机械故障预测

油田机械故障,一方面增加了油田的开采成本,另一方面大大影响了油田的生产效率,如何提前预测油田机械故障,在故障发生前,提前维修或更换设备,从而避免机械故障对油田生产的影响,以往的方法是不具备故障提前预测的,数据挖掘技术可以实现油田机械的提前预测。调用油田开采数据仓库的数据,基于数据挖掘方法,利用关联规则算法挖掘初始数据,获取表征机械运行状态的关联规则,然后计算故障种类和故障征兆、关联规则和故障征兆之间的关联关系,确定其权重系数,建立预测油井机械故障模型;最后,利用实时监测关联规则组的变化趋势,进行油井机械的故障预测。

3)预测结蜡

溶有有石蜡的原油,在开采过程中,随着温度、压力的降低,溶解的石蜡会以结晶形式体析出、长大聚集和沉积在管壁等固相表面上[4]。油井结蜡增加了原油的流动阻力,影响抽油设备的正常工作。因此,防蜡是含蜡原油开采中需要解决的重要问题。化学防蜡是最有效的防蜡方法,化学防蜡是通过向井筒中加入化学防蜡剂,防蜡剂在井筒流体中溶解后达到防蜡的目的,但何时向井筒加入防蜡剂,是无法精确确定的,数据挖掘技术可精确确定加防蜡剂时间。调用油田开采数据仓库的数据,基于数据挖掘方法,对影响结蜡的因素进行相关性分析,筛选出影响结蜡的主因子,然后对各主因子进行相关性分析,选择相关性不大的主因子,弃掉相关性大的主因子。然后基于神经网络算法建立多因子预测油井结蜡的模型。通过该模型就可以得到油井的结蜡趋势,在油井结蜡前加入化学防蜡剂,可有效防止结蜡问题,提高油田产量。

4)油田产量预测

在油田生产中,对油田产量的精准预测是油田工作者的重要研究内容之一[6]。传统的预测方法,由于这些方法的预测原理和应用条件各不相同,在油田生产中会产生大量复杂的数据,这些方法在预测油田产量时,会表现出各自的局限性,不能准确的预测油田的产量。调用油田开采数据仓库的数据,基于数据挖掘方法,首先对影响产量的各个因素与产量之间做灰色关联分析,对其关联度进行排名,剔除关联度小的影响因素,筛选出影响产量的主因子,再基于时间序列分析方法预测影响产量主因子的基本生产数据,最后通过Adaboost神经网络建立预测油田产量的模型。基于数据挖掘技术的预测油田产量模型可有效适应油田生产数据复杂多变这一状况。大大提高了油田产量预测的精度。

5)油田注水决策

常规油田开发中后期,会出现油井压力不足的问题,油井产量超低,油井注水可有效解决这一问题。随着智慧油田的建设,油田注水开采过程中已经累计了海量的生产数据,这些数据体量巨大、种类繁多、结构复杂,传统的分析方法对于处理这些数据已经力不从心,此时数据挖掘方法就显得尤为重要。首先选取注水单耗为目标参数,分析其与注水生产中其他参数的关联度,筛选出与注水单耗关联度最高的生产参数,然后改善其筛选出来的参数来降低注水能耗。运用ARIMA模型对注水系统中的主要参数进行未来趋势预测,然后根据设定这些参数的上限值来建立预警机制,当预测值超过上限值时,提醒工作人员应该调整注水制度。

4 结语

与传统的分析方法相比,数据挖掘方法可有效解决智慧油田数据难处理的问题。油田开采过程中数据挖掘技术的应用可大大降低油田的开采成本,提高油田的开采效率,进而提高油田的效益。数据挖掘技术的使用是数字油田到智慧油田转变的最重要一环。

猜你喜欢

结蜡液面油井
时序示功图驱动的抽油机井结蜡预测及清蜡效果评价
双辊薄带连铸结晶辊面对液面波动的影响
延长油田高含水油井井筒结蜡速率预测模型优化
分子热运动角度建立凹凸液面饱和蒸气压的物理图像∗
井筒结蜡原因分析及治理措施
油井井筒蒸汽热洗清蜡技术研究与应用
吸管“喝”水的秘密
注CO2采油井油管柱腐蚀速率预测
新型油井水泥消泡剂的研制
一种油井水泥用抗分散絮凝剂