数据挖掘技术在石油工程的应用
2018-02-17李俊峰韩佳晟刘志庆
韩 宇,李俊峰,韩佳晟,刘志庆
(1东北石油大学现代教育技术中心 黑龙江 大庆 163318)
(2大庆采油一厂工程技术大队 黑龙江 大庆 163318)
(3大庆采油一厂四矿 黑龙江 大庆 163318)
数据挖掘技术在石油工程的应用
韩 宇1,李俊峰2,韩佳晟3,刘志庆2
(1东北石油大学现代教育技术中心 黑龙江 大庆 163318)
(2大庆采油一厂工程技术大队 黑龙江 大庆 163318)
(3大庆采油一厂四矿 黑龙江 大庆 163318)
随着信息技术的飞速发展,计算机技术在全球迅速普及,大数据时代已然来临,各行业的信息化系统逐步建立起来,如何从海量数据中挖掘出真正有价值的信息成为数据挖掘研究的主要方向。本文谨以油田大数据时代为例,简要分析数据挖掘技术在石油工程行业应用现状,针对数据挖掘技术在石油工程行业的应用提出几点建议。
数据挖掘;石油工程;应用
1 引言
随着计算机技术在全球的迅速普及,数据库、数据仓库、数据海洋的变换发展,各行业、行业间的信息量、数据量正在迅速增长和膨胀。在铺天盖地的数据狂潮中,如何通过不同方法从不同数据资料中分析寻找到有意义的信息,是需要数据挖掘来完成的重要任务。
2 油田大数据时代
1980年,人们发现大数据这一名词,2009年,世界各国信息技术行业开始重视数据的分析和利用,2012年,美国政府投资2亿美金推动大数据发展,大数据发展迅速升级为国家战略。很多著名的石油工程公司开始分析利用大数据,寄希望于海量、高增长率、多样化的信息资产中可挖掘、待挖掘的信息,希望能够在大数据时代中占据鳌头,为企业运行带来更多的经济收益。在数据管理方面,国际石油公司中的油田数据管理已经不再是传统的数据库管理模式,而是将自动词盘库和磁盘阵列两相结合的一种超大规模计算机存储管理[1]。我国不断提高的石油勘探技术,使得石油工程行业内,可供分析的数据一直呈现出上涨的趋势,智能油网和互联网之间联系日益密切,大数据时代已然来临,使用数据挖掘技术进行数据分析对提高油田产量具有非凡的意义。
3 数据挖掘技术在石油工程行业应用现状
数据挖掘就是按企业既定业务目标,对大量的企业数据进行分析,提取出隐藏的、未知的、潜在有用的信息和知识,且进一步将其模型化的过程。在实际工作中,数据挖掘任务通常被分为两种:一种是描述,另一种是预测。描述性任务指的是以简洁概要的方式描述数据,而预测性任务就是以当前已有的数据集为基础,使用特定方法对现有数据进行分析,获得一个或一组数据模型,并将该模型用于预测未来新数据相关性质和发展趋势。
在石油工程行业内,需要使用数据挖掘技术,对现有大量油田生产实际数据进行分析,生成数据模型;在进行预测的过程中,用户可以根据油田产量及发展趋势选择最适合的模型,用模型预测油田产量、指导油田生产。在输入待分析的最终数据集时,还需要输入相应模型生成过程各方面相关参数数据的最新资料,才能将油田产量作为最主要的变量数据进行预测;在分析关联数据时,还需要考虑特定的、已知的影响油田产量的因素。
4 数据挖掘技术在石油工程行业的应用
4.1 支持向量机回归定量预测无阻流量
首先选择31口井,将这些井作为训练数据,接着再选择3口新井,用这3口新井的数据进行结果验证。初步可以确定影响无阻流量的因素,其中包括:孔隙度、有效厚度、含气饱和度、液氮量还有净液量等。等到都确定了之后,运用向量机回归的办法建立定量预测模型。在模型建立的过程中,对径向基核函数进行选择,通过产生的相关图表结果,对结果进行研究分析,结合当地实际油田的情况,确定向量机回归方法存在的意义。
4.2 预测堵水后的含水量
首先可以选择28口井为训练的数据,接着再选择2口井进行外表验证。在分析了可能影响堵水后含水量因素后,基本确定以下几点:堵剂用量、堵前累产液量、堵剂类型、工具类型、措施采取前日产液量、措施采取前含水量等。这时候运用支持向量机回归法,定性定量的对预测模型进行建立,运用多项式核函数,保证数据,发现2个数据的结果都比较好[2]。
4.3 堵水后日产液量的定量预测
首先采用26口井为训练数据,接着再选择3口井当作外表验证数据。初步简单分析堵水后日产液量可能出现的影响因素的时候,发现影响因素主要有:堵水地质类型、堵前累产液量、堵前累产液量、措施前日产液量、措施采取前的含水量等[3]。通过应用支持向量机回归法,对实验过程中可能出现的误差数据进行严格控制,得到比较好的结果。
4.4 碳酸盐岩油藏堵水工艺有效性预测
在对训练产生的数据进行选择的时候,可以首先选择58口油井接着再选择3口新井,把得到的数据运用到外表验证数据中,接着分析对碳酸岩油藏堵水所造成的影响,最后得出的结论包括堵前累计油、含水上升特征、堵水特质模型和堵剂类型等。接着通过支持对向量机进行分类的方法,智能优化软件系统,规范创建分类模型,在建立分类模型的过程中,根据自身需要可以使用径向基核函数,最后根据得到的建模结果图再对具体情况进行实际分析。
5 结语
综上所述,在数字化迅速发展、科学技术日益进步的当今社会,我国石油工程行业要想稳定发展,拥有良好可观的发展前景,需要掌握、分析和利用好现阶段可使用的数据,这也是提高我国石油工程行业竞争力的重要手段。通过良好的科学技术对石油工程行业进行改革、优化,大力发展数据处理技术,对数据进行科学的分析预测,解决实际出现的问题,我国石油工程行业必然能够更快更好地发展。
[1]檀朝东,张恒汝,马永忠,杨兵,王辉萍.油气生产大数据挖掘系统的研究及应用[J].数码设计,2016,06(01):49-52+5.
[2]张冬梅,周英操,纪荣艺,赵庆,蒋宏伟,王荣,卢静.面向钻井工程技术的数据仓库应用探讨[J].信息技术,2012,08(03):6-9.
[3]马鹏鹏,周英操,蒋宏伟,连志龙,赵庆,赵亦朋.现代信息技术在石油钻井中的应用研究——关于钻井信息工程学的探讨[J].石油天然气学报,2014,12(07):89-95+6.
TP311.13 【文献标识码】A 【文章编号】1009-5624(2018)01-0005-02
韩宇(1973-),女,汉族,黑龙江省大庆市,硕士,高级工程师,研究方向:数据挖掘及云计算。