以吨液百米举升耗电量为目标的大数据分析应用
2015-09-26耿玉广杨小平黄少伟张文静周正奇华北油田公司采油工程研究院河北任丘0655华北油田公司第一采油厂河北任丘0655
李 鑫 耿玉广 杨小平 黄少伟 张文静 周正奇(.华北油田公司采油工程研究院,河北任丘 0655;.华北油田公司第一采油厂,河北任丘 0655)
以吨液百米举升耗电量为目标的大数据分析应用
李鑫1耿玉广1杨小平1黄少伟1张文静1周正奇2
(1.华北油田公司采油工程研究院,河北任丘062552;2.华北油田公司第一采油厂,河北任丘062552)
应用大数据挖掘技术可实现将采油工程海量数据转化为可用于指导油田生产的意见。由于影响吨液百米举升耗电量指标的因素众多,对于何种因素是影响区块或单井吨液百米举升耗电量指标的主要因素并不十分明确,这就需要利用大数据挖掘技术来剖析各种因素对吨液百米举升耗电量的影响。以吨液百米举升耗电量为目标,建立了相应的数学分析模型,基于油田生产数据库的海量数据,开发了数据挖掘软件,挖掘出影响阿尔油田机采井吨液百米举升耗电量的数十个关联因素,定量化泵效、沉没度等指标范围,并预测了吨液百米举升耗电量指标的未来的变化趋势,提出了措施调整建议。编制的采油工程大数据软件是实现大数据管理、数据挖掘、结果呈现的载体,包括系统管理、数据预处理、功能模块、功能应用、图形报表展示、分析模型、进程可视等功能,为用户提供了实用的数据挖掘工具平台。
智慧油田;大数据;耗电量;数据挖掘;算法模型
当前,大数据挖掘技术与石油工程领域还没有做到充分结合,应用也并不广泛。有部分学者将数据挖掘技术应用到石油工程领域,如G. Zangl[1]通过建立数据挖掘模型,进一步保证了油田各项数据的质量,实现了对油井或整个生产系统的监视,对提高油气田产量具有重要意义。随着华北油田勘探开发工作的不断深入和数字油田建设的快速发展,在油气生产过程中积累了海量数据,为应用大数据挖掘技术提供了坚实的基础。采用数据挖掘算法和技术能够充分利用多专业的大数据,挖掘出蕴含在海量数据中不易发现的规律,在此基础上综合考虑多种因素变化,预测这些因素对未来生产动态的影响。以吨液百米举升耗电量为挖掘目标,进行大数据分析研究,挖掘各种影响因素与吨液百米举升耗电量之间的内在隐蔽规律,综合考虑多种因素对未来抽油机井系统效率、吨液百米举升耗电量的影响,准确采取降低吨液百米举升耗电量的措施手段。
1 大数据挖掘软件系统
油气田领域的应用数据库独立而分散,结构化数据和非结构化数据并存,为了使这些数据产生效益,将大量的实际数据作为样本点,通过相应的数学分析方法对这些样本点进行分析,得到其中的变化规律和各个样本参数间的关联性[2]。
数据挖掘又称为数据库中的知识发现,是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含其中的、不为人们所知的、但又有潜在应用价值的信息和知识的过程[3]。
1.1总体设计
通过建立主题数据库,从相关数据库中获取所需数据,并配置包括灰色关联、因素分析、聚类分析等多种数据挖掘算法,形成数据挖掘平台,对大量多维、多源数据进行关联分析与预测工作,并以图表、报表等形式进行成果展现,形成基于吨液百米举升耗电量指标的大数据挖掘系统应用。如图1所示。
图1 数据挖掘软件平台系统总体设计
1.2数据准备
吨液百米举升耗电量指原油在开采过程中把1 t液体从地下提升100 m所消耗的电能。
单井吨液百米举升耗电量计算公式[4]
式中,X为单井吨液百米举升耗电量,kW·h/(100 m·t);W为单井日耗电量,kW·h;Q为单井日产液量,t;H为有效扬程,m。
在油田生产中涉及吨液百米举升耗电量指标的因素很多,已知的有:产液量、含水率、井液黏度、井口回压、套压、沉没度、冲程、冲次,泵径、油管直径、泵挂深度、杆柱组合,抽油机井系统效率(井下效率、地面效率)、泵效,电机输入功率、电机功率、电机负载率、抽油机平衡率等。未知的有:环境温度、调参时机、洗井次数、清蜡周期、增注量等。而产液量、电机功率其数值与吨液百米举升耗电量没有直接的线性关系[5],所以需要通过统计、分析找出其相关性。
1.3挖掘算法
在数据仓库的基础上,采用了灰色关联方法、因素分析法和聚类分析法等多种数据挖掘算法建立挖掘模型,对大量多维、多源数据进行关联分析与预测工作[6]。
1.3.1灰色关联方法任何随机过程都是一定范围、一定时区变化的灰色量,其随机过程为灰色过程。对于抽油机井吨液百米举升耗电量,各影响因素不是确定值,而是一个变化范围。灰色理论分析方法是一种动态发展态势的量化描述和比较方法[7]。亦即“灰色关联度”,作为衡量因素间关联程度的一种方法。
设母序列为{X0,(k)},子序列为{Xi,(k)},其中k=1,2,…,N;i =1,2,…,m。N为时间序列长度,m为影响因素个数。
由于系统中各因素的物理意义不同,导致数据的量纲也不一定相同,因此在进行灰色关联度分析时,一般都要进行无量纲化的数据处理。
极大值法——无量纲化数据处理
则关联系数,当t = k时
其中
式中,∆ymin、∆ymax为各个时刻绝对值差的最小值与最大值;ρ为分辨系数[0~1],通常取0.5。
关联度
通过对吨液百米举升耗电量的影响因素进行灰色关联分析,生产决策者可掌握影响吨液百米举升耗电量指标的最重要的影响因素排名,并根据影响程度排名有的放矢地采取相应措施,降低吨油百米举升耗电量,提高抽油机井生产管理水平。
1.3.2因素分析法因素分析法又称连锁置换法或连锁替代法,是通过逐个替换因素,确定相互联系的因素对分析指标变动影响程度的一种方法[8]。实时分析机采井各部分工作状态的参数大小,建立指标评价标准,应用模糊隶属函数标准化方法把指标进行归一化,对各个指标进行评价。
越大越优型
越小越优型
适中型
式中, OFMij为第i个因素的第j个客观指标的隶属度,亦为标准化计量值;OFij为第i个因素的第j个客观指标的计量值;OFijmax为第i个因素的第j个客观指标的最大可能值;OFijmin为第i个因素的第j个客观指标的最小可能值; OFbe为第i个因素的第j个客观指标的最优值。
单因素分析指标级别分为好(0.75~1.0)、较好(0.5~0.75)、一般(0.25~0.5)和差(0~0.25)。通过影响因素分析法可对影响吨液百米举升耗电量指标的几个因素进行评价,并与其评价标准进行比对,就可得到各影响因素的评价级别,进而分析得到导致吨液百米举升耗电量指标低的具体原因,对抽油机井工作参数进行调整,进一步提高抽油机的系统效率,降低吨液百米举升耗电量指标。
1.3.3聚类分析法根据事物的特征对其进行聚类或分类,以期发现规律和典型模式。这类技术是数据挖掘技术的最重要技术之一[9]。聚类分析是归纳的,不需要事先确定分类的准则来分析数据对象,不考虑已知的类标记,聚类目标就是通过聚类算法产生这种标记。
通过研究吨液百米举升耗电量所在区块的分布,能够很好地根据吨液百米举升耗电量指标对多口抽油机井进行分类,发现高耗能井的规律,从而研究各类吨液百米举升耗电量指标特征,并根据现场实际情况做出客观评价。
1.4系统平台
软件平台是实现数据挖掘、结果呈现的载体,包括分析系统、功能模块、分析模型、功能应用、进程可视、结果展示等功能,满足用户选用适合的挖掘算法、定制曲线图表等,数据挖掘软件平台构成见图2。
图2 数据挖掘软件平台构成示意图
2 大数据挖掘应用
采用阿尔、岔河集油田近400万条油井实时生产数据,结合抽油机井基础数据、示功图计量和系统效率分析数据以及当地同期气温数据,建立了针对吨液百米举升耗电量挖掘任务的主题数据库,并利用配置的各种基础、专业和高级挖掘算法对其进行数据挖掘工作,从中发现和总结影响吨液百米举升耗电量指标的相关规律,提出了更加有针对性的降低吨液百米举升耗电量指标的措施。
2.1基础挖掘实例
通过对不同数据以曲线图、柱状图、散点图、饼图和泡状图等形式进行直接展示,可以对某一个参数进行连续显示,从中找出数据的变化规律,实现单口油井生产数据分析;也可以通过井与井间的数据对比,发现井间的差异,实现油井间的对比。以XX井在一年半的时间里吨液百米举升耗电量的变化为例,可以发现吨液百米举升耗电量随时间是在不断变化的,从中反映管理水平;结合井位图直观地展示一个区块内多口油井的吨液百米举升耗电量,其中图形越大,表明耗电量越高。
2.2专业挖掘实例
通过分析环境温度与吨液百米举升耗电量关系,可以发现,环境对吨液百米举升耗电量有一定影响,气温高,吨液百米举升耗电量低;气温低,吨液百米举升耗电量高。通过分析某区块某一时间内全部油井的耗电量情况,可以看出大部分井都在合理区,也有部分井处在潜力区,通过采取适当措施可以降低耗电量;部分井可能数据有问题需要落实,这就为下一步在哪些井上采取措施提供了方向。
2.3高级挖掘实例
随机选择Ax井的16个与吨液百米举升耗电量可能有关的因素,采用灰色关联度分析方法,得到相关度及排序,见表1。从表1可以看出,Ax井沉没度、泵效、有效功率、泵功率和日产液对吨液百米举升耗电量的影响最大。该井泵效(23.62%)和日产液量较低(3.4 t/d),且处于下降趋势,建议该井通过调整抽汲参数提高泵效和产液量,进而可降低吨液百米举升耗电量。
表1 Ax井吨液百米举升耗电量的影响因素排序
选取A井区某一天的所有井数据,对与吨液百米举升耗电量关联度较高的沉没度和系统效率2个因素为研究对象,先聚类归纳后再进行平均处理得到关系曲线。图3显示随沉没度增加,吨液百米举升耗电量先逐渐减少然后增加,而系统效率随着沉没度的增大先增大后减少。因此,A井区合理沉没度区间应控制在400~650 m之间。
图3 A井区沉没度、系统效率与吨液百米举升耗电量聚类分析
3 结论与建议
(1)通过对吨液百米举升耗电量大数据分析方法的研究应用,为在油田各工程领域应用大数据分析技术提供了很好的借鉴作用。
(2)以吨液百米举升耗电量为分析目标,结合基础、专业及高级挖掘算法库开展的大数据分析研究工作,为油田工程技术研究提供了一套新的数据分析方法。
(3)大数据挖掘就是通过“回头看”,把前期大量的生产数据,经过分析、对比,找出产生问题的原因,提出解决的办法,达到优化生产运行参数、节能降耗的目的。
[1]ZANGL G, OBERWINKLER C P, Schlumberger. SPE annual technical conference and exhibition[R] . Houston, Texas, 26-29 September 2004.
[2]刘国民,孟祥菊,李亚,等.数据挖掘技术在油田上的应用[J].内蒙古石油化工,2009(16):92-96.
[3]王宏威.油田数据挖掘技术的研究与应用[D].黑龙江大庆:大庆石油学院,2005-02.
[4]DB21/1740—2009,原油(气)液生产吨液百米用电限额与计算方法[S].
[5]姜海涛.单井电量计量在节能对标方面的应用[J].油气田地面工程,2013,23(9):100.
[6]檀朝东,岳晶晶,吴丽烽,等.数据挖掘技术在油藏挖掘软件中的应用[J].中国石油和化工,2010(10):66-67.
[7]胡永宏,贺思辉.综合评价方法[M].北京:科学出版社,2000:129-140.
[8]龚攀,刘金兰,张婷婷.基于因素分析法的石油企业利润影响因素分析[J]. 价值工程,2011(35):131-132.
[9]吕安民,林宗坚,李成名.数据挖掘和知识发现的技术方法[J].测绘科学,2000,25(4):37-38.
(修改稿收到日期2015-06-26)
〔编辑景暖〕
Big data analysis and application targeted at power consumption by lifting one ton of liquid to 100 m
LI Xin1, GENG Yuguang1, YANG Xiaoping1, HUANG Shaowei1, ZHANG Wenjing1, ZHOU Zhengqi2
(1. Research Institute of Oil Production Engineering, Huabei Oilfield Company, Renqiu 062552, China; 2. No.1 Oil Production Plant, Huabei Oilfield Company, Renqiu 062552, China)
The use of big data mining technology can transform the mass data of oil production engineering into ideas of guiding oilfield production. There are numerous factors which affect the power consumption indicators for lifting one ton of liquid to 100 m, so it is not quite clear which is the main factor that affect the power consumption indicators for lifting. This will need the big data mining technology to analyze the effect of various factors on power consumption indicators for lifting. With the goal of power consumption for lifting, a relevant mathematic analytic model was built, and data mining software was developed based on the mass data of oilfield production database, and tens of related factors were mined which affected the power consumption for lifting in artificially lifted wells of Al Oilfield. The target scope of pump efficiency and submergence was quantified. The future trend of power consumption indicators for lifting was predicted, and suggestions for related measures and adjustment were come up with. The developed big data software of oil production engineering was a carrier which realized big data management, data mining and result presentation, including functions like system management, data preprocessing, functional modules, function application, display of graphic report, analytic model, and progress visualization, providing a practical data mining tool platform for our customers.
intelligent oilfield; big data; power consumption; data mining; arithmetic model
TE355.5;TE19
A
1000 – 7393( 2015 ) 04 – 0076 – 04
10.13639/j.odpt.2015.04.020
华北油田公司中长期重大科研项目“智慧油田研究与实践——油气田自动化生产指挥系统及采油工程云系统研建”(编号:2013-HB-Z1010)。
李鑫,1962年生。1984年毕业于华北石油职工大学油田自动化专业,从事油田自动化技术研究与应用工作,高级工程师。电话:0317-2727695。E-mail:cyy_lixin@petrochina.com.cn。
引用格式:李鑫,耿玉广,杨小平,等.以吨液百米举升耗电量为目标的大数据分析应用[J].石油钻采工艺,2015,37(4):76-79.