数据挖掘聚类算法在斜井抽油扶正器设计中的应用
2013-12-04王学军刘学军赵永峰
王学军,刘学军,王 龙,李 莎,赵永峰
(1.南京工业大学电子与信息工程学院,江苏南京 210009;2.承德石油高等专科学校,河北承德 067000;3.中国石油天然气管道通信电力工程总公司,河北廊坊 065000)
对于斜井抽油生产过程来说,影响其工作的因素有很多,包括井眼轨迹、抽油机的杆柱组合、井底流压、扶正器的位置等多个因素,对于抽油杆来说,其工作状态与效率,将直接影响整个抽油过程,在对抽油杆的设计中,为防止由于受力、井斜、井深等多方面的影响,可以使用扶正器将抽油杆进行固定,达到防止“失稳”的效果,本文就是通过数据挖掘的聚类算法对扶正器设计的研究应用。
1 聚类算法中的k-均值划分算法的描述
1.1 聚类算法的划分方法描述
聚类的划分算法是指,对于给定对象的数据库,利用目标函数最小化的方法,通过迭代把数据分成n个组,每个组成为一个簇,这样的过程称为划分。
划分方法必须要满足两个条件:
1)每个分组至少包含一个对象;
2)每个对象必须属于某一个分组。
1.2 k-均值算法
1)算法定义
k-均值算法是比较流行的聚类算法,其含义是指利用簇内点的均值或加权平均值(质心)作为簇的代表点。
2)算法实现的核心思想
通过迭代把数据对象划分到不同的簇中,以求目标函数最小化,从而实现通过迭代所生成的簇尽可能地紧凑和独立。
3)算法实现过程
首先,随机选取k个数据作为初始的k个簇的质心;
其次,将其余对象根据其与各个簇质心的距离分配到最近的簇中;
再次,求新形成的簇的质心;
最后,上述三个步骤重复执行,直到目标函数最小化为止。
4)算法流程图(见图1)
2 基于划分方法的斜井扶正器位置设计及实验过程
2.1 斜井扶正器的设计思路
对于目前石油工业比较流行的斜井抽油,扶正器的设计(包括个数、位置等方面)也将影响生产过程及效率。影响扶正器设计的因素很多,包括抽油机的杆柱组合、抽油杆的使用频率、斜井所在的地理位置等。斜井抽油生产过程中扶正器设计的目标就是利用较少的扶正器防止抽油杆失去稳定性,达到正常生产的目的。本文通过数据挖掘的K均值算法对井深、井斜角等数据的分析,将数据划分成不同的簇,达到实现设计扶正器位置的目标。
2.2 实验数据
以某油井(测深不超过400 m的井段)为例,根据测量得到下面的数据表(如表1所示)。
表1 实验数据表
续表
2.3 扶正器的个数计算
根据该井段的数据分析来看,在这个测深不超过400 m的井段,井眼轨迹的变化不是很大,因此可根据扶正器安装个数的计算公式aL3-2FL2+λEI=0得到,通过计算可知在该井段大约需要安装4个扶正器。
2.4 扶正器的位置设计
根据数据挖掘聚类算法中的k-均值算法,对于实验数据为14个数据(即n=14),需要划分的簇个数为4(即k=4),也就是将14个数据划分到4个簇中,从而确定其均值(即扶正器需要安装的位置)。
第一步:随机选取4个对象为簇的质心,根据该斜井段数据变化比较规律的特性,可将扶正器均匀分布到该井段,因此,可选取4号点(测深56)、8号点(测深170)、10号点(测深227)、13号点(测深340)这四个点为簇的质心。
第二布:利用如下的曼哈坦距离公式,计算其余的10个点到4个质心的距离。
以8号点(测深170)为例,将8号点的数据作为初始的平均数据,计算结果(见表2)。
表2 利用曼哈坦距离公式的计算结果
根据计算结果,按照距离最近的原则,将观测点分配到相应的簇中,得到了4个簇的划分结果为:(1,2,3,4,5)、(6,7,8,9)、(10)、(11、12、13、14),这样的结果和我们预想的结果不同,不是均匀分布的结果。
第三步:将得到的4个簇重新计算均值,结果见表3:
表3 4个簇重新计算均值的结果
第四步:以新的均值(质心)作为依据,按照第二步重新划分簇,对其数值改变后,按照距离最近的原则,重新进行簇的划分,结果为:(1,2,3,4)、(5,6,7,8,9)、(10)、(11、12、13、14),结果发生了变化。
第五步:对新的簇进行均值的计算(即求质心的过程),结果见表4:
表4 质心的位置数据
将该结果与第一次均值比较,发现,前面两个簇的均值发生了变化。
第七步:利用新的均值(即质心)进行最小距离求解,结果没有发生任何变化,说明计算过程结束。
2.5 计算结论
通过分析,在该口井的不超过400 m深的井段,将安放4个扶正器,分别在测深为30.5 m、141.2 m、227 m、319.75 m处安放扶正器,效果最佳。
3 结束语
通过研究可以发现,在以石油工程斜井抽油生产为代表的工程实践中将产生很多的工程数据,这些数据之间存在很多的联系,通过对数据的研究,可得到很多的有用信息,这些信息将对工程生产实践起到重要的支撑作用,这些应用也将对数据挖掘技术的应用领域起到拓展作用,同时也为相关领域的工程数据处理和预测提供了思路。
[1]王学军,田乃林,高书香.斜井抽油相关数据的处理方法[J].油气田地面工程,2011,30(6):3-4.
[2]檀朝东,张嗣伟.钢丝绳杆泵抽油系统优化设计方法及现场应用[J].石油学报,2005,26(6):104-108.
[3]覃成锦.斜井抽油杆扶正器安放间距三维计算[J].石油机械,1997,25(5):47-48.