APP下载

k-means聚类算法在油水界面检测中的应用

2014-08-02刘远红习玉阳吴华远郑敏红李艳平

化工自动化及仪表 2014年1期
关键词:沉降罐混合液油水

刘远红 习玉阳 吴华远 郑敏红 李艳平

(1.东北石油大学电气信息工程学院,黑龙江 大庆 163318;2.大庆钻探集团钻井一公司,黑龙江 大庆 163453;3.中国石油抚顺石化公司,辽宁 抚顺 113000;4.大庆油田水文地质公司,黑龙江 大庆 163453)

原油储罐内油水界面高度是保证油水分离正常运行的重要参数。因此,快速准确地检测出油水界面是确定出水量、出油量的关键,同时这个参数也为了解油井产量及油井寿命等提供可靠的依据。油水分离技术是一个很复杂的过程,通常是在油水混合物中加入一定量的化学药剂,并将其在原油沉降罐中进行自然沉淀,由于油、水的密度不同,分离后在沉降罐底部一般为纯度较高的水,中部为油水乳化液,上部通常为油。但是由于油和水在沉降罐中形成不同形态的油水乳化液,在界面处形成一个乳化带,乳化带的状态是一个复杂的随机变化过程,乳化带中矿物质的含量、界面的弹性及压力等参数都会影响该过渡带的稳定性,因此,油水界面检测难度较大[1,2],通常采用测量溶液电容值的变化,并依据工人的经验对油水界面的位置和乳化带的宽度进行大致估计。

国内外油水界面测量仪根据测量方式的不同,可分为接触式和非接触式两种,接触式常用的检测方法有电容法、浮球法及差压法等,非接触式则有超声波、射频导纳、短波吸收及射线法等。接触式与非接触式检测方法各有自己的优缺点。接触式检测由于直接与被测物接触,因此一般精度较高,但当被测物具有酸碱等腐蚀性时,长时间使用必然会对传感器产生损伤,影响传感器的使用寿命;非接触式测量精度一般较接触式低,但由于其不与被测物接触,因此使用寿命相对较长。目前油水界面检测仪研究的主要方向大都集中在传感器等硬件的改进上[3,4],而对采集后的信号分析和处理研究较少,并且由于复杂的现场环境、油水乳化液本身状态变化的随机性及非平稳性等因素的影响,传统上仅依据计算各层混合液导电率的拐点来判断油水分界面,精度较低并且稳定性较差。为此,笔者以电容式传感器检测到的数据为基础,对采集到的数据进行滤波处理,并采用三次样条插值方法增加原始数据的点数,以提高数据的精度,由于油层、乳化层和水层的数据分别具有比较明显的时域特征,因此最后利用k-means聚类算法辨识出油水界面和乳化宽度。

1 油水界面检测系统①

通过测量油水混合液电容值的方法,定位油水界面是油田常用的检测方法之一。沉降罐中的界面检测系统如图1所示,罐内由上到下分别为油层、乳化带和水层。

图1 沉降罐中油水界面检测系统示意图

电容式传感器直立在原油沉降罐中,由于制作工艺和安装的限制检测点并不是连续的,通常是每隔20cm安装一个检测点,标准沉降罐高度为3.2m,共16个检测点,采集系统负责将采集到的电容值信号通过RS485协议送入计算机,计算机对数据进行计算分析,以确定油水的界面和乳化带的宽度。

2 油水导电率数据处理

2.1 三次样条插值

检测油水混合液电容值的传感器直立在沉降罐中,受制作工艺的限制混合导电率的测量并不是连续的而是每隔一段距离安装一个电容,通常一个标准的沉降罐中的检测点数为16个,数据点数过少,导致在两个测量点之间的混合液的导电率完全未知,测量精度不高,因此,笔者提出通过在检测点中进行插值,预测出未检测处液体的电容值,以提高最终确定油水界面位置及乳化带宽度的精度。插值[5]与拟合[6]的主要区别在于,插值函数需要完全通过已知点,而拟合则不需要。在确认所采集到的点精确的前提下,通常采用插值法,最常用的插值函数为多项式函数,插值函数的次数越高其精度也越高,同时兼顾精度与计算的复杂度,笔者采用三次多项式进行插值。

设在每个小区间[xi,xi+1]上可以写成:

s(x)=aix3+bix2+cix+di,i=0,1,2,…,n-1

(1)

其中ai、bi、ci、di为待定系数,可通过以下方程求解:

(2)

这样就得到光滑三次样条曲线,由此即可得到整个沉降罐中任意点的液体导电率数值。

2.2 k-means聚类算法

在分离油水混合液的过程中,混合液本身所含的矿质、加药量和沉淀时间的不同,在沉降罐中的混合液,甚至是分离出来的纯油或纯水的导电率是没有一个统一基准的,因此无法采用绝对值的方法来确定沉降罐中的油水界面和乳化宽度,但在正常情况下,沉降罐中从底部到顶部混合液电容值的变化是单调的,符合一定变化规律,时域特征比较明显,因此可通过采用k-means聚类算法将纯油、乳化带和纯水的位置辨识出来[7]。

k-means聚类算法属于一种无监督聚类,以欧式距离作为相似测度,它是求对应某一初始聚类中心向量最优分类,使用评价指标误差平方和准则函数作为聚类准则函数。算法的最大优势在于简洁和快速。算法的关键在于初始中心的选择和距离公式。k-means聚类算法步骤描述如下:

a. 对于数据对象集,任意选取k个对象作为初始的类中心,通常可选择某个邻域数据的平均值作为类中心;

b. 根据类中对象的平均值,对任意一个样本,求其到c个中心的距离,将该样本归到距离最短的中心所在的类;

c. 更新类的平均值,即计算每个类中对象的平均值;

d. 重复步骤b、c;

e. 直到平均值不再发生变化。

3 实验仿真

为了验证笔者所提油水界面检测方法的有效性,选取现场沉降罐中的实际数据。沉降罐高3.2m,每隔20cm安装一个油水混合液导电率检测点,共计16个检测点,表1为对沉降罐中的油水混合液进行采样得到的一组数据,其中电容值在500F以下的为油,1 500F以上的为水,500~1 500F的为乳化层。

表1 现场实际数据 F

以Matlab作为处理工具,采用interp1插值函数对信号进行128点插值,插值前、后数据曲线分别如图2、3所示。从图2中可以看出,由于安装的检测点数过少导致采集到的数据过于稀疏,两检测点的数据无法获知,在计算过程中单个点的变化对最终结果影响较大;从图3中可以看出,当对数据插值后,数据点数增加,单点的变化对最终结果影响较小,提高了油水界面的定位精度。

图2 插值前电容值

对油水混合液电容值曲线分别利用计算拐点和k-means聚类算法,确定油水界面的位置和乳化带宽度,仿真结果如图4、5所示。

图4 拐点法定位油水界面

图5 k-means聚类定位油水界面

图4中*为曲线的拐点,取相邻两点差值最大的拐点作为油水界面,两拐点间为乳化层,使用该方法时当数据稍有波动就会产生较大的误差,容易将曲线的局部凹凸波动误认为曲线的拐点,而导致错误的定位,因此鲁棒性较差,并且该方法只是通过寻找相邻两拐点的最大差值来定位界面,保守性较强导致精度较低。而笔者所提出的k-means聚类算法,避免了拐点的计算,能够准确定位出油水界面的位置和乳化带的宽度,仿真结果显示最后的定位结果不会因个别数值小范围的波动而受到影响,具有良好的鲁棒性,并且由于笔者对采样数据进行插值,几个点的误差并不会对最终结果有太大的影响。

4 结束语

以传统的电容式传感器采集到的油水混合物电容值数据为基础,采用三次插值法对其进行插值,以增加数据的密度提高精度,并利用k-means聚类法对数据进行聚类分析,识别出油水界面,避免了传统拐点法的伪拐点现象以及过于保守性的影响,提高了检测系统的鲁棒性和实用性,并在实际应用中进行了验证。

猜你喜欢

沉降罐混合液油水
硅油和矿物油混合液分层速度的影响因素
水平井油水两相中的RAT流体成像分析
污水沉降罐介质腐蚀性分析
油水混合
油水两相流超声波衰减测试方法
喇嘛甸油田外挂水箱式污水沉降罐出水工艺探讨
误区:维生素K需补充,但要远离“油水”
胆汁胰液混合液溶解颈动脉粥样硬化斑块的体外实验研究
污水沉降罐过渡层组分分析与治理方法
沉降罐在非正常工况下的调节