APP下载

应用时序分析ARIMA模型预测抽油井生产系统效率

2017-10-13李欣伦檀朝东檀芃菲张胜利

数码设计 2017年1期
关键词:抽油机油井差分

李欣伦,檀朝东*,檀芃菲,2,张胜利



应用时序分析ARIMA模型预测抽油井生产系统效率

李欣伦1,檀朝东1*,檀芃菲1,2,张胜利3

(1.中国石油大学(北京),北京昌平,102249;2. 新南威尔士大学,悉尼,NSW2052;3.华北油田采油工艺研究院河北任丘,062550)

抽油井生产系统效率是抽油系统的重要工况指标。系统效率预测是指通过对历史数据的分析和研究,找出系统效率内部变化规律及影响因素之间的关联,然后对系统效率做出预测。以前,油田多采用机理模型实现系统效率预测,但因抽油井系统效率的不确定性、复杂性和时间性的特点,预测效果并不理想。因此本文建立时序分析中的差分自回归移动平均模型对华北油田抽油井生产数据进行了拟合及抽油机井生产系统效率预测。此数据模型着重强调了相邻时间点的抽油井系统效率的相关性。实验结果表明持续更新最新数据点的ARIMA模型能够及时纠正预测方向,大幅提高抽油井生产系统效率预测的准确度。

ARIMA模型;时序分析;预测;系统效率;抽油井

引言

抽油井系统效率是抽油系统的重要工况指标。抽油井生产系统是一个强的机电液耦合系统,柔性的细的细长杆传递运动和能量,不可见的井下泵运动和复杂的油液流动,都给认识带来了困难。能够精准的预测抽油经系统效率可以提前采取预防措施,控制抽油机的生产系统效率,达到节能减耗目的。

所谓预测,就是在分析以往数据的基础上预知未来可能发生的情况。然而,由于抽油井系统效率变化受到多种因子的制约,并且因子间又保持着极其复杂的关系,运用结构性因果模型对其进行预测,一般难以达到较为理想的预测效果。

所以本文考虑引入时间序列分析模型ARIMA模型对抽油井系统效率指标进行预测,为实际生产提供指导。

时间序列模型最主要的特征就是承认观测值之间的依赖关系和相关性,它是一种动态模型,能够应用于动态预测。时间序列预测方法的基本思想是:对一现象进行预测时,用该现象的过去行为来预测未来变化。即通过时间序列的历史数据揭示现象随时间变化的规律,将这种规律延伸到未来,从而对该现象的未来作出预测。ARIMA模型则在此基础上对历史数据进行了比重分配。越临近预测值的历史数据所占比例越大,越远的历史数据则对预测值影响越小。

时间序列分析方法在多个领域广泛研究并应用。自1970年Box和Jenkins的著作《时间序列分析、预测和控制》[1]问世以来,逐渐形成了一整套时间序列识别、估计建模、预测及控制的理论和方法。国内外已有许多学者对时间序列建模给予研究。1999年,查正洪[2]利用时间序列分析对上证综合指数进行建模分析与研究,从而建立了ARIMA模型。薛黎明等[3]运用ARIMA模型,对我国 2020 年前的能源消费总量及煤炭消费总量、非化石能源消费总量进行了预测,对我国能源结构现状及未来能源结构发展趋势进行了分析。袁振洲[4]在分析铁路货源数据的背部规律及其时间序列特性的基础上,采用ARIMA模型对货运煤炭总量进行了预测。张利等[5]提出了一种对ARIMA模型改进的预测算法,并对短时间内的交通流量时间序列建模,取得较准确的预测结果。文献[6-7],将方差检验引入时间序列建模的流程中,并对中国CPI时间序列进行了实例验证。在国外,Contreras.J[8]对电价进行了短期预测,得到ARIMA模型的短期预测能力要好于长期预测能力。Md Zakir Hossain等人[9]针对三种豆类的价格,通过ARIMA模型进行分析预测,发现这一模型的预测精度较高。在石油领域中,丁静之等人[10]建立ARIMA模型对1999年至2005年的国际原油价格数据进行分析,对原油价格的未来走势给出了精确判断。陈汶滨等[11]运用ARIMA方法对油田产量的递减规律进行了研究。但目前尚未有人实现用ARIMA模型对抽油井系统效率指标进行预测。

所以本文尝试引用时间序列分析模型ARIMA模型对抽油井系统效率指标进行预测,以此来实现系统效率预测从机理预测模型到数据预测模型的转变并大幅提高预测准确性。

1 ARIMA模型

1.1 模型分析与建模

设抽油机井生产系统效率的时间序列为{()},经过有限次差分可以将其转化为平稳序列。对于平稳时间序列{()},=0,±1,…,如果满足:,=0,±1,…

基于上述定义,一方面可以把AR(p),MA(q)两个模型归结为模型ARMA(p,q),另一方面在模型ARMA(p,q)中,令q=0,则ARMA(p,q)就是模型AR(p);若令p=0,则ARMA(p,q)就是模型MA(q)。由此可看出三类模型AR(p),MA(q),ARMA(p,q)之间存在着深刻的联系。

设随机序列{()},=0,±1,...,算子B满足t=t-1,=0,±1,...,那么,称算子B为一部延迟算子,且满足kt=t-k+1=t-k,==0,±1,...称k为步延迟算子引入延迟算子后,令f(B)=1-f1B-f2B2-…-fqBq,(B)=1-q1B-q2B2-…-qpBp,则有表达式:f(B)t=q(B)e(t)

1.2 ARIMA模型预测的基本步骤

基于ARIMA模型进行时序分析预测的基本思路:对于非平稳的时间序列,用若干次差分使其称为平稳序列,再用ARMA(p,q)模型对该平稳序列建模,之后反变换得到原序列。并且根据样本自相关函数、偏自相关函数的统计特性来判断随机序列适合哪一模型,进而确定其模型的阶数。

用ARIMA(p,d,q)模型作预测的步骤,如图1所示:

图1 ARIMA模型使用步骤

1.2.1 进行平稳性检验

首先得到抽油机系统效率的时间序列数据,绘制时间序列的折线图、散点图,计算该时间序列的自相关函数和偏自相关函数,从直观上对序列进行初步的平稳性判断。一般以ADF单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别。

设时间序列为{(t)}则样本自协方差为:

自相关函数为:

(4)平稳性检验

如果{(t)}的自相关函数或偏自相关函数既不截尾又不拖尾,则可以断定该序列是非平稳的。

1.2.2 平稳化处理

如果抽油机系统效率的时间序列是非平稳的,需要先对其作平稳化处理。对于非平稳的含指数趋势的时间序列,需要先通过取对数见时间序列的指数趋势转化为线性趋势,再用差分法进行处理。

对{(t)}进行差分处理,每进行一次差分处理后,对其进行平稳化处理,直至序列平稳为止,若序列{(t)}具有d次多项式趋势,则通过d次差分后可变平稳序列。

1.2.3 模型定阶及预测

对差分后平稳序列进行ARMA(p,q)模型定阶,计算出自相关系数和偏自相关系数的值之后,利用和的性质来估计自相关阶数p和移动平均阶数q的值,选择适当的ARMA(p,q)进行拟合。

ARMA(p,q)模型定阶的基本原则如表1所示:

表1 ARMA(p,q)模型定阶的基本原则

采用确定ARMA(p,q)模型对Wt进行预测。

由Wt可计算Xt:

2 实例分析

本文以华北油田XX井从2010年11月1日到2013年7月28日的产生的抽油机生产系统效率数据进行实验,首先将这1000天的抽油机生产系统效率按照时间排序得到时间序列{X(t)}。以1000个时间点作为训练样本,如图2所示,建立ARIMA(p,d,q)模型。

图2 XX井系统效率实测值

首先对时间序列{X(t)}进行平稳型检验,以ADF单位根法进行检验,发现{X(t)}为非平稳时间序列。对{X(t)}一次差分得到{X¢(t)},差分后发现{X¢(t)}为平稳时间序列,则ARIMA的d=1,差分后的时间序列{X¢(t)}如图3所示。

结合自相关函数和偏自相关函数根据ACI准则从ARMA(1,1)开始逐步尝试,可供选择p和q的组合有(1,1)、(1,2)、(1,3)、(1,4)、(2,1)、(2,2)、(2,3)、(2,4),计算每个组合的模型信息函数值(如表2所示),确定模型的类型和阶数。

图3 XX井系统效率一阶差分值

表2 各模型检验结果

pq 1234 112.1576212.2123911.6382211.92738 212.0231811.7231612.8654911.86431

当(p,q)为(1,3)时,模型信息函数达到最小值,从而选择ARIMA(1,1,3),利用ARIMA(1,1,3)模型对1000个数据中的后200个数据进行预测,将预测结果与实际数据进行对比,计算各项指标,判断预测模型是否满足要求。

表3 预测结果的各项指标

指标名称计算结果/10-3 平均误差(SE)50.5 均方根误差(RMSE)63.2 平均绝对误差百分比(MAPE)288

由表3可以看出用ARIMA(1,1,3)预测模型预测结果十分接近真实值,预测效果很好。

图4 第一次预测效果图

图5 两次预测效果图对比图

首先2010年11月1日值2013年1月9日的800个样本数据作为历史数据,预测之后的2013年1月10日以后的200个时间点的系统效率值,得到结果如图4所示。然后将2010年11月1日值2013年4月19日产生的900个实测数据点作为历史数据预测之后2013年4月20日以后的100个时间点的系统效率值,将预测结果与第一次预测结果进行对比(如图5所示),发现第二次的预测值与系统效率的实测值更为接近,可以看出ARIMA(1,1,3)模型的预测精度随着历史数据的增多,预测的误差减小。

3 结语

本文根据油田抽油机井生产系统效率的数据具有不确定性、复杂性和时间性的特点,建立了ARIMA模型作为预测工具,发现系统效率数据存在非平稳现象,通过一阶差分将其平稳化处理,用模型的信息函数值来确定ARIMA模型的阶数。根据对华北油田抽油井生产系统数据进行实验,结果认为ARIMA(1,1,3)模型对该油井的生产系统效率进行预测比较准确。同时得出以下两点结论:1.由于ARIMA模型假定时间序列的未来模式与过去的趋势一致,因此它往往值适用于作短期预测,预测时间较长会导致精度的迅速下降;2.靠近预测点附近的历史数据所占权重较大,持续更新测试的数据信息,可以大幅提高ARIMA模型的预测精度。

[1] Box G E, Jenkins G M.时间序列分析预测与控制[M]. 北京; 中国统计出版社, 2003; 25-90.

[2] 查正洪. 上证综合指数的统计分析与预测[J]. 上海海运学院学报,1999,(04):82-89.

[3] 薛黎明, 侯运炳, 闫旭, 何广. 基于ARIMA模型的我国能源消费结构趋势分析与预测[J]. 中国矿业,2011,(04):24-27+35.

[4] 袁振洲. 应用自回归积分移动平均法预测铁路货源货流发展趋势[J]. 铁道学报, 1996, S1: 52-56.

[5] 张利, 李星毅, 施化吉. 基于ARIMA模型的短时交通流量预测算法研究[J]. 郑州轻工业学院学报(自然科学版), 2008, 04: 89-92.

[6] 谢佳利, 杨善朝, 梁鑫. 我国CPI时间序列预测模型的比较及实证检验[J]. 统计与决策, 2008, 09: 4-6.

[7] 汪淼, 郑舒婷. 基于ARIMA模型的中国消费者价格指数时间序列分析[J]. 辽宁工程技术大学学报(自然科学版), 2010, S1:130-132.

[8] Contreras J, Espinola R, Nogales F J, et al. ARIMA models to predict next-day electricity prices [J]. IEEE transactions on power systems, 2003, 18(3): 1014-1020.

[9] Hossain Z, Abdus Samad Q, Ali Z. ARIMA model and forecasting with three types of pulse prices in Bangladesh: a case study [J]. International Journal of Social Economics, 2006, 33(4): 344-353.

[10] 丁静之, 闵骐, 林怡. ARIMA模型在石油价格预测中的应用[J]. 物流技术, 2008, (10): 156-159.

[11] 陈汶滨, 时琼, 程大勇, 王君. ARIMA模型在研究油气田产量递减规律中的应用[J]. 中国西部科技, 2010, 06: 21-23+59.

Application of ARIMA Model in Time Series Analysis to Predict the Efficiency of Pumping Well Production System

LI Xinlun1, TAN Chaodong1*, TAN Pengfei1, 2, ZHANG Shengli3

(1.China University of Petroleum, Beijing 102249, China; 2.The University of New South Wales, Sydney NSW2052, Australia; 3. Huabei Oil Field Production Technology Research Institute, Renqiu 062552, China)

The efficiency prediction of oil well production system is an important index of pumping system. System efficiency prediction is based on the relationship between the internal variation and the influencing factors, which is learned from the analysis of historical data. Previously, oil fields used mechanism model to predict system efficiency. However, the outcome is not desired due to the uncertainty, complexity and timing of pumping well system efficiency. Therefore, this paper establishes the Autoregressive Integrated Moving Average Model (ARIMA) in time series analysis to predict and analyze the efficiency of Huabei oil field pumping well production system. This model emphasis the effects of the previous nearby data on the prediction by keep updating the latest data. The result indicates ARIMA model could adjust the direction of the prediction and hence improve the accuracy of the prediction for oil production system efficiency.

ARIMA model; time series analysis; prediction; system efficiency; pumping well

10.19551/j.cnki.issn1672-9129.2017.01.11

TE83

A

1672-9129(2017)01-0041-04

2017-01-10;

2017-01-22。

李欣伦,男,重庆长寿,硕士研究生在读,主要研究方向:油气田开发、数据挖掘。檀朝东 (1968-),男,安徽望江,副研究员,博士,主要研究方向:石油工程、物联网教学及科研。檀芃菲,女,北京海淀,硕士研究生在读,主要研究方向:数据分析。张胜利,男,高级工程师,主要研究方向:采油工程技术研究及应用。E-mail:tanchaodong@cup.edu.cn

猜你喜欢

抽油机油井差分
RLW-KdV方程的紧致有限差分格式
符合差分隐私的流数据统计直方图发布
数列与差分
油井遭袭
幼儿园旁的抽油机伪装成了长颈鹿
抽油井杆管防偏磨原因分析及对策研究
浅谈油井作业压裂酸化及防砂堵水技术研究
浅谈游梁式抽油机维护及改进
相对差分单项测距△DOR