基于时序驱动的管道结蜡程度预测及清管效果评价
2024-03-06姜兆波姚佳杉高晓楠梁昌晶
姜兆波,姚佳杉,高晓楠,马 静,刘 倩,梁昌晶
1.中国石油华北油田公司第一采油厂,河北任丘 062552
2.华北石油通信有限公司,河北任丘 062552
3.中国石油华北油田公司第三采油厂,河北河间 062450
我国大部分油田生产易凝、高黏、高含蜡原油,在热油输送的过程中,因流体与管壁、土壤的持续换热,会损失部分热量,当温度降至析蜡点以下时,溶解在原油中的蜡晶分子会析出,借助表面自由能沉积在管壁上[1]。蜡沉积发生后,将减小管道流通面积,降低输送能力,严重时可能发生堵管,进而造成巨大的经济损失[2]。因此,研究管道的结蜡程度,制定合理的清管周期对于保障输油管道安全运行具有重要意义。
迄今为止,诸多学者从单相流、油水多相流等方面对蜡沉积规律和影响因素进行了研究,形成了包括分子扩散、剪切剥离和老化等理论在内的认知机理,推导了以BURGER、SINGH、黄启玉等模型为代表的蜡沉积速率计算公式[3-6],但这些模型多在环道实验或冷指实验上应用,研究成本较高,模型普适性相对较差。随着计算机科学的不断发展,基于人工智能算法的蜡沉积预测模型被广泛应用,骆正山等[7]、陈卓等[8]、肖荣鸽等[9]均证明了此类模型的稳定性和优越性,但训练中所需的管壁处温度梯度、管壁蜡分子浓度梯度等参数计算较为复杂,这也限制了此类模型的应用。管道结蜡是一个缓慢时序过程,目前结合时间序列对管道结蜡程度进行预测的研究还鲜有报道,且现场对于清管周期的确定存在一定的随机性和盲目性,导致频繁出现过度清管,同时缺乏对清管效果的定量评价。基于上述问题,在研究生产数据参数与结蜡程度关系的基础上,通过改进Kmeans 和卷积神经网络(CNN)算法确定管道结蜡程度,实现不同结蜡程度持续时间的在线更新,最后依据清管效果评价指数确定清管效果。
1 管道结蜡影响因素分析
管道结蜡是一个缓慢过程,初始时刻结蜡强度较弱,少量蜡沉积不影响管道运行,随后蜡沉积速率迅速上升达到峰值,最后在多种机理的影响下维持动态平衡。蜡沉积与油温、壁温、流速、流型、原油物性及管壁材料等因素相关[10-11]。温度是影响蜡晶分子析出最重要的热力学因素,油壁温差越大,析蜡区间跨度也越大,蜡分子的扩散驱动力更强,结蜡量增多,但当油温降低至一定程度时,扩散作用减弱,结蜡量趋于稳定。流速体现了剪切剥离的作用机理,在原油剪切的作用下,当流速导致的剪切应力大于蜡沉积三维网络应力时,沉积物被剥离并逐渐向管道后方移动。含水率差异是多相流蜡沉积的主要特征,含水率影响油水乳化程度,特别是含水率超过60%~70%时,管内流型从油包水转为水包油,管壁润湿性大幅增加,蜡分子不易析出且不易在管壁上附着。气油比越大,气体的携液能力越强,携带蜡沉积物排出管道的可能性越大,蜡沉积速率越小。此外,总传热系数表示油流向周围介质传热强度的大小,结蜡厚度越大,管道的保温效果越强,总传热系数越小。
综上所述,影响管道结蜡的因素具有时变性、非线性特点,结合现场可获取的传感器测量参数,确定平均油温、地温(代表壁温)、起点压力(反映蜡沉积对管道的堵塞)、流速、含水率、气油比、总传热系数(通过反算法计算)等为时序输入变量。此外,管道材料、粗糙度和管径也是影响蜡沉积的因素,但对于单一管道而言,这些变量不随时序变化,故不作为输入变量。考虑到一个区块同一开采层位的油品物性接近,且物性也非时序变量,故蜡、胶质、沥青质等含量亦不作为输入变量。
2 基于改进K-means和CNN算法的管道结蜡程度预测模型
基于改进K-means 和CNN 算法的管道结蜡程度预测流程如下。
1)收集同一区块不同集输管道的生产参数,采样周期从清管完成后至下一次清管开始前,且在运行期间内,未采取添加减阻剂、降凝剂等减缓蜡沉积的药剂或清蜡措施,确保结蜡程度是逐渐增加的,采样周期内输入变量的主要变化受蜡沉积影响。
2)为消除单位和数值范围不统一带来的影响,将所有数据进行归一化处理。
3)通过肘部分析法确定K-means 算法的聚类个数,结合结蜡周期内输入变量的变化确定结蜡程度。
4)划分训练集和测试集,利用CNN 模型训练样本集,建立管道结蜡程度预测模型。
5)通过结蜡程度和清管周期的变化程度确定清管效果评价指数。
2.1 基于肘部分析的K-means算法
K-means算法属于分区聚类算法的一种,目的是将不同连续时序区间的管道数据分为若干类,并且一个时间点的数据只能属于一类而不能同时属于多类,通过迭代优化步骤,当每类的质心不再发生改变时,即完成聚类[12]。传统方法需事先指定分类个数k,缺乏数据客观性,容易使质心迭代陷入局部最优。因此,可以引入肘部分析法改进K-means算法。
将每类质点与类内样本点的平方误差和称为畸变程度,对于一个类别,畸变程度越低,类内样本的距离越紧密。一般畸变程度会随类别数的增加而降低,但会存在一个拐点使畸变程度发生转变,这个拐点(肘部)对应的分类个数的聚类性能较好。
通常采用CH指标、轮廓系数等内部评估指标作为畸变程度的损失函数,见下式:
式中:CH(k)为分类数k的指标值,Bk和Wk分别为类别间、类别内的协方差矩阵,Tr为矩阵的迹;N为样本点个数,S(i)为第i个样本的轮廓系数,a为同类样本中2点距离的均值,b为该样本到除自身所在类外的最近类内样本均值。将所有的S(i)取均值后,即为该分类数下的轮廓系数S(k)。
以每1 h为采样频率,采样周期20~40 d(根据每条管道完整结蜡周期的不同确定),单条管道共采集480~960 条数据,共取30 条参数不同的集输管道,考察不同k值下的畸变程度指标,见图1。不同损失函数的误差平方和随k值的增加不断减小,并在k= 4 时产生拐点,故此肘部对应的分类数4为最佳聚类个数。
图1 不同k值下的CH指标和轮廓系数指标
根据聚类个数,将管道结蜡程度分为4 个等级,1 级对应管道基本无结蜡,2 级对应有轻微结蜡或有结蜡趋势,3 级对应蜡沉积速率快速上升,4 级对应严重结蜡且此阶段的蜡沉积厚度已达到2 mm 及以上。以其中的5 条管道为例,聚类结果见图2。不同管道在完整结蜡周期内的等级时间不同,周期长短也不同,这体现了输入参数差异带来的结蜡程度不同,其中各管道在第1~2级中所占的时长较长,在第3 级尤其是第4 级中所占的时长较短,反映了蜡沉积速率的上升速率不断增加,在后期很快时间内可达到堵管状态。以管道1 为例,观察起点压力随时间的变化趋势,见图3。在末点进站压力不变的前提下,蜡沉积引发起点压力逐渐上升,变化曲线与聚类结果基本一致,且最后一个阶段的起点压力上升较快,说明聚类结果可以真实反映管道结蜡程度。
图2 5条管道的聚类结果
图3 管道1起点压力随时间的变化趋势
2.2 一维卷积神经网络的建立及训练
考虑到与结蜡程度相关的变量均为时间序列,故在此采用一维卷积神经网络,网络结构见图4。通过穷举法试算,设置2组卷积层和池化层,卷积层1 和卷积层2 的卷积核个数分别为10、15,卷积层1 和卷积层2 的卷积核大小均为3,步长均为1,并且每层增加了32 个过滤器,采用ReLu 作为激活函数;为降低输出类别混叠性带来的过拟合,每个卷积层后设置大小为3、步长为1的池化层,采用最大池化法对数据进行降采样;随后连接Dropout 层用于筛选数据变化趋势不明显的变量,通过去除50%神经元实现,设置Dropout 为0.5;最后,全连接层整合管道不同工况下的局部特征,并基于Softmax分类器实现不同结蜡程度的时序分类输出。
图4 一维CNN的网络结构示意
将30 条管道数据用于模型训练,设置初始学习率为0.001,每2 轮训练后的学习率按照0.5 倍递减,使用Adam 优化器微调模型参数,批处理尺寸为16,将交叉熵(Loss)作为损失函数用来评估模型结构的有效性,见图5。随着迭代次数的增加,CNN 模型的训练误差不断减小,结蜡程度的识别准确率不断上升,当迭代次数达到50 次以后,损失值和识别准确率达到稳定状态,分别为0.045 87和98.17%,说明模型参数选择合理,建立的模型对管道结蜡程度具有较好的识别效果。
图5 训练过程中损失函数的变化曲线
2.3 模型预测及性能评价
选取8 条与训练时完全不同的管道数据用于模型预测,通过当前及上一时段的管道特征参数可以预测下一时段的结蜡程度,输出结蜡程度序列,并与真实结蜡程度对应的时间相比较,对比结果见图6。为全面评价模型性能,将单个结蜡程度内所有样本发生时间预测值与真实值绝对差值的平均值Kj定义为评价指标,以反映对结蜡程度预测的误差水平,见表1。除第4 级结蜡程度外,其余不同结蜡程度的预测误差在1.0 d 以内,总体平均误差为0.781 d。第4级结蜡程度预测误差较大的原因与该等级对应的时长较短、容许误差较小有关。总体上看,基于改进K-means 和CNN 的管道结蜡程度预测模型具有较强的泛化能力和鲁棒性。
表1 模型评价指标及预测误差
图6 模型预测值与真实值对比
考虑循环神经网络(RNN)和长短期记忆网络(LSTM)也是常用的时间序列预测模型,将其与本文模型的预测误差进行对比,见图7。其中,RNN 模型隐含层个数为2,每个隐含层的节点数分别为30、50,批次样本数量为2;LSTM 模型隐含层节点个数和权值更新初值分别为30、1 000,批次样本数量为2。可见RNN 模型的预测误差最大,这是由于随着预测时间的延长,RNN 在长序列场景会出现梯度消散或梯度爆炸的缺陷,是反向传播误差逐渐累积造成的。LSTM 模型的预测误差大幅降低,虽然LSTM 模型通过引入遗忘门的细胞结构对RNN 模型的梯度问题进行了一定改善,但在处理时间跨度大的序列时,仍存在网络参数混叠,计算量偏大的问题。本文模型的预测精度最高,证明了采用改进K-means算法进行结蜡程度聚类获取数据标签,并用CNN 模型实现预测的过程是合理可行的。
图7 不同模型的预测误差对比
3 清管效果评价
清管是管道常用的清蜡措施,在首站发球筒中放入清管器,利用清管器前后压差,推动蜡沉积从管道内移出。输气管道可通过相对输气效率或允许压降衡量清管效果,但对于输油管道尚未建立科学有效的定量化效果评价指标。基于上述研究,一方面,清管后的管道结蜡等级有所下降,证明清管效果良好;另一方面,管道清管后,下一次清管周期有所延长,也可证明本次清管彻底。将前者定义为清管效果的即时性评价指标,后者定义为长期性评价指标,通过下式构建清管效果评价指数。
式中:Fa、Fb分别为清管前和清管后的结蜡等级;Ta、Tb分别为上次和本次清管周期,d;第一项的分母3为结蜡程度的最大下降值;第二项的分母AT为本区块内相似原油物性管道的平均清蜡周期,d;α、β均为平衡因子,分别取0.8和0.2。
对于公式(3),Fa、Ta为已知变量,Fb和Tb可通过本文预测模型得到,每次清管后,可根据结蜡程度和清管周期的变化确定清管效果。
以该区块一条含水油管道为例,长度6.25 km,管径D159 mm × 7 mm,起点压力1.5~2.0 MPa,区块内平均清蜡周期为36 d。2022 年8 月15 日清管后,根据改进K-means 和CNN 算法建立结蜡程度预测模型,输入步长为10 d(即2022 年8 月15 日~8月24日的数据),以此预测后30 d内的结蜡程度,见图8。预测值与真实值的吻合性较好,说明模型预测的变化趋势是准确的。模型预测在2022 年9月17 日结蜡程度达到4 级,此时系统发出严重结蜡量报警并建议采取清管措施,通过观察起点压力发现压力较平稳运行时上升了0.8~1.2 MPa,沿程温度也上升了5~7 ℃,同时在末点输油泵前的过滤器中发现了沉积物增多的现象。参照SY/T 7550—2012《原油中蜡、胶质、沥青质含量的测定》规定的方法对沉积物组成进行测定,得到蜡、胶质和沥青质的质量分数分别为75.52%、21.63%和2.62%,其余为甲苯不溶物(机械杂质)。由此可见,该管道确实有发生堵塞的趋势,经综合分析于9 月18 日9:10 对其进行清管作业,控制清管器速度为0.7~0.8 m/s,清管时长3.68 h。清管后,根据一段时间的运行数据,对Fb和Tb进行预测,结蜡程度降为1 级,清管周期从35 d 升为40 d,代入式(3)得到本次清管效果评价指数为Q= 0.8×(4-1)/3+0.2×(40-35)/36=0.800+0.028=0.828,Q值较大,说明本次清管效果较好,清管周期降低幅度有限与油品物性和运行条件等因素相关。
图8 某管道结蜡等级预测值与实际值对比结果
4 结论
1)利用改进K-means 算法对管道结蜡程度进行了等级划分,以时间序列为输入变量,通过CNN 算法构建了结蜡程度预测模型,可准确预测管道蜡沉积的变化趋势。
2)本文模型在不同结蜡程度上的预测结果具有良好的泛化性,总体平均误差为0.781 d,小于RNN模型和LSTM模型的2.025 d、1.225 d。
3)根据结蜡等级和清管周期的变化情况,构建了清管效果评价指数模型,实现了清管作业的事前预警,避免了过度清管,可指导现场人员进行清管措施的决策。