APP下载

基于混合模型的原油管道运行电耗预测研究

2022-10-25朱振宇

计算机仿真 2022年9期
关键词:电耗模态粒子

朱振宇,侯 磊,徐 磊

(中国石油大学(北京)机械与储运工程学院,北京102249)

1 引言

我国原油管道年均电耗占管道年运行成本的一半以上,运行电耗直接体现了管道输送的管理水平和经济效益。以某年输量为1000万吨的原油管道为例,当节流压力增加1MPa时,管道系统年耗电量会增加300×10kW·h。有必要对长输原油管道进行运行电耗预测,掌握能耗变化趋势,以便适时调整运行方案与采取相应节能措施。

原油管道传统能耗预测方法主要包括工艺计算法和统计预测法。曾春雷等在考虑管道输量、耗能设备运行特性等因素变化的基础上,使用工艺计算法建立原油电耗预测模型,但管道电耗受多种因素共同影响,关键参数常常获取不及时且不充分,使得该方法预测效果不理想。而统计预测法则立足于真实历史数据进行预测,例如隋富娟等利用某输油管道5年数据,建立了三元非等间距的GM(1,1)模型,但该模型是一种近似模型,实际应用时往往达不到预期精度。目前,人工智能高速发展,机器学习方法也被应用于管道能耗预测领域。Zeng等利用神经网络建模对管道耗电量进行预测,分析表明模型具有良好的预测能力,但神经网络方法通常适用于数据样本较多的情况,在样本较少时,往往容易出现“过拟合”现象。在管道运行过程中,由于数据获取成本过高、企业重视数据安全等原因,往往导致难以获得足够多的样本来进行研究。而基于结构风险最小化原则的支持向量机方法,已被证明能够较好地运用到小样本预测问题,并保证较高的预测精度。例如,Meng等利用改进的经验模态分解支持向量机模型(M-EMDSVM)对渭河月流量进行预测,在强非平稳流情况下相比于其它模型准确度要更高;Olatomiwa等比较了SVM、人工神经网络(ANN)与遗传规划(GP)几种模型预测太阳辐射强度的差异,结果表明SVM的预测精度更高,能够作为预测全球水平太阳辐射的一种有效方法。

机器学习的预测精度依赖于超参数的选取,合适的超参数选取才能够提高模型的预测精度。对于支持向量机预测结果影响较大的主要是惩罚系数C和核参数γ。当C过大或过小时,分别会出现过拟合或欠拟合现象;γ作为高斯核函数的幅宽,影响每个支持向量的作用范围,选取不当会降低模型的预测能力。过去确定超参数时一般依赖于操作人员的经验,效率低下且模型极易陷入“过拟合”。为此学者们进行了大量研究,提出将支持向量机与优化算法相结合的混合模型。其中,粒子群算法(PSO)相较于其它优化算法具有可调参数少、收敛快的优点,已被广泛应用于多种预测领域中。但粒子群算法在搜寻过程后期容易陷入局部最优,从而难以求得最优解。此外,由于管道运行特性,在实际运行数据中常含有部分噪声和波动,且数据间含有较强的非线性联系,这都将为预测工作带来极大困难。

针对上述两种问题,本文通过引入CEEMDAN方法将输入参数分解为多个具有平稳性的模态分量,用以去噪和提高预测精度;利用改进后的粒子群算法对SVM模型的超参数进行优化,避免陷入局部最优。建立CEEMDAN-IPSO-SVM混合模型对国内3条管道进行电耗预测,并将结果与其它方法进行对比,结果证明混合模型具有更高的预测精度。

2 输入参数的选择

选择特征参数的目的是为机器学习方法识别有用和非冗余的特征子集,输入特征参数的合理选择直接决定了模型的预测性能。因此,有必要对管道运行过程中影响电耗的相关因素进行详细分析,选择合适的参数作为预测模型的输入特征。

长输原油管道涉及的参数主要包括原油物性参数、环境参数、管道参数和运行参数,部分参数的详细分类如表1所示。其中,原油物性参数随管道温度变化而变化,在实际运输过程中很难实时获取。环境参数主要影响管道的散热过程,但保温结构的存在能够有效地减缓环境温度变化引起的散热过程。管道参数基本可以视为固定值,作为输入参数的意义不大。对于管道运行参数,输量对电耗的影响最大。泵的扬程和效率会随着输量的波动而产生变化,进而影响管道运行电耗,而且现场工作人员能够依据下月、季输送计划提前获知油品输量,从而实现电耗的提前预测。基于上述分析,选择月输量作为预测模型的输入参数。

表1 原油管道参数分类

3 混合模型的基本模块

提出的原油管道电耗预测混合模型由分解模块、参数优化模块和主体预测模块3部分组成。分解模块CEEMDAN用于将非平稳、非线性数据分解为若干相对平稳的序列,降低预测难度;参数优化模块IPSO用于优选模型超参数,寻求全局最优值;主体预测模块SVM与上述两部分结合,用于最终的预测工作。

3.1 分解模块

目前,已有研究通过添加原始数据前置分解环节构建组合预测模型来进行能耗预测,相比于单一预测模型该方法能够获得更高的预测精度。

分解方法通常包括小波分解、经验模态分解(EMD)和集成经验模态分解(EEMD)等方法。EMD分解解决了小波分解需要人为选择小波基函数与分解层数的问题,但容易出现模态混叠问题。EEMD分解通过添加辅助噪声克服了EMD模态混叠问题,但其分解效率低且噪声难以完全消除。而CEEMDAN分解在每一阶段添加自适应高斯白噪声,通过计算唯一余量信号得到各个模态分解,分解过程完整,能有效解决上述问题。

定义(·)为经分解得到的第个模态分量,()为原始序列,()为第次加入的满足标准正太分布的高斯白噪声,CEEMDAN算法具体实现步骤如下:

1)在CEEMDAN算法中利用对信号()+()进行次重复分解,用于控制附加噪声与原始信号的信噪比,由此计算得到第一个模态分量

(1)

2)当=1时,计算第一个余量信号()

(2)

3)利用算法对信号1()+11(())进行次重复分解,直到得到第一个模态分量为止。由此得到第二个模态分量

(3)

4)对剩余阶段,按照步骤3)计算过程运算得到第+1个模态分量

(4)

(5)

5)重复步骤4),直到最终余量信号满足分解的终止条件为止,得到个模态分量。原始信号可表示为

(6)

式中,()为最终残余信号。

3.2 参数优化模块

粒子群算法作为常用优化算法之一,最早由Kennedy提出。相比于遗传算法(GA)、果蝇算法(FOA)等其它优化算法,PSO具有参数少、收敛快的优点。该算法通过模拟鸟群的社会行为,实现多维空间的目标寻优。图1描述了粒子群算法的优化参数过程。在该算法中,种群由粒子组成,每个粒子的特征包括一个位置向量和一个速度向量,利用个体极值和全局极值来更新位置和速度。每个粒子根据如下公式来更新自己的速度和位置

(+1)=()+()[()-()]+

()[()-()]

(7)

(+1)=()+(+1)

(8)

式中,为迭代次数;为惯性权重;、称为学习因子;()和()是[0,1]区间的随机数;()和()分别表示粒子在第次迭代的速度和位置;()和()分别表示粒子在第次迭代的个体极值的位置和全局极值的位置。

图1 粒子群算法优化参数流程图

但PSO后期容易出现陷入局部最优值、早熟收敛现象。针对这一缺陷,学者们对其做出各类改进。Shi等人引入惯性权重λ有利于提高算法的性能,但控制参数一般具有问题依赖性,固定权值不能适用于所有问题。λ较大时全局搜索能力强,较小时局部搜索能力强。通过考虑λ对粒子群算法搜索能力的影响,使λ呈正弦变化,粒子先在自身附近作局部寻优,接着进行全局寻优,最后使最优粒子进行局部搜索,有助于算法跳出局部最优,收敛性强。具体实现公式如下

()=+06sin(π)

(9)

式中,为最小惯性权重;为最大迭代次数。

3.3 主体预测模块

支持向量机和神经网络已被广泛应用于多个领域的能耗预测。两者最大的区别在于支持向量机能够有效地避免过拟合问题,在数据较少的情况下仍然保持较好的预测效果。

支持向量机的基础是通过非线性逼近或映射将数据集映射到高维特征空间(超平面)中,划分超平面通过如下方程来描述

()=()+

(10)

式中,是输入训练向量,()是输出训练向量,是常数偏差,是权重系数向量,()是非线性映射函数。

支持向量机的间隔可以表示为

(11)

为寻求最大间隔划分超平面,需使得最大,即满足

(()+)≥1,=1,2,…,

(12)

故仅需最大化‖‖,等价于最小化‖‖,因此将模型转化为

(13)

为解决提出的优化问题,引入松弛变量和,目标函数如下

(14)

(15)

式中,为惩罚系数,利用它可以平衡最大间隔与松弛变量。

通过引入拉格朗日乘子将上述优化问题转化为其对偶问题

(16)

核函数通常包括线性核函数、多项式核函数和高斯()核函数,因大多数情况下高斯核函数性能表现良好,故本文选用高斯核函数,可表示为

(17)

式中,为高斯核函数参数。

图2 支持向量机结构图

4 管道电耗预测步骤

a) 数据准备与预处理。对管道电耗数据进行检查和缺失修补,去除明显错误的数据。

b) 数据分解。将输入变量利用CEEMDAN方法进行分解,得到个本征模态函数和1个趋势项分量,=1,2,…,。

c) 数据集划分和归一化。由于本研究使用的初始样本数量较少,为了避免随机抽样带来的抽样误差,采用分层抽样来划分训练集和测试集,使得划分的样本与初始数据的分布规律较为接近。因为输入值的大小存在较大差异,因此对输入值进行归一化,归一化范围通常为0~1,具体如下

(18)

式中,′是归一化后的结果,分别是输入数据的最大值和最小值,是初始值。

d) 参数优化。利用IPSO算法对SVM的惩罚系数C和核参数γ进行优化,使预测模型获得最佳预测性能。

e) 电耗预测与误差分析。将测试集数据输入到训练好的IPSO-SVM模型中,求得最终的电耗预测结果,并对结果进行误差分析。

提出的CEEMDAN-IPSO-SVM混合模型主要实现两种功能,一是通过CEEMDAN将含噪声的输入数据进行去噪,二是利用IPSO算法对超参数进行动态调整,实现其自适应优化,提高SVM模型的预测精度。基于CEEMDAN-IPSO-SVM混合模型的电耗预测过程如图3所示。

图3 管道运行电耗预测流程图

为了评估所提出预测模型的准确性,采用平均绝对误差(MAE)、平均绝对百分误差(MAPE)、相对误差(RE)和决定系数(R)作为性能指标来评估各模型的预测能力。各评价指标公式如下

(19)

(20)

(21)

(22)

5 实例验证

5.1 数据来源与处理

为了保证混合模型的可靠性,选取国内3条原油管道进行实验。管道1位于山东,年设计输量为1800万吨,全长157公里,设有热泵站和泵站各两座;管道2起始山东,南至江苏,全长651公里,管径为720mm,设有6座热泵站;管道3起始河北,北至北京,年设计输油量为750万吨。

对所选3条管道,使用CEEMDAN方法将输入参数分解为若干不同尺度的固有模态函数(IMFs)分量,以测试集为0.3的比例划分数据集,得到的训练集数据量分别为42、42和33组,测试集数量分别为18、18和15组,将归一化后的训练集和测试集数据分别带入IPSO-SVM模型进行训练和预测。在IPSO对SVM参数进行优化过程中,设定IPSO的搜索范围:C∈[1,1000],γ∈ [0.01,10],IPSO的迭代次数K=100,粒子群数目M=100,粒子维度n=2。

5.2 预测结果分析

图4和图5分别表示不同预测模型在3组实验中的MAE和MAPE值,由图可见,相比于PSO、GA、FOA几种优化算法,经IPSO优化后模型的MAE和MAPE更低,预测精度更高,说明IPSO算法能够有效克服PSO算法容易陷入局部最优的缺陷,获得更准确的预测效果,证明了IPSO的优越性。此外,3条管道的电耗预测结果有一定差异,例如IPSO-SVM模型在3组实验中的MAE值分别为50.5835×10kW·h、120.7112×10kW·h和19.6646×10kW·h,这是由于管道数据质量不同造成的,说明数据质量对预测效果具有一定影响,但该算法依然保持最优的预测结果,亦证明该优化算法适用性较广。

图4 不同管道MAE值比较

图5 不同管道MAPE值比较

为了进一步验证CEEMDAN分解的有效性,将经过CEEMDAN分解处理过的数据分别使用SVM和IPSO-SVM模型进行预测。通过比较SVM与CEEMDAN-SVM模型、IPSO-SVM与CEEMDAN-IPSO-SVM模型的结果,证明添加CEEMDAN分解能够显著提高原模型的预测性能。

表2 不同管道预测结果比较

图6 管道1相对误差离散图

图7 管道2相对误差离散图

图6-8分别表示了3组实验测试集的相对误差,相对误差的基准设置为[-5%,5%],通过对比不同模型真实值与预测值之间的偏离程度,能够直观评价模型的预测性能。对于管道1,SVM、IPSO-SVM、CEEMDAN-SVM和CEEMDAN-IPSO-SVM等4种模型预测相对误差的离散点在参考范围内的点数分别为8、9、9和11个;对于管道2,4种模型预测相对误差的离散点在参考范围内的点数分别为10、11、12和13个;对于管道3,4种模型预测相对误差的离散点在参考范围内的点数分别为8、10、9和11个。由此可知,CEEMDAN-IPSO-SVM模型在3组实验中一致最优,说明其总体预测效果更接近于真实值。

图8 管道3相对误差离散图

图9-11为混合模型的最终预测结果,分析可得预测结果与实际数据拟合度较高,相对误差大部分在8%以内,说明CEEMDAN-IPSO-SVM混合模型能够有效地挖掘原油管道非平稳运行数据之间的潜在规律,达到较高的预测精度。

图9 管道1混合模型预测结果

图10 管道2混合模型预测结果

图11 管道3混合模型预测结果

6 结束语

通过改进权重的方法解决了粒子群算法早熟的问题,使用IPSO优化后的模型预测结果均优于其它优化算法,证明IPSO算法具有更佳的全局寻优能力。同时针对管道电耗数据非线性、非平稳的特点,引入CEEMDAN分解,通过对比添加CEEMDAN分解前后模型预测效果的差异,证明了CEEMDAN方法对提高模型预测精度的有效性。在此基础上基于机器学习理论与数据处理技术,建立了小样本情况下原油管道电耗中期预测的CEEMDAN-IPSO-SVM混合模型,与其它模型的对比实验表明,该混合模型预测精度最高,预测结果与真实值最为接近。

猜你喜欢

电耗模态粒子
联合仿真在某车型LGF/PP尾门模态仿真上的应用
多模态超声监测DBD移植肾的临床应用
浅析影响选煤厂电耗的因素与对策
多因素影响下的纯电动汽车电耗算法优化
碘-125粒子调控微小RNA-193b-5p抑制胃癌的增殖和侵袭
上海某高校研究生宿舍空调电耗特性研究
跨模态通信理论及关键技术初探
混沌粒子群算法在PMSM自抗扰控制中的优化研究
基于膜计算粒子群优化的FastSLAM算法改进
天然气净化行业电耗实时监测系统的设计