基于BP神经网络的轻烃回收装置生产参数预测方法
2023-10-05张子波何骁勇臧玮
张子波 何骁勇 臧玮
摘 要 针对油气生产行业数字化转型促使结构化生产数据被广泛应用的现状,提出基于BP神经网络的轻烃回收装置生产参数预测模型,以中海油某终端生产数据进行网络训练和测试,结果表明:BP神经网络应用在该业务场景可行,现有数据条件下网络隐藏层节点数取30、学习率取0.2,可获得相对较好的测试效果。
关键词 BP神经网络 结构化生产数据 轻烃回收 归一化 网络训练
中图分类号 TP18 文献标志码 A 文章编号 1000-3932(2023)05-0689-06
油气行业数字化转型已成为国内外石油公司的发展趋势[1~3],中海油也将数字化、智能化作为公司未来发展的四个跨越之一[4]。随着数字化发展和智能化程度的提高,越来越多的结构化数据将应用于企业管理和研究设计中,促进企业管理水平的提升和技术水平的高质量发展。
海上油气田生产的天然气常通过海底管道输送至陆地终端进行轻烃回收[5]以提高经济效益。随着区域开发和海底管网的日趋完善,海上新区块小规模开发常利用已建陆地终端进行油气处理。在前期研究项目进行经济性评价时,传统方法是通过工艺模拟计算产品产量和能耗数据,但部分终端投产时间较早,装置运行多年,且各终端轻烃回收装置的技术水平也不尽相同,工艺模拟往往與实际生产存在一定差异,限制了对产品产量和能耗数据预测的准确度。
随着大数据时代的到来,人工神经网络也逐步在油气生产领域获得应用[6~9]。笔者通过收集某终端历史生产数据和分析化验数据,提出基于反向传播(Back Propagation,BP)神经网络的轻烃回收装置预测模型,对模型参数进行优化研究,并采用部分生产数据作为测试数据,分析预测结果,最后对人工神经网络应用于轻烃回收生产参数预测研究前景进行了展望。
1 生产参数预测模型
中海油已建陆地终端轻烃回收装置多采用膨胀机+重接触塔制冷工艺,主要通过对压力能的利用来分离天然气中的重组分。终端产出产品主要有干气、LPG和稳定轻烃,能耗主要包括压缩机电耗和导热油炉燃料气消耗。影响产品产量和能耗的主要因素有:进站组分、进站物流流量、进站压力、出站压力。基于BP神经网络的轻烃回收装置生产参数预测模型如图1所示。
2 BP神经网络算法
BP神经网络算法是模拟人脑神经元接收信号并做出反应的工作过程,具有容错能力强、学习能力强、结构简单和易于编程实现[10~13]的优点,能够适用于轻烃回收装置生产参数的预测问题。图2展示了一个3层结构、每层3个节点的BP神经网络。
BP神经网络学习的一般过程为:从隐藏层开始,各节点接收前一层所有节点经权重分配后的输入,应用激活函数,经权重分配后作为后一层的输入;最终输出与结果对比后计算误差,并将误差根据连接到该节点的权重向前一层反馈,最后应用梯度下降法[14~16]调整权重值完成一次学习。通过不断学习,不断调整连接权重矩阵,样本学习完毕即为一个训练世代。学习完毕可对网络进行测试,直至达到预期精度。神经网络单世代训练流程如图3所示。
输入层与隐藏层连接权重调整量矩阵为:
3 数据归一化
研究数据源于中海油已建某终端,该终端投产于20世纪90年代,为了尽可能减少干扰因素,取该终端近两年的日生产数据和分析化验数据进行研究。
生产数据和分析化验数据主要为电子表格文件,首先采用Python第三方库Openpyxl读取生产日报和分析化验日报中所需数据并进行整理用于训练,整理后的部分数据列于表1、2。
轻烃回收生产参数预测神经网络模型采用Sigmoid作为激活函数,为避免各特征参数在数值、量纲上差异过大,激活函数过于“扁长”,导致梯度下降改进误差的过程曲折且耗时,需在训练前对各特征变量进行归一化[17~19],消除不同变量数值范围和不同量纲对网络训练带来的影响。归一化公式如下:
其中,zi为样本数据中第i个特征参数的归一化结果;c为归一因子,对于输入参数(如进站气量等)取值0.99,对于输出参数(如LPG产量等)取值0.98;max(xi)为特征参数xi在所有样本数据中的最大值;min(xi)为特征参数xi在所有样本数据中的最小值。
通过数据归一化,使样本数据输入参数部分取值范围在[0.01,1],输出参数部分取值范围在[0.01,0.99]。输入参数避开取值0是为了避免权重更新表达式置0,从而造成学习能力的丧失;输出参数避开0和1是因为Sigmoid函数只能渐近于0和1,取这两个值可能会驱动产生过大权重,导致权重更新错误。
结合轻烃回收装置实际运行情况,在获取特征变量上下边界max(xi)和min(xi)时,比实际值适当放大或缩小约10%,以提高神经网络模型的适应性,避免测试网络时输入值在接近边界时得到错误结果。
在网络模型训练结束进行测试时,需要对输出结果进行反归一化操作,即将归一化到[0.01,0.99]范围内的输出参数zi进行反译,得到真实结果xi。
4 权重矩阵初始化
网络训练开始前需对权重矩阵进行初始化,为避免随机采样可能产生较大权重值而偏置激活函数[10],采用正态分布采样权重,从均值为0、标准方差等于该节点传入连接数量平方根倒数的正态分布中进行采样。
5 网络训练
对于轻烃回收生产参数预测问题,设计输入层节点数13个、输出层节点数5个。隐藏层节点数和学习率分别设置不同的值进行试算,确定最佳取值。
训练样本数据共约500组,通过设置不同的训练世代数反复进行训练,以确定最佳的世代数。
6 模型测试及分析
选取不在训练数据中的20个样本对训练完成的神经网络进行结果测试,对所有测试样本全部输出参数求取相对误差绝对值的平均数作为结果准确度的衡量指标。
6.1 网络参数
6.1.1 训练世代
隐藏层节点数取30,学习率取0.2,训练世代与结果平均相对误差关系如图4所示。
6.1.2 学习率
隱藏层节点数取30,训练世代取1 100,不同学习率对应的相对误差见表3,可以看出,较低的学习率能获得较好的网络性能,最佳学习率取0.2。
6.1.3 隐藏层节点数
学习率取0.2,训练世代取1 100,不同隐藏层节点数对应的相对误差见表4。
隐藏层节点数的最佳值确定,与训练样本数量、训练世代及输入层和输出层节点数都有关系,对于该网络训练条件,隐藏层节点数取30,可以获得相对较好的表现。
6.2 预测精度分析
对于训练世代1 100代、学习率0.2、隐藏层节点数30的网络,测试样本的各参数分别求取的相对误差见表5。
计算结果显示,干气产量的预测精度相对较高,实际上网络参数设置为不同值时(如训练世代取100代左右),干气产量预测能够达到更高的准确率,最高时相对误差可在0.005以下。这意味着1 100代实际上对干气产量预测而言处于过度训练的状态。而LPG产量、稳定轻烃产量等预测相对误差较大,即使训练世代达到1 100代仍然不能取得较高的精度,原因分析如下:
a. 干气产量与进站气量相关性高,轻烃回收装置回收的重组分对干气气态体积的影响相对于较大的进站气量而言,占比较小,因此无论重组分回收情况如何,干气产量波动主要取决于进站气量。
b. LPG、稳定轻烃产量、终端耗气、耗电量除受组分、气量影响外,还与进出站压力直接相关。目前终端记录方式为每日24:00的进出站压力计入该日生产日报,不能有效体现当日整体压力状况。部分生产日报提及当日进站压力低,但实际记录的24:00的进站压力与往日并无太大差别。原始数据的准确度是影响参数误差的最主要因素。随着企业数字化转型的实施,传统记录方式有望革新,更准确便捷的结构化数据或可应用于该业务场景。
7 结束语
BP神经网络应用于轻烃回收装置生产参数预测可行,但受制于基础数据尤其是进出站压力记录方式,部分参数预测精度欠佳。未来数字化转型完成后,更先进的数据记录和处理方式有望提高数据准确性,进而促进该模型的进一步应用。基于现有训练数据,在隐藏层节点30个、学习率为0.2时能取得相对较好的测试结果。训练样本数据偏少,需要的训练世代数约1 100代,获取更多的生产数据可进一步提升网络性能。
基础数据获取便捷的前提下,可对该模型应用进行拓展,对相同工艺流程的终端取更多的生产数据进行训练,提高各参数的训练范围,随着训练数据的丰富,有望获得一个普适性网络模型,在前期研究项目和生产实际中提升产量能耗预测的准确度和速度,并可用于各类轻烃回收装置的优化研究。
参 考 文 献
[1] 杨剑锋,杜金虎,杨勇,等.油气行业数字化转型研究与实践[J].石油学报,2021,42(2):248-258.
[2] 贾承造.中国石油工业上游发展面临的挑战与未来科技攻关方向[J].石油学报,2020,41(12):1445-1464.
[3] 《中国石油报》评论员.全力推进数字化转型智能化发展[N].中国石油报,2021-09-28(1).
[4] 王秀强.全面建成“智慧海油”,抢占新一轮产业竞争制高点——专访中国海洋石油集团有限公司科技信息部总经理周建良[J].能源,2021(11):19-22.
[5] 张超,金海刚,王俊美,等.天然气丙烷回收率的优化[J].现代化工,2021,41(11):201-205.
[6] 蒋伟,佟国香.基于改进PCA-RFR算法的汽油辛烷值损失预测模型的构建与分析[J].石油学报(石油加工),2022,38(1):220-226.
[7] 杨帆,周敏,金继民,等.智能优化算法及人工神经网络在催化裂化模型分析中的应用进展[J].石油学报(石油加工),2020,36(4):878-888.
[8] MOHAMADI-BAGHMOLAEI M,AZIN R,OSFOURIS ,et al.Prediction of gas compressibility factor using intelligent models[J].Natural Gas Industry B,2015,2(4):283-294.
[9] AFSHIN A,ALI B H,HOSSEIN M,et al.Prediction of w- ater formation temperature in natural gas dehydrators using radial basis function(RBF)neural networks[J].Natural Gas Industry B,2016,3(2):173-180.
[10] [英]塔里克·拉希德.Python神经网络编程[M].林赐,译.北京:人民邮电出版社,2018.
[11] 廖藤藤,李国庆,李若溪.基于带搜索约束的神经网络实现吸收稳定系统操作优化[J].石油学报(石油加工),2017,33(6):1138-1145.
[12] ZHOU Q,RYOZO O.Performance of neural network for indoor airflow prediction:Sensitivity towards weight initialization[J].Energy & Buildings,2021,246:111106.1-111106.13.
[13] JIN T T,YAN C L,CHEN C H,et al.Light neural network with fewer parameters based on CNN for fault diagnosis of rotating machinery[J].Measurement,2021,181:109639-1-109639-15.
[14] 周金應,桂碧雯,李茂,等.基于岩控的人工神经网络在渗透率预测中的应用[J].石油学报,2010,31(6):985-988.
[15] 叶文静,王莉华.基于反向传播神经网络的疲劳裂纹扩展分析[J].力学季刊,2021,42(4):752-762.
[16] LIN W,YI Z,TAO C.Back propagation neural network with adaptive differential evolution algorithm for time series forecasting[J].Expert Systems with Applications,2015,42(2):855-863.
[17] KAVZOGLU T,MATHER P M.The use of backpropagating artificial neural networks in land cover classification[J].International Journal of Remote Sensing,2003,24(23):4907-4938.
[18] HAYKIN S S,GWYNN R.Neural Networks and Learning Machines[M].Beijing:China Machine Press,2009.
[19] VASILKOSKI Z,AMES H,CHANDLER B,et al.Revi- ew of stability properties of neural plasticity rules for implementation on memristive neuromorphic hardware[C]//International Joint Conference on Neural Networks.2011:2563-2569.
(收稿日期:2023-03-01,修回日期:2023-07-26)
A Prediction Method for Production Parameters of Light Hydrocarbon Recovery Unit Based on BP Artificial Neural Network
ZHANG Zi-bo1, HE Xiao-yong1, ZANG Wei2
(1. CNOOC Research Institute Co., Ltd.; 2. CNOOC Tianjing Branch Co.)
Abstract Considering the fact that in digital transformation of the oil and gas production industry, the structured production data are widely used, a prediction model for production parameters of the light hydrocarbon recovery unit based on BP artificial neural network was proposed and trained and tested with the production data of a CNOOC terminal unit. The results show that, BP neural network application is feasible in this business scenario and relatively good test results can be obtained when the number of nodes in the hidden layer of the network is 30 and the learning rate is 0.2 under the existing data conditions.
Key words BP neural network, structured production data, light hydrocarbon recovery, normalization, network training
基金项目:中海石油(中国)有限公司综合科研项目“陵水半潜式生产平台研究专项”(LSZX 2020 HN 05)。
作者简介:张子波(1985-),高级工程师,从事油气处理工艺的设计和研究工作,zhangzb3@cnooc.com.cn。
引用本文:张子波,何骁勇,臧玮.基于BP神经网络的轻烃回收装置生产参数预测方法[J].化工自动化及仪表,2023,50(5):689-694.