多元线性回归模型在连续重整装置的应用
2022-03-08刘新
刘 新
(福建联合石油化工有限公司,福建 泉州 362800)
某公司的连续重整装置以直馏重石脑油、加氢裂化石脑油和芳烃抽余油为原料,为下游装置生产对二甲苯和苯提供原料,同时副产大量的含氢气体、液化气、戊烷组分供其他装置使用。该连续重整装置原料的馏程为82~175℃,碳原子数为5~11个,在正常生产中因为加工原油种类的变化、上游装置操作的调整,导致连续重整原料中各个组分的含量变化较大,在生产计划排场时难以准确预测连续重整产物组成,影响全厂优化生产。因此开发一种快速预测连续重整产物的方法供生产计划人员使用显得十分必要。
1 多元线性回归模型介绍
回归是通过若干已知数据来预测另一个数值型变量的目标值过程,线性回归属于回归分析,即表示在自变量与因变量之间存在线性关系。多元线性回归模型是用两个或两个以上的自变量来解释因变量的一种模型。
对连续重整装置而言,可以假设各组数据下连续重整脱戊烷油的辛烷值、循环氢流量、连续重整进料量等参数维持不变,仅仅考虑原料组成变化对连续重整产物组成的影响。
设Yi为因变量,代表连续重整产物的组成(i=H2,C1,C2,…,C11P,C11N,C11A);Xj为自变量,代表连续重整原料的组成(j=C5N,C6P,C6N,C6A,…,C11P,C11N);βj代表各原料组成的回归因子。其中N代表环烷烃;P代表链烷烃,包括正构烷烃和异构烷烃;A代表芳烃。
利用最小二乘法算法可求得β值。β=(XT·X)-1XT·Y,其中XT代表原料矩阵X的转置矩阵[1]。
2 矩阵数据生成
2.1 基础模型创建
KBC公司开发的重整反应动力学模型REFSim作为通用的流程模拟软件在国内已经有较多的应用[2-3]。根据不同产品产量的需要,连续重整原料的初馏点即碳六烷烃含量是主要的调节指标。表1为连续重整原料各族组成在半年时间内的变化,从中可以观察到原料中的烷烃特别是碳六烷烃质量分数波动比较大。为使REF-Sim模型数据具有代表性,特选取了碳六烷烃质量分数居于最大值和最小值中间的一组原料数据作为基础数据进行建模。
表1 连续重整原料各族组成(质量分数)在半年内的变化 %
续表1
在输入连续重整装置原料和产物的流量、组成后,在校核界面通过适当调整产品流量来获得进出物料质量平衡和碳氢平衡。此时运行模型校准程序就可获得各产物的组成,若有部分组成偏离值较大,还可通过调整REF-Sim内建的各调节因子来减少偏离值。表2对比了主要组分的现场数据与采用基础模型校准后的REF-Sim数据。
表2 主要组分的现场数据与基础模型数据对比%
由表2可以看出:采用基础数据建立的REFSim模型符合生产实际,可以用于生成矩阵数据。
2.2 创建随机数据
首先将基础模型中的各产物汇流,使得模型只有一个总进料和总出料,并在short name一栏中输入三位字符。
为得到建立多元线性回归模型的数据,需要利用REF-Sim模型中的LPU(LP Utility)功能。以建立REF-Sim模型时输入的原料数据为base,参考表1中各组成的最小值和最大值设置变化量的下限和上限;设Data Sets值为400,点击Randomize按钮,让REF-Sim模型随机变化原料族组成的同时保持每一Data Set的族组成总和为100%。表3展示了生成的随机原料数据的分布情况。
由表3可以看出:随机生成的原料族组成数据分布较分散,有利于提高回归结果的精度。随机原料数据生成后,点击Generate Data按钮,即可求出400组不同原料组成但主要操作参数和各调节因子恒定时的连续重整产物数据。
表3 原料族组成随机数据的分布比例 %
2.3 数据整理
利用LPU中的Exporting功能可将生成的400组数据导出到EXCEL表中,利用先前输入的三位字符可以区分连续重整产物组成Y和连续重整原料的组成X数据。将Y和X的各组数据以按行排列的方式存入另外的表格以便方程求解。
3 方程求解和验证
3.1 多元线性方程求解
求解多元线性回归方程的前提是自变量Xj之间不存在严格的线性关系。利用rank函数可验证矩阵X是列满秩,即符合方程求解前提。
求解方程β=(XT·X)-1XT·Y,并进行回归方程的显著性验证,可得出求解得到的回归方程Y=Xβ有意义,即β值不全为零,Y值会随着X值变化而变化。
3.2 多元线性回归因子验证
为了验证回归的准确性,特选取了原料组成接近最小值和最大值的原料A和原料B,两组原料的部分组成见表4。
将A和B的原料族组成带入公式Yi=Xjβj中,预测的连续重整产物族组成与生产数据的偏差(见表5)[4]。
从表5可以看出:纯氢收率贴近生产数据,产品的芳烃组分产率与实际数据略有偏差,主要原因是假定各原料组成下脱戊烷油辛烷值不变,但实际加工原料A和原料B时的脱戊烷油辛烷值略高于REF-Sim模型的基础工况下的辛烷值。另外产品组成中的偏差数基本相近,实际应用时可通过增减固定的偏差数来提高预测精度。
4 结语
利用反应动力学模型REF-Sim生成多组连续重整产物组成数据,通过多元线性回归可得到产物中各组成相对进料组成的回归因子,将回归因子与连续重整进料的组成相乘可以预测连续重整的产物组成,且主要组成的偏差相近,可用于生产计划预测。