APP下载

基于主成分分析-支持向量机的电脱盐工艺预测方法研究

2024-06-07乔松吕宝林朱建新袁文彬

化工自动化及仪表 2024年3期
关键词:工艺参数支持向量机主成分分析

乔松 吕宝林 朱建新 袁文彬

DOI:10.20030/j.cnki.1000?3932.202403011

摘 要 原油电脱盐工艺水平直接影响常减压装置腐蚀状态和工艺催化剂活性。综合考虑电脱盐工艺参数,选择脱盐前盐质量浓度、含水量及电场强度等40个工艺参数共440组工况数据,进行电脱盐效果評价研究。根据脱后盐含量数据箱型图特征,将电脱盐效果等级分为3级,采用主成分分析法,提取原始数据累积贡献率90.91%以上的前3个主成分,与电脱盐等级建立数据集,最后通过支持向量机建立电脱盐等级评价模型。结果表明:该方法对指导电脱盐工艺优化具有较好的工程适用性。

关键词 主成分分析 支持向量机 电脱盐 工艺参数

中图分类号 TP274   文献标志码 A   文章编号 1000?3932(2024)03?0443?06

原油和重质渣油中溶解盐是导致换热器污染和腐蚀的主要原因,也是破坏下游转化工艺催化剂活性的重要因素[1],因此原油的电脱盐预处理工艺水平直接影响常减压装置的长周期安全运行。影响电脱盐的主要因素包括原油进电脱盐罐的温度、电脱盐注水量、电场强度、油水界面、破乳剂及脱盐剂注入量等,传统电脱盐优化方法主要根据机理分析以调整主要因素[2],达到提高电脱盐效率的目的。

当原油种类较多、混炼比例变化较为频繁时,工况变化较为复杂,电脱盐影响因素增加[3],导致机理分析试验样本数量激增,试验成本过高。同时,机理分析往往简化次要因素[4],导致试验条件与实际工况存在偏差。

石化流程行业自动化程度较高,DCS和LIMS监测数据丰富,随着大数据分析和机器学习技术的发展和应用,石化工业大数据治理被认为是石化行业数字化转型的关键[5]。工业上电脱盐效果的决定性因素涵盖了电脱盐系统操作工艺,随着大数据技术的发展,基于操作工艺数据建立大数据模型进行电脱盐效果评价逐渐成为研究热点,并取得良好应用效果[6]。笔者以电脱盐系统大数据为基础,研究基于主成分分析和支持向量机的电脱盐系统预测模型,为开展电脱盐系统的优化运行提供依据。

1 主成分分析-支持向量机模型原理

1.1 主成分分析的基本原理

电脱盐工艺包括约40类参数,属于高维数据且部分数据存在相关性[6],这会影响算法精度,并面临维数灾难,不便于数据特征可视化,主成分分析(Principal Component Analysis,PCA)通过线性变换将高维数据投影到低维空间,以实现降低数据维度和去除相关性,其基本流程如图1所示。

原始数据标准化,假设电脱盐操作工艺数据为n维变量,工艺数据的样本量为m(m>n),则原始数据可以表示为矩阵形式X=[x],x为第i个样本的第j个工艺参数对应的值。原始数据标准化转换公式为:

z=(x-x)/s,i=1,2,…,m;j=1,2,…,n(1)

x=x/n

s=(x-x)/(n-1)

其中,z表示标准化矩阵Z中的元素,x表示第j个工艺参数的平均值,s表示工艺参数的标准差。

计算标准化矩阵Z的相关性系数矩阵R,矩阵R中的元素表示为:

R=(2)

求解相关性系数矩阵R的特征值与特征向量:

|R-λI|=0(3)

通过式(3)求得n个特征根,由大到小为λ,

λ,…,λ,λ表示第j个参量的贡献率。假设γ表示原始数据的信息利用率,按照λ/n≥γ确定主成分数量k的数值;再通过求解方程组R×b=λb可以得到特征根对应的特征向量b,b,…,b。

根据实际工况对信息利用率γ的要求,提取前l个主成分信息,即可利用l个主成分信息代表原始数据信息,即:

p=Z×b,j=1,2,…,l(4)

其中,p为第j主成分。

1.2 支持向量机的基本原理

支持向量机(SVM)是一类按监督学习方式对数据进行二元分类的广义线性分类器[7]。电脱盐工艺数据与电脱盐效果为非线性表征关系,笔者借助SVM中核函数的线性变换功能,将这种非线性表征问题转化为高维空间的线性问题[8],通过求解最优分类超平面以实现电脱盐工艺的分类。

以二分类情况进行说明,假设电脱盐效果标签为y,取值+1或-1分别表示正负样本,即电脱盐效果好或差的情况,数据集表示为(x,y)(x表示工艺数据,x=[x,x,…,x]),则分类超平面方程可以表示为:

ω·x+B=0(5)

其中,ω为权向量,B为偏置。要求超平面距离两类样本之间的距离尽可能大,根据点到平面距离公式,每个样本与超平面的距离d为:

d==(|ω·x+B|+|ω·x+B|)(6)

考虑到可以加上约束|ω·x+B|=1,松弛变量ξ(ξ>0)和惩罚因子C(C>0),最大间隔超平面称为广义最优分类超平面,式(6)转化为:

minω·ω+Cξ=0(7)

为求解ω、B、ξ,引入Lagrange乘子α、β,得到Lagrange函数L():

将Lagrange函数L()分别对ω、B、ξ求导,且α y=0,α>0,则得到最优化判断函数为:

f(x)=sgn

α

yK(

x,

x)+B(9)

当核函数K(x,x)确定时,通过统计误判样本数量即可得到电脱盐结果优劣的分类和评价模型。

针对多分类问题,一般采用一对多法(One?Versus?Rest,OVR)或一对一法(One?Versus?One,OVO)[9],以三分类为例,OVR法训练3个分类器,选择任一类为正样本,另外两类作为负样本,即:

svm:1~2,3svm:2~1,3svm:3~1,2(10)

再输入特征向量计算每个模型的预测函数值,将样本判别为预测值最大的分类器所对应的类。

OVO法同样训练3个分类器,训练第1个分类器时,以第1类样本作为正样本,剩余2類样本作为负样本,其他模型以此类推,即:

svm:1~2svm:1~3svm:2~3(11)

同样输入特征向量计算每个模型的预测函数值,分别判断样本所属的分类,样本分类出现次数最多的分类即预测值最大的分类器所对应的类。

1.3 PCA?SVM建模流程

电脱盐工艺参数种类较多,且部分工艺数据不可避免地存在一定相关性,通过PCA处理,可以去除数据相关性并降低维度以提高SVM分类的精度,为了验证笔者所提方法的适用性和科学性,分别采用PCA?SVM模型和SVM模型对电脱盐工艺进行分类分析并对比结果,具体流程如图2所示。

采用协同的随机数种子,将原始数据和经过PCA降维后的主成分数据按照6∶2∶2的比例随机分为训练集、测试集和验证集,分别建立SVM模型,并对比验证集数据的预测结果。

2 电脱盐数据与指标选择

原油脱盐前盐含量浓度对脱除效果具有一定影响,而操作工艺具有决定性作用。以某常减压电脱盐系统为研究对象,其工艺参数见表1。

3 基于主成分分析-支持向量机模型的电脱盐工艺预测

选择该常减压装置电脱盐系统1~5月的工艺参数(共440组),建立图3所示脱后盐含量数据箱型图,根据电脱盐含量分布状态,将电脱盐工艺等级分为3级,即下四分位到下限的120组为最优Ⅰ级,下四分位到上四分位的220组为中等Ⅱ级,大于上四分位(含异常值)的100组为Ⅲ级。

3.1 主成分分析-支持向量机电脱盐工艺模型建立

按照主成分分析步骤,将原始数据标准化后,计算相关性系数,考虑到原始数据包括40类工艺参数,限于篇幅,笔者取部分工艺参数相关性系数(表2)进行说明,可以看出压力(6)和压力(23)的相关性系数高达0.97,电流(17)和电流(21)的相关性系数高达0.98,工艺参数间较高的相关性说明部分原始数据信息重叠[10],因此首先采用主成分分析法提取主要信息。

进一步列出前8项主成分对应的贡献率(表3)。

可以看出前2、3个主成分累积贡献率分别达到79.46%和90.91%,已经可以代表原始数据绝大部分信息,同时降低了原始数据的维度。

3.2 模型预测结果对比分析

选择前2、3个主成分以及工艺参数原始数据分别进行SVM分类分析,选择高斯核函数,分别建立SVM模型。为验证PCA?SVM模型的准确性,选择12组随机数据采样,统一按照6∶2∶2的比例划分训练集、测试集和验证集,预测结果见表4。

从12次随机试验结果可以看出,经PCA去除原始数据重复信息后,模型准确率显著提升。统计12次随机试验分类的预测结果(表5),可以看出Ⅰ级和Ⅲ级相互不会发生误判,Ⅱ级和Ⅲ级相互误判概率较大,Ⅲ级误判为Ⅱ级概率最大,高达17.86%。

进一步研究分布分类并分析误差原因。为使数据可视化,选择前2个主成分分析电脱盐工艺参数分布,如图4所示。可以看出电脱盐Ⅰ级、Ⅱ级和Ⅲ级工艺参数的主成分具有明显区域特征,但同时也发现电脱盐Ⅰ级和Ⅱ级,电脱盐Ⅱ级和Ⅲ级部分主成分数据会聚集在一起,即说明该部分数据差异性较小,是导致模型产生误差的主要原因。

进一步绘制高维超平面在二维平面上的投影(图5),可以看出超平面分类效果良好,能够明显区分3个等级电脱盐效果的数据聚类特征,Ⅱ级与Ⅲ级分类超平面的二维投影在部分区域非常接近,与表5的分析吻合。

建立电脱盐效果评价分类模型后,当混炼比例变化需要调整工艺时,将工艺参数代入PCA?SVM模型,即可预测电脱盐效果。

4 结论

4.1 电脱盐效果受多种工艺参数综合影响,尤其是当原油种类较多,混炼比例变化较为频繁时,基于大数据分析方法可以分析操作流程全部工艺参数,并可以涵盖更多的工况样本建立预测模型。

4.2 主成分分析法可以有效去除原始数据中重复数据特征提高模型精度。笔者利用主成分分析,提取前2、3个主成分,对比PCA?SVM模型与原始数据SVM模型预测结果,PCA?SVM模型性能显著提高。

4.3 通过前2个主成分的二维分布、分类超平面的二维投影,可以看出不同等级电脱盐效果数据具有明显聚类特征,同时也发现相邻等级样本部分参数差异性较小,导致模型产生少量误判。总体来说,该方法针对电脱盐工艺参数维度较多且具有时间相关性的模型具有较强适用性。

参 考 文 献

[1] 马红杰,孙存龙,江臣.常顶换热器铵盐垢下腐蚀防护措施优化及应用[J].石油化工设备技术,2021,42(3):41-45;7.

[2] 蒋定建,方晓玲,李飞,等.常减压蒸馏装置电脱盐优化操作及技术研究[J].现代化工,2017,37(5):174-177.

[3] 涂亚明,崔明彧.原油电脱盐效果的影响因素分析[J].中国石油和化工标准与质量,2018,38(2):91-93.

[4] 汉继程,夏渊,缪磊,等.常减压蒸馏装置的腐蚀风险分析与控制建议[J].腐蚀与防护,2022,43(10):113-116;120.

[5] 中国电子技术标准化研究院,全国信息技术标准化技术委员会大数据标准工作组.工业大数据白皮书(2019版)[R].北京:中国电子技术标准化研究院,2019.

[6] 朱建新,袁文彬,吕宝林,等.基于操作参数大数据分析的电脱盐系统运行优化技术研究[J].石油化工自动化,2021,57(5):6-10.

[7] BOSER B E,GUION I M,VAPNIK V N.A training algorithm for optimal margin classifiers[C]//Proceedi?

ngs of the Fifth Annual Workshop on Computational Learning Theory.New York:ACM Press,1992:144-152.

[8] 詹长杰,周步祥.基于PCA?SVM模型的中长期电力负荷预测[J].电测与仪表,2015,52(9):6-10;40.

[9] 雷明.机器学习:原理,算法与应用[M].北京:清华大学出版社,2019.

[10] 韩超群,陈建宏,周智勇,等.基于主成分分析—支持向量机模型的矿岩可爆性等级预测研究[J].黄金科学技术,2019,27(6):879-887.

(收稿日期:2023-04-15,修回日期:2024-02-07)

基金项目:国家重点研发计划(批准号:2022YFB3306400)资助的课题;安徽省重点研究与开发计划(批准号:202104

a07020011)资助的课题。

作者简介:乔松(1982-),高级工程师,从事承压设备的检测与运维工作,522546237@qq.com。

引用本文:乔松,吕宝林,朱建新,等.基于主成分分析-支持向量机的电脱盐工艺预测方法研究[J].化工自动化及仪

表,2024,51(3):443-448.

Research on Prediction Method of Electric Desalination Process

Based on Principal Component Analysis?Support Vector Machine

QIAO Song1,2, LV Bao?lin1,2, ZHU Jian?xin1,2, YUAN Wen?bin1,2

(1. Hefei General Machinery Research Institute Co., Ltd.; 2.  National Technical Research Center

for Safety Engineering of Pressure Vessels and Pipelines)

Abstract   The technical level of crude oils electro?desalting process directly influences the corrosion status of atmospheric and vacuum distillation unit and the activity of process catalyst. In this paper, 40 process parameters including salt mass concentration, water content and electric field strength before desalting were selected to evaluate the  electro?desalting effect, total 440 sets of data of working conditions. Through considering  characteristics of the desalted salt content box diagram, the electro?desalting effect was divided into three levels, and the principal component analysis method was adopted to extract the first three principal components with the original data utilization rate of more than 90.91%, and the data set was established with the electro?desalting level. Finally, the evaluation model of the electro?desalting level was established by the support vector machine. The results show that, the method proposed has good engineering applicability in guiding optimization of the electro?desalting process.

Key words   principal component analysis, SVM, electro?desalting, process parameter

猜你喜欢

工艺参数支持向量机主成分分析
基于选择性烧结技术的薄壁零件加工工艺研究
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于AMI的双色注射成型模拟分析
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
基于熵技术的公共事业费最优组合预测
SPSS在环境地球化学中的应用
基于支持向量机的金融数据分析研究
工程机械油缸内孔加工滚压头设计