APP下载

PCA-SS-LSSVM在循环冷却水结垢预测中的应用

2017-12-07胡艳珍李晨光

化工自动化及仪表 2017年11期
关键词:搜索算法降维结垢

董 超 胡艳珍 李晨光

(1.天津理工大学天津市复杂系统控制理论及应用重点实验室;2.中国石油化工股份有限公司天津分公司)

PCA-SS-LSSVM在循环冷却水结垢预测中的应用

董 超1胡艳珍1李晨光2

(1.天津理工大学天津市复杂系统控制理论及应用重点实验室;2.中国石油化工股份有限公司天津分公司)

采用主成分分析-分散搜索算法-最小二乘向量机(PCA-SS-LSSVM)算法对某石化企业近几年的生产数据进行建模预测。经过实验仿真表明:该算法能及时准确地预测粘附速率。

PCA-SS-LSSVM算法 循环冷却水 结垢 动态建模 动态仿真

循环冷却水系统是遍及石化、冶金及电力等工业部门的用水系统,是流程工业重要的公用工程,其运行质量直接以及生产装置和设备安全,关系到产品的产率和质量。腐蚀和结垢是循环冷却水系统中的常见故障。随着循环冷却水的不断重复利用,受到水源、工艺条件及工艺介质等的影响,循环冷却水水质会不断恶化,容易导致设备形成水垢,产生腐蚀,进而影响设备寿命、安全生产和经济运行。为此,只有合理、准确判断水质特性才能采取相应的措施来预防腐蚀和结垢问题[1]。循环冷却水结垢是受多个因素影响的典型复杂非线性问题[2]。PCA-SS-LSSVM可以很好地实现降维和非线性预测算法,故笔者采用该算法对结垢问题进行预测研究。

1 PCA-SS-LSSVM

PCA-SS-LSSVM是一种标准支持向量机的改进组合算法。采用最小二乘线性方程代替传统标准向量机中ε不敏感损失函数,从而将原来的非线性约束转变为线性约束[3,4]。利用分散搜索算法(SS)对惩罚因子和核函数宽度进行寻优,从而找到最优组合来提高模型的精度[5,6]。由此就形成了扩展的向量机SS-LSSVM。由于结垢问题受到众多因素影响,因此引入了主成分分析(PCA)对它进行降维处理,以达到不影响模型精度的条件下提高计算速度的目的[7,8]。PCA-SS-LSSVM算法结构框图如图1所示。

图1 PCA-SS-LSSVM算法结构框图

由图1可知该算法的输入变量在经过PCA降维处理之后得到主成分,并将它作为模型的输入进行训练建模。其中模型的参数寻优由SS得到。经过SS-LSSVM的建模预测之后输出变量,当输出变量的误差允许值超过设定范围,则返回输入重新计算。

2 基于PCA的结垢因素相关性分析

主成分分析是把各变量之间互相关联的复杂关系进行简化分析的方法。在力求数据信息丢失最少的原则下,对高维的变量空间降维。

本文实验研究中选取了天津某石化200天的实际生产数据,对结垢有影响的因素有15个(表1),初始样本见表2、3。

表1 参数名称对应表

表2 初始样本数据(一)

表3 初始样本数据(二)

将上述数据导入SPSS软件中进行主成分分析,主成分贡献率见表4,图2为特征值的碎石分布。

表4 特征值及其累积贡献率

(续表4)

从表4可以看出,前6个主成分的累积贡献率已超过90%。另外,在图2中,主成分数在序号2处有明显拐点,但要求提取的主成分包涵原信息的90%以上,为此提取的主成分个数为6,其中F1~F6为降维后的6个新变量,通过特征值向量表示为:

F1=-0.149X1+ 0.025X2-0.146X3+0.050X4+0.105X5+0.027X6+0.161X7+0.039X8+0.152X9-0.013X10+

0.157X11- 0.053X12- 0.167X13+ 0.050X14+ 0.158X15

F2=0.134X1+0.169X2+0.080X3-0.139X4-0.560X5+0.097X6-0.058X7+0.155X8-0.016X9+0.490X10-

0.054X11+0.307X12+0.053X13+0.106X14-0.071X15

F3=0.074X1+0.107X2+0.043X3+0.422X4-0.030X5+0.020X6+0.006X7+0.808X8+0.043X9+0.225X10+

0.005X11+0.180X12-0.012X13+0.129X14+0.043X15

F4=0.048X1+0.006X2+0.027X3-0.058X4+0.048X5-0.001X6+0.097X7+0.005X8+0.080X9-0.060X10+

0.062X11-0.661X12-0.158X13+0.034X14-0.050X15

F5=0.028X1+0.165X2-0.001X3+0.144X4+0.120X5-0.069X6-0.027X7-0.143X8-0.012X9+0.102X10-

0.019X11+0.248X12+0.082X13-0.845X14-0.068X15

F6=0.049X1+0.047X2+0.003X3+0.245X4-0.074X5+0.949X6+0.010X7-0.079X8+0.024X9+0.112X10+

0.009X11+0.065X12+0.007X13+0.091X14+0.036X15

图2 特征值的碎石分布

3 基于SS-LSSVM的预测模型

3.1用SS优化LSSVM模型

SS算法是一种功能等同于GA、PSO等的优化算法,其目的是寻找惩罚因子与核函数宽度的最优化解。SS算法较GA有实现动态跟踪功效,较PSO可以避免局部寻优弊端[9~11]。

笔者利用SS算法优化LSSVM模型,就是要寻找惩罚因子C与核函数宽度γ,使得LSSVM训练集中预测均方差E最小、决定系数R最大,目标优化模型为:

式中l——训练集中样本个数;

在训练LSSVM中,关于解的编码是通过令个体I=(C,γ),其中惩罚因子C=(0.01,1000),核函数γ=[0.1,100],另外SS算法参数设置为:初始解集的大小N=100,参考集中高质量解集和多样性解集的个数分别为10、10;局部搜索过程中迭代次数最多为30,终止参考集更新的迭代次数为200。在保证E最小、R最大的条件下,一次迭代计算,得到最优的惩罚因子C=10.2751,核函数γ=0.0326。此时SS算法的收敛曲线如图3所示。

图3 SS算法收敛曲线

3.2实例仿真

将降维后得到的主成分作为模型的输入,其中原始样本的五分之四为训练集,五分之一为测试集。仿真结果如图4~7所示。

图4 SS-LSSVM仿真结果

图5 PSO-LSSVM仿真结果

图6 GA-LSSVM仿真结果

图7 LSSVM仿真结果

其中mse为误差标准。由图可知, SS-LSSVM可达到的精度为97.945%,PSO-LSSVM可达到的精度为93.063%,GA-LSSVM可达到的精度为90.688%,LSSVM可达到的精度为84.433%。各算法的误差见表5。

表5 各算法误差比较

4 结束语

在标准支持向量机上进行改进组合,形成了SS-LSSVM算法,该算法比SVM具有精度高、收敛速度快及泛化能力更强等优势。在优化模型时,分散搜索算法比遗传算法(GA)、粒子群算法(PSO)有更好的服务作用。此外引入了主成分分析法对输入变量进行了降维,降维后输入维数大幅降低,且所提取的主成分包含了原样本数据90%以上的信息,保证不丢失数据的同时达到了减少计算资源等目的。通过仿真比较得出了PCA-SS-LSSVM的模型具有很高的精度,证实该算法具有很强的可行性和实用性,能够为循环冷却水结垢的预防提供精准的参考意义。

[1] 张凌峰.工业循环冷却水智能辅助分析平台的关键技术研究[D].天津:天津理工大学,2012.

[2] 董超,张凌峰,李荣,等. 循环冷却水系统腐蚀速率的预测模型[J].化工自动化及仪表,2011,38(6):676~678.

[3] 顾燕萍,赵文杰,吴占松.最小二乘支持向量机的算法研究[J].清华大学学报,2010,50(7):1063~1066,1071.

[4] Huang W, Huang F C, Song J. Water Quality Retrieval and Performance Analysis Using Landsat Thermatic Mapper Imagery Based on LS-SVM[J]. Journal of Software, 2011, 6(8):411~422.

[5] Gorjaei R G, Songolzadeh R, Torkaman M, et al. A Novel PSO-LSSVM Model for Predicting Liquid Rate of Two Phase Flow through Wellhead Chokes[J]. Journal of Natural Gas Science and Engineering, 2015, 24: 228~237.

[6] Gao J, Yu J, Leng Z.The Application of PSO-LSSVM in Fault Diagnosis of Subway Auxiliary Inverter[J]. International Journal of Research and Surveys, 2013, 4(3): 777~784.

[7] 周松林,茆美琴,苏建徽.基于主成分分析与人工神经网络的风电功率预测[J].电网技术,2011,35(9):128~132.

[8] 孙刘平,钱吴永. 基于主成分分析法的综合评价方法的改进[J].数学的实践与认识,2009,39(18):15~20.

[9] 王晓晴,唐加福,韩毅.分散搜索算法研究进展[J].系统仿真学报,2009,21(11):3155~3160.

[10] 郭希旺,刘士新,王大志.多目标拆卸序列优化问题的分散搜索算法[J].东北大学学报(自然科学版),2012,33(1):56~59.

[11] 朱文兴,程泓.VISI电路划分问题的分散搜索算法[J].电子学报,2012,40(6):1207~1212.

PCA-SS-LSSVMApplicationinPredictingtheFoulingofCirculatingCoolingWater

DONG Chao1, HU Yan-zhen1, LI Chen-guang2

(1.TianjinKeyLaboratoryofControlTheory&ApplicationinComplicatedSystems,TianjinUniversityofTechnology;2.SinopecTianjinBranchCo.)

PCA-SS-LSSVM algorithm was used to predict the production data of a petrochemical enterprise in recent years. Simulation results show that, this algorithm can predict the adhesion rate accurately and timely and it has important guiding significance in improving production efficiency and reducing operating costs.

PCA-SS-LSSVM algorithm,fouling of cirulating cooling water,dynamic modeling, dynamic simulation

董超(1978-),副研究员,从事过程控制的研究。

联系人胡艳珍(1992-),硕士研究生,从事循环冷却水腐蚀结垢预测的研究, 1484324506@qq.com。

TH865;TP391

A

1000-3932(2017)11-1056-05

2017-05-18,

2017-09-13)

猜你喜欢

搜索算法降维结垢
混动成为降维打击的实力 东风风神皓极
一种基于分层前探回溯搜索算法的合环回路拓扑分析方法
改进的非结构化对等网络动态搜索算法
改进的和声搜索算法求解凸二次规划及线性规划
Helicobacter pylori-induced inflammation masks the underlying presence of low-grade dysplasia on gastric lesions
油田采出水结垢影响因素分析
降维打击
一种改进的稀疏保持投影算法在高光谱数据降维中的应用
玻璃钢原油管线结垢特性实验分析
基于跳点搜索算法的网格地图寻路