APP下载

柴油十六烷值快速分析技术研究

2016-04-12李敬岩安晓春田松柏杨星明

石油炼制与化工 2016年5期
关键词:十六烷值柴油校正

李敬岩,安晓春,田松柏,杨星明

(1.中国石化石油化工科学研究院,北京 100083;2.中国石化茂名分公司)

柴油十六烷值快速分析技术研究

李敬岩1,安晓春2,田松柏1,杨星明2

(1.中国石化石油化工科学研究院,北京 100083;2.中国石化茂名分公司)

基于上千个柴油样本建立了测定柴油十六烷值的近红外光谱数据库,采用一次性空瓶解决了光谱快速采集的问题,通过向数据库中添加少量样本的方式改进了模型在某石化企业的适用性,通过偏最小二乘法、支持向量机法和最小二乘支持向量机法将不同类型的柴油建立了统一的分析模型,并比较了不同算法建模的准确性。结果表明:使用PLS,SVM,LSSVM算法建立的校正模型对柴油样本十六烷值的预测标准偏差分别为1.6,1.4,1.3,可满足快速评价要求。本研究节约了建模成本,减少了数据库的维护工作量。

近红外光谱 柴油 十六烷值 数据库 化学计量学

柴油是目前使用最多的车用燃料之一,柴油十六烷值(CN)是衡量燃烧性能的主要指标。测定柴油十六烷值的标准方法为发动机台架试验。由于该试验机价格昂贵、使用和维护费用高,需要较高标准的实验室和高素质分析人员,中小炼油厂很少配备;即使一些大型炼油厂使用的频率也很低,一般每月只测1~2次,平时则采用十六烷指数来评价柴油的燃烧性能,不便用于柴油的自动调合系统。由于十六烷指数的影响因素较多,其与十六烷值的对应关系往往随油品组成的改变而变化,以致影响对油品燃烧性能的正确评价。

近红外光谱结合化学计量学方法可以快速测定柴油的多项性质和组成数据[1-2]。近红外光谱法(NIR)不需要对样品进行预处理,操作简单,分析快速,非常适合油品的定量和定性分析,在石油化工行业中得到了较为广泛的应用[3-4]。目前,在柴油的自动调合中,也大都采用在线近红外技术实时测定十六烷值、多环芳烃含量、密度等关键指标[5-6]。近红外分析技术需建立较复杂的分析模型,才能得到可靠的测量结果。建立稳健的定量校正模型是近红外光谱分析的核心之一,经典的多元校正方法有偏最小二乘(PLS),可以完美地回归线性系统,近红外光谱建立的模型是基于开放性的、可扩展样品数量的数据库技术,随着使用过程校正集样本数量的不断增加,其适用范围将越来越宽,分析准确性和稳健性也将越来越高。

国外一些大型石化企业以及知名仪器公司都有汽油、柴油数据库,在先进过程控制和优化控制等方面发挥着重要的作用。在柴油分析方面,中国石化石油化工科学研究院(简称石科院)前期只是做了初步的探索工作,尚未进行系统的研究和开发。针对目前某石化企业对柴油快速分析以及未来柴油调合工艺的需要,本研究拟在一系列研究成果的基础上,进一步扩充柴油近红外数据库,并解决试验过程中的具体技术问题,针对性地建立柴油十六烷值分析模型并为以后柴油在线调合提供方案。

1 实 验

1.1 柴油样本

石科院柴油库共收集了1 148个柴油样本,包括催化裂化柴油、直馏柴油、加氢柴油、成品柴油;其中,有多环芳烃基础数据的470个样本,有密度基础数据的380个样本,有碳含量和氢含量基础数据的141个样本,有十六烷值基础数据的508个样本。柴油样本的收集时间为2009年11月至2014年8月。所有样本用20 mL密封小瓶封装,放置于冰柜中保存。柴油的十六烷值由台架试验机测定。

某石化企业需使用近红外光谱仪来进行数据库的建立和预测柴油性质的工作。从该石化企业收集两个批次,共计72个柴油样本,十六烷值范围从43.3到55.7,收集时间为2013年7月至2014年9月。

1.2 近红外光谱仪与光谱采集

本研究选用Thermo公司的Antaris Ⅱ傅里叶变换型近红外光谱仪作为建立汽柴油近红外光谱数据库的硬件平台。

采集柴油样本的近红外光谱参数如下:①仪器:Thermo Antais Ⅱ傅里叶变换近红外光谱仪;②测量附件:透射样品室,带聚乙烯塞一次性透明0.7 mL圆筒玻璃小瓶,35 mm×7.8 mm,光程6.5 mm,用空玻璃小瓶进行背景测量;③光谱分辨率:8 cm-1;④累计扫描次数:128次;⑤光谱采集范围:3 500~10 000 cm-1。典型柴油的近红外光谱见图1。

图1 典型柴油的近红外光谱

1.3 实验方法

在油品测量时,传统使用的比色皿方式给油品的光谱测量带来了诸多不便,如比色皿价格高,需要清洗后重复使用,且易损坏。由于柴油的黏度较大,比色皿清洗费时费力。另外,比色皿密封性差,容易造成环境污染,光谱的重复性较难保证,也不能长期对油品进行储存。

本研究选用一次性玻璃小瓶作为采集汽柴油近红外光谱的测量方式,在光谱采集过程中,以空样品瓶做参比,消除一次性玻璃小瓶在材质和尺寸上存在的微小差异。相比于传统的比色皿采样方式,其具有如下技术优势:①测量方便,价格便宜,一个玻璃小瓶约1元人民币;②因不用清洗,样品用量大幅度下降(仅需1 mL),且环境污染小;③小瓶密封性好,光谱测量重复性显著提高;④小瓶容量小,密封性好,可以长期对样品进行保存。

1.4 定量校正方法

将采用标准方法测得的十六烷值和柴油光谱通过石科院“化学计量学光谱分析软件3.0”进行编辑,生成标准矩阵式数据库。光谱预处理、定量校正等计算均在石科院“化学计量学光谱分析软件3.0”上进行。程序运行平台:ThinkPad T440p,i5(2.50 GHz),4 GB RAM。本研究采用PLS、支持向量机(Support Vector Machine,SVM)和最小二乘支持向量机(Least Squares Support Vector Machines,LSSVM)3种定量校正方法进行建模。

PLS定量校正方法基本模型为:

Y=UQT+EY

(1)

X=TPT+EX

(2)

式中:T和U分别是X和Y矩阵的得分矩阵;P和Q分别是X和Y矩阵的载荷矩阵;EX和EY分别是X和Y矩阵的PLS拟合残差矩阵。然后将T和U作线性回归:

U=TB

(3)

B=(TTT)-1TTY

(4)

式中,B为回归系数。在预测时,首先根据P求出未知样品光谱矩阵Xun的得分Tun,然后根据式(5)得到浓度预测值Yun:

Yun=TunBQ

(5)

SVM是在20世纪 90 年代Vapnik等建立的统计学习理论(Statistical Learning Theory,SLT)基础上发展起来的一种新的模式识别方法。SVM 可有效克服神经网络方法收敛难、解不稳定以及推广性(泛化能力、预测能力)差的缺点,SVM收敛速度快、无局部最优解。

对于光谱矩阵X={x1,x2,…xn},对应的性质矩阵Y={y1,y2,…yn},其中xi∈Rd为输入向量,yi∈R为目标向量,d是维数,i=1,2,…n。首先由一非线性映射φ(·)将原空间映射Rd到特征空间φ(xi),然后在高维特征空间内构造最优决策函数y(x)=wTφ(x)+b,并以结构风险最小化原则优化模型参数w和b,其中以核函数代替从低维到高维的映射,该模型构建以下约束优化问题:

(6)

式中:Remp为训练误差;C为模型的正规化参数。建立适用的SVM校正模型需要首先对模型参数进行优化,γ参数是选择径向基函数作为核函数后,该函数自带的一个核宽度参数。

为降低训练时间、减少计算复杂程度以及提高泛化能力,一些改进的支持向量机算法被提出,如LSSVM等。LSSVM采用最小二乘线性系统作为损失函数,通过解一组线性方程组代替传统 SVM 采用的较复杂的二次规划方法,降低了计算复杂性,加快了求解速度。

LSSVM以线性系统降低了计算的复杂性,控制过拟合,无局部最小点,预测可靠性高且泛化能力更强。其构建的线性系统如下:

(7)

式中:I=[1,…,l];K为核函数,这里采用径向基核函数。通过最小二乘法求解线性系统(7)可得到参数a、b。最终得到LSSVM决策函数为:

(8)

当采用径向基核函数时,需要调节核参数δ2和正规化参数C。这两个参数对模型的计算复杂度和预测精确度都有很大的影响,本研究采用基于交互验证的网格搜索法寻找最优的参数组合。

2 结果与讨论

2.1 光谱预处理

仪器采集的近红外光谱信号除样品信息外,还包含来自各方面的噪声。光谱预处理的目的是滤去噪声,提取有用信息,方便后续处理。常用的光谱预处理方法有小波变换、平滑、归一化和微分等。其中微分是一种常用的光谱预处理方法,可以有效地消除样本颜色、基线和其它背景干扰,分辨重叠峰,提高分辨率和灵敏度。本研究采用二阶微分处理,以解决柴油样品在颜色上的差别引起的光谱基线偏移和漂移。图2为成品柴油的二阶微分光谱。

图2 柴油的二阶微分光谱

2.2 光谱范围的选择

在不同波长范围的近红外光谱所含的信息量不同。要建立稳健的校正模型需要选择与具体性质相关的谱区,因为没有显著吸收特征和与其它官能团吸收峰重叠的光谱区间将会降低校正模型的预测能力。以成品柴油为例,考察不同波长范围与十六烷值的相关性。图3为十六烷值与近红外光谱的相关系数,从图3可以看出,在不同的光谱区间十六烷值与近红外光谱的相关性有较大的差别,其中4 500~6 000 cm-1范围内光谱与十六烷值具有较高的相关性,但从图1可以看出在此区间内吸光度远远大于1,此吸光度非线性响应较强,因此不予选择。通过比较得出,7 000~7 400 cm-1和8 100~8 600 cm-1范围内光谱与十六烷值具有较高的相关性,可以作为建模的区间。选择最有用的光谱信息建立校正模型,不但可以提高模型预测能力,同时由于剔除了信息弱的光谱区域,减少了光谱数据量,能够提高计算速度。

图3 柴油十六烷值的光谱与性质的相关性

2.3 PLS校正模型

采用石科院 “化学计量学光谱分析软件3.0”中的PLS方法建立校正模型。模型建立前,首先选取石科院柴油库构成校正集,选取其中30个柴油样本作为监测集样本,某石化企业收集的72个柴油作为验证集样本。所有样本均在38 ℃下采集光谱,光谱首先经二阶微分处理,以消除样品颜色、温度及基线漂移等因素的影响,选择与十六烷值有良好相关性的近红外光谱波段区间(7 000~7 400 cm-1和8 100~8 600 cm-1)作为特征谱区,将特征谱区内的吸光度与标准方法测定的十六烷值数据相关联,建立柴油十六烷值的校正模型。光谱最佳主因子数采用交互验证法所得的预测残差平方和(PRESS)确定。模型通过校正标准偏差(SECV)和监测集的标准偏差(SEM)来评价。

图4为交互验证的PRESS图,当主因子数为11时,PLS交互验证SECV达到最小并趋于稳定,因此由交互验证所得的预测PRESS确定光谱最佳主因子数为11。

图4 交互验证PRESS图

图5为PLS建模的校正结果。从图5可以看出,采用NIR方法与常规方法测得的柴油十六烷值具有良好的相关性,十六烷值交互验证得到的SECV为1.6,SEM为1.8,与常规分析方法的重复性基本相当,说明所建模型有较好的预测能力。将所建立的PLS校正模型分别对验证集中72个某石化企业柴油样本的十六烷值进行预测分析,结果见表1。

图5 PLS校正模型中十六烷值的NIR测定值与实测值的相关性■—校正集; ●—监测集。 图7、图8同

从表1可以看出,由于校正集中不含某石化企业柴油,因其在组成上与库中柴油存在少许差异,所以导致个别样本的预测结果偏差较大,预测标准偏差(SEP)为1.9,最大的十六烷值预测偏差为4.3个单位。

从72个某石化企业柴油样本里选取20个样本补充到校正集中,重新建立校正模型,对剩余52个样本的十六烷值进行预测分析,结果见表2。从表2可以看出,经添加某石化企业柴油样本后,校正模型的适应性有了显著提高,SEP为1.6,十六烷值的预测值基本与实测值一致。说明该模型经过较少样本的更新后,可以解决校正模型的适应性问题。

表1 PLS方法对72个某石化企业柴油未知样本的十六烷值预测结果

上述结果说明,若将一个或数个炼油厂的柴油样本建立的十六烷值近红外模型直接用于另一个炼油厂,则会存在一定的系统误差。通过向校正集中添加少量的新炼油厂的样本更新模型后,便可扩大模型的适用性,得到更为准确的预测结果。

表2 PLS模型中NIR方法对52个某石化企业柴油未知样本的十六烷值预测结果

2.4 SVM模型

采用径向基函数作为核函数,建立适用的SVM校正模型需要首先对模型参数进行优化,包括γ参数(选择径向基函数作为核函数后,该函数自带的一个核宽度参数)以及模型的正规化参数C。

图6是通过网格搜索法,在一定的范围内选择参数组合进行模型计算得到的误差面,其中X轴和Y轴代表参数γ和C,Z轴为校正标准偏差(SEC)。选取合适的参数组合使模型的SEC最小,从图6可以看出,γ和C值分别选择20、18时基本满足要求。

确定模型参数后采用SVM方法建立校正模型。模型建立前,首先选取石科院柴油库构成校正集,其中30个柴油样本作为监测集样本,某石化企业72个柴油样本作为验证集样本。由近红外光谱性质相关系数图选取光谱区间参与模型的建立。

图6 SVM网格搜索误差面

图7为采用NIR方法与常规方法测得的柴油十六烷值的相关性,结果表明,十六烷值的SEC为1.7,SEM为1.9。

图7 SVM模型中十六烷值的NIR测定值与实测值的相关性

从72个某石化企业柴油样本中选取20个样本补充到校正集中,重新建立校正模型,对剩余52个样本的十六烷值进行预测分析,结果见表3。从表3可以看出,SEP为1.4,十六烷值的预测值基本与实测值一致。说明该模型经过较少样本的更新后,进一步提高了预测准确性。

2.5 LSSVM模型的建立

超参数是决定LSSVM的学习精度和泛化能力的重要参数,本研究采用径向基核函数,首先需要调节核参数δ2和正规化系数C,通过基于交互验证的网格搜索法找到最优的参数组合,得到lgC和lgδ2分别为8.0和4.9。

表3 SVM模型中NIR方法对52个某石化企业柴油未知样本的十六烷值预测结果

确定模型参数后,采用LSSVM方法建立校正模型,样本集同PLS模型,图7为采用NIR方法与常规方法测得的柴油十六烷值的相关性,结果表明,十六烷值的SEC为1.7,SEM为1.9。

图8 LSSVM模型中十六烷值的NIR测定值与实测值的相关性

选取20个某石化企业柴油样本补充到校正集后,重新建立校正模型,对剩余52个样本的十六烷值进行预测分析。将所建立的LSSVM校正模型对验证集柴油样本的十六烷值进行预测分析,结果见表4。从表4可以得出,SEP为1.3,优于PLS方法和SVM方法。

表4 LSSVM模型中NIR方法对52个某石化企业柴油未知样本的十六烷值预测结果

3 结 论

本研究扩充了石科院柴油数据库到千余个柴油样本,基于NIR方法开发了适用于某石化企业柴油十六烷值的预测分析校正模型。

研究结果表明,若将原石科院近红外柴油PLS校正模型直接用于某石化企业柴油十六烷值的预测分析,则会存在一定的系统偏差。但通过向校正集中添加较少数量的样本更新模型后,便可扩大模型的适用性,显著减少校正模型的维护量,得到准确的预测结果。

本课题同时考察了SVM以及改进后的LSSVM非线性校正方法建立柴油十六烷值校正模型的效果,结果表明这两种方法对某石化企业柴油样本的预测结果均优于PLS方法。使用PLS,SVM,LSSVM算法建立的校正模型对某石化企业柴油样本十六烷值预测的SEP分别为1.6,1.4,1.3,满足企业要求。

[1] 徐广通,陆婉珍,袁洪福.近红外光谱测定柴油十六烷值[J].石油学报(石油加工),1999,15(4):62-67

[2] Julio C L A,Claudete B H,Ronei J P.Classification of diesel pool refinery streams through near infrared spectroscopy and support vector machines using c-SVC and m-SVC[J].Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2014,117:389-396

[3] Jr Vianney O S,Flavia C C O,Daniella G L,et al.A comparative study of diesel analysis by FTIR,FTNIR and FT-Raman spectroscopy using PLS and artificial neural network analysis[J].Analytica Chimica Acta,2005,547(2):188-196

[4] 徐广通,刘泽龙,杨玉蕊,等.近红外光谱法测定柴油组成及其应用[J].石油学报(石油加工),2002,18(4):65-71

[5] Julio C L A,Claudete B H,Ronei J P.Determination of diesel quality parameters using support vector regression and near infrared spectroscopy for an in-line blending optimizer system[J].Fuel,2012,97:710-717

[6] Li Jingyan,Chu Xiaoli,Tian Songbai.Research on calibration transfer across infrared spectrometric instruments for fast evaluation of crude oils[J].China Petroleum Processing and Petrochemical Technology,2015,17(1):1-5

RESEARCH ON FAST EVALUATION FOR DIESEL CETANE NUMBER BY NEAR-INFRARED SPECTROSCOPY

Li Jingyan1, An Xiaochun2, Tian Songbai1, Yang Xingming2

(1.SINOPECResearchInstituteofPetroleumProcessing,Beijing100083; 2.SINOPECMaomingCompany)

Based on more than one thousand diesel samples, the near infrared spectroscopic database for determination of cetane number was established, where a disposable headspace bottle was used for the spectral fast acquisition. By adding a small amount of samples to the database, a suitable model for a petrochemical company was obtained. A robust and uniform calibration model was developed for different types of diesels by partial least squares method,SVM and LSSVM algorithm and by comparing their results. The standard error of prediction of diesel CN using PLS, SVM and LSSVM calibration model were 1.6, 1.4 and 1.3, respectively. The work has advantages of high speed, cost saving of modeling and reduction of the database maintenance workload.

NIR; diesel; cetane number; database; chemometrics

2015-09-24; 修改稿收到日期:2015-11-27。

李敬岩:博士,高级工程师,从事原油及油品的快速分析工作。

李敬岩,E-mail:lijy.ripp@sinopec.com。

猜你喜欢

十六烷值柴油校正
用履带收割机送柴油
柴油十六烷值改进剂的应用
柴油加入十六烷值改进剂后储存试验探究
劉光第《南旋記》校正
基于幂指数法预测柴油十六烷值
在Lightroom中校正镜头与透视畸变
机内校正
基于PLC控制柴油发电机组3D 模型
柴油发电机负荷计算
测定柴油十六烷值的影响因素分析