拉曼光谱法结合偏最小二乘法快速测定柴油十六烷值
2021-11-29俞艳文魏宇锋黎霄斐舒锡娜
邱 丰,俞艳文,魏宇锋,黎霄斐,舒锡娜,刘 曙
(上海海关工业品与原材料检测技术中心,上海 201507)
柴油是现代社会使用最多的车用燃料之一,十六烷值是衡量其燃烧性能的关键指标。柴油十六烷值过低,会导致燃烧延迟,使发动机产生爆震;过高则会燃烧不完全,导致燃油消耗量增加。因此,柴油十六烷值的测定对于柴油的质量评价和工艺控制具有重要意义。
ASTM D613-18《柴油十六烷值试验方法》和GB/T 386-2010《柴油十六烷值测定法》中规定,样品测定时需要先进行热机,再用标油多次标定,最后反复进行仪器手轮读数。测定过程耗时、耗力且成本高;标准方法中指定的国外品牌发动机设备、配件、标油等都需要进口,价格十分昂贵;后续定期的发动机维护保养费用也非常高,需要高标准的实验室和高素质的分析人员,中小炼油厂及一般的第三方实验室很少有能力配备。因此,有必要建立一种准确、快速且低成本测定柴油十六烷值的方法。
目前,十六烷值的测定方法有十六烷指数计算法[1]和近红外光谱法[2-8]。根据柴油的密度和馏程馏出温度两种数据来计算十六烷指数,在一定条件下能近似十六烷值,但存在很大的局限性,无法准确评价油品的燃烧性能[1]。拉曼光谱法可以测定物质所含的化学成分及其相对含量,是一种对样品进行无损定性定量的分析技术。它作为一种散射光谱,一般无需处理样品,可以直接通过玻璃、石英容器来进行检测,且对弱极性基团的响应信号比红外光谱强,因此拉曼光谱法适用于油品的快速定量和定性分析,特别是在油品调和过程中能在线实时测定关键指标[9-11]。由于拉曼光谱可以提供不同基团的信息,而柴油十六烷值与其组分中的链烷烃、环烷烃、芳烃等密切相关[11],因此可以采用拉曼光谱法来测定柴油的十六烷值[12]。
偏最小二乘法(PLS)是一种多因变量对多自变量的回归建模方法,通过计算光谱数据与目标分析物之间的最大方差对两者进行关联解析,适用于复杂的多组分光谱分析,是应用较广泛的多变量校准方法,具有很好的选择性和预测准确性。PLS能够消除数据中共线性的影响,有效降低光谱数据维度,其评价参数用校正相关系数和预测相关系数表示,并且用校正均方根误差(RMSEC)和预测均方根误差(RMSEP)来表示模型的预测能力。当RMSEC和RMSEP越小,并且校正相关系数和预测相关系数越趋近于1时,模型的分析效果越好。文献[13]采用PLS和神经网络结合拉曼光谱法对柴油的密度、黏度、十六烷指数等指标进行定量分析。
本工作通过优化校正集和预测集、光谱预处理方法、主因子数和光谱区域范围,建立了拉曼光谱法结合PLS测定柴油十六烷值的分析方法,以期准确、快速地测定柴油十六烷值。
1 试验部分
1.1 仪器与试剂
DXR 2xi型显微拉曼成像光谱仪;CFR F5型柴油十六烷值测定机。
十六烷值参考标油U-21(十六烷值为73.6),T-32(十六烷值为21.9);车用柴油、普通柴油、B5生物柴油样品共124个,由某石油公司提供。
1.2 仪器工作条件
扫描范围50~3 300 cm-1;分辨率4 cm-1;采集曝光时间5 s;扫描次数16次。
1.3 试验方法
1.3.1 标准发动机法
将校准燃料(由参考标油U-21和T-32配制而成)和柴油样品分别放入标准条件下的单缸发动机中,根据燃料在发动机中的燃烧情况,手轮部件上显示出相应的数值,比较校准燃料与样品的数值,采用内插法,计算得样品的十六烷值。
1.3.2 拉曼光谱法
将柴油样品置于液体槽中,按仪器工作条件进行测定。
1.3.3 建立 PLS模型
采用TQ Analyst光谱数据分析软件中的PLS校正方法,设置校正集和预测集的数量分别为103和21,选择卷积平滑(SG)和标准正态变量变换(SNV)对光谱进行预处理,主因子数为7。导入样品的拉曼光谱图及对应十六烷值结果,对700~1 700 cm-1和2 700~3 100 cm-1两个波长范围同时建立PLS模型,利用该模型预测柴油样品的十六烷值。
2 结果与讨论
2.1 拉曼光谱图分析
拉曼光谱从分子振动的水平上表现物质的结构特征,柴油的拉曼光谱图见图1。其中,2 850 cm-1处的特征峰对应亚甲基(-CH2)的伸缩振动;1 650 cm-1处的特征峰对应不饱和双键(C=C)的伸缩振动;1 450 cm-1处的特征峰对应烃基碳氢键(C-H)的剪式振动;1 300 cm-1处的特征峰对应烃基的变形振动[14]。通过柴油拉曼光谱图的辨识,可以在建立PLS模型的过程中更有针对性地选择光谱波段范围,从而提高模型的精密度。
图1 柴油样品的拉曼光谱图Fig.1 Raman spectrum of diesel oil sample
2.2 PLS模型的优化
2.2.1 校正集和预测集
为使PLS模型的拟合达到最佳效果,校正集和预测集的数量非常重要。试验用标准发动机法测定124个柴油样品的十六烷值,采用最大最小策略,按一定比例的校正集和预测集对124个样品建立PLS模型。即先计算所有候选样本的平均光谱,找到与平均光谱距离最小和最大的样本加入校正集;再计算其余样本与校正集中每个样本光谱的距离,找到与平均光谱距离最小和最大的样本加入校正集,重复以上步骤,直到校正集数量达到设定值,剩余样本则归入预测集。不同数量的校正集和预测集的模型参数见表1。
表1 不同数量的校正集和预测集的PLS模型参数Tab.1 PLS model parameters of calibration set and prediction set with different amounts
由表1可知,随着校正集数量的增加,模型的预测能力趋于理想,而校正集比例过高会产生过度拟合现象,预测相关系数明显下降,因此试验选择103个校正集和21个预测集来建立模型。
2.2.2 光谱预处理方法
常见的光谱预处理方法有一阶导数、二阶导数、SG等。导数光谱可以很好地消除基线平移和漂移,配合SG处理,可有效消除背景噪声的干扰,提高光谱分辨率,并且可以分辨重叠峰,增强光谱特征。SNV和多元散射校正(MSC)主要用于消除光程变化及表面散射现象对光谱的影响。采用导数、SNV、MSC、SG等光谱处理方法进行PLS建模,其相关参数见表2。
表2 不同光谱预处理方法的PLS模型参数Tab.2 PLS model parameters of different spectral pretreatment methods
结果显示,采用SG及SNV对光谱进行预处理时,RMSEC 为 1.04,校正相关系 数为 0.939 7,RMSEP为1.04,预测相关系数为0.903 4,各评价参数均较好,因此试验选择采用SG及SNV对光谱进行预处理。
2.2.3 主因子数
采用TQ Analyst光谱数据分析软件的留一法交叉验证功能,对光谱预处理后的PLS模型进行分析。即每次只使用一个样本作为测试集,剩下的样本全部作为训练集,直至每个样本都建立模型完成分析,最终得到验证均方根误差(RMSECV)。不同主因子数对应的RMSECV见图2。
由图2可见:当主因子数大于3时,PLS模型的RMSECV较小,并且逐渐稳定在1.2~1.5内;当主因子数为7时,RMSECV最小。因此,试验选择主因子数为7。
图2 不同主因子数的验证均方根误差Fig.2 Root mean square error of cross validation on different principal factor
2.2.4 光谱范围
柴油的组分非常复杂,拉曼光谱全波段中包含很多信息,加入模型的波长范围过宽会增加无用的光谱信息,降低模型的精密度和建模的速率,通过筛选光谱范围可以提高PLS模型的拟合度。根据柴油拉曼光谱图的特征峰,对光谱范围分段建模,其相关参数见表3。
表3 不同光谱范围的PLS模型参数Tab.3 PLS model parameters of different spectral regions
结果显示,同时对700~1 700 cm-1和2 700~3 100 cm-1两个光谱范围进行建模时,得到的评价参数较好,且这两个光谱范围内的谱峰信息丰富(图1),能有效地提取光谱信息。
2.3 PLS模型分析
按照上述优化后的条件建立PLS模型,并对124个柴油样品进行分析,所得结果与标准发动机法测定结果进行比较,结果见图3。
图3 PLS模型的分析结果Fig.3 Analytical results of PLS model
结果表明,标准发动机法测定样品的十六烷值和PLS模型分析样品的十六烷值结果均匀分布在等值线两侧,绝对误差在-2.9~2.9内,模型的均方差小于1,说明PLS模型分析结果较好。
2.4 方法比对
将近红外光谱法测定十六烷值的模型参数与本工作拉曼光谱法测定十六烷值的模型参数进行比对,结果见表4。
表4 拉曼光谱法与红外光谱法的模型参数对比Tab.4 Comparison of model parameters between Raman spectroscopy and infrared spectroscopy
由表4可见,拉曼光谱法结合PLS模型在准确度、精密度及稳定性上优于红外光谱法结合PLSSVM模型,与红外光谱法结合PLS模型评价结果基本一致。
本工作建立了拉曼光谱法结合PLS测定柴油十六烷值的方法。在PLS建模过程中,对校正集和预测集数量、光谱预处理方法、主因子数及光谱范围进行优化,最终建立的PLS模型的RMSEC为0.913,校正相关系数为0.954 3,RMSEP为0.911,预测相关系数为0.924 6。利用该模型对柴油样品进行分析,所得结果与标准发动机法测定结果的绝对误差为-2.9~2.9,满足发动机标准的要求,并且该方法具有分析快速、样品使用量少、分析成本低等优点,适用于实际样品的测定。