近红外光谱分析原油中水分和硫含量模型的建立及验证
2020-07-06
(上海海关 工业品与原材料检测技术中心,上海 200135)
原油中水分含量和硫含量是评价原油品质的2个重要指标。水分含量高会增加原油储存和运输过程动力与热力的消耗,腐蚀输送管线及炼油设备,不利于原油产品的加工,影响原油产品的质量[1]。硫含量过高会给原油加工企业带来一系列的安全隐患,包括硫腐蚀引发的各种生产设备及管线泄漏,硫化亚铁自燃、引燃诱发的着火或爆炸等事故,如果发生硫化氢泄漏,可能造成人员中毒等[2]。
目前,我国用于原油品质检测的标准方法多基于化学法,但化学法存在检测速度慢、操作繁琐,使用的大量高毒溶剂会对分析人员身体健康以及环境产生很大的危害等问题。例如国家标准GB/T 11133-2015是通过采用卡尔费休法检测原油中水分含量的,采用该标准检测时,不仅会耗用大量有机溶剂,而且长时间接触这些有机试剂会使人产生眩晕、麻木、痉挛、食欲不振、昏迷等症状,对检测人员身体健康造成极大威胁。原油产品中硫含量检测方法一般为管式炉法(GB/T 387-1990)及燃灯法(GB/T 380-1977),这些方法都是通过燃烧将硫化物转化成二氧化硫等物质,用吸收液吸收后再对吸收液进行滴定来计算出硫含量的,存在检测速率慢、操作繁琐、消耗大量有机试剂等问题。因此,建立快速、准确、环境友好的检测原油水分含量和硫含量的方法是非常有必要的。
近红外光谱法(NIRS)一般通过建立校正模型来对待测物进行定性和定量分析,它最大特点是对样品无破坏性、操作简便、分析迅速、测量信号可以远距离传输等,在农业[3-4]、烟草[5]、药品[6]及化工产品[7-10]等领域已得到广泛的应用。目前,NIRS用于柴油、燃料油、润滑油等油品品质分析的研究已被广泛报道[11-15]。例如:文献[12]采用NIRS建立柴油中芳烃含量的预测模型,对未知样品的预测结果与高效液相色谱法相比,平均偏差为0.27%;文献[14]利用人工神经网络方法(ANN)建立了润滑油闪点的近红外分析模型,实现对润滑油闪点的检测,可以快速判断润滑油中是否混入轻质油料,为及时找到设备故障提供依据。
NIRS在原油的品质分析中的应用较少,主要原因是原油的颜色深、黏度高,近红外光不易透过,难以获得光谱图。
本工作通过优化近红外光谱的采集条件获得了原油的近红外光谱数据,通过化学法获得了样品水分含量及硫含量的数据,通过偏最小二乘回归法(PLS)对近红外光谱数据进行回归运算,分别建立原油中水分含量、硫含量的近红外分析模型。通过模型预测,可以快速获得原油样品的水分含量和硫含量,本方法大大提高了检测效率,可及时将不合格产品拒于国门之外,为保障企业的经济利益与公众的健康安全提供了技术参考。
1 试验部分
1.1 仪器与试剂
Antaris II FT-NIR 型近红外光谱仪,配TQ Analyst 8、Result Integration、Result Operation分析软件;901型智能卡式水分仪;RX-360SH 型能量色散X 射线荧光光谱仪。
卡尔费休试剂;原油样品共120个,由上海海关工业品与原材料检测技术中心提供,在近红外光谱采集前,样品在4 ℃的冰箱中保存。
1.2 仪器工作条件
采集光谱前仪器预热1 h;样品吸收池为光程0.5 mm 的石英比色皿;样品台温控模块温度为30 ℃;分析光谱为透射光谱;扫描波数4 000~12 000 cm-1,扫描次数为32次,累计扫描64次;分辨率为8 cm-1。
1.3 试验方法
1.3.1 卡尔费休法测定原油中水分含量
按照GB/T 11133-2015对120份原油样品中水分含量进行测定。每个样品平行测定2次,取平均值。
1.3.2 原油中硫含量的测定
按照GB/T 17040-2008对120份原油样品中硫含量进行测定,取2次平行测定结果的平均值。
1.3.3 数据处理
采用TQ Analyst 8软件进行光谱预处理、光谱区间的优化、化学计量学分析水分和硫含量等数据处理工作。采用TQ Analyst 8软件中杠杆值算法剔除异常样品。水分含量分析模型的建模条件为:光谱采用Savitzky-Golay滤波预处理,建模光谱区间为6 200~8 200 cm-1,主成分数为6,用PLS算法交叉验证建立校正模型。硫含量分析模型的建模条件为:光谱采用二阶导数-Norris Derivative滤波预处理,建模光谱区间为4 400~4 700 cm-1,主成分数为6,用PLS交叉验证建立校正模型。样品分为校正集样品和交叉验证集样品,校正集样品用于建立校正模型,交叉验证集样品用于验证模型的准确性。根据校准决定系数()、内部交叉验证决定系数(),校正标准偏差(RMSEC)、交叉验证标准偏差(RMSECV)指标确定最优校正模型。
2 结果与讨论
2.1 原油样品的近红外光谱图
原油中有机含氢基团(C-H、O-H、N-H 和S-H 等)振动的倍频与合频的吸收构成了其近红外光谱的核心部分。按仪器工作条件下对120个原油样品进行测试,得到的近红外光谱图见图1。
图1 原油样品近红外光谱图Fig.1 NIR spectra of crude oil samples
由图1可以看出,原油样品近红外光谱可分为第一(10 000~6 250 cm-1)、第 二(6 250~5 000 cm-1)、第三(5 000~4 000 cm-1)等3 个波段,这与文献报道的原油的近红外吸收图一致[16]。第一个波段是有机含氢基团振动的高级倍频区,谱带较弱;第二个波段和第三个波段是这些基团振动的一级倍频和合频谱区,谱带较强。
2.2 化学分析测定结果
原油水分含量和硫含量化学分析结果(平均值、标准偏差、范围等)见表1。
表1 样品水分含量和硫含量测定结果Tab.1 Determined values of moisture and sulfur content in the sample
由表1 可以看出:原油中水分质量分数为0.04%~2.15%,硫质量分数为0.175%~3.35%。说明所选择的120份原油样品,其水分含量和硫含量基本上涵盖了目前检测可能出现的含量变化范围,具有较好的建模样品代表性,可以保证所建的近红外分析模型的可靠性。
2.3 近红外分析中异常样品的剔除
采用 TQ Analyst 8 软件中的马氏距离(Spectrum Outlier)和杠杆值(Leverage)等2 种算法来剔除异常样品,以提高原油中水分含量和硫含量近红外光谱分析结果的准确性和可靠性。以水分含量模型为例,采用马氏距离剔除了5 个样品,采用杠杆值剔除了4个样品,比较了不同算法剔除异常样品前后的和RMSEC 的变化,结果见表2。
表2 剔除异常样品前后的 和RMSEC值Tab.2 Values of and RMSEC obtained before and after rejection of abnormal samples
表2 剔除异常样品前后的 和RMSEC值Tab.2 Values of and RMSEC obtained before and after rejection of abnormal samples
由表2可知:经过2 种算法剔除异常样品后,RMSEC都有所减小,有所提高,这说明模型预测的准确度提高,而采用杠杆值算法剔除异常样品后得到的模型的准确度更高,试验选择杠杆值算法剔除异常样品。
2.4 光谱预处理方法的选择
样品中物质含量的信息是通过物质特征结构中的C-H、S-H 和O-H 基团对近红外光谱的吸收大小表现出来的,因此可以根据物质结构特征选择光谱区间。根据文献[17],水中羟基(O-H)的合频伸缩振动吸收在5 150 cm-1左右,一级倍频的伸缩振动吸收在6 944 cm-1左右,巯基(S-H)在一级倍频区有着较强吸收。以水分含量分析模型为例,试验考察了不同光谱区间对模型指标的影响,见表3。
表3 光谱区间对水分含量分析模型指标的影响Tab.3 Effect of the spectral interval on the index of the model for prediction of moisture content
由表3可知:当光谱区间为6 200~8 200 cm-1时,得到的最大,RMSEC最小。
在近红外光谱分析中,由于受到仪器、样品背景或其他因素影响,常出现谱图的偏移或漂移现象,会影响到校正模型的优劣和未知样品预测结果的准确度。因此,建模前还需对光谱数据进行预处理,以减弱以至消除各种非目标因素对光谱的影响。以水分含量分析模型为例,试验运用Result软件考察了分别采用常数偏移消除一阶导数(FD),二阶导数(SD)、Savitzky-Golay滤波、Norris Derivative滤波等不同光谱预处理方法时对、RMSEC、、RMSECV等模型指标的影响,结果见表4。
由表4可知:在经过Savitzky-Golay滤波方法进行光谱预处理后,值有了显著提高、RMSEC明显降低,模型的准确性进一步提高,试验选择采用Savitzky-Golay滤波方法对光谱进行预处理。
2.5 不同建模算法的选择.
以水分分析模型为例,试验考察了采用主成分回归(PCR)、多元线性回归(MLR)和PLS等算法建模时对模型指标的影响,结果见表5。
表4 光谱预处理对水分含量分析模型指标的影响Tab.4 Effect of method for pretreatments of NIR spectra on index of the model for prediction of mosture content
表5 建模算法对水分含量分析模型指标的影响Tab.5 Effect of modeling algorithm on index of the model for prediction of moisture content
2.6 水分含量近红外分析模型的建立及验证
图2 水分含量预测值和测定值的相关性Fig.2 Correlation between predictied values and determined values of moisture content
由图2可以看出:样品中的水分含量分布较均匀,模型预测值与测定值的相关性较好。模型的决定系数在0.980 0 以上且有着较小的校正标准偏差,说明水分含量分析模型的预测效果较好,可以用于原油中水分含量的快速预测。
按照仪器工作条件对10个未知原油样品进行测定,并同标准方法进行比较,以验证分析模型的准确度,结果见表6。
表6 10个未知原油样品水分含量的预测值和测定值的比较Tab.6 Comparison of predicted values and determined values of moisture content in the 10 unknown crude oil samples
由表6可以看出,预测值与测定值相吻合,相对偏差小于9.0%。
2.7 硫含量近红外分析模型的建立及验证
图3 硫含量预测值和测定值的相关性Fig.3 Correlation between predicted values and determined values of sulfur content
由图3可知:模型预测值与测定值的相关性很好。模型的决定系数大于0.990 0,校正标准偏差较小,说明硫含量分析模型的预测效果较好,适用于原油中硫含量的检验。
按照仪器工作条件对10个未知原油样品进行测定,并同标准方法进行比较,以验证分析模型的准确度,结果见表7。
表7 10个未知原油样品硫含量的预测值和测定值的比较Tab.7 Comparison of predicted values and determined values of sulfur content in 10 unknown crude oil samples
由表7可以看出:预测值与测定值的结果相吻合,相对偏差小于5.0%。
本工作采用光程为0.5 mm 的比色皿,成功采集原油的近红外光谱图,并通过优化建模条件建立了原油中水分及硫含量的近红外分析模型,结果显示,预测值与测定值具有良好的线性相关,模型准确度高、稳定性好,且模型的覆盖范围广,具有实际的应用价值。