最小二乘支持向量机结合中红外光谱测定甲醇柴油甲醇含量
2016-11-19欧阳爱国唐天义刘燕德
欧阳爱国, 唐天义, 周 鑫, 刘燕德
(华东交通大学 光机电技术及应用研究所, 江西 南昌 330013)
最小二乘支持向量机结合中红外光谱测定甲醇柴油甲醇含量
欧阳爱国*, 唐天义, 周 鑫, 刘燕德
(华东交通大学 光机电技术及应用研究所, 江西 南昌 330013)
采用中红外光谱法对甲醇柴油的甲醇含量进行检测分析。首先,对采集到的原始光谱进行预处理(标准正则变换、多元散射校正、一阶微分、二阶微分、Savitzky-Goly平滑),采用偏最小二乘法和最小二乘支持向量机建立了甲醇柴油的甲醇含量预测模型,并比较了不同预处理方法对模型预测能力的影响。实验结果表明,LSSVM的建模效果最佳,其预测集相关系数R2为0.981 8,预测均方误差RMSEP为1.3917%(体积比)。因此,中红外光谱技术可用于甲醇柴油中甲醇含量的快速检测,且可以达到很好的效果。
中红外光谱; 甲醇柴油; 偏最小二乘; 最小二乘支持向量机
1 引 言
汽车工业的快速发展使人们对石油的需求逐年增加,直接导致石油资源日益枯竭和环境恶化等问题,为解决这个问题,世界各国都在寻找石油燃料的替代品。沼气、液化石油气、天然气、氢气、二甲醚、醇类(甲醇、乙醇)、酯类(植物油、生物柴油)[1-2]等都可以作为内燃机的替代燃料。目前,我国仅有天然气、液化石油气、二甲醚、甲醇较成功地应用于柴油机,但同时还需对发动机进行参数调整或改造[3]。其中甲醇柴油作为生物柴油的一种,是在柴油中加入一定比例的甲醇同时添加一定的助溶剂使甲醇与柴油均匀混合形成新型混合燃料。它可以代替纯柴油使用,减小柴油使用量,同时也降低了我国对国外石油进口的依赖程度。柴油中添加甲醇能够有效减少氮氧化物、碳氢化合物的排放,燃烧充分可以减少碳烟的形成。甲醇的沸点低于柴油沸点,当柴油表面燃烧时,内部的甲醇受热并汽化,体积急剧膨胀,产生的巨大压力使柴油油滴爆破,油滴进一步变小,容易形成“二次雾化”,使柴油和空气的接触面积大幅度增加,提高了燃烧效率,达到节能的效果[4]。
金盼盼等[5]利用中红外汽油分析仪,检测了不同浓度甲醇汽油的RON辛烷值、MON辛烷值和抗爆性,比较了甲醇含量变化时的甲醇汽油辛烷值及抗爆性变化。覃旭松等[6]借助拉曼光谱技术分析了汽油辛烷值的检测方法,同时结合小波变换和支持向量机(Support vector machine,SVM)等方法,显著提高了模型的稳健性和预测精度。目前,甲醇柴油中甲醇含量的光谱检测国内还鲜有报道。中红外光谱检测技术发展比较成熟,可以对固态、气态或者液态的无机、有机、高分子化合物进行检测,精度高,重复性好。本文主要应用中红外光谱技术测定甲醇柴油的甲醇含量,建立了偏最小二乘和最小二乘支持向量机模型,并比较了两个模型的结果。
2 实 验
2.1 实验样品
由于甲醇的亲水性和柴油的亲油性,甲醇和柴油是互不相溶的,两者直接混合会出现明显分层。因此,在配制甲醇柴油时需要添加助溶剂,且添加剂应该具备亲油和亲水两种性质。常用助溶剂主要有以下几类:植物油(脂肪酸类)、胺类、醇类等[7-8]。油酸是脂肪酸类的一种,其来源广泛,大量存在于植物油脂中且价格低廉。油酸含有烃基和羧基,其密度、碳原子数均与柴油接近,能够增强甲醇柴油的稳定性。因此本实验选择油酸作为助溶剂。
实验所用柴油是从学校附近某加油站购买的中石化国四0#成品柴油,甲醇和油酸均采购于江西赣仪科技有限公司。甲醇为实验用无水甲醇(纯度>99.5%)。甲醇柴油配制时室温始终控制在30 ℃左右,且油酸的加入量会随甲醇含量、温度等要求的不同而有所变动。首先,通过移液枪将油酸和甲醇按大约1∶1的比例加入50 mL容量瓶形成变性甲醇。然后,加入柴油并滴定至50 mL,搅拌均匀,静置得到淡黄色透明液体。按上述的比例和方法,分别配制了32种不同浓度的甲醇柴油溶液,甲醇的体积分数为2%~25.8%,然后每个浓度分为3个样品,共得到96个甲醇柴油样品,所得32种甲醇柴油的体积分数如表1所示。
表1 甲醇在32种甲醇柴油中的体积分数
2.2 实验仪器
实验使用的红外光谱仪是北京北分瑞利分析仪器(集团)公司生产的WQF-510A傅立叶变换红外光谱仪,配备高性能的空冷高效球反射红外光源、角镜型迈克尔逊干涉仪系统和DTGS红外探测器系统。使用上海恒平科学仪器有限公司生产的NDJ-5S旋转粘度计(数字式)对甲醇柴油样本进行粘度测试。
2.3 光谱采集
WQF-510A傅立叶变换红外光谱仪光谱测量范围为7 800~350 cm-1,分辨率优于0.85 cm-1,扫描时间设置为32 s。开机预热30 min后,仪器方可使用。环境温度控制在5~35 ℃之间,相对湿度控制在80%以下。采集时,先将镜片放在样品架上,再用塑料吸管吸取甲醇柴油使之充满整个镜片表面,关紧仪器舱门,进行光谱采集。每个浓度样品制备3份,每份测3次,取平均光谱后用于后续数据处理。
2.4 数据分析
采用MainTOS光谱采集软件来采集样品的透过率光谱,再由“谱图打印”专用程序进行光谱与数据转换处理, 使用Unscrambler (verion.10.1; CAMO AS, Trondheim, Norway)化学计量学分析软件进行预处理。本文所有程序均在MATLAB R2012a中编写、运行。
3 结果与讨论
3.1 甲醇柴油的光谱图及甲醇含量的统计分析
甲醇柴油的中红外光谱如图1所示,在1 250~1 800 cm-1以及2 500~3 250 cm-1范围内,光谱与甲醇含量有较好的线性关系。甲醇特征峰出现在1 375,1 480,1 690 cm-1附近,这是由于甲醇柴油中甲基C—H的一级倍频在1 695 cm-1处,合频在1 360 cm-1和1 435 cm-1处,与甲醇含量具有一定的线性相关性;而在1 667~2 000 cm-1范围内的光谱数据与甲醇含量的线性相关性较差,这是由于柴油中烃类物质的官能团吸收峰重叠导致的。
3.2 偏最小二乘法模型的建立
为减小测量过程中仪器或温度等因素的影响,本文主要采用以下几种方法进行预处理:标准归一化(SNV)、多元散射校正(MSC)、一阶微分(First Derivative)、二阶微分(Second Derivative)、Savitzky-Goly平滑(SG)。偏最小二乘是光谱分析中最常用的建模方法,广泛应用于食用油、石化、食品及农产品等领域[9-14]。本文用KS算法将96个样本划分为建模集和预测集,剔除3个异常样本后,70个用于建模,23个用于验证,其统计结果如表2所示。将处理后的光谱作为模型的输入变量,甲醇柴油的甲醇含量作为预测值,建立了甲醇柴油中甲醇含量的PLS模型,其结果如表3所示。从表3可以看出,不同预处理方法对模型的结果有影响。经标准正则变换(SNV)预处理后建立的甲醇柴油中甲醇含量的PLS模型最优。不同的因子数对模型有所影响,此时,模型最佳主因子数为18。校正集相关系数为0.995 9,均方根误差为0.4452%(体积比);预测集相关系数为0.962 6,预测均方根误差为1.3599%(体积比)。模型的预测散点图如图2所示。
表2 甲醇柴油中甲醇含量的统计
表3 不同光谱预处理方法建模和预测结果
Fig.2 Scatter plots of the prediction of methanol content with PLS
3.3 最小二乘支持向量机模型的建立
最小二乘支持向量机是常见的非线性校正技术,能够从光谱数据中提取出非线性信息,使模型达到最佳的建模效果,本文将原始光谱经过不同预处理方法(SNV、MSC、First derivative、Second
derivative、SG)后的光谱作为模型的输入变量x,甲醇柴油的甲醇含量作为输出变量y,用KS算法将96个样本划分为建模集和预测集,剔除3个异常样本后,70个用于建模,23个用于验证,建立了甲醇柴油甲醇含量的LSSVM[15-17]模型。分别采用Lin函数和径向基函数(RBF)作为模型的核函数,比较两者结果后,最终采用径向基函数(RBF)作为核函数。该模型主要有两个待定参数:gamma(γ)和sig2(σ2),这两个参数在很大程度上决定了模型的学习泛化能力和预测能力。每次运行结果都有稍微的差别。不同预处理下建立的模型结果如表4所示,由表4可知,经多元散射校正(MSC)预处理后建立的甲醇柴油中甲醇含量的LSSVM模型获得了最优的预测结果。该模型的两个参数最佳组合为:γ=621.11,σ2=537.12。该模型对预测集样本进行预测的相关系数为0.981 8,预测均方根误差为1.3917%(体积比)。模型的散点图如图3所示。
表4 甲醇柴油中甲醇含量的LSSVM模型结果
Fig.3 Scatter plots of the prediction of methanol content with LSSVM
从表3、4中看出,经标准归一化(SNV)处理后的光谱数据建立的甲醇柴油中甲醇含量的偏最小二乘模型最优;经多元散射校正(MSC)处理后的光谱数据建立的甲醇柴油中甲醇含量的最小二乘支持向量机模型最优。且在相同预处理情况下(SNV、MSC、First derivative、Second derivative、SG)LSSVM模型的建模效果均优于PLS模型。这说明在甲醇柴油的甲醇含量检测方面,LSSVM是一种很有效的建模方法。
图4和图5分别为偏最小二乘模型和最小二乘的绝对残差分布。LSSVM模型的残差主要分布在-0.8%~1.1%之间,PLS模型的残差主要分布在-1.75%~1.5%之间。比较两图可以看出,LSSVM模型残差接近零线的点的个数较多,个别几个偏离较大,说明模型的预测值更加接近其真实值;而PLS模型残差偏离零线的点的个数较多,说明模型的预测值更加偏离其真实值。从绝对残差分布这一点可以得出,LSSVM模型的拟合效果要优于PLS模型。甲醇柴油是一种非线性检测目标,甲醇柴油的中红外光谱信息中含有更多的非线性信息。
Fig.4 Absolute residual distribution of predictions for PLS
Fig.5 Absolute residual distribution of predictions for LSSVM
4 结 论
本文应用中红外光谱技术结合线性(PLS)和非线性(LSSVM)校正技术实现了甲醇柴油中甲醇含量快速准确的预测,且光谱在MSC处理后建立的LSSVM模型取得了最优的结果,模型预测集的相关系数R2为0.981 8,预测均方根误差RMSEP为1.3917%。甲醇含量的预测精度比较令人满意,表明应用中红外光谱技术和PLS/LSSVM快速无损检测甲醇柴油的甲醇含量是可行的。本文虽然只是对甲醇柴油的甲醇含量这一个指标进行了检测,而甲醇柴油的密度、粘度、十六辛烷值等均没有检测,但是为下一步研究甲醇柴油的密度、粘度、十六辛烷值这几个指标奠定了基础。
[1] 徐文渊. 液化石油气(LPG)、压缩天然气(CNG)、液化天然气(LNG)作汽车燃料的现状和发展 [J]. 石油与天然气化工, 1995, 24(3):163-166.
XU W Y. The present situation and development of using LPG, CNG and LNG as motor fuels [J].Chem.Eng.OilGas, 1995, 24(3):163-166. (in Chinese)
[2] 何邦全,王建昕,阎小光. 柴油机含氧燃料的研究进展 [J]. 农业机械学报, 2003, 34(1):134-138.
HE B Q, WANG J X, YAN X G. Review of the progress in oxygenated fuels for diesel engines [J].Trans.Chin.Soc.Agric.Mach., 2003, 34(1):134-138. (in Chinese)
[3] 洪斌,汪洋,朱永生,等. 高压缩比甲醇发动机的试验研究 [J]. 汽车工程, 2014, 36(11):1351-1354.
HONG B, WANG Y, ZHU Y S,etal.. An experimental study on a high compression ratio methanol engine [J].Autom.Eng., 2014, 36(11):1351-1354. (in Chinese)
[4] 曹建喜,董松祥,商红岩,等. 甲醇柴油的研究进展 [J]. 现代化工, 2010, 30(6):41-45.
CAO J X, DONG S X, SHANG H Y,etal.. Advances in methanol-diesel [J].Mod.Chem.Ind., 2010, 30(6):41-45. (in Chinese)
[5] 金盼盼,张腾,杨晓平,等. 甲醇汽油的中红外法测定研究 [J]. 汽车科技, 2012(5):66-70.
JIN P P, ZHANG T, YANG X P,etal.. Mid-infrared analyzers for the determination of methanol fuels [J].Autom.Technol., 2012(5):66-70. (in Chinese)
[6] 覃旭松,戴连奎. 小波变换在Raman汽油辛烷值测定仪中的应用 [J]. 化工自动化及仪表, 2004, 31(5):65-68.
QIN X S, DAI L K. Application of wavelet transform in gasoline octane number analyzer using Raman spectroscopy [J].ControlInstrum.Chem.Ind., 2004, 31(5):65-68. (in Chinese)
[7] 古文英,史权,彭勃,等. 乙醇柴油的研究现状 [J]. 西安石油大学学报(自然科学版), 2004, 19(6):57-62.
GU W Y, SHI Q, PENG B,etal.. Present situation of the researches on ethanol diesel oil [J].J.Xi’anShiyouUniv. (Nat.Sci.Ed.), 2004, 19(6):57-62. (in Chinese)
[8] 周庆辉,纪威,王冬冬. 利用生物柴油制取甲醇柴油微乳液及其热力学分析 [J]. 拖拉机与农用运输车, 2007, 34(2):18-19.
ZHOU Q H, JI W, WANG D D. Preparation and thermodynamic analysis on forming microemulsification system of methanol and diesel using biodiesel [J].Tract.FarmTransp., 2007, 34(2):18-19. (in Chinese)
[9] 王智宏,刘杰,陈晓超,等. 光谱数据对油页岩含油率近红外光谱分析PLS建模精度的影响 [J]. 光谱学与光谱分析, 2012, 32(10):2770-2774.
WANG Z H, LIU J, CHEN X C,etal.. Effect of near infrared spectrum on the precision of PLS model for oil yield from oil shale [J].Spectrosc.Spect.Anal., 2012, 32(10):2770-2774. (in Chinese)
[10] 陈云坪,马伟,王秀,等. 基于PLS的土壤养分与小麦产量空间相关关系研究 [J]. 农业机械学报, 2012, 43(2):159-164.
CHEN Y P, MA W, WANG X,etal.. Relationship between soil nutrient and wheat yield based on PLS [J].Trans.Chin.Soci.Agric.Mach., 2012, 43(2):159-164. (in Chinese)
[11] 吕游,刘吉臻,杨婷婷,等. 基于PLS特征提取和LS-SVM结合的NOx排放特性建模 [J]. 仪器仪表学报, 2013, 34(11):2418-2424.
LV Y, LIU J Z, YANG T T,etal.. NOxemission characteristic modeling based on feature extraction using PLS and LS-SVM [J].Chin.J.Scient.Instrum., 2013, 34(11):2418-2424. (in Chinese)
[12] 吴静珠,徐云. 基于CARS-PLS的食用油脂肪酸近红外定量分析模型优化 [J]. 农业机械学报, 2011, 42(10):162-166.
WU J Z, XU Y. NIR quantitative model optimization of fatty acid in edible oil based on CARS-PLS [J].Trans.Chin.Soc.Agric.Mach., 2011, 42(10):162-166. (in Chinese)
[13] 吴静珠,石瑞杰,陈岩,等. 基于PLS-LDA和拉曼光谱快速定性识别食用植物油 [J]. 食品工业科技, 2014, 35(6):55-58.
WU J Z, SHI R J, CHEN Y,etal.. Rapid qualitative identification method of edible vegetable oil based on PLS-LDA and Raman [J].Sci.Technol.FoodInd., 2014, 35(6):55-58. (in Chinese)
[14] 淡图南,戴连奎. 基于PLS投影分析的光谱波段选择方法 [J]. 光谱学与光谱分析, 2009, 29(2):351-354.
DAN T N, DAI L K. Spectral wavelength selection based on PLS projection analysis [J].Spectrosc.Spect.Anal., 2009, 29(2):351-354. (in Chinese)
[15] 刘燕德,周延睿. 基于GA-LSSVM的苹果糖度近红外光谱检测 [J]. 西北农林科技大学学报(自然科学版), 2013, 41(7):229-234.
LIU Y D, ZHOU Y R. GA-LSSVM based near infrared spectroscopy detection of apple sugar content [J].J.NorthwestA&F(Nat.Sci.Ed.), 2013, 41(7):229-234. (in Chinese)
[16] 彭秀辉,黄常毅,刘飞,等. LSSVM模型下的近红外光谱联合区间波长筛选方法 [J]. 光谱学与光谱分析, 2014, 34(3):668-672.
PENG X H, HUANG C Y, LIU F,etal.. Near infrared spectroscopy synergy interval wavelength selection method using the LSSVM model [J].Spectrosc.Spect.Anal., 2014, 34(3):668-672. (in Chinese)
[17] 伍铁斌,朱红求,孙备,等. PLS-LSSVM模型在锌净化中的应用 [J]. 计算机工程, 2012, 38(10):212-214.
WU T B, ZHU H Q, SUN B,etal.. Application of PLS-LSSVM model in zinc purification [J].Comp.Eng., 2012, 38(10):212-214. (in Chinese)
欧阳爱国(1968-),男,江西南昌人,教授,1990年于江西农业大学获得学士学位,主要从事车辆性能检测方面的研究。
E-mail: ouyangaiguo1968711@163.com
Methanol Content Determination in Methanol Diesel with Mid Infrared Spectroscopy Analysis Using Least Square Support Vector Machine
OUYANG Ai-guo*, TANG Tian-yi, ZHOU Xin, LIU Yan-de
(InstituteofOptics-Mechanics-ElectronicsTechnologyandApplication,EastChinaJiaotongUniversity,Nanchang330013,China)
*CorrespondingAuthor,E-mail:ouyangaiguo1968711@163.com
The mid-infrared spectroscopy was used to detect the content of methanol in the methanol diesel. Firstly, the collected original spectra were pre-processed by the standard normal transformation(SNV), multiple scatter correction (MSC), first derivative, second derivative and Savitzky-Goly smoothing methods. The quantitative model of methanol was established by partial least square method and least square support vector machine (SVM). The influence of different pre-processing methods on the model prediction capability was also investigated. The results show that LSSVM modeling is the optimal forecasting model with the prediction set correlation coefficientR2of 0.981 8 and the prediction mean square error (RMSEP) of 1.3917%(volume ratio). So, the mid infrared spectrum technology can be used for the rapid detection of methanol in the methanol diesel and achieve very good results.
MIRS; methanol diesel; PLS; LSSVM
1000-7032(2016)10-1253-06
2016-04-08;
2016-05-22
南方山地果园智能化管理技术与装备协同创新中心(赣教高字[2014]60号)资助项目
O657.33; TE626.9
A
10.3788/fgxb20163710.1253