斜率截距校正算法在食用油酸值和过氧化值上的近红外光谱模型转移的研究
2018-03-10李天瑞刘翠玲位丽娜吴静珠孙晓荣
李天瑞 刘翠玲 位丽娜 吴静珠 孙晓荣
(北京工商大学计算机与信息工程学院;北京市食品安全与大数据重点实验室,北京 100048)
光谱仪器与化学计量学理论相结合形成的近红外光谱分析技术具有快速、高效、非破坏、样品无需预处理、无污染、无浪费等优点。近年来,该技术在食品领域有着广泛的应用[1-2],国内外学者也在食用油的酸值和过氧化值等指标上有着相应的研究[3-6]。然而在光谱测量的实际应用中,会遇到这种情况,即在一台仪器(称为主机)上建立的校正模型,但在另一台仪器(称为从机)上的结果却偏差较大甚至无法使用。一般将这类问题称为模型失效问题,解决这类问题一般采用模型转移方法。模型转移可以有效避免重复建模,实现样品和数据资源的共享,并且模型转移对近红外光谱技术应用的推广有着重要意义[7]。
近些年来人们一直在进行着模型转移相关的研究。Galvao R K H等[8]针对小光谱集提出了单变量校正和鲁棒性回归的模型转移方法;Pereira L S A[9]等研究了药品的粉末状混合物的模型转移;Ji W等[10]对水稻土中pH值,有机物,总氮含量进行了模型转移的研究。其中也不乏一些学者利用斜率截距校正算法(Slope/Bias Correction,SBC)在不同领域进行着模型转移研究。Leion H等[11]的研究显示,SBC算法可以应用到各种仪器上;Qin Y等[12]使用了SBC算法研究了烟草含糖量的模型转移;Li W[13]等利用SBC算法对中药的重要成分在两台仪器间的模型传递进行了研究并取得了良好的效果;Brito R S等[14]利用SBC算法减小了在线光谱仪之间水质检测的误差。然而关于食用油的酸值、过氧化值的近红外光谱模型在两台光谱仪间的转移研究较少,而针对食用油模型转移的研究不仅可以有效的推进近红外光谱在食用油的应用,还可以满足食用油品质快速检测的需要。所以本文利用斜率/截距校正算法(SBC)针对三组实验仪器的近红外光谱模型食用油的理化指标(酸值、过氧化值)结合偏最小二乘(Partial Least Squares PLS)建立的矫正模型进行了模型转移研究。
1 原理及算法
斜率/截距校正(Slope/Bias Correction)算法假设主仪器和从仪器上所测样本的预测值之间存在一定的一元线性关系,通过一元校正算法求得线性关系的斜率和截距,根据求得的斜率和截距可实现对待转移样品预测结果的修正,从而实现主、从仪器间的模型转移。
该方法的基本思想为:设Sm、Ss分别为主、从仪器上采集的样本光谱矩阵,b为主、从仪器上建立的校正模型的回归系数矩阵,则主从仪器上测得样本的预测浓度矩阵和光谱矩阵及系数矩阵存在如式(1)、式(2)所示的关系。
ym,i=Sm,i×b
(1)
ys,i=Ss,i×b
(2)
式中:ym,i和ys,i分别为主仪器和从仪器所测样本的预测浓度值。
假设ym,i和ys,i存在式(3)关系:
ym,i=S×ys,i+B
(3)
利用最小二乘法计算斜率(S)和截距(B),则用所建的模型对样本光谱Xs进行预测后,再利用式(4)对其进行校正,即可得到从仪器上所测样本校正后的预测浓度。
ys,carr=S×(Xs×b)+B
(4)
式中:Xs为从仪器上所测的待转换的光谱数据。
文中设计的SBC算法的模型转移流程如图1所示。
图1 SBC模型转移算法流程图
2 实验方案及光谱采集
2.1 实验仪器
本次实验是在北京工商大学光谱技术与品质检测研究室和中国农业大学光谱技术检测实验室完成,用到的光谱检测仪器为Bruker公司的傅里叶红外光谱仪VERTEX 70(简称V70)和Thermo Scientific公司的傅里叶近红外光谱仪Antaris Ⅱ(简称A Ⅱ)。
表1 光谱仪器及参数
表1(续)
2.2 实验样本光谱采集
本次实验包括3组实验,第一组以VERTEX 70红外光谱仪为主机,Antaris Ⅱ近红外光谱仪(利用光纤探头部件)为从机;第二组以VERTEX 70红外光谱仪为主机,Antaris Ⅱ近红外光谱仪(利用透射部件)为从机;第三组以Antaris Ⅱ近红外光谱仪(利用光纤探头部件)为主机,Antaris Ⅱ近红外光谱仪(利用光纤探头部件)为从机。两台仪器的具体参数设置:分辨率为16 cm-1;样本扫描次数为32次;背景扫描次数为32次;光谱的采集范围为12 000~4 000 cm-1;光阑设置:6 mm;扫描速度:10 kHz。
调查发现食用油的特征谱区分布在5 000~5 500波段[15],但为了避免光谱信息的丢失,本次实验利用的是5 000~9 000 cm-1的光谱数据,共520个波数点,两种仪器采集的4种食用油样本的近红外谱图如图2所示。
图2 4种食用油的3种近红外光谱
2.3 模型传递及效果评价
采用校正集样本在主仪器上建立偏最小二乘模型,利用SBC算法计算标准化样品分别在主从仪器上的测定光谱的传递参数,检验集样本检验模型传递效果。利用校正集决定系数(R2),校正均方根误差(RMSECV)和预测均方根误差(RMSEP)。以及标准偏差S和系统偏差B评价。
(5)
(6)
3 结果与分析
3.1 食用油酸值模型转移结果与分析
3.1.1 酸值无模型转移前建模结果
观察图2可以看出,两台仪器上采集的相同样本的3种光谱间存在明显的差别。利用主仪器采集的40个校正集样本数据,结合PLS算法建立校正模型,利用从仪器采集的无模型转移算法处理的10个验证集样本数据进行预测,3组实验结果分别如图3~图5所示,实验结果统计如表2所示。
结果表明,主仪器建立的校正模型较好,而从仪器预测结果很差。主仪器上建立的食用油酸值校正模型在从仪器上无法使用,说明了模型转移的必要性。
a 主仪器(V70)建立的酸值校正模型
b 从仪器(A Ⅱ光纤)预测结果图3 第一组实验主、从仪器酸值建模及预测结果
a 主仪器(V70)建立的酸值校正模型
b 从仪器(A Ⅱ透射)预测结果图4 第二组实验主、从仪器酸值建模及预测结果
a 主仪器(A Ⅱ光纤)建立的酸值校正模型
b 从仪器(A Ⅱ透射)预测结果图5 第三组实验主、从仪器酸值建模及预测结果
实验组R2RMSECVRMSEP主机:VERTEX700.989590.04751654.6756从机:AⅡ(光纤)主机:VERTEX700.949410.092980220.7131从机:AⅡ(透射)主机:AⅡ(光纤)0.977230.070274208.1585从机:AⅡ(透射)
3.1.2 SBC算法模型转移后酸值建模结果
利用主仪器采集的40个校正集样本数据,结合PLS方法建立的食用油的酸值校正模型,利用从仪器采集的经SBC算法处理后的,10个验证集样本数据进行预测,3组实验结果如图6~图8所示,实验结果统计如表3所示。
a 主仪器(V70)建立的酸值校正模型
b 从仪器(A Ⅱ光纤)预测结果
c 模型转移集预测酸值拟合结果
a 主仪器(V70)建立的酸值校正模型
b 从仪器(A Ⅱ透射)预测结果
c 模型转移集预测酸值拟合结果
a 主仪器(A Ⅱ 光纤)建立的酸值校正模型
b 从仪器(A Ⅱ透射)预测结果
实验组SBR2RMSECVRMSEP主机:VERTEX700.7076-2.96170.958610.0947470.44199从机:AⅡ(光纤探头)主机:VERTEX700.0135-2.80150.949410.0929800.71934从机:AⅡ(透射部件)主机:AⅡ(光纤探头)0.04039.10050.973460.0673420.95948从机:AⅡ(透射部件)
经SBC算法转移后,3组实验的预测结果有了一定的改善,预测标准偏差RMSEP分别为0.441 9、0.719 3、0.959 5。观察3组实验的S(slope)、B(bias)系数和主、从仪器训练集预测酸值拟合结果图,可以发现第一组实验线性相关性最好,第二组实验线性相关性最差,SBC算法对不同仪器间的模型转移效果不同。总体看来SBC算法对于主机为v70与从机为A Ⅱ(透射部件)效果有限。
3.2 食用油过氧化值模型转移结果与分析
3.2.1 过氧化值无模型转移前建模结果
利用主仪器采集的40个校正集样本数据,结合PLS算法建立校正模型,利用从仪器采集的未经SBC算法处理的,10个验证集样本数据进行预测,3组实验结果分别如图9~图11所示,实验结果统计如表4所示。
主仪器上建立的食用油过氧化值定量校正模型,在从仪器上由于预测标准偏差过大,在从仪器上无法使用。
a 主仪器(V70)建立的过氧化值校正模型
b 从仪器(A Ⅱ光纤)预测结果图9 第一组实验主、从仪器过氧化值建模及预测结果
a 主仪器(V70)建立的过氧化值校正模型
b 从仪器(A Ⅱ透射)预测结果图10 第二组实验主、从仪器过氧化值建模及预测结果
a 主仪器(A Ⅱ光纤)建立的过氧化值校正模型
b 从仪器(A Ⅱ透射)预测结果图11 第三组实验主、从仪器过氧化值建模及预测结果
实验组R2RMSECVRMSEP主机:VERTEX700.996020.447271912.2194从机:AⅡ(光纤)主机:VERTEX700.942041.716905397.2539从机:AⅡ(透射)主机:AⅡ(光纤)0.969371.241204303.0678从机:AⅡ(透射)
3.2.2 过氧化值模型转移后建模结果
利用主仪器采集的40个校正集样本数据,结合PLS方法建立的食用油的过氧化值校正模型,利用从仪器采集的经SBC算法处理后的,10个验证集样本数据进行预测,3组实验结果如图12~图14所示,实验结果统计如表5所示。
表5 SBC算法转移后建模结果
由实验结果可以看出,经SBC转移后,模型预测标准偏差RMSEP分别下降了到了6.752、6.205和4.589,实验证明了该算法在食用油过氧化值定量模型转移中的有效性。观察三组实验的S、B系数和主、从仪器训练集预测酸值拟合结果图,可以发现仍然是第一组实验线性相关性最好,第二组实验线性相关性最差。综合酸值和过氧化值模型转移后的结果,表明仪器光谱采集原理(同为光纤扫描)越相近,转移效果越好。然而从3组实验中的从仪器预测结果可以看出,预测结果与实际结果仍存在较大的差别,模型需要进一步优化,转移问题需要更深入的探索研究。
a 主仪器(V70)建立的过氧化值校正模型
b 从仪器(A Ⅱ光纤)预测结果
c 模型转移集预测过氧化值拟合结果
a 主仪器(V70)建立的过氧化值校正模型
b 从仪器(A Ⅱ透射)预测结果
c 模型转移集预测过氧化值拟合结果
a 主仪器(A Ⅱ 光纤)建立的过氧化值校正模型
b 从仪器(A Ⅱ透射)预测结果
c 模型转移集预测过氧化值拟合结果
4 结论
利用50个实验样本,首先将未经任何处理的主、从仪器上的食用油近红外光谱数据直接建模预测,结果直接说明了模型转移的必要性,然后用SBC算法分别对食用油理化指标(酸值、过氧化值)的3组实验仪器间的近红外光谱定量模型进行了模型转移研究。研究表明,经过SBC算法转移后,模型预测结果都有了不同程度的改善。并且SBC算法对食用油的酸值的转移效果好于过氧化值,相同原理的仪器有较好的线性度与较好的模型转移效果。但是,经SBC算法转移后的模型预测结果与理想结果仍存在很大的差距,食用油酸值和过氧化值的模型转移问题仍需要深入研究。
[1]QU J H,LIU D,CHENG J H,et al. Applications of near-infrared spectroscopy in food safety evaluation and control:a review of recent research advances.Critical Reviews in Food Science and Nutrition,2015,55(13):1939-1954
[2]KUMARAVELU C,GOPAL A Chennai,TAMIL Nadu,India:Institute of Electrical and Electronics Engineers Inc.,2015
[3]MOSSOBA M M,AZIZIAN H,TYBURCZY C,et al.Rapid FT-NIR analysis of edible oils for total SFA,MUFA,PUFA,and trans FA with comparison to GC[J].JAOCS,Journal of the American Oil Chemists’ Society.2013,90(6):757-770
[4]WOJCICKI K,KHMELINSKII I,SIKORSKI M,et al.Near and mid infrared spectroscopy and multivariate data analysis in studies of oxidation of edible oils[J].Food Chemistry.2015,187:416-423
[5]于修烛,张静亚,李清华,等.基于近红外光谱的食用油酸价和过氧化值自动化检测[J].农业机械学报,2012,09:150-154+159
YU X Z,ZHANG J Y,LI Q H,et al.Automatic Determination of Acid Value and Peroxide Valueof Edible Oils by Near-infrared Spectroscopy[J].Transactions of the Chinese Society for Agricultural Machinery,2012,43(09):150-154+159
[6]CAYUELA SANCHEZ J A,MOREDA W,GARCIA J M.Rapid determination of olive oil oxidative stability and its major quality parameters using vis/NIR transmittance spectroscopy[J].Journal of Agricultural and Food Chemistry.2013,61(34):8056-8062
[7]陆婉珍,褚小立.近五年我国近红外光谱分析技术研究与应用进展[J].光谱学与光谱分析,2014(10):2595-2605
LU W Z,ZHU X L.Research and application progress of near infrared spectroscopy analytical technology in China in the past five years[J].Spectroscopy and Spectral Analysis,2014(10):2595-2605
[8]GALVAO R K H,SOARES S F C,MARTINS M N,et al.Calibration transfer employing univariate correction and robust regression[J].AnalyticaChimicaActa.2015,864(1):1-8
[9]PEREIRA L S A,CARNEIRO M F,BOTELHO B G,etal.Calibration transfer from powder mixtures to intact tablets:A new use in pharmaceutical analysis for a known tool[J].Talanta.2016,147:351-357
[10]JI W,LI S,CHEN S,et al.Prediction of soil attributes using the Chinese soil spectral library and standardized spectra recorded at field conditions[J].Soil and Tillage Research.2016,155:492-500
[11]LEION H,FOLESTAD S,JOSEFSON M,et al.Evaluation of basic algorithms for transferring quantitative multivariate calibrations between scanning grating and FT NIR spectrometers[J].Journal of Pharmaceutical and Biomedical Analysis.2005,37(1):47-55
[12]QIN Y,GONG H.NIR models for predicting total sugar in tobacco for samples with different physical states[J].Infrared Physics and Technology.2016,77:239-243
[13]LI W,CHENG Z,WANG Y,et al.A study on the use of near-infrared spectroscopy for the rapid quantification of major compounds in Tanreqing injection[J].SpectrochimicaActa-Part A:Molecular and Biomolecular Spectroscopy.2013,101:1-7
[14]BRITO R S,PINHEIRO H M,FERREIRA F,et al.Calibration Transfer between a Bench Scanning and a Submersible Diode Array Spectrophotometer for in Situ Wastewater Quality Monitoring in Sewer Systems[J].Applied Spectroscopy.2016,70(3):443-454
[15]吴静珠,石瑞杰,陈岩,等.食用油油酸的近红外特征谱区优选[J].中国粮油学报,2015,2:118-121
WU J Z,SHI R J,CHEN Y,et al.Research on Selecting Characteristic NIR regions of oleic acid in edible oil[J].Journal of the Chinese Cereals and Oils Association,2015,30(2):118-121.