基于近红外光谱技术的茶油脂肪酸含量的快速检测
2016-12-19文韬郑立章龚中良李立君谢洁飞马强
文韬,郑立章,龚中良*,李立君,谢洁飞,马强
(中南林业科技大学 a.机电工程学院;b.理学院,湖南 长沙 410004)
基于近红外光谱技术的茶油脂肪酸含量的快速检测
文韬a,郑立章a,龚中良a*,李立君a,谢洁飞a,马强b
(中南林业科技大学 a.机电工程学院;b.理学院,湖南 长沙 410004)
为快速准确地测定茶油中脂肪酸含量,建立了应用近红外光谱技术检测茶油中脂肪酸含量的方法。选取市售的156份茶油样品,利用气相色谱仪测定其脂肪酸组成及含量,同时采用近红外光谱仪采集油样的光谱数据,并分析原始(R)光谱、SG平滑(SG)光谱和二阶导数变换(SD)光谱与茶油中脂肪酸含量的相关性,采用偏最小二乘回归法(PLSR)比较全光谱波段与显著性波段对建模精度的影响,优选出茶油中脂肪酸含量的定量检测模型。结果表明:茶油中棕榈酸、油酸和亚油酸含量较高,分别为4.428%~10.931%、78.036%~84.621%、7.013%~9.863%;采集的茶油近红外光谱曲线特征变化较为明显,光谱特征峰的位置分布于8 600~8 200、7 300~6 900、6 000~5 500、4 800~4 500和4 500~4 000 cm–1;茶油中棕榈酸含量与R、SG光谱吸光度呈正相关,油酸和亚油酸含量与R、SG光谱吸光度呈负相关,SD光谱数据与棕榈酸、油酸和亚油酸含量之间的相关系数与R和SG光谱吸光度比较,相关性极大被削弱;基于全波段建立的PLSR模型对棕榈酸、油酸和亚油酸含量的整体预测精度略高于显著性波段所建立的模型,校正集相关系数RC和预测集相关系数RP分别为0.837~0.956和0.818~0.938。从模型的复杂程度分析,采用显著性波段建模的输入变量的数量可压缩至全波段建模的25%以下;SG–PLSR模型对棕榈酸、油酸和亚油酸含量的综合预测性能最优,相应的RP和预测集均方根误差(RMSEP)分别为0.938、0.930、0.925和0.560、0.438、0.287。
茶油;棕榈酸;油酸;亚油酸;近红外光谱;偏最小二乘回归;检测
投稿网址:http://xb.ijournal.cn
油脂中脂肪酸成分及含量的检测,通常采用质谱(MS)、气相色谱(GC)以及高效液相色谱(HPLC)等结合化学计量方法来进行,油脂送检前,需对其添加化学溶剂或衍生化处理,不能满足对脂肪酸快速测定的需要[1–3]。近红外光谱检测技术(NIRS)具有无损、快速和非接触等特点,可利用它检测有机物在光谱区的振动信息,从而反演化学成分的含量[4]。运用近红外光谱对含油脂食材中脂肪酸组成和含量的检测取得了很大的进展[5–8],Lars等[9]应用NIR检测菜籽油脂肪酸含量,其游离脂肪酸的均方根误差范围为0.19%~1.7%;庄小丽等[10]利用近红外光谱技术结合判别分析对橄榄油的品质进行定性分析,其鉴别准确率为100%,并利用偏最小二乘法对橄榄油中掺杂成分进行了定量分析,其预测相对误差范围在–5.67%~5.61%;梁丹[11]应用近红外光谱结合PLS预测植物油脂肪酸含量,其油酸、亚油酸、亚麻酸的验证集相关系数分布范围为0.961~0.973;张辉等[12]对9种植物油相互配置得到多种油脂样品,并用NIR检测亚油酸和亚麻酸含量,其预测集相关系数分别为0.989、0.972。上述研究结果表明,近红外光谱检测植物油中油脂成分及含量具有一定可行性,但植物油在近红外光谱区实施检测,会受到测试环境和样品背景的影响,且上述研究方法并未对光谱数据建模效率进行讨论及优化。
笔者选取茶油为研究对象,利用气相色谱仪测定油茶主产区的156份油样的脂肪酸组成及含量,用近红外光谱仪采集油样的光谱数据,分别分析原始(R)光谱、SG平滑(SG)光谱和二阶导数变换(SD)光谱与茶油中主要脂肪酸含量的相关性,探寻全光谱波段与显著性波段建模的适应性,并优选最佳的脂肪酸含量光谱检测模型,以期为快速、无损测定茶油脂肪酸含量提供一种新方法。现将结果报道如下。
1 材料与方法
1.1 材料
选用市售156份茶油样本,主要来自于湖南、江西、安徽、浙江,其中,原油36份、成品油120份。成品油中国标一级60份、国标二级45份、医用级15份。
主要仪器包括GC1120气相色谱分析仪(江苏舜宇恒平仪器有限公司出品)和ANTARIS II傅里叶变换近红外光谱仪(美国Thermo公司出品)。
1.2 方法
1.2.1 茶油脂肪酸含量的测定
依据GB/T 17376—2008[13],对茶油样品进行甲酯化。取1 μL甲酯化茶油,用气相色谱仪检测其脂肪酸组成及含量。气相色谱条件为:DB–23毛细管柱(长60 m,内径0.250 mm,膜厚0.25 μm),火焰离子化检测器(FID),分流比20∶1,载气为氮气,采用程序升温(由100 ℃的初始温度,先以10 ℃/min升至160 ℃后保温5 min;又以5 ℃/min升温至230℃,保温10 min)。利用脂肪酸甲酯的标准混合溶液(常见的37种)中各组分出峰保留时间进行标定。样品中各脂肪酸含量(以质量分数计)依据直接面积归一化法计算。
式中:Xi为脂肪酸的质量分数(%);Ai为脂肪酸甲酯的响应峰面积;为各脂肪酸甲酯响应峰面积的总和。
1.2.2 茶油近红外光谱信息的采集
用ANTARIS II傅里叶变换近红外光谱仪测定茶油样本的近红外原始光谱(R)。光谱仪预热稳定1 h后,准确量取300 μL茶油样本,加样于光程0.2 mm的SiO2可拆卸液体池,设定光谱检测波数范围为10 000~4 000 cm–1,检测分辨率为4 cm–1,扫描方式为近红外透射光谱,以SiO2窗作空白对照,样本全光谱采集在避光的实验室内进行;每个茶油样本重复扫描3次,作算术平均后得到茶油样本实际的光谱吸光度。
1.2.3 模型的建立与评价
茶油样本按批次进行单独编号,采用Kennard–Stone(KS)算法[14]划分为校正集和预测集,其中,104个样本组成校正样本集,剩余52个样本作为预测样本集。采用偏最小二乘回归方法(PLSR)[15]建模。考虑到光谱信息采集过程中受到测试环境和样品背景的影响,建模过程分别将茶油的R、SG和FD光谱数据作为建模数据,选择留一法[16]作为交叉验证方法。
PLSR模型预测精度主要选取校正集相关系数(RC)、预测集相关系数(RP)、校正集均方根误差(RMSEC)以及预测集均方根误差(RMSEP)4个参数进行评价,其中RC和RP越大、RMSEC和RMSEP越小,表明模型性能越优,其预测能力越强。
2 结果与分析
2.1 茶油样本的脂肪酸含量
气相色谱检测结果表明,茶油样本中分离得到的脂肪酸甲酯共有23种,包含食用植物油中常见的脂肪酸,有3个脂肪酸甲酯保留峰峰形高大,对照脂肪酸标样图谱,分别为棕榈酸甲酯、油酸甲酯和亚油酸甲酯。直接面积归一化结果表明,茶油中棕榈酸、油酸和亚油酸含量较高,为脂肪酸的主要组成成分(表1)。
表1 茶油脂肪酸的组成及含量Table 1 Camellia oil fatty acid composition and content %
2.2 茶油样本的的近红外光谱特征
为了方便分析茶油样本的近红外光谱特征,从156个茶油样本光谱中提取脂肪酸含量最大值和最小值所对应的2条SG平滑光谱曲线(图1)。这2条曲线有以下特征:光谱曲线变化趋势基本一致, 呈波动性增加;在10 000~6 000 cm–1波段范围内,近红外光谱吸光度的波动趋于平缓,2条光谱曲线差异较大;在6 000~4 000 cm–1波段范围内的近红外光谱吸光度波动较为明显,2条曲线差别较小;茶油脂肪酸含量与近红外光谱吸光度呈正相关关系,随着脂肪酸含量的增加,茶油的近红外光谱吸光度增加;茶油的近红外光谱吸收峰的位置分布于8 600~8 200、7 300~6 900、6 000~5 500、4 800~4 500和4 500~4 000 cm–1。
为了更好地突出采集近红外光谱数据轮廓的变化,放大特征信息,对全波段近红外光谱进行了二阶导数(SD)变换处理,结果如图2所示。经过SD变换处理后,茶油样本原始光谱曲线吸收峰对应的特征吸收带更加突出,消除了基线漂移和平缓背景干扰,异质性因素对不同脂肪酸含量的茶油近红外光谱曲线的影响得到了抑制。
图1 茶油脂肪酸的近红外光谱SG平滑预处理曲线Fig.1 SG smoothing near infrared spectroscopy of fatty acid for camellia oils
图2 茶油脂肪酸的近红外光谱SD预处理曲线Fig.2 SD near infrared spectroscopy of fatty acid for camellia oils
2.3 茶油脂肪酸组分含量与近红外光谱吸光度的相关性
校正集样本中棕榈酸、油酸和亚油酸含量与R、SG和SD光谱吸光度之间的相关性分析如图3所示。由图3可知,3种脂肪酸含量与不同波段范围内近红外光谱吸光度之间的相关系数分布曲线具有明显差异,采集的光谱数据经过不同预处理变换对同一种脂肪酸含量的相关性计算结果影响显著。棕榈酸与R光谱呈正相关,油酸和亚油酸与R光谱呈负相关,相关系数曲线在10 000~6 000 cm–1波段范围内比较平滑,6 000~4 000 cm–1波段范围内波动明显(图3–a、图3–d、图3–g)。R光谱经SG平滑处理后,棕榈酸、油酸和亚油酸含量同SG光谱数据间的相关系数变化趋势与R光谱基本一致,原来分布在7 400~6 800、4 800~4 700、4 500~4 000 cm–1波段范围内的噪声被消除,更加突出特征信息的表征(图3–b、图3–e、图3–h)。SG平滑后的光谱数据再经SD变换,变换后的近红外光谱数据与棕榈酸、油酸和亚油酸含量之间的相关系数在显著性门限值间波动明显并且起伏较大,与R和SG的相关系数相比相关性极大削弱,将R和SG在近红外波段范围突显的特征信息淹没(图3–c、图3–f、图3–i)。
图 3 光谱吸光度的3种变换形式与茶油脂肪酸含量的相关系数Fig.3 Correlation coefficient between fatty acid contents and raw, transformed spectrum absorption for camellia oils
分别对R、SG和SD光谱吸光度与棕榈酸、油酸和亚油酸含量的相关系数进行显著性水平为0.01的t检验,检验结果通过图3的显著性门限划分可知,R和SG所对应的显著性波段基本一致,分布集中且较为连续,而SD所检验得出的显著性波段分布较为离散。选取棕榈酸、油酸和亚油酸分别作为因变量,以R、SG和SD光谱吸光度作为相关性分析的自变量,对应筛选获得的显著性波段数量如表2所示。
表2 相关性分析筛选的显著性波段数量Table 2 Numbers of significant wavelengths by correlation analysis
2.4 全波段和显著性波段的茶油脂肪酸含量的PLSR模型
分别选取全波段(10 000~4 000 cm–1)和R、SG、SD通过显著性水平为0.01的t检验波段作为PLSR建模的自变量,将棕榈酸、油酸和亚油酸含量作为因变量,采用交叉验证法来确定回归模型中最佳因子数,以校正集样本构建PLSR模型,并利用预测集样本检验模型的优劣,相应的模型预测结果如表3所示。
由表3可知,选取全波段建模,采用R–PLSR、SG–PLSR、SD–PLSR模型预测茶油中棕榈酸、油酸和亚油酸含量RC和RP分布范围分别为0.853~0.956、0.837~0.948、0.890~0.936和0.847~0.938、0.818~0.930、0.865~0.925,对应的RMSEC和RMSEP分布范围分别为0.830~0.502、0.624~0.383、0.364~0.260和0.862~0.560、0.677~0.438、0.408~0.287;选取显著性波段建模,上述3种模型预测茶油中棕榈酸、油酸和亚油酸含量RC和RP分布范围分别为0.699~0.942、0.656~0.935、0.724~ 0.928和0.687~0.923、0.632~0.919、0.713~0.910,对应的RMSEC和RMSEP分布范围分别为1.149~0.548、1.211~0.421、0.693~0.279和1.173~ 0.592、1.278~0.474、0.718~0.325。由此可见,采用显著性波段建立模型的实测值与预测值的相关系数R均略小于全波段建模,且RMSEC和RMSEP均大于全波段建模,说明显著性波段建立模型的预测能力比全波段差,但从模型的复杂程度分析,显著性波段极大地压缩了模型输入变量个数,应用R–PLSR、SG–PLSR、SD–PLSR模型预测棕榈酸、油酸和亚油酸含量时,其模型的输入变量数压缩为全波段的1%~25%,节省了运算时间。
表3 全波段与显著性波段建立的PLSR模型的评价参数Table 3 Evaluation parameters of the PLSR models built by the full wavelengths and the significant wavelengths
3种变换形式的近红外光谱数据应用于全波段进行模型预测,SG–PLSR模型对茶油中棕榈酸、油酸和亚油酸含量的预测性能最优,相应的RP和RMSEP分别为0.938、0.930、0.925和0.560、0.438、0.287,这进一步说明SG平滑能够较好消除测试环境和样品背景对近红外光谱检测的影响,保留光谱特征信息。对比SD–PLSR模型应用于全波段的预测结果,发现SD–PLSR模型预测茶油中脂肪酸含量不理想,对于上述3种脂肪酸含量预测的RP和RMSEP分别为0.847、0.818、0.865和0.862、0.677、0.408,说明SD变换淹没了光谱中部分有用信息,削弱了近红外光谱对脂肪酸的敏感性。
3 结论
研究结果表明,茶油近红外光谱曲线变化趋势基本一致,呈波动性增加,光谱吸收峰的位置分布于8 600~8 200、7 300~6 900、6 000~5 500、4 800~4 500、4 500~4 000 cm–1,茶油脂肪酸含量与近红外光谱吸光度呈正相关关系。
试验选取的156份茶油样本,通过气相色谱仪分离出棕榈酸、油酸和亚油酸为茶油中主要的脂肪酸成分,峰面积归一化测定的脂肪酸含量分布范围分别为4.428%~10.931%、78.036%~84.621%、7.013%~9.863%。茶油中的棕榈酸、油酸和亚油酸含量与R、SG和SD光谱吸光度之间的相关系数分布曲线具有明显差异。棕榈酸含量与R光谱吸光度呈正相关,油酸和亚油酸含量与R光谱吸光度呈负相关,相关系数曲线在10 000~6 000 cm–1波段范围内比较平滑,6 000~4 000 cm–1波段范围内波动较明显。R光谱经SG平滑处理后,棕榈酸、油酸和亚油酸含量同SG光谱数据间的相关系数变化趋势与R光谱基本一致,原来分布在7 400~6 800、4 800~4 700和4 500~4 000 cm–1波段范围内的噪声被消除;SD变换后的光谱数据与棕榈酸、油酸和亚油酸含量之间的相关系数在显著性门限值间波动明显并且起伏较大,与R和SG的相关系数相比相关性极大被削弱。
选取全波段光谱对茶油中脂肪酸含量的整体预测精度要略高于显著性波段,相应的RC和RP分布范围分别为0.837~0.956和0.818~0.938,但从模型的复杂程度分析,采用显著性波段建模的输入变量数量可压缩至全波段建模的25%以下,节省了运算时间。3种变换形式的近红外光谱数据应用在全波段进行模型预测,SG–PLSR模型对棕榈酸、油酸和亚油酸含量的综合预测性能最优,相应的RP和RMSEP分别为0.938、0.930、0.925和0.560、0.438、0.287,能够较好的预测茶油中脂肪酸含量,因此,应用近红外光谱技术结合SG–PLSR对茶油的脂肪酸含量进行定量预测具有可行性,可为快速无损检测茶油的脂肪酸含量提供参考依据。
[1] 高宏,徐慧,贾涛,等.气相色谱法测定氢化油脂加工食品中反式脂肪酸含量[J].食品安全质量检测学报,2015,6(1):321–327.
[2] 赵玉生,陈翔,王瑛瑶,等.超高效液相色谱法测定油脂中脂肪酸的组成与分布[J].中国油脂,2009,34(5):64–68.
[3] 林春花,严楠,许招会,等.超高效合相色谱–质谱法快速检测植物油脂中5种脂肪酸含量[J].分析测试学报,2014,33(11):1322–1326.
[4] 林涛,于海燕,应义斌.可见/近红外光谱技术在液态食品检测中的应用研究进展[J].光谱学与光谱分析,2008,28(2):285–290.
[5] Pazdernik P D,Killam A S,Orf J H.Analysis of amino and fatty acid composition in soybean seed,using near-infrared reflectance spectroscopy[J].Agron,1997,89:679–685.
[6] Velasco L,Mollers C.Nondestructive assessment of protein content in single seed rapeseed(Brassica napus L.) by near-infrared reflectance spectroscopy[J].Euphytica,2002,123(1):89–93.
[7] Li G, Kang J, Yao X, et al. The component of green tea, L–theanine protects human hepatic L02 cells from hydrogen peroxide–induced apoptosis [J]. European Food Research & Technology, 2011, 233: 427–435. DOI:10. 1007/s00217–011–1534–5.
[8] 文韬,洪添胜,李立君,等.基于高光谱技术的霉变稻谷脂肪酸含量无损检测[J].农业工程学报,2015,31(18):233–239.
[9] Lars P H,Dorthe K,Helle R.Determination of SFC,FFA,and equivalent reaction time for enzymatically interestified oils using NIRS[J].Talanta,2007,71:868–873.
[10] 庄小丽,相玉红,强洪,等.近红外光谱和化学计量学方法用于橄榄油品质分析与掺杂量检测[J].光谱学与光谱分析,2010,30(4):933–936.
[11] 梁丹.应用近红外光谱分析技术定量检测植物油脂肪酸含量的研究[J].安徽农业科学,2012,30(40):14933–14936.
[12] 张辉,吴迪,李想,等.近红外光谱快速检测食用油必需脂肪酸[J].农业工程学报,2012,28(7):266–270.
[13] GB/T 17376—2008 动植物油脂脂肪酸甲酯制备[S].
[14] 潘国锋.基于K–S算法的水质硝酸盐含量光谱检测方法研究[J].光谱实验室,2011,28(5):2700–2704.
[15] 于雷,洪永胜,耿雷,等.基于偏最小二乘回归的土壤有机质含量高光谱估算[J].农业工程学报,2015,31(14):103–109.
[16] 王昶,黄驰超,余光辉,等.近红外光谱结合偏最小二乘法快速评估土壤质量[J].土壤学报,2013,50(5):881–890.
责任编辑:罗慧敏
英文编辑:吴志立
Rapid determination of fatty acid content in camellia oil based on near infrared spectroscopy technology
Wen Taoa, Zheng Lizhanga, Gong Zhonglianga*, Li Lijuna, Xie Jiefeia, Ma Qiangb
(a. College of Mechanical and Electrical Engineering; b.College of Sciences, Central South University of Forestry and Technology, Changsha 410004, China)
To determine fatty acid content in camellia oil non-destructively and precisely, the method was proposed to determinfatty acid content in camellia oil by near infrared spectroscopy technology. 156 kinds of commercial camellia oil were used as the samples camellia oil fatty acid composition and content was got by using the gas chromatograph, and the near infrared spectrum information collected by using the spectrometer. The correlation between the original spectrum, SG smooth spectral, two derivative transform spectrum and the fatty acid content in camellia oil was respectively analyzed. The optimizing quantitative model was obtained to determine the fatty acid content in camellia oil through the comparison between the full wavelengths and the significant wavelengths using partial least squares regression methods. . The results indicated that main fatty acids of camellia oil were palmitic acid, oleic acid and linoleic acid, which ranged from 4.428% to 10.931%, from 78.036% to 84.621%, from 7.013% to 9.863%, respectively. The spectrum scanning test for camellia oil samples showed that the characteristic variation of spectrum among camellia oil samples was located in 8 600–8 200, 7 300–6 900, 6 000–5 500, 4 800–4 500 and 4 500–4 000 cm–1, respectively. A positive correlation betweenthe content of palmitic acid in camellia oil and the absorbance of R, SG spectrum was observed, and there was a negative correlation between the content of oleic acid and linoleic acid in camellia oil and the absorbance of R, SG spectrum. However, there was a relatively weak correlation between the content of palmitic acid, oleic acid and linoleic acid in camellia oil and the absorbance of SD spectrum compared with R, SG spectrum. The accuracy of PLSR model for the content of palmitic acid, oleic acid and linoleic acid in camellia oil built by the full wavelengths was slightly higher than by the significant wavelengths, whose related RCfrom 0.837 to 0.956 and RPfrom 0.818 to 0.938, respectively. For the complexity of two models, input variables to the models built by the significant wavelengths were decreased to below 25% compared to that by the full wavelengths. The performance of SG–PLSR model by the full wavelengths was best to test the content of palmitic acid, oleic acid and linoleic acid in camellia oil, whose related RPand RMSEP were 0.938, 0.930, 0.925 and 0.560, 0.438, 0.287, respectively.
camellia oil; palmitic acid; oleic acid; linoleic acid; near infrared spectroscopy; partial least squares regression; determination
O433.1
A
1007-1032(2016)06-0676-06
2016–04–04
2016–09–10
国家自然科学基金项目(31401281);湖南省自然科学基金项目(14JJ3115);湖南省高校科技创新团队支持计划(2014207);湖南省科技计划重点研发项目(2016NK2151)
文韬(1983—),男,湖南长沙人,博士,副教授,主要从事农业工程、机电一体化和信息技术应用研究,wt207@sina.com;*通信作者,龚中良,博士,教授,主要从事机电一体化技术及应用研究,gzlaa@163.com