近红外光谱技术测定油料种子脂肪酸的研究进展
2020-02-26崔虎亮张亚楠袁星雨
崔虎亮 张亚楠 贺 霞 袁星雨
(1 山西农业大学园艺学院/山西省功能农业提质增效协同创新中心,太谷 030801;2 中国科学院植物研究所/北方资源植物重点实验室,北京 100093)
我国是食用油大国,食用油消费逐年增长,而油料消费增速远远高于供给增速,自2008 年以来我国植物油自给率逐年下降[1],油料已成为我国对国际市场依存度最高的大宗农产品。与此同时,随着人们生活水平的不断提高,消费者对食用油品质的追求也不断提高。因此,提升油料生产效益,加快培育新优种质,增强油料供应自给能力对于维护国家粮油安全具有重要意义[2]。
近红外光谱技术(NIRS,near infrared spectroscopy)是20 世纪80 年代后期迅速发展起来的一种物理测试技术。它利用有机化学物质在近红外光谱区域的光学特性,快速估测样品中的一种或多种化学成分的含量,具有成本低、分析速度快、样品无需前处理及不使用有害化学药品等优点[3],因此在测定有机物质化学成分方面受到青睐。早在20 世纪70 年代,Norris 等[4]就使用NIRS 技术进行农产品的检测,此后,随着NIRS 技术的不断成熟,开始广泛应用于粮食作物[5]、果蔬[6]、肉类乳制品[7]等农产品检测,药物药材鉴别[8],林木[9]及石油化工产品检测[10]等领域,在油料作物上也发挥着重要作用。
1 近红外光谱技术(NIRS)原理
1.1 NIRS 技术特点近红外光谱是介于可见光和中红外光之间的电磁波,波长范围780~2526nm(3959~12820cm-1),主要是由于分子振动的非谐振性使分子振动从基态向高能级态跃迁时产生的,该光谱区域主要记录含氢基团(CH、OH 和NH)振动的倍频和合频吸收[3]。但是,有机物质在近红外区域的吸收信号弱、谱带重叠严重,解析难度大,因此长期以来近红外光谱无法得到应用。20 世纪80 年代后,随着计算机技术和化学计量学的发展,光谱信息的提取和背景噪音的解析等问题得到有效改善,人们重新认识了近红外光谱的价值。
总体来看,近红外光谱技术具有如下优点。第一,分析速度快、效率高,一次测量可同时对样品多个组分进行测定;第二,适用范围广,可测量液体、固体和胶状体等不同状态的物质,且样品不需要预处理,可直接测量;第三,对样品无损害,可以实现活体测量,样品测量后亦可用于其他分析;第四,不使用化学药剂,不对环境产生污染和危害。
当然,该技术也有一定的局限性。首先,由于有机物质通常在近红外区域吸收弱,一般要求被测组分的含量应大于4%,否则检测结果不准确;其次,建模工作有一定难度,需要采集大量的有代表性的样品;再次,由于样品本身的特性和光谱采集的差异,一种模型通常仅适用一定的范围和年限,需要不断地维护。
1.2 NIRS 定性定量分析方法应用利用近红外光谱结合化学计量学方法进行农产品产地判别和真伪鉴别[11],是NIRS 定性分析的主要应用领域。如刘翠玲等[12]利用近红外光谱技术结合聚类分析,对30 种食用油的近红外光谱进行鉴别,建立了芝麻油-大豆油-花生油-玉米油的定性识别模型,识别率和预测率达到100%。杨佳等[13]采用傅里叶变换近红外光谱(FT-NIRS)结合化学计量学建立了芝麻油、大豆油、花生油和葵花籽油的分类模型,可准确预测芝麻油中10%~100%掺假油,其预测值与实际值的相对标准偏差(SEP)分别为1.027(大豆油)和0.9660(葵花籽油)。Jiménez-Carvelo 等[14]利用NIRS 和荧光光谱进行橄榄油产地和真伪鉴别,供试的60 份橄榄油样品中,2 种光谱均能够鉴定出掺杂菜籽油的橄榄油样品,但NIRS 能够100%鉴别出供试样品的产地,而荧光光谱尚不能做到。Sinelli等[15]对112 组初榨橄榄油进行产地溯源研究,发现线性判别分析和模式识别分类法对初榨橄榄油产地的判别正确率分别为71.6%和100%。
NIRS 定量分析的主要难点是建模工作(图1),而选择样品是建模工作的前提,因为样品的代表性直接影响到所建模型的准确度和适用性。通常情况下,应当广泛采集样品,尽量包涵不同地区、不同气候类型、不同品种或种质类型,必要时还应包涵不同年份的样品材料。然后,将样品按照一定比例(通常为2∶1)分为定标集和验证集,定标集用于模型建立,验证集用于评价模型预测准确度。常用评价参数有相关系数、均方根误差(RMSEP,the root mean square error of predication)和范围误差比(RPD,the ratio of performance to deviation)。前人研究指出[16-17],定量模型相关系数越高、RMSEP 值越低,则表明模型预测准确度较高,此外,RPD≥2.5 则表明该模型准确性较高,可用于植物品种育种的筛选工作;若RPD≥5 则表明该模型精确度较高,可用于质量控制。常用建模方法主要有多元线性回归法(MLR,multiple linear regression)、主成分分析法(PCA,principal component analysis)、偏最小二乘法(PLS,partial least square)、人工神经网络法(ANN,artificial neural network)等[18]。
2 NIRS 在油料种子脂肪酸检测中的应用
2.1 NIRS 在大宗油料种子中的应用NIRS 在油料作物中的应用极为广泛,并且已经成为大宗油料作物育种世代材料品质检测和性状筛选的重要工具。
油菜是世界主要油料作物之一,20 世纪90 年代开始国内外就有大量关于油菜NIRS 应用的报道。Velasco 等[16]利用NIRS 进行油菜种子鲜重、含油量和脂肪酸含量模型构建,其中油酸(r=0.92)和芥酸(r=0.94)相关系数较高,亚油酸(r=0.75)和亚麻酸(r=0.73)的相关系数较低,种子鲜重和含油量的相关系数均达到0.92。Hom 等[19]则构建了油菜种子小样品量NIRS 检测模型,用于光谱扫描的样品仅3~4g,能够预测出油脂、蛋白和硫代葡萄糖苷的含量(r=0.82~1.00),同时该研究建立的单粒检测模型可用于检测烯酸、吲哚酸和硫代葡萄糖含量(r=0.83~0.86)。Niewitetzki 等[20]利用自动进样设备(图2)进行高通量油菜单粒种子NIRS 建模工作,该设备可扫描800 粒/h 种子,通过改良偏最小二乘回归法(MPLS,modified partial least square regression)进行定标集和验证集的校正,结果表明油酸标准偏差(SD)在2.7%~3.7%之间,亚麻酸的SD在1.2%~1.8%之间,从而证明NIRS 用于油菜单粒种子检测的可行性。油菜小样品量和单粒种子NIRS 模型的应用,实现了油菜种子单粒筛选,大大推动了油菜高效育种和精准育种工作。
大豆作为世界范围内的大宗油料作物,NIRS技术应用也达到了小样品量和单粒检测水平。Armstrong 等[21]发现NIRS 在预测大豆蛋白和油脂方面具有较高的准确性,而构建的单粒模型亦可用于杂交后代种子遗传背景筛选。Ferreira 等[22]利用播种于巴西隆德里纳和蓬塔格洛萨2 个地区的20份大豆品种进行NIRS 研究,发现所建模型在预测种子含水量、灰分、蛋白和油脂含量等方面具有较好的适用性(R2=0.72~0.88)。Han 等[23]选择600 粒大豆高油酸杂交F2种子进行NIRS 扫描,并准确建立了油酸含量预测模型,相关系数r2=0.99,该模型可用于大豆高油酸品质育种种质筛选。
向日葵是重要的油用作物,栽培分布十分广泛。Leonardo 等[24]收集向日葵高硬脂酸突变体材料CAS-14 的种子,利用2510 粒去皮种子进行NIRS 建模,采用交叉验证评估建模效果,发现硬脂酸(R2=0.80,SD=0.45)、油酸(R2=0.89,SD=0.34)、亚油酸(R2=0.91,SD=0.30)建模准确度较高,这一研究使得向日葵种子油脂实现了无损单粒检测。Sato等[25]同样发现NIRS 的准确性较高,其中利用去皮种仁建立的NIRS 模型相关系数达到0.993,而利用提取出来的葵花籽油建立的NIRS 模型相关系数达到0.989。
花生是出油率极高的油料作物,我国也是世界上最大的花生油消费国。Sundaram 等[26]利用维吉尼亚和瓦伦西亚2 种花生种质进行NIRS 建模研究,发现维吉尼亚花生种质所建模型RPD>5,可用于该类花生质量控制和成分检测;而瓦伦西亚种质所建模型RPD>3.01,可用于初筛。酸价是花生油质量评价的重要指标,Rao 等[27]利用NIRS 对67 份花生油样品进行酸价模型构建,发现使用判别最小二乘法(DPLS,discriminant partial least squares)能够准确判别样品酸价,准确率达到96.55%。
亚麻分纤维用亚麻、油用亚麻和油纤兼用亚麻3 种类型,其中油用亚麻又称胡麻,在中国有1000多年的栽培历史。东野广智等[28]利用26 个亚麻油样品进行NIRS 检测,将亚麻油各组分模块化后采用PLS 方法进行定量分析,实现了亚麻油的快速无损检测。Ribeiro 等[29]利用NIRS 和中红外(MIR)光谱分析黄色和棕色亚麻种子中亚油酸和亚麻酸含量,发现NIRS 可以较好地预测完整籽粒的亚油酸(R2=0.90,SEP=1.61)和亚麻酸(R2=0.86,SEP=0.63),而NIRS 和MIR 均可用于种子粉末的检测。
可以说,经过30 多年的努力,NIRS 基本实现了对大宗油料种子含油量和主要脂肪酸含量的无损、快速和准确检测,并且单粒种子检测模型和高通量检测模型的应用使得油料种子检测更加精细和高效,克服了油料作物早期育种留种问题和材料较少等缺陷。
2.2 NIRS 在特种油料种子中的应用现状相比大宗油料作物,其他特种油料作物NIRS 的应用水平尚待进一步提高。蓖麻(Ricinus communis)是热带地区常见的油料作物,其种子含油量高达42%~58%,Fernández-Cuesta 等[30]收集高蓖麻酸和高油酸种质872 份,发现在1400~1914nm 区域可检测蓖麻酸含量;张良波等[31]收集46 份蓖麻籽样品,测定其近红外光谱值,并用索氏提取法测定了含油率,然后将二者拟合建立了定标模型,相关性为0.9655,可实现蓖麻籽含油率的快速无损检测。水黄皮(Pongamia pinnata)广泛分布于东南亚等热带地区,其种子油脂用途广泛,Khamchum等[32]选择60 份种子样品建立含油量和脂肪酸含量的NIRS 模型,最终利用粉碎种子样品建立的含油量模型准确度较高(R2=0.9),可用于未知样品检测。麻风树(Jatropha curcas)是重要的能源植物,其种子含油量较高,Montes 等[17]收集740 份种子样品进行NIRS 研究,发现硬脂酸、油酸、亚油酸和亚麻酸预测模型准确度较高,而花生酸和棕榈酸预测模型尚不准确。红花(Carthamus tinctorius)主要分布于干旱半干旱地区,其种子富含亚油酸和生育酚,可供食用和药用,Rudolphi 等[33]收集完整籽粒和籽粕样品108~534 份用于NIRS 建模,结果表明籽粕样品模型准确度高于完整籽粒,而完整籽粒模型中,含油量准确度较高,相关系数R2=0.91,亚油酸和油酸准确度较低,相关系数R2分别为0.73 和0.68。
油茶(Camellia oleifera)是我国南方一带较为常见的木本油料作物,富含维生素、磷脂和多种单不饱和脂肪酸。原娇娇等[34]以索氏提取法分析的30份油茶籽的含油量为化学值,利用傅里叶变换近红外光谱仪测定相应的光谱,最终得到的预测模型相关系数(r)为0.8978。奚如春等[35]对150 份不同产地的油茶种子样品进行含油量的NIRS 建模,发现粉碎样品准确度最高,相关系数R2达到0.98,而无损样品的相关系数R2仅0.88。同样地,孙佩光[36]通过测定132 份广宁红花油茶茶籽含油率进行近红外光谱预测模型的分析,发现粉碎种仁样品的建模参数较高,外部验证表明近红外预测值与化学测定值的相关系数为0.98,标准误差0.33,该模型可用于广宁红花油茶种子的含油量预测。
棉花籽油富含多种维他命、甾醇和脂肪酸,可供食用且具有明显的抗氧化和延缓衰老的作用。Quampah 等[37]以444 份棉籽粉碎样品为材料建立NIRS 模型,其中含油量(RPD=11.495)和亚油酸(RPD=5.026)含量建模预测结果准确,但软脂酸、硬脂酸、油酸、亚麻酸不太理想(RPD<1.5);黄庄荣等[38]以385 份棉花种子为材料探讨NIRS 棉籽脂肪酸含量检测效果,结果表明硬脂酸、油酸和亚油酸的相关系数分别为0.881、0.843 和0.806,同时发现基于蒙特卡罗无信息变量消除法(MC-UVE)的非线性最小二乘支持向量机(LS-SVM)建模方法可提高精度。
油用牡丹是我国新型木本油料作物,其种子油脂富含α-亚麻酸、油酸、亚油酸等多不饱和脂肪酸,具有抗肿瘤、抗衰老、调节免疫等功能,近几年推广种植较为广泛[39]。Cui 等[40]利用FT-NIR 对收集的115 份牡丹种子材料进行建模,同时利用声光可调滤光型近红外光谱(AOTF-NIR)对447 粒牡丹种子进行单粒建模,种子材料的前处理包括完整籽粒、去皮种仁和种子粉末等,结果表明去皮种仁的模型效果最好,可定量检测亚麻酸、油酸和亚油酸的含量(RPD>2.5),而单粒种子模型仅可用于亚麻酸的定量分析。
3 特种油料种子NIRS 建模的主要因素
3.1 种子理化特性对NIRS 的影响油料种子的外部形态会直接影响到NIRS 的检测效果。大宗油料作物的种子通常体积较小,或形状可看作近似的几何体,种子体积小且形状规则,利于NIRS 漫反射光谱的采集,反之,则NIRS 光谱数据易产生误差。如油菜种子千粒重1.4~5.7g,大豆种子千粒重110~250g,花生种子千粒重290~500g,胡麻种子千粒重2~13g[41]。朱大洲等[42]认为,在利用近红外漫反射光谱扫描大豆单粒种子时,光谱的准确获取是关键,其中表面光滑的种子光谱重复性好,而表面存在缺陷的种子光谱数据存在明显差异,不具有代表性。特种油料种子的外部形态直接影响近红外光谱的采集,油茶种子体积较大,单果重量可达到22.6~681.6g,这对NIRS 光谱采集会产生影响,孙佩光[36]采用风干的整粒种子、风干后去壳种仁和风干后种仁粉碎粉末分别进行NIRS 建模,结果表明粉碎粉末的模型准确度最高,整粒种子的准确性最低;牡丹种子外形不规则,百粒重达到36.5~41.7g,且种仁外有黑色种皮,导致牡丹去皮籽粒和完整籽粒的NIRS 光谱吸收强度存在显著差异[40],崔虎亮[39]采用完整籽粒、去皮籽粒和粉碎样品进行油用牡丹NIRS 建模,发现去皮籽粒模型效果最好,而粉碎样品最差。可见,特种油料种子体积和外观均有其特殊性,需对种子样品进行预处理才能用于光谱扫描。根据油料种子质地,选择恰当的样品预处理方法可以获得较为准确的化学值。蓖麻种子含油量较高,且粘度较大,直接用研钵研磨易损失种子粉末及油脂,导致含油量结果测定偏低,张良波等[31]采用滤纸研磨,获得较为准确的蓖麻籽含油量数据,从而建立了蓖麻籽含油量的NIRS 检测模型。
3.2 NIRS 建模中光谱数据预处理的重要性不同有机物质的化学结构官能团在不同的近红外光谱区域存在特征吸收峰。Sato 等[43]证明,1600~1800nm(波数6250~5555.6cm-1)的近红外反射光谱波长区域与脂肪酸的碳链长度和顺式不饱和脂肪酸的吸收带有关,此后多位学者先后证明了油酸和亚油酸与该波段的光谱参数的极显著相关性[44],如5801.0cm-1和5831.9cm-1波数附近为亚油酸和油酸的最佳建模光谱区段,亚麻酸的最佳建模区段为5603.1~5954.1cm-1[40]。
选择最佳光谱预处理方法和谱区范围对提高油料种子NIRS 建模准确性十分必要。常用的光谱预处理方法包括多元散射矫正(MSC),标准正则变换(SNV),标准化处理法(Normalization),1 阶求导(1stderivative),2 阶求导(2ndderivative)等,以及各种预处理方法的组合[3],同时,使用Savitzky-Golay对光谱数据进行平滑处理,可进一步提高光谱的精细度[32]。孙佩光[36]在构建油茶NIRS 模型中,通过对比不同光谱预处理及其组合构建的模型参数,最终筛选出了MSC+2 阶求导的预处理方法构建的模型最优;油用牡丹去皮种仁亚麻酸的光谱预处理最优方法是MSC,亚油酸是MSC+1 阶导数,油酸是SNV+1 阶导数,而软脂酸则是SNV[40];在蓖麻含油率测定的近红外模型中,MSC+detrend(去偏异技术)是最佳处理方法[31]。
4 小结
我国是食用油大国,发展特种油料作物对于缓解我国食用油压力具有重大意义。NIRS 在检测大宗油料种子脂肪酸含量上已取得成熟的经验,而特种油料种子的理化性质常常较为复杂,这对NIRS光谱的采集产生干扰信息,从而影响NIRS 技术在特种油料种子上的应用。进行种子样品预处理提高光谱采集的准确性,同时进行光谱数据预处理以消除噪音干扰,对于提高NIRS 建模准确度十分必要。随着相关研究的进一步开展,NIRS 在特种油料中的应用也必然更加高效。