近红外光谱技术测定花生蛋白质含量研究
2014-03-27金华丽李琳琳
金华丽,李琳琳
(河南工业大学 粮油食品学院,河南 郑州 450001)
0 引言
花生是一种高蛋白的植物性食物,蛋白质含量在20%左右.花生中的蛋白质包含了人体必需的8 种氨基酸,极易被吸收,消化系数可达90%.作为我国具有明显竞争优势的出口创汇农产品,花生的蛋白质含量也成为出口质量标准中的一项重要评定指标.蛋白质含量的传统测定方法是凯氏定氮法,该方法虽然测定准确性高,但必须破坏籽粒,且操作复杂,耗时长,不适合用于花生品质的准确快速检测.
近红外光谱分析技术(Near Infrared Spectroscopy,NIRS)是近年来迅速发展起来的一项高效、快速的检测技术.它利用含氢基团X—H 振动的倍频和合频在近红外谱区的吸收[1],可以测定样品中水分、蛋白质、脂肪等成分[2-4]的含量.与传统的化学分析方法相比,近红外光谱技术具有无损、快速、多组分同时测定等优点[5],广泛应用于小麦[6]、玉米[7]、大米[8]等农产品的硬度、蛋白质、粗脂肪等的测定.禹山林等[9]用傅立叶变换近红外漫反射光谱仪对花生进行光谱采集,采用偏最小二乘法的回归技术建立花生蛋白质含量的测定模型.本试验建立了基于Infratec 1241 型近红外谷物分析仪的花生蛋白质含量的测定模型,比较不同回归技术、光谱和数学处理方法对模型的影响,建立最优模型,实现对花生种子蛋白质含量的快速无损检测,也为其他谷物蛋白质含量的测定提供依据.
1 材料与方法
1.1 材料
从全国不同地区收集不同品种的花生样品共65 份.
1.2 仪器与设备
Infratec 1241 型近红外谷物分析仪:FOSS 公司;FW80 型高速万能粉碎机:北京中兴伟业仪器有限公司.
1.3 试验方法
1.3.1 蛋白质含量的测定
蛋白质含量的测定按照GB 5009.5—2010,用凯氏定氮法测定花生中的蛋白质含量,每个样品重复测定3 次,取平均值作为样品蛋白质含量的最终值.
1.3.2 近红外光谱数据的采集
近红外谷物分析仪开机预热30 min,对采集到的65 个花生样品分别进行光谱扫描,光谱波长范围为570~1 098 nm,每隔2 nm 采集一次光谱.样品光程设为30 nm,子样品数设为10,为消除样品粒度、均匀性不一致引起的差异,每个样品连续扫描2 次.
1.3.3 样品集的划分
选取1—55 号样品作为定标集,用于定标模型的建立,56—65 号样品作为验证集,用于模型可行性的评价.
1.3.4 近红外光谱定标模型的建立
利用软件自带的WINISI 定标软件,对选取的定标集样品进行预处理,剔除异常样品,剩余样品进行建模,选择合适的建模参数,建立最佳花生蛋白质含量的检测模型.
1.3.5 近红外光谱定标模型的验证
用外部验证法评价定标模型的可行性,即比较验证集样品的模型预测值与真实值的相关性,通过相关系数(RSQ)的大小评价定标模型的好坏.
2 结果与分析
2.1 花生蛋白质含量的化学测定值
用国标方法测定的花生蛋白质含量见表1.
由表1 可知,花生蛋白质含量的最大值为23.37%,最小值为17.74%,平均值为19.82%,数据分布较均匀,基本覆盖了花生蛋白质的含量值,其中作为定标集的55 个样品的蛋白质含量包含了最大值和最小值,因此,选取的花生样品符合近红外建模的要求.
2.2 花生样品的近红外扫描光谱图
对65 个具有完整籽粒的花生样品进行光谱扫描,每个样品得到20 条谱线,对其进行平均处理,得到65 个样品的扫描光谱,见图1.各样品的光谱曲线趋势基本相同,但又不完全相同,显示了不同样品间的差异.
表1 花生蛋白质含量的化学测定值 %
图1 样品近红外扫描光谱
2.3 花生蛋白质含量近红外测定模型的建立
用WINISI 软件对选取的定标集样品进行超常样品剔除后,对剩余样品用不同的回归技术做光谱处理和数学处理,比较不同回归技术及光谱和数学处理方法对模型的影响,选择最优参数建立花生蛋白质含量测定的最佳模型.衡量模型优劣的主要参数为定标相关系数(RSQ)、定标标准偏差(SEC)、交叉验证相关系数(1-VR)、交叉验证标准偏差(SECV).
2.3.1 光谱和数学处理参数的选择
在建模过程中,不同的光谱和数学处理方法对模型的优劣有很大影响.本试验讨论了无散射处理(None)、标准正常化结合散射处理(SNV and Detrend)标准正常化处理(SNV)、去散射处理(Detrend Only)、多元离散校正(MSC)5 种光谱处理方法和“1,4,4,1”(一阶导数处理,导数处理采用光谱间隔点为4 nm,一次平滑处理光谱间隔点4 nm,不做二次平滑处理)、“2,4,4,1”、“3,4,4,1”、“4,4,4,1”4 种数学处理方法对模型的影响.不同处理方法得到的定标方程参数见表2.
表2 不同处理方法得到的蛋白质含量定标参数
由表2 可知,选用标准正常化结合散射处理(SNV and Detrend)的光谱处理方法和“2,4,4,1”的数学处理方法得到的定标方程的SEC 值和SECV 值最低,分别为0.228 1 和0.311 9,而RSQ值和1-VR 值最高,分别为0.926 9 和0.911 7.因此,选取这两种处理方法建立的模型会取得较好的效果.
2.3.2 回归技术的选择
由以上讨论得到的最优参数,在SNV and Detrend 和“2,4,4,1”的处理条件下,采用主成分分析法(PCR),改进最小二乘法(Modified PLS)和最小二乘法(PLS)3 种回归技术分别对光谱进行处理,得到的定标方程参数见表3.
表3 采用不同回归技术得到的定标方程参数
由表3 可知,采用改进最小二乘法(Modified PLS)进行回归分析得到的RSQ 和1-VR 最大,同时SEC 和SECV 也最小.因此,建立花生蛋白质含量近红外测定模型的最佳回归技术是改进最小二乘法.
综上,选用SNV and Detrend 和“2,4,4,1”的处理方法,用改进最小二乘法做回归分析得到花生蛋白质含量的近红外测定模型.
2.4 模型的验证
评定一个模型的好坏除了看自身的RSQ 和SEC 外,还需用未参与建模的样品进行验证,通过比较验证集的模型预测值和化学方法测定的真实值之间的相关性来评价模型的可行性.本试验用验证集的10 个样品对建立的模型进行验证,验证集样品的模型预测值和化学测定值见表4.
验证集样品的模型预测值和化学测定值间的回归方程为y=0.923 9x+1.522 2,相关系数R2为0.919 7,说明模型具有很好的预测能力,用近红外光谱技术建立的花生蛋白质含量的测定模型是可行的.
表4 花生蛋白质化学测定值和模型预测值 %
3 结论
本试验运用近红外光谱技术建立了花生蛋白质含量的近红外测定模型,并通过外部验证评价了模型的优劣.采用的最佳建模参数为:标准正常化结合散射处理(SNV and Detrend)的光谱处理方法和“2,4,4,1”的数学处理方法,用改进最小二乘法做回归分析.得到的定标方程的定标相关系数为0.926 9,定标标准偏差为0.228 1,交叉验证相关系数为0.911 7,交叉检验标准偏差平均值为0.311 9,经外部验证得到的相关系数为0.919 7.结果表明,花生蛋白质含量的近红外预测值与化学测定值之间有很好的相关性,近红外光谱技术可以作为测定花生蛋白质含量的一种方法,用于花生蛋白质含量的快速检测中.
[1]孙颖.近红外光谱分析技术及应用进展[J].山东化工,2010,39(2):24-26,30.
[2]郭蕊,王金水,金华丽,等.近红外光谱分析技术测定芝麻水分含量的研究[J].现代食品科技,2011,27(3):366-369.
[3]Wang Li,Wang Qiang,Liu Hongzhi,et al.Determining the content of protein and amino acids in peanuts using near-infrared reflectance spectroscopy[J].Journal of the Science of Food and Agriculture,2013,93:118-124.
[4]韩熹,严红兵,卢福洁,等.基于国产近红外谷物分析仪的大豆中粗蛋白与粗脂肪含量的检测研究[J].现代科学仪器,2009(2):119-121.
[5]杨琼,项瑜,杨季冬.近红外光谱分析技术的研究与应用[J].重庆三峡学院学报,2013(3):89-91.
[6]Fox G P,Osborne B,Bowman J,et al.Measurement of genetic and environmental variation in barley(Hordeum vulgare)grain hardness[J].Journal of Cereal Science,2007,46(1):82-92.
[7]陈建红,黄岛平,黄家雄.广西优良玉米新品种近红外快速化学成分检测研究[J].安徽农业科学,2011,39(22):13342-13343,13353.
[8]刘明博,唐延林,李晓利,等.大米蛋白质含量近红外光谱检测模型研究[J].中国农学通报,2013,29(12):212-216.
[9]禹山林,朱雨杰,闵平,等.傅立叶近红外漫反射非破坏性测定花生种子蛋白质及含油量[J].花生学报,2003,32(增刊):138-143.