APP下载

小麦主要品质指标的近红外光谱分析模型建立

2017-11-03姬玉梅孙华

食品研究与开发 2017年21期
关键词:定标面筋光谱

姬玉梅,孙华

(鹤壁职业技术学院,河南鹤壁458030)

小麦主要品质指标的近红外光谱分析模型建立

姬玉梅,孙华

(鹤壁职业技术学院,河南鹤壁458030)

以黄淮地区83个小麦品种为材料,采用SPXY算法筛选目标集、用马氏距离法进行预处理、用SPA法提取敏感波点、用偏最小二乘法建模,研究建立小麦蛋白质、湿面筋和沉降值的近红外光谱预测模型,并利用预测集进行验证。结果表明,蛋白质含量、湿面筋含量和沉降值3种测定结果相关系数r分别为0.996 7、0.999 5和0.997 9,说明所建模型与常规化学值有较好的相关性,有较高的可信度,为再进行类似测定提供借鉴。

小麦;品质;近红外光谱技术;建模

小麦品种的品质水平状况,不仅是小麦作为商品粮的品质基础,也是食品加工企业生产优质食品的重要物质基础[1-4]。近年来,我国在小麦品质性状遗传改良方面取得明显进展,已培育出一些品质较好的小麦品种在生产上应用,但依然存在优质专用小麦品种数量不足和优质不高产等问题。缺乏对杂种早代材料进行准确快速鉴定评价的方法是主要的原因之一[5]。而近红外光谱分析技术具有操作简便、非破坏性测定、速度快、稳定性好、效率高等特点,以及测定一次光谱可同时获得多种品质成分含量的独特优点,因此,近红外光谱技术在农作物品质分析中得到了广泛的应用[6-11]。段国辉[12]等以河南省地方小麦新品种为材料,提出近红外光谱测定方法可以用于分析小麦品质。刘玲玲[13]等设计了基于光栅技术的近红外检测系统快速无损地检测小麦品质,测试了该系统的准确性、重复性和稳定性,建立偏最小二乘回归模型并验证。其试验表明该模型对平均光谱的预测效果优于单张光谱,可应用于小麦品质质量检测。由于近红外技术检测必须收集具有代表性的样品,考虑到区域的样品特点,为此,本研究建立了一个新的适宜于黄淮地区小麦主要品质近红外光谱分析检测模型,分别采用国标化学方法和近红外光谱建模分析法对83个黄淮地区大面积种植小麦品种主要品质指标的含量进行了检测,并对黄淮地区小麦主要品质近红外光谱分析检测模型精确度进行了验证。

1 材料与方法

1.1 试验材料

试验使用黄淮地区主要推广的百农矮抗58(新系)、百农 207、周麦 16、周麦 22、西农 979、新麦 26、郑麦7698、郑麦366、济麦22等45个品种和38个试验材料,统一进行编号检测。

样品的处理采用瑞士产布勒三皮三心试验磨进行制粉,细度为过100目筛,面粉水分控制在13%~15%范围内,取粉按一心粉+二心粉+一皮粉+二皮粉+三心粉+三皮粉+刷麸粉,出粉率在60%,粉样经充分混合后放置一周以后进行测定。

1.2 方法

1.2.1 物化指标的测定

分别采用GB/T 5511-2008《谷物和豆类氮含量测定和粗蛋白质含量计算凯氏法》,采用GB/T 5506.2-2008《小麦和小麦粉面筋含量第2部分:仪器法测定湿面筋》,采用GB/T 21119-2007《小麦沉降指数测定法Zeleny试验》,每个样品3次重复,取平均值。

1.2.2 近红外光谱预测模型的建立

光谱采集:光谱数据采集采用FOSS公司的Infratec TM 1241型近红外光谱谷物品质分析仪扫描样品,扫描温度均控制在21℃~25℃之间,扫描波长范围为834 nm~1 094 nm,扫描步长为2 nm,扫描10次,并作样品平行,取平均光谱值用于近红外光谱分析。

模型建立步骤和方法:SPXY(Sample set partitioning based on joint x-y distance)算法是一种基于统计学的样本集选择方法,由KS(Kennard-Stone)法发展而来,优点在于能够有效地覆盖多维向量空间,合理划分校正集和预测集。连续投影算法(Successive Projection Algorithm,SPA)只需要原始光谱数据中的少数几列数据,就可以高度概括绝大多数样品光谱的信息,最大程度的避免了信息重叠[14]。

本文采用SPXY算法筛选出具有代表性的定标集样本和预测集,以马氏距离为指标对定标集、预测集样本的光谱数据进行预处理,采用SPA对预处理后的光谱数据进行敏感波点提取,采用偏最小二乘法建立敏感光谱波点与小麦蛋白质、湿面筋和沉降值之间的校正模型,用预测集数据对模型进行检验与评价。此研究通过SPXY算法选择70个样本作为定标集,剩余的13个样本作为预测集。

评价指标模型建立:对模型进行评价常用的指标有定标均方根误差(Root mean square error of calibration,RMSEC),均方根误差(Root mean square error,RMSE),预测均方根误差(Root mean square error of prediction,RMSEP),定标相关系数(Calibration correlation coefficient,Rc),预测相关系数(Prediction correlation coefficient,Rp)等,表达模型好坏的一个常用方法是,校正集和预测集真值对预测值的散点图。本文样本的划分、光谱数据预处理、波长点选取及模型的建立均通过MATLAB 7.0编程实现。模型的评价指标为预测相关系数(r)和预测均方根误差(RMSEP)。

2 结果与分析

2.1 小麦籽粒主要品质指标含量的化学法测定

本次试验样品处理分析结果如表1中所示,全部样品中蛋白质含量最大值为17.54%,最小值为9.67%,大多分布在11.00%~16.00%之间。湿面筋和沉降值的含量也有类似蛋白质含量的特点,可见,所选样品的蛋白质、湿面筋和沉降值含量范围覆盖面大,数据分布较为合理,表明选取的样品具有代表性。

表1 定标集和预测集蛋白质、湿面筋和沉降值含量分布Table 1 The calibration set and prediction set included protein,wet gluten and sedimentation value

2.2 小麦籽粒主要品质指标近红外分析模型的建立

2.2.1 小麦样品及处理后的光谱比较

小麦样品及处理后的光谱比较见图1。

由图1通过对原始光谱和预处理后的光谱进行比较,可以看出经过预处理后的光谱图基本上消除了基线漂移和基线倾斜,光谱特征峰显著,更便于对后续的建模提供有用的信息。

2.2.2 近红外分析模型的建立

采用SPXY算法从83个样本中筛选出具有代表性的70个样本作为定标集,其余13个样本作为预测集,表1即是利用SPXY算法划分出的定标集和预测集样品分布情况。由表1可以看出,定标集和预测集中样本的蛋白质、湿面筋和沉降值含量分布都较大,亦有较大的标准差,说明样本间差异较大,具有较好的代表性,基本能够代表全省各地小麦品种的品质现状。

图1 小麦样品及处理后的光谱图Fig.1 The spectral image after samples of wheat processing

采用SPXY算法筛选目标集、用马氏距离法进行预处理、用SPA法提取敏感波点、用偏最小二乘法建模这一搭配组合的近红外光谱分析方法,建立常规分析方法测定的数据与预处理过的光谱数据之间的数学校正预测模型,如图2至图4。

图2 蛋白质化学值与预测值之间的相关性Fig.2 Protein chemistry values and the relationship between the predicted value

图3 湿面筋化学值与预测值之间的相关性Fig.3 Relationship between chemicaly values and predicted value of wet gluten

图4 沉降值预测值与化学值之间的相关性Fig.4 Relationship between sedimentation value chemicaly and predicted value

2.3 定标模型的验证

利用验证样品集的13个样品,验证所建立的近红外光谱定标模型的预测精度和可靠性。通过线性回归,得到小麦籽粒蛋白质、湿面筋和沉降值含量化学分析值和模型预测值之间的相关关系,分别如表2和图2至图4所示。

表2 预测集样品主要品质指标的化学值和模型预测值Table 2 The chemical value and the model predictive value of the main quality index of the sample

由表2可知,在13种预测集样品中,77号样品蛋白质含量的化学值与预测值之间的差值(化学值绝对误差)偏大,其余12种二者相互接近。

采用化学值绝对误差的F检验,判定77号样本为化学值异常,予以剔除后,对剩余预测集样品的化学值和预测值进行相关性分析,如图2至图4所示。

由图2可以看到,趋势线的斜率为0.994 6,相关系数为0.996 7;由图3可以看到,趋势线的斜率为1.020 8,相关系数为0.999 5;从图4中可以看出,趋势线的斜率为1.002 1,相关系数为0.997 9,每个图中二者均接近于1,每个图中校正模型的校正集预测均方根误差(RMSEP)都小于5%,说明显著性水平较高,因此所建立的小麦籽粒主要品质指标模型具有良好的预测性。

3 讨论与结论

近年来,随着人们对饮食安全的重视,快速、高效的对小麦品质进行类型检测已发展成为一项重点研究课题。目前,许多学者在此项课题上己取得了一定的成果,如采用近红外光谱分析技术实现小麦品质类型的检测。但目前的检测方法仍存在一些问题,如所建模型不完善、模型预测精度不高等。就此问题许多学者进行了不同程度的研究。钱海波[15]采用SPXY算法选择具有代表性的校正集样本,然后使用不同方法多光谱数据作预处理,增强光谱特征,在此基础上分别采用偏最小二乘法回归和BP神经网络方法建立了小麦蛋白质、湿面筋及沉降值的校正模型。测试结果表明,蛋白质、湿面筋预测相关系数分别为0.972 44和0.960 93,沉降值的校正模型相关性不理想。段国辉等[16]研究认为近红外品质测定蛋白质含量的校正值与国标法测定结果吻合程度较好,湿面筋含量次之,而沉降值吻合程度较差。毛晓东[17]运用近红外光谱分析了小麦按面筋强度分类的可行性,深入研究小麦类型监测模型。

本研究结果表明,采用SPXY算法筛选目标集、用马氏距离法进行预处理、用SPA法提取敏感波点、用偏最小二乘法建模这一搭配组合的近红外光谱分析方法测定农作物品质,结果能达到较高的校正相关系数。通过对近红外光谱分析法与国标法测得的小麦品质结果进行相关分析,蛋白质含量、湿面筋含量和沉降值三种测定结果相关系数r分别为0.996 7、0.999 5和0.997 9,说明所建模型与常规化学值有较好的相关性,有较高的可信度。这一结果较其他报道都高,一方面可能受测试品种影响,另一方面可能是综合多种处理和分析方法综合运用的结果。

[1]朱天钦.食品专用面粉的种类及其质量指标[J].郑州粮食学院学报,1985,19(1):10-16

[2]张国权,魏益,欧阳韶阵,等.陕西关中小安品种品系的品质分析[J].表类作物学报1998,18(2):18-21

[3]陈明引.面团流变学特性与面包烘倍品质的关系[J].粮食与油脂,1991(4):2-6

[4]马长德,Liu G T,Rubenthaler G L.中国北部冬麦与美国太平洋两北部冬安区小麦品种加工品质的分析比较[J].作物学报,1987,13(2):130-134

[5]高居荣,韩秀兰,孙彩玲,等.DA 7200近红外仪在小麦品质分析中的应用研究[J].实验室科学,2009,2:173-176

[6]景茂,严衍禄,刘广田.付里叶变换近红外漫反射光谱法测定小麦单籽粒中蛋白质含量[J].光谱学与光谱分析,1991,11(3):20-22

[7]李大群,王文真,张玉良.近红外漫反射光谱法测定大豆和小麦中的蛋白质含量[J].分析仪器,1990(4):45-50

[8]彭玉魁,李菊英,祁振英.近红外光谱分析技术在小麦营养成份鉴定上的应用[J].麦类作物,1997,17(2):33-35

[9]Paradkar M M,Sivzakesava S,Irudayaraj J.Discrimination and classification of adulterants in maple syrup with the use of infrared spectroscopic techniques[J].J Sci Food Agric,2002,3(83):71-72

[10]Barton I I,Franklin E.Theory and principles of near infrared spectroscopy[J].Spectroscopy Europe,2002,14(1):12-18

[11]何学超,郭道林,冯永建,等.小麦新陈快速鉴别方法的研究[J].粮食储藏,2006(1):42-45

[12]段国辉,张园,高海涛,等.利用近红外光谱技术分析不同类型小麦品质[J].江苏农业科学,2011(5):422-424

[13]刘玲玲,赵博,张银桥,等.小麦品质近红外检测系统的设计与试验研究[J].光谱学与光谱分析,2013(1):92-97

[14]林松.近红外光谱分析技术在啤酒酒精度检测中的应用研究[D].镇江:江苏大学,2004

[15]钱海波.基于神经网络的小麦品质建模与评估系统设计[D].哈尔滨:黑龙江大学,2011

[16]段国辉,张园,高海涛,等.2011.近红外光谱分析技术测定冬小麦主要品质性质[J].西北农业学报,20(9):25-30

[17]毛晓东.基于多层SVM的面筋强度分类模型优化研究[D].哈尔滨:黑龙江大学,2014

Building a Near Infrared Spectral Analysis Model for Main Quality Indexes of Wheat

JI Yu-mei,SUN Hua
(Hebi Vocational and Technical College,Hebi 458030,Henan,China)

Taken 83 varieties of wheats in Huang-huai area as material,screened target set by SPXY Algorithm,pretreated by Mahalanobis Distance Method,extracted sensitive wave points by SPA Method,and modeled by PLS Method,a near infrared spectral prediction model for wheat protein,wet gluten and sedimentation value of wheat was researched and built,and verified by using the prediction set.The results showed that the correlation coefficient(r)of the three results of protein content,wet gluten content and sedimentation value were 0.996 7,0.999 5 and 0.997 9,indicating that there was a good correlation and high credibility between the model and the conventional chemical values,which could provide reference for similar determination.

wheat;quality;near infrared spectroscopy;modeling

10.3969/j.issn.1005-6521.2017.21.027

鹤壁市科学研究与技术开发计划项目(20150613)

姬玉梅(1975—),女(汉),副教授,本科,主要从事作物营养研究。

2017-01-14

猜你喜欢

定标面筋光谱
基于三维Saab变换的高光谱图像压缩方法
我国为世界大豆精准选种“定标”
基于恒星的电离层成像仪在轨几何定标
面团变面筋
偏偏是它
面筋包揣肉圆
基于角反射器的机载毫米波云雷达外定标实验
4m直径均匀扩展定标光源
星载近红外高光谱CO2遥感进展
苦味酸与牛血清蛋白相互作用的光谱研究