APP下载

不同产地稻谷近红外技术建模效果的比较

2016-09-14后其军鞠兴荣朱贞映南京财经大学食品科学与工程学院江苏省粮油品质控制及深加工技术重点实验室江苏南京210023

食品工业科技 2016年8期
关键词:决定系数直链稻谷

后其军,鞠兴荣,袁 建,何 荣,朱贞映(南京财经大学食品科学与工程学院,江苏省粮油品质控制及深加工技术重点实验室,江苏南京210023)

不同产地稻谷近红外技术建模效果的比较

后其军,鞠兴荣*,袁 建,何 荣,朱贞映
(南京财经大学食品科学与工程学院,江苏省粮油品质控制及深加工技术重点实验室,江苏南京210023)

选取安徽省、江苏省、湖南省、黑龙江省四个不同产地的代表性稻谷样品,测定其水分含量、粗蛋白含量、脂肪酸值以及直链淀粉含量,扫描其近红外光谱,运用偏最小二乘法(Partial least square,PLS)建立定量分析模型,比较不同地区同一指标之间建模效果,探索近红外建模是否需要分区域进行。结果表明:在样品具有足够代表性的前提下,对各省化学指标建立的模型都是可靠的,但是同一指标不同地区之间建模效果有所不同,四省水分含量建模决定系数(R2)分别为0.91、0.97、0.94、0.85;粗蛋白含量建模决定系数(R2)分别为0.94、0.78、0.87、0.72;脂肪酸值建模决定系数(R2)分别为0.77、0.60、0.83、0.65;直链淀粉含量建模决定系数(R2)分别为0.68、0.58、0.69、0.53。

不同产地,稻谷,近红外技术,建模效果

近 红 外 光 谱(Near Infrared Reflectance Spectroscopy,NIRS)技术作为一种新崛起的物理测试技术,具有分析速度快、分析指标全面、成本低廉等多种优势。近年来在各个领域均有涉及[1-4],在食品、农作物等定性定量分析中也应用的越来越广泛[5-6],在谷物类的研究方面也不乏研究成果,齐龙等[7]阐述了近红外技术在大米检测中的应用主要有品种鉴定、品质鉴定以及矿质元素含量检测三方面,王传梁等[8]利用近红外检测技术测定大米中的脂肪含量,利用偏最小二乘法建立数学模型,证明了近红外测定大米脂肪含量的可行性。

在稻谷的主要成分中,粗蛋白质含量及水分含量是影响其品质的主要因素,为评价稻谷品质质量的重要指标,直链淀粉含量更是稻谷定等的重要依

据,脂肪酸值则是反映稻谷新陈度的重要指标,对稻谷的储藏和加工都有重要影响。检测稻谷直链淀粉含量和粗蛋白含量可以判定稻谷品质的优劣,分析稻谷水分含量和脂肪酸值可以研究稻谷储藏的品质变化。目前关于近红外技术在谷物品质分析中的应用已经很多,但是很多研究并没有严格区分样品来源,缺少对单一省份的稻谷样品进行分析比较。

本实验选取黑龙江省、江苏省、安徽省、湖南省四个不同产地的代表性稻谷样品,测定其水分含量、粗蛋白含量、脂肪酸值以及直链淀粉含量,扫描其近红外光谱,运用近红外光谱分析技术建立数学分析模型,比较不同地区同一指标之间建模效果的差异性。旨在为稻谷收购过程中形成更加便捷科学化的数据参考,从而提高稻谷收购的质量水平,为稻谷收购过程科学快速提供理论依据以及为是否需要建立区域模型提供新的研究思路。

1 材料与方法

1.1 材料与仪器

稻谷实验样品 选取安徽省、江苏省、湖南省、黑龙江省四个地区的稻谷,其中,安徽省样品135份、江苏省样品180份、湖南省样品98份、黑龙江省样品135份。样品从各省粮库获取,选取的样品均为每个省种植较多的品种且样品经过除杂和不完善粒的筛选。将样品用密封袋包装后编号置于低温储藏室保存备用。

SupNIR-2700近红外分析仪(附有自动旋转样品盘) 聚光科技(杭州)有限公司;K-360全自动凯氏定氮仪 上海步琦有限公司;BS-224S型天平 北京赛多利斯仪器系统有限公司;101-3AS型电热鼓风恒温干燥箱 上海苏进仪器设备厂;FW80多功能粉碎机 天津泰斯特仪器有限公司;JFYZ分样器 上海加定粮油检测仪器厂。

1.2 实验方法

1.2.1 稻谷水分含量测定 采用恒温箱烘干法测定稻谷水分含量,方法参照GB/T 5497-1985《粮食、油料检验水分测定法》[9]。每个样品重复测定三次,取其平均值作为最终结果。

1.2.2 稻谷粗蛋白含量测定 采用凯氏定氮法测定稻谷粗蛋白含量,方法参照GB/T 5511-2008《谷物和豆类氮含量测定和粗蛋白质含量计算凯氏法》[10]。每个样品重复测定三次,取其平均值作为最终结果。

1.2.3 稻谷脂肪酸值测定 采用标准氢氧化钾溶液滴定法测定稻谷脂肪酸值,方法参照GB/T 15684-1995《谷物制品脂肪酸值测定法》[11]。每个样品重复测定三次,取其平均值作为最终结果。

1.2.4 稻谷直链淀粉含量化学方法的测定 采用分光光度计于720 nm处测定显色复合物吸光度的方法测定稻谷直链淀粉含量,方法参照GB/T 15683-2008《大米直链淀粉含量的测定》[12]。每个样品重复测定三次,取其平均值作为最终结果。

1.2.5 光谱采集 近红外分析仪开机预热30 min,经过性能测试后,对收集到的稻谷样品分别进行光谱扫描。为获得稳定的、有代表性的图谱,在环境温度25℃、环境湿度60%的条件下采用自动旋转样品盘采集样品图谱,每个样品重复装样2次,采集光谱范围是1000~1800 nm,分辨率8 cm-1,每间隔1 nm取一次光谱数据,每个样品扫描64次取平均值。

1.2.6 光谱预处理 对收集到的代表性图谱进行预处理,选择的预处理的方法为Savitzky-Golay导数、Savitzky-Golay平滑、多元散射校正(MSC)以及均值中心化的组合方式。

1.2.7 近红外光谱分析模型的建立 利用SupNIR-2700系列光栅型近红外光谱仪自带的RIMP定标软件,设定对收集的谱图与化学测量值一一对应,采用随机方法划分样品集,以80%作为校正集,20%作为验证集,选择偏最小二乘法建立稻谷水分含量、粗蛋白含量、脂肪酸值以及直链淀粉含量的定量分析模型,仪器中建模的参数设置为:最大主因子数20;交互验证分堆数8;马氏距离阈值10.00;学生残差T值2.50;最近邻距离阈值10.00。

1.2.8 近红外建模结果的相关参数说明 SEC(Standard error of calibration)、SEP(Standard error of prediction)分别代表建模的校正标准差和预测标准差,SECV (Standard error of cross validation)代表交互验证标准差,是反映建模数据准确性的参数,SEC、SEP、SECV值越接近0且同时相互之间越接近越好,RC(校正相关系数),表示校正模型中化学测试数据与预测数据之间的相关性,RP(预测相关系数)是反映模型预测能力的参数,RP值越高,表明模型预测能力越强,RPD(Ratio of performance to standard deviate)值则是评价模型分辨能力的重要参数,表示了近红外分析将分布标准差范围之内的样品分级的数目[13],RPD值越大,表示模型的预测效果越好,R2即为RC的平方,是模型的决定系数,反映建模样品集中测量值与预测值之间的相关性,是对建模效果最为直观的判断参数。

2 结果与分析

2.1 不同地区稻谷水分含量建模效果的比较

由图1可以看出,对于水分含量所建的近红外模型,四个省份的稻谷水分含量都呈现明显的线性分布,其中江苏省的线性最为明显,所得到的模型线性最好,方程为Y=0.97x+0.50,决定系数R2值高达0.97,反映出收集的稻谷代表性良好,水分含量的测定值准确。安徽省与湖南省稻谷水分含量建模效果也比较理想,决定系数R2值均超过0.90,而黑龙江省稻谷水分含量分布的不是特别均匀,决定系数R2值为0.85,建模效果不如其他三省。四省具体的建模报告见表1。

四个地区的SEC与SEP值都比较小,说明参比值与预测值之间的标准差较小,数据准确度高;每个地区模型的SECV与SEP值接近,说明实验样品代表性很好;RC与RP都超过0.9,反映了参比值与预测值之间的相关性很高;表1中的RPD(RPDC/RPDV)值基本上都超过了2,说明构建的近红外模型的预测效果较好。范维燕等[14]利用近红外技术对不同品种、不同地区、不同储藏时间的144份稻谷进行水分含量模型的建立,认为修正偏最小二乘法所建立的模型效果最

好,测试值与预测值的相关性高达0.996,说明近红外技术可以用于稻谷水分含量的测定。与之相比,本实验中测试值与预测值相关性最高的是江苏省的0.9831(表1),低于0.996,这可能与选用的建模方法不同有关。

图1 不同地区稻谷水分含量近红外模型图Fig.1 Rice moisture content near infrared model diagram of different regions

2.2 不同地区稻谷粗蛋白含量建模效果的比较

图2 不同地区稻谷粗蛋白含量近红外模型图Fig.2 Rice crude protein content near infrared model diagram of different regions

表1 不同产地稻谷水分含量建模报告Table1 Rice moisture content model report of different regions

对于稻谷粗蛋白含量所建的近红外模型,四个省份的稻谷粗蛋白含量都呈现明显的线性分布,其中安徽省的线性最为明显,所得到的模型线性最好,方程为Y=0.94x+0.47,决定系数R2值高达0.94(图2),反映出收集的稻谷代表性良好,粗蛋白含量的测定值准确。江苏省与湖南省稻谷粗蛋白含量的建模效果也比较理想,决定系数R2值均超达到0.80左右,图2中显示黑龙江省稻谷粗蛋白含量分布的不是特别均匀,决定系数R2值为0.72,建模效果不如其他三省。四省具体的建模报告见表2。

表2 不同产地稻谷粗蛋白含量建模报告Table2 Rice crude protein content model report of different regions

四个地区的SEC与SEP值都比较小,说明参比值与预测值之间的标准差较小,数据准确度高;每个地区模型的SECV与SEP值接近,说明实验样品代表性很好;四省建模报告中的RC值都超过0.84,说明建模效果较好;江苏省与黑龙江省建模的RP值略低于0.80,说明模型的预测能力不如安徽省和湖南省模型的预测能力强;就表2中的RPD(RPDC/RPDV)值而言,江苏省与黑龙江省的较低,说明构建的近红外模型效果没有安徽省与湖南省的建模效果好。Bagchi T B等[15]选取不同品种的印度稻谷,对其蛋白含量进行了分析,选用128个样品作为建模集,并用29个样品作为验证集进行模型的验证,得到的近红外模型的决定系数R2为0.749,验证集中参比值与预测值之间的相关性很高,R值达到近0.96。说明近红外技术可以用于稻谷粗蛋白含量的测定,从表2中的RP值可以发现,模型的预测能力并非完全取决于校正模型的高R值。

2.3 不同地区稻谷脂肪酸值建模效果的比较

图3可以发现:对于稻谷脂肪酸值所建的近红外模型,四个省中湖南省呈现明显的线性分布,方程为Y=0.83x+4.28,所得到的模型稳定性最好,决定系数R2值高达0.83,反映出收集的稻谷代表性良好,脂肪酸值含量的测定值准确。安徽省建模效果也比较理想,决定系数R2值达到0.77,图3中显示黑龙江省与江苏省脂肪酸值分布的不是特别均匀,建模R2分别为0.65、0.60,建模的效果不如安徽省与湖南省。四省具体的建模报告见表3。

相比水分含量和粗蛋白含量而言,四个地区脂肪酸值的SEC与SEP值都偏大,说明参比值与预测值之间的标准差较大,这与脂肪酸值测定过程中产生的无效数据有关;每个地区模型的SECV与SEP值接近,说明实验样品代表性较好;从建模报告中可以明显的发现,RPD值偏低,均小于2,因此关于脂肪酸值的近红外建模效果就不如水分含量和粗蛋白含量建模效果好,模型的预测能力也没有他们强;就四个省而言,安徽省与湖南省脂肪酸值建模效果还是明显优于江苏省和黑龙江省。范维燕等[16]用来自不同地区的150份稻谷作为建模集,50份作为验证集,研究近红外技术在脂肪酸值测定中的应用,认为修正偏

最小二乘法建模效果最好,预测值和参比值之间有很好的相关性,定标标准偏差为1.9205,可以用近红外技术测定稻谷脂肪酸值。本实验中有三个省定标标准差大于1.9205,说明测试化学值的准确性还有待提高。

图3 不同地区稻谷脂肪酸值近红外模型图Fig.3 Rice fatty acid value near infrared model diagram of different regions

表3 不同产地稻谷脂肪酸值建模报告Table3 Rice fatty acid value model report of different regions

图4 不同地区稻谷直链淀粉含量近红外模型图Fig.4 Rice amylose content near infrared model diagram of different regions

2.4 不同地区稻谷直链淀粉含量建模效果的比较

稻谷直链淀粉含量所建的近红外模型如图4所示,四个省份的稻谷直链淀粉含量都分布的比较散,呈现一定的线性却不十分明显,决定系数R2值在0.53~0.69不等,说明测试值与预测值之间存在一定的偏差,预测值与测试值之间的相关性不够显著。安徽省与湖南省的建模效果优于江苏省和黑龙江省,四省具体的建模报告见表4。

四个地区的RC值都明显的高于RP值,表明校建模效果不错,但是预测能力一般,这可能是由于建模集划分采用随机方法造成的,导致验证集的样品代表性不足,而且RPD值不是很高,说明验证集样品的测量值与预测值之间也存在一定的偏差。Xie L H等[17]选取中国八大稻谷主产地的稻谷688份测定稻谷的直链淀粉含量,并用近红外技术建立数学模型,其中491份用于建模,197份用于验证,认为不同的建模方法以及预处理方法对建模结果存在不同的影响,R2值0.3~0.9不等,修正偏最小二乘法建模的效果最好,R2值最高可达到0.9。建模效果优于本实验结果,未来研究中可以考虑补充样品对模型进行扩充从而提高建模效果和预测能力,尝试更多建模方法不断优化近红外模型。

3 结论

本实验用近红外光谱技术对安徽、江苏、湖南、黑龙江四省稻谷重要品质指标进行建模,通过建模效果的比较,探索近红外建模是否需要分区域进行。实验结果表明,在样品具有足够代表性的前提下,对各化学指标建立的模型都是可靠的,但是同一指标不同地区之间建模效果有所不同,四省水分含量建模决定系数R2分别为0.91、0.97、0.94、0.85;粗蛋白含量建模决定系数R2分别为0.94、0.78、0.87、0.72;脂肪酸值建模决定系数R2分别为0.77、0.60、0.83、0.65;直链淀粉含量建模决定系数R2分别为0.68、0.58、0.69、0.53。建议近红外技术建立模型可以尝试分区域进行。

[1]Stubbs T L,Kennedy A C,Fortuna A M.Using NIRS to predict fiber and nutrient content of dry land cereal cultivars[J].Journal of Agricultural and Food Chemistry,2010,58(1):398-403.

[2]修连存,郑志忠,俞正奎,等.近红外光谱分析技术在蚀变矿物鉴定中的应用[J].地质学报,2007,81(11):1584-1590.

表4 不同产地稻谷直链淀粉含量建模报告
Table4 Rice amylose content model report of different regions

地区 SEC RC SECV SEP RP RPDC RPDV FACTOR安徽 1.0061 0.8236 1.0281 1.0587 0.7604 1.5106 1.5452 8江苏 1.0999 0.7593 1.1832 2.8563 0.3994 1.3266 1.0365 10湖南 0.7269 0.8325 0.7731 0.7516 0.7018 1.6527 1.3360 8黑龙江 1.1591 0.7293 1.5133 3.8793 0.3613 1.3573 0.7712 14

Comparison of modeling effect among rice from different regions with near infrared technology

HOU Qi-jun,JU Xing-rong*,YUAN Jian,HE Rong,ZHU Zhen-ying
(College of Food Science&Engineering,Nanjing University of Finance and Economics,Jiangsu Key Laboratory of Quality Control and Deep-Utilizing Technology of Cereals and Oils,Nanjing 210023,China)

The representative rice samples were selected from four provinces of Anhui,Jiangsu,Hunan and Heilongjiang.With the determination of its moisture content,crude protein content,fatty acid values and amylose content,scanning the near infrared spectra,establishing the quantitative analysis model by using partial least squares(PLS),comparing the different modeling results of same index of different regions to explore whether establishing the model of near infrared technology need to distinguish areas.The results showed that if the samples were representative enough,the modeling effect of same index between different areas exist certain differences based on reliable model built of different indexes.Four provinces moisture content modeling determination coefficient(R2)were 0.91,0.97,0.94,0.85,crude protein content modeling determination coefficient(R2)were 0.94,0.78,0.87,0.72,fatty acid value modeling determination coefficient(R2)were 0.77,0.60,0.83,0.65,amylose content modeling determination coefficient(R2)were 0.68,0.58,0.69,0.53,respectively.

different areas;rice;near infrared technology;modeling effect

TS201.1

A

1002-0306(2016)08-0125-06

10.13386/j.issn1002-0306.2016.08.017

2015-09-14

后其军(1991-),男,在读硕士研究生,研究方向:食品加工与检测技术,E-mail:houqijuny@126.com。

*通讯作者:鞠兴荣(1957-),男,博士,研究方向:食品营养、功能食品及农产品深加工,E-mail:xingrongju@163.com。

国家科技支撑计划(2013BAD17B02-2);江苏省普通高校研究生科研创新计划项目(KYZZ_0276)。

猜你喜欢

决定系数直链稻谷
谦卑的稻谷
基于Python语言路径分析矩阵算法运演
玉米价疯涨 稻谷也凑热闹
不同规格香港牡蛎壳形态性状对重量性状的影响
2种贝龄合浦珠母贝数量性状的相关与通径分析
异淀粉酶法高直链银杏淀粉的制备
基于颜色读数识别物质浓度的数学模型研究
上海有机所实现烷烃高效转化
田野稻谷香
春节过后 稻谷行情稳中趋弱