APP下载

基于近红外光谱的高粱籽粒直链淀粉、支链淀粉含量检测模型的构建与应用

2022-02-22张北举陈松树李魁印李鲁华徐如宏安畅熊富敏张燕董俐利任明见

中国农业科学 2022年1期
关键词:直链支链定标

张北举,陈松树,李魁印,李鲁华,徐如宏,安畅,熊富敏,张燕,董俐利,任明见

基于近红外光谱的高粱籽粒直链淀粉、支链淀粉含量检测模型的构建与应用

张北举,陈松树,李魁印,李鲁华,徐如宏,安畅,熊富敏,张燕,董俐利,任明见

贵州大学农学院/国家小麦改良中心贵州分中心,贵阳 550025

【】高粱是酿酒和饲料的主要原料之一,其籽粒直链淀粉含量与支链淀粉含量的比值大小与白酒品质及饲料质量密切相关。传统的高粱成分化学检测方法已不适合高通量测试,采用改进最小二乘法(modified PLS)对高粱样品的近红外光谱图进行光谱预处理、得分处理和结果监控建立高粱籽粒直链淀粉、支链淀粉含量的预测模型,旨在得到一种快速高效低成本的检测方法,为高粱的遗传改良及品质分析提供依据。从450份高粱资源中筛选出112份代表品种作为校正集和验证集,通过双波长法测定112份高粱品种籽粒中直链淀粉、支链淀粉含量的化学值,并收集波长为850—1 048 nm的近红外光谱,对光谱进行扫描数据矩阵和化学数据计算得分(PL1)处理解释光谱间差异,剔除马氏距离(GH)大于3的超常品种以减小建模误差。采用Modified PLS回归技术建模,通过不同散射处理和导数处理等方法建立不同的定标模型。根据交叉验证标准偏差(SECV)、交叉验证相关系数(1-VR)确定最佳模型,并进行结果监控和非参数检验评估模型的预测性能。直链淀粉的近红外预测模型SECV是2.7732,1-VR是0.9503,相关系数(RSQ)是0.9688。Bias=0.229<2.7732(SECV)×0.6,即偏差(Bias)小于定标模型SECV的0.6倍;预测标准偏差(SEP)=1.266<2.7732(SECV)×1.3=3.60516,即SEP小于定标模型SECV的1.3倍,11.01(SD)—10.81(SD)=0.2<11.02(SD)×0.2=2.204即化学数据和近红外预测数据标准偏差(SD)差值小于化学数据SD的20%。支链淀粉的近红外预测模型SECV是1.7516,1-VR是0.8818,RSQ是0.9127。Bias=-0.014<1.7516(SECV)×0.6即Bias小于定标模型SECV的0.6倍,SEP=1.316<1.7516(SECV)×1.3=2.2708即SEP小于定标模型SECV的1.3倍,5.30-5.29=0.01<5.30×0.2=1.06即化学数据和近红外预测数据SD差值小于化学数据SD的20%。利用30份模型外高粱籽粒对模型的有效性进行两配对样本非参数检验,结果表明,直链淀粉含量和支链淀粉含量的测定值与预测值之间差异不显著(=0.262>0.05;=0.992>0.05)。所建立的近红外模型精准度高,稳定性好,能准确快速地检测高粱籽粒中直链淀粉、支链淀粉的含量,可用于高粱的遗传改良及高粱品质的检测。

近红外光谱;高粱;直链淀粉;支链淀粉;改进最小二乘法

0 引言

【研究意义】高粱是中国公认的白酒传统固态发酵和饲料的主要原料之一,白酒的出酒率和品质及饲料的质量均与高粱中籽粒直链淀粉含量与支链淀粉含量的比值大小有重要关系[1]。根据市场和育种工作者的需求,探究一种高效快速、低成本、简单易操作、无污染检测高粱直链淀粉和支链淀粉含量的方法,对研究高品质酒和优质饲料具有极其重要的意义。近红外光谱(near-infrared spectroscopy,NIS)分析技术具有无损、快速等优点,已被广泛应用于不同的科学研究领域[2-5];基于近红外光谱技术,采用改进最小二乘法(modified PLS)构建高粱籽粒直链淀粉、支链淀粉含量的预测模型,可得到一种高效准确的高粱籽粒直链淀粉、支链淀粉含量的检测方法。【前人研究进展】加拿大谷物实验室早期通过近红外光谱技术检测油菜籽粒中油分、硫苷及蛋白质含量[6-7]。王翠秀等[8]通过偏最小二乘法(partial least squares,PLS)、反向传播(back propagation,BP)神经网络法建立大豆籽粒脂肪和蛋白质含量最优近红外预测模型,实现大豆品质分析的快速检测,极大地推动育种改良进程。ZHANG等[9]通过可见光和近红外光谱技术分别建立玉米种子水分含量的预测模型,确定近红外光谱技术模型与玉米种子水分含量具有更多的相关性。李佳佳等[10]通过393份大豆茎秆的近红外光谱图,构建了大豆茎秆化学组分含量检测模型,具有高效、低成本、无污染的特点,用于大豆种植资源抗倒伏的选育。目前,基于近红外光谱分析技术,分析高粱的重要指标也有相关报道。黄朝晖等[11]应用PLS技术建立高粱原花青素近红外预测模型,能准确检测高粱中高含量原花青素品种,为高粱选育提供了一种不破坏籽粒的方法。刘敏轩等[12]应用傅里叶变换近红外光谱分析技术建立高粱籽粒中多酚类物质含量的分析模型,能准确快速检测高粱籽粒中多酚类物质的含量,在高粱的育种和品质分析中具有非凡的意义。SIMEONE等[13]利用近红外光谱采用PLS技术测定甜高粱汁中蔗糖、葡萄糖、和果糖的含量,用于分析甜高粱基因型与不同环境中甜高粱产生乙醇量的相关性。相对于传统的化学检测技术,近红外光谱分析技术能够无损害、样品处理量小、绿色、高效检测各种作物的化学成分,且精度、准确度高[14-15],对高粱的遗传改良及高粱品质检测有重要意义。【本研究切入点】目前,国内外科研人员已采用PLS、BP神经网络法等构建高粱蛋白质、脂肪、单宁、水分、淀粉等含量的检测模型,但采用Modified PLS构建高粱籽粒直链淀粉、支链淀粉含量的预测模型鲜见报道。【拟解决的关键问题】为推进高粱的遗传改良及高粱品质检测,本研究采用Modified PLS对82份校正集高粱品种和30份验证集高粱品种的近红外光谱图进行得分处理、光谱预处理和结果监控建立高粱籽粒直链淀粉、支链淀粉含量的预测模型,用于快速、高效、无污染、低成本等检测高粱籽粒中直链淀粉、支链淀粉含量,为推进酒高粱的遗传改良及高粱品质检测提供依据。

1 材料与方法

1.1 供试材料

高粱品种资源分别于2018年和2019年播种在国家小麦改良中心贵州分中心基地。分别用Grain Analyzer(InfratecTM1241型,丹麦FOSS)收集2年高粱籽粒的近红外光谱,根据马氏距离(global H,GH),剔除数值大于3的超常品种和小于0.8的过剩品种,挑选出112份变异性(代表性)高粱品种作为校正集和验证集,用于定标建模和结果监控。

1.2 高粱近红外光谱的收集

先用种子风选净度仪(CFY-II型,浙江托普云农科技股份有限公司)将烘干的112份高粱品种进行风选,减少杂质的干扰,然后进行近红外光谱收集,收集光谱波长为850—1 048 nm,每份高粱品种扫描10次,收集平均光谱,每份高粱品种重复装样扫描收集光谱3次,作为高粱品种的原始光谱。

1.3 双波长法测定直链淀粉与支链淀粉含量

参考GB7648-87和GB/T15683-2008[16](部分步骤稍有改进)测量112份高粱品种籽粒的支链淀粉、直链淀粉的含量。依据高粱支链淀粉标品(购买于Solarbio公司货号106A1030)和直链淀粉标品(购买于Solarbio公司货号1012G104),通过酶标仪(MULTISKAN Sky型,成都百乐科技有限公司)分别测定高粱籽粒支链淀粉、直链淀粉的测定波长和参比波长。分别将112份高粱籽粒用高速多功能粉碎机(SUS 304型,永康市铂欧五金制品有限公司)粉碎,过120目筛子,装入自封袋备用。将粉碎的高粱品种用脂肪测定仪(SZF-06C型,浙江托普云农科技股份有限公司)进行脱脂脱糖处理并烘干,使用电子天平(BSA224S型,赛多利斯科学仪器有限公司)称取0.1000 g脱脂脱糖的高粱品种,放入50 ml的烧杯中,加入450 μl的无水乙醇进行湿润,再加10 ml 0.5 mol·L-1的KOH溶液,80℃加热10 min加速溶解,用双蒸水定容至50 ml。最后吸取品种液2.5 ml,加入25—35 ml的双蒸水,用0.1 mol·L-1的HCL调节pH为3左右,加入0.5 ml的碘试剂进行显色,通过酶标仪得出高粱品种的吸光度计算出高粱品种籽粒支链淀粉、直链淀粉的含量。每份高粱品种重复测量3次,然后分别挑选出直链淀粉、支链淀粉含量相对稳定的30份品种作为验证集,并通过WinISI软件[17]选出3次扫描的近红外光谱图,其余的82份品种作为校正集,并通过WinISI软件选出3次扫描的近红外光谱图。验证集需要化学值稳定,以便能准确检测模型的预测性能,减小误差。

1.4 近红外光谱预测模型的建立与验证

1.4.1 定标光谱的化学数据及得分作图处理 通过WinISI软件分别打开3次选出的82份定标光谱文件,一一对应输入直链淀粉、支链淀粉含量的化学数据,为降低操作误差对3份定标光谱进行平均处理生成平均定标光谱文件。对平均定标光谱文件进行扫描数据矩阵和化学数据计算得分(programming language 1,PL1)处理解释光谱间差异,马氏距离(GH含义为得分的三维图中,每个品种距离中心品种点的距离。)设置为3,通过数学处理(math treatment)、散射处理(scatter)、导数处理(derivative)剔除超常品种,然后将直链淀粉、支链淀粉转化为主成分得分数据进行预测模型的建立。

1.4.2 定标模型的构建及选择 利用宽范围定标技术(global equation)建立可扩展的定标模型,方便以后定标模型升级。为得到最佳直链淀粉、支链淀粉的近红外光谱模型,采用Modified PLS回归技术对主成分得分数据建模,分别采用标准正常化处理(standard normal variant,SNV)、去散射处理(detrend only)、无散射处理(none)、标准正常化+散射处理(SNV+detrend)、多元离散校正(multi scatter correction,MSC)、反向多元离散校正(inverse multi scatter correction)、加权散射校正(weighted multi scatter correction)进行散射处理;导数处理分别采用一阶导数处理、二阶导数处理;做一次平滑处理等方法建立不同的定标模型[18]。通过观察不同定标模型的近红外预测数据和实验室标准数据的相关系数(R-squared,RSQ),预测没有参与定标品种近红外值与化学分析值之间交叉验证标准偏差(standard error of cross validation,SECV)的均值,预测没有参与定标品种近红外值与化学分析值之间交叉验证相关系数(1 minus the variance ratio,1-VR)的均值选择最佳定标模型。

1.4.3 定标模型的结果监控 采用30份验证集品种对最优模型的预测性能进行验证,根据Bias、SECV、预测标准偏差(standard error of prediction,SEP)评价定标模型的预测性能。Bias小于定标模型SECV的0.6倍,预测SEP小于定标模型SECV的1.3倍,化学数据和近红外预测数据SD差值小于化学数据SD的20%,检测表明该成分适合近红外光谱分析,预测性能可靠。

2 结果

2.1 高粱中直链淀粉、支链淀粉含量的测定

在测定高粱直链淀粉、支链淀粉含量的过程中,为确定化学值的准确度,同时也保证近红外分析的准确性。由同一个操作员完成112份高粱品种籽粒直链淀粉、支链淀粉含量的测定,并设3个重复取平均值,确保操作的统一性。表1为高粱品种直链淀粉、支链淀粉含量化学值统计参数。校正集直链淀粉含量的平均值是18.23%,含量范围是1.08%—40.8%;支链淀粉含量的平均值是45.05%,含量范围是26.74%— 67.95%。校正集直链淀粉、支链淀粉含量范围广,具有一定的代表性。验证集是挑选出化学值稳定的品种并且范围较广,具有一定监控的性能。

表1 高粱品种直链淀粉、支链淀粉含量化学值统计参数

2.2 82份校正高粱品种近红外光谱及三维得分图

由图1可以看出高粱品种的原始光谱走向基本相同并且光谱扫描完整没有残缺,可以对光谱进行数学处理和去散射处理。处理后的光谱特征基本一致,波峰和波谷的变化明显,说明近红外光谱对高粱直链淀粉、支链淀粉有较高的区分度。对处理后的光谱进行扫描数据矩阵和化学数据计算得分,利用每个高粱品种的得分与校正高粱品种得分平均值比较计算GH,GH大于3为超常品种,剔除。由图2可知直链淀粉三维得分图比较集中,没有明显的分组现象,不需分组定标建模;支链淀粉三维得分极大部分集中,但有少部分分布在边缘,可能是化学值测量存在一定误差(在可接受范围内,GH小于3),为降低预测分析误差,剔除边缘品种定标建模。

A:直链淀粉;B:支链淀粉 A: Amylose; B: Amylopectin

2.3 高粱直链淀粉、支链淀粉含量近红外模型的建立及最佳模型选择

采用Modified PLS回归技术对得分文件建模,采用不同的数学方法和散射方法进行处理。SECV是进行交叉验证时所获得的近红外预测值与化学分析值标准偏差,通过SEVC可以大致评估定标模型的预测准确度,1-VR是进行交叉验证时模型对品种集浓度变化所能描述出的百分率。对于直链淀粉、支链淀粉,当SECV越低,1-VR越高,说明定标模型越好。由表2可知直链淀粉最佳模型是通过标准正常化处理+二阶导数(SNV+second derivative)处理获得的模型(SECV=2.7732、1-VR=0.9503),支链淀粉最佳模型是通过标准正常化处理+一阶导数(SNV+ first derivative)处理获得的模型(SECV=1.7516、1-VR=0.8818)。

2.4 高粱直链淀粉、支链淀粉含量近红外模型的监控

运用WinISI软件验证30份高粱品种(表3)检验定标模型的预测性能,直链淀粉定标模型检测结果(图3)表明,Bias=0.229<2.7732(SECV)×0.6,SEP=1.266<2.7732(SECV)×1.3=3.60516,11.01(SD)-10.81(SD)=0.2<11.02(SD)×0.2=2.204,RSQ(外部)是0.987。支链淀粉定标模型检测结果(图3)表明,Bias=-0.014<1.7516(SECV)×0.6,SEP=1.316<1.7516(SECV)×1.3=2.2708,5.30-5.29=0.01<5.30×0.2=1.06,RQS(外部)是0.937。同时将直链淀粉、支链淀粉含量测定值(表3)进行单样本K-S检测,结果(表4)表明,直链淀粉渐进显著性=0.003<0.05,支链淀粉渐进显著性=0.012<0.05,所以直链淀粉、支链淀粉含量数据不符合正态分布,不能进行检测。为检验测定值和预测值的相关性,进行了两配对样本非参数检测(威尔科克森符号秩检验,表5),结果表明,直链淀粉测定值-直链淀粉预测值渐进显著性=0.262>0.05,支链淀粉测定值-支链淀粉预测值渐进显著性=0.992>0.05,所以直链淀粉、支链淀粉测定值和对应的预测值无显著差异,因此,直链淀粉、支链淀粉的定标模型有很高的预测性能,能满足高粱直链淀粉、支链淀粉含量中高对准度的要求。

A:直链淀粉;B:支链淀粉 A: Amylose; B: Amylopectin

表2 不同处理方法高粱直链淀粉、支链淀粉含量的主要评价参数

SEC:定标标准偏差;RSQ:相关系数;SECV:交叉验证标准偏差;1-VR:交叉验证相关系数

SEC: standard error of the calibration; RSQ: R-squared; SECV: standard error of cross validation; 1-VR: 1 minus the variance ratio

表3 化学测定值和近红外模型预测值结果比较

3 讨论

近红外光具有很好的透射性,在检测样品时近红外光通过漫反射、透射、反射等方式使含氢基团X-H(X=C、S、N、O)对近红外光进行选择性吸收,获得包含样品信息合频和倍频近红外光谱,运用化学计量学方法将光谱和化学数据关联并建立预测模型[19]。直链淀粉是一种基本线性α-(1,4)-葡聚糖链,支链淀粉由许多α吡喃葡萄糖通过α-1,4-糖苷键连接而成的短链所构成[20-22]。因此,直链淀粉、支链淀粉都含有大量的羟基和碳氢键,可以对近红外光进行吸收。相较于传统检测方法操作复杂、样品破坏性大、存在一定的安全风险和环境污染等的缺陷,近红外光谱分析技术已经用在产业产品品质和质量的评定标准上,在生产效率和产品质量上取得了良好的效果,并在农业、分子生物和制药等领域都广泛的普及应用[23-25]。

表4 单样本科尔翼戈洛夫-斯米诺夫检验

a:检验分布为正态分布;b:根据数据计算;c:里利氏显著性修正

a: Test distribution is normal;b: Calculate based on data;c: Richie's significance correction

表5 威尔科克森符号秩检验

a:基于正秩a: Based on positive rank

本研究基于Grain Analyzer(InfratecTM1241型,丹麦FOSS)建立一套快速、高效、绿色、低成本检测高粱籽粒直链淀粉、支链淀粉含量的定标模型,并利用该模型对高粱品质进行评估。InfratecTM1241 Grain Analyzer获得CE认证、GIPSA认证、NTEP认证、PTB认证等,开机自检、程序稳定、操作简单,通过单色光穿透样品到达检测器获取光谱信号,该信号通过内置计算机处理获得检测值。通过收集2年450份高粱品种的近红外光谱图,根据计算得分处理挑出0.8<GH<3的112份代表品种定标建模和结果监控。相较于刘红梅等[26]、王勇生等[27]、巫小建等[28]构建的近红外模型,本研究采用的样品是通过GH挑选出来的代表性品种,光谱特征基本一致波峰和波谷的变化明显,在932和972 nm处不同高粱品种的吸光度有较大区别,说明近红外光谱对高粱直链淀粉、支链淀粉有较高的区分度,既节省时间又确保模型的稳定和结果的准确(图1)。然后对样品光谱采用14种不同的散射处理、计算得分,并用WinISI软件根据得分文件采用Modified PLS构建不同模型,挑选出最佳模型并进行结果监控。与李佳佳等[10]、陈雪萍等[5]构建的近红外模型相比,本研究采用Modified PLS构建模型,获得模型SECV小1-VR高(表2)。用WinISI软件进行结果监控并绘图,相比SPSS相关性分析更准确更靠谱,同时还可以对定标模型进行斜率和截距的调整,使检测结果更准确更稳定。

刘红梅等[26]通过PLS回归技术,采用不同预处理和不同波长建立稻米直链淀粉含量的近红外光谱预测模型。结果表明,对全谱图采用多元校正(MSC)预处理的效果较好,经过优化模型的相关系数()是0.9819,SEP是0.1009,定标标准偏差(standard error of the calibration,SEC)是0.831;将化学值与稻米直链淀粉含量的近红外光谱预测值进行配对检测,=0.356>0.05(置信区间为95%),说明近红外光谱预测值与化学分析值无显著差异,即利用近红外光谱快速检测稻米直链淀粉含量是可行的。王勇生等[27]采用PLS回归技术和全交互验证手段高粱中粗蛋白质、水分含量的近红外光谱预测模型。结果显示粗蛋白质含量原始光谱通过一阶导数+多元散射校正预处理得到的近红外光谱预测模型相对分析误差是8.41,交互验证相对分析误差是4.97,外部验证相对分析误差3.32;水分含量原始光谱通过一阶导数+减去一条直线预处理得到的近红外光谱预测模型相对分析误差是12.20,交互验证相对分析误差是7.97,外部验证相对分析误差5.36。预测模型的相对分析误差均大于评估值,因此具有精确评估高粱中粗蛋白质和水分含量的应用效果。巫小建等[28]建立大麦籽粒总淀粉的近红外检测模型代替传统检测,韩浩楠等[29]建立玉米粉淀粉含量预测模型应用于育种材料筛选,KIM等[30]建立阔叶凋落物的水分含量近红外预测模型用于预测林地凋落物的水分,说明近几年近红外光谱分析技术在育种、品质分析、工业上运用得越来越广泛。

CHEN等[31]、刘红梅等[26]、王勇生等[27]用校正集样品近红外光谱通过不同的预处理和主成分分析建立不同的模型,通过验证集样品进行模型评估,比较各模型的RSQ、SEP、SECV、1-VR等选择最优模型。该研究步骤与前人基本一致,但回归建模技术是Modified PLS,检测模型的预测性能是通过WinISI软件进行监测和非参数检验。该试验建立的高粱中直链淀粉含量最佳预测模型采用SNV+二阶导数处理,SECV是2.7732,1-VR是0.9503,RSQ是0.9688。Bias=0.229<2.7732(SECV)×0.6,即Bias小于定标模型SECV的0.6倍;SEP=1.266<2.7732(SECV)×1.3=3.60516,即SEP小于定标模型SECV的1.3倍,11.01(SD)-10.81(SD)=0.2<11.02(SD)×0.2=2.204,即化学数据和近红外预测数据SD差值小于化学数据SD的20%。支链淀粉含量最佳预测模型是采用SNV+一阶导数处理,SECV是1.7516,1-VR是0.8818,RSQ是0.9127。Bias=﹣0.014<1.7516(SECV)×0.6,即Bias小于定标模型SECV的0.6倍,SEP=1.316<1.7516(SECV)×1.3=2.2708,即SEP小于定标模型SECV的1.3倍,5.30-5.29=0.01<5.30×0.2=1.06,即化学数据和近红外预测数据SD差值小于化学数据SD的20%,并且进行两配对样本非参数检验结果表明二者之间差异不显著(=0.262>0.05;=0.992>0.05)。

4 结论

构建了一套低成本、绿色、高效的高粱籽粒直链淀粉、支链淀粉含量检测模型。该模型的结果监控显示精准度高,稳定性好,可靠性强,并且可以代替化学方法测定高粱籽粒直链淀粉、支链淀粉的含量。

[1] 焦少杰, 王黎明, 姜艳喜, 严洪冬, 苏德峰, 孙广全. 高粱与固态白酒关系的研究综述. 酿酒, 2015, 42(1): 13-16.

JIAO S J, Wang L M, JIANG Y X, YAN H D, SU D F, SUN G Q. A review of the research on the relationship between sorghum and solid liquorWine Making, 2015, 42(1): 13-16. (in Chinese)

[2] OMAR J, SLOWIKOWSKI B, BOIX A. Chemometric approach for discriminating tobacco trademarks by near infrared spectroscopy.Forensic Science International, 2019, 294: 15-20.

[3] CHEN H, TAN C, LIN Z, LI H J. Quantifying several adulterants of Noto ginseng powder by near-infrared spectroscopy and multivariate calibration. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2018, 211: 280-286.

[4] SIRSOMBOON P, POSOM J. On-line measurement of activation energy of ground bamboo using near infrared spectroscopy. Renewable Energy, 2019, 133: 480-488.

[5] 陈雪萍, 刘世尧, 尹能文, 荆凌云, 魏丽娟, 林呐, 肖阳, 徐新福, 李加纳, 刘列钊. 甘蓝型油菜茎秆纤维组分含量和木质素单体G/S近红外模型构建. 中国农业科学, 2018, 51(4): 688-698.

CHEN X P, LIU S Y, YIN N W, JING L Y, WEI L J, LIN N, XIAO Y, XU X F, LI J N, LIU L Z. Construction of NIR model of fiber component content and lignin monomer G/S instalk. Scientia Agricultura Sinica,2018, 51(4): 688-698. (in Chinese)

[6] TKACHUK R. Oil and protein analysis of whole rapeseed kernels by near infrared reflectance spectroscopy.Journal of the American Oil Chemists’ Society, 1981, 58(8): 819-822.

[7] PANFORD J A, WILLIAMS P C, DEMAN J M. Analysis of oilseeds for protein, oil, fiber and moisture by near-infrared reflectance spectroscopy.Journal of the American Oil Chemists’ Society, 1988, 65(10): 1627-1634.

[8] 王翠秀, 曹建飞, 顾振飞, 徐明雪, 吴泉源. 基于近红外光谱大豆蛋白质、脂肪快速无损检测模型的优化构建. 大豆科学, 2019, 38(6): 968-976.

WANG C X, CAO J F, GU Z F, XU M X, WU Q Y. Optimized construction of a rapid non-destructive detection model for soybean protein and fat based on near-infrared spectroscopy. Soybean Science, 2019, 38(6): 968-976. (in Chinese)

[9] ZHANG Y M, GUO W C. Moisture content detection of maize seed based on visible/near-infrared and near-infrared hyperspectral imaging technology. International Journal of Food Science and Technology. 2020,55: 631-640.

[10] 李佳佳, 洪慧龙, 万明月, 储丽, 赵敬会, 汪明华, 徐志鹏, 张阴, 黄志平, 张文明, 王晓波, 邱丽娟. 基于近红外光谱的大豆茎秆化学组分含量检测模型构建与应用. 中国农业科学, 2021, 54, 54(5): 887-900.

LI J J, HONG H L, WAN M Y, CHU L, ZHAO J H, WANG M H, XU Z P, ZHANG Y, HUANG Z P, ZHANG W M, WANG X B, QIU L J. Construction and application of soybean stem chemical composition detection model based on near infrared spectroscopy. Scientia Agricultura Sinica, 2021, 54, 54(5): 887-900. (in Chinese)

[11] 黄朝晖, 陆平, 杨楠, 孟宪军, 任贵兴. 近红外光谱法测定高粱原花青素含量. 食品科技, 2008(10): 207-210.

HUANG Z H, LU P, YANG N, MENG X J, REN G X. Determination of proanthocyanidins content of sorghum by near infrared spectroscopy. Food Science and Technology, 2008(10): 207-210. (in Chinese)

[12] 刘敏轩, 黄赟文, 韩建国. 高粱籽粒中多酚类物质的傅里叶变换近红外光谱分析. 分析化学, 2009, 37(9): 1275-1280.

LIU M X, HUANG Y W, HAN J G. Fourier transform near infrared spectroscopy analysis of polyphenols in sorghum grains.Chinese Journal of Analytical Chemistry, 2009, 37(9): 1275-1280. (in Chinese)

[13] SIMEONE M L F, PARRELLA R A C, SCHAFFERT R E S, DAMASCENO C M B, LEAL M C B, PASQUINI C. Near infrared spectroscopy determination of sucrose, glucose and fructose in sweet sorghum juice. Microchemical Journal, 2017, 134: 125-130.

[14] 纪楠. 大豆秸秆木质素和纤维素含量与近红外光谱相关性模型研究[D]. 哈尔滨: 东北农业大学, 2016.

JI N. Research on the correlation model between lignin and cellulose content of soybean straw and near infrared spectroscopy[D]. HarbinNortheast Agricultural University, 2016. (in Chinese)

[15] CELIO P. Near infrared spectroscopy: fundamentals, practical aspects and analytical applications. Journal of the Brazilian Society, 2003, 4(1): 198-219.

[16] GB/T15683-2008, 大米直链淀粉含量的测定. 北京: 中国标准出版社, 2008.

GB/T15683-2008, Determination of amylose content in rice. Beijing: China Standard Press, 2008. (in Chinese)

[17] GARRIDOVARO A, GARCIAOLMO J, FEARN T. A note on Mahalanobis and related distance measures in WinISI and The Unscrambler. Journal of Near Infrared Spectroscopy, 2019, 27(4): 253-258.

[18] BAI T C, WANG T, CHEN Y Q, MERCATORIS B. Comparison of near-infrared spectrum pretreatment methods for Jujube leaf moisture content detection in the sand and dust area of southern Xinjiang. Spectroscopy and Spectral Analysis,2019, 39: 1323-1328.

[19] 郑震璇. 近红外光谱分析技术在饲料加工行业的应用. 福建农机, 2019, 40(1): 24-27.

ZHENG Z X. Application of near infrared spectroscopy analysis technology in feed processing industry. Fujian Agricultural Machinery, 2019, 40(1): 24-27. (in Chinese)

[20] VAMADEVAN V, BERTOFT E. Structure-function relationships of starch components. Starch-Stärke, 2015, 67(1/2): 55-68.

[21] LEE J H, YOU S, KWEON D K, CHUNG H J, LIM S T. Dissolution behaviors of waxy maize amylopectin in aqueous-DMSO solutions containing NaCl and CaCl2. Food Hydrocolloids, 2014, 35: 115-121.

[22] BERTOFT E. Understanding starch structure: recent progress. Agronomy 2017, 7: 1-29.

[23] 郝勇. 近红外光谱微量分析方法研究[D]. 天津: 南开大学, 2009.

HAO Y. Research on near infrared spectroscopy microanalysis method[D]. Tianjin: Nankai University. 2009. (in Chinese)

[24] 梁晓燕, 吉海彦. 近红外光谱技术在农作物品质分析方面的应用. 中国农学通报, 2006, 22(1): 366-371.

LIANG X Y, JI H Y. Application of near infrared spectroscopy technology in crop quality analysis. Chinese Agricultural Science Bulletin, 2006, 22(1): 366-371. (in Chinese)

[25] 王家多, 周向阳, 金同铭, 胡祥娜, 钟娇娥, 吴启堂. 近红外光谱检测技术在农业和食品分析上的应用. 光谱学与光谱分析, 2004, 24(4): 447-450.

WANG J D, ZHOU X Y, JIN T M, HU X N, ZHONG J E, WU Q T. The application of near-infrared spectroscopy detection technology in agriculture and food analysis. Spectroscopy and Spectral Analysis, 2004, 24(4): 447-450. (in Chinese)

[26] 刘红梅, 肖正午, 申涛, 蒋鹏, 单双吕, 邹应兵. 稻米直链淀粉含量近红外检测模型的建立. 湖南农业大学学报, 2019, 45(2): 189-193.

LIU H M, XIAO Z W, SHEN T, JIANG P, SHAN S L, ZOU Y B. Establishment of near infrared detection Model of rice amylose content. Journal of Hunan Agricultural University, 2019, 45(2): 189-193. (in Chinese)

[27] 王勇生, 李洁, 王博, 张宇婷, 耿俊林. 基于近红外光谱技术评估高粱中粗蛋白质、水分含量的研究. 动物营养学报, 2020, 32(3): 1353-1361.

WANG Y S, LI J, WANG B, ZHANG Y T, GENG J L. Research on the evaluation of crude protein and moisture content in sorghum based on near-infrared spectroscopy technology. Chinese Journal of Animal Nutrition, 2020, 32(3): 1353-1361. (in Chinese)

[28] 巫小建, 曾凡荣, 岳文浩, 汪军妹. 大麦籽粒总淀粉含量近红外快速无损检测模型的构建. 浙江农业科学, 2021, 62(1): 40-41.

WU X J, ZENG F R, YUE W H, WANG J M. Construction of a near-infrared rapid non-destructive detection model for the total starch content of barley grains.Zhejiang Agricultural Sciences, 2021, 62(1): 40-41. (in Chinese)

[29] 韩浩楠, 王美娟, 赵训超, 鲁鑫, 周志强, 李明顺, 张德贵, 郝传芳, 翁剑峰, 雍红军, 李新海. 玉米粉淀粉含量近红外模型建立与优化. 玉米科学, 2020, 28(6): 81-87.

HAN H N, WANG M J, ZHAO X C, LU X, ZHOU Z Q, LI M S, ZHANG D G, HAO C F, WENG J F, YONG H J, LI X H. Establishment and optimization of near-infrared model of corn flour starch content.Maize Science, 2020, 28(6): 81-87. (in Chinese)

[30] KIM G, HONG S J, LEE A Y, LEE Y E, LM S. Moisture content measurement of broadleaf litters using near-infrared spectroscopy technique. Remote Sensing, 2017, 9(12): 1212.

[31] CHEN J M, LI M L, PAN T, PANG L W, YAO L J, ZHANG J. Rapid and non-destructive for the identification of multi-grain rice seeds with near-infrared spectroscopy. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2019, 219(5): 179-185.

Construction and Application of Detection Model for Amylose and Amylopectin Content in Sorghum Grains Based on Near Infrared Spectroscopy

ZHANG BeiJu, CHEN SongShu, LI KuiYin, LI LuHua, XU RuHong, AN Chang, XIONG FuMin, ZHANG Yan, DONG LiLi, REN MingJian

College of Agriculture, Guizhou University/Guizhou Branch of National Wheat Improvement Center, Guiyang 550025

【】Sorghum is one of the main raw materials for wine making and feed. The ratio of amylose content to amylopectin content in its grains is closely related to liquor quality and feed quality. Traditional chemical detection methods of sorghum components are no longer suitable for high-throughput testing. Modified PLS is used to perform spectral preprocessing, score processing and result monitoring on the near-infrared spectra of sorghum samples to establish sorghum grain amylose and amylopectin. The prediction model of amylose content aims to obtain a fast, efficient and low-cost detection method, laying the foundation for genetic improvement and quality analysis of sorghum. 【】From 450 sorghum resources, 112 representative varieties were selected as calibration set and verification set. The chemical values of amylose and amylopectin content in 112 sorghum varieties were measured, and near-infrared spectra with wavelengths of 850-1 048 nm were collected, and the spectrum was scanned data matrix and chemical data calculated score (PL1) processing and interpreting the differences between the spectra, and eliminating abnormal species with Global H (GH) greater than 3 to reduce modeling errors. Modified PLS regression technology is used for modeling, and different calibration models are established through different scattering processing and derivative processing methods. Determine the best model according to the cross-validation standard deviation (SECV) and cross-validation correlation coefficient (1-VR), and perform result monitoring and non-parametric testing to evaluate the predictive performance of the model.【】The near-infrared prediction model SECV of amylose is 2.7732, 1-VR is 0.9503, and the correlation coefficient (RSQ) is 0.9688. Bias=0.229<2.7732(SECV)×0.6, that is, the deviation (Bias) is less than 0.6 times of the calibration model SECV; the predicted standard deviation (SEP)=1.266<2.7732(SECV)×1.3=3.60516, that is, the SEP is less than the calibration. The model SECV is 1.3 times, 11.01(SD)-10.81(SD)=0.2<11.02(SD)×0.2=2.204, that is, the difference between the standard deviation (SD) of the chemical data and the near-infrared prediction data is less than 20% of the chemical data SD. The near-infrared prediction model SECV of amylopectin is 1.7516, 1-VR is 0.8818, and RSQ is 0.9127. Bias=-0.014<1.7516(SECV)×0.6 means that Bias is less than 0.6 times of SECV of calibration model, SEP=1.316<1.7516(SECV)×1.3=2.2708 means SEP is less than 1.3 times of SECV of calibration model, 5.30-5.29=0.01<5.30×0.2=1.06, that is, the difference between the chemical data and the near-infrared prediction data SD is less than 20% of the chemical data SD. Using 30 sorghum grains outside the model to conduct a two-pair sample non-parametric test on the validity of the model, the results showed that the difference between the measured and predicted values of amylose content and amylopectin content was not significant (=0.262>0.05;=0.992>0.05).【】The established near-infrared model has high accuracy and good stability, can accurately and quickly detect the content of amylose and amylopectin in sorghum, and can be used for the genetic improvement of sorghum and the detection of sorghum quality.

near infrared spectroscopy; sorghum; amylose; amylopectin; improved least squares method

10.3864/j.issn.0578-1752.2022.01.003

2021-06-01;

2021-07-30

贵州省特色杂粮现代农业产业技术体系建设专项(黔财农[2019]15号)、酒用高粱良种繁殖及配套栽培技术试验研究(700484192124)、贵州酒用高粱品种选育研究(GNW2020GD001)

张北举,E-mail:743665191@qq.com。通信作者任明见,E-mail:rmj72@163.com

(责任编辑 李莉)

猜你喜欢

直链支链定标
一类1T2R并联机构拓扑结构综合及优选
高直链玉米淀粉在食品、食品材料及保健食品中的应用进展
近红外定标法分析黏/锦/氨三组分纤维含量
环境减灾二号A/B卫星在轨定标模式设计与验证
高分六号高分辨率相机在轨几何定标方法与精度验证
采用分光光度法分析酱香型白酒生产用糯高粱中淀粉的研究
高直链淀粉材料改性及应用研究进展
糯米和大米
浴砖清洗剂
烷烃系统命名叶1的“多”“简”“小”原则