不同种皮颜色花生糖含量近红外模型的构建
2022-09-05侯名语崔顺立穆国俊刘盈茹李秀坤刘立峰
陈 淼, 侯名语, 崔顺立, 李 振, 穆国俊, 刘盈茹, 李秀坤, 刘立峰
华北作物改良与调控国家重点实验室, 华北作物种质资源研究与利用教育部重点实验室,河北省作物种质资源实验室, 河北农业大学农学院, 河北 保定 071001
引 言
花生是我国重要的经济作物, 年均总产量已达1 500万吨, 约占世界总产的40%, 其中用来榨油的约占年产量的60%, 约30%的花生籽仁加工成喜闻乐见的小食品或直接被人们食用[1]。 花生籽仁中的糖含量是影响食味品质的重要指标, 直接影响消费者的口感和花生的经济价值。 当花生籽仁中蔗糖含量达到6%以上时, 口感较好。 已有研究结果表明花生籽仁中的总糖含量、 可溶性糖含量和蔗糖含量具有种质差异。 李威涛[2]等采用高效液相色谱法检测到28份花生品种的蔗糖含量为1.14%~8.38%。 Hou等[3]测定河北花生种质57份, 总糖含量为7.81%~18.01%。 通过鉴定花生籽仁中各类型糖含量, 可筛选和培育到高糖含量的种质, 满足消费者的需求。
鉴定花生糖含量最常用的方法有三种, 分别为比色法、 近红外光谱法和示差折光法。 其中近红外光谱分析法具有高效、 快速和不损伤种质等特点, 在农作物育种研究中已经得到广泛应用[4-5]。 在花生种子各成分含量鉴定上, 已建立了脂肪含量、 各脂肪酸含量和蛋白质含量的近红外模型。 秦利[6]、 唐月异[7]和雷永[8]等分别采用72份, 167份及185份基因型为材料, 分别构建了适应于瑞典波通DA7200近红外分析仪、 Matrix-Ⅰ型傅里叶变换近红外光谱仪及Spectra Star XL 近红外光谱仪的花生籽粒蔗糖含量测定的近红外模型。 花生籽仁总糖含量和可溶性糖含量鉴定的近红外模型鲜有报道。
广泛种植的栽培花生品种多为粉色种皮, 但为了适应市场需求, 尤其是鲜食花生市场, 黑紫色、 红色种皮花生因其含有丰富的花青素类抗氧化物质, 更受消费者青睐。 高通量筛选不同种皮颜色的高糖含量花生基因型是花生食味品质育种的重要工作。 有研究表明样品外观颜色是影响近红外分析的重要因素之一, 按样品外观颜色分类定标(校正)更有利于提高模型的预测性能[9-10]。 已构建的花生籽粒蔗糖含量近红外模型[7-9]未涉及不同种皮颜色。
为更深入探索近红外光谱分析法在花生籽仁糖含量鉴定上的应用, 本研究选取不同种皮颜色的332份花生样品进行了可溶性糖、 蔗糖及总糖含量的测定, 采用近红外仪扫描样品的光谱, 构建了不同种皮颜色花生籽仁的糖含量近红外分析模型, 为高效选育食用型花生种质提供技术支撑。
1 实验部分
1.1 材料
选用232份以四粒红和冀农黑3号为亲本衍生的重组自交系群体和100份美国微核心种质为试验材料。 并在本实验室资源库中采用色差仪随机选取三种种皮颜色各15份品种做模型验证。 所用到的种子均为2020年9月收获于河北省河北农业大学清苑试验基地。
1.2 花生种皮色度值测定
采用日本KONICA MINOLTA公司生产的CR-10 Plus色差仪测定花生种皮的色度值, 每个花生基因型分别取三粒饱满, 无损坏的种子测定三次, 测定L*, a*, b*值, 取三次结果的平均值。 色差仪从L*(从黑到白, 0~100)、 a*(从绿到红, -a~+a), b*(从蓝到黄, -b~+b)3个方面分别评价果实颜色。
1.3 光谱采集
采用瑞典波通 DA7250 近红外分析仪(DA7250 Diode Array Analyzer)的SimplicityTM软件进行光谱信息采集, 如图1所示。 光谱仪扫描波长范围为950~1 650 nm, 环境温度在24~25 ℃, 样品在25 ℃左右恒温放置48 h以上, 以减少温度对样品的影响。 仪器开机预热30 min后, 每个样品取均匀饱满的种子装入样品杯中, 使表面平整。 扫描5次, 重复装样3次, 获得平均光谱用于建模。
图1 DA7250近红外分析仪
1.4 花生籽粒中的糖含量测定
参照侯名语等[11]方法进行样品前处理, 将采集光谱后的花生籽仁去种皮, 称取100 mg样品用JXFSTPRP-24(上海净信实业发展有限公司)砸样机砸碎, 加石油醚(沸程: 60~90)脱脂三次, 作为脱脂样品, 进行不同糖含量的测定。 所有糖含量测定分别进行三次生物学重复。
将准备的100 mg脱脂样品3份, 参照Hou[3]的3,5-二硝基水杨酸法测定花生籽粒中的总糖含量, 以葡萄糖为标准品。 参照王冬梅[12]的蒽酮比色法测定花生籽粒中的可溶性糖含量, 以蔗糖为标准品。 采用蔗糖含量检测试剂盒G0531W(苏州格锐思生物科技有限公司)进行样品的提取及测定。
1.5 模型构建与优化
采用挪威CAMO公司的化学计量学软件The Unscrambler X10.4构建模型, 将测得的糖含量化学值与采集的近红外光谱导入The Unscrambler X10.4软件, 采用多元散射校正(MSC)、 标准正态变量变换(SNV)、 一阶导数(1stDerivative, 1st-der)、 二阶导数(2ndDerivative, 2nd-der)、 S-G卷积平滑、 归一化处理等预处理方法减少噪声和误差对光谱的影响[6], 将预处理方法分别进行单一处理及复合处理, 筛选出最佳的预处理方法。 对预处理后光谱及化学值用偏最小二乘回归法(partial least squares regression, PLSR)建立定标模型。 检验时, 自动剔除较大剩余值的异常样品, 然后再经过反复交叉验证剔除异常值, 采用外部验证评价模型的稳定性。 模型的评价参数主要由决定系数(R2)和标准误差(RMSE)来衡量模型的预测精度[6], 相关系数高且标准误差小的模型稳定性好。
1.6 模型的外部验证
三种颜色种皮的花生品种(系)各随机选取15个, 采用建立的近红外模型检测其糖含量, 记录近红外模型的预测值和化学测定样品的各种糖含量。 比较近红外模型预测值与化学值的相关性和准确性。
2 结果与讨论
2.1 不同种皮颜色花生的划分
采用CR-10 Plus色差仪测定不同花生种皮的色度值, 由图2(a,b,c)所示, 将332份花生样品划分成了黑紫色, 红色和粉色三种不同颜色的种皮籽粒。 其中, 黑紫色种皮样品120份, 红色种皮样品80份, 粉色种皮样品132份。 花生不同种皮颜色(L*, a*, b*)最小值、 最大值、 均值以及标准差统计结果, 如表1所示。 从表1中可以看出, 不同种皮颜色综合色度E值的均值分别为10.64(黑紫色)、 25.74(红色)和29.23(粉色)。 随着色泽参数L*均值的增大, 种皮的颜色越亮; 随着色泽参数a*均值的增大, 颜色由浅红色变为深红色; 随着色泽参数b*均值的增大, 颜色由低亮度黄色转变为高亮度黄色。 并将三个种皮颜色的综合色差E值进行了多重比较分析, 发现三个种皮颜色间均表现为差异极显著, 说明采用颜色分类构建模型是有意义的。
表1 不同种皮颜色色度值的统计分析
图2 不同颜色种皮花生籽粒样品
2.2 不同种皮颜色花生籽仁光谱采集
采集的黑紫色种皮样品120份花生籽仁近红外光谱如图3所示, 红色种皮样品80份花生籽仁近红外光谱如图4所示, 粉色种皮样品132份花生籽仁近红外光谱如图5所示, 由图3—图5可见, 花生样品在950~1 650 nm范围内均有明显吸收峰, 每个样品存在多处吸收峰, 不同样品的吸收峰强度不同。 表明扫描的近红外光谱可以用于花生籽粒糖含量的定量分析。
图3 黑紫色样品的扫描光谱
图4 红色样品的扫描光谱
图5 粉色样品的扫描光谱
2.3 花生仁中糖含量的化学分析
采用比色法测定332份花生籽粒中的糖含量, 样品的化学测定结果如表2所示, 总糖含量范围在6.42%~39.71%之间, 其中黑紫色籽仁差异最大, 在6.42%~39.53%之间; 可溶性糖含量范围在2.19%~14.53%之间, 其中粉色籽仁差异最大; 蔗糖含量范围在0.92%~7.99%之间, 其中粉色籽仁差异最大, 在0.95%~7.99%之间, 不同颜色种皮的籽粒糖含量变异系数在33.03%~44.89%之间。 秦利[6]和雷永[8]等在建立花生蔗糖模型时其变异系数分别为19.30%和40.66%。 结果表明, 本试验选择花生材料的糖含量分布范围广, 变异系数大, 代表性好, 可以进行近红外光谱定标预测。
表2 不同种皮颜色花生籽仁糖含量的化学测定结果
2.4 花生籽仁糖含量预测模型构建
2.4.1 光谱预处理方法的选择
一般常用的光谱预处理方法有多元散射校正(MSC)、 标准正态变量变换(SNV)、 一阶导数(1stDerivative, 1st-der)和二阶导数(2ndDerivative, 2nd-der)、 S-G卷积平滑、 归一化处理(Normalize)、 基线校正(Baseline)等, 将其按基线校正, 散射校正, 平滑处理, 尺度与缩放等分别进行单一预处理, 两个预处理和三个预处理共计120种预处理方法对光谱进行处理。 根据相关系数(R2)及标准误差(RMSE)筛选出最佳的处理方法[13]。
本研究所建9个模型最佳光谱预处理方法如表3所示,均采用了两种以上的预处理方法, 以保障模型的适用性。 用得比较多的处理方法是Detrend, Normalizalion和SNV三种处理方法。 其中, 黑紫色花生总糖含量、 可溶性糖含量和蔗糖含量的模型、 红色花生蔗糖含量和总糖含量模型、 粉色花生总糖含量模型等6个模型用到了Detrend方法; 黑紫色花生总糖含量和蔗糖含量模型、 红色花生可溶性糖含量模型、 粉色花生可溶性糖含量和蔗糖含量模型等5个模型用到了Normalizalion方法; 黑紫色花生总糖含量和蔗糖含量模型、 红色花生总糖含量模型、 粉色花生总糖含量和蔗糖含量模型等5个模型用到了SNV处理方法。
表3 不同种皮颜色花生籽仁糖含量光谱值的最佳预处理方法及预测模型
2.4.2 花生籽仁糖含量定标模型的构建与验证
对不同颜色种皮花生中总糖含量、 蔗糖含量和可溶性糖含量的化学值和采集的近红外光谱数据分别进行拟合光谱处理, 采用偏最小二乘回归法(PLSR)的化学计量学方法建立定标模型, 反复采用内部交叉验证剔除异常值, 通过模型的决定系数(R2)和定标标准差(RMSE)衡量定标模型, 筛选最佳模型。 对没有进行定标模型建立的三个颜色各15份品种分别进行近红外分析和化学方法测定, 作为外部验证集, 进行模型预测。 样品的校正模型的相关系数分别如表3和图6(a—i, a1—i1)所示, 决定系数均大于0.88, 最大的是粉色种皮总糖含量的模型, 相关系数Rc可达0.925, 所建模型可以进行有效预测。
所建模型经外部验证, 各模型预测值与化学值的相关系数均在0.88以上(图6), 黑紫色花生总糖含量预测模型的预测值与化学值相关系数达到0.967[图6(c)]。 并计算了每个模型预测值与化学值之间的偏差, 偏差范围分别是-0.75%~0.41%(黑紫色蔗糖), -1.24%~0.85%(黑紫色可溶性糖), -3.32%~1.79%(黑紫色总糖), -0.5%~0.52%(红色蔗糖), -1.54%~0.44%(红色可溶性糖), -3.52%~3.18%(红色总糖), -0.79%~0.78%(粉色蔗糖), -3.34%~0.57%(粉色可溶性糖), -2.22%~2.43%(粉色总糖)。 9个模型预测值与化学值之间的偏差在-3.52%~3.18%之间, 相关系数Rp在0.892~0.967之间, 结果表明本研究所构建的模型预测结果准确, 可用于不同种皮颜色花生总糖、 可溶性糖和蔗糖含量的测定。
图6 不同种皮颜色花生籽仁糖含量的校正模型及预测模型
近年来, 近红外技术在品质筛选中得到了广泛的应用[4-5]。 与之前秦利[6]、 唐月异[7]和雷永[8]等建立的花生蔗糖含量的预测模型相比较, 本研究构建了总糖含量、 可溶性糖含量和蔗糖含量的近红外测定模型, 可更系统地综合评价花生籽仁的口感食用品质。 且采用色差仪将花生种质划分为粉色、 红色和黑紫色种皮花生, 更有利于特色食用性花生品种的培育。 本研究采用Perten公司生产的DA7250近红外光谱仪建立糖含量的预测模型, 分级清楚, 模型的适用性广泛。
3 结 论
基于色差仪对种皮颜色分级的基础上构建了黑色、 红色、粉色种皮的总糖含量、 可溶性糖含量和蔗糖含量近红外光谱模型, 定标模型相关系数最高达0.925。 在剔除样品颜色影响因素后, 所构建的模型可系统、 全面地反映花生籽仁中各糖类碳水化合物的含量。
本研究所构建的蔗糖、 可溶性糖、 总糖模型与同款机型上已有的蛋白质、 脂肪酸、 油酸、 亚油酸等模型可同步、 快速、 无损的整体评价花生基因型的品质, 为高通量花生品质鉴定研究提供技术支撑。