基于近红外光谱分析的高丹草种子发芽率检测研究
2022-02-17惠云婷王德成彭要奇王红达张海凤
惠云婷, 王德成, 唐 欣, 彭要奇, 王红达, 张海凤, 尤 泳*
1. 中国农业大学工学院, 北京 100083
2. 山东农业工程学院, 山东 济南 250100
引 言
近年来, 随着畜牧业的快速发展, 饲草料的需求也急剧增加, 饲草料的短缺已经成为制约畜牧业发展的重要因素之一, 亟待解。 高丹草(sorghum-sudan grass)作为一种新品种, 是由高粱(sorghum bicolor)和苏丹草杂交培育而成, 它结合了二者的优良特性, 富含粗蛋白及碳水化合物, 适合青贮, 且在干旱、 寒冷、 盐碱地等环境下抵抗能力强[1]。 高丹草的优良特性使其成为许多地区的家畜首选饲料。 高丹草的种植改变了一些地区的农业结构, 对于地区发展畜牧业有着突出的贡献。 优质的高丹草种子可有效促进畜牧业的发展, 发芽率是衡量种子质量的常规指标之一[2]。 研究表明, 长时间贮藏高丹草种子会影响种子活力, 发芽率也随之变化。 因此高效判断高丹草种子质量可有效促进畜牧业发展。
现阶段实验室检测种子发芽率多采用发芽试验法[8], 在人工气候培养箱内严格按照种子发芽技术规定的条件(包括湿度、 光照、 时间等)进行试验, 试验条件要求较高, 一般需要10~15 d, 周期较长, 且发芽试验对种子具有破坏性, 试验后的种子不能重复使用, 试验投入的人工成本及时间成本较高, 不能满足快速、 准确、 无损测试的要求, 也不能适应快速发展的畜牧业需求。 因此, 为降低成本, 提高检测速度及精度亟需一种无损、 快速且准确的发芽率的检测方法[3-4]。 近红外光谱技术的应用广泛, 可以得到有关物质的特征信息[5], 可以不破坏样品且无需利用化学试剂, 更高效、 成本更加低的进行样品分析[6]。 故而, 许多研究人员开始将这一技术应用到种子领域。
在农作物的营养检测方面, 近红外光谱技术[7]也展现出了独特优势, 如评估高粱内部成份含量[8]、 预测植物叶片含水率[9]、 小麦内在品质的无损检测[10-11]; 戴子云等利用近红外光谱技术对结缕草种子的标准发芽率进行分析, 并利用定量偏最小二乘法进行数据分析; 李毅念等为检测不同老化程度的杂交水稻种子的发芽率, 采集数据并进行建模, 校正预处理时采用了全波段和标准化+正交信号这种方法; 金文玲等设计并搭建了一套投射式近红外光谱检测系统, 结合光谱特性建立了主成分分析模型, 同时通过偏最小二乘法建立了不同年份水稻种子的活力判别模型, 研究结果表明, 水稻种子的活力梯度与其近红外吸收光谱的吸收峰值相关[12]。 国内外现有活力检测分析的研究对象主要是针对小麦和水稻, 鲜有高丹草种子发芽率分析的报道。 本工作针对高丹草种子检测发芽率存在的问题, 提出一种利用近红外光谱技术快速检测高丹草种子发芽率的方法。
采集2个品种的高丹草种子的近红外光谱, 同时进行种子发芽试验; 利用导数法对采集的光谱数据进行预处理, 并将预处理之后的数据采用支持向量机(SVM)建立高丹草种子发芽率检测模型, 以期分析高丹草种子发芽率的光谱特征, 提高发芽率检测的速度及精度, 从而为基于近红外光谱技术检测高丹草种子发芽率提供依据。
1 实验部分
1.1 材料
高丹草种子100份, 分别来自内蒙(50份)、 山东(50份), 随机选择相同粒数的种子进行发芽试验, 试验地点为中国农业大学牧草机械实验室。
1.2 光谱采集
图1所示为美国Unity Scientific 2600XT近红外光谱仪, 波长范围: 680~2 600 nm, 分辨率: 1 nm; 该仪器内含二极管阵列检测器检测固体样品的近红外光谱, 检测范围宽; 在食品、 农业、 医药领域得到广泛应用。
图1 近红外光谱仪
在测试样品前, 剔除杂物、 破损粒、 霉变粒等坏种粒; 称取相同质量[(8±0.1) g]的高丹草种子样品置于样品杯中, 倒入时, 高丹草的种子样品至样品杯的10 mL刻度处, 并通过旋转顶窗设计和漫反射的方式进行扫描。 重复扫描24次求取平均光谱。
1.3 种子发芽试验
根据农业部《农作物种子检验规程—发芽试验》(GB/T 2930.4—2001)标准, 进行高丹草种子发芽试验。 将培养皿清洗、 烘干, 然后在其中平铺两层滤纸, 将去离子水沿壁缓慢的滴入培养皿, 使滤纸完全浸湿, 并将筛选出的100粒高丹草种子均匀的放置在浸湿的滤纸上。 种子之间保持适当的距离, 避免过于紧密或者距离太大影响种子发芽率。 每组试验重复3次; 将培养皿放入培养箱(型号: BD-PRX, 南京贝帝实验仪器有限公司), 每天观察种子生长情况, 当芽长超过种子自身长度1/2视为发芽, 并记录发芽情况, 及时补充水分, 且对发芽数进行记录, 当实验进行至12 d时, 统计高丹草种子的总发芽数。
种子发芽率的计算如式(1)所示
(1)
式(1)中,GR为种子发芽率;N为供试种子粒数;n为发芽种子粒数。
1.4 数据分析与处理
采用仪器所带的UScanTM软件及美国Unity科学公司SpectraStar系列第二代仪器的日常定量分析软件, 使用matlabR2020a软件调用LIBSVM软件包。 预处理: 将采集样品的光谱数据利用导数法进行分析, 并将预处理之后的数据采用支持向量机(SVM)建立高丹草种子发芽率检测模型, 并且通过该模型对高丹草种子的发芽率进行快速检测与验证。
2 结果与讨论
2.1 样本的发芽率和近红外光谱
通过种子发芽试验得到的100份样品的发芽率分布于41%~64%之间(表1), 平均值为52.86%; 将试验的100份种子根据发芽率进行分类, 发芽率41%~52%属于第一类(类标签: 0), 52%~100%为第二类(类标签: 1); 按照7∶3的比例划分训练集和测试集, 可得训练集样本70份, 测试集30份。
表1 样本发芽率
近红外漫反射光谱如图2, 从图中可以看出, 不同种类的高丹草种子样品的光谱图像相似, 样品的漫反射吸光度值范围是0.19~0.94。 光谱图像有重叠, 在1 110, 1 200, 1 300, 1 460, 1 900, 2 000, 2 100, 2 200和2 500 nm附近有明显的吸收峰、 吸收谷存在。
图2 高丹草种子的原始光谱
2.2 不同光谱预处理方法对高丹草种子建模效果的影响
采集样品光谱信息的目的是采集该样品所包含的化学组成信息, 然而一些其他无关信息也有可能被采集, 因此对采集到的光谱进行预处理以去除电噪声、 样品背景和杂散光无关信息的干扰, 降低模型的复杂程度, 从而提高模型的稳定[13]。 在多种预处理方法[14]中, 使用导数光谱导数法来消除由于背景色或其他因素引起的光谱基线漂移或位移, 以区分重叠的波峰和波谷, 提高分辨率, 降低系统所带来的误差以及基线校正。 在本研究中, 由于采集的高丹草种子光谱段波长样点多且分辨率较高, 采用直接差分法求导, 以此减少误差。
表2 高丹草种子的光谱预处理结果
图3 一阶导预处理后的光谱曲线
图4 二阶导预处理后的光谱曲线
2.3 基于导数法-支持向量机的高丹草种子发芽率检测模型
支持向量机(support vector machines, SVM) 在解决小样本问题时有其独特之处[15], 其在优化问题时, 将训练误差作为约束条件, 相较于一些传统的分析样本的方法来说, 具有不可替代的优势性。 在对高丹草种子发芽率检测时, 该方法十分适用。 标记所有通过导数方法预处理的样本, 在训练SVM核函数及其参数时, 随机选取标记好的高丹草种子样本总量的十分之七, 剩下的数据样本用作测试集。 在本研究中, 使用MATLAB中调用的LIBSVM软件包来实现SVM训练和预测过程。
通过使用3折和10折交叉验证方法进行对比, 首先选择核函数类型为Rbf, 采用网格寻优的方法寻找支持向量机惩罚因子c和核函数g的最优值。 参数g定义了单个训练样本的影响大小, 值越小影响越大, 参数c在误分类样本和分界面简单性之间进行权衡。 在试验时选择随机抽样, 使参数c和g在[2-5, 215]的范围内进行网格优化, 并确定最佳参数, 如图5(3D视图)所示和图6(等高线图)所示。 准确率是指被分对的样本数除以所有的样本数, 错分率与正确率相反, 描述被错分的比例; 用准确率和错分率来评价分类模型。 结果表明, 3折和10折交叉验证对比, 折线对比区别较小, 检验准确率相同, 3折检验效率较高, 所以使用3折交叉验证。 参数c和g最优分别为2 896.309 4和0.5, 并将这两个最优参数训练支持向量机。 3折交叉验证下的最佳检测准确率为96.666 7%(29/30), 如图7所示分类情况检测的性能已经可以满足一定的要求。 结合预处理和3折交叉验证法, 建立导数法-支持向量机高丹草种子检测模型。
图5 网格搜索最佳c, g 3D视图
图6 网格搜索最佳c, g等高线视图
图7 测试集的实际检测和预测检测图