单粒玉米种子水分近红外快速无损测定模型研究
2020-10-22吴静珠李江波刘翠玲孙晓荣
张 乐 吴静珠 李江波 刘翠玲 孙晓荣 余 乐
(北京工商大学食品安全大数据技术北京重点实验室1,北京 100048) (北京农业智能装备技术研究中心2,北京 100097)
玉米是目前我国种植面积最广、产量第一的农作物。随着玉米机械化单粒精量播种技术的引入,我国玉米种植模式发生了深刻的改变[1]。单粒精量播种技术较传统播种模式更有利于机械化操作,省工、省种、高产,但是对每颗种子都提出了更高的检测需求。根据GB 4404.1—2008[2],水分是我国农作物种子质量四大必检项目之一。因此单粒玉米种子水分的快速、高通量、无损检测对于单粒精量播种具有重要的现实意义。
GB/T 3543.6—1995《农作物种子检验规程 水分测定》中显示,种子水分测量方法有低恒温烘干法、高温烘干法、高水分预先烘干法[3],这些方法测试精度高但普遍存在试样破坏性、耗时长、无法单颗测定等问题。近红外光谱(Near Infrared Spectrometry,NIR)技术以其快速、无损、绿色分析特点在种子质量检测领域迅速发展[4,5]。我国在2010年发布了玉米水分含量近红外法测定的国家标准用于玉米水分测定[6]。沈广辉等[7]将近红外光谱技术与偏最小二乘法结合建立了玉米籽粒中水分、粗蛋白、粗灰分和总能的定量分析模型,其中水分检测模型的预测集相关系数和均方根误差分别为0.76,2.41。肖青青[8]将近红外技术与等间隔组合偏最小二乘法结合建立了玉米粉的水分、粗脂肪的高性噪比近红外波长模型,其中水分检测模型的预测集的相关系数和均方根误差分别为0.943和0.278。国标制定和文献表明近红外光谱技术在玉米水分检测领域具有实际应用可行性,但已有研究的检测对象大都为经过粉碎的玉米或是多粒玉米,难以满足玉米精量播种技术对单粒种子水分的检测需求。
本研究重点探索将近红外光谱与化学计量学方法相结合,建立性能优秀的单粒玉米种子水分快速、无损检测定量检测模型,以期为玉米精量播种技术的推广和发展探索可行的检测手段。
1 材料与方法
1.1 实验材料
55组玉米样本品种包括中地77、沈玉29、中地168、强硕68、奔诚15和春育8。从每组样本中分别选取2个玉米籽粒,共计110份玉米样本。首先采用单籽粒采样附件扫描近红外光谱后, 再使用HB43-S卤素水分测定仪测定每组样本水分。
表1为110份玉米样本的含水量统计信息。按照3∶1的比例随机划分训练集和测试集,其中训练集样本82份,测试集样本28份。
表1 样本集统计信息
1.2 光谱采集
采用VERTEX 70傅里叶变换红外光谱仪[9]及单籽粒采样附件采集单粒玉米种子光谱,如图1所示。为减少装样引起的干扰,放置样本时统一将样本胚面朝下,样本朝向一致。仪器参数设定:波数范围为4 000 ~ 12 500 cm-1,分辨率为8 cm-1,扫描次数为64次。样本近红外光谱如图2所示。不同颗粒的玉米种子表面平整度不一且种子形态、种皮性质均存在明显差异,导致光谱采集过程中光反射、散射影响程度不同,从图2中也可以看出,样本集近红外光谱在整个谱区范围内离散度较大。但是所有样品的光谱趋势基本一致,玉米近红外光谱在波数为8 400、7 000、5 000 cm-1处有3个明显的特征峰。 其中8 400、7 000 cm-1处的特征峰为 O—H 键二级振动,5 000 cm-1处的特征峰为 O—H 键一级振动,均与玉米中水分含量有关。
图1 单粒玉米种子测样
图2 样本集近红外原始光谱
2 结果与讨论
2.1 单粒种子水分PLS线性模型的建立与优化
为了降低由种子形态等引起的光谱噪声干扰,选择采用合适的光谱预处理方法提升光谱质量。本实验采用OPUS 7.2软件,分析比较了一阶导、二阶导、归一化、消除常数偏移量、以及多元散射校正结合光谱波段自动谱区搜索组合所建立的模型性能,如下表2所示。
表2 基于不同光谱预处理组合的PLS模型性能比较
由表2可以看出,求导并不适用于单粒玉米种子光谱数据预处理,单粒种子光谱本身含有的噪声较大,求导更加剧了噪声的引入,因此大大降低了模型的准确性;多元散射校正可以有效消除近红外漫反射光谱中由于样品的镜面反射及不均匀造成的噪声[10],消除光谱的基线漂移现象及光谱的不重复性,因此基于多元散射校正相对其他预处理方法而言,建立的单粒种子水分模型性能较好,其训练集的相关系数为0.81,留一交互验证均方根误差(Root Mean Square Error of Cross Validation,RMSECV)为0.75;测试集的相关系数为0.93,预测均方根误差(Root Mean Square Error of Prediction,RMSEP)为0.86。实验结果表明基于PLS的单粒种子水分模型性能一般。
2.2 单粒种子水分SVM非线性模型的建立与优化
本实验基于PLS的多元线性校正建模方法建模效果不是十分理想,分析其原因可能是由于单粒玉米种子光谱采集时引入的非线性干扰导致的,因此本实验探索采用在小样本、非线性建模领域极具代表性的建模方法[11]——支持向量机(support vector machine, SVM)建立单粒种子水分近红外模型。
在Matlab2016中使用Libsvm3.1软件包,将原始光谱数据经过多元散射校正预处理后再进行训练和测试。支持向量机中常见的核函数有线性、多项式、RBF和Sigmoid核函数4种形式。为选择合适的核函数, 分别采用4种核函数建立SVM模型。运行结果如表3所示。通常情况下,相较于其他核函数,RBF核函数更适用于特征维数少、样本数量正常、没有先验知识的情况,RBF核函数的参数决定了它对于数据中的噪声有着较好的抗干扰能力[12]。从表3可以得出基于RBF核函数建立的模型训练集和测试集的准确性更高。实验采用网格搜索法确认了RBF的核参数,惩罚因子 C为1.174 1,核函数参数g为0.062 5。最终建立模型的训练集相关系数达到0.99,预测均方根误差为0.05;测试集相关系数达到0.96,预测均方根误差为0.71。相较于PLS模型而言,基于SVM的种子水分非线性检测模型性能更优。
表3 基于四种核函数的SVM模型性能比较
3 结论
本研究采用多种光谱预处理方法消除单粒种子采集光谱时由于颗粒形态等引起的噪声干扰,比较建立了基于PLS线性模型和SVM非线性模型的单粒玉米种子水分近红外检测模型。实验结果表明,光谱预处理结合SVM非线性模型可以有效降低单粒玉米种子近红外光谱采集时引入的非线性干扰,有助于提升单粒玉米种子水分近红外快速无损检测实际应用可行性,有望为玉米精量播种技术的推广和发展提供可行的检测手段。