基于近红外与高光谱技术的小麦种子多指标检测方法*
2016-08-22吴静珠孙丽娟张泽宇
吴静珠, 刘 倩, 陈 岩, 孙丽娟, 张泽宇
(1.北京工商大学 计算机与信息工程学院 食品安全大数据技术北京市重点实验室,北京 100048;2.中国农业科学院 作物科学研究所,北京 100081)
基于近红外与高光谱技术的小麦种子多指标检测方法*
吴静珠1, 刘 倩1, 陈 岩1, 孙丽娟2, 张泽宇1
(1.北京工商大学 计算机与信息工程学院 食品安全大数据技术北京市重点实验室,北京 100048;2.中国农业科学院 作物科学研究所,北京 100081)
采集47份小麦样本的高光谱图像,提取感兴趣区内的平均光谱,结合反映小麦品质的水分、蛋白质和湿面筋三个指标基础数据,通过OPUS软件搜寻最佳的光谱预处理和波段组合,分别建立了三个指标的偏最小二乘法(PLS)定量分析模型。同时与采用近红外(NIR)光谱技术建立的三个指标的近红外模型进行比较,发现高光谱模型的各性能指标均明显优于近红外模型。结果表明:当被测样品为颗粒状且内部化学成分分布不均匀时,近红外模型的准确性和稳定性会受其测量条件的限制,而高光谱采样面积大,获取信息更全面,展现出强大的分析检测潜质,为小麦品质评价提供了新方法。
小麦品质; 高光谱; 近红外光谱; 偏最小二乘法
0 引 言
品质评价是小麦生产、收购、储运、加工和育种的重要技术依托,对国家粮食安全与经济发展有非常重要的影响[1]。其中,水分、蛋白质、湿面筋是小麦品质评价的重要指标。近红外(NIR)光谱技术具有操作简单、分析速度快、无损伤、多组分同时分析等优点[2],目前已广泛应用于小麦品质分析,并已出台近红外技术检测小麦水分、蛋白等指标的国家标准[3,4]。但近红外技术对于小麦等固体样品,多采用漫反射测量方式,极易受样品状态和装样条件的影响,且小麦籽粒内部各成分的空间分布极度不均衡,采样面积过小,则只能获得样品的局部化学信息,将造成较大的测试误差,模型的可靠性与稳定性也得不到保证。
高光谱成像技术[5]是近年来出现的将光谱与成像科学相结合的分析技术,既能获取被测样品在不同波长上的图像信息,又能获得不同空间点上的光谱信息,因而可以更全面地获取样本信息,有更高的分析检测潜质[6~8]。
本文以水分、蛋白质和湿面筋含量作为评价小麦品质的三个指标,采用高光谱技术建立小麦种子上述三个指标的定量分析模型并与近红外模型比较,推动小麦品质快检的发展。
1 材料与方法
1.1 实验材料
47份小麦样本由中国农业科学院作物科学研究所提供,每份样本对应不同的品种和产地信息。
1.2 化学值测定
小麦水分含量参照GB 5497—1985 《粮食、油料检验水分测定法》[9]中105 ℃恒重法进行测定,蛋白质含量参照GB/T 5511—2008《谷类和豆类氮含量测定和粗蛋白质含量计算(凯氏法)》[10]测定,湿面筋含量参照GB/T 14608—1993《小麦粉湿面筋测定法》[11]测定。
1.3 高光谱图像采集与处理
1.3.1 高光谱图像采集与标定
选用北京卓立汉光仪器有限公司GaiaSorter高光谱分选仪作为高光谱图像采集系统,如图1所示。采集过程和仪器参数设定如下:取每个小麦样本100粒平铺无重叠地放置于样品台上采集其高光谱图像,图像分辨率320像素×256像素点,光谱扫描范围876~1 729 nm,曝光时间25 ms,波段间隔3.3 nm。
图1 高光谱图像采集系统Fig 1 Hyperspectral image acquiring system
由于光源的强度在各个波段下分布不均匀和摄像头中暗电流的存在,造成光源强度分布较弱的波段所获得的图像含有较大的噪声。因此,需要对所获得的高光谱图像按下式进行黑白标定
(1)
式中Icorrection为校正后的光谱图像,Iraw为原始光谱图像,Iwhite为扫描反射率为99 %的标准白板得到的白板标定图像,Idark为关上光源,拧上镜头盖后采集的黑板标定图像。
1.3.2 高光谱特征提取
首先,为了减少小麦样本内部成分分布不均匀性对测定结果的影响,选取样本全区域作为感兴趣区;然后,在样本与背景区分明显的波段下(实验选取波段为1 026.5 nm)利用最大方差自动取阈法[12]提取样本轮廓图像,依次在256个波段下提取样本轮廓范围内的反射率平均值作为该样本的光谱信息,如图2所示。
图2 1 026.5 nm波段的灰度图像、轮廓图像和提取的高光谱Fig 2 Grayscale image at 1 026.5 nm,outline image and extracted hyper-spectrum
高光谱仪在其测量临界区有较强的机器噪声,因此,截去两端噪声严重波段,取939~1 692 nm范围内高光谱进行分析。
1.4 近红外光谱采集
采用德国布鲁克公司的VERTEX 70傅立叶变换近红外光谱仪扫描小麦样本的近红外光谱。采用大样品杯旋转采样方式,装样前仔细筛查剔除夹杂物和空粒。扫描频率范围设定在939~1 692 nm,扫描次数为64次。47份小麦样本的近红外光谱如图3所示。
图3 小麦样本的近红外光谱Fig 3 NIR spectra of wheat seed samples
1.5 模型评价
根据模型的决定系数(R2)、交互验证均方根误差(root mean square error of cross validation,RMSECV)、预测均方根误差(root mean square error of prediction,RMSEP)和相对分析误差(residual predictive deviation,RPD)评价模型性能。
2 结果与分析
2.1 样本统计信息
47份小麦样本的水分、蛋白质、湿面筋参考值统计信息如表1所示。
表1 样本参考值统计信息(%)Tab 1 Statistic information of reference value of samples
2.2 模型建立与对比
对47份样本按照Kennard-Stone法以35∶12的比例划分校正集与预测集,利用Bruker OPUS定量分析软件分别筛选出近红外光谱和高光谱对应的最佳光谱预处理方法和建模波段,结合偏最小二乘算法(partial least squares,PLS)建立小麦水分、蛋白质、湿面筋含量的最优近红外模型和最优高光谱模型并进行比较,如表2所示。
表2 三个指标最优高光谱模型与近红外光谱模型比较Tab 2 Comparison between the optimal hyperspectral and NIR models of three indexes
分析表2可知,与近红外模型相比,高光谱模型的决定系数较高,预测误差较小,且模型的RPD值较大,说明高光谱模型的性能明显优于近红外模型,且模型的准确性和预测能力较高,可用于精确的定量分析。
结果表明:高光谱成像技术可以很好地用于小麦种子品质的评价,且比近红外分析方法有较大的优越性。分析原因,近红外光谱是通过漫反射积分球测样,由于光斑面积有限,通过旋转方式采样的面积也仅是一个环状区域,而小麦种子颗粒不均匀且内部成分分布极不均衡,近红外光谱受其采样方式的限制往往只能获取样本局部的信息,造成光谱代表性低,模型稳定性不能保证。而高光谱成像技术是通过面扫描方式得到一堆平铺开的小麦种子的图像,再针对性地从图像上选定目标区,获取每像素点的光谱信息,光谱代表性更强,因而可以更精确、全面地反映出样品内部的化学成分信息,所建的模型的性能更好。
3 结 论
采用高光谱技术,选择最佳的光谱预处理方法和波段区间结合偏最小二乘法分别建立了小麦种子中水分、蛋白质、湿面筋三个指标的定量分析模型,并与对应的近红外光谱模型进行比较。结果表明:高光谱模型的各性能指标均明显优于近红外模型,更适用于小麦品质的精确评价。后期可以尝试针对单籽粒种子进行品质检测,用于满足育种应用需求,并进一步结合数字图像信息对籽粒的形态学特征信息,如大小、饱满和干瘪以及虫害等进一步探索。
[1] 孙 辉,尹成华,赵仁勇,等.我国小麦品质评价与检验技术的发展现状[J].粮食与食品工业,2010(5):14-18.
[2] 陆婉珍.现代近红外光谱分析技术[M].北京:中国石化出版社,2006:9-11.
[3] GB/T 24898—2010.粮油检验小麦水分含量测定近红外法[S].
[4] GB/T 24899—2010.粮油检验小麦粗蛋白质含量测定近红外法[S].
[5] 丁 冬.高光谱成像技术及其在农产品检测中的应用[J].科技信息,2013,35:72,98.
[6] 李美凌,邓 飞,刘 颖,等.基于高光谱图像的水稻种子活力检测技术研究[J].浙江农业学报,2015(1):1-6.
[7] 邓小琴,朱启兵,黄 敏.融合光谱、纹理及形态特征的水稻种子品种高光谱图像单粒鉴别[J].激光与光电子学进展,2015(2):128-134.
[8] 贾仕强,刘 哲,李绍明,等.基于高光谱图像技术的玉米杂交种纯度鉴定方法探索[J].光谱学与光谱分析,2013(10):2847-2852.
[9] GB/T 5497—1985.粮食、油料检验水分测定方法[S].
[10] GB/T 5511—2008.谷物和豆类氮含量测定和粗蛋白质含量计算凯氏法[S].
[11] GB/T 14608—1993.小麦粉湿面筋测定法[S].
[12] Rafael C G,Richard E W,Steven L E.Digital image processing using Matlab[M].Beijing:Publishing House of Electronics Industry,2005:305-307.
Multi-index detection method of wheat seed based on NIR and hyperspectrum technology*
WU Jing-zhu1, LIU Qian1, CHEN Yan1, SUN Li-juan2, ZHANG Ze-yu1
(1.Beijing Key Laboratory of Big Data Technology for Food Safety,School of Computer and Information Engineering,Beijing Technology and Business University,Beijing 100048,China;2.Institute of Crop Science,Chinese Academy of Agricultural Sciences,Beijing 100081,China)
hyperspectral images of 47 unit wheat seed samples are collected,and average spectrum information is extracted within the range of interest.Combined with three index basic data of moisture,protein and wet gluten content reflect the quality of wheat seed,partial least squares(PLS)quantitative analysis models of the three index are built separately the optimal spectral preprocessing and waveband combination is searched by OPUS software.And by comparing the hyperspectral models with the NIR models,it is found that the performance index of hyperspectral model is better than that of NIR model.The results show that,when the sample is granular and its chemical composition inside distributes unevenly,the accuracy and stability of the NIR model will be affected by the limitation of its measurement conditions,while hyperspectral technology exhibits larger sampling area,more comprehensive information, and stronger analysis potential, which provides a new way for wheat quality evaluation.
wheat quality; hyperspectrum; near infrared(NIR)spectrum; partial least square(PLS)
10.13873/J.1000—9787(2016)07—0042—03
2015—10—29
土壤植物机器系统技术国家重点实验室开放课题基金资助项目(2014—SKL—05);北京工商大学两科基金培育项目(19008001110);北京工商大学2015年研究生科研能力提升计划资助项目
O 657.3
A
1000—9787(2016)07—0042—03
吴静珠(1979-),女,江苏无锡人,博士,副教授,主要研究方向为基于分子光谱、成像技术的农产品与食品检测。