近红外光谱在麦粒内部害虫检测中的应用
2013-04-12剧森邱道尹张红涛王季琴
剧森 邱道尹 张红涛 王季琴
【摘 要】近红外光谱技术是一种新型的分析技术,它具有高效、快速、操作简单、稳定性好、无污染等优点,更重要的是它含有C-H、N-H、O-H等含氢基团基频和倍频的吸收带,可以用来检测淀粉含H化合物含量的变化;米象和谷蠧的幼虫在麦粒内部生长,使麦粒内部的淀粉和蛋白质等含量发生了变化,而这些变化必然会引起近红外反射光谱吸收率发生变化,因此,用近红外光谱是可以检测到麦粒内部是否有害虫。
【关键词】近红外;检测;麦粒
0.引言
我国不仅是世界上最大粮食生产国,也是是粮食储藏大国,每年库存量高达年产量的一半以上[1],因此,做好粮食储备具有非常重大的意义。米象、谷蠹等蛀食性害虫直接危害完整粒,成虫不仅蚕食麦粒,其幼虫在麦粒内部侵蚀胚乳和胚,很难从外部可视化检测,而且其排泄物、尸体、皮壳等还会对粮食产生严重的污染。由此可见,麦粒内部害虫造成的危害是非常大的,并且,检测比较困难的。
麦粒中含有蛋白质、脂肪、糖、淀粉和纤维等有机成分,它们在近红外区域有丰富的吸收光谱,每种成分都有特定的吸收特征,这些吸收特征为近红外光谱定量分析提供了依据。
1.材料和方法
1.1试验材料准备
试验以米象和谷蠧为试验对象,试验所用小麦是新夏小麦,淘洗干净后放入烘烤箱里烘到含水量15%左右。把200头健康的米象成虫与300克小麦混合,放在30摄氏度、湿度70%恒温恒湿箱里培养15天,然后把成虫和小麦分离出来。从培养用的麦粒中每份挑选出300颗完整和300颗受害虫用于近红外相机拍摄,其中每份样品的80%用做试验,20%用做测试。
1.2试验方法
从一个样品中随机挑选出300粒麦粒,用近红外相机进行扫描。每五个麦粒为一组,摆放在黑色塑料板上,摆放的时候应该注意小麦不能有叠加,以免在分析时产生干扰,然后把塑料板移到近红外相机拍摄区域进行扫描,扫描的波长在1000~1600nm。
2.数据分析
由于传感器的缺点,大部分相机都有几个不敏感的像素点,可以导致获取的高光谱图像存在噪声,但是采用1×5窗口的中值滤波可以予以去除。通过执行MATLAB码,查看原图像。已扫描的高光谱图像的数据的保存形式是矩阵形式,这时需要转换成灰度图像。使用MATLAB中的bwlabe函数功能,通过自动设置临界值,把每个图像转换成二值图像。MATLAB内部含有多元图像分析系统,可以用来分析图像中标记的每个麦粒。多元图像分析系统是基于主成分分析(PCA)。一个简单的多元图像含有二个像素坐标(宽和高)和一个变量坐标(波形值),构成一个三维数组(超立方体)。每隔60个波长,把所有麦粒的按照像素强度(反射比)重新排列成一纵列,那么超立方体数据就被重构成一个二维数组。这个二维数组可用一个k×60 表示,其中K是被标记的麦粒的总的像素数目。然后再用主成分分析法重构每个麦粒的二维数据组。
最有效的波长应该与选择的第一主成分和第二主成分的最高因子载荷相一致,用于特征提取。从图像中提取的6个统计图像特征(最大值,最小值,中值,平均值,标准方差,方差)应与有效波形一致。从变换后的图像中每个有效波长提取10个直方图特征,然后把这个特征均匀分成10组映射在0和1之间。这些特征可以作为不同判别分类器的输入。运用多种统计判别分析(线性,二次方程式,马氏距离)来开发不同的判别算法。
最有效的波长应该与选择的第一主成分和第二主成分的最高因子载荷相一致,用于特征提取。从图像中提取的6个统计图像特征(最大值,最小值,中值,平均值,标准方差,方差)应与有效波形一致。从变换后的图像中每个有效波长提取10个直方图特征,然后把这个特征均匀分成10组映射在0和1之间。这些特征可以作为不同判别分类器的输入。运用多种统计判别分析(线性,二次方程式,马氏距离)来开发分类算法。线性判别分析(LDA)分类器是以贝叶斯标准合并协方差。在生物应用方面,数据不可能总是服从正态分布,因此合并协方差并不能得到适当的分类。二次方程判别(QDA)分类器应用每类的协方差计算,而不是合并它们。如果每类的协方差相等,那么线性判别分析分类器和二次方程判别分析分类器很可能得到同样的分类结果。马尔科夫判别分析分类器是线性判别分析分类器的一个简化模型,并且假设已知组有相等的先验概率。如果数据呈椭圆分布并且未知样品所在组具有最小马尔科夫距离,那么马尔科夫判别分析分类器是一个很好的分类器。
3.结果和讨论
在高光谱处理时,第一主成分和第二主成分因子载荷的累积贡献分别为94%和5%用于波形的提取。在1101,69和1305.05nm处的二个波长与第一主成分的最高因子载荷相一致,在1447.46nm处的波长与第二主成分的最高因子载荷相一致,可以作为特征波长进行特征抽取。在分类中,总共提取和使用48个特征(6个统计特征,每个波长10个直方图特征)。在1100~1300nm范围内的波长吸收带与C-H第一、第二倍频和C-H化合带相一致,因此这个范围内的波形可以被淀粉颗粒吸收。与完整麦粒相比,被粮虫侵食过的麦粒的淀粉含量减少了,这是由于粮虫在生长的过程中消耗了淀粉。完整麦粒的胚芽区域呈暗黑色,但是大部分被侵害的麦粒的胚芽区域不明亮,较暗部位是被侵蚀区域,实际的灰度图像是不能显示出完整麦粒和被侵蚀麦粒之间的差别。
4.结论
在1000~1600nm波长范围内,二个波长(11101.69nm和1305.5nm)与第一主成分分析的最高因子载荷相一致,可以用来设计最佳分类器;第二个选择的波长与第二主成分分析的最高因子载荷相一致,但是不能明显提高分类器的精确性。合并统计特征和直方图特征可以最大程度的提高分类器的精确性,使用线性判别分析分类器和二次方程判别分析分类器可以很好的判别出麦粒是否受粮虫侵食,判别率可达85%~100%,麦粒的姿态对分类器设计的影响不大,因此,近红外高光谱图像可以从麦粒判别出麦粒是否受粮虫侵食。
【参考文献】
[1]陆良怒.中国农业新发展与食物安全[EB/OL].http://www.sfncc.org.cn/.
[2]丁声俊.十亿饥饿人口的警示[N].人民日报,2009-10-15.
[3]毛罕平,张红涛.储粮害虫图像识别的研究进展及展望[J].农业机械学报,2008,39(4):175-179.
[4]Singh C B,Jayas D S,Paliwal J,et al.Detection of insect-damaged wheat kernels using near-infrared hyperspectral imaging[J].Journal of Stored Products Research.2009,45(3):151-158.
[5]张红涛,胡玉霞,毛罕平.基于SVM的储粮害虫图像识别分类研究[J].农机化研究,2008,30(8):36-38.
[6]张红涛.储粮害虫图像识别中的特征提取研究[D].郑州:郑州大学电气工程学院, 2002.