基于图像处理和特征优选的玉米品质识别
2015-07-31刘仲鹏李文华
刘仲鹏 李文华
摘要:为实现玉米籽粒的品种识别与品质评估,根据籽粒图像特征参数较多、参数间有一定相关性的特点,采集原始图像并进行必要的预处理,提取图像的颜色特征、形状特征及纹理特征共30个;以主成分分析法对指标集进行精简,在保证识别精度的前提下去除冗余信息,降低图像计算复杂度,使特征集精简为10个;以支持向量机进行分类识别,结果证实品种平均识别率为93.3%,不合格粒平均识别率为94.5%,识别精度较高,可满足玉米籽粒的无损识别、分类、检测及评估需求。
关键词:图像处理;特征优选;玉米品质识别;支持向量机
中图分类号: S126;TP391.4 文献标志码: A
文章编号:1002-1302(2015)03-0382-03
玉米籽粒的性状属性能够在很大程度上体现出其品种与品质,因此对玉米种子的形态特征进行提取,对其变化规律进行统计,具有比较重要的意义。传统的方法是采用人工方法进行识别及检测,效率低且准确度不足。随着信息技术在农业的应用逐步深入,当前已有不少研究成果引入图像处理技术对玉米籽粒的外部形态进行分析或统计[1-4],但这些成果多局限于籽粒的体积、密度、质量等常规指标。而玉米种子内部的生理生化特征与其形态特征、颜色特征及纹理特征等均有着密切的关系,这些变量参数较多,参数间又有一定的相关性,如何能够在优化精简指标的基础上保持足够的识别及检测的准确度,是一个亟待解决的问题。本研究首先对提取的玉米籽粒图像进行预处理,然后提取其颜色特征、形状特征及纹理特征等多个属性,以主成分分析的方法对指标进行精简,在保证识别精度的前提下去除冗余信息,降低图像计算复杂度,增加图像分析识别的速率,对品种进行分类与评价。本研究成果为农作物籽粒的无损检测提供了借鉴。
1 材料与方法
1.1 材料
1.1.1 样本采集
以华北地区比较常见的沈玉26、中地77、博诚6等3个品种作为样本,3类种子的外观彼此较类似,色调基本是黄色的。
1.1.2 图像采集设备
设计如图1所示的种子图像采集设备。其中,摄像孔的直径为5 cm,升降杆可以在25~40 cm之间调节,光源为LED灯,以普通尼康数码相机作为采集器件,主光源可以选择LED灯,也可以选择相机闪光灯,本试验选择了8×8阵列LED灯,调节角度之后使图像不存在阴影。
1.2 方法
1.2.1 图像预处理
1.2.1.1 灰度处理
所采集的玉米种子原始图像属于24位真彩图,含有RGB 3个分量。为了使后续处理计算量减少,对其进行灰度化处理,通过3個步骤实现:
(1)分别提取目标图像RGB的具体值;
(2)求出具体的灰度值gray;
(3)令R=B=G=gray,最终实现图像灰度化。
灰度化的图像(部分)如图2所示。
1.2.1.2 中值滤波处理
在对玉米籽粒图像进行处理时,还应考虑到原始图像中可能由于一些外部干扰而掺杂的噪声成分[5]。噪声的存在会对图像质量造成比较直接的影响,进而降低籽粒各类特征的提取准确性[6-7]。因此,本研究在灰度预处理的基础上,继续以中值滤波对图像进行进一步处理。中值滤波的主要原理是,将图像分为不同的窗口S,窗口里的所有像素进行大小排列,将中位灰度值作为该窗口的灰度值。中值滤波已被证实能较为有效地避免图像细节的模糊,并滤除颗粒噪声及脉冲噪声,尽量保持图像边缘的有用信息。本研究将滤波模板定位于3×3,实现样本图像的增强。
1.2.2 图像分割
该步骤将玉米籽粒从图像背景中分离出来,以便于下一步的特征提取及分析。本研究分割图像采用的是阈值法,得到的是玉米籽粒的二值图像。对图像的每一个点,高于该阈值则取1,低于该阈值则取0。通过“试错法”可知,在阈值为0.4时可以较好地分割玉米籽粒目标。图3所示为经过阈值分割之后的玉米籽粒图像样本(部分)。
1.2.3 特征提取
对玉米籽粒样本图像的特征集F进行提取,选择三大类特征:形状特征、颜色特征、纹理特征。
1.2.3.1 形状特征提取
形状特征可以体现玉米籽粒的外形属性。对以下主要形状特征进行提取:
F1:面积——玉米籽粒投影图像包含的像素总数,是体现玉米种子品质的重要参量之一。
F2:周长——玉米籽粒投影图像轮廓线的长度,与F1特征一起来反映玉米种子的大小。
F3:圆形度——玉米籽粒的边缘与标准圆形的相似度,能够体现玉米种子是否规则。
F4:直径——玉米籽粒边界最小外接圆的直径。
F5:延伸度——玉米籽粒最长轴与最短轴的比值,体现玉米种子的形状。
每种玉米品种籽粒随机选取200粒,进行形状特征提取,分别得到5个特征值。以沈玉26为例,其形状特征如表1所示。
1.2.4 特征优选
对籽粒样本提取了大量特征之后,由于指标数目多,且有些指标之间具有较强的相关性,因此如果直接以所有指标进行识别,会由于数据的冗余而降低识别效率。
本研究引入主分量分析法进行特征优选。基本思路是:把待精简的所有指标表示为向量,对所有的特征数据进行降维处理,从而使这些特征属性表示为线性组合,选取前n个对识别效果影响最大的主成分,实现特征的优选。具体步骤如下:
(1)首先使各类特征数据标准化,避免量纲的影响:
2 结果与分析
2.1 玉米品种识别
不同品种的玉米籽粒在各类特征属性的统计值方面有着明显的不同,因此对玉米种子的品质评估前,应对其种类进行识别。结合本研究提取出的玉米籽粒形状、颜色、纹理特征集F∈(F1,F2,…,F30),以主成分分析法提取出其中的10个主成分F∈(F2、F1、F4、F5、F24、F25、F26、F13、F15、F3)来作为识别时所使用的玉米籽粒属性集,对样本进行品种识别。样本来自沈玉26、中地77、博诚6等3个品种,以随机抽取的方式选取50%(各100幅,共300幅)的图像作为构建SVM的测试集,其余50%(各100幅,共300幅)作为测试集。支持向量机的输入为10个主成分。进行玉米品种识别,识别结果如表6所示。
由表6数据可知,采用SVM方法对沈玉26、中地77、博诚6等3个品种的玉米籽粒进行种类识别,在训练样本和测试样本均为100的情况下,其识别率均达到较为满意的效果,其中沈玉26的识别率最高,达96%,平均识别率为93.3%。
2.2 不合格籽粒识别
对不合格籽粒进行自动识别,是玉米种子品质评估的重要步骤。不合格粒包括虫咬、霉斑、不完整、杂质(如石子)等等,本研究选取其中一些典型的不合格粒类型,包括霉变、不完整、破碎、石子等几种进行识别。SVM的输入为10个主成分F∈(F2、F1、F4、F5、F24、F25、F26、F13、F15、F3),识别率如表7所示。
由表7中数据可知,对霉变、不完整、破碎、石子等不合格粒以SVM识别,其识别率均较为满意,其中霉变粒识别率最高,达97.2%,石子粒识别率较低,为91.0%,平均识别率为94.5%。
可以证实本研究的特征优选方法能够应用于对玉米种子的品种识别与籽粒等级评估中。
3 结束语
如何能够以无损的方式实现农作物种子的快速准确检测,是我国粮食产业的一个关键问题。本研究在机器视觉下提取玉米籽粒的大量特征,并以主分量分析方法對这些特征进行简化,使识别算法的精度和效率得到提升,对作物种子的品质评估与品种识别具有比较好的借鉴意义。
参考文献:
[1]杨爱国,张世煌,李明顺,等. CIMMYT和我国玉米种质群体的配合力及杂种优势分析[J]. 作物学报,2006,32(9):1329-1337.
[2]杨国虎,欧阳一沁,李 新,等. 外引优异玉米种质形态性状的初步鉴定[J]. 种子,2006,25(9):100-102.
[3]Nelson S O. Dimensional and density data for seeds of cereal grain and other crops[J]. Transactions of the ASAE,2002,45(1):165-170.
[4]闸建文,陈永艳. 基于外部特征的玉米品种计算机识别系统[J]. 农业机械学报,2004,35(6):115-118.
[5]王 静. 基于图像处理技术的烟叶病害自动识别研究[D]. 昆明:昆明理工大学,2011.
[6]齐 龙,马 旭,张小超. 基于BP网络的植物病害彩色图像的分割技术[J]. 吉林大学学报:工学版,2006,32(S2):126-129.
[7]王惠明,史 萍. 图像纹理特征的提取方法[J]. 中国传媒大学学报:自然科学版,2006,13(1):49-52.
[8]刘丽娟,刘仲鹏,程 芳. 玉米生长期叶部病害图像识别预处理研究[J]. 河南农业科学,2013,42(10):91-94.