不同生长年限林下山参的数字图像处理研究
2016-03-26石磊徐世义翟菲慕善学徐伟陈羽
石磊,徐世义,翟菲,慕善学,徐伟,陈羽
(沈阳药科大学,沈阳?110016)
人参为五加科植物人参(PanaxginsengC.A.Mey.)的干燥根及根茎。由于生长环境不同,人参的性状特征差异较大,形态上存在明显的区别,故有野山参、林下山参、趴货、园参等许多种类[1]。由于野山参资源稀少,林下山参的种植渐成规模并大量进入市场,且生长年限超过15年的林下山参已经接近野山参的水平[2],成为高档人参的主流品种,生长年限已成为衡量林下山参商品价值的主要因素之一。目前,对林下山参生长年限的识别仅靠传统的经验估算,即使具有一定实践经验的人也很难准确识别,且易出现争议。因此,人参市场急需一种快速、客观、准确的方法识别林下山参的生长年限。利用图像处理技术对农作物、农产品进行数字化识别的研究较多,目前已经在很多农作物上得到了应用,如甘薯、花生等[3,4]。对人参进行相关的研究未见国内、外文献报道。本实验采用Matlab对集安地区不同生长年限林下山参的数字化信息进行提取,构建数据库模型,摸索不同生长年限林下山参性状特征的变化规律,为今后进行林下山参的生长年限数字化鉴别研究奠定基础。
1 仪器与材料
佳能6D数码相机(日本佳能公司);戴尔Inspiron灵越14 7000(INS14PD-1848R)[戴尔(中国)有限公司];Matlab 2014a(美国MathWorks公司)。
林下山参,参龄11年、13年、15年、20年各40支,产自吉林省集安市清河镇乌拉山参场,原始播种为二马牙类型,经沈阳药科大学孙启时教授鉴定为林下山参。
2 方法
2.1 图像采集
相机与林下山参保持50cm的距离,在自然光的阴面采集图像[5],红色背景。
2.2 图像处理
2.2.1图像灰度化处理采集的林下山参原始图像属于24位真彩图,含有RGB 3个分量。为了减少后续处理计算量,对其进行灰度化处理。图像灰度化是图像增强的一种手段,可使图像动态范围加大,使图像对比度扩展,图像更加清晰,特征更加明显[6]。在Matlab数字图像处理工具箱中有自带的函数rgb2gray可以将RGB图像转换成灰度图像,其调用格式为I=rgb2gray(RGB)。
2.2.2灰度化图像二值化处理要提取图像中的数字特征信息,需要把林下山参灰度图片进一步进行二值化处理,Matlab数字图像处理工具箱中自带函数im2bw可以完成二值图像转化,其调用格式为BW=im2bw(I,LEVEL)。“LEVEL”的取值范围是0~1,其取值的大小直接影响二值图的效果,灰度直方图中2个波峰之间的波谷对应的横坐标为“LEVEL”的最佳值。以参龄20年的林下山参为例,灰度直方图波谷对应的横坐标为70,归一化后的值为0.45,所以该二值图的“LEVEL”值为0.45(图1)。从图1可以看出,该二值图轮廓清晰。
a.灰度直方图;b.二值图 a.Gray histogram;b.Binary Image
2.3 特征提取
2.3.1形状特征①芦:F1:芦最长轴与最短轴的比值,体现芦的粗细;F2:芦最长轴与园芦长轴的比值,体现园芦所占的比例。Fl、F2的特征综合反映林下山参的生长年限。②体:F3:根主体的长、宽比,体现是“顺体”还是“横体”;F4:根主体最长轴与芦长轴的比值。F3、F4特征综合反映林下山参体的灵活性。③须:F5:须的最长轴与根主体最长轴的比值。
采用最小矩形法,通过不断旋转来寻找图像轮廓的最小外接矩形,在每次旋转的图像中,进行行扫描和列扫描。如从左至右列扫描时,当碰到第一个像素的RGB值不是(255,255,255)时,可以确定为最左边界点,记录此列值;同理得出最右边界点,记录列值,计算两列值差值即为最小矩形长值,同理得出宽值。形状特征信息见表1。
表1不同生长年限集安地区林下山参形状特征信息
Table 1Shape feature informations of mountain cultivated ginseng with different growth preiods in Ji’an
表2不同生长年限集安地区林下山参纹理特征信息
Table 2Texture feature informations of mountain cultivated ginseng with different growth preiods in Ji’an
2.4 支持向量机识别
支持向量机(SVM)针对“二类模式”识别效果较好[8]。为增强实时性,选取基于RBF核函数的支持向量机,实现最佳性能。令U∈Rn,V∈Rn,g∈Rn,则RBF核函数定义为:K(U,V)=exp(-g-U-V-2)。其中:R表示向量空间,g为核函数的参数。
3 结果
不同生长年限集安林下山参形状特征、纹理特征集F∈(F1,F2,…,F11),作为识别集安地区林下山参属性集,给出不同生长年限集安地区林下山参的置信区间,对样本进行生长年限判别。样本为11年、13年、15年、20年生林下山参各40幅,以随机抽取的方式各选取20幅,共80幅的图像作为构建支持向量机的训练样本,其余各20幅,共80幅作为测试样本。支持向量机的输入为11个特征,进行林下山参生长年限判别,结果见表3。
表3集安地区林下山参生长年限判别结果
Table 3Growth period identification result of mountain cultivated ginseng in Ji’an
由表3数据可知,采用支持向量机方法对林下山参生长年限进行判别,在训练样本和测试样本均为20幅的情况下,其判别率均达到较为满意的效果,林下山参生长年限的判别率平均为88.75%。
4 讨论
4.1 由于本实验首次采用Matlab软件对不同生长年限林下山参进行数字化信息提取研究。因此,为了验证本实验的可行性,只选择了集安地区林下山参(种子为二马牙类型)的4种不同生长年限的林下山参,具有一定的局限性,只是初浅的尝试,实验结果是在已知林下山参生长年限情况下的判断,不是对未知林下山参生长年限的识别。而不同产地、不同品种的林下山参其芦长比、体态、色泽等指标与其生长的环境、土壤类型相关性较大,情况较为复杂。如何拓展本实验在所有产地的林下山参进行生长年限的识别,还需进行深入研究。
4.2 本实验在集安乌拉山参场采集林下山参时发现,相同年限的林下山参生长在不同树种、郁闭度、坡向其颜色特征也有差别。因此,色泽不易作为林下山参生长年限识别的指标,可作为不同类型人参的鉴别指标。
4.3 本实验在自然光的阴面采集图像,采集图像方法简单,实验提取的形态特征信息均为比值,不会因采集到的图像大小而影响计算结果,可稳定表现林下山参的形态特征。
[1]徐世义,李可欣,史德武,等.野山参、林下山参、趴货、园参性状及显微特征的研究[J].中草药,2013,44(16):2304-2307.
[2]赵亚宏,孙文采.集安市清河镇林下山参考察报告[J].人参研究,2012,(4):45-47.
[3]Tsakama M,Mwangwela A M,Manani T A,et al.Physicochemical and pasting properties of starch extracted from eleven sweet potato varieties[J].African Journal of Food Science and Technology,2010,1(4):90-98.
[4]杜晓晨,张幸,陆国权.基于图像处理的甘薯种类识别方法研究[J].中国粮油学报,2014,29(11):118-122.
[5]罗雪宁,彭云发,代希君,等.基于MATLAB的红枣图像处理研究[J].农机化研究,2015,(3):183-186.
[6]张俊杰,刘治远,杨艺,等.基于MATLAB平台吸虫虫卵图像自动识别研究[J].中国数字医学,2014,9(9):105-108.
[7]刘仲鹏,李文华.基于图像处理和特征优选的玉米品质识别[J].江苏农业科学,2015,43(3):382-385.
[8]刘丽娟,刘仲鹏,程芳.玉米生长期叶部病害图像识别预处理研究[J].河南农业科学,2013,42(10):91-94.