APP下载

基于选择性搜索的药用植物目标检测

2020-08-13孟令涛孙国强

软件 2020年6期

孟令涛 孙国强

摘  要: 药用植物目标检测可以有效应用于药用植物的图像识别以及图像的语义分割。文章对已有的算法做了优化,使其对自然环境下的药用植物目标检测更为准确,提出了一种基于选择性搜索的目标检测算法。该算法首先对药植图像进行高斯滤波去噪,并对图像做归一化预处理。对预处理后的图片使用基于图的图像分割算法进行原始分割区域的划分,计算相邻区域间的颜色、纹理、大小和交叠相似度。最后根据相似度进行区域合并,最终得到目标区域。文章图片数据集来自PPBC中国植物图像库以及作者实地拍摄。实验结果表明,该算法对有花植物检测得分达到84.3,叶片植物检测得分达到67.86,平均检测得分为76.08,较原选择性搜索算法提升12.64。此外,该算法不需要训练,计算简单,适用性更强。

关键词: 药用植物目标檢测;选择性搜索;语义分割;区域合并

中图分类号: TP391.41    文献标识码: A    DOI:10.3969/j.issn.1003-6970.2020.06.021

本文著录格式:孟令涛,孙国强. 基于选择性搜索的药用植物目标检测[J]. 软件,2020,41(06):96101

【Abstract】: Target detection of medicinal plants can be effectively applied to image recognition and semantic segmentation of medicinal plants. This article optimizes the existing algorithms to make it more accurate for the medicinal plant target detection in the natural environment, and proposes a target detection algorithm based on selective search. The algorithm first performs Gaussian filtering and denoising on the medicine plant image, and performs normalized preprocessing on the image. The pre-processed picture is divided into the original segmentation regions using a graph-based image segmentation algorithm, and the color, texture, size, and overlap similarity between adjacent regions are calculated. Finally, the region is merged according to the similarity, and the target region is finally obtained. The article picture data set is from the PPBC China Plant Image Library and the author field shooting. Experimental results show that the algorithm achieves a score of 84.3 for flowering plants, a leaf plant detection score of 67.86, and an average detection score of 76.08, which is 12.64 higher than the original selective search algorithm. In addition, the algorithm requires no training, is simple to calculate, and more applicable.

【Key words】: Medicinal plant target detection; Selective search; Semantic segmentation; Region merging

0  引言

中国拥有世界上最丰富的药用植物资源,对药用植物的发现、使用和栽培有着悠久的历史。我国地域辽阔,从寒温带直到热带,地形复杂,气候多样,是世界上植物种类最多的国家之一,世界已知植物共约27万种,我国存在约25700种,其中很多植物具有药用价值。20世纪80年代,我国曾进行过全面系统的资源调查,发现我国的药用植物资源种类包括383科,2309属,11146种,其中藻、菌、地衣类低等植物有459种,苔藓、蕨类、种子植物类高等植物有10687种。在这些药用植物中,临床常用的植物药材有70多种,其中300多种以人工栽培为主,传统中药材的80%为野生资源。[1][2]

中药材行业目前发展趋势迅猛,但是依然存在发展不平衡的问题,主要体现在专业人才不足,资源利用不全面。因为中医属于传统行业,更多地是利用“经验”进行知识的传播,近些年才有了科学系统的培养模式。自上世纪八十年代我国进行过一次全面的中药资源普查之后,到现在为止还没有再一次完成普查工作,导致对中药资源掌握不完全,不能有效利用。未能完成普查一方面是由于我国  国土面积辽阔,地形地势复杂,另一方面也是因为缺少相关人才以及技术设备,无法进行准确地识别。因此,高效的图像识别算法对目前而言仍有重要  意义。

目标检测一直是图像领域研究的热点问题,已经取得了很大进展。对野外环境下的药用植物的检测属于目标检测的范畴。Arbelaez等人[3]提出了一种MCG(Multi-scale Combinatorial Grouping)方法用于自上而下的分层图像分割和候选区域的生成,其首先开发了一种快速归一化的切割算法,提出一个能够有效利用多尺度信息的高性能分层分割器;Cheng等人[4]提出了一个简单而且鲁棒性强的特征BING(Binarized Normed Gradients),通过使用对象状态得分来协助检测对象。Mei[5]使用SVM(Support Vector Machine)训练的主动基础模型作为表示对象的稀疏编码模型,通过从多尺度图像金字塔滑动窗口来实现目标检测。钟必能等人[6]将选择性搜索方法和粒子滤波方法相结合,运用到了粒子的跟踪上。与传统的单一策略相比,选择性搜索提供了多种策略;与全搜索相比,又大幅度缩小了搜索空间。

针对以上问题,本文提出了基于选择性搜索的药用植物检测算法,旨在实现从野外实际环境下拍摄到的复杂背景图片中检测到药用植物位置。本文首先对采集到的图片通过图像预处理技术进行预  处理;然后使用改进后的选择性搜索算法对预处理后的植物图像进行目标区域的划定并在原图上标记;最后验证标记区域与实际目标所在区域的定  位差异,得到图像检测得分,用来判断该算法的有效性。

1  算法流程

1.1  药用植物图像预处理

高斯滤波是一种线性平滑滤波,是对整幅图像进行加权平均的过程,具体操作是:用一个模板(或称卷积、掩模)扫描图像中的每一个像素,用模板确定的邻域内像素的加权平均灰度值代替模板中心像素点的值。本文采用离散化窗口滑窗卷积的方法,利用高斯核完成卷积操作。为简化计算,将去噪后的图像归一化为512*512。

1.2  选择性搜索算法

选择性搜索算法[8]是一种经典的基于区域的图像分割算法,用于为物体检测提供候选区域,速度快,召回率高。首先是利用经典的基于图的分割算法[14]得到一些原始区域,再计算图像相邻区域内颜色、纹理等特征相似度,合并相似度最高的两个区域后迭代计算,获取数量较少而召回率较高的目标区域,缩小搜索范围,从而获得了若干个可能的目标区间。本文选择性搜索算法应用步骤如下:

(1)对预处理后的图像,利用基于图的图像分割算法(Graph-Based Image Segmentation)将图像分割为原始区域 。

(2)对于相邻区域,计算之间的颜色、纹理、大小以及吻合相似度 ,相似度集合为   。

(3)将相似度集合 中相似度最大的值 所對应的两个区域 和 ,合并为一个区域 ,将其加入区域集合 ,删除相似度集合 中  有关的相似度,计算 与相邻区域的相似度,并加入相似度集合 。

(4)重复步骤(3)直至 ,然后遍历区域集合 ,对于分辨率不足2000、宽高比大于1.4的候选区域做删除处理。此时筛选完毕的区域集合 即为图像最终的分割区域,获取的区域集合 中每个区域所对应的外界矩形,即为可能的目标区域。

本文利用基于图表示的图像分割算法获取初始分割区域,以图论为基础,将相邻像素的间的欧氏距离作为变的权值,通过最小生成树和K值确定区域大小,从而获得具有相似特性的区域。该方法可获取具有高相似性的分割区域,但分割区域过于精细,难以获取完整目标,因此本文利用初始分割区域相邻区域间的颜色、纹理、大小以及交叠相似度对初始分割区域进行合并。

1.3  算法性能评估

2  实验过程

为了验证药用植物检测算法的有效性,本文设计实验过程如下:(1)数据集采集与预处理;(2)实验环境搭建;(3)实验结果与分析。

2.1  数据集采集与预处理

通过中国植物图像库网站爬取,以及在上海植物园、上海中医药大学药植园、山东中医药大学百草园等地实地拍摄共收集药植照片5类5574张图片。收集到的图片特征清晰,角度、色调等符合正常拍摄的情境,具有很强的代表性。图片将作为测试集,用来测试算法对药用植物检测的有效性。

对收集到的图片,使用工具“光影魔术手”做归一化处理,将图片尺寸统一为512*512,并以相同格式重命名图像,分别保存在文件夹下,如图1所示。

对归一化后的图像,需要进行目标标注,如图2所示,目的是用来检测算法性能。

2.2  实验过程与分析

本文是对现有植物目标检测算法的改进,首先使用高斯滤波器对图像做去噪处理,然后使用基于图的图割算法划定初始分割区域,计算所有相邻区域的颜色、纹理、大小以及交叠相似度,按照合并策略对相似度求和,确定需要合并的区域,最后不断迭代至最后目标区域确定。

选择性搜索算法是通过对初始分割区域的不断合并最终得到目标区域,因此初始分割区域的划分直接影响算法的性能。初始分割区域过于精细会造成相似度较高的两个区间可能被划分为不同的区域,无法合并。同时因为区域的增多,导致计算量增加,算法复杂度增大,实用性降低;而初始分割区域过于粗糙则会减弱区域特性,无法准确区分区域边界。由此需要先确定初始分割区域Scale的最优值。

实验设置Scale值从100~1200递增,不同Scale值下药用植物的平均检测得分如图3所示。由图3可知,在高斯核大小Sigma取0.5、合并策略为C+T+S+F的情况下,当Scale值为100时,平均检测得分只有35.3,到800时达到最大值58,到1200时平均检测得分降到了46.4。可以看出,在初始值100的情况下,初始分割区域过于精细导致过度界定不同区域,使得目标区域内目标检测框数量过多且重合,而当Scale取值大于800后,算法无法准确界定目标所在区域,检测效果不理想。根据实验结果,初始分割区域参数Scale设为800。

按照同样的方法,设定高斯核Sigma(即标准差)从0.1增大到1.5。实验结果显示,算法的平均检测得分在Sigma取0.8时达到最大值70.3。当高斯核取值较小时,高斯滤波去噪效果不明显,图像噪点严重,导致目标分割区域过多,重叠严重;随着高斯核取值的增大,算法的平滑效果更明显,图像的颜色特征对区域分割的影响更大,因此检测效果也变得更好。图4展示了不同Sigma取值下的检测效果图。

由于在自然环境下采集图片时的光照、天气等条件均不同,步骤(2)中四种相似度会对目标检测产生不同程度的影响。为了探究四种相似度的影响程度,本文在确定Scale=800,Sigma=0.8的前提下,以各种策略组合设置实验。

在初始分割区域大小设为800、高斯核大小设为0.8的前提下,不同合并策略对药用植物目标检测的结果如图5所示。从折线图中可以看出,在“C+T+S+F”合并策略下,药用植物目标检测的平均检测得分最高。这是因为采集到的图片中目标所在位置以及目标尺寸皆有不同,单一合并策略无法做到对目标的准确定位,更多合并策略的组合保证了植物目标检测的鲁棒性和准确率。综上,本文选择“C+T+S+F”的合并策略。

由綜合相似度公式可知,各相似度的权重会直接影响相似区域间的合并。如果图片目标区域与周围物体的颜色特征相差较大,提高颜色相似度的权重就可以保证让颜色相近的区域先合并,对于目标颜色与背景色相差较大的物体的检测准确率就会更好。而对于目标物体颜色与背景色相近的情况,提高纹理相似度的权重就可以依据目标边界进行合并,降低了颜色对区域合并的影响,避免过度合并导致目标检测不充分。

在确定各相似度权重的实验中,首先依据植物的主要特征从图片库中分别选取有花植物与叶片植物图片各100张,分别探究有花植物与叶片植物算法最佳的相似度权重。由药用植物所处的实际环境来看,有花植物花朵的颜色与植物背景色有较大的区别,提高颜色相似度的权重对于花朵的检测有较大的帮助。经过实验,参数选择(0.8,0.3,0.9,1)时有花植物目标检测的平均检测得分最高,可以达到84.3。对于叶片植物,植物的叶片是我们所要检测的主要目标,而叶片的颜色与背景色极为相似,叶片的纹理是检测的主要依据,那么则需要提高纹理相似度。经过实验,参数为(0.5,0.8,0.8,1)时叶片植物的目标检测平均检测得分可以达到67.86。在以上参数设置下算法检测结果如图6所示。

为了验证本文算法的有效性,本文还设置如下对比实验:(1)实验一:使用原始选择性搜索算法分别对有花植物图片和叶片植物图片进行目标检测;(2)实验二:对图片进行预处理之后再使用原始选择性搜索算法进行实验;(3)实验三:使用本文算法对相同图片进行目标检测。实验结果见表1。

对比实验一与实验二,可以发现经过图像预处理之后,算法取得更好地结果。同时在实验过程中发现,经过图像预处理之后算法的效率得到极大的提升,当直接使用未处理的图片进行检测时,算法耗费时间过长并可能导致程序崩溃。从实验二与本文算法实验的对比来看,在经过对初始区域分割大小、高斯核大小、策略选择以及各策略权重等参数优化之后,本文算法的平均目标检测得分提高了约12.64,这是因为在选择更优的参数之后,超像素的分割与策略合并更为准确。

本文通过控制变量法进行实验得到了算法各个参数的最优值,同时为算法增加图像预处理环节,使得效率与准确度得到较大提升。使用本文算法对自然环境下的药用植物图片进行目标检测,有花植物可以得到84.3的检测得分,叶子植物可以得到67.86的检测得分,平均检测得分达到76.08。实验结果表明,本文算法在自然环境下的药用植物定位检测上取得了较好的结果。

3  结束语

本文提出了一种基于选择性搜索的药用植物目标检测算法,首先利用基于图的图像分割方法得到具有相似特性的初始分割区域,然后将综合相似度最高的区域合并,不断迭代最后得到若干个可能的目标区间,完成药用植物目标定位检测。本文算法计算简单,计算效率高,有较强的实用性。考虑到野生药植实际生存环境,获取到的图片背景较复杂,本文算法的优点在于对这种复杂环境的处理更优秀,具有更强的鲁棒性与准确率。

在要检测的药植本身颜色、纹理特征不明显的情况下,本文算法获得目标区域也会出现一些误差,影响准确率。这将是下一步工作亟待解决的问题。

参考文献

[1] 张琳, 王晓. 中药连作障碍形成及其时空效应理论探讨[J]. 现代中药研究与实践, 2014(5): 78-83.

[2] 李焕普. 发展野生濒危药用动植物的家养家种是缓解供求矛盾和保护生态的有效途径[J]. 中国现代中药, 2008(07): 47-48.

[3] Pablo Arbelaez, Jordi Pont-Tuset, Jon Barron, et al. Multiscale Combinatorial Grouping[C]// 2014 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2014.

[4] Cheng M M, Zhang Z M, Lin W Y, et al. BING: Binarized normed gradients for objectness estimation at 300fps[C]// Proc of the 2014 IEEE Conference on Computer Vision and Pattern Recognition, 2014: 3286-3293.

[5] Mei X. Visual object detection using deformable sparse coding model[C]// International Conference on Progress in Informatics & Computing. IEEE, 2017.

[6] 钟必能, 潘胜男. 选择性搜索和多深度学习模型融合的目标跟踪[J]. 华侨大学学报:自然科学版, 2016(37): 212.

[7] Kulkarni A, Callan J. Selective Search: Efficient and Effective Search of Large Textual Collections[J]. 2015, 33(4): 1-33.

[8] Uijlings J R R, K. E. A. van de Sande…. Selective Search for Object Recognition[J]. International Journal of Computer Vision, 2013, 104(2): 154-171.

[9] ?i?la, Cevahir, Alatan A A. Efficient graph-based image segmentation via speeded-up turbo pixels[C]// IEEE International Conference on Image Processing. IEEE, 2010.

[10] Bilaniuk O, Fazl-Ersi E, Xu C, et al. Fast LBP Face Detection on Low-Power SIMD Architectures[C]// IEEE Conference on Computer Vision & Pattern Recognition Workshops. IEEE Computer Society, 2014.

[11] Quanwu L I, Yuhui L I, Bo L I, et al. Research on Vehicle Face Localization and Recognition Method[J]. Journal of Frontiers of Computer Science and Technology, 2015.

[12] Bei M, Le Z. Vehicle Recognition Based on Texture Feature[J]. Electronic Science and Technology, 2010.

[13] Bineng Z, Shengnan P. Multi-Clue Fusion Target Tracking Algorithm Based on Selective Search and Deep Learning[J]. Journal of Huaqiao University(Natural Science), 2016.

[14] Felzenszwalb P F, Huttenlocher D P. Efficient graph-based image segmentation[J]. International Journal of Computer Vision, 2004, 59(2): 167-181

[15] Arguello J, Callan J, Diaz F. Classification-based resource selection[C]// Proceedings of the 18th ACM Conference on Information and Knowledge Management, CIKM 2009, Hong Kong, China, November 2-6, 2009. ACM, 2009.

[16] Kulkarni A. Efficient and Effective Large-scale Search[J]. Dissertations & Theses - Gradworks, 2014.

[17] Zitnick C L, Dollar P. Edge Boxes: Locating Object Proposals from Edges[C]// ECCV. Springer International Publishing, 2014.

[18] Everingham M, Gool L V, Williams C K I, et al. ThePascal-Visual Object Classes (VOC) Challenge[J]. International Journal of Computer Vision, 2010, 88(2): 303-338.

[19] 闞江明, 王怡萱, 杨晓微, 等. 基于叶片图像的植物识别方法[J]. 科技导报, 2010, 28(23): 81-85.

[20] 吴素雯, 战荫伟. 基于选择性搜索和卷积神经网络的人脸检测[J]. 计算机应用研究, 2017(09): 300-303+322.