基于SSD-MobileNet V1深度学习算法的药用植物叶片识别方法

2020-03-03丁常宏王守宇高鹏

江苏农业科学 2020年22期

丁常宏王守宇高鹏

摘要：长期以来药用植物的鉴定主要依靠人工和经验，为协助中药资源研究人员、植物资源研究人员更准确地完成植物鉴别，数字图像模式识别技术可以加以应用。本研究基于SSD-MobileNetV1深度学习算法对需要查询的药用植物照片进行相似性检索，对比药用植物叶片进行药用植物的识别与鉴定。结果表明，当阈值为0.5时，精确率及召回率均可达96.0%，为该深度学习模型的最佳值。在此条件下，训练集的学习准确率各标签均为100%;识别检验结果显示，5种药用植物共100张不同叶片照片的识别正确率可以达到100%。说明基于SSD-MobileNetV1深度学习算法的药用植物叶片识别方法高效准确，能够协助植物资源调查人员进行植物辨识，为中药资源普查、研究，植物资源研究等各方面工作提供了强大技术支持。

关键词：数字图像模式识别技术;SSD-MobileNetV1深度学习算法;相似性检索;阈值;植物叶片

中图分类号：TP391.41文献标志码：A

文章编号：1002-1302（2020）22-0222-06

作者简介：丁常宏（1981—），女，黑龙江哈尔滨人，博士，副教授，从事中药资源学相关研究。E-mail：598808726@qq.com。

通信作者：高鹏，博士，高级工程师，从事计算机体系结构与深度学习方面的研究。E-mail：40478978@qq.com。

中医药学包含着中华民族几千年的健康养生理念及实践经验，是中华文明的一个瑰宝，凝聚着中华民族的博大智慧。新中国成立以来，我国中医药事业取得显著成就，为增进人民健康做出了重要贡献。近年来，中药无论在我国还是海外都受到了越来越多的欢迎和重视。随着中药产业的迅速发展，关于中药的化学成分、药理作用等方面的研究越来越多。中药资源是中药产业发展的根本和基础，维持中药资源的可持续发展是一项基本策略。只有清楚中药资源的现状，才能制定出切实可行的政策和措施，这主要依靠中药资源调查工作的全面开展。20世纪以来，中药资源的现状令人堪忧，一方面随着社会和经济的发展，人们对中药的需求日益增大;另一方面随着全球气候改变、环境污染以及人们对资源的过度开发，中药资源的分布范围不断缩小，中药资源面临着极大的挑战。

中药资源调查是针对国家或区域的野生、栽培或养殖的药用动植物及矿物资源的种类构成、数量、质量、分布格局和开发条件等进行的考察研究工作，它是进行中药资源开发利用、保护更新和经营管理等工作的前提和基础。

中药大多数为植物药，药用植物的鉴别与分类对于植物种类的区分、植物药用价值的探索等方面具有重要的意义。植物分类学是一门研究整个植物界不同类群的起源、亲缘关系以及进化发展规律的基础学科，就是把纷繁复杂的植物界分门别类地鉴别到种，并按系统排列起来，以便于人们认识和利用植物。长期以来药用植物的鉴定主要靠人工和经验鉴别，在信息化的今天，应该更高效地利用计算机化的药用植物识别的方法，利用数字图像模式识别技术对药用植物进行辨识和管理。随着科技的发展，模式识别技术被应用到越来越多的行业中，在植物叶片的识别中也同样有很好的应用前景。目前，已有K最邻近方法（KNN）分类器、双路卷积神经网络、傅里叶（Fourier）描述子和局部二值模式（LBP）相结合技术、支持向量机（SVM）算法等技术应用于植物的识别过程中，在植物叶片的识别过程中发挥了越来越重要的作用[1-5]。

SSD-MobileNetV1是Google于2017年发布的网络架构，旨在充分利用移动设备和嵌入式应用的有限资源，有效地最大化模型的准确性，以满足有限资源下的各种应用案例。SSD-MobileNetV1可以用于分类、检测、嵌入和分割等任务提取图像卷积特征。其核心是把卷积拆分为Depthwise+Pointwise等2个部分，通过Depthwise+Pointwise的拆分，相当于将普通卷积的计算量压缩为原来的1/9，计算时间压缩为原来的1/8，可以更好地解决植物叶片识别方面的问题。本研究是通过SSD-MobileNetV1利用移动设备和嵌入式应用的有限资源，对照片进行识别。如果图片置信度大于70%，那么就可以说图片和标签高度相似。

1材料与方法

1.1试验材料

本试验拍摄器材为iPhone4S;开发语言为Python3.5;深度学习框架版本为paddle-fluid-v1.5.1;运行环境为图形处理器（GPU）：V10016GBVMem，中央处理器（CPU）为8Cores56GBMemory。

1.2试验方法

1.2.1药用植物图像采集

本研究中所用到的图片均在中医药大学药用植物园采集，共5种植物，分别为杜仲（EucommiaulmoidesOliver）、金银花（LonicerajaponicaThunb.）、女贞（LigustrumlucidumAit.）、无花果（FicuscaricaLinn.）、喜树（CamptothecaacuminataDecne.），拍摄用于深度学习不同角度、不同背景叶片照片共84张，用于深度学习后数据验证测试的不同植物照片有100张。

1.2.2植物图像预处理

将用于深度学习的图片按照其种类进行分类，统一上传到系统中。通过系统中的矩形工具，对每张照片中的植物进行选取，同时，按照植物的种类标注相应的植物名称标签。此次试验中所使用的植物名称标签为ulmoides（杜仲）、japonica（金银花）、lucidum（女贞）、carica（无花果）、acuminata（喜树）。

1.2.3深度學习方法

编写基于SSD-mobileNetV1算法的深度学习脚本，脚本代码下载地址：https：//pan.baidu.com/s/1aOk2gXoy4On1TlweT0tGQw。根据实际情况配置脚本数据训练迭代次数、控制评估的间隔迭代数、数据预处理输入模型的图像尺寸、训练日志输出频率等信息。上传前期准备好的用于深度学习的84张照片，并按照其植物名称进行分类，分类标签为该植物的拉丁种名。运行深度学习脚本，让系统按照设定好的算法进行学习。分别上传测试植物叶片照片，通过系统反馈分类标签的置信度来判断植物识别的准确度。

1.2.4测试复杂背景环境下叶片识别成功率

选择不同分类植物叶片，每组叶片选择20幅进行测试。通过上述SSD-MobileNetV1深度学习算法训练后的模型进行图像分析，测试植物叶片识别成功率。

2试验结果

2.1训练模型效果

通过对ulmoides（杜仲）、japonica（金银花）、lucidum（女贞）、carica（无花果）、acuminata（喜树）等5种植物的叶片训练集（图1至图5）进行检测，得到基于SSD-MobileNetV1深度学习进行叶片识别的训练效果。

物体检测（objectdetection）算法中衡量算法效果的指标平均准确率（meanaverageprecision，mAP）为100%（图6）。在不同阈值下多次计算和试验，从训练集的检验中得到一条F1值的曲线（图6），可以发现，当阈值为0.5～0.7时，F1值（精确率和召回率的调和平均数）为98.0%，其中建议阈值为0.5，为该深度学习模型的最佳值，这时通过检测可得训练中精确率（为该阈值下正确预测的物体数与预测物体总数之比）可达96.0%，召回率（该阈值下正确预测的物体数与真实物体数之比）可达100.0%（图7）。在此条件下，各标签训练集的学习准确率均为100%（图8）。

2.2识别结果

2.2.1杜仲葉片识别结果

利用基于SSD-MobileNetV1进行杜仲叶片的识别检验，共识别20张杜仲叶片的照片（图9），识别正确率可以达到100%（表1）。其中，12张照片识别出唯一的结果，另外8张照片的识别中出现其他的相似项，但置信度均低于正确结果。

2.2.2金银花叶片识别结果利用基于SSD-MobileNetV1进行金银花叶片的识别检验，共识别20张金银花叶片的照片（图10），识别正确率可以达到100%（表2）。其中，12张照片识别出唯一的结果，另外8张照片的识别中出现其他的相似项，但置信度均低于正确结果。

2.2.3女贞叶片识别结果

利用基于SSD-MobileNetV1进行女贞叶片的识别检验，共识别20张女贞叶片的照片（图11），识别正确率可以达到100%（表3）。其中，13张照片识别出唯一的结果，另外7张照片的识别中出现其他的相似项，但置信度均低于正确结果。

2.2.4无花果叶片识别结果

利用基于SSD-MobileNetV1进行无花果叶片的识别检验，共识别20张无花果叶片的照片（图12），识别正确率可以达到100%（表4）。其中，18张照片识别出唯一的结果，另外2张照片的识别中出现其他的相似项，但置信度均低于正确结果。

2.2.5喜树叶片识别结果

利用基于SSD-MobileNetV1进行喜树叶片的识别检验，共识别20张喜树叶片的照片（图13），识别正确率可以达到100%（表5）。其中，15张照片识别出唯一的结果，另外5张照片的识别中出现其他的相似项，但置信度均低于正确结果。

3讨论

SSD-MobileNetV1可以用于分类、检测、嵌入和分割等任务提取图像卷积特征。其核心是将卷积拆分为Depthwise+Pointwise等2部分。通过拆分可以提高原有的计算效率，得到高效准确的识别结果。并且即使在比较复杂的背景下的叶片也能较好地识别，识别率可以达到100%。将该技术推广应用，可以协助中药资源研究人员及植物资源研究人员完成植物鉴别。在以往的研究中，曾使用动态时间规整算法进行植物叶片的识别和鉴定[6]，但当背景过于凌乱时会造成识别的误差，而此方法即使在复杂的背景下也可以准确识别。

此研究的训练集仅仅使用了5种药用植物不同叶片的84张照片，数量有限。而且此训练集中植物的叶片形态如喜树、杜仲还较为相似，但在最终的识别试验中准确率已经达到100%。可见，如果增加训练集的数量，让机器进行更深入的学习，检验结果的置信度还会进一步提高。可以尝试扩增训练集的植物种类，将这一技术进行推广和应用，协助植物资源调查人员进行植物辨识，为中药资源的普查和研究，植物资源研究等各方面工作提供强大的技术支持。

参考文献：

[1]梅星宇，李新华，鲍文霞，等.基于复频域纹理特征的植物叶片识别算法[J].江苏农业学报，2019，35（6）：1334-1339.

[2]XiangZ，ZhaoWQ，LuoHZ，etal.Plantrecognitionvialeafshapeandmarginfeatures[J].MultimediaToolsandApplications，2019，78（19）：27463-27489.

[3]于慧伶，麻峻玮，张怡卓.基于双路卷积神经网络的植物叶片识别模型[J].北京林业大学学报，2018，40（12）：132-137.

[4]张善文，张晴晴，齐国红.基于Fourier描述子和LBP相结合的植物叶片识别方法[J].江苏农业科学，2019，47（14）：273-276.

[5]马娜，李艳文，徐苗.基于改进SVM算法的植物叶片分类研究[J].山西农业大学学报（自然科学版），2018，38（11）：33-38.

[6]丁常宏，高鹏.基于动态时间规整算法的药用植物叶片识别方法[J].中医药导报，2019，25（11）：63-66.