基于SSD-MobileNet V1深度学习算法的药用植物叶片识别方法
2020-03-03丁常宏王守宇高鹏
丁常宏 王守宇 高鹏
摘要:长期以来药用植物的鉴定主要依靠人工和经验,为协助中药资源研究人员、植物资源研究人员更准确地完成植物鉴别,数字图像模式识别技术可以加以应用。本研究基于SSD-MobileNetV1深度学习算法对需要查询的药用植物照片进行相似性检索,对比药用植物叶片进行药用植物的识别与鉴定。结果表明,当阈值为0.5时,精确率及召回率均可达96.0%,为该深度学习模型的最佳值。在此条件下,训练集的学习准确率各标签均为100%;识别检验结果显示,5种药用植物共100张不同叶片照片的识别正确率可以达到100%。说明基于SSD-MobileNetV1深度学习算法的药用植物叶片识别方法高效准确,能够协助植物资源调查人员进行植物辨识,为中药资源普查、研究,植物资源研究等各方面工作提供了强大技术支持。
关键词:数字图像模式识别技术;SSD-MobileNetV1深度学习算法;相似性检索;阈值;植物叶片
中图分类号:TP391.41文献标志码:A
文章编号:1002-1302(2020)22-0222-06
作者简介:丁常宏(1981—),女,黑龙江哈尔滨人,博士,副教授,从事中药资源学相关研究。E-mail:598808726@qq.com。
通信作者:高鹏,博士,高级工程师,从事计算机体系结构与深度学习方面的研究。E-mail:40478978@qq.com。
中医药学包含着中华民族几千年的健康养生理念及实践经验,是中华文明的一个瑰宝,凝聚着中华民族的博大智慧。新中国成立以来,我国中医药事业取得显著成就,为增进人民健康做出了重要贡献。近年来,中药无论在我国还是海外都受到了越来越多的欢迎和重视。随着中药产业的迅速发展,关于中药的化学成分、药理作用等方面的研究越来越多。中药资源是中药产业发展的根本和基础,维持中药资源的可持续发展是一项基本策略。只有清楚中药资源的现状,才能制定出切实可行的政策和措施,这主要依靠中药资源调查工作的全面开展。20世纪以来,中药资源的现状令人堪忧,一方面随着社会和经济的发展,人们对中药的需求日益增大;另一方面随着全球气候改变、环境污染以及人们对资源的过度开发,中药资源的分布范围不断缩小,中药资源面临着极大的挑战。
中药资源调查是针对国家或区域的野生、栽培或养殖的药用动植物及矿物资源的种类构成、数量、质量、分布格局和开发条件等进行的考察研究工作,它是进行中药资源开发利用、保护更新和经营管理等工作的前提和基础。
中药大多数为植物药,药用植物的鉴别与分类对于植物种类的区分、植物药用价值的探索等方面具有重要的意义。植物分类学是一门研究整个植物界不同类群的起源、亲缘关系以及进化发展规律的基础学科,就是把纷繁复杂的植物界分门别类地鉴别到种,并按系统排列起来,以便于人们认识和利用植物。长期以来药用植物的鉴定主要靠人工和经验鉴别,在信息化的今天,应该更高效地利用计算机化的药用植物识别的方法,利用数字图像模式识别技术对药用植物进行辨识和管理。随着科技的发展,模式识别技术被应用到越来越多的行业中,在植物叶片的识别中也同样有很好的应用前景。目前,已有K最邻近方法(KNN)分类器、双路卷积神经网络、傅里叶(Fourier)描述子和局部二值模式(LBP)相结合技术、支持向量机(SVM)算法等技术应用于植物的识别过程中,在植物叶片的识别过程中发挥了越来越重要的作用[1-5]。
SSD-MobileNetV1是Google于2017年发布的网络架构,旨在充分利用移动设备和嵌入式应用的有限资源,有效地最大化模型的准确性,以满足有限资源下的各种应用案例。SSD-MobileNetV1可以用于分类、检测、嵌入和分割等任务提取图像卷积特征。其核心是把卷积拆分为Depthwise+Pointwise等2个部分,通过Depthwise+Pointwise的拆分,相当于将普通卷积的计算量压缩为原来的1/9,计算时间压缩为原来的1/8,可以更好地解决植物叶片识别方面的问题。本研究是通过SSD-MobileNetV1利用移动设备和嵌入式应用的有限资源,对照片进行识别。如果图片置信度大于70%,那么就可以说图片和标签高度相似。
1材料与方法
1.1试验材料
本试验拍摄器材为iPhone4S;开发语言为Python3.5;深度学习框架版本为paddle-fluid-v1.5.1;运行环境为图形处理器(GPU):V10016GBVMem,中央处理器(CPU)为8Cores56GBMemory。
1.2试验方法
1.2.1药用植物图像采集
本研究中所用到的图片均在中医药大学药用植物园采集,共5种植物,分别为杜仲(EucommiaulmoidesOliver)、金银花(LonicerajaponicaThunb.)、女贞(LigustrumlucidumAit.)、无花果(FicuscaricaLinn.)、喜树(CamptothecaacuminataDecne.),拍摄用于深度学习不同角度、不同背景叶片照片共84张,用于深度学习后数据验证测试的不同植物照片有100张。
1.2.2植物图像预处理
将用于深度学习的图片按照其种类进行分类,统一上传到系统中。通过系统中的矩形工具,对每张照片中的植物进行选取,同时,按照植物的种类标注相应的植物名称标签。此次试验中所使用的植物名称标签为ulmoides(杜仲)、japonica(金银花)、lucidum(女贞)、carica(无花果)、acuminata(喜树)。
1.2.3深度學习方法
编写基于SSD-mobileNetV1算法的深度学习脚本,脚本代码下载地址:https://pan.baidu.com/s/1aOk2gXoy4On1TlweT0tGQw。根据实际情况配置脚本数据训练迭代次数、控制评估的间隔迭代数、数据预处理输入模型的图像尺寸、训练日志输出频率等信息。上传前期准备好的用于深度学习的84张照片,并按照其植物名称进行分类,分类标签为该植物的拉丁种名。运行深度学习脚本,让系统按照设定好的算法进行学习。分别上传测试植物叶片照片,通过系统反馈分类标签的置信度来判断植物识别的准确度。
1.2.4测试复杂背景环境下叶片识别成功率
选择不同分类植物叶片,每组叶片选择20幅进行测试。通过上述SSD-MobileNetV1深度学习算法训练后的模型进行图像分析,测试植物叶片识别成功率。
2试验结果
2.1训练模型效果
通过对ulmoides(杜仲)、japonica(金银花)、lucidum(女贞)、carica(无花果)、acuminata(喜树)等5种植物的叶片训练集(图1至图5)进行检测,得到基于SSD-MobileNetV1深度学习进行叶片识别的训练效果。
物体检测(objectdetection)算法中衡量算法效果的指标平均准确率(meanaverageprecision,mAP)为100%(图6)。在不同阈值下多次计算和试验,从训练集的检验中得到一条F1值的曲线(图6),可以发现,当阈值为0.5~0.7时,F1值(精确率和召回率的调和平均数)为98.0%,其中建议阈值为0.5,为该深度学习模型的最佳值,这时通过检测可得训练中精确率(为该阈值下正确预测的物体数与预测物体总数之比)可达96.0%,召回率(该阈值下正确预测的物体数与真实物体数之比)可达100.0%(图7)。在此条件下,各标签训练集的学习准确率均为100%(图8)。
2.2识别结果
2.2.1杜仲葉片识别结果
利用基于SSD-MobileNetV1进行杜仲叶片的识别检验,共识别20张杜仲叶片的照片(图9),识别正确率可以达到100%(表1)。其中,12张照片识别出唯一的结果,另外8张照片的识别中出现其他的相似项,但置信度均低于正确结果。
2.2.2金银花叶片识别结果利用基于SSD-MobileNetV1进行金银花叶片的识别检验,共识别20张金银花叶片的照片(图10),识别正确率可以达到100%(表2)。其中,12张照片识别出唯一的结果,另外8张照片的识别中出现其他的相似项,但置信度均低于正确结果。
2.2.3女贞叶片识别结果
利用基于SSD-MobileNetV1进行女贞叶片的识别检验,共识别20张女贞叶片的照片(图11),识别正确率可以达到100%(表3)。其中,13张照片识别出唯一的结果,另外7张照片的识别中出现其他的相似项,但置信度均低于正确结果。
2.2.4无花果叶片识别结果
利用基于SSD-MobileNetV1进行无花果叶片的识别检验,共识别20张无花果叶片的照片(图12),识别正确率可以达到100%(表4)。其中,18张照片识别出唯一的结果,另外2张照片的识别中出现其他的相似项,但置信度均低于正确结果。
2.2.5喜树叶片识别结果
利用基于SSD-MobileNetV1进行喜树叶片的识别检验,共识别20张喜树叶片的照片(图13),识别正确率可以达到100%(表5)。其中,15张照片识别出唯一的结果,另外5张照片的识别中出现其他的相似项,但置信度均低于正确结果。
3讨论
SSD-MobileNetV1可以用于分类、检测、嵌入和分割等任务提取图像卷积特征。其核心是将卷积拆分为Depthwise+Pointwise等2部分。通过拆分可以提高原有的计算效率,得到高效准确的识别结果。并且即使在比较复杂的背景下的叶片也能较好地识别,识别率可以达到100%。将该技术推广应用,可以协助中药资源研究人员及植物资源研究人员完成植物鉴别。在以往的研究中,曾使用动态时间规整算法进行植物叶片的识别和鉴定[6],但当背景过于凌乱时会造成识别的误差,而此方法即使在复杂的背景下也可以准确识别。
此研究的训练集仅仅使用了5种药用植物不同叶片的84张照片,数量有限。而且此训练集中植物的叶片形态如喜树、杜仲还较为相似,但在最终的识别试验中准确率已经达到100%。可见,如果增加训练集的数量,让机器进行更深入的学习,检验结果的置信度还会进一步提高。可以尝试扩增训练集的植物种类,将这一技术进行推广和应用,协助植物资源调查人员进行植物辨识,为中药资源的普查和研究,植物资源研究等各方面工作提供强大的技术支持。
参考文献:
[1]梅星宇,李新华,鲍文霞,等.基于复频域纹理特征的植物叶片识别算法[J].江苏农业学报,2019,35(6):1334-1339.
[2]XiangZ,ZhaoWQ,LuoHZ,etal.Plantrecognitionvialeafshapeandmarginfeatures[J].MultimediaToolsandApplications,2019,78(19):27463-27489.
[3]于慧伶,麻峻玮,张怡卓.基于双路卷积神经网络的植物叶片识别模型[J].北京林业大学学报,2018,40(12):132-137.
[4]张善文,张晴晴,齐国红.基于Fourier描述子和LBP相结合的植物叶片识别方法[J].江苏农业科学,2019,47(14):273-276.
[5]马娜,李艳文,徐苗.基于改进SVM算法的植物叶片分类研究[J].山西农业大学学报(自然科学版),2018,38(11):33-38.
[6]丁常宏,高鹏.基于动态时间规整算法的药用植物叶片识别方法[J].中医药导报,2019,25(11):63-66.