APP下载

BP 神经网络与 HOG特征相结合的小花清风藤叶片智能鉴别模型建立

2019-04-30郭文凯孙庆文

贵州农业科学 2019年4期
关键词:清风识别率小花

郭文凯, 孙庆文

(贵州中医药大学, 贵州 贵阳 550025)

小花清风藤(SabiaparvifloraWall.ex Roxb.)为清风藤科(Sabiaceae)清风藤属(Sabia)植物[1-2],是贵州苗族、布依族等少数民族治疗肝炎、风湿痹痛、跌打损伤等疾病的常用药物[3]。现代化学、药理研究表明,小花清风藤含有生物碱、黄酮、萜类、甾体及皂苷等成分,具有明显的保肝、抗炎、镇痛等作用[4]。笔者所在的作者课题组对小花清风藤的资源状况、生药鉴定、引种栽培、质量控制以及化学药理等方面进行了系统研究[5-12],经过长期的研究发现,小花清风藤与同属(清风藤属)的簇花清风藤(SabiafasciculataLecomte ex L.Chen)、尖叶清风藤(SabiaswinhoeiHemsl. ex Forb. et Hemsl.)等物种在植物形态上极为相似,在没有花、果的情况下很难准确鉴别,加上相似的几个物种具有同样的分布区,导致药农在采集小花清风藤药材的时候极易混杂,从而影响临床疗效,甚至埋下安全隐患。因此,探索准确、快速、简便的鉴别方法,是小花清风藤综合开发利用和药材质量控制的重要环节。

方向梯度直方图(Hog)特征是应用于图像处理领域的特征描述子,由于其能够很好的对一幅图像的局部区域进行描述,逐渐被用于图像处理、模式识别和机器学习等领域。TAKIRAN 等[13]从无噪声干扰、大小相同的图像中提取HOG 特征对手写签名进行准确识别,使用PCA 技术将所提取的特征进行降维后再进行选择,将所获得的最终数据反馈到GRNN 分类器进行训练,该方法运用在试验中取得了98.33%的准确度。BP(Back Propagation)神经网络是按误差逆传播算法训练的多层前馈网络,可以对任一非线性输入输出关系进行模仿,因此被广泛应用在分类识别、回归、压缩、逼近等领域[14]。如曹永峰等[15]建立了GA-BP四层神经网络,输入节点设置为256,输出节点设置为5,进行数字图像识别,GA-BP网络正确识别率达98.7%;周舒冬等[16]从穿心莲药材指纹图谱中提取了4个主成分,并利用LM-BP神经网络进行模式识别,建立了穿心莲药材指纹图谱的LM-BP神经网络模型,其算法在识别速度和精度上都比传统BP算法有较大提高。鉴于BP神经网络与HOG特征在图像处理、模式识别等领域的突出优势,笔者等将其引入小花清风藤及同属植物药材的鉴别,建立BP神经网络与HOG特征相结合的小花清风藤叶片智能鉴别模型,以期为小花清风藤的综合开发利用和质量控制提供新的科学方法。

1材料与方法

1.1材料

小花清风藤与簇花清风藤叶片:采集于贵州中医大学药用植物种质资源圃,并由贵州中医药院大学鉴定为清风藤科(Sabiaceae)植物小花清风藤(SabiaparvifloraWall.exRoxb.)和簇花清风藤(SabiafasciculataLecomte ex L. Chen),植物凭证标本保存于贵州中医药大学生药重点实验室。

Dell Optiplex 3050计算机(戴尔中国有限责任公司)、Epson ME OFFICE 620F扫描仪〔爱普生(中国)有限责任公司〕、MATLAB R2018a软件〔美国迈科沃斯(北京)有限公司〕。

1.2方法

1.2.1HOG特征提取 HOG特征的提取是基于梯度特征的提取,主要思想为在一幅图像中,局部目标的表象和形状能够被梯度或者边缘的方向密度分布所描述。为了提取小花清风藤与簇花清风藤叶片图像的HOG特征,首先需将图像进行色彩和Gamma归一化,计算待检测窗口的每一个像素的梯度幅值和方向;其次将待检测窗口划分为n个cell,在每个cell中按照设计好的梯度方向和量化间隔构建梯度方向直方图;然后将相邻的cell组成一个大的空间(Block),对相邻空间的重叠部分进行直方图归一化处理;最后将待检测窗口中所有空间(Block)中的梯度方向直方图组成特征向量,相关计算公式如下:

A(x,y)=A(x,y)gamma

Gx(x,y)=H(x+1,y)-H(x-1,y)

Gx(x,y)=H(x,y+1)-H(x,y-1)

式中Gx(x,y)为像素点(x,y)处水平方向梯度,Gy(x,y)为像素点(x,y)处垂直方向梯度,H(x,y)为像素值,G(x,y)为梯度幅值,α(x,y)为梯度方向。

1.2.2BP神经网络模型构建 BP神经网络可以存储大量的图像信息,并且通过学习储存大量的模式映射关系(图1),基于HOG提取特征与BP神经网络相结合的小花清风藤与簇花清风藤叶片的智能识别模型的建立主要有以下步骤: 1) 采用HOG特征提取算法提取两种叶片的HOG特征;2) 建立以HOG特征为输入层,以簇花清风藤和小花清风藤为输出层的BP神经网络,调整隐含层阈值后建立测试模型;3) 输入测试数据库叶片测试神经网络对小花清风藤和簇花清风藤的识别率,达到要求,模型建立。通过图2流程对小花清风藤与簇花清风藤叶片进行识别。

图2BP 神经网络模型的叶片识别过程

1.2.3数据库构建 为便于采集图像信息、减少外界环境等干扰因素、提高识别效率,试验采用Epson ME OFFICE 620F扫描仪对叶片正面进行扫描,扫描分辨率像素为2 481×3 509,扫描图像为RGB色彩图像,图片格式为jpg。将上述扫描图像使用MATLAB Image Processing Toolbox进行预处理:Otsu方法计算最优阈值T对图像进行去噪声、图像二值化、按最大外接矩形(3.5∶1)将图片裁剪为1 416×416像素。将裁剪后的小花清风藤叶图片500张,簇花清风藤叶258张,相机随机拍摄照片500张,随机抽取小花清风藤叶图片400张,簇花清风藤150张,相机随机拍摄照片400作为训练数据库,剩余部分则作为测试数据库。

1.2.4BP神经网络构建 试验在一台3.4GHz CPU,8GB RAM,4GB内存的计算机上进行训练和测试,利用MATLAB R2018 a进行编程,网络模型采用5层分类器,基于HOG特征的BP神经网络构建步骤如下:1)使用HOG特征提取函数对训练集样本进行HOG特征提取,得到小花清风藤400×720维和簇花清风藤150×720维训练集特征;2)样本特征合并,并赋值给小花清风藤为1,簇花清风藤为-1;3)创建BP神经网络,调整隐含层层数、节点传递函数、两次显示之间的训练步数、训练次数、训练目标、学习速率、训练神经网络;4)使用测试数据库测试神经网络识别效果确定上述参数。

根据文献[14]及经验设置隐含层为3层,节点传递函数为Logsig,其他参数使用系统默认值,考察训练次数、训练目标、显示训练内容等训练因子对两种叶片的识别率。

2结果与分析

2.1不同训练因子对2种叶片识别效果的影响

从表1可知,随着训练次数的增加,小花清风藤叶片识别的正确率也增加,直到500次识别率达到最大值,为99%。而簇花清风藤则无变化。从表2可知,随着训练目标精度的增加,训练时间在逐渐减少,识别正确率也是逐渐增加(训练目标精度为0除外)。随着显示训练次数的增加,小花清风藤叶片识别的正确率也增加,而簇花清风藤则变化不大(表3)。

2.2小花清风藤叶片智能鉴别模型的构建

综合考虑时间等因素,设置隐含层为3层,节点传递函数为Logsig,2次显示之间的训练步数为50步,训练次数为500次,训练目标为0.001,学习速率为0.01,平行训练与测试神经网络10次,得到小花清风藤的的平均识别率为97.60%,簇花清风藤为98.61%,挑选其中训练识别率最高的小花清风藤为100%,簇花清风藤为99.07%的版本保存。

表1 BP 神经网络不同训练次数对小花清风藤和簇花清风藤的识别率

表2 BP 神经网络不同训练目标对小花清风藤和簇花清风藤的识别率

表3 两次显示之间的训练步数对小花清风藤和簇花清风藤的识别率

3结论与讨论

通过HOG特征提取描述子与BP神经网络结合的方法,建立了两种极为相似的植物叶片的神经网络鉴别模型,该模型对小花清风藤叶片的平均识别率为97.60%,簇花清风藤为98.61%,对任意样本为100%。这是一种准确、简单、快速的植物及药材鉴别的新方法,是中药材传统“四大鉴别法”的有益补充。

为了提高BP神经网络的泛化能力,在基于专门识别小花清风藤与簇花清风藤叶片神经网络模型的基础上,增加了提高该网络模型泛化能力的样本。先把小花清风藤单独分为一类,其次把簇花清风藤与泛化样本分为一类,然后在此基础上再将簇花清风藤与泛化样本区分开,该模型得到了较好的识别率。在识别小花清风藤与簇花清风藤和任意样本混合时,小花清风藤识别率达93%。在识别簇花清风藤与小花清风藤和任意样本混合时,簇花清风藤识别率达96.30%。在识别小花清风藤与任意样本时,各自的识别率均达100%。在识别簇花清风藤与任意样本时,各自的识别率均同样达100%。

在预试验中,进行了基于颜色(RGB)、形状特征、纹理特征相结合的神经网络的辨识,但结果不理想。挑选识别错误的照片进行对比分析后发现,图库集中被识别为簇花清风藤的小花清风叶片与簇花清风藤在形态、纹理、大小等特征方面有着极大的相似性;此外,神经网络中判别两种清风藤设定的阈值和HOG特征提取属性导致两种叶片误读。如果只想提高识别其中一种清风藤的能力,则可以稍微调整判别两种清风藤的阈值来达到目的,如果需要两者兼顾,则还需要大量样本来训练神经网络或者提取更多更细微的特征加上有导师的训练来达到目的。

该神经网络模型为专门针对识别小花清风藤和簇花清风藤叶片设计,识别模式为无背景干扰的固定尺寸的图像,得到了很好的识别效果,但也存在如背景单一等局限性,接下来的工作中将会在以下几个方面展开 :一是扩大清风藤属植物叶片的数据库,力争做到清风藤属植物叶片全覆盖识别;二是 建立在复杂背景下清风藤属植物叶片的识别;三是 开发基于移动终端的软件实现实时的图片识别工作。

猜你喜欢

清风识别率小花
每一朵小花都应该尽情绽放
小花
9月,清风送爽 高远辽阔
无名的小花
基于类图像处理与向量化的大数据脚本攻击智能检测
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
提升高速公路MTC二次抓拍车牌识别率方案研究
Ways to improve the development of economy in China’s rural area
高速公路机电日常维护中车牌识别率分析系统的应用
携清风一缕,叹浮生轻狂