APP下载

基于HOG-LBP特征的中药饮片图像识别

2019-04-25吕宇琛王健庆

中国中医药信息杂志 2019年4期
关键词:图像识别中药饮片特征提取

吕宇琛 王健庆

摘要:目的  通过对方向梯度直方图(HOG)、局部二值模式(LBP)等特征提取及融合的方法研究,实现有效的中药饮片图像识别。方法  分析HOG和LBP特征,进行特征融合,采取支持向量机(SVM)分类算法,在采集整理的中药饮片图像数据集基础上对算法进行训练、测试和改进,从而获得有效的中药饮片多分类模型,并将模型与其他算法进行比较,评价算法的有效性。结果  通过对30种中药饮片2927张图像的训练和测试,等价模式下的HOG-LBP融合特征算法的饮片图像识别率达91.16%,优于传统算法。结论  等价模式下HOG-LBP融合特征结合SVM分类器的方法具有较高的识别率,可有效应用于中药饮片的识别和分类。进一步提高数据种类和数据量,有助于提高算法的适用性和识别效果。

关键词:中药饮片;图像识别;特征提取;方向梯度直方图;局部二值模式

中图分类号:R286.0;R2-05    文献标识码:A    文章编号:1005-5304(2019)04-0106-05

药材识别是中药配方及饮片研究的关键技术之一,可用于中药鉴定、分类识别、质量品质统计等领域,对临床应用研究起重要作用,借助计算机及人工智能技术的识别研究具有较好前景和潜在经济价值。通过计算机辅助手段对中药饮片进行分类识别,基于机器学习的图像识别是最为有效和快捷的方法,特征提取是其核心技术之一。目前中药饮片图像识别研究尚未广泛开展,主要采取颜色特征[1-2]、形状特征[3-4]等,但识别效率尚不理想,无法实现实用的样本分类。

在图像特征描述中,局部二值模式(LBP)[5]计算较简单,对图像局部特征描述较好,但单独使用对特征提取不完整。方向梯度直方图(HOG)特征[6]通过计算梯度和方向的边缘密度,可较好描述局部目标边缘和形状信息。由于其对图像几何和光学变化可保持良好的不变性,被大量应用于多种物体的分类[7-8]。本研究针对HOG和LBP特征描述子各自的特点和优势,根据中药饮片识别对边缘轮廓和局部纹理信息的要求,通过融合HOG和LBP特征的方法提取中药饮片图像特征,并采用LIBSVM软件分类器进行图像分类,从而实现中药饮片图像的有效识别。

1  特征提取

1.1  方向梯度直方图特征提取

本研究采用常用的30种中药饮片,其HOG局部特征分布效果见图1。

1.3  特征融合

HOG特征对图像几何和光学的形状保持良好的不变性,单独使用HOG特征,能有效提取图像边缘局部纹理特征,但对非边缘主体部分及一些易混淆的边缘部分很难进行识别。而某些中药饮片图像主要的区别存在于细微的纹理特征上。

针对HOG特征在描述局部纹理特征不足的问题,根据LBP局部纹理描述较好的特性,本研究采用HOG融合LBP的方法,以更好描述图像的整体和局部特征。通过将HOG特征向量与LBP特征向量进行串联,形成新的局部特征纹理描述。

(12)

2  分类器

支持向量机(SVM)是一种有监督的学习模型,可实现多分类问题[9]。本研究采用LIBSVM软件训练器,选用C_SVC训练模型以及线性分类算子,将样本及对应的标签导入LIBSVM分类器,查找最优超平面。操作步骤:

①建立训练样本集合。设置样本数据空间,导入样本,设置样本类名及相应的标签。本实验中设置标签共30类。②设置相关训练参数。选择LIBSVM训练的模型为C_SVC,以及核函数为线性分类算子。③根据训练样本对SVM进行训练。其中,对1477个训练样本数据的支持向量数为1364个。④输出训练模型。在训练模型的核函数中,degree值为3 801 155,gamma值为1.6912e-306,coef0值为1.2906e-306。

3  结果与分析

3.1  实验数据

实验所用数据为阿胶珠、薜荔果、炒稻芽、炒牛膝、川贝母、大枣、牡丹皮、麸炒白芍、茯苓、覆盆子、枸杞子、花椒、淮小麦、莲子、蜜麸僵蚕、牵牛子、全蝎、山香圆叶、升麻、水飞蓟、水红花子、天麻、温山药、乌梢蛇、盐杜仲、薏苡仁、郁金、制何首烏、制吴茱萸及制远志30种常用中药饮片图像,均为RGB模式下的jpg格式图像,见图2。

3.2  实验分析

实验测试了[等价模式(uniform)]LBP+HOG+[线性(linear)]SVM、[旋转不变模式(rotation- invariant)] LBP+HOG+(linear)SVM、(uniform rotation–invariant) LBP+HOG+(linear)SVM、(uniform)LBP+(linear)SVM、HOG+(linear)SVM、(3层金字塔)PHOG[24]+(linear) SVM共6种不同的方法。

6组识别算法实验结果见图3,所采用的维度、训练时间、检测时间以及样本识别率见表2。实验结果表明,单独使用HOG特征对训练集识别率较高,但对测试集识别率较低,特别对易混淆样本区分度较差。通过对LBP 3种模式的识别率比较可知,提取的LBP特征模式主要分布在等价模式中,且中药饮片图像没有明显旋转现象。综合识别时间和识别率,与其他方法比较,采用HOG特征描述子融合等价模式下的LBP特征描述子识别率为91.16%,识别效果更优。

研究发现,实验样本数量的增加,有助于提高识别率。本研究侧重在3000样本数量级对中药饮片图像进行识别。训练样本比率为50%时,样本数量级对图像识别率的影响见图4。

根据不同中药饮片的形状及纹理特征,本研究将30种中药饮片分成段、颗粒、块、切片、枝叶5类进行分析研究。各类别饮片识别率见表3。研究发现,段、块类的饮片识别率较低,主要由于此类饮片纹理差异较大,不同样本间特征呈多样化。而枝叶和颗粒种类的饮片识别率较高,由于此类饮片共同纹理特征较多,特征比较单一。

50%训练样本下30种中药样本的识别率见表4。其中山香圆叶的识别率最低,由于此类饮片呈不同的折叠破碎状,部分局部纹理在炮制过程中被破坏,对图像识别造成了较大影响。展平样本有助于提高识别精度,但不利于自动化操作。在训练样本的预测模型中,1364个有效的支持向量数据均不位于类域之间的边界上。提示各类中药饮片提取出的特征存在共性。

4  小结

近年来,图像识别技术已逐步应用于中医药领域[10],极大推动了中医药客观化、标准化相关研究。采用模式识别方法不仅可提高中药饮片识别自动化程度及分类识别的稳定性,还能确保统一的分类结果,避免人工方法导致的分类结果不一致。实验表明,HOG特征对样本局部纹理特征描述不足而导致易混淆饮片的识别不理想,LBP可有效反映局部纹理特征,但对特征提取不完整。因此,融合的HOG-LBP特征相较于单独特征方法,在识别率方面有了较大提高。今后研究可通过进一步提高样本的种类和数量,排除样本的偶然性,以提高模型适应性和算法的泛化性。同时,继续深入研究特征提取,以进一步提高识别率,并研究挖掘其更深层次的应用价值。

参考文献:

[1] YONG R, HUANG T S, CHANG S F. Image retrieval:current techniques, promising directions, and open issues[J]. Journal of Visual Communication and Image Representation,2015,10(1):39-62.

[2] 木拉提·哈米提,員伟康,严传波,等.基于颜色直方图的新疆维吾尔医药材图像特征提取与判别分析[J].生物医学工程学杂志,2015,32(3):588-593.

[3] 李震.中药饮片特征提取和识别系统[D].哈尔滨:哈尔滨工业大学, 2013.

[4] 黄道,何晋,刘志愿,等.组合分类器算法bagging和adaboostM1在中草药分类的研究[J].中国新通信,2014,16(4):21.

[5] OJALA T, PIETIKAINEN M, MAENPAA T. Gray scale and rotation invariant texture classification with local binary patterns[J]. European Conference on Computer Vision,2000,24(7):404-420.

[6] DALAL N, TRIGGS B. Histograms of oriented gradients for human detection[J]. Computer Vision and Pattern Recognition,2005, 1(12):886-893.

[7] 胡仕玲,顾爽,陈启军.基于HOG的物体分类方法[J].华中科技大学学报:自然科学版,2011,39(S2):124-126.

[8] MARCOS J, FERN?NDEZ R. Computer vision for pedestrian detection using Histograms of Oriented Gradient[D]. Boston:Massachusetts Institute of Technology,2014.

[9] FLACH P A. On the state of the art in machine learning:A personal review[J]. Artificial Intelligence,2001,131(1):199-222.

[10] 陈梦竹,岑翼刚,许家佗,等.基于图像处理的望诊面色自动识别研究[J].中国中医药信息杂志,2018,25(12):97-101.

(收稿日期:2018-03-20)

(修回日期:2019-02-16;编辑:向宇雁)

猜你喜欢

图像识别中药饮片特征提取
基于Resnet-50的猫狗图像识别
高速公路图像识别技术应用探讨
基于Daubechies(dbN)的飞行器音频特征提取
图像识别在物联网上的应用
图像识别在水质检测中的应用
Bagging RCSP脑电特征提取算法
中药饮片市场监管乏力
中药饮片小包装探讨
中药饮片鉴别真伪的意义及相关方法
基于MED和循环域解调的多故障特征提取