基于形状特征及纹理特征的中药材检索方法
2014-12-23朱黎辉李晓宁蒲华秀吴纯洁
朱黎辉,李晓宁+,张 莹,蒲华秀,吴纯洁
(1.四川师范大学 计算机科学学院,四川 成都610101;2.成都中医药大学 中药材标准化教育部重点实验室,四川 成都611137)
0 引 言
基于内容的图像检索方式融合了传统的模式识别技术与良好的人机交互技术[1],已运用到多个领域,例如植物图像检索[2],商标图像检索[3]等。本文结合实际项目,利用基于图像内容的检索热点技术对中药材图像进行检索。
实现中药材图像的检索关键在于提取中药材图像的有效特征以及利用这些特征构建合适的分类器进行分类。中药材图像的形状特征和纹理特征属较明显的特征,因此从这2个角度提取中药材的图像特征,将所提取到的2个特征进行加权线性组合,构成综合特征向量。支持向量机[4](support vector machine,SVM)是 一 种 新 的 机 器 学 习 技术,可作为分类器使用。吴乐南等人将SVM 用于水果分类[5],张淑雅等人使用支持向量机用于黑白老照片和彩色照片的分类[6]。SVM 分类器分类效果明显,因此使用SVM 对中药材图像进行分类。本文着力探寻图像内容的特征,通过设计特征降维方式,减少传统形状及纹理特征的维数,反复试验对比分析获得适宜的权重系数,构造多分类器解决图像分类问题,解决中药材图像检索时间长、精度低等问题。
1 算法流程和框架
图1为中药材图像的检索结构。对于数据库图像,分别提取形状,纹理特征,然后进行特征的加权组合,组合特征放入特征数据库,利用SVM 进行训练;对于查询图像,提取同样的加权特征构成组合特征,查询时对查询图像使用SVM 进行预测所属类别,通过计算欧氏距离,按距离从小到大依次返回预测类别的检索结果图像。
图1 中药材图像检索结构
2 图像特征提取
2.1 改进HOG 的形状特征提取
梯 度 方 向 直 方 图 (histogram of oriented gradient,HOG)算法[7]广泛用于图像形状特征提取。但是HOG 特征向量维数较大,不利于提取特征效率及后期分类。例如分辨率为64*128像素的图像进行HOG 特征提取得到特征向量为3780 维[8]。因此,本文对原始HOG 进行了改进,改进梯度方向直方图 (improved histogram of oriented gradient,IHOG)基本操作步骤如图2所示。
图2 IHOG 处理的流程
(1)计算梯度。使用式 (1)计算水平和垂直方向的梯度
式中:Gh(x,y)——该像素点的水平梯度值,Gv(x,y)——该像素点垂直梯度值。像素点的梯度值 (强度)及梯度方向按式 (2)进行计算
(2)分块。将分辨率为row*col像素的图像分为3×3块。为使图像特征向量统计时包含尽量多的信息,分块时考虑使相邻的区域有部分重叠。做法是设定步长,使重叠部分大小为原区域的一半,行步长设定为 row/(3+1) ;列步长为col/(3+1) 。
通过步长可严格设定重叠块区域。图3 为区域分块。单元C1,C2,C5,C6 组成块B1;单元C2,C6,C3,C7组成块B2;C2、C6为重叠区域。
图3 区域分块
(3)计算梯度直方图。对9个小块分别计算梯度直方图,做法是在每块内梯度方向范围取0~180度,平分为9个方向角度。如0~20度是一个方向角度,再统计在这个方向角度的梯度值总和。9个方向角度得到一个9维的梯度直方图。
(4)归一化特征向量。为使特征向量空间对光照,阴影和边缘变化具有鲁棒性,因此对每一块的梯度直方图进行归一化。归一化函数选取文献 [7]中的L1-norm 范式,即式 (3)
式中:v——未归一化的特征向量,v1——1-norm,ε——一个很小的常数,取值为0.01。
(5)组合特征向量。将9块归一化后的特征向量通过线性组合成一个81维的IHOG 特征向量。
2.2 分块LBP的纹理特征提取
原始的局部二值模式 (local binary patterns,LBP)算子[9]在每个像素点都得到一个LBP 编码,直接用作纹理特征维数较大,且空间位置容易混乱从而产生误差。本文在原始LBP算子上进行了一定改进,主要采用了分块的思想。分 块 局 部 二 值 模 式 (block Local binary patterns,BLBP)处理的流程如图4所示。
图4 BLBP处理流程
(1)对待处理中药材图像进行原始LBP 特征提取,得到LBP 纹理图像。为降低LBP 的编码模式,使用文献[10]中特征维数为10 维LBPriu2(8,1)统一模式,它具有旋转不变性和灰度不变性的特点,可减小中药材图像由于旋转和光照不匀带来的影响。
(2)将降低了编码模式的LBP 纹理图像平均划分为4×4的小区域。分辨率为row*col像素的图像分块后,每块的行列像素变为row/4 * col/4 。
(3)统计每块的灰度直方图,即计算小块内每个数字出现的频率。因为降低了编码模式,所以此步得到的是一个10维的向量。
(4)每块执行完直方图统计后,将每块得到的向量进行线性合并,组合成一个行向量,此时得到了整幅图的BLBP纹理特征向量。
3 图像分类
3.1 线性组合分类器的内核
图像包含颜色、形状和纹理特征,单一特征只能表达图像的部分属性,对图像内容的描述较片面,缺少足够的区分信息。从而有必要考虑组合互补特性构成综合特征,使图像内容特征描述更全面。
本文综合中药材图像IHOG 形状特征及BLBP 纹理特征,考虑2 个特征的凸组合,实验得出最优权重,形如式(4)
式中:F——组合特征,α、β——IHOG、BLBP 特征对应权 重 系 数,fihog、fblbp——IHOG 形 状 特 征 及BLBP 纹 理特征。
3.2 分类器的设计
SVM 分类器本质是针对两分类问题,在实际生活中常对多类问题进行分类,即需构造SVM 多值分类器。文献[11]列举了5种SVM 多类分类方法,分别为一类对余类法、一对一分类法、二叉树法、纠错输出编码法以及决策树方法。
本文针对多类中药材的图像进行分类,选取一对一方法进行SVM 多值分类器的构造,设图像类别为N 类,共需训练N×(N-1)/2个2值SVM 分类器,这种方式是对N 个分类类别训练集进行两两区分,测试的时候采用投票法决定所属类别,得票最多的类即为预测类别
SVM 通过用内积函数定义的非线性变换将输入空间变换到一个高维空间,然后在这个空间中求广义最优分类面来解决非线性问题。根据不同的内积核函数将形成不同的算法,本文选取式 (5)所列的RBF (径向基)核函数[12]。
4 实验及结果分析
4.1 实验设置
本文实验选取自制的中药材图像数据库。包括青贝、松贝、珍珠贝、炉贝、莲子五类图像,每类药材图像数目为1000幅,一共5000 幅图像。数据库由不同光照,视点角度条件下拍摄的图像组成,图像大小均为128*128*3像素,JPG 格式。部分中药材图像如图5所示。
图5 部分中药材图像
实验过程中训练集和测试集的组成为:每类图像随机抽取500幅作为训练集,剩下的500 幅图像作为测试集。一次分类实验中,每类测试集用于测试,即共需测试2500幅图像。
4.2 特征权重对分类影响实验
为获得IHOG 和BLBP 最佳特征权重,实验对比了不同权重分配下中药材图像10次分类平均准确率。见表1。
表1 不同权重分类准确率比较
从表1 可看出,当α 为0,β 为1 时,平均准确率为86.62%;当α为1,β为0时,平均准确率为84.16%;当α、β均不为0 时,平均准确率提高到92%左右,其中当IHOG 和BLBP特征权重均为0.5时中药材图像平均分类准确率最高。
IHOG 和BLBP特征单独使用时仅体现了图像的形状特征或纹理特征;2 个互补特征进行不同权重组合能使图像内容特征描述更全面;其中当IHOG 和BLBP 特征权重均为0.5时显示出最优的权重分配,可见中药材图像数据库中图像的IHOG 和BLBP 特征对于表达图像内容信息贡献率相当。
4.3 特征提取算法对比实验
为验证IHOG 和BLBP 特征提取算法的有效性,实验对比了原始HOG (文献 [8]使用的HOG 方法)、IHOG、原始LBP、BLBP和特征权重均为0.5的IHOG、BLBP 特征组合 (本文方法)在中药材数据库中性能,如表2所示,表中时间表示一幅图像进行特征提取所耗时间,分类准确率代表10次平均分类准确率。
表2 特征提取算法在中药材数据库性能对比
通过表2可看出,BLBP相比原始LBP,特征维数降低了102.4倍,特征提取时间减少了16倍,但分类准确率提高了66.62%。IHOG 相比原始HOG 特征,特征维数降低了46.67倍,特征提取时间减少了14倍,分类准确率却提高了29.88%。本文方法结合IHOG 和BLBP特征,在保证特征维数、时间耗费较小情况下分类准确率达到93.56%。
IHOG 算法继承了原始HOG 描述子能描述图像局部形状信息、一定程度上抑制平移和旋转影响等优点,一定程度上简化了分单元的细节,使表征的范围大大的减少;BLBP算子在基本保留原始LBP 纹理特征的基础上,避免了空间位置混乱以及缩小了特征向量的维数。
4.4 检索性能实验
从中药材检索框架可知,本文的检索性能与分类结果密切相关。查询图像首先提取IHOG 和BLBP 组合特征,然后通过SVM 分类器获得预测类别,再对中药材图像数据库中与预测类别一样的图像进行欧式距离度量,最后根据距离大小依次返回检索结果图像。预测正确与否直接关系到最终的检索效果。
图像检索系统性能评价的重要指标是查准率和查全率。查准率 (precision)、查全率 (recall)公式如下
式中:m——检索结果的图像数量,x——在检索结果图像中与查询图像属于同类别的数量,测试集总图像数量为n幅图像中共有y 幅图像与要查询图像属于相同的类别。
实验利用本文方法分别计算青贝、松贝、珍珠贝、炉贝、莲子这五类的查准率和查全率。图6为对五类图像在图像检索系统的查准率折线图,图7是与图6相对应的图像检索系统的查全率的折线图。
图6 图像检索系统的查准率
图7 图像检索系统的查全率
图6中,图像检索系统的查准率基本保持恒定状态,其中珍珠贝、炉贝、莲子这三类的查准率接近1,青贝和松贝的查准率分别在0.8506和0.9374浮动。
图7中,青贝及松贝的查全率分别在0.8751和0.9218浮动。珍珠贝、炉贝、莲子这三类的图像查全率约为1。
由图6、图7对图像检索系统的查准率和查全率在平均检索次数下进行统计可知,青贝和松贝的查准率及查全率相对较低,而珍珠贝、炉贝、莲子的较高,这和查询图像预测类别相关,表3 列出了五类别一次分类的混淆矩阵,矩阵的每行代表一个实际类的实例,而每列代表在一个预测类的实例。
表3可看出,每一类取500张进行测试,其中500张松贝图像,只有410张分类正确,67张被预测为青贝图像,19张预测为珍珠贝,4张预测为炉贝,导致分类的准确率为82.0%。松贝和青贝的分类准确率相对较低,这是因为青贝和松贝类间相似度很大,容易导误分现象;珍珠贝、炉贝、莲子分别与其他类别之间的类间相似度较小,容易根据形状和纹理特征区别开来,从而分类准确率较高。显然,检索的查准率和查准率对易误分的青贝和炉贝就相对较低。
表3 分类结果的混淆矩阵
5 结束语
本文对原始LBP纹理特征及原始HOG 形状特征进行了改进,在提高分类精度的同时克服了维数很大的缺点。实验表明BLBP 纹理特征和IHOG 形状特征组合存在优势互补,将特征进行适当的特征权重联用能改善分类精度。本文提出的基于形状特征和纹理特征的中药材检索方法实验结果有效,具有很好的检索性能。下一步将在此基础上,研究特征组合权重的自适应设置。
[1]WU Yongguo,LI Deqiang,LUO Haibo,et al.Image retrieval method combining global description and local description[J].Computer Engineering and Design,2012,33 (2):634-638 (in Chinese).[吴永国,李德强,罗海波,等.融合全局和局部描述的图像检索方法 [J].计算机工程与设计,2012,33 (2):634-638.]
[2]Kebapci H,Yanikoglu B,Unal G.Plant image retrieval using color,shape and texture features[J].The Computer Journal,2011,54 (9):1475-1490.
[3]Mohd Anuar F,Setchi R,Lai Y.Trademark image retrieval using an integrated shape descriptor[J].Expert Systems with Applications,2013,40 (1):105-121.
[4]Zheng J,Shen F,Fan H,et al.An online incremental learning support vector machine for large-scale data [J].Neural Computing and Applications,2013,22 (5):1023-1035.
[5]Zhang Y,Wu L.Classification of fruits using computer vision and a multi-class support vector machine[J].Sensors,2012,12 (9):12489-12505.
[6]ZHANG Shuya,ZHAO Yiming,LI Junli.Algorithm and implementation of image classification based on SVM [J].Computer Engineering and Applications,2007,43 (25):40-42(in Chinese).[张淑雅,赵一鸣,李均利.基于SVM 的图像分类算法与实现 [J].计算机工程与应用,2007,43 (25):40-42.]
[7]Déniz O,Bueno G,Salido J,et al.Face recognition using histograms of oriented gradients [J].Pattern Recognition Letters,2011,32 (12):1598-1603.
[8]DING Xuedong,LIU Yuan,XIE Zhenping.Improvement of content-based image retrieval system by incrementally learning semantic attributes of images [J].Application Research of Computers,2014,31 (1):273-276 (in Chinese). [丁学东,刘渊,谢振平.增量学习语义属性的图像内容检索系统增强[J].计算机应用研究,2014,31 (1):273-276.]
[9]Mohamed A,Yampolskiy RV.Face recognition based on wavelet transform and adaptive local binary pattern [G].LNCS 114:Digital Forensics and Cyber Crime.Berlin:Springer Berlin Heidelberg,2013:158-166.
[10]Li L,Li S,Zhu H,et al.An efficient scheme for detecting copy-move forged images by local binary patterns[J].Journal of Information Hiding and Multimedia Signal Processing,2013,4 (1):46-56.
[11]GOU Bo,HUANG Xianwu.SVM multi-class classification methods[J].Journal of Data Acquisition and Processing,2006,21 (3):334-339 (in Chinese).[苟博,黄贤武.支持向量机多类分类方法 [J].数据采集与处理,2006,21 (3):334-339.]
[12]Gumus E,Kilic N,Sertbas A,et al.Evaluation of face recognition techniques using PCA,wavelets and SVM [J].Expert Systems with Applications,2010,37 (9):6404-6408.