Lib SVM在彩色图像分类中的应用

2018-09-03耿艳萍张建英

无线互联科技 2018年16期

耿艳萍，张建英

（山西大学软件学院，山西太原 030013）

图像分类是图像处理的基础，是通过计算机技术定量地分析图像像素和区域，把图像划分为某一类别的技术[1]，是计算机视觉领域的核心问题。现实中，有很多不同的实际应用，如人脸识别、视频监控分析、医疗影像分析等。支持向量机（Support Vector Machine，SVM）是机器学习常用方法，其理论基础是统计学习，SVM原理是用分离超平面作为分离训练数据的线性函数，解决非线性分类问题[2]。在图像分类时有很好的效果，尤其是样本数量有限，分类泛化能力更佳[3]。图像分类时，在特征提取方面，单一特征不能获取图像的完整信息，故分类效果比较差。多特征融合，可以获取互补的图像信息，分类效果更佳[4]。在本文中，主要提取彩色图像的颜色特征和纹理特征，在此基础上，采用Lib SVM方法对图像进行分类，不同特征的组合（进行特征融合）及类别数目对分类结果有一定影响，Lib SVM参数的设置对分类结果也有很大影响，本文经过多次实验，获取了最有效的特征组合，和最优参数设置，对分类准确率有了很大的提高。

1 颜色特征

任意获取一幅彩色图像，颜色特征在视觉上是很直观的，是图像的重要性质[5]。本文采用简单有效的方法：颜色矩来描述图像的颜色特征。颜色信息主要集中在低阶矩中，图像中任何一种颜色分量都可用它的一阶矩（均值）、二阶矩（方差）、三阶矩（倾斜度）来描述颜色分布特征。在本文的实验中，图像的颜色特征用9个分量来表示（3个颜色分量RGB，每个分量上3个低阶矩）。如：有N个像素的一幅彩色图像，pi,j表示第i个颜色通道中，灰度为j的像素出现的概论。

公式（1）为一阶颜色矩的计算方法，描述图像颜色明暗度。

公式（2）二阶颜色矩的计算方法，描述图像颜色分布范围。

公式（3）三阶颜色矩的计算方法，描述图像颜色分布的对称性。

2 纹理特征

2.1 Tamura纹理特征

从视觉心理学的角度，Tamura等人提出了6个纹理特征[6]：coarseness（粗糙度），刻画纹理基元（组成纹理的基本单位）的大小和重复次数；contrast（对比度），统计图像的灰度分布情况；directory（方向度），衡量纹理的方向性；rgularity（规则度），刻画纹理的规律性；linkness（线性度）；roughness（粗略度），对比度和粗糙度的和。这些纹理特在图像识别、图像合成方面都有很好的应用。

2.2 统计特征

图像的统计特征是对图像的像素分布情况进行统计，从而描述图像的全局信息，常用的统计特征有：熵值、均值、方差等。具体计算方法如下：

公式（4）计算熵值，其中pi为图像中k种灰度值出现的概率。

对于一幅M×N的图像，某一点（i，j）的灰度值用f（i，j）表示，用公式（5）计算图像的灰度算术均值。

公式（6）为灰度方差的计算方法，反映了整幅图像的灰度均值与图像中每一像素灰度值的离散程度。

本实验提取了图像的上述3个统计特征。

2.3 特征融合

本实验所选corel图像库中的图像都是彩色图像，颜色是图像的关键特征，辨识度较高。Tamura特征和统计特征刻画图像其他某方面的特征。本实验中提取了3类图像特征，这些特征对不同类别的图像在分类时所起的作用不同，所以融合不同的特征能提高图像分类的准确度，实验中融合了颜色特征9个，Tamura特征6个和统计特征3个，形成一个能从多方面，多角度描述图像特征的18维综合特征向量T=（C1，C2，C3，C4，C5，C6，C7，C8，C9，T1，T2，T3，T4，T5，T6，P1，P2，P3），对次实验证明多特征融合比单一特征对图像分类更有效。

3 图像分类算法

本实验分类算法的流程如图1所示。

图1 实验分类算法流程

SVM，从样本的特征入手分析对象，预测对象的属性类别。通过支持向量（Support Vector）能够使经验误差最小，几何边缘最大的分类过程[7]，其特点在于在某种程度上解决了样本容量小、非线性等分类中遇到的困难，一定程度上解决了分类模型局部最小的问题，提高了分类的精度。

实验中对支持向量机的具体实现采用台湾大学林智仁教授设计开发的工具包—Lib SVM（Library for Support Vector Machines）—进行图像分类。Lib SVM主要由以下几个函数组成。

（1）svm_scale，对训练数据和测试数据做归一化处理，一般情况，把数据缩放到[-1,1]或[0,1]；（2）svm_train，对样本分类建模，提供优化参数；（3）svm_predict，利用上一步已建模型，对测试数据进行分类。

4 实验结果分析

4.1 实验设置

实验从corel图像库中选择花、食物、建筑、大象、车5类图像各80张，并归一化成512×512的图像；其中每一类随机选取40张作为训练集，另外的40张作为测试集。在Win7系统下采用了MATLAB R2016a，Lib SVM-mat-3.0-1，MinGW-64编译器等软件进行实验。

4.2 实验结果

如表1所示，分类正确率=正确分的该类的数目/测试集中该类的总数。

Lib SVM可以实现多分类，图像分类的种类越多时，系统进行分类的难度就越大，分类的准确率就越低。实验中只选两种样本种类（动物类，食物类）时，分类准确率可达100%，当选3种样本种类（建筑类、动物类、食物类）时，识别准确率可达95%，而再加入花和车后，分类准确率明显下降。在corel图像库中，花和食物色彩多样鲜艳，颜色特征对花和食物的分类很有效；建筑类和车类，棱角清晰，线性感较强，Tamura纹理特征对建筑对这两种分类更有效。