基于SVM的图像分类算法研究
2017-12-21孟金龙丁超洋周慧吕爽
孟金龙++丁超洋++周慧++吕爽
摘要:互联网技术的飞速发展,使我们通过电子产品接触到大量的图像信息,开阔了我们的眼界,然而对于层出不穷的各种各样的图像,带给我们的不仅是丰富多彩的世界,还有对未知事物的疑惑,因此需要计算机具有理解图像的能力并且能自动把图像正确地分类。针对以上问题,本文提出了一个基于支持向量机(SVM)算法的图片分类方法,此方法结合图片的梯度直方图(HOG)特征,经过计算机学习训练,生成可以用来分类图像的分类器。
关键词:机器学习;图像分类;支持向量机
中图分类号:TP319 文献标识码:A 文章编号:1007-9416(2017)10-0123-02
1 支持向量机
支持向量机(support vector machine)是将一堆数据分成两个不同类别样本的二类分类模型,用其将训练样本分类后,与分类面平行并且离分类面最近的样本面上的训练样本就叫做支持向量(Support Vector)。分类是数据挖掘中及其重要的一步,而支持向量机就是基于学习理论的一种机器学习方法,对于每一个单一的数据svm根据它的特征向量去判断它的标签以此来确定样本的类别,并在此过程中提高学习机泛化能力,获得良好的分类结果。
2 SVM的基本思想
(1)最优分类面。要使支持向量机有良好的分类效果就需要找到一个最优分类面,使其在两类样本之间并且两类样本中离它最近的点都尽可能的离它远。因为测试集上我们观测到的数据与真实分布式有一定误差的,如果误差过大,分割面就会将训练样本类别分割错误,而最优分类面的误差容忍力士最强的。如图1所示,通过算法找到了最优的H1和H2,这就是我们训练出来的SVM。(2)核函数。在实际中,我们可以通过将空间映射到高维度来分类非线性数据,然而这种映射会出现很多新的维度从而带来大量的工作,而核函数可以用它们的点积来进行分类,内核通常是线性的,而如果使用非线性内核,我们只需要改变点积就可以得到一个非线性分类器,避免資源的消耗的同时能使分类操作更具灵活性和可操作性。
3 方向梯度直方图特征
方向梯度直方图(Histogram of Oriented Gradient),缩写为HOG,它先计算图像局部区域不同方向上梯度的值,并累积,得到直方图从而构成在计算机图像处理中用来进行物体检测的特征描述子。是目前计算机识别领域常用的描述图像局部纹理的方法。
HOG的中心思路:所检测的局部物体外形能够被光强梯度或边缘方向的分布描述。
具体实现:
(1)先将图像划分为小的细胞单元,并采集个像素点的梯度或边缘的方向直方图,组合构成特征描述器。(2)确定一个更大范围,计算各个直方图在该范围区间的密度a,然后根据a来对该范围内的细胞单元做归一化从而获得更好的效果。
由于HOG操作的是细胞单元,空间领域较小,因此不会对图像几何和光学的形变有太大的影响,而且得到的直方图就可以作为特征输入到分类器中。
4 图像分类
图像分类算法流程图如图2所示。
首先收集足够多的样本,让程序读取正、负样本图片并计算正负样本图像的HOG描述子,对正负样本赋予样本标签,将HOG特征、样本标签均输入到SVM中进行训练,最后生成分类器。将包含待分类图片输入到训练好的SVM分类器中,分类器通过比对Hog将图片分为A、B两类,达到图像分类的算法。
5 结语
丰富多彩的图像已经成为人们信息交流的一种必要方式,同时图像所传达的信息也会根据识别人的理解不同而发生改变,使得检索十分困难。利用机器学习的有关知识结合SVM和HOG特征完成图像的分类,有效的解决了该问题。它能够快速地从多种特征中找到对分类最有效的那一项,帮助用户识别并分类图像,给用户以方便。
参考文献
[1]张瑜慧,胡学龙,陈琳.基于支持向量机的图像分类[J].扬州大学学报(自然科学版),2007,(02):46-49.
[2]苟博,黄贤武.支持向量机多类分类方法[J].数据采集与处理,2006,(03):334-339.
[3]汪慧兰,赵海峰,罗斌.基于局部颜色空间特征的图像检索[J].计算机技术与发展,2006,(01):76-79.endprint