APP下载

基于多种特征的朴素贝叶斯的图像分类

2019-12-16徐昌王瑶舒福舟

电脑知识与技术 2019年30期
关键词:图像分类特征提取

徐昌 王瑶 舒福舟

摘要:为了实现对图像的分类,提出了一种基于多種特征的朴素贝叶斯方法。从数据图像集中提取灰度直方图特征、SIFT特征、SURF特征以及对数据集裁减的方式降低维度等四种特征,求取每一种特征下的图像的精确率、召回率、F1值以及对应的混淆矩阵。本文在数据集进行了分类实验,结果表明,采用SIFT特征描述的图像表示能够取得更好的分类结果。

关键词:图像分类;特征提取;朴素贝叶斯

中图分类号:TP311 文献标识码:A

文章编号:1009-3044(2019)30-0194-03

随着人工智能的来临,机器学习在各个领域的应用占据主要的成分。在大数据时代,面对海量的图像处理,传统的图像分类模式需要大量的人力资源,而且在图像分类上的精度不高,这种模式已经跟不上时代的步伐。为了节约成本和资源,提高图像分类的精度,从而转向人工智能的领域,希望找到更加有效的算法处理海量的图像,如朴素贝叶斯分类器算法、支持向量机算法和神经网络算法等。

本文通过朴素贝叶斯算法,分别采用四种特征提取_5_的方式,如:灰度直方图、SIFT特征、SURF特征和裁剪图像,来分析各个特征的平均精确率、平均召回率、平均Fl值以及混淆矩阵,从而判断分类效果的好坏。

1特征提取的方法

本文采用四种方式的特征方法对朴素贝叶斯分类器进行分析:

1)灰度直方图:灰度图像由256个灰度级,然后利用openCV库中的函数calcHist函数统计出每个灰度级上的像素个数。

2)SIFT特征:SIFT特征对于图像的尺度大小、旋转角度和明暗程度变化具有不变性特点,通过微分向量的方向和大小来确定一个主方向,求取主方向有关的特征并与图像的特征匹配,在图像的分类上获得了良好效果。

3)SURF特征:SURF特征基于行列式的局部斑点特征检测方法。利用图像的积分在不同的尺度上近似的计算出Hart小波值。

4)裁剪图片:先将图片做灰度化处理,在将灰度图像裁剪成64*64像素的图像。

2朴素贝叶斯算法原理

朴素贝叶斯算法先根据给定的训练数据集进行训练,生成一个贝叶斯模型,然后通过这个模型,把测试集数据带人这个模型进行测试。求出每一个测试数据在各个类别中的概率,在比较各个类别的概率,哪个概率最大就认为测试数据就属于这个类别,进而生成预测的标签,然后跟真实的标签进行比对,计算出每一个种类的识别精度以及混淆矩阵,采用如图1所示的方法进行图像分类。

3实验结果与分析

3.1数据描述

本实验所用的数据集的名称是color_1000,有1000张图像,总共分为10类,种类的样本图像如图2所示,每一类都含有100张图像。实验过程中随机抽取每个样本类别总数的80%作为训练数据样本,剩余的20%数据作为测试样本。

3.2实验结果分析

实验过程中提取四种特征即裁剪图片、灰度直方图、SIFT特征、SURF特征,通过朴素贝叶斯算法进行图像的分类,在提取不同特征后,通过每个类别的精确率、召回率、F1值、以及混淆矩阵判断分类效果的好坏。不同的特征提取在朴素贝叶斯算法上运行的结果不同。图像集分别进行仅裁剪图片、灰度直方图、SIFT特征、SURF特征的10类图片的召回率、准确率、F1值的平均值如表1所示。

从表中可以看出使用SIFT特征,图片的分类效果最好,将每张图片仅裁剪64*64个像素的分类效果最差。

图像集分别进行仅裁剪图片、灰度直方图、SIFT特征、SURF特征的10类图片精确率如图3所示,从图中可以看出仅裁剪图片和提取灰度直方图精确率的跳变比较大,而采用SIFT特征和SURF特征的方法在图像分类的效果比较好。

图片集分别进行仅裁剪图片、灰度直方图、SIFT特征、SURF特征的10类图片召回率如图4所示,从图中可以看出采取SIFT特征的方法在分类的效果是最好的。

图片集分别进行仅裁剪图片、灰度直方图、SIFT特征、SURF特征的10类图片F1值如图5所示。从图中可以看出采取SIFT特征的分类的效果在整体上是最好的。

表2、表3、表4分别是仅裁剪图片、灰度直方图、SIFT特征、SURF特征的10类图片的混淆矩阵,每一行数据代表每类图片经过算法预测后的标签的概率。其中对角线上的数据是每一类正确分类的精确率。

4结论

本文研究了一种基于多特征提取的朴素贝叶斯图像分类的方法,运用该方法对1000张图像数据集,使用四种特征的方式仅裁剪图片、灰度直方图、SIFT特征和SURF特征通过贝叶斯分类器进行分类,分析实验的精确率、召回率、F1值和混淆矩阵,结果表明在四种特征下采用SIFT特征的贝叶斯分类器的图像分类效果最好。

猜你喜欢

图像分类特征提取
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于Daubechies(dbN)的飞行器音频特征提取
基于数据挖掘的图像分类算法
基于云计算的图像分类算法
一种基于LBP 特征提取和稀疏表示的肝病识别算法
基于锚点建图的半监督分类在遥感图像中的应用
基于DSP的直线特征提取算法
基于MED和循环域解调的多故障特征提取
Walsh变换在滚动轴承早期故障特征提取中的应用