面向火灾图像的特征提取与识别方法研究
2015-04-29朱晨捷郑灵凤叶炜朱蓉
朱晨捷 郑灵凤 叶炜 朱蓉
摘 要: 提出了一种针对火灾图像进行处理的特征提取及识别方法。首先,通过建立颜色直方图提取火灾图像与非火灾图像的颜色特征;然后,利用尺度不变特征变换算法计算两类图像的局部特征,并利用主成分分析法对两类图像特征进行降维处理,再针对降维处理后的图像特征采用K均值聚类算法进行计算;最后,针对测试图像库中的图像数据,经过颜色直方图初判、局部特征与聚类中心对比等步骤获得识别结果。该方法能够将火灾图像有效、快速地识别出来,以达到及时报警的效果。
关键词: 火灾图像识别; 颜色直方图; 特征提取; 尺度不变特征变换; 主成分分析法; K均值聚类
中图分类号:TP39 文献标志码:A 文章编号:1006-8228(2015)12-26-04
Research on feature extraction and recognition method for fire image
Zhu Chenjie, Zheng Lingfeng, Ye Wei, Zhu Rong
(College of Mathematics and Information Engineering, Jiaxing University, Jiaxing, Zhejiang 314001, China)
Abstract: In this paper, a method of feature extraction and recognition for fire image is presented. The color features of fire images and non-fire images are extracted respectively via the establishment of color histograms. Then, the local features of these two kinds of images are computed by using SIFT (Scale Invariant Feature Transform) algorithm, and reduce the dimension by using PCA (Principal Component Analysis) method and those processed local features are calculated by K-means clustering algorithm. The recognition results are obtained by the prejudgment of color histograms and the comparison of local features with clustering centers. It is proved by experiments that the proposed method can recognize the fire image effectively, and can achieve a good result in early-warning.
Key words: fire image recognition; color histogram; feature extraction; Scale Invariant Feature Transform (SIFT); Principal Component Analysis (PCA); K-means clustering
0 引言
由于每年发生的不同程度的火灾给人们带来了巨大的经济损失,因而对火灾监控和火灾发生后及时报警进行研究一直是研究者关注的重点。传统的火灾报警是通过烟雾、温度来进行检测,相比基于图像的检测方法准确率低。因此,本文提出了一种基于图像内容的火灾识别方法。
通常,火灾图像上会呈现一些显著的特点,从图1给出的这些火灾图像中可见,火焰区域多数呈橘红色,烟雾区域多数呈灰白色;从纹理上看,火灾区域与其他区域的区别比较明显。
本文在深入分析火灾图像颜色和纹理特性的基础上,提出了一种基于颜色直方图、尺度不变性特征变换(Scale Invariant Feature Transform,简称为SIFT)算法和K均值聚类算法的火灾图像特征提取与识别方法。该方法能够有效地利用火灾图像在颜色和纹理上远胜于其他图像视觉信息的辨识度的优势,将火灾图像与非火灾图像有效地区分开来。具体步骤为:①运用颜色直方图方法提取图像的颜色特征,再利用SIFT算法计算两类图像的局部特征,并采用主成分分析法(Principal Component Analysis,简称为PCA)对特征进行降维处理;②采用K均值聚类算法针对降维处理后的局部特征计算出两類图像各自的聚类中心;③在测试图像库中的若干幅图像数据上进行实验验证,经过颜色直方图初判、局部特征与聚类中心对比等步骤获得较好的识别结果。
1 相关研究介绍
有关SIFT算法已有许多研究和应用。例如,在文献[1]中,作者通过划分重叠的特征区域,计算各自对应的SIFT特征相关度,实现了人耳的精确识别。在文献[2]中,作者结合卡尔曼滤波算法的预测性,运用SIFT特征加以辅助跟踪,并充分利用SIFT特征对旋转、缩放、亮度等变化保持不变的优点,对视频不同帧的不同匹配目标区域的位置进行独立预测,以达到实时跟踪车辆的目的。在文献[3]中,作者利用SIFT特征描述子表述相邻帧的图像像素,克服了传统使用光流实现弱小目标检测和跟踪的缺点,为处理红外弱小目标提供了新的思路。
有关火灾图像识别,近几年的研究取得了较大进展。在文献[4]中,作者选用HSI颜色空间,通过确定色度分量H和亮度分量I的初始聚类中心,分别在直方图特征空间进行模糊聚类处理,从而实现了火灾图像的识别处理。在文献[5]中,作者采用图像灰度化和二维熵最大阈值法对图像进行预分割,得到火焰疑似区域,再对火焰图像进行分析与决策,以达到鉴别火灾图像的效果。
从以上研究可知,充分利用图像视觉特征能够较好地将火灾图像与非火灾图像区分开来。因此,本文在深入分析火灾图像在颜色和纹理特征上的显著特性基础上,提出了一种基于颜色直方图、SIFT算法和K均值聚类算法的火灾图像特征提取与识别方法,旨在有效地对火灾图像进行识别,进而做到及时报警。
2 基于SIFT算法和K均值聚类的特征提取与识别方法
2.1 HSV颜色直方图
作为一种区分图像内容的主要特征,颜色特征的提取与处理在图像识别过程中占据了重要位置。在图像处理中,常用的图像颜色模式有两种:RGB颜色模型和HSV颜色模型。其中,RGB颜色空间采用物理三基色表示,适合彩色显像管工作,但不适合彩色图像的处理;而HSV颜色模型不仅可以清晰地将图像中的颜色特征和亮度特征相区别,其在颜色的表示上所采用的色调及色彩饱和度更接近人眼感受颜色的方式。故HSV颜色模式在颜色特征检测方面较RGB模式更适合。
假设一幅图像在区间[0,I]内共有T个灰度级,则定义其灰度直方图为如下函数:
⑴
其中,是区间[0,I]内第m级亮度,nm是灰度级为像素总数,m=1,2,…,T。
归一化直方图后得到:
⑵
其中,表示灰度级出现的频率。
2.2 尺度不变性特征变换算法
一幅图像的尺度空间被定义为函数C(x,y,σ),它是尺度变化的高斯函数G与图像Im的卷积:
⑶
⑷
SIFT算法[6]是一种检测图像局部特征的算法,它具有尺度不变性的特点,即在改变旋转角度、图像亮度或拍摄视角的状态下,仍能得到很好的检测效果。
SIFT算法提取图像特征点主要有以下三个步骤。
步骤1 建立图像的DOG(Difference-of-Gaussian)金字塔,在DOG尺度空间中的26个领域中检测极值,D(x,y,σ)是两个相邻尺度图像之差,即
⑸
如果一个点在DOG尺度空间本层以及上下两层26个领域中是最大或最小值时,就认为该点是图像在该尺度下的一个特征点。
步骤2 利用关键点邻域像素的梯度方向分布特性,为每个关键点指定方向参数,使算子具备旋转不变性。
⑹
⑺
公式⑹、⑺分别为(x,y)处梯度的模值和方向公式。其中:C所用的尺度为每个关键点各自所在的尺度。
步骤3 生成SIFT特征向量,将坐标轴旋转到特征点方向以保证旋转不变性。然后,以关键点为中心取8×8的窗口,利用公式⑹、⑺求得每个像素(i,j)的梯度幅值F(i,j)与梯度方向θ(i,j),箭头方向代表该像素的梯度方向,箭头长度代表梯度模值,再用高斯窗口对其进行加权运算,每个像素对应一个向量,长度为F(i,j)*G(σ',i,j)。其中G(σ',i,j)为该像素点的高斯权值,方向为θ(i,j),在实际应用中可采用4×4个小窗口,这样每个特征点就可用128维向量来表征。
2.3 PCA方法
PCA方法是利用降维的思想,将多个变量转化为少数几个综合变量,这些综合变量能够反映原始变量的绝大部分信息,且所含的信息互不重叠[7]。
PCA方法的基本步骤如下。
步骤1 原始指标数据的标准化采集m维随机向量L=(L1,L2,…,Lm)T,n个样品Li=(Li1,Li2,…,Lim)T,i=1,2,…,n,(n>m),构造样本阵,对样本阵元进行标准化变换,得到标准化矩阵B:
⑻
其中:,。
步骤2 对步骤1中得到的标准化阵B求相关系数矩阵
⑼
其中:。
步骤3 求解特征方程|B-σIp|=0,得到p个特征根,用以确定主成分(g值得确定保证信息利用率达85%以上)。对每个σj(j=1,2,…,g),求解方程组Cv=σjv得到单位特征向量。
2.4 K均值聚类
K均值算法是目前最常用的聚类算法之一,其目的是使各个样本与所在类别均值的误差平方和达到最小。K均值算法原理简单、具有计算速度快的特点,故在实际应用非常广泛。
假设要将n个数据对象聚集为K个类别,使用K均值算法的主要步骤为:
步骤1 从n个数据对象中随机选择K个对象作为初始聚类中心;
步骤2 根据每个聚类对象的中心对象,计算每个对象与这些中心对象的距离,并根据最小距离重新对相应对象进行划分;
步骤3 计算新的中心对象,返回步骤2,当每个聚类不再发生变化时停止。
3 实验结果与分析
为验证本文中提出的方法的有效性,我们从互联网上下载了600幅与火灾相关的图像和1100幅非火灾图像,其中500幅火灾图像和1000幅非火灾图像用于训练过程,余下的100幅火灾图像和100幅非火灾图像用于测试过程。
训练过程和测试过程的算法流程图分别如图2和图3所示。
[开始][从训练库中导入图像][图像预处理][计算图像的HSV颜色空间特征][该图像是否为火灾图像?] [保存火灾类图像的HSV颜色空间特征][找出火灾类图像的共有颜色特征][计算局部性特征][训练库图像是否读入完毕?] [主成分分析降维][K均值聚类][分别得到火灾类图像的聚类中心和非火灾类图像的聚类中心][结束] [Yes] [No] [No][Yes]
图2 训练过程
[开始][从测试库中导入图像][图像预处理][计算图像的HSV颜色空间特征][是否與火灾类图像的共有颜色特征存在重叠?] [计算局部性特征][主成分分析降维][设接近火灾类图像的特征点数为a的初值为0,接近非火灾图像的特征点数为b的初值为0][从测试图像特征点中提取
一维特征点][计算该特征点与火灾类图像聚类
中心距离L1][计算该特征点与非火灾类图像聚类
中心距离L2][L1
图3 测试过程
假设训练库中训练图像SIFT得到的特征点为200×128维,在PCA降维后的得到的特征点为30×12维,现在有一幅测试图像I,假设其HSV颜色空间中与火灾图像的共有颜色特征存在重叠,计算其降维后的30×12局部特征,接近火灾图像的特征点数为a,接近非火灾图像的特征点数为b,其某一特征点与火灾类图像聚类中心距离为L1,与非火灾类图像聚类中心距离为L2(本文中采用欧式距离公式计算距离值),则可以通过计算L1与L2之间的距离差值来获得该特征点接近的图像,最后通过计算a所占比例获得图像I的识别结果。若a/(a+b)>0.5,则该图像识别为火灾类图像,否则,该图像识别为非火灾类图像。
图4-图6分别给出了三幅示例图像的识别结果。图4中的图像得到的计算结果为0.7333,其值大于0.5,判定为火灾图像;图5中的图像得到的计算结果为0.2333,其值小于0.5,判定为非火灾图像;图6中的图像由于其HSV颜色空间中与火灾图像的共有颜色特征不存在重叠,所以直接判断为非火灾图像。表1给出了针对100幅火灾图像和100幅非火灾图像的测试结果。
从实验结果可知,本文提出的方法获得了较高的正识率和较低的误检率,能够有效地将火灾图像和非火灾图像区分出来。部分图像也存在误识,其原因可能是:有些非火灾图像的纹理与火灾区域非常接近,而有些火灾区域的纹理比较特殊,有异于寻常火灾区域的纹理,所以出现了错误的识别。
4 结束语
随着当前智能信息系统在各行各业的普及,针对火灾这种具有重大危害的事件进行早期自动报警,能够有效地控制事态的进一步发展。本文提出的方法能够有效地将火灾图像和非火灾图像区分出来。基于该方法研发的智能火灾报警系统区别于传统的感烟、感光火災监测,具有重要的科学意义与应用价值。
参考文献(References):
[1] 雷松泽,姚红革,齐敏,郝重阳.基于SIFT特征的人耳识别[J].
计算机应用,2009.6:1690-1693
[2] 尤优,詹智财,张松松.一种基于SIFT特征的车辆跟踪系统实
现[J].电脑知识与技术,2011.23:5695-5697
[3] 牛志彬,周越.基于SIFT流红外弱小目标的检测和跟踪[J].微
型电脑应用,2010.1:37-39
[4] 方维,王慧琴,杨娜娟,厉谨.基于改进FCM聚类算法的火灾
图像分割[J].计算机仿真,2011.4:246-249
[5] 郝东东,展美宁.基于BP神经网络的火灾图像识别技术[J].硅
谷,2011.20:109
[6] David G.Lowe. Distinctive Image Features from Scale-
Invariant Keypoints[J].International Journal of Computer Vision,Nov2004:91-110
[7] 朱星宇,陈勇强.SPSS多元统计分析方法及应用[M].清华大
学出版社,2011.