考虑颜色特征最优组合的CART决策树火灾图像识别方法*
2023-02-24李海,孙鹏
李 海,孙 鹏
(1.中国民用航空飞行学院民航安全工程学院,四川 德阳 618307;2.中国民用航空飞行学院民机火灾科学与安全工程四川省重点实验室,四川 德阳 618307;3.中国刑事警察学院公安信息技术与情报学院,辽宁 沈阳 110035)
0 引言
火灾事故作为常见的事故之一,对人们的生命安全和财产安全具有严重的威胁。据原应急管理部消防救援局发布的2020年全国火灾情况显示,2020年全年全国消防救援队共接报25.2 万起火灾事件,死亡1 183人,受伤775 人,直接财产损失40.09 亿元[1]。如何有效识别火灾是火灾事故预防关注的重要问题之一,由于视频图像具有高度真实性、易传输、易保存、抗干扰能力强等优势,火灾图像识别逐渐成为火灾预防领域的研究热点之一。
截至目前,国内外学者在火灾图像识别方面已进行大量研究,并取得重要突破。文献[2]针对复杂图像中火灾区域的检测问题,提出1 种改进的密集连接的卷积网络(DenseNet)深度神经网络架构;文献[3]针对火灾图像识别特征问题,提出1 种基于火焰尖角特征的火灾图像识别算法;文献[4]针对火灾图像识别特征问题,提出1 种基于张量对象特征提取的多线性主成分分析(MPCA) 深度学习算法;文献[5]基于大规模火灾图像数据集,以及地面实况复杂度图像是根据人类检测火灾存在或不存在所需的时间来量化的图片,提出4 种基于火灾探测特性的图像复杂度度量和1 个基于图像复杂度评估图像火灾检测算法性能的新方法;文献[6]提出基于参数优化的随机子空间-支持向量机(RS-SVM)分类器模型弥补过拟合和确定局部极值的不足,具有良好的可靠性和稳定性,提高火灾预报的准确性;文献[7]针对森林火灾图像识别中遇到的漏检和误检等问题,提出1 种基于K-Means聚类下样本熵值判别算法;文献[8]针对人为选择支持向量机(SVM)参数具有盲目性以及参数对其分类能力影响较大的特点,提出基于改进果蝇优化算法-支持向量机(FOA-SVM)的火灾图像识别模型;文献[9]针对火灾图像识别特征问题,基于迭代算法-支持向量机(Adaboost-SVM)集成算法提出1种新的基于Gabor滤波和局部二值模式(LBP)的多尺度局部纹理特征提取方法;文献[10]针对矿井下传统火灾识别方法准确率较低的问题,提出1 种基于改进FOASVM火灾图像识别融合算法;文献[11]为以更少的参数提取更高级别的特征,提出1 种用于深度伪造检测的轻量级三维卷积神经网络(3D CNN)模型;文献[12]提出1 个火控的耦合卷积神经网络模型(FC-MSPCNN),并提供1 个在有效脉冲周期内控制放电和放电神经元的参数设置方法;文献[13]提出1 种使用卷积神经网络的语义火灾图像分割方法;文献[14]基于机器视觉的火灾/烟雾检测方法进行完整的调查和分析;文献[15-16]针对火灾火焰识别算法复杂和对环境要求高的特点提出基于图像特征的火灾火焰识别方法,针对传统火灾探测中灵敏度不高、响应慢的问题,提出1 种基于特征融合的图像型火灾探测方法。
上述研究在各个方面均取得较好的效果,但也存在一些不足,具体表现如下:1)火灾图像识别过程中使用浅层深层特征、火焰形状特征的尖角特征、张量对象特征、支持向量机等,而并未使用直接表征火灾信息的颜色特征;2)模型训练过程中图像样本量较少;3)基于纹理特征的分类与回归树(CART)进行火灾图像的识别样本量少,同时纹理特征表征火灾图像的效果低于颜色特征;4)基于卷积神经网络对火灾图像库进行训练的模型识别精度较高,但是随着样本数据量的增多,运算负荷急剧增加。
综上所述,为研究适合火灾图像识别的最优颜色特征组合以及后续基于图像多维特征融合提高火灾图像识别准确率,本文基于火灾图像颜色特征融合CART决策树进行火灾图像方法的识别研究,研究结果对提高火灾图像识别准确率具有现实意义。
1 基本原理
1.1 颜色特征
本文基于常见的3 种色彩模式(Lab、RGB、HSV),利用偏色因子[17]及偏色因子间方差var[18-21]来表征常规场景与火灾场景下图像颜色特征。偏色因子及其方差var计算过程(以RGB色彩模式为例)如式(1)~(8)所示:
式中:r,g,b为分别为RGB色彩模式的红、绿、蓝分量信息;dr,dg,db是RGB色彩模式下图像各通道信息平均值;M,N为图像的像素维数;mr,mg,mb为RGB图像各个分量信息偏色平均值;kr,kg,kb为3 个分量偏色因子;var为偏色因子方差。
1.2 决策树算法
决策树(decision tree)是1 类常见的有监督机器学习预测模型,是对象属性与对象值之间的映射关系。常见的决策树算法有ID3 算法、C4.5 算法、CART算法,其中C4.5 算法继承ID3 算法的优点,其计算过程中基于信息增益率来选择属性,而CART算法主要使用基尼指数(Gini index)来选择划分属性。CART决策树具体算法流程如图1所示。对于决策树算法,最关键是如何选择最优划分属性,而CART决策树使用基尼指数,其克服ID3 算法与C4.5 算法分别用信息增益和信息增益率选择属性时偏向选择取值多的属性的不足。
图1 CART决策树算法流程Fig.1 Algorithm process of CART decision tree
1.2.1 信息增益
信息熵(information entropy)是决策树算法计算过程中度量样本集合纯度的1 种指标。设对于任意的集合D,第k类样本所占的比例为pk(k=1,2,…,),则集合D的信息熵Ent(D)计算过程如式(9)所示:
信息熵Ent(D)的值越小,表示集合D的纯度越高。
考虑到样本数越多的分支结点的影响越大,计算用属性a 对样本集D进行划分所获得的信息增益(information gain),其计算过程如式(10)所示。设a 有V个可能值{a1,a2,…,av},若使用a 对样本进行划分,则会产生V个分支点,其中第v个分支点包含集合中所有在属性a 上取值为Dv的样本,根据式(9)计算出Dv的信息熵,再考虑到不同的分支结点所包含的样本数不同,给分支结点赋予权重
对于信息增益Gain(D,a)而言,其值越大,则表示属性a 来对分类划分的纯度提升越大。
1.2.2 信息增益率
信息增益率是为了减少信息增益准则对可取值数目较大的属性有所偏好的不利影响,从而来选择最优的划分属性。增益率Gain_ratio(D,a)的定义如式(11)所示:
1.2.3 基尼指数
基尼指数的计算过程如式(12)所示:
式中:Gini(D)表示从数据集中随机抽取2 个样本,其类别标记不一致的概率,Gini(D)越小,则数据集的纯度越高。
属性a 的基尼指数计算过程如式(13)所示:
因此,选择基尼指数最小的属性作为最优划分属性,即a*=,A表示a 的集合。
1.3 方法
一次优化特征是指在Lab、RGB、HSV3 种色彩模式下,分别进行特征的随机组合,第1 次寻找最优组合特征。二次优化特征是指针对Lab、RGB、HSV 3 种色彩模式下优化的一次优化特征,基于混合叠加原理组成的新组合特征。本文方法的具体过程如图2所示。
图2 方法流程Fig.2 Flow chart of method
步骤1:收集火灾图像与非火灾图像样本集。
步骤2:基于Lab、RGB、HSV3 种色彩模式提取火灾与非火灾样本库颜色特征数据,即Ka、Kb1、Var1;Kr、Kg、Kb2、Var2;Kh、Ks、Kv、Var3。
步骤3:首先在Lab、RGB、HSV色彩模式下分别基于粗略决策树、中等决策树、精细决策树寻找一次优化特征,然后基于混合叠加原理组合为二次优化组合特征。
步骤4:基于步骤3 寻找的最优组合特征以及样本图像进行CART决策树模型的训练,并进行验证准确度与测试准确度计算。
步骤5:依据步骤4 的测试准确度数据判断其大小是否满足火灾图像识别精度要求,如果不满足要求,调整分裂数数量,优化CART参数或更换训练样本集,直至找到测试准确度最高的CART决策树模型。
2 实验结果与分析
2.1 构建样本集
为了验证本文方法的有效性,使用自建数据库进行实验,自建数据库图像源于Canon EOS80D相机拍摄的模拟真火场景以及网上森林火灾图像。图像库总计7 775张,其中火灾图像3 777 张,非火灾图像3 998 张,并按3 :1 的比例随机分为训练集和测试集。火灾图像包括基于红色背景、绿色背景、蓝色背景在晴天自然光、阴天自然光、暗箱无光3 种光照条件下所拍摄的火灾场景,各400 张,共计1 600 张,以及400 张源于互联网的森林火灾图像中随机抽取的177 张图像,总计3 777 张;非火灾图像包括基于红色背景、绿色背景、蓝色背景在晴天自然光、阴天自然光、暗箱无光3 种光照条件下所拍摄的常规场景,各400 张,共计1 600 张,以及随机拍摄的日出、日落、校园外景、教学楼内室等398 张非火灾场景图像,总计3 998 张。
2.2 寻找最优特征组合
2.2.1 Lab 色彩模式下优化组合特征
为研究各种组合特征预测火灾图像的的优劣性,采用数理统计方法对3 个特征进行排列组合,总计7 组表1为Lab 色彩模式下颜色特征指标编码及3 种决策树精度大小分布,Lab 色彩模式下颜色特征组合预测火灾图像精度大小分布如图3所示。结合表1和图3可以看出,Lab 色彩模式下“Kb1 +Var1” (6号特征)特征组合预测精度最高。
图3 Lab色彩模式下火灾图像识别精度大小Fig.3 Accuracy of fire image recognition in Lab color mode
表1 Lab色彩模式下特征编号及决策树精度大小分布Table 1 Feature number and size distribution of decision tree accuracy in Lab color mode
2.2.2 RGB色彩模式下优化组合特征
为了研究各种组合特征预测火灾图像的优劣性,采用数理统计方法对4 个特征进行组合,总计15 组(M=。表2为RGB色彩模式下颜色特征指标编码及3种决策树精度大小分布,RGB色彩模式下颜色特征组合预测火灾图像精度大小分布如图4所示。结合表2和图4可以看出,RGB色彩模式下“Kg+Kb2 +Var2”特征(14 号特征)组合预测精度最好。
图4 RGB色彩模式下火灾图像识别精度大小Fig.4 Accuracy of fire image recognition in RGB color mode
表2 RGB色彩模式下特征编号及决策树精度大小分布Table 2 Feature number and size distribution of decision tree accuracy in RGB color mode
2.2.3 HSV色彩模式下优化组合特征
为了研究各种组合特征预测火灾图像的优劣性,采用数理统计方法对4 个特征进行组合,总计15 组(M=。表3为HSV色彩模式下颜色特征指标编码及3种决策树精度大小分布,HSV色彩模式下颜色特征组合预测火灾图像精度大小分布如图5所示。结合表3和图5可以看出,HSV色彩模式下“Kh +Ks+Kv” (11 号特征)特征组合预测精度最好。
图5 HSV色彩模式下火灾图像识别精度大小Fig.5 Accuracy of fire image recognition in HSV color mode
表3 HSV色彩模式下特征编号及决策树精度大小分布Table 3 Feature numbers and size distribution of decision tree accuracy in HSV color mode
综上所述,本文选用Lab、RGB、HSV3 种色彩模式下的优化特征构建决策树,特征组合为“Kb1 +Var1 +Kg+Kb2 +Var2 +Kh +Ks+Kv”。
2.3 实验结果
针对上文数据集和最优特征组合,应用CART决策树方法提取决策树。表4为不同类型树与CART决策树准确度对比结果,由表4可知,对于验证准确度而言,子空间KNN集成树验证准确度最高,可达90.92%,其次为CART决策树,验证准确度达90.54%,其他决策树和集成树验证准确度均低于子空间KNN 集成树与CART决策树;对于测试准确度而言,CART决策树准确度最高,可达84.50%,而其他决策树和集成树测试准确度均低于CART决策树。表5为CART决策树不同交叉折数下火灾图像识别准确度对比结果,由表6可以看出,9 折交叉验证测试准确度最高,可达86.47%,交叉验证折数越高,验证准确度也呈现螺旋式增长态势,但是测试准确度不会随交叉验证折数的增长而增长。
表4 不同类型树与CART决策树识别准确度对比Table 4 Comparison of recognition accuracy between different types of trees and CART decision tree
表5 CART决策树在不同交叉折数下识别精度对比Table 5 Comparison of recognition accuracy of CART decision tree under different cross fold numbers
3 结论
1)3 种色彩模式下的颜色特征对于火灾图像识别表征效果较好,在Lab 色彩模式下最优颜色特征组合为“Kb1 +Var1”,其验证准确度为74.5%;在RGB色彩模式下最优颜色特征组合为“Kg+Kb2 +Var2”,其验证准确度为78.8%;在HSV色彩模式下最优颜色特征组合为“Kh +Ks+Kv”,其验证准确度为83.9%。
2)不同类型决策树和集成树对于火灾图像识别的验证准确度与测试准确度差异较大,子空间KNN集成树对火灾图像识别的验证准确度最高,但其测试准确度较低;而CART决策树对于火灾图像识别的验证准确度次之,同时CART决策树对于火灾图像的测试准确度最高,这反映出子空间KNN集成树训练模型存在过拟合现象,泛化能力较弱,其原因是验证准确度与测试准确度相差较大。
3)除子空间KNN集成树外,与其他决策树模型相比,CART决策树的验证准确度与测试准确度均最高,同时验证准确度与测试准确度之差也明显最小,这也表明CART决策树模型的泛化能力较好。
4)考虑颜色特征最优组合的CART决策树火灾图像识别方法为火灾图像多维特征融合识别提供基础,其重在考虑颜色特征对于火灾图像识别的贡献度。火灾图像的特征还包括纹理特征、多边形特征等,这些特征对于火灾图像识别均具有一定的贡献度,在后续的研究中还要从纹理特征、多边形特征、多特征融合等角度出发,基于机器学习等方法进行火灾图像识别方法的研究,从识别精度及效率等方面优化火灾图像识别效能,为火灾事故预防提供方法基础。