基于融合特征稀疏编码模型的车辆品牌识别方法
2020-05-25赵池航张小琴李彦伟薛善光毛迎兵
石 鑫,赵池航,张小琴,李彦伟,薛善光,毛迎兵
(1.河北交通职业技术学院 土木工程系,河北 石家庄 050011;2.东南大学 交通学院,江苏 南京 211189;3.河北省交通规划设计院 公路建设与养护技术、材料及装备交通运输行业研发中心,河北 石家庄 050011)
0 引 言
车辆品牌类型信息已成为公共交通服务、交通运行监管和安全防护等行业中的数据处理与分析的基础,因此,研究基于图像的车辆品牌识别方法已经成为智慧交通系统车辆管理和维护工作中的重要课题[1]。基于稀疏表征的车辆品牌识别方法是在给定的字典(车型品牌库)中选择部分相关类型的信息表示车脸图像,其目标是利用选择的原子对与原始图像同类的不同样本形成较好的表达能力。为了使字典中的原子能够正确表示存在自然噪声的车脸图像,常用做法是不断增加车脸图像的训练样本,但是训练样本的成倍增加将导致识别速度大幅降低;同时,为了提高车辆品牌的识别率和精度,需要对二维车脸图像按行或列展开,组合成一维特征向量,这既增加计算复杂度,也忽略了图像矩阵中固有的局部结构信息。
特征融合的目的是为了挖掘具有相互补充和增强描述能力的潜在特征,这些特征信息可以来自同信息源或异信息源。本文提出的基于融合特征稀疏编码模型的车辆品牌识别方法,是将待识别车辆品牌的车脸图像一级提取特征作为过完备字典中训练图像集的线性组合,通过寻找稀疏分解得到最佳稀疏系数,从而得到有效描述车辆品牌类型特征的内在结构及特征信息之间的关联性信息,大大提高车辆品牌类型的识别效率。
1 方向梯度直方图
方向梯度直方图(Histogram of Oriented Gradient, 简称HOG)[2]是由Dalal和Triggs提出的一种纹理特征提取方法,主要思想是在梯度或边缘的特定位置不确定的情况下,借用图像的局部梯度变化的方向分布来实现对图像局部的纹理外观描述,其优势在于图像几何和光学的形变都能保持很好的不变性。采用方向梯度直方图提取车脸图像纹理特征的过程如下。
(1)将车脸图像分割成大小相同的单元格,并利用梯度提取算子对每个单元格进行卷积计算,得到每个像素点的梯度值的大小和方向,然后将车脸图像的360°方向划分成所需的级数。
(2)根据车脸图像中像素点梯度方向的梯度值进行累加,形成不同方向的直方图;将车脸图像分成若干个包含小单元格的块,对单元格采用Gamma矫正法调节对比度,滤除光线阴影等因素的影响。
(3)将每个单元格提取到的车脸HOG特征进行首尾串联,组成整个车脸图像的一维特征向量。
本文将单元格大小定义为64×64 pixels,胞元大小为64×64 pixels,胞元增量横向、纵向均为64 pixels,应用梯度滤波器[-1,0,1]获取图像的梯度直方图,每个像素点的梯度0°~180°内分为9级。对图1(a)中的上海大众车脸图像提取方向梯度直方图特征,如图1(b)所示,特征维数为288维。
图1 车辆图像的HOG特征提取
2 融合特征稀疏编码模型
稀疏编码模型将某种类别中的每幅图像都作为多个基函数的线性组合[3],当把该图像投影到由基函数张成的特征子空间上时,只有部分基函数上的投影权值较大,大部分基函数上的投影值很小或为0,从而形成对该图像的稀疏表示。本文提出的融合特征稀疏编码模型是将车脸图像的一级抽象HOG特征作为过完备字典中训练样本集的线性组合,通过寻找稀疏分解得到最佳稀疏系数,得到有效描述车辆品牌特征的内在结构及特征信息之间的关联性信息。
假设车脸图像为I,则I(x,y)为车脸图像的灰度像素值,(x,y)为像素的空间坐标,定义一级抽象HOG特征变换函数
Tt=Γ1(I(x,y))
(1)
式中:t为特征维数。
视觉感知系统通过对外界刺激产生的感受野特征,将其表达为视觉细胞的活动状态,该过程可用信息编码模型来描述,即
(2)
式中:ti为模拟初级视觉系统主视皮层V1区感受野的特征基向量;αi是随机稀疏系数矢量,表示对各个基函数的响应,并对应主视皮层V1区简单细胞神经元的活动状态;ε假设为高斯白噪声。对于变换后的Tt信号,Α为变换后信号组成的训练样本空间;y为测试图像转换组合而成的列向量;A表示基函数;x为稀疏向量。
当稀疏向量ti的l0足够稀疏时,则有
(3)
式(3)与l1最小化问题的解同解,即
(4)
如果式(4)中的线性约束不成立,就可以将其转化为下列无约束优化问题,即
(5)
从神经生理学的角度出发,V1区神经元细胞对较弱的背景刺激较为敏感,而且刺激不能为负值。根据一级HOG提取特征都是非负性的,则可以对车脸特征信号进行非负性稀疏表示。将Lee等人的非负矩阵分解算法(Non-negative Matrix Factorization,NMF)和Olshausen等人提出的标准算法相结合,则形成一种非负稀疏编码算法,其目标函数定义为
(6)
其中,约束条件λ>0;稀疏向量x的稀疏性由惩罚函数的具体形式决定,定义为
f(x)=|x|=x(x≥0)
(7)
因此,目标函数式(6)在非负性条件下等价于
(8)
xi+1=xi.*{(ATy)./(ATAy+λ)}
(9)
采用式(9)更新规则来实现x的迭代过程,则更新后的x仍然满足非负性,因为其更新过程是通过乘以一个非负因子(ATy)./(ATAy+λ)来实现的。只要稀疏向量x的初始值设置为正数,那么在x的迭代过程中,对任意要求的精度都能够收敛到全局最小值。给定x不变,考虑A的优化问题,采用标准的梯度下降算法,得到A的更新规则为
(10)
式中:μ为学习步长;β为学习速率。只要步长μ>0且足够小,投影梯度算法就可以保证减小目标函数值。
对于给定的k类车辆品牌图像,通过对训练样本进行字典学习,可获得m个最适合重构车辆品牌图像的基函数集合。对于任意的测试样本,计算其用每种基函数集合进行稀疏表示的重构误差,对应于重构误差最小的类别为该车辆品牌的所属类别。令每个车辆品牌类下的每个样本用v中的一个列向量来描述vini,若第i类包含ni个样本,则有
(11)
若y属于第i类,则有
y=ai1vi1+ai2vi2+…+ainivini
(12)
通过求得的稀疏解向量重构出各类车脸图像,并与原始测试样本对比求残差,分类规则为重构残差最小的为该所属车辆品牌类型。
图2 东南大学车脸数据库的部分图像
3 试验分析
试验采用东南大学的车脸数据库,该数据库部分图像如图2所示,包含30类车辆品牌类型,每类图像400幅,共12 000幅图像,涵盖奥迪、别克、比亚迪、长安、奇瑞、雪佛兰、雪铁龙、东风、中国一汽、福特、福田、重汽、长城、本田、现代、江淮、日产、铃木、丰田、上海大众、五菱、海马、起亚、标致、跃进、威望、吉利、通用、启晨和五征等车辆品牌。为考察基于融合特征稀疏编码模型的车辆品牌识别方法的有效性,随机选取东南大学车脸数据库中的7 500幅图像作为训练样本集(数据库的67.5%,每类车辆品牌250幅),剩余的4 500幅图像作为测试样本集(数据库的32.5%,每类车辆品牌150幅),进行以下对比试验。
本文通过试验与基于单特征HOG及支持向量机(SVM)的车辆品牌分类方法、基于传统稀疏表示的车辆品牌识别方法、基于字典学习稀疏表示的车辆品牌识别方法进行对比分析[4-5],试验结果统计如表1所示,其中基于融合特征稀疏编码模型的车辆品牌识别方法的性能优于HOG+SVM、传统稀疏表示和字典学习稀疏表示的车辆品牌识别方法,其平均识别率达到96.16%。
表1 不同方法的车辆品牌识别结果
计算所有车辆品牌识别结果的混淆矩阵,混淆矩阵对角线上的元素为车辆品牌的正确识别率。奥迪、别克、比亚迪、长安、奇瑞、雪佛兰、雪铁龙、东风、一汽大众、福特、福田、重汽、长城、本田、现代、江淮、日产、铃木、丰田、上海大众、五菱、海马、起亚、标致、跃进、威望、吉利、通用、启晨和五征一共30种车辆品牌的识别率分别为98.67%、98.00%、96.67%、98.67%、92.67%、95.33%、95.33%、94.00%、89.33%、96.67%、94.67%、90.67%、98.67%、97.33%、94.00%、94.00%、94.00%、100.00%、85.33%、100.00%、100.00%、98.67%、98.67%、100.00%、96.67%、99.33%、100.00%、100.00%、100.00%、100.00%。其中,8种车辆品牌的识别率达到了100%,20种车辆品牌的识别率高于90%,只有中国一汽和丰田2种车辆品牌的误判率偏大,分别为89.33%和85.33%,说明它们与其他车辆品牌存在较相似的细节特征信息,如图3所示。丰田品牌大多被误判为比亚迪品牌。
图3 被误判车辆品牌样本实例
由于受道路(如道旁树木的阴影投射在车辆上)、天气(如太阳光线太足,导致车脸区域有反光)、人为(如车辆装饰或文字绘画)等多方面的影响,车脸图像通常存在一定噪声。为进一步考察基于融合特征稀疏编码模型的车辆品牌类型识别方法的鲁棒性和适用性,选取52幅具有严重噪声的车脸图像,如图4所示,分别包括强光反射、局部装饰或遮挡、光线照射弱、运动模糊等测试样本进行试验,试验结果如表2所示。由表2可知,52幅图像的车辆品牌整体识别率为78.85%,其中测试样本在光线照射弱的环境中识别错误的序号有(1)、(2)、(12)、(21)、(23)、(24)、(25)、(26),在强光反射的环境中识别错误的样本序号有(35)、(36)、(42)。采用基于HOG特征及支持向量机(SVM)的车辆品牌分类方法对52幅车辆品牌图像进行识别,则只有序号(30)为识别正确的测试样本。试验结果表明,基于融合特征稀疏编码模型的车辆品牌识别方法是最优的。
图4 含有不同噪声类型的车脸图像
表2 含有不同噪声类型的识别结果
4 结 语
基于HOG进行稀疏分解,提取到的融合特征是对HOG特征的第二层抽象,也即对HOG特征的深层次的特征挖掘,该融合特征既能保留HOG特征的纹理描述对几何光学形变的不变形优点,又能结合稀疏表示特征的生物视觉感知系统的局部性、方向性和频域的带通性等特点,并针对HOG特征的非负性对稀疏表示中的系数求解进行改进,因此,本文提出的基于融合特征稀疏编码模型的车辆品牌识别方法具有较好的鲁棒性。