APP下载

基于改进词包模型的车型识别算法∗

2018-05-29康珮珮于凤芹

计算机与数字工程 2018年5期
关键词:参考点特征向量识别率

康珮珮 于凤芹 陈 莹

(江南大学物联网工程学院 无锡 214122)

1 引言

车型识别技术一直是智能交通领域研究的一个重要课题,其主要任务是对特定地点和时间的车辆进行识别和分类,并以之作为交通管理、收费、调度、统计的依据。目前已有的车型识别方法主要有电子标签识别法、电磁感应线圈识别法、车牌识别法、基于图像的车型识别法等。近年来,基于图像的车型识别方法[2~4]发展迅速,它是通过对车辆图像进行特征提取,然后送入分类器进行分类,进而识别出车辆的类型。

词包模型(Bag-of-Words,BoW)[1]最初应用于文本检索和文本分类领域,后来计算机视觉领域的研究人员将其扩展到图像处理领域,得到了广泛应用,其中之一就是将词包模型应用于基于图像的车型识别领域。Li等[2]引入原始词包模型,在提取车辆图像的SIFT特征和SURF特征后使用矢量量化(Vector Quantization,VQ)编码算法对两种特征分别进行编码,然后使用线性核SVM(Support Vector Machine)分类器进行车型识别,基于SIFT特征的词包模型识别率相对较高但速度较慢,而基于SURF特征的词包模型速度相对较快但识别率较低。Lazebnik 等[3]对 词 包 模 型 进 行 改 进 ,提 取 了Dense-SIFT特征,特征提取速度加快,然后使用空间金字塔匹配(Spatial Pyramid Matching,SPM)和相交核进行识别,识别率较高,但是该算法达不到实时性要求。Jang等[4]在提取SURF特征后将词汇树(Vocabulary Trees,VT)用于量化编码,并使用RBF核SVM分类器进识别,识别率和速度较原始词包模型均有提高。

针对传统车型识别算法识别速度慢、识别率低的问题,本文提出了一种基于改进词包模型的车型识别算法。首先,使用Dense-SURF特征代替原始词包模型中的SURF(Speeded Up Robust Feature)特征,并通过改进稠密采样策略对Dense-SURF特征的提取过程进行加速,设置稠密采样步长等于与子区域边长相等,在子区域中提取36维改进Dense-SURF特征向量,减少了Haar小波响应求和次数,提高了特征提取速度;然后,将特征的空间位置作为上下文信息并与矢量量化编码结合,提出特征上下文—矢量量化(Feature Context-Vector Quantization,FC-VQ)编码算法,使用FC-VQ算法对改进的Dense-SURF特征向量进行编码,生成包含空间信息的FC-VQ特征向量,弥补了空间信息缺失,从而提高识别率;最后,使用特征向量构建直方图相交核作为核函数,将编码后的特征送入SVM分类器进行训练和识别,进一步提高了识别效率。仿真实验结果表明,本文提出的算法具有较高的识别率,同时识别速度较快,基本满足实时性要求。

2 基于改进词包模型的车型识别算法

2.1 改进的词包模型

词包模型的流程主要分为两大步骤:1)提取图像的特征;2)对提取的特征进行编码,将特征量化为若干视觉单词。在特征方面,传统的词包模型常使用SIFT或SURF作为图像特征,但是两种特征的提取速度不够快,无法满足实时性要求,因此本文使用Dense-SURF特征来表示图像,并通过改进稠密采样策略进一步提高特征提取速度。在编码方面,传统的词包模型常使用矢量量化(VQ)编码算法,但是VQ编码方式简单,忽略了图像特征的空间位置信息,导致对图像的描述性较差。为了解决这个问题,本文提出了一种特征上下文—矢量量化(FC-VQ)编码算法。

2.1.1 Dense-SURF的原理及改进

SURF特征[5]的构建主要包括特征点检测和特征点描述两个过程,而 Dense-SURF[6~7]只使用了特征点描述部分,从而速度较快。Dense-SURF特征提取过程由图1所示。

图1 原始Dense-SURF特征提取过程

首先采用稠密采样的方式,在边界框内将矩形窗口以一定的步长在图像上从左到右、从上到下进行遍历,获得多个像素块,然后将每个像素块划分为4×4个子区域,在每个子区域中使用积分图像计算像素点的一阶Haar小波响应dx和dy,将子区域内dx、dy、 ||dx、 ||dy分别求和,得到一个4维特征向量:

再将4×4个子区域的特征向量进行连接,归一化得到一个4×4×4=64维的Dense-SURF特征向量,像素块中间像素的位置即为Dense-SURF特征向量的空间位置。

在Dense-SURF的提取过程中,由于采用稠密采样策略,获得的像素块数量较多且在每个像素块都提取64维的特征向量,使得表示每幅图像的向量维数过高。因此,本文对64维特征向量进行降维,将上述的像素块划分为3×3个子区域,得到一个 3×3×4=36维的Dense-SURF特征向量。Dense-SURF特征向量的维数减少,使得下文欧氏距离计算复杂度降低。Dense-SURF特征的数量与像素块数量一致,由稠密采样的步长与像素块的大小共同决定。由图1的提取过程可知,若将稠密采样的步长与像素块中每个子区域的边长设为相同值,则在计算其它像素块的特征向量时可以重复使用之前子区域的特征向量,避免在子区域内重复进行Haar响应求和计算。

综上,为了进一步提高特征提取速度,本文改进了Dense-SURF提取过程中的稠密采样策略,将稠密采样步长设置为矩形窗口边长的1/3来遍历图像得到像素块,并将像素块划分为3×3个子区域,即令采样步长等于子区域的边长,同时考虑到特征点的个数要适中,本文将此值设置为5个像素点,在子区域内提取36维改进的Dense-SURF特征向量。

2.1.2 FC-VQ编码算法原理

VQ编码[1]的大致过程为:首先使用k-means聚类算法[8]将训练样本生成的特征向量进行聚类,生成N个聚类中心(称为码字),N个码字构成了码本。然后计算测试样本生成的特征向量与各个码字之间的欧氏距离,将特征向量映射到距离最小的码字。最后统计属于各个码字的特征向量个数,作为编码后的向量。VQ编码的过程简单,但忽略了特征的空间位置信息,导致识别率较低。

针对这个问题,本文提出了FC-VQ编码算法。先将提取的特征的空间位置作为上下文信息,然后使用特征上下文(FC)[9]改进矢量量化编码(VQ)。通过FC-VQ算法对提取的Dense-SURF特征向量值和空间位置进行编码,得到编码后的FC-VQ特征向量。

对于一幅给定的图像I,令Z={z1,…,zL}表示Dense-SURF特征点的位置,示Dense-SURF特征向量,p是图像I中一个参考点的位置。为了更好地描述特征点的位置分布,先在图像I中建立对数极坐标系,并将参考点 p的附近区域在极坐标系中划分为多个子区域,记为(r=1,…,R),本文中 R=12。每个子区域中的Dense-SURF特征向量集合可表示为

式中:l=1,…,L,L为特征点(或特征向量)的总个数;表示区域的半径为s的圆形邻域,它使得区域边界附近的点可能属于多个区域,弥补了局部描述子的空间不确定性。

假设第r个子区域中有M个特征向量,W(r)中的第m个特征向量Wm与第n个码字cn之间的欧氏距离为

式中:m=1,…,M ;n=1,…,N ;U=36(改进的Dense-SURF特征向量的维数)。

参考点p所对应的FC-VQ特征向量则为其附近子区域内映射于各个码字的Dense-SURF特征向量的个数,即:

式中:dmi={dmi};count用于统计符合条件的m值总数;argmini∈{1,…,N}dmi表示当 dmi取最小值时 i的取值。FC-VQ特征向量生成示意图如图2所示。

图2 FC-VQ特征向量生成示意图

为了使特征点的空间位置更加明确,本文使用了多个参考点,记为同时为了减少运算量,本文先计算特征点与各个参考点之间的距离并选取距离最近的参考点作为式(4)中的参考点。根据距离的大小大致将特征点的位置分成K块,分别对应于K个参考点,避免了重复判断特征点与每个参考点附近子区域的位置,降低了计算复杂度。K个参考点对应的FC-VQ特征向量则表示为

2.2 基于快速直方图相交核的SVM分类器

SVM分类器在基于词包模型的车型识别方法中得到了广泛应用,其核函数的选择对识别性能有较大影响,相交核函数在众多核函数中性能较好,但是计算速度较慢。因此,本文使用快速直方图相交核[10~11]作为SVM的核函数,来提高识别效率。

直方图相交核函数的计算公式为

使用直方图相交核的SVM分类函数则为

其中 x={x1,…,xk}为输入向量,zj={z1j,…,zkj}表示第 j个支持向量,αj和tj={+1,-1}分别是第 j个支持向量的权重和标签,m是支持向量的个数。对于固定的i值,将zij的值按升序排序,记为z͂ij,此时 αj和 tj分别表示成 ᾶj和 t͂j,令 r 表示满足z͂ir≤xi最大的整数。则式(7)可改写为

式(8)即为基于快速直方图核函数的SVM分类函数。对于每一个i值,可以预先计算的值,这是由于其不随 xi而改变。因此计算分类器的输出值则相当于为每一个维度i找到合适的r值,时间复杂度为O(logm)。则使用快速直方图相交核函数的总时间复杂度为O(klogm),与常见的基于距离的核函数的时间复杂度O(km)相比,时间复杂度降低,从而提高了识别效率。

3 算法实现步骤

基于改进词包模型的车型识别算法流程图如图3所示。

具体实现步骤如下:

1)读取训练车辆图像,将矩形窗口大小设置为15×15并划分为3×3个子区域,设置稠密采样的步长与子区域的边长相等(5个像素点),在3×3个子区域中计算Haar小波响应和,得到36维改进Dense-SURF特征向量。

2)使用k-means算法对训练样本的Dense-SURF特征进行聚类,得到100个聚类中心(码字),构成码本。

3)将特征的空间位置作为上下文信息,使用FC改进VQ编码,得到FC-VQ编码算法,并用其对改进的Dense-SURF特征进行编码,得到FC-VQ特征向量。

4)将训练样本的特征向量送入快速直方图相交核SVM分类器进行训练,得到训练模型。

5)输入测试车辆图像,快速提取36维改进Dense-SURF特征向量。

图3 基于改进词包模型的车型识别算法流程图

6)使用FC-VQ对改进的Dense-SURF特征向量进行编码,得到测试车辆图像的FC-VQ特征向量。

7)加载训练好的模型,将测试样本的特征向量送入快速直方图相交核SVM分类器进行识别,得到测试车辆图像的车型识别结果。

4 实验结果与分析

实验硬件环境为Intel Core i5-3470处理器、4G内存,软件环境为Windows7系统、Matlab R2012a软件。数据集选取文献[12]中提供的BIT数据集,该数据集是在交通卡口拍摄的车辆正面图像,包含一些复杂环境,如光照的变化、雨天的影响和不同颜色的车辆,车辆类型分为五类:大型客车、小型客车、大型货车、小型货车、轿车(含普通轿车和SUV,本文不作区分)。数据集标注了车辆的位置信息,本文根据车辆的位置信息将车辆单独分割出来,部分分割出的车辆图像如图4所示。将分割出来的车辆图像作为训练和测试样本,并使用双三次插值方法将样本统一采样到400×400像素大小。对于每一类车,随机选取400张图像进行训练,200张图像进行测试。

图4 BIT数据集实例

本文使用识别率P以及每幅图的平均特征提取时间Te、平均特征编码时间Tc、平均识别时间Tr作为评价指标。

图5是参考点的个数与对应的编码时间和识别率之间的关系图,每个点从左到右依次代表1、2、4、9个参考点。由图5可以看出,参考点的个数在1~4之间时,随着个数的增加,识别率也在提高,但参考点的数目增加到9时,识别率反而降低。这是因为参考点数目过多,使得图像的表示过于具体,以至于对同类型车辆之间的差异也较为敏感。因此,综合考虑编码时间和识别率两方面因素,本文选择4个参考点进行编码。

图5 参考点个数与编码时间和识别率关系

图6 是使用本文算法进行车型识别所得到的混淆矩阵。从混淆矩阵中可以看出,大型客车、大型货车和轿车取得了较好的识别结果,而小型客车和小型货车识别率相对较低。这是由于在此数据集中小型客车和轿车在外观上有一定的相似性,小型货车和大型货车也具有相似性,容易误分。

图6 车型识别混淆矩阵

为了进一步验证本文算法的有效性,本文首先进行了纵向对比实验,分别与原始Dense-SURF+FC-VQ+hist核函数、改进Dense-SURF+VQ+hist核函数、改进Dense-SURF+FC-VQ+RBF核函数进行对比,hist核函数表示直方图相交核函数,实验结果见表1。然后本文进行了横向对比实验,分别与文献[2]中算法(原始词包模型)、文献[3]中算法、文献[4]中算法进行对比,实验结果见表2。

由表1可以看出,在特征提取方面,本文改进的Dense-SURF与原始Dense-SURF相比,特征提取速度加快,提取时间仅占原始的36.4%,而且对识别率几乎无影响;在编码方面,本文提出的FC-VQ编码与VQ编码相比,虽然编码速度相对较慢,但是识别率大幅提高,高出9.4%;在分类器方面,与RBF核SVM相比,本章使用的快速直方图相交核SVM取得了更高的识别率和识别速度,识别率高出1.7%,总体识别时间占其73.9%。由表2可以看出,与文献[2]中算法(原始词包模型)相比,在识别速度和识别率上都大幅提升,识别时间仅占其23.6%,识别率高出7.9%。与文献[3]中算法相比,识别速度较快,识别时间仅占其50.0%,且识别率高出1.5%。与文献[4]中相比,识别率高出5.7%,识别时间仅占其32.1%。综上,与其它三种算法相比,本文算法检测速度更快,且具有更高的识别率。

表1 本文算法与其它算法的纵向对比结果

表2 本文算法与其它算法的横向对比结果

5 结语

本文针对传统车型识别算法识别速度慢、识别率低的问题,提出了一种基于改进词包模型的车型识别算法。首先通过改进稠密采样策略快速提取36维Dense-SURF特征,然后提出FC-VQ编码算法,对提取的特征进行编码,最后将编码后的特征向量送入快速直方图相交核SVM分类器进行识别。为了验证本文算法的有效性,在BIT车辆图像数据集上进行了实验,通过实验对本文的车型识别算法和其它算法进行了横向和纵向对比分析。实验结果表明:本文算法与其它车型识别算法相比,识别率更高,且识别速度更快。

[1]G Csurka,C Dance,L Fan,et al.Visual categorization with bags of keypoints[C]//Workshop on statistical learning in computer vision,ECCV,2004,1(1-22):1-2.

[2]LI Q W,CHENG H S,ZHOU Y,et al.Road vehicle monitoring system based on intelligent visual internet of things[J].Journal of Sensors,2015:1-16.

[3]S Lazebnik,C Schmid,J Ponce.Beyond bags of features:Spatial pyramid matching for recognizing natural scene categories[C]//IEEE Conference on Computer Vision and Pattern Recognition(CVPR),2006(2):2169-2178.

[4]D M Jang,M Turk.Car-Rec:A real time car recognition system[C]//IEEE Workshop on applications of computer vision(WACV),2011:599-605.

[5]H Bay,A Ess,T Tuytelaars,et al.Speeded-up robust features(SURF)[J].Computer vision and image understanding,2008,110(3):346-359.

[6]J R R Uijlings,A W M Smeulders,R J H Scha.Real-time visual concept classification[J].IEEE Transactions on Multimedia,2010,12(7):665-681.

[7]J R R Uijlings,A W M Smeulders,R J H Scha.Real-time bag of words,approximately[C]//Proceedings of the ACM international Conference on Image and Video Retrieval,2009:6.

[8]A K Jain.Data clustering:50 years beyond K-means[J].Pattern recognition letters,2010,31(8):651-666.

[9]XING-GANG WANG,XIANG BAI,WEN-YU LIU,et al.Feature context for image classification and object detection[C]//IEEE Conference on Computer Vision and Pattern Recognition(CVPR),2011:961-968.

[10]S Maji,A C Berg,J Malik.Classification using intersection kernel support vector machines is efficient[C]//IEEE Conference on Computer Vision and Pattern Recognition(CVPR),2008:1-8.

[11]JIAN-XIN WU,J M Rehg.Beyond the euclidean distance:Creating effective visual codebooks using the histogram intersection kernel[C]//Proceedings of the 12th IEEE International Conference on Computer Vision,2009:630-637.

[12]ZHEN DONG,YUNDE JIA.Vehicle type classification using distributions of structural and appearance-based features[C]//Proceedings of the 20th IEEE International Conference on Image Processing(ICIP) ,2013:4321-4324.

猜你喜欢

参考点特征向量识别率
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
克罗内克积的特征向量
数控机床回参考点故障诊断及维修
Clinical outcomes of endoscopic management of pancreatic fluid collections in cirrhotics vs non-cirrhotics: Α
浅谈数控机床参考点故障
三个高阶微分方程的解法研究
基于相关性选择的高维多目标优化算法∗
档案数字化过程中OCR技术的应用分析
基于PCA与MLP感知器的人脸图像辨识技术
科技文档中数学表达式的结构分析与识别