APP下载

基于SVM的交通视频分类优化

2017-02-27张伟郝泳涛

电脑知识与技术 2016年31期
关键词:参数优化模式识别数据挖掘

张伟+郝泳涛

摘要: 当前智能交通数据挖掘研究的重點在于如何设计有效的挖掘算法。该文对特定的不同环境下的高速公路视频进行分析处理,提取出整体的特征属性,选取了SVM分类方法,基于所提取出的特征属性对交通视频进行分类。同时使用启发式的遗传优化SVM参数,寻求最优参数,相比于传统方法,提高了分类准确率。

关键词:模式识别;数据挖掘; SVM;遗传算法;参数优化

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2016)31-0179-04

Abstract: Current intelligent transportation data mining research focuses on how to design an effective mining algorithm. The project achieved the classification of video-based traffic congestion. This was done by using the average rate of population density and population. Based on the extracted feature values, we used the popular data mining algorithms SVM classification methods to carry out on the training and testing data classification and prediction and compared the accuracy of classification. Finally, genetic algorithms was used to heuristic SVM classification parameters to obtain the optimal parameters of SVM.

Key words:Pattern Recognition;Data Mining;SVM;Genetic Algorithm;Parameter Optimization

随着城市的高速发展,城市公路交通拥堵以及效率不高等,已成为城市发展面临的共同问题。智能交通系统(ITS)是将先进的科学技术有效地综合运用于交通运输、服务控制和车辆制造,加强车辆、道路、使用者三者之间的联系,从而形成一种保障安全、提高效率、改善环境、节约能源的综合运输系统。

城市交通相关的数据挖掘技术的研究是数据挖掘技术领域最活跃的研究方向之一。交通数据挖掘的主要目的是寻找交通数据中的规律,为智能交通系统的设计提供技术支持,有利于缓解交通拥挤、优化交通路网运行,促进交通健康稳定发展。

1 研究现状

随着图像处理技术的不断发展, 利用机器视觉相关技术来进行车辆检测有望取代传统方式成为现代智能交通系统的重要组成部分。

传统的方法大部分是基于对个别车辆的检测和计算。基本上每个车辆是被隔离跟踪的,通过分析它的运动轨迹来估算交通流量、车辆速度和停放的车辆。一些作者还使用斑点尺寸、三维模型、外形和纹理特征进行车辆分类[1]。然而,大多数的现有工作通常会在拥挤的情况下(例如交通拥堵)失效,原因是运动对象有严重的闭塞性。基本上,在传统方法中,交通是通过在情景中被检测车辆的数量分类的,但是在非常拥堵的情景中,两个或两个以上的车辆的斑点可能会重叠,这会造成车辆计数错误。因此,当运动对象(例如,人或车辆)的密度增加时,传统方法的精确度趋于下降。

2 目标特征属性提取

2.1人群密度估算

背景相减法是运动目标检测中比较常用的一种方法。把摄像头捕捉的图像第一帧作为背景,以后的每一帧都减去背景帧,然后将计算结果中每一像素的值和一个预先设定的阈值进行比较,若结果大于阈值,这个点是前景点,否则这个点为背景点[2]。

两种常用的背景估计方法:

1)统计平均法

2)统计直方图法

2.2人群密度获取

在实验中,交通监控视频中的人群密度估算是通过背景相减法进行的。人群密度是通过计算由多层背景相减法获得的前景掩膜的像素数决定的。每个视频帧都会进行此过程。首先,为防止或至少减小外部不相关的对象的影响,要设置感兴趣区域,这在运动分割和密度估算中是需要考虑的。交通人群密度是由在每个视频中平均的密度变化来估算的。如遇视频流或冗长的视频,密度估算可以由N帧的块来决定。对于每个块,该系统会预测出人群密度。

2.3 人群速度估算

实验中选择传统的KLT (Kanade-Lucas-Tomasi)跟踪方法进行人群跟踪。选择KLT跟踪的主要动机是它的高速的性能,能够获得实时结果。

人群跟踪由两个步骤组成。首先,给定两个连续的帧,从第一帧中提取一定数量的特征点并存储在内存中。在接下来的步骤中,所存储的特征点在连续的帧内被跟踪。一些特征点可能会在跟踪的过程中丢失(目标进入/离开现场)。在这种情况下,如果特征点的数量小于阈值T,该算法将会在下一帧中提取新的特征点[3]。一个特定特征点在某些帧的位移表示人群运动矢量。然而,许多的运动矢量可能为零长度,因为一些特征点在帧内是静止的。也可能由于噪声的存在、背景为动态的以及人群运动太小等原因,运动矢量可能很短。为了减少这一问题对人群速度估算的影响,运动矢量长度小于阈值T的将会被过滤掉[4]。

3.3 构建特征向量

4 交通拥堵分类

4.1数据预处理

4.1.1数据集概要

该数据集包含了254个白天西雅图高速公路监控视频。所有的视频都是由一个单一的固定摄像头所记录的,共计20分钟。该数据集包含了多样性的交通模型,例如轻型、中型和重型拥堵,而且有各种天气条件下的(如晴天,下雨,阴天)。每个视频有42-52帧,这些帧的分辨率为320x240,是按每秒10帧(fps)录制的。该数据集还提供了描述每个视频序列的手工标记的地面实况。表1显示了数据集的概要。

4.1.2数据预处理

4.2支持向量机

4.2.1 SVM原理

SVM方法是一个有监督的学习模型,通常用来进行模式识别、分类以及回归分析,对独立测试集的测试误差较小[5]。SVM方法通过一个非线性映射,把样本空间映射到一个高维特征空间中,使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。

SVM方法应用核函数的展开定理,不需要知道非线性映射的显式表达式,由于是在高维特征空间中建立线性学习机,所以与线性模型相比,不但几乎不增加计算的复杂性,而且在某种程度上可以避免“维数灾难”。

4.2.2 SVM核函数

选择不同内积核丞数,就可以生成不同的SVM,这样也就形成了不同的算法。日常的核函数主要有三类[6]:

1)多顼式核函数

2)径向基函数(RBF)

3)S形核函数

4.3 SVM数据分类

4.3.1使用线性内核函数

通过上面的对比,可以看出,对于此数据集采用径向基函数作为SVM分类器的核函数,最终的分类准确率最高。

5 SVM分类参数优化

虽然采用了SVM来进行交通视频分类,最终得到了较为满意的结果。但使用SVM进行交通视频分类预测时,调用不同的核函数需要改变相关的参数才能获得相对理想的分类准确率。

5.1 K-CV交叉验证

交叉验证是用来验证分类器性能的一种统计方法,其思想是在某种意义下将原始数据进行分组,一部分作为训练集,另一部分作为验证集。首先用训练集对分类器进行训练,再利用验证集来测试训练得到的模型,以此来作为评价分类器的性能指标[7]。

5.2遗传算法优化SVM参数

5.2.1遗传算法

遗传算法(Genetic Algorithm)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的計算模型,是一种通过模拟自然进化过程搜索最优解的方法。在遗传算法中,通过编码组成初始群体后,遗传操作的任务就是对群体的个体按照它们对环境适应度(适应度评估)施加一定的操作,从而实现优胜劣汰的进化过程。从优化搜索的角度而言,遗传操作可使问题遗传过程的解,一代又一代地优化,并逼近最优解。

利用遗传算法对SVM参数进行优化的整体算法过程如图5所示:

5.3实验仿真

对训练集进行CV意义下的准确率作为遗传中的湿度函数值,先进行数据提取和预处理,然后利用遗产算法对处理数据进行最佳参数寻找,参数的选择结果及预测结果如下:

在CV的意义下,通过使用网格划分来寻找最佳参数的方式虽然能够找到全局最优解,但是如果想在更大的范围内寻找最佳的参数会很耗费大量时间。通过使用启发式的遗传算法不需要必遍历网格内的所有参数点,也可以找到群居最优解,最终提高了分类预测的准确率。

6 结束语

智能交通数据挖掘研究的重点在于设计有效合理的挖掘算法,难点主要有两面:首先由于交通数据的特殊性,现有的大部分数据挖掘算法无法直接高效的应用在大规模交通数据处理中;另一方面,需要根据领域知识来设计专门的数据挖掘算法,否则处理结果可能无法满足应用本身的需求。本文在选定了视频特征提取方法后,对不同的目标追踪方法进行了比较,选择了合适的追踪方法;然后使用SVM算法,根据提取的特征属性对交通视频进行分类,通过比较分类的准确性,选择合适的分类器。最后利用启发式的遗传算法对SVM参数进行了优化,提高了分类的准确率。

参考文献:

[1] 王汉斌. 基于视频的目标检测与跟踪技术研究[D].南京航空航天大学, 2009.24(19):21-24.

[2] 王圣男, 郁梅, 蒋刚毅. 智能交通系统中基于视频图像处理的车辆检测与跟踪方法综述[J]. 计算机应用研究, 2005, 22(9):9-14.

[3] 韩超. 视频车辆检测技术背景及国内外研究现状[J].无线互联科技, 2012 (3):103-103.

[4] Andrews Sobral L O, Schnitman L, De Souza F. Highway Traffic Congestion Classification Using Holistic Properties[C]//Proc. International Conference on Signal Processing, Pattern Recognition and Applications, 2013.

[5] 范昕炜.支持向量机算法的研究及其应用[D].杭州:浙江大学, 2003.

[6] 王睿.关于支持向量机参数选择方法分析[J].重庆师范大学学报:自然科学版, 2007, 24(2):36-38.

[7] 赵春晖, 陈万海, 郭春燕. 多类支持向量机方法的研究现状与分析[J].智能系统学报, 2007, 2(2): 11-17.

[8] 平雪良,徐荣礼,孔俊,等. 基于空间划分的海量数据K邻近新算法[J].华南理工大学学报: 自然科学版, 2007, 35(5):65-69.

[9] 贾银山, 贾传荧. 一种加权支持向量机分类算法[J].计算机工程,2005,31(12): 23-25.

[10] Keerthi S S, Lin C J.Asymptotic behaviors of support vector machines with Gaussian kernel[J]. Neural computation,2003,15(8):1667-1689.

猜你喜欢

参数优化模式识别数据挖掘
基于并行计算的大数据挖掘在电网中的应用
浅谈模式识别在图像识别中的应用
第四届亚洲模式识别会议
一种基于Hadoop的大数据挖掘云服务及应用
第3届亚洲模式识别会议
电气设备的故障诊断与模式识别
基于GPGPU的离散数据挖掘研究