交通流数据特性与预处理方法的研究
2018-05-08孙红影
孙红影
摘 要:随着我国城市化率的逐年提高和经济的飞速发展,交通拥堵问题已经成为城市和经济发展的桎梏。研究者们致力于对交通拥堵状态的预测,文章就预测过程中需要的交通流数据的采集与处理分析方法进行讨论,为交通流数据从采集到处理过程提供思路。
关键词:交通流;数据处理;数据分析
中图分类号:U491 文献标志码:A 文章编号:2095-2945(2018)12-0123-02
Abstract: With the increasing of urbanization rate and the rapid development of economy, traffic congestion has become the shackles of urban and economic development. Researchers are committed to the prediction of traffic congestion. This paper discusses the methods of collecting and processing traffic flow data needed in the process of forecasting, and provides ideas for traffic flow data from collecting to processing.
Keywords: traffic flow; data processing; data analysis
引言
随着城市化率的逐年提高和经济的快速发展,城市交通容量已经达到现有设计容量的阈值,汽车的保有量已经趋于饱和,其表现形式为城市交通的流量越来越大,平均车速越来越低,道路运送能力越来越低,因而城市交通的拥堵已经称为城市和经济法则的桎梏。在现有城市道路设计容量状况下,对城市道路交通进行精确控制,是提高城市道路利用率的重要手段之一。而对城市道路交通进行精确控制的核心问题之一是对各交通枢纽进行交通流预测。这里提出的交通流是一般指交通工具流量,交通流的数据特性是千变万化的,交通流状态很难用确切的数字来说明,例如交通工具、目的地、驾驶员的驾驶特点、规划的路线等都是不尽相同的,它具有较强的不确定性,而整个交通流又会随着时间段、交通环境、道路运行状态的变化而改变。但道路系统的运行从大量的观测数据来看,它还是遵循一定规律的,例如较为明显的早高峰、晚高峰,早进城、晚出城等。本文分析了交通数据流的特性,并对其预处理方法进行了研究。
1 交通流基本特征
获得交通流的方法和手段很多,最常用的是全自动交通流量观测仪,按照监测类型可以分为接触式和非接触式,接触式一般有地感线圈和压电流量仪,非接触式有超声波式、微波式、视频式以及超声波-微波复合式流量仪。通过安装在不同交通位置的装置,采集各交通断面的交通数据流,再进行数据分析和处理,可以预测未来一定时间段的交通流量变化情况,从而对道路交通进行精确的疏导和控制。目前,多数文章都是针对单个交通断面进行预测研究,缺少对多断面的交通流数据研究。但是整个城市的交通网绝不是孤立的,它在时间和空间上都有相关性,因此需要进一步的探讨和研究道路网的多断面交通数据流处理及预测。多断面交通数据流预测以单个断面的交通流预测为基础,利用交通流的实时数据,结合道路交通网的一系列特性,例如是否主干道、周边社会资源分布、公共交通资源分布、红绿灯分布等多项因子,着眼于道路交通网多断面交通流状态,以及道路网中多断面交通流状态的时空相关性,来实现道路网中多个断面的同时预测。这种对交通流的多断面预测更加符合实际,是今后研究的重要方向。要实现交通流的多断面预测,首先应解决以下问题。
1.1 交通流数据的准确性
前文已经提到,目前有多种方法可以实时采集交通流数据,无论是接触式还是非接触式、是视频流量数据还是超声探测数据,这些都为今后的智能交通以及交通流量精确控制提供了有力的保障。但是电子仪器的误差总是存在的,可能会发生软件故障、硬件故障、通信干扰、环境噪声、数据模糊等情况,得到的实时数据并不能保证都是真实、可靠、有效的。甚至道路突发的车辆故障、交通肇事都会对数据造成巨大影响。这些包含丢失数据、错误数据、突变数据的交通数据流,必须加以识别和预处理,否则就会直接影响下一步研究的准确性。因此,在进行交通流数据分析之前,应采取平滑过滤、奇点剔除、插值补漏等数据预处理方法对实时采集的交通数据进行预处理,确保数据的真实可靠有效。
1.2 多个断面交通流数据之间的相关性
城市交通网是一个庞大的系统,在同一个交通网中又存在着多个断面,这些断面之间的交通流数据看似毫无关系,其后却存在密不可分的联系,例如无分叉路口的主干线相邻两个红绿灯断面之间是有绝对联系的,而相邻两个十字路口的八个断面之间也存在或强或弱的关联性,它们之间的关联性受时间、各交通断面的资源分布等影响。当对某一个交通断面进行预测时,不可能对所有关联断面都进行预测,这种计算量和工作量会十分庞大,因此有必要对各个断面的相关性进行分析,找出对要预测的交通断面影响最大的一个或者几个交通断面进行计算预测。采取这种强相关性预测方法,能在满足预测精度的前提下减小预测工作量,对于实际应用具有重要意义。因此,在对交通流进行预测之前应当采取关联分析的方法,对输入端的数据进行分析处理,以提高预测的精度。
2 交通流故障数据的识别
交通流预测的过程中,交通流数据的准确性对预测的结果的精准性起着不可忽视的作用。交通流数据因为是动态的,在采集过程中往往会由于采集设备的软硬件故障、环境噪声、数据模糊以及数据传输过程中系统故障而引起数据异常。为了所建立的模型的精度更为精确,就需要更有效地分析交通数据的规律。因此在数据分析和使用之前应该对其进行异常点剔除、平滑滤波、线性插值等方法进行相关的预处理。通过对大量的交通流数据进行分析,可知数据的异常通常是由两个方面引起,一是传感器前端故障,二是通信过程干扰。引起的后果也是两种,一是數据错误即非真实值,二是数据丢包。
2.1 错误数据预处理
因自动交通流量观测仪的软件故障、硬件故障、环境噪声、数据模糊等引起的错误数据是不可以直接用来使用的。需要将采集到的错误数据进行预处理。处理方法大概分为以下两种:一种是将错误的数据剔除。这种情况仅在错误数据相对很少的情况下可以采用,剔除个别错误数据不会影响数据的完整性和趋势性,但如果错误数据所占比例较大,就不能采取剔除法,因为过多剔除错误数据会破坏数据的完整性和其趋势性。第二种就是对数据进行修复。方法是首先剔除明显异常的错误数据,然后采用平滑滤波、插值法将剔除掉的数据补上,使整个数据的完整性和趋势线不受影响。
2.2 丢失数据预处理
引起数据丢失的原因也是两个,一是因为软硬件因素在检测端就没有检测到数据,二是在数据通信时产生了丢包现象。在实际使用中,会因为车辆过度的密集而引起交通流检测仪器数据采集不准确,数据在传输中出现故障等等诸多原因而导致采集到的数据会出现空白,如出现某个时间点、一段时间或者几段时间内的数据丢失。这种情况就需要对丢失的数据进行相关与处理。针对影响因素特征序列的单位及数量级不统一的实际情况,用初值化算子对其进行无量纲化处理,然后利用插值、平滑等算法对数据进行修复。
3 交通流数据的处理步骤
STEP1:提取一个特定路口的多个断面每天的数据。
STEP2:对于错误的数据进行剔除跟修复。当数据采集到的数据为0或者远远超过平均值的时候。假设当数据采集的时间间隔为5min,根据先验值,流量限制的最大的合理流量在200台/5min。按照高峰期与非高峰期之分,可以设定为一个是数据采集点一天采集到的数据若在[700-720]之间,则保留数据。否则就作为错误数据,将全天的数据全部剔除。然后利用平滑法、插值法,对于保留下来的数据样本进行处理,将缺失的数据进行补齐。
STEP3:数据关联性分析及整合。首先进行数据关联性分析,对于不重要的可有可无的数据可以忽略不计,对于有重大关联的数据进行保留。另外在数据处理过程中,可能会出现几个车道的数据进行合并的情况。
4 多断面交通流数据的相关性分析
短时交通流数据进行预测,就是指在具有不确定性与随机性变化的交通流中,根据检测到的数据,对数据的剔除跟修复后,找出来规律来建立模型。用来预测未来的交通流变化。其要求实时性,又要求精准度。然而,只是考虑一个断面的交通流数据,又不能充分的体现这一路口的实际交通流情况,结果是片面的,不符合实际的,所以就需要考虑多个断面的数据。多个断面的数据看似毫无关系,其实内在是有个密不可分的联系的,因此,我们可以运用数据关联度分析:主要是针对交通系统影响因素过多的现状,利用灰色关联分析,将影响因素按照灰色关联度大小进行排序;按照灰色关联度从大到小的顺序,分别取1,2……n个影响因素序列,根据预测的需要,选取适合的影响因素序列的个数。以达到预测的目的。
5 结束语
交通流数据是智能道路交通系统中进行道路交通流量情况预测的核心因素。因为数据本身具有的实时性,不确定性以及数据错误及缺失。在预测之前就必须对数据进行分析及预处理。本文从交通流数据的特性出发,分析了错误数据识别与处理的方法。最后给出了多组数据相关性的分析。为交通流数据处理提供了思路。
参考文献:
[1]贺国光,李宇,马寿峰.基于数学模型的短时交通流预测方法探讨[J].系统工程理论与实践,2000,20(12):51-56.
[2]宗春光,宋靖雁,任江涛,等.基于相空间重构的短时交通流预测研究[J].公路交通科技,2003,20(14):71-75.
[3]徐啟华,丁兆奎.交通流量的递归神经网络实时预测模型研究[J].公路交通科技,2004,21(10):99-101.
[4]田晶,杨玉珍,陈阳舟.短时交通流量两种预测方法的研究[J].公路交通科技,2006,23(14):103-106.
[5]邵春福,熊志华,姚智胜.道路网短时交通需求预测理论、方法及应用[M].北京:清华大学出版社,2011.
[6]马国旗.城市道路交通流特征参数研究[D].北京:北京工业大学,2004.
[7]杨兆升.城市交通流诱导系统理论与模型[M].北京:人民交通出版社,2000.