高速公路流量检测数据的预处理方法研究
2015-04-07李阳
李阳
摘 要:主要研究高速公路车检器流量检测数据的筛选方法和修补方法。首先从交通流三参数的关系出发,分析错误数据的种类及原因,提出一种对错误数据的筛选方法;然后分析与修补数据相关性最强的参数集合,制定修补算法对缺失数据进行补修。错误数据的筛选主要运用阈值法,阈值的制定以道路通行能力为依据。本研究为高速公路的车检器流量检测数据的预处理技术提出了新的思路。
关键词:流量检测数据;错误数据筛选;修补算法;阈值法
中图分类号:TP316 文献标识码:A 文章编号:2095-1302(2015)02-00-02
0 引 言
交通流数据主要包括车流量、车速、车间距、车辆类型、道路占有率等信息,其一般采用车辆检测器检测,车辆检测器是高速公路交通监控系统中不可缺少的组成部分,在智能交通系统中占有重要的地位,其检测数据的有效利用能很大程度上提高交通监控系统的管理水平。但是,由于车检器的老化程度各有差异,受到路面交通状况、恶劣环境等因素的影响程度也不同,车检器也会存在不同程度的间歇性工作故障,流量检测数据也会有不同程度的缺失与错误,若直接将有质量问题的数据应用到交通流状态辨识及后续应用中,必将对应用结果带来不良影响,甚至直接影响科学决策的正确性[1]。因此,为获得高效精益化的交通流数据,数据筛选与修补显得尤为重要。目前,错误数据的判别算法中的阈值方法、基于交通流机理的方法应用较为广泛,修补算法中加权平均法、BP神经网络等方法也均有应用[2]。而本研究采用的阈值法与交通流理论相结合的数据筛选方法,与已有的方法相比筛选规则更加精细,筛选流程更加清晰有据,且数据修补算法较为简便易懂,便于实际运用[3]。本文通过设计科学合理的算法对高速公路车检器流量检测数据的质量给予评估,过滤掉错误的数据,并再此基础上将错误数据修补成较为真实的数据,为车检器检测数据在ITS应用领域发挥更好与更大的效能提供基础[4]。
1 流量检测数据的筛选
车检器检测数据表现了高速公路的交通运行状态特征,可提供总交通量、大中小分车型交通量、车辆占有率、速度等参数。其中,占有率、总交通量与速度间具有密切的联系(在交通流量较小的情况下,单位时间内通过检测器的车辆数较小,且由于车速较高,导致时间占有率比较低。随着交通量增加,单位时间内通过检测器的车辆数增加,而且车速有所降低,因此检测器被车辆占用的时间增加,时间占有率会显著增加。当出现交通拥挤时,通过检测器的交通量虽然可能降低,但由于车速明显下降,使得时间占有率仍然处在一个较高的水平。)当检测数据中三者的关系符合其正常关系时,总交通量符合真实值,反之,则可认定其错误。然而,在判断总交通量正确的情况下,并不能反映出分车型流量的正误,如图1所示。当分车型流量与总流量之间有一条数据不符合实际情况,那么此条数据就为错误数据。
图1 XX省XX段某车检器流量检测数据
1.1 总交通量的筛选方法
利用占有率、交通量与速度之间的密切联系,把交通流三参数作为一个整体考虑,有利于更好地利用其内在的规律进行筛选。表1是交通流三参数九种不同情况取值的组合,通过对这些组合的分析,可以对交通流三参数做一个基本的判断,筛选出明显错误的数据[5,6],其中,v代表车检器采集到的速度值,o表示车检器采集到的占有率,q表示车检器采集到的总流量。
通过上述研究可得,除了被认为数据错误的5种情况被直接过滤掉外,另外4种情况将进一步制定判别方法判断流量检测数据是否为真实值或错误值,本研究主要运用阈值法,阈值筛选是指交通量、速度和占有率不能超过一定的阈值。
表1 错误数据筛选判编号 参数形式 错误判断 处理方式
1 v=0,o=0,q=0 数据缺失或真实值 进行下一步检验
2 v=0,o=0,q≠0 数据错误 删除
3 v=0,o≠0,q=0 数据错误 删除
4 v≠0,o=0,q=0 数据错误 删除
5 v=0,o≈1,q=0 完全停车情况 进行下一步检验
6 v≠0,o≠0,q=0 数据错误 删除
7 v=0,o≠0,q≠0 数据错误 删除
8 v≠0,o=0,q≠0 待定 进行下一步检验
9 v≠0,o≠0,q≠0 待定 进行下一步检验
针对交通量不为零的情况(情况8和情况9,在交通低峰时期,车速快,车辆检测器有时会出现灵敏度不够的情况,占有率就会显示为零),可通过最大阈值法排除检测交通量数值超过道路通行能力的情况。道路通行能力是指道路上某一地点、某一车道或某断面处,单位时间内可能通过的最大的交通实体(车辆或行人)数,估算单车道的道路通行能力的公式为[7]:
(1)
l0=lc+la (2)
根据道路通行能力的估算,定义交通量的取值范围q的合理范围为:0≤q≤C·T/60·f。其中:C为道路通行能力(veh/h);v为小客车的行车速度(km/h);T为数据采集的时间间隔(min),一般为5 min;l0为车头最小间隔;lc为小客车的长度(km);la为车辆间的安全间距(km);f为修正系数,一般取1.3~1.5。
针对交通量为零,占有率约为1的情况,可通过前5分钟和后5分钟的数据判断是否出现停车或拥堵状况,如果前后三项数据基本一致则正确,否则将此条数据视为错误数据。
针对交通量和占有率均为0的情况,可能是因为凌晨流量较低,也可能是数据传输中断造成丢失。这里可以对不同天数同一时段的交通流量的数据进行比较,如果前后两天的流量接近0,则数据为真实值;否则为错误数据。
1.2 分车型流量数据的筛选方法
将总流量有错误的数据过滤掉后,需要判断分车型流量数据是否有错误。当总流量为真值时,分车型流量的和与总流量相比相差过大也是不对的。分车型流量的筛选通过以下公式判断:
(3)
其中:qi为分车型流量的值(i=1,2,3,分别表示大、中、小型车的检测流量值);Q为总交通量;δ%为设定误差,通常根据车检器的精度参数进行设定。
如果总交通量的值与分车型流量的和之间的相对误差在规定范围内,可视为数据为真实值;否则本条数据错误,需要过滤掉。
2 流量检测数据的修补
将保留下来的车检器流量检测数据(包括小、中、大型车和总流量的检测数据)根据残缺度,还原成完整度为1的数值,作为车检器全天正常工作时检测到的数据。车检器一天中某缺失时段的总交通量的修补值根据对应缺失时段的前15天的总交通量检测数据与后15天的总交通量检测数据计算得出,公式如下:
(4)
其中: kn为车检器第n天缺失时段的总流量修补值。针对大、中、小、型车的检测数据的修补方法,与总流量数据的修补方法相同。
3 结 语
本研究利用阈值法和数理统计知识对车检器流量检测数据的错误数值的筛选提供了思路和依据,并将其修补为正确性高,完整率为1的检测数据。该方法的使用可以为高速公路管理部门提供质量更好的流量检测数据,使车检器数据发挥出更好的效能。
参考文献
[1]王晓原,吴芳.交通流数据清洗的关键理论及方法研究[D].淄博:山东理工大学,2009.
[2]王保保,叶庆添.基于数据挖掘技术的短时交通流预测的研究与应用[D].西安:西安电子科技大学,2013.
[3]姜桂艳.道路交通状态判别技术与应用[M].北京:人民交通出版社,2004.
[4]金盛.环形线圈检测器交通数据预处理方法研究[D].长春:吉林大学,2007.
[5]姜桂艳,江龙晖,张晓东,等.动态交通数据故障识别与修复方法[J].交通运输工程学报,2004,4(1):121- 125.
[6]裴玉龙,马骥.实时交通数据的筛选与恢复研究[J].土木工程学报,2003,36(7):78-83.
[7]张亚平,裴玉龙.道路通行能力研究现状及发展综述[J].交通运输工程学报,2002,2(2):95- 97.