基于BP神经网络的公交车到站时间预测
2016-02-13谢炜
谢 炜
(中国石油大学胜利学院高等教育研究与评价中心,山东东营257061)
基于BP神经网络的公交车到站时间预测
谢 炜
(中国石油大学胜利学院高等教育研究与评价中心,山东东营257061)
公交车到站时间预测是城市公共交通智能化发展的首要需求。基于公交车的历史数据和实时数据,综合考虑公交车运行所处时段、天气状况和工作日时段等全局性因素和交通密度、交通流量、车辆排队长度等区域性因素的影响,增加了同路车的上下行到站信息参数,对公交车到站时间进行预测,提出了基于BP神经网络的预测模型。研究结果表明,BP神经网络能够较准确预测公交车到站时间。
GPS;BP神经网络;公交车到站时间;预测
目前我国的城市化进程不断加速,城市交通道路网络不断完善,但是道路的供给能力仍无法满足交通需求量的快速增长。优先发展城市公共交通,鼓励市民公交出行是目前行之有效的解决办法。市民如何能提前获取公交车的到站时间,并根据个人情况优先选择不同的公交车出行,减少乘车时间,成为城市公共交通智能化发展的首要需求。先进的公共运输系统(APTS)和先进的出行者信息系统(ATIS)为预测公交车辆运行时间提供了基础,不仅提高了公交车资源使用效率、方便了市民公交出行,而且间接减少了城市交通的拥堵。然而城市公交车到站时间具有复杂的非线性特征,利用传统的指数平滑法等无法做到准确预测,笔者利用计算机科学的神经网络的非线性映射能力来实现其精确预测。
1 公交到时预测模型
1.1 GPS
GPS数据采集技术是获取实时交通信息最常用的方法之一,美国首先提出了利用配有GPS的目标车辆采集交通信息,实现车辆位置的精确定位;日本提出了动态路径引导系统,在系统中融合了GPS数据采集、地图信息更新、交通实时信息的发布等技术,更方便了公交车GPS的实用性。孙棣华等以GPS定位数据为基础,综合考虑道路路段平均速度、车辆即时速度、到站距离等因素,实现了实时预测[1]。周雪梅等利用GPS数据,并考虑了前车的平均瞬时速度作为近似反映道路交通动态变化的特点,提出了估算公交车在公交站点区域停留时间的预测模型[2]。虽然GPS克服了传统方式采集的局限性,并实现了自动采集和自动信息交互,极大地提高了数据采集的有效性。然而,采用GPS获取车辆位置的技术需要一定的硬件成本,对于大中城市的公交公司是可以承受的,但是对于三线城市的公交公司需要较大的前期投入。公交车GPS属于民用GPS,精度低,数据通信容易受电磁干扰,这些都直接影响采集数据的准确性。另外,公交车在行驶过程中,GPS信号容易受到高楼、隧道、树木和立交桥的影响,造成实时数据缺失;公交车在停车站、停车场、交叉路口等特殊区域运行速度缓慢或停止,造成大量的GPS数据为零的情况,形成“倒行”误差。
1.2 历史数据
涂利明采用基于前车与经验数据的公交车站到站时间预测模型,区分了高峰期和非高峰期、红灯等待时间和斑马线的影响,较好地满足预测所需要的准确性和实时性要求。这种方法对历史数据的采集工作要求很高,当出现偏离历史描述的突发事件时,预测效果不很理想[3]。
1.3 神经网络
于滨等采用支持向量机(SVM)预测公交车的到站时间,采用了时间段、天气、路段和当前路段的运行时间和下一路段的运行时间作为输入变量,能较好应对运行过程的随机延迟[4]。周敏等采用广义神经网络(GRNN)预测公交车运行时间,提高了系统的泛化能力,减小了预测误差[5]。郭兰平等采用径向基函数(RBF)神经网络预测兰州103路公交车的车速,拟合进度和预测精度较高[6]。神经网络是根据大脑的生理研究,采用特定的拓扑结构,通过输入层、隐含层和输出层之间顺次连接,对输入的数据进行加权求和,如果和超出某个阈值,输出一个量。通过大量的数据训练进行学习训练,不断调整各输入端的权重,形成最符合要求的预测模型。但是,神经网络需要的计算时间和计算空间较大,并容易陷入局部最优。
2 公交车行驶的影响因素
2.1 区域性
区域性影响主要是指公交车在行驶过程中,由于所处城市不同的繁华地区,行驶的速度和车乘人员的数量都不同程度的变化,这些导致了交通密度、交通流量、车辆排队长度等因素的变化。其中,交通流量指单位时间内通过道路某一截面的实际车辆数,是用来度量城市交通状态的一个指标。交通密度是指单位长度的道路上某一时刻能够容纳的最多车辆数。交通密度和交通流量成反比,当发生交通拥堵导致观测路段无法通行,全部车流处于停滞状态时,交通密度最大,交通流量几乎为零。车辆排队长度是指为排队等候在发生交通间断点(道路交叉口或交通事故发生地点)的车辆数。排队长度越长,道路的拥挤程度越厉害。
针对区域性影响因素,对于这个区域通过的公交车可以不去考虑,因为这带有区域性特点,也就是越繁华的地方,区域性影响趋于一致。那么对于本区域的公交车的车速,载客量,交通高低峰的影响是一致的。如果局部区域出现交通事故,那么对这一区域的公交车的影响也是趋于一致的。涂利明选取杭州公交104路,其中经过医院、商业区等比较复杂路况的路段时,交通密度和车辆排队长度很大,而线路中其他路段的路况较畅通,候车乘客也比较少[3]。
2.2 全局性
全局性影响是指相关因素针对整个城市的公交系统都有统一的影响,车辆运行的高峰时段还是平峰时段,天气状况和工作日的时间都对整个城市公交系统的影响有一致的趋势。其中,车辆运行时段是指公交车运行的时间,分为高峰时段、平峰时段。而天气状况会影响公交车的某些性能参数,相对于夏季,冬天需要热车时间。另外,降雨、大雾、降雪等恶劣天气会导致路面湿滑和阻挡行车视线,影响公交车的行驶时间。对于工作日,高峰和平峰对所有公交车的影响是一致的。对于节假日,繁华地段、部分公园和乐园的公交影响往往大于工作日时段。那么这些影响因素对整个城市的公交系统的影响并不区分繁华地区还是城市近郊区地区。
3 BP神经网络预测模型
BP(back-propagation)误差反向传播的神经网络,主要思想是利用实际输出与期望输出之差对网络的各层连接权重由后向前逐层进行校正,通过大量样本数据的不断训练,使误差平方和最小。如图1所示,这是一个BP神经元模型,它具有n个输入,每个输入都通过一个恰当的权值w和下一层相连,网络输出可表示为a=f(wx+b),其中f表示输入/输出关系的传递函数。
图1 BP神经元模型
BP神经网络由三个层次构成:输入层、隐藏层和输出层。输入层的个数由样本分类个数决定。隐藏层的层数和每层的神经元个数由用户指定。每一层包含若干个神经元,每个神经元包含一个而阈值,用来改变神经元的活性。网络中的连线表示前一层神经元和后一层神经元之间的权值。每个神经元都有输入和输出。输入层的输入和输出都是训练样本的属性值。BP神经网络的优点是只要有足够的隐藏层和隐藏节点,就可以逼近任意的非线性映射。缺点是收敛速度较慢,目标函数陷入局部最小点的可能性较大。可以采用修正办法,调节收敛速度增加动量项,或高阶导数和共轭梯度法等数学方法修正函数。
在影响公交运行的因素中,考虑全局影响因素、区域影响因素和车载信息因素。全局影响因素选取时间段、天气、是否是节假日作为模型的输入变量。时间段变量X1分为高峰时段、平峰时段。对于天气变量X2,考虑晴天和多云、降雨和多雾两种情况。对于节假日变量X3,分为工作日和非工作日。公交车辆到站时间的历史经验数据可以作为线路到站时间预测模型的基准数。然而,同一线路在当天可能会有临时交通状况发生,从而造成公交车辆运行时间的变化,仅仅以历史经验数据进行预测可能与实际运行情况有一定的偏差。涂利明提到刚刚驶往下一个站点前车车辆的平均瞬时速度能够近似地反映当前公交车辆驶入该区段时的道路交通状况,该前车数据可以对经验数据偏差进行修正[3]。针对区域因素,采用公交车和车站的信息交换设备,能够提供公交车的上下行数据和不同路公交车的到站时间历史记录以及到上一个站点的时间。通过这些数据能映射区域性交通状况,区域性影响主要是受到繁华地区和交通事故区域的交通密度、交通流量、车辆排队长度等因素的影响,也就是单位时间内的区域性影响能够通过这个时间段通过的不同路的公交车的上行和下行数据来表示,如果处于繁华地区,公交车的相关数据反映了所处区域的情况——同样班次的公交车到站时间间距变长,而处于城郊区域,单位时间内的公交车的运行时间基本一致。因此,采用公交车的上下行到站时间和同一路公交车的前一站的到站时间这些数据,而这些数据是对车站周边一公里半径的交通状况的一种反馈。公交车在线路上某站点i的到站时间预测是由i-1站点的上行到站时间变量X4、i站点t时刻最近的下行到站时间变量X5实现的。图2为基于BP神经网络构建的公交车到站时间的预测模型。
采用三层的BP神经网络,输入为表示5种影响因素,输出为 表示t时刻公交车到达的时间,使用样本数据对神经网络进行训练,调整相应的权重,这些训练学习可以采用离线方式进行,对t时刻的预测过程,可以采用已经训练好权重的神经网络进行实时预测。
图2 BP神经网络结构
4 结束语
采用BP神经网络较好地实现了对公交车到站时间这种非线性特征计算的预测,该模型选取了影响公交车运行状态的全局性因素和反映区域性因素的多个变量,预测出当前时刻公交车的到站时间。但是BP神经网络存在着学习时间长、计算量大,需要离线训练等问题。下一步可以采用不需事先确定隐含层单元的径向基函数神经网络,而且学习时间短、计算量小,预测能力优于BP神经网络。针对输入层,目前只考虑了同路公交车在i-1站点的上行到站时间和i站点t时刻最近的下行到站时间,以后的研究中,可以加入不同路公交车的i站点的上行和下行到站时间,以期提高预测的准确性。
[1] 孙棣华,赖云波,廖孝勇,等.公交浮动车辆到站时间实时预测模型[J].交通运输工程学报,2011(2):84-89.
[2] 周雪梅,彭昌溆,宋兴昊,等.基于前车数据的动态公交车辆到站时间预测模型研究[J].交通与运输(学术版),2011(2): 52-56.
[3] 涂利明.基于前车与经验数据的车辆到站时间预测模型[J].计算机时代,2015(1):1-3.
[4] 于滨,杨忠振,林剑艺.应用支持向量机预测公交车运行时间[J].系统工程理论与实践,2007(4):160-164.
[5] 周敏,韩印,姚佼.基于广义回归神经网络的公交车运行时间预测模型[J].交通与运输(学术版),2013(2):75-78.
[6] 郭兰平,俞建宁,张建刚,等.改进RBF神经网络在城市公交车速时间序列预测中的应用[J].重庆理工大学学报(自然科学版),2010(12):60-66.
[责任编辑]董大伟
O141.4
A
1673-5935(2016)04-0038-03
10.3969/j.issn.1673-5935.2016.04.011
2016-11-10
山东省高等学校科技计划项目(J11LG82)
谢 炜(1972—),男,上海虹桥人,中国石油大学胜利学院高等教育研究与评价中心讲师,主要从事计算机应用研究和高教研究。