基于Elman神经网络的客流量预测方法应用
2022-08-23周青张青松
周青 张青松
1.昆明医科大学海源学院;2.云南师范大学实验中学
本文明确了客流量预测在整个公交运力配置流程中的关键作用。客流量的准确预测是公交资源优化配置的依据和前提。本文给出了基于Elman神经网络的公交客流量预测流程。最后,通过数据搜集,利用某城市近8年的客流量数据进行了实例预测。最后通过与当前较流行的BP静态神经网络比较,发现Elman神经网络整体上比BP神经网络具有较高的预测精度。
客流量的预测是进行公交运力配置的基础和依据。但是,由于客流量的时间和空间复杂性,数据量之大,准确度量很难真正实现。客流量在不断地发生变化,在不同的时间和不同的空间上均有变化,但是这种变化还是有一定的规律可循的。掌握了公交客流的变化规律,对于组织公交运输、优化公交运力资源具有极其重要的意义。
1 公交客流的概念和特点
1.1 公交客流的概念
城市公交客流指公众为实现某项出行活动,借助特定的交通工具,在城市道路上有目的地流动而形成的人流。依据乘客乘车的目的地指向区别,公交的客流可分为上班工作流和其他客流。位于市区的乘客,客流量整体上较郊区大,时间规律性较强,高峰时间明显,平均乘车间距较短,换成交替频繁;公交客流量是动态变化的,难以准确计算。但是客流量的准确预测,对公交站点、线路的设定和发车频率等有着决定性的影响。
1.2 公交客流的特点
公交客流量的分布主要呈现出时间特征和空间特征,时间上分为高峰期和平峰期,高峰期的客流量主要为上下班客流,人员多,时间比较集中,规律性比较强;通常存在几个高峰时段:早上班高峰,晚下班高峰,节假日高峰,学校附近上下学高峰等。平峰期,主要呈现出客流分散,时间不集中,规律性不明显。空间分布特征也主要体现在客流密集地带和分散地带。密集地带主要分布在学校、客运站和居民区附近等,分散地带客流量比较少无规律性,密集地带,人员量大,时间规律性强。对于规律性以外的客流量具体来分,客流量还具有以下空间特点:
1.2.1 线路网上的客流动态
线路网上的客流动态,是指对整个城市而言,是个宏观的概念,是指某一时刻,城市公交线路的某一截面上的客流量的动态变化,没有公交线路、停靠站点和流动方向的区别,总体体现了整个城市公交线路网上客流量的特征。
1.2.2 方向上的客流动态
某条线路乘客在流动方向上的变化状态即方向上的客流动态。公共交通每条线路都有上、下之分,在同一时间间隔内上下行客流经常是不平衡的,有的线路差异甚至巨大,根据客流方向可以分为单行和双行两种类型。
分析客流动态,利于确定公交调度形式,组织车辆运行,编制行车时刻表都有至关重要的意义。
2 基于Elman神经网络的预测方法的引入
2.1 常见客流预测的方法
针对客流量的预测,我们国家已有很多研究,最常见的预测方法主要有两种:四阶段预测法和直接预测模型法。但是,这些模型牵涉的相关因素多、结构复杂,求解难度大,因而在实际的应用过程中有很大的局限性。因此,有很多学者开始转向神经网络方面的研究和实验。
2.2 神经网络理论
神经网络是一门交叉学科,是机器学习研究的重要分支。它通过模范学习动物神经网络的行为特征,对信息进行类似仿生处理的数学方法。神经网络通过调整系统内部节点之间相互关系,实现信息处理的目的。由于公交客流量的特殊性,随着时间不断变化的特点,很难用确定的函数或方程来描述。因此,在对客流量进行预测的过程中,本文引入了神经网络的相关原理。
2.3 Elman神经网络理论
Elman神经网络的概念最早是由J. L. Elman于1990年首次提出来的,它是一种典型的局部回归型网络(Global Feed Forward Local Recurrent)。因此,我们可以将Elman神经网络看作是一个具有局部记忆单元和反馈连接的递归神经网络。在神经网络的预测模型中,有两种常用理论:BP网络和Elman网络。而BP神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络。其原理本质上是将动态的时间建模转化为静态的空间建模。而本文中关于公交客流量的预测,公交客流量具有动态性时空变化的特点,使用BP网络建模必然会出现许多问题。因此本文引入了带有反馈的动态神经网络,Elman型神经网络由于其自身的特殊性,在解决预测问题上也有更高的准确性和科学性。
3 公交线路客流分布预测流程
公交客流预测是一个复杂的过程。在对客流量进行预测时,首先要对公交线路客流现状的调查,通过各种形式的数据调查,可以得到公交线上的乘客分布规律以及各站点一天客流分布规律、公交车的满载率等指标,为公交线路运力的合理配置提供依据。我国城市公交基础设施普遍落后,而公交出行乘客众多,客流调查难度大,调查数据容易出现偏差。因此,数据修正的步骤必不可少。通过数据修正,对客流量进行初步的预测。根据预测结果,进行试运营,具体数据根据实际的运营状况再次进行调整。因此整个运营线路的客流预测是线路运力配置优化的关键。具体的流程如图1所示。
图1 基于时空变化的公交线路客流分布预测流程Fig.1 Passenger flow distribution prediction process of bus lines based on temporal and spatial changes
(1)首先,根据线路的现有运营情况,确定是否要优化公交站点?
如果需要,就要从站点的具体客流情况做分析调研。这里主要是对线路站点的服务面积分析,在此基础上结合以往历史数据(已有站点)或者类似站点的经验数据(新增站点),生成该站点的客流量预估数值。同时,做本站点的客流量OD调查,调查内容主要涉及乘客起止点分布、出行目的、出行方式、出行时间、出行距离、出行次数等,以此对站点预测数据做出修正。对于最终得到的预测数据,作为新线路客流量预测的初值,在实际运营过程中,根据后期的实际统计数据,再做最终的修正。
(2)如果不需要开辟新线路,就直接对该条线路做全日客流量的预测。根据线路上站点的地理位置、人群结构等分布,针对站点的两种不同的类似度有以下两种处理方式。
1)如果线路上的若干个站点类似度较高,则采用首末站分层不等概率抽样,根据调查数据,做出客流时段分布预测,并以此对其他站点的客流量做出分布推算。
2)如果线路上的站点类似度较低,则采用聚类分析的方法对站点进行处理。首先,聚类分析代表站点的客流量情况,并做出预测。然后,再针对层内站点客流量做出时段分布推算。
(3)这些通过模型预测得到的数据,必须在实际的公交运用过程中,根据用户的乘车体验和公交公司的综合效益等指标再做出数据修正。
3.1 数据处理
这里采用Matlab软件完成数据处理,通过网络训练和预测数据的时间序列转换,需要对原始数据进行归一化处理。函数如下:
为了提高精度,通常设置输入输出数据的范围在0.2~0.8之间。经过这样的处理,利于样本数据的快速训练,生成预测数据。下文中的实验数据处理过程也是采用这种数据精度的。
3.2 模型的实例化与评价
为了更好地比较Elman神经网络和BP神经网络的差异,我们通过数据搜集,取某城市某一个固定站点近8年的公交线路客流量数据如表1所示,进行实例化模型分析。
表1 2013—2020年某城市公交客流量Tab.1 Bus passenger flow of a city from 2013 to 2020
该城市2013—2020某一固定站点8年的客流量数据,每个数据分别对应一个时间函数x
(i
)。通过MATLAB仿真模拟,得到的模拟值和模拟误差率如表2所示。表2 Elman和BP模拟值及误差率Tab.2 Elman and BP simulation values and error rate
从表2中数据可以看到,Elman模拟比起BP模拟,平均误差为-0.66%,而BP模拟的误差率达到2.15%,从8年的实例数据仿真可以看出,Elman神经网络比BP神经网络具有更高的模拟精度。因此,现实的客流预测中采用Elman神经网络来进行,会有更高的现实拟合度,更加精确和科学。
但是,神经网络预测体系只是保证了预测过程的相对准确度,要想真正得到精确的数据,需要与其他先进技术相结合,如视频图像处理、模式识别、传感器等,保证采集到第一手准确的现实数据。只有做到了这些,才能保证得到较准确的客流量数据。
4 结语
本文首先分析公交客流量的时空分布的复杂性和规律性,然后结合现有的优秀的算法对客流量的预测流程进行了建模。最后,利用某城市近8年的某一固定站点的客流量数据进行了实例预测,通过比较,发现Elman神经网络比BP神经网络具有较高的预测精度。在实际的使用过程中,数据的采集和数据的修正也直接关系着后续优化工作的开展效率。因此,有待于先进科技的不断融入,只有准确采集了当前的客流量数据,对整个公交运力配置的过程推进才会产生真正的意义。