基于小波神经网络的定制公交目标乘客出行意愿预测
2018-07-30靳文舟韩博文郝小妮黄玮琪
靳文舟,韩博文,郝小妮,黄玮琪
(华南理工大学 土木与交通学院,广东 广州 510640)
0 引 言
如今基于“互联网+”的新型定制化公共交通出行方式越来越多的出现在人们生活中。这种新型定制化出行方式以人们出行需求为导向,提供定制化的出行服务。例如:为解决目前普遍存在的城市大型对外交通枢纽与城市道路客运交通无法很好衔接的问题,拟规划的广州南站商务专线定位于运用“互联网+”技术为商务人士以及追求方便、快捷、舒适出行体验的乘客提供抵离广州南站的定制化出行服务。该专线有以下特点:① 公共交通属性,如定点、定时、固定线路等;② 采用商务车型使其比常规公交和地铁更加快捷、舒适;③ 预约上下车点可有效解决“最后一公里”的问题;④ 价格定位于出租车与公交之间,因此比出租车更有价格优势;⑤ 在服务上较常规公交和地铁更具吸引力。
白玉方等[1]研究表明:增强公交的快速性和便捷性能提高出行者公交出行意愿,但商务专线发展前景如何,是否能让乘客对其产生较强的出行意愿,还有待于进一步研究。笔者以目标乘客出行意愿为对象的研究可归结为交通方式选择行为的研究[2-8]。通过对乘客相关特征分析,从而预测其交通方式选择的意愿偏好。
目前,学界通常采用离散选择模型[9]、神经网络[10-11]等方法进行研究。离散选择模型中最具代表性的为Logit模型和Probit模型,两者均是基于效用最大化原理,以微观决策者为研究对象,对决策者选择行为进行研究,但两者均有着一定缺陷和不足。神经网络具备较强的模拟任意非线性关系能力和模式识别能力,笔者基于定制公交目标乘客出行意愿预测从本质上而言是一个选择分类的问题——即是否有意愿乘坐定制公交出行,且乘客出行意愿与其影响因素之间存在复杂的非线性关系,因此神经网络较适用于文中乘客出行意愿预测。通过目标乘客出行意愿调查(stated preference survey),笔者获取了大量乘客出行特征,并基于小波神经网络对乘客出行意愿进行预测研究,从而为新型定制公交规划提供依据。
目前运用神经网络对乘客出行意愿进行预测的研究较少,且现有研究所运用的神经网络类型大都较为落后,如概率神经网络、BP神经网络等。笔者尝试运用较为先进的小波神经网络对基于定制公交的乘客出行意愿进行预测。笔者通过搜集大量样本数据进行计算分析,获得了较为全面的乘客出行意愿影响因素,不仅包括乘客自身属性,还包括了影响乘客出行意愿的一些关键出行特征,让预测更具科学性。为改善网络训练效果,笔者采用自适应方法对网络学习速率和隐含层节点数进行确定,并采用成批训练方法对网络进行训练,以减少训练过程中振荡的发生。
1 乘客出行意愿影响因素
笔者以广州南站商务专线的目标乘客出行意愿为研究实例,对目标乘客出行意愿的影响因素进行分析。广州南站商务专线的主要服务对象是广州市抵离广州南站的乘客,本次乘客出行意愿调查共回收有效问卷9 522份,通过对调研数据统计分析发现:乘客自身属性(性别、年龄、职业、年收入)以及乘客出行特征(出行目的、出行起讫点、出行是否换乘、现状出行方式等)都对乘客未来是否有意愿乘坐商务专线有着显著影响。
1.1 乘客自身属性
1.1.1 性 别
在出行方式选择上,男性乘客与女性乘客之间的注重点有所不同,因此男女乘客的出行意愿会有所差异。调查结果显示:男性乘客乘坐商务专线的意愿高于女性乘客。
1.1.2 年 龄
不同年龄段乘客在经济基础、消费理念、出行习惯以及偏好上均有所差异,因此其出行意愿会有所差异。调查结果显示:18~30岁年龄段乘客出行意愿最高,其次分别为30~40岁、40~60岁、18岁以下、60岁以上的乘客。
1.1.3 职 业
调查结果显示:机关企事业人员对商务专线的意愿最高,学生、企业家、离退休人员及其他职业人群的意愿较低,不同职业乘客的出行意愿具有明显差异。
1.1.4 年收入
由于商务专线运价定位于公共交通和出租车之间,提供中高端出行服务,因此年收入较低的乘客对其出行意愿较低;又由于年收入很高的乘客大都拥有私家车,因此其出行意愿也较低。调查结果显示:出行意愿较强的乘客主要为年收入在5~10万、10~20万之间的人群,年收入在30万以上和5万以下的乘客出行意愿较低。
1.2 乘客出行特征
1.2.1 出行目的
调查结果显示:以商务出行、探亲、旅游等出行目的的乘客对商务专线意愿较高,特别是商务出行的乘客;以其他出行目的的乘客(学生、日常通勤的车站工作人员等)由于其消费水平较低或出行选择较多,对于商务专线的出行意愿稍低。
1.2.2 出行起讫点
不同地区经济发展不同,城市道路网、公共交通建设发展不同,导致不同地区抵离广州南站交通条件便利程度不同。如:荔湾区、天河区、海珠区等核心区域具有完善的公共交通运输服务体系,乘客抵离广州南站方式较多,出行满意度较高,对商务专线出行意愿较低;而南沙区、黄浦区、白云区、番禺区的公共交通和道路条件建设相对滞后,乘客抵离广州南站方式较少,出行满意度较低,导致乘客对商务专线出行意愿较高。
1.2.3 出行是否换乘
乘客出行便捷度一部分体现在是否需要换乘上,换乘导致的出行不便会增加乘客对直达商务专线的出行意愿。调查结果显示:来往广州南站需要换乘的乘客对商务专线出行意愿明显高于不需要换乘的乘客。
1.2.4 出行方式
出行方式主要分为:出租车、地铁、公交、长途汽车、私家车。由于这5种出行方式服务水平有所不同,且商务专线对这5种出行方式的竞争优势有所不同,因此现行的各类出行方式乘客对商务专线的出行意愿也会有所不同。调查结果显示:各类出行方式乘客中,出租车乘客对商务专线出行意愿最高,其次为地铁、公交、长途汽车,最低的是私家车。
因此,笔者将性别、年龄、职业、年收入、出行目的、出行起讫点、出行是否换乘和乘客出行方式作为影响乘客出行意愿的8个主要因素。
2 基于小波神经网络预测模型
小波神经网络(wavelet neural network, WNN)是小波分析理论与神经网络理论相结合的产物[12]。笔者构建的小波神经网络以3层BP(back propagation)神经网络拓扑结构为基础,是一种以小波基函数代替Sigmoid函数作为隐含层节点的传递函数神经网络。把目标乘客出行意愿影响因素标定值作为网络输入,将目标乘客出行意愿作为网络输出,利用共轭梯度法来修正网络权值和小波系数。笔者所构建的小波神经网络可避免BP神经网络等结构设计上的盲目性,从根本上避免了局部最优等非线性优化问题,具有较强的函数学习能力,能对目标乘客出行意愿与其影响因素之间存在的复杂非线性关系实现较高精度模拟。
2.1 小波神经网络算法结构
小波神经网络由输入层、隐含层和输出层这3层结构组成,其结构如图1。
输入层输入为:xi(i=1, 2, …,N1),隐含层输出为:yh(h=1, 2, …,N2),输出层输出为:zj(j=1, 2, …,N2),网络期望输出为dj。笔者将目标乘客出行意愿的8个影响因素作为小波神经网络输入变量,故网络输入层有8个神经元(N1=8);由于网络输出结果仅为乘客的出行意愿(是为1;否为2),因此网络输出层为1个神经元(N2=1)。隐含层神经单元数N2则是根据训练误差要求自适应确定,从而克服了传统BP神经网络不足。
图1 小波神经网络拓扑结构Fig. 1 Wavelet neural network topology
小波神经网络前馈计算描述如下:
对于隐含层,有式(1):
(1)
对于输出层,有式(2):
(2)
式中:neth为隐含层第h个神经元的输入值;netj为输出层第j个神经元的输入值;wih为输入层第i个神经元与隐含层第h个神经元之间的连接权值;whj为隐含层第h个神经元与输出层第j个神经元之间的连接权值;f(net)为隐含层传递函数,文中使用Morlet小波函数作为隐含层传递函数;g(net)为输出层传递函数,文中使用Sigmoid函数作为输出层传递函数,以便于对预测结果进行分类处理,同时减少训练过程中发散的可能性。
f(net)和g(net)的计算如式(3):
(3)
式中:b为小波基函数的平移因子;a为小波基函数的伸缩因子;β为常数。
2.2 模型算法学习过程
小波神经网络算法学习实质是输入输出样本集对网络进行训练,根据实际输出与期望输出误差E不断调整网络各层之间的连接权值和小波基函数参数,直到误差小于预先设定的某个精度值ε(ε>0)或训练次数n达到最大训练次数N时停止网络学习,其具体学习过程如图2。训练过程中,笔者采用有动量的梯度下降法对网络权值和小波基函数参数进行修正,该方法利用前一步得到的修正值来平滑学习路径,从而避免了网络陷入局部极小值缺陷,加快学习速度。由于在对单个样本进行逐一训练时,会引起权值和参数的修正振荡,因此笔者采用成批训练方法,如每次训练P个样本则对网络参数修正一次,从而避免了振荡发生。
图2 小波神经网络算法学习过程Fig. 2 Algorithm learning process of wavelet neural network
网络隐含层神经元数按如下方法自适应确定:取小波神经网络的隐含层单元数h=1,若此时网络能在最大学习次数内满足所设定的误差条件,则停止迭带,若达到最大学习次数后,仍不满足误差条件,则隐含层单元数增加1,重复上述过程,直到满足误差条件为止。
给定一批p(p=1,2,…,P)个输入输出样本,学习率为η(η>0),动量因子为λ(0<λ<1),则目标函数误差如式(4):
(4)
小波神经网络隐含层与输出层之间权值修正计算如式(5):
(5)
输入层与隐含层之间权值修正如式(6):
(6)
小波基函数伸缩因子修正公式如式(7):
(7)
小波基函数平移因子修正公式如式(8):
(8)
学习速率η自适应修正公式如式(9):
(9)
3 模型预测的MATLAB实现
3.1 模型输入变量标定
模型输入变量标定原则为:考虑神经网络自身固有的模式识别问题,即以样本相似性度量来提取样本特征进行模式分类。笔者在进行模型输入变量标定时,遵循出行意愿相似变量用相连数字代码表示的原则。调研显示:探亲和旅游乘客其乘坐商务专线的意愿比较相近,那么在对出行目的进行变量标定时,探亲和旅游需用相连数字来标定。其具体标定如下:
x1为性别:男(x1=1)、女(x1=2);
x2为年龄:18岁以下(x2=1)、60岁以上(x2=2)、40~60岁(x2=3)、30~40岁(x2=4)、18~30岁(x2=5);
x2为职业:离退休人员(x2=1)、其他(x2=2)、学生(x2=3)、企业家(x2=4)、机关企事业(x2=5);
x4为x4年收入:30万以上(x4=1)、5万以下(x4=2)、20~30万(x4=3)、10~20万(x4=4)、5~10万(x4=5);
x5为出行目的:其他(x5=1)、探亲(x5=2)、旅游(x5=3)、商务出行(x5=4);
x6为出行起讫点:荔湾区(x6=1)、天河区(x6=2)、白云区(x6=3)、越秀区(x6=4)、黄浦区(x6=5)、番禺区(x6=6)、海珠区(x6=7)、花都区(x6=8)、南沙区(x6=9);
x7为出行方式:私家车(x7=1)、公交车(x7=2)、长途汽车(x7=3)、其他(x7=4)、地铁(x7=5)、出租车(x7=6);
x8为出行是否换乘:是(x8=1)、否(x8=2);
z1为出行意愿:是(z1=1)、否(z1=2)。
乘客观测值由两部分组成:①自身属性和出行特征(性别、年龄、职业、年收入、出行目的、出行起讫点、出行是否换乘、出行方式);②乘坐意愿(是、否)。若一个乘客的观测值为(1、3、5、4、4、1、1、2、2),则表示该乘客性别为男,40~60岁,在机关企事业单位工作,年收入为10~20万,他因工作从荔湾区开私家车到南站坐火车去出差,中途无换乘,不愿意乘坐商务专线。
3.2 训练样本选取
为提高神经网络预测的精确性和稳定性,笔者以与现实乘客类型结构相近且充分覆盖各类样本为原则,从调研获得乘客数据中选取2 000个有效训练样本,并对模型进行训练,以确保模型对各类不同属性乘客进行意愿预测时都能具有较高精确性和稳定性。样本属性结构如表1。
表1 样本属性结构Table 1 Attribute structure of samples %
3.3 样本归一化处理
由于文中所标定样本数据不在同一个数量级,为提高神经网络的训练速度,需对其进行归一化处理。笔者利用MATLAB中的函数工具[pn, minp, maxp]=premnmx(p)将选取样本数据映射到[-1,1],其具体算法如式(10):
(10)
式中:p为所收集的一组数据;minp、maxp分别为数据的最小值和最大值;pn为归一化后的数据。
3.4 网络训练
为检验文中所构建的小波神经网络预测模型与传统BP神经网络相比是否具有先进性,在实验中分别用小波神经网络和BP神经网络对样本进行训练,均设置网络最大学习次数为10 000,目标误差为10-6,两种方法训练过程中网络MSE(均方差)变化曲线如图3。
由图3可看出:基于小波神经网络模型有着更快的训练速度,仅经过101次便达到了目标误差;而传统BP神经网络经346次训练达到了最优误差值9.142 5E-04后停止训练,并未达到目标误差。
图3 网络训练速度对比Fig. 3 Comparison of network training speed
3.5 预测结果分析
网络在对预测结果进行输出时,经Sigmoid函数转化之后网络预测值将会分布到[-1,1]之间,笔者对乘客出行意愿预测结果进行分类的判断条件为:若预测值位于(0,1]上,则判断乘客出行意愿为“否”;否则乘客出行意愿为“是”。在对500个预测样本预测结果进行分类判断之后,笔者构建的小波神经网络对500个样本预测精度最高可达到86%,而BP神经网络预测精度最高可达到78%。
前50个样本的一次预测情况如图4。小波神经网络网络预测结果中有47个与实际一致,精度为94%;传统BP网络预测结果中有41个与实际一致,预测精度为82%。由此可看出:小波神经网络对于乘客出行意愿预测具有较好预测效果,且与BP神经网络相比,对样本预测值更加接近样本实际值,其预测精度也就更高。
图4 网络预测值与实际值的分布Fig. 4 Distribution of network predictive value and actual value
4 结 论
笔者以广州南站商务专线目标乘客出行意愿预测为研究实例,从目标乘客出行意愿角度预测了新型定制化公交所具有的市场前景。通过对乘客属性对乘客意愿的影响分析,发现乘客属性与其意愿之间存在复杂的非线性关系。
笔者建立了乘客出行意愿预测小波神经网络模型,并运用MATLAB软件对模型预测进行了分析。为改善网络训练效果,笔者采用自适应方法对网络学习速率和隐含层节点数进行确定。结果表明:小波神经网络对于预测定制公交目标乘客出行意愿具有较好地适用性,且比传统BP神经网络有更好的预测效果。
影响乘客出行意愿的因素非常多,除了笔者分析的8个因素之外,乘客个人偏好、城市文化及其他不确定因素都会对出行意愿有着影响,忽略这些因素影响将导致网络预测存在失准风险。除此之外,笔者在对乘客职业、出行目的及出行方式进行分类时,分类程度不够充分明确,将非主要类别都归到了“其他”一类,导致这些类别乘客出行意愿的不确定性。网络模型对此类样本学习效果不佳,在预测时容易出错,从而降低了网络预测精度。因此在后续地研究中应通过加入更多相关影响因素和对影响因素进行详细分类来进一步提高网络预测的准确性。