出行链化的贝叶斯网络预测
2015-04-13赵应场谭家美
赵应场, 谭家美
(上海海事大学 交通运输学院, 上海 200135)
出行链化的贝叶斯网络预测
赵应场, 谭家美
(上海海事大学 交通运输学院, 上海 200135)
以出行链为研究对象,在特定因素下通过贝叶斯网络对其链化趋势进行预测. 首先依据已有的理论基础和实践经验,提取影响出行链的因素并构建贝叶斯网络结构模型,其次通过采集的有效样本数据进行模型参数的学习,预测出行链化倾向. 最后将预测数值与实际数值进行对比、分析. 结果表明运用模型所得到的预测值与调查所得的实际数据基本相符,两者之间误差很小,只在个别样本点有所偏差,相对于整体,此差值完全在可接受的范围内. 由预测结果与实际值对比可知,出行者的链化行为在时间、空间、成本等因素作用下具有一定的波动,但长期趋势保持稳定.
活动; 出行链; 贝叶斯网络; 预测
0 引言
人们每日在参与不同活动,由于这些活动在时空分布的差异导致了一系列交通出行,将这些出行按照前后发生的顺序衔接即形成出行链(TripChain,TC). 出行链是伴随着活动链(ActivityChain)的产生而形成的. 随着城市空间规模、人口规模日益扩大,城市交通出行需求急剧增加,但有限的交通供给仍然难以缓解不断增加的交通压力,出行链的形成即是人们为了降低出行成本而采用的一种决策.
当前针对出行链的研究,依据不同的技术分析方法,主要集中在3个方面. 第一方面是运用计量统计的方法分析不同因素对于出行活动、出行链形成的影响,如Lu等[1]运用结构方程模型分析得出社会人口统计特征与活动参与,出行行为之间存在比较强的影响关系. 隽志才等[2]综合评述了将贝叶斯理论与已有的出行行为分析方法相结合,可以使出行行为预测更为精确、全面和灵活,从而更加准确地描述活动—出行决策行为与TDM策略的互动响应关系. Bhat[3]利用计量经济学的方法估计活动出行模式中主要出行方式的选择. 祝伟等[4]建立了基于贝叶斯网络的居民出行方式选择模型,并结合居民出行调查数据对模型进行参数估计,结果表明,该模型能较全面地考虑居民出行选择的影响因素,模型精度较高. Jang[5]利用协方差结构模型分析指出参与活动的过程中涉及简单出行模式和复杂出行模式,个体出行者将一系列的出行链接,由此形成出行链以有效利用交通资源. Farber等[6]通过描述性统计方法和统计推断揭示出在活动持续时间更长,时间约束力更强的环境下,人们对于自驾车出行的依赖性越强. Roorda[7]借助结构方程建模技术分析比较了出行活动模式在短期和长期内的相似之处以及两者的差异. 第二方面是利用仿真模型来反映出行链,由于出行链包含不仅一次出行,其涉及的内容较多,如果采用传统的数理模型难以真实全面反映出行链的构成,即使能够描述出行链,这样的数理模型求解也很困难. 目前针对出行链研究应用较好的有SMASH (SimulationModelofActivitySchedulingHeuristics)系统. Janssens[8]利用仿真方法模拟并评价活动出行模式,了解出行个体的出行模式及其出行决策. Arentze等[9]通过开发仿真模型分析出行个体在多日内的活动规划. Timmermans等[10]从微观仿真方法和实际应用的角度分析活动时间分配、出行方式选择、活动产生和活动顺序安排等. 第三方面即近年来借助于地理信息系统等可视化技术,将出行活动与出行链放置在真实的三维环境中表现人们的出行行为,如Kwan[11]借助于地理信息系统的三维可视化技术,显示并分析人们的活动出行模式在时间与空间上的分布特征.
上述研究工作在描述出行链的影响因素、出行链的构成以及出行链的优化等方面都已取得了较好的成果,但出行链在特定因素影响下(如出行时间、出行费用等),其变化是否具有长期稳定性、人们的出行链化倾向是怎样的、如何预测人们的出行链化行为,这是本文借助于贝叶斯网络所期待解决的问题.
1 出行链预测的贝叶斯网络结构模型构建
1.1 贝叶斯网络
贝叶斯网络(BayesianNetwork,BN)又称之为信念网络(BeliefNetwork),是一种图型化的建模方法,它采用图形表示一组变量间的联合概率分布函数[12-13]. 贝叶斯网络模型在交通出行,交通预测方面已有应用[14-17]. 一个贝叶斯网络模型包括2个部分:结构模型和一组与结构模型对应的条件概率分布函数. 如图1所示贝叶斯网络图形中有5个节点,分别代表5个随机变量:下雨、道路拥挤、出行延误、迟到和出行路径改变,图中有4条有向边分别用以表达各随机变量之间的影响关系. 下雨有可能导致道路交通产生拥挤;在道路拥挤的情况下,人们的出行有可能延误,或者某一部分人群会临时改变固有的出行路径;出行延误很有可能造成人们上班延误. 这种影响关系的强弱是通过有向弧表达的条件概率分布函数来判断的.
图1 贝叶斯网络模型示例
1.2 出行链的贝叶斯网络构建
针对问题研究目标,确定问题领域内的研究对象及每个研究对象包含的特征变量集,特征变量集即一一对应于贝叶斯网络中的节点集. 针对出行链形成的特征,主要存在2个方面的诱导因素:一方面是日益增加的交通出行压力促使人们降低成本,而出行链即是一种主动的选择;另一方面是快捷运输系统如地铁、轻轨等的快速延伸以及公交网络的形成为出行链的形成提供了很好的供给. 在我国大城市与特大城市,如上海、北京等,日常的交通出行压力较大,根据本文在上海的采样结果,一般来讲,人们的平均通勤出行距离都要在13 km左右,相应的通勤时间约为1 h,部分样本数据显示,部分人群的通勤距离甚至在20 km以上,通勤时间超过2 h,这样的通勤出行同时也带来了较大的出行费用与体力消耗. 因此,本文在建立贝叶斯网络结构模型时将时间、空间约束与成本约束分别作为影响出行链的3个因素考虑.
“出行源于活动”这一思路的提出引发了目前交通行为的一个研究热点,人们更多地从活动参与的角度分析交通出行. 不同的活动类型对于活动参与时间的要求不同,会影响人们的出行决策[18-20],针对有固定参与时间要求的活动如上班、上学等,会促使人们将时间这一因素作为首要考虑的约束条件,而对于那些没有固定参与时间要求的购物、娱乐等活动,出行费用、出行距离等因素可能被视为首要约束条件.
另外,出行成本(包括费用、体力消耗等)愈高,人们出行链化的趋势就愈加明显[21]. 当人们有意愿将一系列出行按照顺序衔接起来形成出行链时,可利用的交通供给方式就成为实现出行链的必要物质基础,因而出行模式被作为影响出行链选择的另一项主要因素.
同时还必须指出的是,个体出行者的社会统计特征,如性别、年龄、收入水平、是否拥有自驾车、是否有小孩等,会不同程度影响人们对于时间、空间以及成本等约束条件的理解[22-25]. 例如男性同时年纪较轻的出行者很大比例上对于时间约束的感受更强,收入水平较低的出行者对于出行成本则更敏感,另外,是否拥有自驾车一定程度上决定了人们的日常出行模式.
上述分析得出的6个因素均对出行链产生影响,因此将时间约束、空间约束、成本约束、活动特征、出行模式与个体特征作为影响出行链的6个变量. 本文的研究目标是出行链在这些因素影响下的变化趋势,为了简化模型,将与出行链无关的影响关系在这里省略,直接确定从影响变量到被影响变量之间的链接,由此建立贝叶斯网络结构模型,如图2所示. 下面即根据给定的网络结构和采集的样本数据对出行链的变化趋势进行预测分析.
图2 出行行为链化的贝叶斯网络结构模型
2 模型计算与结果分析
2.1 数据描述
根据影响出行链的因素以及所构建的网络结构,针对研究目标,设计调查问卷. 问卷的发放主要以在上海某高校就读MBA的在职人员为主,收集并整理问卷,剔除空白值较多、异常值较多的问卷,最终提取302份有效样本. 在模型计算时,选用其中的200份样本进行模型参数的学习,剩余的102份样本作为贝叶斯预测结果的参照比较,最后对模型结果进行分析.
2.2 模型求解
模型求解采用Kevin Murphy编写的贝叶斯网络工具包Bayes Net Toolbox(简称BNT)建立贝叶斯网络模型. 在软件包BNT中,以下函数是程序计算时使用的主要功能:
1)N=n:N表示离散型贝叶斯网络模型中节点的数量;
2) dag=zeros(N,N):dag(directed acyclic graph)即有向无环图,当相同节点间没有有向弧连接时用函数zeros(N,N)表示;
3)C=4;S=2;R=3;W=4:这里C,S,R,W分别是模型中具体变量名称的简写,其中,对应离散变量C的可能状态取值有4个,对应S的可能状态取值2个,对应R的可能状态取值3个,对应W的可能状态取值4个;以此类推,模型中的节点均设定为离散型节点,因此确定为离散型贝叶斯网络.
4) dag(C, [RS])=1,dag(R,W)=1:有向无环图中前面的变量(如C,R)表示有向无环图中对应的父节点,后面的变量(如R,S,W)表示对应父节点的子节点. dag(C,[RS])表示由节点C指向R和S,即C为R,S的父节点. dag(R,W)表示由节点R指向W,以此表达方式确定模型中有向无环图的具体结构;
5) discrete_nodes=1:N:指在混合贝叶斯网络模型中,节点1至N均为离散型节点;
6) mk_bnet:表示贝叶斯网络的结构模型构造函数;
7) bnet.CPD{i}:表示贝叶斯网络结构模型中节点i指定类型;
8) learn_params:通过指定节点类型进行模型参数学习;
9) jtree_inf_engine:贝叶斯网络结构模型参数学习过程中使用的推理引擎;
10) enter_evidence:贝叶斯推理时需要的变量约束条件.
建立贝叶斯网络模型的目的即根据出行者既有的出行链行为,预测出行个体的出行链变化趋势,并将预测值与实际值进行比较,当两者差异较小时,表明预测结果较好. 模型计算时将有效样本数据代入相应函数中,通过对参数的学习,依据已知节点的值估计未知节点的值. 首先学习302份有效问卷中前面的200个数据集,将整理的有效数据集以表的形式写入Matlab贝叶斯网络软件包主要功能函数的代码中,首先假设其他变量不改变,仅分析出行时间的变动对于个体出行者出行链的影响. 在此基础上,对剩余的102个数据进行预测并与真实数据进行比较分析.
图3给出了剩余102个样本数据的波动情况,图中横坐标表示有效参照样本数据的规模,共102份,模型中为了表示人们的出行链选择,用出行链中包含活动的数量来显示人们的这种出行链构成. 图3中实际共包含了3个图形,最上一层的图形表示通过学习前面200个样本数据,预测另外102份样本数据在出行时间波动的影响下,其出行链构成,即出行链中包含活动的数量. 中间一幅图是102个样本数据的实际值,纵坐标为链中包含的活动数量. 最下一层的图表示预测值与实际值的差值,显示在纵坐标上.
图3 模型计算结果
2.3 模型结果分析
由图3中曲线波动的情况可以看出,预测值与实际值的差异较小,两者的偏差仅在个别点(个别样本)中波动较大. 其他变量包括空间约束、出行模式、出行成本、活动特征等变量的波动变化对于出行链的影响,经Matlab贝叶斯软件包的计算,结果图基本等同于图3.
在贝叶斯模型的实际运用中,如果能获得更多的信息,模型的预测结果会更趋于准确. 这样的预测也可用于分析具有均质特征的出行个体的出行链倾向,即将主要特征具有相似性的出行个体归为一类,忽略次要特征的个体异质性,通过采集其历史出行数据,继而依赖先验出行知识学习并预测其出行链选择倾向.
3 结论
本文运用贝叶斯网络对个体出行者的链化行为进行预测,贝叶斯网络用有向弧表示随机变量间的依赖关系或者影响关系,用概率分布表达各随机变量间依赖关系的强弱,同时,贝叶斯网络模型能将先验知识与样本数据有机结合起来,从而表达一种依赖于先验知识的样本学习过程. 结合先验知识,贝叶斯网络提供了较为主观的概率关联关系.
由于贝叶斯网络对于样本规模并不像统计模型那样要求高,在能继续得到更多新的样本数据时,贝叶斯网络可以不断利用这些新数据对网络结构和参数进行更新. 另外,本文建立的贝叶斯网络属于静态贝叶斯网络,但这种静态的假设前提是个体出行者是完全理性的,忽略了其每次出行过程中的不断学习与经验积累. 而动态贝叶斯网络是一种基于概率和统计理论的决策分析工具,适合用于描述应用领域内的非线性关系和由随机现象引起的不确定性,能更好地借助先验知识将模型在时序建模方面进行扩展,同时模型内的随机变量也可以随时间不断演化,以后的研究工作可以在这方面做一些尝试.
[1] Lu X, E I, Pas. A structural equations model of the relationships among socio-demographics, activity participation and travel behavior [J]. Transportation Research, 1999, A(31): 1-18.
[2] 隽志才, 宗芳, 栾琨. 活动- 出行决策行为与TDM策略互动关系研究的贝叶斯方法 [J]. 交通运输系统工程与信息, 2009, 9(4): 97-102.
[3] Bhat C R, Singh S K. A comprehensive daily activity-travel generation model system for workers [J]. Transportation Research, 2000(34): 1-22.
[4] 祝伟, 过秀成, 何明. 基于贝叶斯网络的出行方式选择模型研究 [J]. 交通信息与安全, 2010, 28(1): 99-103.
[5] Jang T Y. Causal Relationship Among Travel Mode, Activity, and Travel Patterns [J]. Journal of Transportation Engineering, 2003, 129(1): 16-22.
[6] Farber S, Ez A P. My car, my friends, and me: a preliminary analysis of automobility and social activity participation [J]. Journal of Transport Geography, 2008(2): 5-12.
[7] Roorda M J, Ruiz T. Long- and short-term dynamics in activity scheduling: A structural equations approach [J]. Transportation Research, 2008, A(42): 545-562.
[8] Janssens D, Wets G, Brijs T, et al. The development of an adapted Markov chain modeling heuristic and simulation framework in the context of transportation research [J]. Expert Systems with Applications, 2005(28): 105-117.
[9] Arentze T A, Timmermans H J. A need-based model of multi-day, multi-person activity generation [J]. Transportation Research, 2009, B(43): 251-265.
[10] Timmermans H J, Zhang J. Modeling household activity travel behavior: Examples of state of the art modeling approaches and research agenda [J]. Transportation Research, 2009, B(43): 187-190.
[11] Kwan M. Interactive geovisualization of activity-travel patterns using three-dimensional geographical information systems: a methodological exploration with a large data set [J]. Transportation Research, 2000, C(8): 185-203.
[12] Jensen F V. Bayesian networks and decision graphs [M]. New York: Springer, 2001: 78-104.
[13] Lam W, Bacchus F. Learning bayesian belief networks: An approach based on the principle [J]. Computational Intelligence, 1994(10): 269-293.
[14] 于继江, 廉飞宇. 一种基于贝叶斯网络和博弈论的信息融合模型[J]. 江西师范大学学报: 自然科学版, 2010, 34(2): 133-137.
[15] 陆宇, 岳昆, 刘惟一. 一种基于贝叶斯网的交通拥堵预测方法[J]. 云南大学学报: 自然科学版, 2010, 32: 355-363.
[16] 李晔, 黄肇义. 基于贝叶斯方法的出行产生率预测[J]. 同济大学学报: 自然科学版, 2009, 37(1): 63-66.
[17] 刘祥. 基于贝叶斯网络的多方法短时交通流量联合预测[J]. 机电技术, 2010(4): 33-35.
[18] Kitamura R. Activity-based travel demand forecasting and policy analysis. In L. J. Engelke(Ed. ), Activity-based Travel Forecasting Conference: Summary, Recommendations and Compendium of Papers. Report of the Travel Model Improvement Program [R]. Arlington, TX. : Texas Transportation Institute, 1997.
[19] Pas E I. Time use and travel demand modeling: recent developments and current challenges[A]. Presented at the 8th Meeting of the International Association for Travel Behavior Research, September 21-25, Austin, TX. In H. S. Mahmassani (Ed. )[C]. Recent Developments in Travel Behavior Research, Pergamon: Oxford, 1997: 307-331.
[20] 邵昀泓, 王炜. 出行需求分析的新方法: 活动模型的应用研究[J]. 公路交通科技, 2008, 25(5): 111-115.
[21] Sundo M B, Fujii S. The effects of a compressed working week on commuters' daily activity patterns [J]. Transportation Research, 2005, A(39): 835-848.
[22] Walle S V, Steenberghen T. Space and time related determinants of public transport use in trip chains [J]. Transportation Research, 2006, A(40): 151-162.
[23] Recker W, Chen C, McNally M. Measuring the impact of efficient household travel decisions on potential travel time savings and accessibility gains [J]. Transportation Research, 2001, A(35): 339-369.
[24] 杨敏, 陈学武, 王炜. 通勤出行简单链和复杂链的选择行为研究[J]. 武汉理工大学学报: 交通科学与工程版, 2008, 32(2): 191-194.
[25] 张萌, 孙全欣, 陈金川. 北京市女性出行行为研究[J]. 交通运输系统工程与信息, 2008, 8(2): 19-26.
Trip Chaining Prediction Using Bayesian Network
ZHAO Ying-chang, TAN Jia-mei
(College of Transport and Communications, Shanghai Maritime University, Shanghai 200135, China)
The paper considers trip chain as the focus, and utilize Bayesian networks to predict the trend of trip chain based on specific factors. First this paper identifies the factors influencing trip chain based on theory and practices, and establishes a Bayesian network model, and then the sample data are used to estimate parameters and predict trip chaining. Finally, a comparison between the predicted value and practical value was conducted to evaluate the calculation results. There is little deviation between the predicted value and practical value, and the acceptable deviation exists at a few sample points. From the comparison of values we know that long-term trend of trip chain will remain stable, though varying with time-space, cost and other factors.
activity; trip chain; Bayesian network; prediction
10.13986/j.cnki.jote.2015.01.003
2014- 11- 03.
赵应场(1989—),男,在读硕士研究生,研究方向为交通行为研究. E-mail:zyc502@163.com.
C 93
A
1008-2522(2015)01-15-05