基于活动的城市出行需求层次选择模型
2012-07-31缪子山
杨 超,缪子山,史 晟
(1.同济大学 道路与交通工程教育部重点实验室,上海201804;2.上海市城市规划设计研究院,上海200040)
随着城市化、机动化进程的加快,以传统“四阶段”法为代表的交通需求预测技术已经不能应对伴随城市交通发展所产生的新问题,而基于活动的出行需求分析模型(下简称“活动模型”)较好地解释了出行产生的机理,同时又能敏感地对交通政策和交通需求管理做出响应,为决策者更好地制定改善城市交通的政策和指令提供服务.
作为一种出行需求分析方法,活动模型的创立可以追溯到瑞典伦德大学的地理学家Hagerstrand[1]和美国北卡大学的社会学家兼规划师Chapin[2]的先期贡献.直到20世纪70年代中后期,Jones等[3]开始对基于活动的出行行为进行首次综合研究,对活动模型给出了明确的定义,并进行了复杂出行行为建模的初步探索.其后的研究主要分为基于离散选择建模和基于仿真建模的方法.基于离散选择模型如Bowman在Sacramento地区开发的SACSIM模型[4].基于仿真方法的研究如Bhat等开发的CEMDAP模型[5],Koohbanani等在开发的TRANSIMS系统[6]以及Balmer和 Axhausen在瑞典开发的 MATSIM模型[7].
近年来国内一些学者也开始结合中国城市的特点在活动模型领域进行了探索和研究.李志瑶、隽志才等将活动模式定义为一阶、二阶、中间驻停、工作子往返4类,并运用logistic回归方法进行模型的标定[8-9].杨敏对工作者通勤出行简单链模式和复杂链模式的选择行为特征进行了建模分析[10].穆蕊利用2005年北京居民出行调查数据建立基于活动的出行方式选择模型,研究了年龄、职业、月票情况、家庭月交通费、家庭月收入和出行距离等对出行方式选择的影响[11].总体来说,国内关于活动模型的研究还处于起步阶段,基本还停留在分析出行链和出行的不同,以及出行链的基本特征的研究上,在活动模型的实际应用方面还有待深入研究.
本文结合基于活动的理论和离散选择理论,提出适合我国国情的基于活动的居民出行需求预测模型结构.以2010年绵阳市传统居民出行调查数据为输入数据,研究从传统居民调查数据中提取往返行程和日活动模式以及活动模型建模所需特性数据的方法和流程,并提出以方式/目的地选择模型、时间选择模型和日活动模式选择模型为主体的层次选择模型结构,采用分层标定模型的方法,就活动模型的数据处理、模型结构、变量选择、模型标定提出一个完整的分析方法,并用于预测分目的、分方式、分时间段的居民出行起迄矩阵,从而实现基于活动模型的交通需求预测.
1 数据
居民出行调查数据是居民出行需求预测的基础.目前我国大多数城市仍使用基于传统“四阶段”法的交通需求预测方法,与之相对应的城市居民出行调查无论是调查内容还是调查问卷也都是为传统模型服务.本文建模使用的是2010年四川省绵阳市综合交通规划中进行的传统居民出行调查数据,通过处理,从调查数据中提取往返行程和日活动模式等基于活动模型建模所需的特性数据,使其符合基于活动模型的建模要求,从而进行模型活动链特征的统计分析和各层模型的标定.
1.1 数据收集
2010年四川省绵阳市居民出行调查采用传统的居民调查设计表,调查6周岁以上的居民,以户为单位,采取家访调查的形式.调查共抽取家庭10 593户,约27 500人,抽样率4%,回收表格10 120户,其中有效户数为9 359户,有效记录19 944人,有效抽样率3%.本文建模仅针对绵阳市区范围,划分为189个小区,土地利用、人口、就业岗位等均以小区为单位进行统计.
1.2 数据处理
传统模型的居民出行调查在社会经济特征、出行方式可选性、小区特征和用地特征等方面的调查内容与面向活动模型的居民出行调查基本相同.主要区别在于传统的居民出行调查中居民的出行活动是以出行为研究单位;而面向活动模型的调查是以往返行程为研究单位.因此,要利用传统居民出行调查的数据来进行活动模型的建模,需要对居民出行的相关数据进行处理,从中提取出居民出行的往返行程和日活动模式等建模所需的特性数据.
本文采用的问卷按照一天出行次序的先后,逐次记录每次出行的出发和到达时间、出行目的、目的地、出行方式和费用等,采用录入程序得到基础的Excel数据表格后,使用Excel中的VBA语句对基础数据进行处理,剔除了逻辑错误数据后进行分解、判断,合成得到往返行程和日活动模式的数据.对每个出行居民的数据处理逻辑流程如图1所示.
图1 出行数据提取逻辑图Fig.1 Flow chart of extracting activity-based data from traditional trip survey
根据以上步骤对数据进行处理统计,得到本文所建离散选择模型的样本量见表1.
表1 各个离散选择模型的样本量Tab.1 Sample sizes of each discrete choice model
1.3 数据描述
根据调查数据,每个出行居民一天的活动可分为一阶往返行程、二阶往返行程和子往返行程.鉴于一阶往返行程中工作/上学往返行程主要集中在早晚高峰时段,更具规律性,可单独分类考虑.根据数据统计,一阶工作/上学往返行程占43.19%,一阶非工作/上学往返行程占38.66%,二阶往返行程16.50%,子往返行程占1.64%.一阶往返行程所占比例较大,出行时间集中在早晚高峰,而且工作/上学往返行程和非工作/上学往返行程在特征上有较大不同,可分两类讨论.而子往返行程的数量较少,因此不单独建模研究.
2 方法
根据绵阳市居民活动特征和活动理论的基本要求,对居民每日的活动做如下假设:①假设调查所得的数据反映了居民每天按一定时间上下班(学)的规律性;②将居民具有规律性的每日活动划分出不同的日活动模式;③出行者在选择日活动模式的条件下,再进一步考虑每一个往返行程的目的地、出行时间和出行方式;④假设各个往返行程相互之间是独立的.根据以上假设,本文在建模时按照活动-出行选择顺序建立三层模型:日活动模式选择模型、时间选择模型和方式/目的地联合选择模型,模型的选择结构如图2所示.下面从底层开始逐一对模型进行介绍.
图2 基于活动的多层选择模型结构Fig.2 Structure of activity-based hierarchy selection model
2.1 方式/目的地选择模型
本研究中出行方式和目的地的联合选择模型为
式中:Pmd为交通方式m和出行目的地d组合的概率;m是仅随出行方式变化的确定效用项d是仅随出行目的地变化的效用确定项md是同时随交通方式和目的地变化的效用确定项;Cmd为可以选择的出行方式和目的地集合.
出行方式/出行目的地联合选择模型的效用函数影响变量主要有3类:社会经济属性变量、出行模式变量和城市用地属性变量.社会经济属性变量包括:家庭规模、交通工具拥有情况、家庭收入、性别、年龄和职业等.出行模式变量包括:出行者的出行模式中是否存在驻停、驻停的次数和位置等.城市用地属性变量包括:阻抗变量、区位变量和吸引性变量3类.阻抗变量主要指出行距离;区位变量包括目的地小区所处区位(中心区、郊区)、出行是否跨江、出发小区和目的地小区是否相同;吸引性变量主要包括小区的人口、就业面积和居住面积.
2.2 时间选择模型
离散选择模型中,难以模拟连续时间的选择.本研究中时间选择模型为
式中,Pj为选择时间段j的概率是根据时间选择影响因素Xkj计算的确定效用项,θkj是可观测变量的参数;Ct为可以选择的时间段集合.
本文对一天的时间进行了分段,将早高峰作为一个时间段,晚高峰作为一个时间段,早高峰前、早晚高峰之间、晚高峰以后分为3个时间段,一天共划分为5个时间段,并假定每个时间段内交通系统的性能大致相同.往返行程用往程起始时间所在时间段,返程起始时间所在时间段来定义往返行程的时间,同时假定:①往程起始时间(返程起始时间)所在的时间段内交通系统的性能一致;②认为往程起讫时间和返程起讫时间不发生时间段的跨越.
出行者对出行时间的选择主要受到家庭属性和个人属性的影响,同时也受到往返行程类型和目的以及其驻停的位置和数量的影响.本文在建立时间选择模型的效用函数时主要考虑3类变量:家庭属性变量,包括家庭人口、家庭拥有交通工具的数量;个人属性变量,包括性别、年龄、职业、收入、是否有驾照等;驻停属性变量,包括驻停的位置和数量.
2.3 日活动模式选择模型
本研究中日活动模式选择模型为
式中:Pl为日活动模式选择概率,是日活动模式选择影响因素Xkl计算的确定效用项,θkl是可观测变量的参数;Cm为可以选择的活动模式集合.
在绵阳市居民出行调查问卷中将出行目的划分为11类,包括:工作、工作外出、上学、购物、私人事务、走访亲友、娱乐等.结合调查数据中日活动模式的特点,本文对日活动模式按以下几种特征进行分类:一阶往返行程的目的、一阶往返行程的驻停位置、有无二阶往返行程.通过对调查数据进行统计分类,得出绵阳市居民出行调查存在17种日活动模式.
日活动模式模型是活动模型的最上层模型,影响日活动模式的变量非常多,本文建模时主要考虑家庭属性、个人属性、家庭和个人属性交叉类、出行距离变量等几种因素.家庭属性类变量,包括家庭人口数和家庭交通工具拥有情况;个人属性变量,包括个人的年龄、性别和职业;家庭和个人属性交叉类变量,包括:男-家庭人口数1(male_hh1)、男-家庭人口数2(male_hh2)、男-家庭人口数3(male_hh3)、男-家庭人口数4(male_hh4)、女-家庭人口数1(female_hh1)、女-家庭人口数2(female_hh2)、女-家庭人口数3(female_hh3)、女-家庭人口数4(female_hh4)、老人-家庭人口数3以上(old_hh3+)和年轻人-家庭人口数3以上(young_hh3+);出行距离变量,根据绵阳市居民出行调查的数据,当一阶活动的出行距离大于2.5 km时,仅有25%的出行者仍然会选择二阶活动,因此设置出行距离变量DIST,当一阶活动出行距离大于2.5 km时DIST=1,否则为0.
2.4 模型标定
Pendyala等在FAMOS系统的技术手册中提到,对于多层选择模型的标定一般有两种方法:逐层标定(sequential)方法和整体同时标定(simultaneous)方法[12].其中,逐层标定方法存在下列优点:
(1)可操作性:当使用整体同时标定法来标定活动模型时,总的选择枝数量是每一层的选择枝的数量的乘积,这在用非集计模型求解时将非常困难,而逐层标定在每一层标定时所面对的选择枝数量要小得多[13].
(2)行为理论基础:逐层标定方法也存在出行者出行行为决策的理论支持.出行者往往并不了解所有交通方式、出行时间段、出行目的地等在出行性能上的不同,因此虽然有些选择枝的效用可能更好,但是出行者却并不一定选择.因此出行者在出行决策时往往更倾向于逐层选择来确定日活动模式、活动时间和活动的方式/目的地[14].
考虑到实际标定的可操作性和出行者实际选择出行时的思维模式,本文建立的基于活动的出行需求预测模型对如下3种关系进行简化处理:①各阶往返行程之间的独立不相关性;②时间选择与方式/目的地选择的独立不相关性;③日活动模式与往返行程之间的独立不相关性.因此,本文建立的日活动模式模型、时间选择模型和方式/目的地联合选择模型之间是相互不相关的,可以使用逐层标定的方法依次标定方式/目的地选择模型、时间选择模型和日活动模式模型.下面以方式/目的地联合选择模型中一阶工作往返模型的标定为例,介绍标定过程.
使用SAS软件中的logistic回归对方式/目的地联合选择模型的数据用多项罗吉特(MNL)模型进行标定,先将与方式与目的地选择相关的变量全部代入模型,使用stepwise逐步回归对变量进行选择,在每一步迭代中选择对模型贡献最大(表征变量显著水平的P值<0.05)的变量,将对模型影响水平不显著的变量剔除出模型,反复迭代,直到没有变量可以进入模型同时也没有变量可以剔除出模型为止.将一阶工作往返行程的数据筛选出来进行标定后,模型共迭代39次,标定的拟合指标和每轮迭代的变量的显著水平见表2.
表2 一阶工作往返方式/目的地模型拟合指标Tab.2 Fitness index of mode/destination choice modal for first order wor k trip
从表2可见,模型极大似然比(likelihood ratio)、Score检验和 Wald检验的值都符合要求,远大于临界值.模型的McFadden系数(SAS中为R2)和最大修正R2分别为0.584 4和0.608 2满足回归要求(该系数一般达到0.2~0.4即认为符合要求).
模型效用函数系数标定结果见表3.表中1指步行,2指自行车,3指摩托车和助动车,4指小汽车,5指公交,6指其他交通方式.6被作为参照组,默认所有系数均为0,则对于其他5种交通方式该变量的标定系数为正,则说明这种交通方式对于该变量属性更具吸引力.表中变量包括:常数项(intercept)、家庭人口数为1~3人(hhsize1~3)、家庭人口数为4人及以上(hhsize4)、家庭拥有汽车数为0辆(auto0)、家庭拥有汽车数为2辆及以上(auto2)、家庭拥有摩托车数为0~1辆(motor0~1)、家庭拥有自行车数为0~1辆(bike0~1)、家庭拥有自行车数为2辆及以上 (bike2)、家 庭 月 收 入 2 000~3 000 元(income2)、家庭月收入3 000~4 000元(income3)、家庭月收入4 000~6 000元(income4)、家庭月收入6 000元以上(income5)、性别为男(gender)、年龄6周岁以下(age1)、年龄6~19周岁(age2)、年龄20~25周岁(age3)、年龄65周岁以上(age5)、拥有驾照(driver_l)、工人(voca1)、公务员(voca2)、专业技术人员(voca3)、职员(voca4)、商业服务人员(voca5)、企事业负责人(voca6)、大专院校学生(voca7)、农民(voca8)、中小学生(voca9)、家务劳动者(voca10)、个体经营者(voca11)、其他职业(voca12)、起讫小区相同(rd)、在中心城内(centre)、无驻停(nostop)、返程驻停(backstop)、往返均驻停(bothstop),以上均为哑元变量,是则值为1,否则为0.此外,还包含变量小区距离阻抗(Modedestimp)和小区岗位面积(work_m_level),小区岗位面积小于20 000 m2,取值为1;20 000—100 000 m2,取值为2;100 000—200 000 m2,取值为3;200 000—400 000 m2,取值为4;400 000 m2以上,取值为5.
表3 一阶工作往返模型变量参数估计结果表Tab.3 Results of calibrated variables for first order work trip model
由表3的结果可以看出:
(1)对于出行距离这个变量(modedestimp),步行的系数为负值,而小汽车>公交>摩托车>自行车,说明出行距离越远越倾向于选择机动能力强的交通方式.
(2)对于小区就业用地面积(work_m_level)这个变量,所有交通方式的系数均为正,符合小区就业用地面积越大提供的岗位数就相应多,产生更多的交通吸引,更容易成为活动的目的地.
(3)对于步行出行交通方式,家庭没有小汽车(auto0)、没 有 摩 托 车(motor0)、收 入 较 低(income1)、年龄低(age1,age2)的出行者更倾向于选择步行交通方式.
(4)对于自行车交通方式,收入较低(income1)、20~25周岁(age3)更愿意选择自行车交通方式.
(5)对于小汽车交通方式,家庭人数4人以上的(hhsize4)、收入高的(income5),拥有多辆小汽车的(auto2)更愿意选择小汽车交通方式.
(6)公务员(voca2)、企事业负责人(voca6)和个体经营者(voca11)更愿意选择小汽车的出行方式.
(7)当返程有驻停(backstop)或往返均有驻停(bothstop)时不易选择小汽车出行方式.
参数大部分具有良好的解释意义,但有一部分参数解释意义模糊或者不符合一般的认识,如农民(voca8)的交通方式选择,有可能是这部分样本量相对其他职业过少,影响标定结果.但为了模型整体交通方式分担率和目的地分布的预测,保留这些参数.
3 验证
在标定模型时使用80%的数据用于标定模型,剩余20%用于模型的精度检验,对一阶工作往返行程使用的交通方式进行预测并和原始数据进行比较来检验模型.对每一条记录将数据用表3的变量参数计算每一个出行者每种交通方式的效用V步行,V自行车,V摩托车,V小汽车,V公交车,并令V其他=0,则某方式的选择概率为:P某方式=exp(V某方式)/(exp(V步行)+exp(V自行车)+exp(V摩托车)+exp(V小汽车)+exp(V公交车)+exp(V其他)),分别计算P步行,P自行车,P摩托车,P小汽车,P公交车,P其他,最后将每一条记录各种交通方式累加,得到联合选择模型估计的交通方式分担率.
将联合选择模型所得的各交通方式出行量和调查原始数据统计的出行量进行比较(图3).可以看到联合选择模型除了对摩托车出行量的估计偏高,其他几种交通方式的出行量估计都比较准确,方式/目的地联合选择模型可以较为准确地计算出行者往返行程的交通方式.
图3 联合选择模型结果检验图Fig.3 Validation of combined choice model
4 结论
在目前的交通需求预测领域,传统的“四阶段”法仍占据主导地位,但是在交通需求管理和交通政策管理的背景下,“四阶段”法本身对于出行机理解释的不足,模型内部各阶段之间联系不紧密,对政策的不敏感等缺陷都让其显得跟不上时代前进的步伐.本文从传统的居民出行调查数据入手,提出获取基于活动模型的数据的方法,并以此数据为模型输入,提出了基于活动的城市居民出行需求预测模型,确定模型的结构和变量参数,采用逐层标定的方法对模型进行标定,基本实现了预测居民一日主体活动的功能,但模型中对于活动中所涉及到的有关家庭决策和外部系统的影响还没有考虑,有待今后的进一步深入研究.
[1] Hagerstrand T.What about people in regional science [J].Regional Science Association Papers,1970,24(1):6.
[2] Chapin F S.Human activity patterns in the city:things people do in time and space[M].New York:Wiley,1974.
[3] Jones P M,Dix M C,Clarke M L,et al.Understanding travel behavior[M].Aldershot:Gower,1983.
[4] Bowman J L.Disaggregate treatment of purpose,time of day and location in an activity-based regional travel forecasting model[D].Boston:School of Engineering of Massachusetts Institute of Technology,2005.
[5] Bhat C R,Guo J Y,Srinivasan S.Guide book on activity-based travel demand modeling for planners[R].Austin:School of Engineering of University of Texas at Austin,2003.
[6] Koohbanani M J.Enhancements to transportation analysis and simulation system(TRANSIMS)[D].Virginia:School of Engineering of Virginia Polytechnic Institute and State University,2004.
[7] Balmer M,Axhausen K W,Nagel K.Agent-based demandmodeling framework for large-scale microsimulations [J].Transportation Research Record,2006,1985:125.
[8] 隽志才,李志瑶,宗芳.基于活动链的出行需求预测方法综述[J].公路交通科技,2005,22(6):108.JUAN Zhicai,LI Zhiyao,ZONG Fang.A review of activitybased travel demand forecasting method [J].Journal of Highway and Transportation Research and Development,2005,22(6):108.
[9] 李志瑶,隽志才,宗芳.居民出行时间选择及拥挤收费政策[J].交通运输工程学报,2005,5(3):105.LI Zhiyao,JUAN Zhicai,ZONG Fang.Resident travel time choice and congestion pricing policy[J].Journal of Traffic and Transportation Engineering,2005,5(3):105.
[10] 杨敏.基于活动的出行链特征与出行需求分析方法研究[D].南京:东南大学交通学院,2007.YANG Min.Research on the characteristics of activity-based trip chaining and travel demand analysis method[D].Nanjing:School of Transportation of Southeast University,2007.
[11] 穆蕊.基于出行活动的非集计模型研究及应用[D].北京:北京交通大学交通运输学院,2010.MU Rui.Research and utility of disaggregate model based on trip activity[D].Beijing:School of Traffic and Transportation of Beijing Jiaotong University,2010.
[12] Pendyala R M.Phased implementation of a multimodal activitybased travel demand modeling system in Florida.volume I:technical documentation[M].Tallahassee:Florida Department of Transportation,2004.
[13] Jones P. Developments in dynamic and activity-based approaches to travel analysis[M].Aldershot:Avebury,1990.
[14] Simon H A.A behavioral model of rational choice [J].The Quarterly Journal of Economics,1955,69(1):99.