APP下载

基于家庭属性和Nested Logit模型的学生出行选择特性分析

2015-06-07马书红付建川姚志刚

关键词:下层小汽车交通

马书红,付建川,姚志刚

(1.长安大学 公路学院,陕西 西安 710064;2.长安大学 经管学院,陕西 西安 710064)



基于家庭属性和Nested Logit模型的学生出行选择特性分析

马书红1,付建川1,姚志刚2

(1.长安大学 公路学院,陕西 西安 710064;2.长安大学 经管学院,陕西 西安 710064)

运用非集计模型中 Nested Logit模型的理论与方法,以中小学生出行方式选择行为为对象,研究个人属性、家庭属性和出行特性对学生出行方式选择的影响。模型分上下两层,上层为公共交通和私人交通方式的选择,下层为小汽车、摩托车、自行车及步行交通方式的选择; 利用SPSS软件对模型进行标定和检验,分析各因素对学生出行选择的影响。结果表明:家庭收入对于上下层交通方式选择影响大,收入高的家庭,学生出行更倾向于选择私人交通方式;是否拥有公交卡对上层交通方式影响最明显,当学生拥有公交卡时,其选择公共交通方式是私人方式的38倍;家庭交通工具拥有量和是否有人接送是下层交通方式选择的主要因素,家庭小汽车数量增加或有人接送时,学生出行选择小汽车的概率增加。

交通工程;学生出行;行为;家庭属性;Nested Logit模型;出行方式选择

0 引 言

出行方式选择是交通预测的重要组成部分,对交通规划工作有着重要的意义。从出行者个体角度,对其交通选择行为进行分析,应用较多的是非集计模型中的Logit模型,相关研究成果集中于交通方式选择,停车行为选择,出行路线选择和政策影响分析等方面。富晓艳等[1]利用非集计模型结合出行方式选择和出行时间段对长春市居民出行次数进行了分析。刘炳恩等[2]利用MNL (multinomial logit) 模型对城市居民出行方式选择进行研究,全面考虑了影响居民出行的因素,模型具有良好的实用性。杨励雅等[3]利用分层非集计模型分析了居住地、出行时间和出行方式之间的联合选择。M.K.Kara等[4]将NL (nested logit) 模型和Logsum相结合对公路收费政策及不同情景下的收费效果进行分析,给出了一个基于Destination-Mode-time of day-Route的4层NL出行选择模型结构。针对特殊群体或特定区域而进行的进行研究也有不少。吴文静等[5]针对通勤者这个特殊群体,给出了通勤者非工作时间的活动时间选择决策模型。鲜于建川等[6]针对双职工家庭研究其家庭成员出行长度的选择,分析了家庭成员出行长度的选择和男女主人出行长度的相互影响。学生群体(本文指中小学生)作为一个特殊的群体,人数多且其出行具有明显时空分布特征,对城市交通的影响不容忽视。基于此,笔者结合浙江省宁海市2012年居民出行调查数据,对学生这一特殊群体的出行特征和影响因素进行研究。考虑到各个因素影响的次序和程度,并且学生出行往往是基于某一前提而作出的选择,故引入Nested Logit模型,并重点研究基于家庭属性的学生出行。研究成果对缓解城市道路交通拥挤,保障道路顺畅具有重要意义。

1 分析基础

1.1 学生出行特性分析

学生群体作为城市出行者的一部分,具有普通出行者的交通心理需求,希望出行能够省时、省钱、省力,同时能够安全、方便、舒适。影响学生出行及其交通特征的因素包括学生性别、年龄、家庭属性等。一般而言,学生出行可分为上学和其他(如购物、出游、探亲访友等),笔者主要针对学生以上行为目的,的出行行为进行研究。

学生群体是一个特殊的群体,人数众多,在城市的通勤出行中占很大的比例,并且往往具有明显的时间和空间分布特性,形成分别围绕上学和放学时间,以学校为终点和起点的出行。由于学生年龄、与学校的距离和其他条件的限制,学生对于出行方式的选择能力较弱,其出行决策往往在很大程度上受到家庭属性和家庭决策的影响。学生单独出行时选择的交通方式多为步行、自行车或公交车,而采用小汽车、摩托车的出行方式一般需要家庭中其他成员(主要是父母)的陪同,同时受到家庭拥有交通工具种类和数量的影响。

1.2 基于学生特性的分析模型选择

非集计模型(Disaggregate Model)也称为个人选择模型或离散选择模型,其假设当出行者面临选择时,对某种选择的偏好可以用被选择对象的效用值来描述:出行者是交通行为意志决定的最基本单位;出行者在特定的选择条件下,选择其所认知的选择方案中效用最大的方案[7]。学生出行也是学生在一定条件下的出行选择行为,假定学生总是会选择他所认为的效用最大的交通方式,则学生的出行行为决策也可用非集计模型来描述。

常用的非集计模型有BL(Binary Logit)、MNL 和NL模型,其中BL模型适用于选择枝是2个的出行行为描述,MNL和NL模型适用于多个选择枝。一般而言,MNL模型形式简单且易于估计,是较常使用的离散选择模型,但它具有内在的缺陷: IIA特性。NL模型是一般Logit模型的改进模型,通过对选择枝分层进而对出行选择决策等进行描述。学生的出行选择行为具有明显的分层特性,如先考虑公共交通或私人交通方式出行,或者先考虑个人单独出行或者家人陪同出行等,因此可以选用非集计模型中的NL模型对学生的出行选择行为和出行特性进行分析。

1.3 NL模型简介

随机效用理论认为效用是一个随机变量,效用函数由两部分组成,确定项和随机项,表示如式(1):

(1)

式中:Uin为出行者n选择方案i时的效用;Vin,εin分别为出行者n选择方案i时效用函数的确定项和随机项。

如果假设某出行者n的选择方案集合为An,选择其中方案j的效用为Ujn,则该出行者n从An中选择方案i的条件为:

(2)

Vin+εin>max(Vjn+εjn),i≠j,j∉An

(3)

此时,根据效用最大化理论,出行者n选择方案i的概率Pin可以写为如式(4):

Pin=Prob(Uin>maxUjn,i≠j,j∉An) =Prob(Vin+

εin>max(Vjn+εjn))

(4)

这里假设随机项εin服从二重指数分布,得到Logit模型的表达式:

(5)

NL模型是基于一般的Logit模型的改进模型。NL模型的分层原则是将相似性较大的选择方案作为一个层次,将不同类型的选择方案作为不同的层次。NL模型的基本公式如式(6):

(6)

在NL模型中,下层所属的上层选择方式被选择时,下层的选择具有条件概率性,因此可以确定上层方案的效用,其一般由下层最大期望效用和影响方案的因素的属性变量组成,即:

Uin=Vin+εin+logsum

(7)

式中:logsum为下层方案中决策者所选方案对应的影响因素的效用值的总和,用来表示下层影响因素对上层的影响。

2 学生出行NL模型结构和参数选择

2.1 出行数据分析

以宁海市2012年学生家庭的出行调查数据为基础进行分析。此次调查共发放5 000份调查问卷,回收2 820份(2 820个家庭),其中有车家庭2 061个,小汽车家庭拥有率73%。调查以学生家庭为单位进行,全部家庭成员出行次数共计23 263次,出行方式主要有小汽车、步行、公交车、自行车和摩托车。各出行方式所占比例如图1。

图1 学生家庭全成员出行交通方式分担率

学生群体和家庭内成员间虽然共享收入、居住环境和交通工具,但学生出行特性和家庭其他成员明显不同,将学生家庭中的学生出行进行专门统计,得到学生出行交通方式分担情况,如图2。

图2 学生家庭学生交通方式分担率

从图1、图2 可以看出,不同交通方式的分担率发生了较明显的变化。小汽车出行在两图中的比例都是最高的,但学生出行的小汽车比例比全成员的比例少10%;学生摩托车出行比例比全成员摩托车出行比例减少了12%。由于在无人接送的情况下,步行和自行车是学生经常采用的交通方式,因此学生出行步行和自行车的选择比例相对全成员步行和自行车的选择比例增加比较明显(分别为7%和13%)。

影响学生出行的因素除了家庭属性、性别和年龄等个人属性、出行特性之外,还包括家长的接送,类似于陪同出行。本次调查的2 820个家庭中,有人接送的学生为1 454个,约占52%。学生家庭其他成员的出行目的主要分为探亲、休闲、上下班、公务、接送学生,在调查的9 857次出行中,接送学生上下学出行次数为1 647次,占16.7%(其中部分出行目的为上班的出行中也包括接送学生上下学,因此实际比例高于该值)。

2.2 模型结构建立

以学生家庭学生的出行行为为分析对象,分析家庭因素和出行因素对学生出行方式选择的影响。从调查数据看,出行方式选择最多和最少的交通方式分别是小汽车和公交车,通过此次模型的建立研究影响这些交通方式选择的因素,并对该结果做出合理的解释。为了能够区分不同出行因素对于学生选择公共交通方式(公交车)和私人交通方式的不同影响,笔者采用的NL模型结构如图3。

图3 NL模型结构

2.3 模型参数选择

此次对学生家庭的调查内容包括:家庭基本信息(家庭住址、现有交通工具、小汽车购买计划等)、家庭成员信息(性别、年龄、职业、收入、是否有公交IC卡,是否有驾驶执照等)及家庭成员全天的出行信息(出行次数、每次出行起终点、采用的交通方式、出行目的等)。具体到学生来说,还同时调查了是否有人接送、是否有公交IC卡等信息。对调查得到的信息进行分析,把影响学生选择公共交通的因素选入到上层模型,把影响学生选择不同私人交通方式的因素归入到下层模型,形成表1所示的NL模型层次划分及对应参数。

表1 NL模型参数

为更方便的分析变量(参数)和交通方式选择结果之间的关系,需要首先将这些参数量化,即对这些哑变量进行赋值,以便后续利用软件对模型参数进行估计。各变量及其取值情况如表2。

表2 变量取值

Table 2 Values of parameters (variables)

3 模型参数估计

3.1 非集计模型θ的参数标定原理

非集计模型最优参数估计方法主要有N-R (Newton-Raphson method)、D-F-P(Davidon-Fletcher-Powell method)等,常用的是N-R法,其主要计算步骤如下:

步骤0:令θ的初值为0,循环次数q=0;

步骤2:求A(0)点处L的切线方程式,方程如式(8):

(8)

步骤3:求上式所示的切线与轴交点值θ(0),即令L=0,求θ(0);

θ(0)=θ(0)-[2L(θ(0))]-1L(θ(0))

(9)

步骤4:收敛性检验。

(10)

(11)

式中:P为参数的个数;上标q为循环次数;μ1,μ2为预先给定的误差,通常μ1=10-4,μ2=10-2。如满足式(10)、式(11),则为θ(q)所求;否则返回步骤1,重复以上步骤。

NL模型参数估计分为两个阶段:①下层选择参数估计。这里把最底层的模型看成是多个独立的MNL模型,对这些独立的多项Logit模型进行定义和估计;②上层选择参数估计。上层方案的效用由两部分构成,logsum参数和效用参数。根据下层模型的参数估计,计算离散数据的logsum值,作为对上层选择效用的影响因素,之后对上层模型进行定义和估计。

3.2 利用SPSS标定模型参数

在所有的调查数据中筛选出有效数据共500条,即对500个信息完整的学生家庭中,学生的出行行为进行分析。数据的处理主要利用SPSS软件进行,将相关变量带入到SPSS软件中,得到下层模型的参数估计如表3。

根据统计学理论,在自由度为1,置信度a=0.05的条件下,Wald临界值为3.841,即如果Wald大于3.841,说明自变量和因变量显著相关;Wald略小于3.841,认为自变量对因变量有影响,但影响程度较小;Wald远小于3.841,则认为自变量和因变量显著无关[9]。

根据表3中下层模型的参数估计结果,与步行相比,摩托车出行比较显著的影响因素为是否有人接送、家庭收入、家庭摩托车拥有数量;小汽车出行比较显著的影响因素有是否有人接送、学生年龄、家庭收入、出行时间、家庭小汽车拥有数量;自行车出行方式的因素有是否有人接送、学生年龄、家庭是否拥有自行车等。

表3 下层参数估计

注:参考类别是步行。

在此基础上,将样本数据带入模型中,得到样本对于选择集中各出行方式的选择概率,将最大的概率定为样本的预测结果。表4中每行数据的和为实际的样本选择结果,每列数据的和为模型的预测结果,表中各数为其所在行对应的交通方式预测为所在列对应的交通方式的统计数,其中对角线上的数据为模型中的选择结果和预测结果一致的统计数。百分比校正表示预测结果与实际结果一致的样本占该出行方式样本的比例,总百分比例所对应交通方式预测结果所占的比例。最终的命中率为对角线上样本量所占样本总量的比例,如表4。

表4 下层模型命中率

将公共交通方式和私人交通方式作为NL模型的上层,利用下层参数可以得到下层影响因素的logsum值,将下层的logsum值作为上层选择方式的一个影响因素,可以得到上层的各个参数和主要的统计量[8],如表5。

表5 上层参数估计

注:参考类别是私人交通。

从表5可以看出,上层参数估计得到的Wald值相对较大,说明上层模型的各因素对于模型的影响都比较显著,其中是否拥有公交卡和下层模型构成的logsum项对于模型影响最大,其次为家庭收入。同样将离散数据分别带入模型中,将概率最大的方式定为预测结果,得到上层模型的命中率,具体如表6。

表6 上层模型命中率

3.3 模型精度检验

模型的精度主要体现在似然比、模型拟合优度、命中率和包容系数几个方面,模型精度检验就是要对上述指标进行统计分析,证明模型的准确性和合理性。

模型似然比检验能够反应出行特性变量对模型是否显著,根据软件的分析结果整理得到模型的似然比检验指标,具体如表7。

表7 似然比检验指标

从表7可以看出,对于似然比检验,模型上下层均有P(sig)<0.05,因此在本模型上下层回归模型均有显著意义。

命中率表示实际选择结果和模型推算结果的吻合程度,如果一个模型命中率超过80%,则认为命中率相当高。该模型上层命中率为83%,下层命中率为77.6%,说明模型上层命中率高于下层,但是预测结果的准确率尚在可接受范围之内。

包容系数反映了分层模型结构的合理性,包容系数即logsum的参数估计值,如果包容系数的绝对值小于1则说明模型是显著的。该模型的包容系数为-0.216,其Wald检验值为12.697,说明模型的影响显著,NL模型的上下层之间有明显的阶层关系,模型结构关系合理。

4 模型结果分析及措施

在NL模型分析过程中,上层模型由于用私人交通方式作为参照,故利用SPSS软件输出的参数估计值实际上为公共交通方式和私人交通方式效用之差的系数。同样的,下层模型由于以步行交通方式为参照,参数估计值实际上为某一特定出行方式和步行效用之差的系数。分析模型计算结果和相应参数,并进行敏感性分析,得出如下结论:

1)家庭收入是家庭属性中影响学生交通方式选择的一个重要因素,在上层和下层模型中同时将这一影响因素考虑进去。家庭收入对于上层交通方式选择的影响比较大,当家庭收入在划分范围内上升一个档次,学生选择公交车的概率是选择私人交通方式的0.5倍。下层模型中,家庭收入每上升一个等级,学生采用摩托车、小汽车、自行车的概率分别是步行出行方式的1.48,1.64,1.12倍。以上数据说明,家庭收入越高的学生越倾向于私人交通方式,小汽车出行为高收入家庭学生的首选。

2)在下层模型中,将几种家庭交通工具的拥有量作为学生出行的影响因素,家庭小汽车拥有量对小汽车出行有比较重要的影响。当家庭小汽车数量增加,学生出行选择小汽车的概率是选择其他交通方式的2.5倍;当学生家庭拥有摩托车,学生采用摩托车出行概率是步行的1.62倍;当学生家庭拥有自行车,学生采用自行车出行是步行出行的40倍。其中家庭小汽车数量的增加还会减少自行车出行的概率。

3)是否拥有公交卡对上层的交通方式的影响最明显,当学生拥有公交卡时,其选择公共交通出行方式是私人出行方式38倍。在下层模型的影响因素中,是否有人接送对于学生交通方式的选择有比较大的影响,有人接送的情况下学生更容易选择小汽车和摩托车的方式出行,但是有人接送却会降低自行车的出行概率。在有人接送的情况下,学生采用小汽车出行方式是采用步行方式概率的34倍,摩托车出行为步行方式概率的17倍,自行车出行方式为步行方式的0.2倍。

综合上述分析结果,在实际交通管理中,可以有针对性的采取相应的管理措施或对策:

1) 私家车的出行方式有一定的习惯性和依赖性,其他的交通方式很难替代;居民的收入水平对学生选择私家车出行的概率有很大的影响,并且随着经济的发展私家车出行比例会呈逐渐增加趋势,应针对性的采取相应地限制策略减少私家车的出行。

2) 家长接送学生上下学是影响学生选择私人交通方式的重要因素,鼓励学生独立上下学,减少家长接送,能的有效的减少私家车在学生上下学出行方式中占的比例。

3) 校车作为一种公共交通方式逐渐被学校采用, 应通过相关政策和规划实施校车服务,将其他出行方式尤其是电动自行车和私家车出行吸引到校车上来。

4) 鼓励学生办理公交IC卡,采用公共交通方式上下学。对公交的满意度对于学生公交出行有比较大的影响,要增加公共交通的出行分担率就要改善公交车的乘车环境。

5 结 语

学生出行是城市居民出行的重要组成部分,并具有明显的时空分布集中性特点,往往会造成一定时间和空间内的交通拥挤。从家庭属性和个体属性的角度,对影响学生出行选择的主要因素及其影响机理进行分析,构建了基于NL模型的学生出行行为选择模型,并对主要影响因素进行了敏感性分析。研究成果有助于更好的了解学生出行选择的特点,从而更好的采取相应地城市交通管理对策和措施。

[1] 富晓艳,隽志才,宗芳,基于非集计选择模型的长春市居民出行数据分析[J].交通运输系统工程与信息,2007,7(5):80-84. Fu Xiaoyang,Juan Zhicai,Zong Fang.Disaggregated model-based changchun residents’ travel time data analysis [J].Journal of Transportation Systems Engineering and Information Technology,2007,7(5): 80-84.

[2] 刘炳恩,隽志才,李艳玲,等.居民出行方式选择的非集计模型的建立[J].公路交通科技,2008,25(5): 116-120. Liu Bing’en,Juan Zhicai,Li Yangling,et al.Development of a multinomial logit model for travel choice of residents [J].Journal of Highway and Transportation Research and Development,2008,25(5): 116-120.

[3] 杨励雅,李霞,邵春福.居住地、出行方式与出发时间联合选择的交叉巢式Logit模型[J].同济大学学报:自然科学版,2012,40(11): 1647-1653. Yang Liya,Li Xia,Shao Chunfu.Cross-nested model for joint choice of residential location,travel model and departure time [J].Journal of Tongji University: Natural Science,2012,40(11): 1647-1653.

[4] Kara M K,Jason D L.Anticipating new-highway impacts: opportunities for welfare analysis and credit-based congestion pricing [J].Transportation Research Part A,2011,45(8): 825-838.3

[5] 吴文静,隽志才.通勤者下班后非工作活动时间选择决策行为[J].中国公路学报,2010,23(6):93-95. Wu Wenjing,Juan Zhicai.Decision-making behavior of commuters’ non-working activity time choice after work [J].China Journal of Highway and Transport,2010,23(6): 93-95.

[6] 鲜于建川,隽志才.双职工家庭通勤出行长度选择研究[J].武汉大学学报,2012,36(6):1133-1135. Xianyu Jianchuan,Juan Zhica.Modeling commute length choice decision in dual-income households [J].Journal of Wuhan University of Technology,2012,36(6): 1133-1135.

[7] 关宏志,非集计模型—交通行为分析的工具[M].北京:人民交通出版社,2004. Guan Hongzhi.Disaggregate Model—A Tool of Traffic Behavior Analysis [M].Beijing: China Communications Press,2004.

[8] 陈俊励,马云龙,朱楠.基于巢式Logit模型的公交出行方式选择行为研究[J].交通运输系统工程与信息,2011,11(1):121-125. Chen Junli,Ma Yonglong,Zhu Nan.A study on bus travel mode choice behavior based on nested logit model [J].Journal of Transportation Systems Engineering and Information Technology,2011,11(1): 121-125.

[9] 王济川,郭志刚.Logistic回归模型—方法与应用[M].北京:高等教育出版社,2001. Wang Jichuan,Guo Zhigang.Logistic Regression Model-Methods and Applications [M].Beijing: Higher Education Press,2001.

Choice Characteristics of Students Travel Behavior Based on Household Characteristics and Nested Logit Model

Ma Shuhong1, Fu Jianchuan1, Yao Zhigang2

(1. School of Highway, Chang’an University, Xi’an 710064, Shaanxi, China;2. School of Economics & Management, Chang’an University, Xi’an 710064, Shaanxi, China)

Based on nested Logit model, the impact on students travel behavior choices due to students’ personal attributes, household characteristics and trip features was elaborated. A two-layer nested Logit model was established. The upper layer included public transit and private mode alternatives, and the lower layer included car, motorcycle, bicycle and walk. SPSS was used to calibrate and test the model according to survey data, and then the influence of household vehicle ownership, household income and other factors was analyzed. The results illustrate that household income is an important factor for mode choice, and students intend to choose private mode in a higher income household. Having a bus card or not is the most evident factors for upper mode choice, and students choosing public transit mode is 38 times than private mode when they have a bus card; household vehicle ownership and needing ferry or not are critical factors for lower mode choice, and the probabilities of students choosing a private mode are higher when their homes have a car or when there is someone picking up them.

traffic engineering; students travel; behavior; household characteristics; Nested Logit model; travel mode choice

10.3969/j.issn.1674-0696.2015.04.24

2013-12-28;

2014-04-28

马书红(1975—),女,河北藁城人,副教授,博士,主要从事交通规划、交通经济方面的研究。E-mail: jtmn@gl.chd.edu.cn。

U491

A

1674-0696(2015)04-122-06

猜你喜欢

下层小汽车交通
小汽车
繁忙的交通
我的玩具小汽车
拼一拼
小小交通劝导员
积雪
陕西横山罗圪台村元代壁画墓发掘简报
有借有还
阅读理解三则