APP下载

基于D-optimal试验设计的公共交通出行logit模型

2014-09-06杨桥东曾大堃

山东交通学院学报 2014年1期
关键词:私家车行者效用

李 信,杨桥东,曾大堃

(西南交通大学 交通运输与物流学院,四川成都 610031)

基于D-optimal试验设计的公共交通出行logit模型

李 信,杨桥东,曾大堃

(西南交通大学 交通运输与物流学院,四川成都 610031)

以成都到龙泉片区的交通通道为研究对象,假设通道开通地铁的情况下,采用D-optimal试验设计意愿调查问卷,选择费用、时间等变量以及个人属性作为效用变量,建立公共交通出行的多项logit模型,结合意愿调查数据对模型进行求解,分析通道中公共交通出行选择行为,并预测成都到龙泉片区主要交通方式的客流分担率。分析表明,地铁将承担通道中大部分的客流。

公共交通出行;D-optimal试验设计;意愿调查;多项logit模型

离散选择模型是描述人们选择行为的模型,广泛应用于具有选择行为的社会各个方面,在交通工程界的应用主要有需求量预测、政策评价、交通服务效益评价等。离散选择模型是基于效用函数最大化的假说,以Logit模型应用最为广泛,假设效用函数的概率项服从二重指数分布。Logit模型中需要的数据主要采用意愿调查(Stated Preference,SP)得到,意愿调查获取假设情景下出行者的偏好或者选择结果[1-2]。意愿调查的问卷设计方法有多种,应用比较多的是正交设计法,但本文采用一种新的试验设计方法——D-optimal试验设计法进行问卷设计,该方法的本质是使模型的渐进协方差矩阵的行列式最小,本质是使模型参数的标准误差最小,从而得到更可靠的参数估计结果,进而能够更精确的分析出行者的出行偏好。

1 D-optimal试验设计

1.1 D-optimal试验设计原理

D-optimal试验设计的目的是使模型渐进协方差矩阵的行列式Derror最小,则模型参数估计的标准差也就越小,参数估计的精度就越高,确保所选属性水平的组合方案能够最大程度体现受调查者出行选择时的偏好信息最大化[3]。

多项Logit(MNL)模型的对数似然函数L为

(1)

式中yni为列矩阵,选择枝i在选择情景中被回答者n选择时,yni值为1,反之为0;Pni为选择模型中选择枝i被出行者n选择的概率;I为选择枝总数;N为出行者总数。

定义的选择模型考虑一个特殊的选择数据集,使式(1)最大化,得到参数的最大似然估计量。

渐进协方差矩阵Ω可以计算为Logit模型的对数似然函数L的海赛矩阵逆矩阵的负数[4-6]。海赛矩阵H中的元素计算式为

式中Xikn为选择枝i中属性k的值,该值不随出行者n改变;βik为选择枝i中属性k的系数;K为试验设计中需要标定的一般参数的总数量。

1.2 D-optimal试验设计

1)定义选择枝集合、选择枝属性以及属性水平

假设成都地铁2#线东沿线开通,成都到龙泉片区交通出行的选择枝集合为:大巴、公交车、出租车、私家车、地铁。利用SP调查问卷采集出行者从成都到龙泉片区的选择偏好的数据。选择枝属性定义时,应选能够有效反应选择枝特性且不具有相关性的属性。在定义选择枝属性水平时,每个属性的水平个数不需要相等,属性水平定义越多,在效用空间中能够得到的信息量越大,但属性水平的个数会影响试验组合个数,因此,应适当选择[7]。选择枝属性水平的选取应结合实际情况,适当增加和减少相应的比例,结合从成都到龙泉片区各种交通方式的实际出行时间,根据两地距离和地铁的运行速度计算出车内时间,最后确定选择枝的属性及属性水平定义如表1所示。

表1 选择枝属性及属性水平定义

注:到站时间,指从出发点到乘车站点的时间。

表2 选择枝属性预先值

2)计算参数的预先值

D-optimal试验设计法需要先计算参数的预先值。调查问卷采用正交设计,采集192组观测结果,利用采集的数据对MNL模型进行参数估计,参数估计结果为属性参数的预先值,从而得到5个选择枝中属性参数的预先值,如表2所示。

3)设计试验组合

根据表1定义的选择枝属性以及属性水平,利用全因子设计法可以有648个试验组合,把这648个试验组合作为候选试验组合。本文使 D-optimal试验设计的试验组合数为32个。根据D-optimal试验设计的步骤,利用Matlab软件编程,从具有648个组合的候选矩阵中任意挑选32个试验组合,计算Derror,重复迭代,得出使Derror最小的32个试验组合,该Derror为0.065。

同样,为了减少被调查者的调查情景数,得到更可靠的调查数据,把32个组合随机分成8块,由8个被调查者来完成,每个被调查者完成4个组合情景,再加上个人属性等问题的选择,构成完整的问卷。试验组合示例如表3所示。

表3 D-optimal试验设计组合示例

2 城市居民公共交通出行logit模型建立

2.1模型建立

Logit模型是基于随机效用最大化理论的假设。根据效用最大化理论,出行者总是选择具有最大出行效用的出行方式,出行者n选择第i种出行方式的概率Pn(i)为

Pn(i)=P(Uni≥Unj),∀j∈Cn,j≠i,

式中Uni为出行方式i对于出行者n的效用;Unj为出行方式j对于出行者n的效用;Cn为选择枝集合。

效用Uni、Unj与出行方式的属性和出行者本身属性相关。随机效用理论认为效用是一个随机变量,并将效用函数U分为可以观测的影响因素所构成的固定项(V)和不可观测的影响因素所构成的随机项(ε)两大部分,并假设它们呈线性关系。因此交通方式i对出行者n的效用函数可以表示为

Uni=Vni+εni,

Vni=α+β1Xi1n+β2Xi2n+…+βkXikn+λ1Si1n+λ2Si2n+…+λmSimn,

(2)

式中α为选择枝i的常数项;βk为每个选择枝的效用中属性k的权重,即选择枝属性的参数值;λm为每个选择枝的效用中出行者属性m的权重,即出行者属性的参数值;Sinm为出行者n属性m的值。

当εni服从相互独立的Gumbel分布时,可以得出Multinomial logit(MNL)模型的一般式,logit模型中出行者n选择第i种出行方式的概率[8]为

(3)

2.2数据分析

基于D-optimal试验设计法的一份问卷包括32个选择情景,每个被调查者完成4个选择情景。在实际调查中不仅采集被调查者的年龄、收入、性别等个人信息,而且被调查者必须回答在不同的费用与出行时间组合情况下首选的交通方式。每份问卷包含多个完全独立的情景,被调查者需要对其中调查内容做出回答。此次,调查对象为1 344人,男性占50.2%。样本中拥有私家车的出行者占41%,样本平均年龄为32.8岁,年龄的分布如图1如示,其中男性和女性的平均年龄差距比较小,总体平均年龄分别是33.4岁和32.2岁。样本总体月平均收入为3 788元,与成都市居民的月平均收入相差不大,样本的收入分布比例如图2所示。

图1 总体样本年龄分布图

图2 总体样本收入分布图

3 模型标定结果分析

MNL模型效用参数的标定通过软件NLOGIT 3.0实现。NLOGIT软件可以实现多项式选择数据的估测、模拟和分析,已经成为估计和模拟多项离散选择模型的首要软件。把调查的数据样本数量1 344输入标定软件,NLOGIT软件利用最大似然估计法得到模型参数的标定结果,如表4所示。由表4可得,似然函数值为1 004.118,拟含优度为0.37。

表4 MNL模型标定结果

注:性别、年龄、月收入分别为对应车型驾驶员的性别、年龄、月收入。

一般离散选择模型的拟合优度为0.2~0.4时,代表模型的拟合度较好,所建模型的拟合优度为0.37,模型拟合度较好,说明所建模型正确。由表4可知,广义变量“费用”、“到站时间”、“候车时间”、“车内时间”以及“下车到目的地时间”的参数值均为负值,表示费用越高,选择该种交通方式的概率越小,出行时间越长,选择该种交通方式的概率越小,与实际相符。

通过t检验值的绝对值判断该参数值所对应的属性是否能够显著影响出行者的选择行为。通常,在5%置信度区间下,如果t检验的绝对值>1.96,则认为该属性能够显著影响出行者的选择行为,反之则认为该属性对出行者的选择行为不会造成显著影响。根据模型结果,变量“费用”、“到站时间”、“车内时间”t检验的绝对值均>1.96,表明这3个属性对出行者的选择行为具有显著影响。

精神卫生既是全球性的重大公共卫生问题,也是较为严重的社会问题。由于精神障碍患者病情波动的不可预见性,在预防控制精神障碍患者突发肇事肇祸事件上存在着相当困难,因此严重精神障碍应急处置就显得异常重要。应急处置主要是通过有效的应急救援行动,尽可能地降低事故的后果,包括人员伤亡、财产损失和环境破坏等。在应急处置过程中,需要包括综治、公安、卫生、街道、居委会、家属等多部门的参与,各部门要分工明确,职责分明,流程顺畅,应对及时;应急处置后还有可能需要民政、司法、残联等相关部门的后续支持,因此掌握严重精神障碍患者应急处置流程,明确各部门职责就显得异常重要。

出行者的个人属性也作为解释变量进入模型,由表4可知,选择枝大巴、公交车和地铁对应变量“收入”的参数值均为负数,说明收入越高,选择这几种交通方式的概率越小。出租车对应变量“收入”的参数值为正数,表明收入越高,选择出租车的概率就会越大。“是否拥有私家车”对私家车的使用有着显著地影响,拥有私家车的出行者在出行上非常依赖于私家车。

将表4的模型标定参数值代入式(2)可以得出5种出行方式对出行者的效用。

如:一年龄28岁的男性出行者,月收入5 600元,无私家车,针对表3中的第4种组合的出行方式,分别计算选择5种出行方式的概率。

当出行者性别为男时,属性值为1;性别为女时,属性值为0;拥有私家车时,属性值为1,否则为0;年龄为25~30岁时,属性值为3;收入为4 000~6 000元时,属性值为3。将表4中相应的数据代入式(2),计算大巴对该出行者的效用为

V1=3.328-0.028 9×10-0.108 9×20-0.020 9×15-0.034 2×40-0.031 7×15+0.351 6×1+0.036 9×3-0.292 6×3=-1.713 0.

同理计算出公交车、出租车、私家车、地铁对该出行者的效用分别为:-1.249 8、-2.396 5、-1.946 1、1.628 9。

同理可计算出该出行者选择公交车、出租车、私家车、地铁的概率分别为:0.49,0.16,0.25,0.879。这样,计算出每个选择情景中出行者对每种交通方式的选择概率,再计算每种交通方式选择概率的平均值,得到通道中大巴、公交车、出租车、私家车、地铁5种交通方式的客流分担率分别为2.5%、22.6%、1.2%、25.6%、48.1%。可见地铁对旅客具有强大的吸引力,将承担通道内大部分的客流。

4 结论

基于D-optimal 试验设计的公共交通logit模型的拟合优度为0.37,拟合优度较好,说明所建模型的正确性。模型求解结果表明:

1)费用、到站时间以及车内时间显著影响出行者的出行行为,通过提高公交车的站点覆盖率、缩短公交线路的非直线系数等手段来缩短出行者的到站时间和车内时间,可以提高公交车的选择概率。

2)拥有私家车的出行者对私家车依赖度非常高,因此可以采用一些交通需求管理政策控制小汽车的出行量,以达到缓解交通拥挤的目的。

3)成都到龙泉片区地铁建成后,成都到龙泉片区大巴、公交车、出租车、私家车、地铁5种交通方式的客流分担率分别为2.5%、22.6%、1.2%、25.6%、48.1%,地铁将承担成都到龙泉片区的大部分客流。

[1]赵鹏,藤原章正.SP调查方法在交通预测中的应用[J].北京交通大学学报,2000,24(6):29-32.

[2]焦朋朋,陆化普.基于意向调查数据的非集计模型研究[J].公路交通科技,2005,22(6):114-116.

[3]Michiel C J Bliemer, John M Rose. Experimental Design Influences on Stated Choice Outputs: An Empirical Study in Air Travel Choice[J].Transportation Research: Part A , 2011,45:63-79.

[4]John M Rose, Michiel C J Bliemer, David A Hensher, et al.Designing E Cient Stated Choice Experiments in the Presence of Reference Alternatives[J].Transportation Research: Part B,2008,42(4):395-406.

[5]Rose J M, Bliemer M C J, Hensher D A ,er al. Handbook of Transport Modelling[K].Oxford:Oxford University Press,2008:151-180.

[6]Kenneth Train, Wesley W Wilson. Estimation on Stated-Preference Experiments Constructed from Revealed-Preference Choices[J].Transportation Research: Part B, 2008,42(3): 191-203.

[7]David Alan Hensher, William Greene. Applied Choice Analysis [M].England:Cambridge University Press,2005.

[8]关宏志.非集计模型——交通行为分析的工具[M].北京:人民交通出版社,2004.

(责任编辑:杨秀红)

ApplicationofD-OptimalDesignMethodforLogitModelConstructionofPublicTransportTravelBehavior

LIXin,YANGQiao-dong,ZENGDa-kun

(CollegeofTransportationandLogistics,SouthwestJiaotongUniversity,Chengdu610031,China)

A traffic corridor between Chengdu and Longquan district is selected to analyze the public transport travel behavior. Assuming that the subway is opened in the traffic corridor, the D-optimal design is adopted in the stated preference questionnaires. Then, such utility variables as time, cost, sex, age and income are selected to construct the multinomial Logit (MNL) model and the stated preference data are used to calibrate the Logit model to analyze peoples′ public transport behavior. Finally, the sharing rate of main traffic modes is forecast. As a result, the analysis shows that the subway will undertake the main part of passenger flow in the traffic corridor.

public transport travel behavior; D-optimal design;stated preference; multinomial logit model

2013-03-03

李 信(1990—),女,云南弥勒人,西南交通大学硕士研究生,主要研究方向为交通运输规划与管理、交通规划与交通行为理论与实证.

10.3969/j.issn.1672-0032.2014.01.008

U491

A

1672-0032(2014)01-0033-06

猜你喜欢

私家车行者效用
乘坐私家车
做“两个确立”的忠实践行者
逆行者
Cлово месяца
最美逆行者
小学美术课堂板书的四种效用
图说
私家车将逐渐消失
纳米硫酸钡及其对聚合物的改性效用
几种常见叶面肥在大蒜田效用试验