到达车站的步行时间对老年人公交选择的影响
2020-02-28刘建荣郝小妮
刘建荣,郝小妮
(华南理工大学土木与交通学院,广州510640)
0 引 言
由于人均寿命增加及低生育率等原因,我国正逐渐迈入老龄化社会.相对于青壮年人,老年人面临更多问题,如更低的身体功能、认知能力等.这些问题导致老年人受到更多的社会排斥.社会排斥进一步增加了政府和个人的卫生保健支出[1].老年人外出活动是降低老年人所受到的社会排斥的重要手段,可以显著降低老年人的医疗费用.但是我国仅有45%的老年人外出活动是足够的[1],需要采取措施提高老年人外出比例.
公共交通是老年人常用的出行方式.可达性是公共交通系统服务质量的重要内容.可达性中,到达公交车站的步行时间是公交系统可达性的重要组成部分[2].对公交可达性的研究较多,但大部分研究对象是青壮年群体,以老年人为研究对象的文章不多.由于身体状况、出行目的等不同,公共交通中青壮年群体的研究结论并不适用于老年群体[3].少部分涉及老年人可达性方面的研究结论也不一致.文献[4]认为,可达性的提高均有助于提高老年人使用公共交通的概率;而文献[5]发现,可达性对老年人使用公共交通概率的影响不显著.国内虽然对老年人出行行为进行了一定研究,如文献[3]和文献[6]等,但鲜有公交可达性对老年人出行行为影响的研究成果.由于物质、人文、交通环境等方面的巨大差异,西方国家或地区的研究成果并不适用于发展中国家或地区[7].
出行行为研究中,多项Logit 模型(Multinomial Logit Model,MNL)是应用最为广泛的模型之一.MNL 模型假定所有个体的偏好是一样的[8],即MNL忽略了个体间偏好的异质性.这个假设很强,但与实际存在较大的出入[8].考虑到个体选择偏好的不一致性,为更精确分析个体选择行为,研究者常根据个体的某些特征将个体划分为若干小组,并对每一小组的个体适用MNL进行分析.私家车拥有情况、性别、收入等是较常使用的个体特征.这种方法假定小组内的个体偏好一致,不同小组之间的偏好可能不一致.但根据老年人的某些人口统计特征进行分类的方法存在两个缺陷[8]:当分类依据较多时,被划分出来的子集过多;数据样本的划分缺乏理论基础,特别是划分依据是连续变量而非分类变量时(如收入),如何确定分类的阈值缺乏理论依据.考虑到MNL 的优缺点,学者提出了随机系数Logit 模型(Random Parameters Logit Model).随机系数Logit 模型效用函数中的系数不是固定的,而是服从某一随机分布,可能受到个体的统计学特征影响.随机系数Logit 模型通过考虑不同出行者偏好的随机变异,克服了MNL的问题[9].
基于以上分析,本文利用随机系数Logit 模型研究到达公交车站步行时间对老年人公交选择行为的影响.
1 随机系数Logit模型
传统的离散选择模型假定个体的偏好是一样的,即在效用函数中,对所有人,随机变量的系数都是一样的.此时,个体i在选择集t中选择选项j的概率可表示为
式中:Prob(yit=j)为个体i面对选择集t中的Ji个选项,选择选项j的概率;xqi为变量向量,q=1,2,…,Ji;β为系数向量;αq为常数项;αj为与选项j相关的常数项;xji为与选项j相关的变量向量.
与传统离散选择模型不同,随机系数Logit 模型认为个体的偏好是不一致的,即表征个体i的系数βi服从某一分布:βi~f(βi|θ),其中θ表示分布函数的参数.此时,个体i在选择集t中选择选项j的概率可表示为
随机系数选择模型最简单的形式为
式中:βki为向量βi的第k个分量的值;βk为总体均值;vik为个体i的异质性参数,均值为0,标准差为1;σk是βk的标准差;σj是αji的标准差;vjt为αji的异质性参数.
为更详细地分析个体属性对系数βi的影响,可将βki进一步表征为
式中:zi为个体i的个体属性向量;δk为系数向量.
2 问卷设计
选用陈述性偏好(Stated Preference,SP)调查方法获取老年人出行行为数据.调查问卷包括3部分内容:个体统计学特征,对于体育活动的态度,SP问题.个体特征如表1所示.
考虑到老年人对身体状况的主观感知,以及老年人对体育活动的态度等心理因素可能会影响老年人的出行[10],本文考虑这两因素对老年人公交可达性的影响.由于心理因素为潜变量,不能直接观测,使用显变量表征潜变量,显变量采用李克特五级量表进行调查,即1~5分别表示“完全不赞同”“有点不赞同”“不确定”“基本赞同”“完全赞同”.具体如表2所示.
当SP 问题中因素态度太多时,老年人不能充分理解问题并从中选择最优选项[6];另外,65 岁以上老年人乘坐公交车免费.故仅考虑步行时间(Twalk)和公交车内乘坐时间(Tiv)两个因素,即老年人i的效用函数的可观测部分Vi可表征为
两个因素的取值水平如表3所示.
表1 个体统计学特征Table1 Socio-demographic questions
表2 表征潜变量的显变量Table2 Manifest variables and latent variables
表3 SP 调查中的因素和水平Table3 Attributes and levels used in SP survey
为减少SP 调查的问题量,并充分利用因素的各水平,利用软件JMP进行SP问题卷设计,共产生16个假定情景,每个假定情景包含两个选项,要求被调查者在两个选项中选择最优的方案.16个假定情景被分配到4个分组中,即每个被调查者应回答1个分组中的4个假定情景.表4为假定情景示例.
表4 假定情景示例Table4 Example of SP choice scenario
3 实证分析
调查全程在线下进行,调查地点为广州市天河区的多个住宅区域,调查时间为2019年4~5月.调查者随机选取,最终获取有效问卷508 份.受访者年龄全部在50岁以上,集中在60~80岁;男女比例为46.81∶53.19;教育程度方面,受访者分布比较均匀,大专及以上学历的较少.
在数据详细分析前,对样本进行问卷信度及效度检验.在进行信度分析的时,采用的参数是最常用的α系数.当α >0.7时,表示所研究的数据可靠性较高.本文调查问卷的信度为0.882,远高于0.7,表明调查问卷的信度较高.效度检验采用KMO 和Bartlett 检验,本文调查数据的KMO 值为0.886,Bartlett 球形检验的p值为0.000,数据通过效度检验.
3.1 老年人心理变量分析
在模型设定中,老年人对身体状况的主观感知(lphysical)、老年人对体育活动的态度(lpsychological)为潜变量,无法直接测量.根据调查数据及显示变量,利用验证性因子分析分析,即表2中的显变量,得到潜在变量模型的拟合度指标如表5所示.验证性因子分析拟合度指标主要有RMSEA、CFI、TLI、SRMR 等.根据文献[11],模型的所有拟合度指标均符合要求,模型拟合度较高.
潜在变量模型中潜在变量与显示变量的因果关系如表6所示,为简明起见,潜在变量与潜在变量的相关性未列出.表6中数据均为标准化后的数值.表6数值中显变量与潜变量之间的数值均显著(p值都小于0.05),且均大于0.6,表明显变量可极好地表征潜变量.
表6 潜在变量模型结果Table6 Result of confirmatory factor analysis
3.2 老年人出行选择行为研究
根据文献[12]中对于随机系数Logit模型分析流程的建议进行数据分析.假定影响效用的Twalk和Tiv两个变量都是随机系数,并将系数设置为式(3)的形式,即βki=βk+σkvik.另外,考虑到出行者对于假定情景的选择是在两种公交中进行选择,两种类型的公交除了车内时间、步行时间不同外,没有任何其他区别,在效用函数中,不需要设置常数项以表征两种公交的不同,因此将αji设置为0.此时,出行者i的效用函数的可观测部分Vi可表征为
根据以上设定,对调查数据进行随机系数Logit 回归.根据对随机系数Logit 模型的分析,随机系数Logit 模型系数的求解没有闭型解,需要仿真求解,涉及随机抽样.随机抽样中,Halton序列抽样效果较好[12],故采用Halton 序列抽样,抽样次数为1 000,最终得到的结果如表7所示.
从表3数据可以看出,Twalk、Tiv的总体均值系数均为负,且显著,这与实际相符.Nwalk、Niv中Nwalk显著,Niv不显著,表明在效用函数中,步行时间(Twalk)为随机系数,公交车内乘坐时间(Tiv)为非随机系数.
表7 不考虑个体属性影响的随机系数Logit 回归结果Table7 Result of mixed Logit model without demographic characteristics
表7中只确定了Twalk的系数为随机系数,但并不能看出哪些因素影响了Twalk的系数.为明确这一点,根据前述分析,设定Tiv的系数为非随机系数,设定Twalk的系数为随机系数,分析表1中个体统计学特征及老年人心理因素lphysical、lpsychological等对Twalk的系数的影响.即假定Twalk的系数的函数形式为βki=βk+δTk zi+σkvik.采用Halton序列抽样,抽样次数为1 000,最终得到的结果如表8所示.
表8 考虑个体属性影响的随机系数Logit 回归结果Table8 Result of mixed Logit model withdemographic characteristics
从表8数据可以看出有较多因素对Twalk的系数产生显著影响.在表8数据分析的基础上,剔除不显著变量,重新进行随机系数Logit 回归,采用Halton序列抽样,抽样次数为1 000,得到的最终模型结果如表9所示.
表9 考虑显著的个体属性影响的随机系数Logit 回归结果Table9 Result of mixed Logit model with significant demographic characteristics
最终模型的对数似然值为-1 069,伪R2为0.241;标准的条件Logit 模型的对数似然值为-1 163,伪R2为0.173.随机系数Logit模型各方面指标显著高于传统的条件Logit模型.
根据表9数据,以车内时间为基准,将步行时间的系数除以车内时间的系数,得到步行时间的相对系数Rwalk,具体公式为
根据式(7),相对男性老年人,女性老年人步行相对系数低0.52,即女性相对男性更倾向于步行,这与文献[4]等的研究成果较一致,但与文献[6]等的结论不同.年龄cage的系数为0.03,年龄增长1岁,步行相对系数增加0.03,即随着年龄的增加,对步行时间的负面评价增加,这与文献[13]等的研究一致.delectric的系数-0.67,系数为负,即相对无电动车的老年人,有电动车的老年人对步行持更加正面的评价.lphysical、lpsychological的系数均为负,随着lphysical、lpsychological的系数的增加,步行时间相对系数减少,表明老年人对身体状况的主观感知、老年人对体育活动的态度对老年人步行时间有正向作用,这与文献[10]等的研究一致.dhighschool、dcollege的系数均为负,且dcollege的系数小于dhighschool,表明学历越高的老年人,对步行的正面评价越高,结论与文献[10]等的研究一致.dincome3000的系数为正,相对低收入老年人,高收入老年人的步行时间相对系数更高,表明高收入老年人对步行时间的正面评价更低.dbususe(frequently)的系数为负,即经常乘坐公交的老年人对步行时间的负面评价更低.
4 结 论
本文利用随机系数Logit 模型研究了步行时间对老年人公交选择行为的影响.通过研究得到以下结论:数据拟合度方面,随机系数Logit 模型显著高于传统的多元Logit模型;性别、年龄、是否拥有电动车、教育程度、月收入是否大于3 000元、是否经常使用公交等个人统计学属性,以及老年人对身体状况的主观感知、老年人对体育活动的态度对老年人步行时间价值有显著影响;是否与子女同住、是否参与老年活动、月收入是否在[1 000,3 000]元之间、是否偶尔使用公交等对老年人步行时间价值无显著影响.