城市常规公交接驳方式分担率预测模型研究
2018-11-15裴玉龙
潘 跃,裴玉龙
(东北林业大学 交通学院,黑龙江 哈尔滨 150040)
常规公交站点接驳结构的合理与否,直接关系到各接驳设施的利用率,同时也会对各接驳方式的运能匹配产生影响。因此,对常规公交接驳方式分担率的准确预测具有重要意义。
邵昀泓[1]采用非集计模型建立了以出行时间和费用为影响因素的枢纽客流分时段交通方式分担率预测模型,为枢纽内交通疏解提供了理论指导;袁长伟等[2]选择时间、费用、出行目的及收入为影响因素,运用随机效用理论构建了枢纽内交通方式两两交叉相互作用下的客流换乘分担率模型,为城市综合客运枢纽的规划提供决策支撑;韩晓玉等[3]应用Logit模型对轨道交通接驳方式进行预测,并以苏州为例对模型参数进行标定、检验,验证了Logit模型在轨道交通接驳方式预测上的适用性;Winnie Daamen[4]在探讨枢纽的设计问题中,得出设施服务水平的变化对不同路径客流的形成具有重要影响,并收集了荷兰两个枢纽站的数据,建立了以接驳设施为影响因素的客流接驳方式选择模型;N Tilahun等[5]以芝加哥为研究对象,在解决最后一公里的问题中,综合分析了社会因素和个人约束对居民交通方式选择的影响,构建出行者交通方式选择模型。
现有研究大多以规模较大的城市交通枢纽为研究对象,对规模较小的常规公交站研究较少,并且更侧重于对一种分担率预测模型的研究,缺少不同分担率预测模型的对比研究。本文在已有研究基础上,选择多项logistics回归和Bayes判别分析两种方法,分别建立常规公交接驳方式分担率预测模型,并通过对模型预测精度对比,分析两种模型各自的适用性。
1 数据调查
1.1 调查目的及对象
本次调查旨在收集常规公交站中出行者的个人属性和出行属性等基本信息,作为常规公交接驳方式选择影响因素的研究基础,并为构建接驳方式分担率预测模型提供数据支撑。
基于以上调查目的,2018年对哈尔滨市居民展开常规公交接驳意向调查,调查地点为3处远离轨道交通的常规公交站。为避免样本产生严重的多重共线性,所选常规公交站衔接了不同数量的常规公交线路,且具备一定的典型性,站点途经线路及布置形式如表1所示。
表1 所选常规公交站经停线路及布置形式
1.2 调查内容及方法
在考虑常规公交接驳方式选择影响因素的基础上,确定本次调查主要包括出行者性别、年龄、职业、收入、出行目的、出行距离和所选择的接驳方式等内容[6-7]。为尽量避免由调查带来的误差,选取简单随机抽样的方法,以发放调查问卷的形式,获取哈尔滨市常规公交站中出行者数据。本次调查共计发放问卷500份,经数据处理后得到有效问卷487份,有效率为97.4%。
2 接驳特征分析
通过对调查数据的统计分析,得到常规公交站的主要接驳方式为步行、其他线路常规公交和自行车3种,不同出行者在接驳方式的选择上存在较为明显的差异,出行者基本信息及接驳方式选择如表2所示。
表2 出行者基本信息及接驳方式选择调查结果
续表2
从表2可以看出,出行者的个人属性和出行属性对常规公交接驳方式的选择存在一定程度的影响,分析如下:
2.1 性别对接驳方式选择的影响
常规公交站中男性人数略高于女性,占总人数的52.05%。在接驳方式选择上,男、女采用步行接驳常规公交的比例基本相同,均达到了60%以上。在常规公交和自行车的选择上,男性比女性更倾向选择自行车,究其原因可能是在体能方面男性更具优势,能够承受使用自行车产生的身体耗能。
2.2 年龄对接驳方式选择的影响
19~30岁的出行者是常规公交站中的主要客流,占总人数的23.98%。18岁以下的出行者选择自行车的比例相对较低,主要原因是该年龄段出行者的安全意识尚需加强,而自行车的使用稳定性相对较差;19岁以上的出行者选择自行车的比例逐渐减少,说明年轻人对于近年新兴的共享单车使用起来更得心应手。
2.3 职业对接驳方式选择的影响
一般职员和工人占据了常规公交站三分之一以上的客流组成。学生对自行车的选择比例相对较高,这与上文年轻人对自行车的选择倾向相符;考虑个体经营者出行的随机性更大,所以,选择消费不高且较为舒适的常规公交接驳的比例较高,为29.55%;教育、科研工作者更倾向选择步行接驳常规公交,主要是日常锻炼身体的时间不多,而选择步行刚好能有效达到锻炼身体的作用。
2.4 收入对接驳方式选择的影响
月收入在1 501~3 000元的出行者占总人数的39.14%,是常规公交站中的主要客流。随着出行者收入的不断增多,步行被选的比例不断降低,而常规公交被选的比例也得到显著提升,收入较少的出行者,在接驳方式选择上会考虑接驳费用问题,因此,选择步行的出行者更多。
2.5 出行目的对接驳方式选择的影响
通勤出行者的人数明显高于非通勤出行者,占调查总人数的61.89%。非通勤出行者选择常规公交和自行车的比例较高,该部分客流对出行时间的安排更为随意,且对出行的舒适性和体验性要求更高,因此,选择自行车和常规公交的出行者更多。
2.6 出行距离对接驳方式选择的影响
本文所指的出行距离是指出发地至常规公交站的距离(或是常规公交站至目的地的距离),有87.09%的出行者出行距离在2 km以内,且随着出行距离的不断增长,选择步行接驳的比例逐渐降低,而选择常规公交和自行车的比例显著增高。
3 接驳方式分担率预测模型
在已有的交通方式分担率分析方法中,多项Logistics回归和Bayes判别分析两种方法应用较为广泛,不仅能对调查数据进行直接利用,还具备较高的预测准确率,并且可借助多类软件来实现相关计算,操作较为简便。因此,本节在上文对接驳方式选择影响因素分析的基础上,分别采用多项logistics回归分析和Bayes判别分析两种方法建立常规公交接驳方式分担率预测模型,并对两种模型的预测结果进行对比分析。
3.1 基于多项logistics回归分析的接驳方式分担率预测模型
3.1.1 模型构建
在预测时以最后一个类别(即第I个类别)自行车为参考项,并假设乘客均会依据自身需求,对接驳方式做出最为理性的选择,可分别得到步行、常规公交相对于自行车的相对效用,计算式为[8]
(1)
式中:i=1,2,3分别表示步行、常规公交和自行车;Vi为第i类接驳方式相对于自行车的效用;αi为第i类接驳方式的常数项;xn为第n个影响因素;βin为第i类接驳方式对应的变量xn的系数;Pi为选择第i类接驳方式的概率。
通过式(1)可依次求得各接驳方式对于自行车的相对效用,又因各接驳方式分担率之和为1,可据此分别计算出选择各接驳方式的概率,计算式为[9-10]
(2)
所得概率最大的接驳方式即为乘客选择的接驳方式,通过统计得到选择各接驳方式的人数,将人数与样本总量相比即可求出各接驳方式的分担率,计算式为
(3)
以哈尔滨市常规公交站为例,根据上文对常规公交接驳方式选择影响因素的分析,将出行者性别、年龄、职业、收入、出行目的和出行距离定为特性变量进行接驳方式分担率预测建模。为避免由于单个变量中某一类别样本数据量过少而给回归结果带来误差,在不影响结果的基础上,将年龄、职业和出行距离3个影响因素中的变量进行适当合并。选取的特性变量及定义如表3所示。
表3 模型中特性变量的数学定义
3.1.2 模型标定与分析
选择SPSS软件进行极大似然估计,其输出结果能更好地展示各因素与选择结果之间的联系。并选取“自行车”这一接驳方式作为参照类别进行多项Logistics回归,得到的模型参数标定结果如表4所示。
表4 参数估算值
续表4
注:a.参考类别为自行车;b.此参数冗余,因此设置为零
表4中第2列的B值代表不同分类下的自变量在模型中的系数,正负号表示与接驳方式选择呈正相关还是负相关。当显著性大于0.05时,对应的变量对选择结果影响不大,可以剔除。
在将影响较小的变量剔除后,可以分别得到步行、常规公交相对于自行车选择概率的自然对数模型:
步行——自行车
1.811x31-1.046x33+1.256x41+0.984x42+
0.751x51-1.289x6.
(4)
常规公交——自行车
1.353x21-2.117x22-0.256x23-
0.146x24-1.746x31-0.926x32-1.386x33+
1.185x41+0.808x42+0.664x43+0.840x51+
1.130x6.
(5)
由式(2)、式(3)即可求得各接驳方式分担率。
3.1.3 模型检验
模型参数标定后,从模型拟合信息、拟合优度指标和似然比检验三方面检验模型是否可靠。
1)模型拟合信息如表5所示,可以看出概率值
远小于0.05,说明构建的模型通过检验,具有统计学意义。
表5 模型拟合信息
2)选取Nagelkerke和McFadden两个指标对模型的拟合优度进行判别。Nagelkerke取值介于0~1之间,其值越大表示模型拟合优度越高,反之则越差,本文的Nagelkerke统计量为0.671,说明拟合度比较高。McFadden被称为伪R方,在实际应用中,通常认为McFadden的决定系数在0.3~0.5范围内拟合度比较理想[11],本文的决定系数为0.455,说明模型的拟合效果较佳。
3.1.4 预测结果
3种接驳方式平均准确率为78.9%,认为模型的命中率达到预期值,选取的影响因素对接驳方式选择有显著影响,输出结果可被采纳。其中自行车的准确率较低,仅为57.6%,主要由于自行车样本数据较少而造成的影响,对模型的整体效果无重大影响,预测结果如表6所示。
表6 预测结果
3.2 基于Bayes判别分析的接驳方式分担率预测模型
3.2.1 模型构建3.2.1.1 先验概率
随机抽取一个样本属于总体Gi(1,2,…,n)的概率即为先验概率P(Gi),通常可以通过计算直接求得先验概率Q,也可以依据熵最大的原则,令各类别的先验概率相等。
3.2.1.2 样本似然
在总体Gi(1,2,…,n)中抽到样本X的概率,记为p(X|Gi)。当判别变量服从多元正态分布,且各类别的协方差矩阵相等,则在总体Gi中抽到样本观测X的概率为
(6)
式中:|Σ|为协差阵的行列式值;μi为总体Gi的均值。
(7)
3.2.1.3 计算X属于总体Gi的概率
根据Bayes公式定义,用样本似然调整先验概率,则有
(8)
(9)
根据n个概率值的大小进行判别决策,随机样本X属于概率最大的类别。
3.2.2 模型标定
结合哈尔滨市常规公交站中获取的调查数据,借助SPSS软件提供的Bayes判别法建立常规公交接驳方式分担率预测模型,分类函数系数如表7所示。
表7 分类函数系数
由表8可以得到标定后的Bayes判别函数为
Y步行=-17.296+5.977x1+1.893x2+
1.382x3+0.929x4+2.249x5+5.998x6.
(10)
Y常规公交=-26.974+6.284x1+2.432x2+
1.951x3+0.629x4+1.492x5+9.067x6.
(11)
Y自行车=-24.409+5.678x1+1.492x2+
1.835x3+1.376x4+2.867x5+8.333x6.
(12)
3.2.3 预测结果
将调查数据回带至Bayes判别分析模型中,得到三种接驳方式平均准确率为75.8%,预测精度较高。选取的影响因素对接驳方式的选择有显著影响,输出结果可被采纳,预测结果如表8所示。
表8 分担率预测结果
3.3 结果对比分析
从上文可以看出,多项Logistics回归和Bayes判别分析都可用来做常规公交接驳方式分担率的预测,但两者的理论基础却不尽相同。多项Logistics回归是利用极大似然估计方法对模型参数进行估计,根据回归函数值进行预测,并能够对影响因素进行解释[14];而Bayes判别分析是根据观测值与各不同类别之间距离差异进行判别预测,无法对影响因素进行解释[15]。
从多项Logistics回归和Bayes判别分析两种模型的预测结果可以看出,两种模型预测总体正确率相差不大,且均在70%以上,说明建立的这两种模型具有比较强的泛化能力,预测结果如表9所示。在步行和自行车这两种接驳方式的预测上,多项Logistics回归模型预测的相对误差更低,分别为0.99%和6.06%,而Bayes判别分析对常规公交接驳方式预测的相对误差更低,为3.39%。结合两种模型在分担率预测中表现出的特有优势,在实际应用中,可酌情考虑针对不同接驳方式的分担率采用不同模型进行预测。在研究步行和自行车接驳分担率时,建议采用多项Logistics回归模型进行预测,而在研究常规公交接驳分担率时,建议采用Bayes判别分析模型进行预测,接驳方式分担率预测结果对比如图1所示。
表9 接驳方式分担率预测结果对比 %
图1 两种模型的分担率预测结果相对误差对比
4 结 论
1)男性比女性更倾向于选择自行车,而女性在常规公交的选择上高于男性;年龄在18岁以上的出行者,随着年龄的增大,选择自行车的比例也随之减少;学生与其他职业的出行者相比选择自行车的比例最大,而教育、科研工作者则在步行的选择上高于其他职业的出行者;出行者的收入与选择步行的比例呈负相关,与常规公交和自行车的选择呈正相关;通勤出行者在步行的选择上高于非通勤出行者,而在常规公交和自行车的选择上低于非通勤出行者;随着出行距离的增长,步行的选择比例显著降低,而常规公交的选择比例有明显的提升。
2)分别构建了基于多项Logistics回归分析和Bayes判别分析的常规公交接驳方式分担率预测模型,两种模型的预测总体正确率分别为78.9%和75.8%。通过对各类接驳方式分担率预测相对误差进行计算,发现多项Logistics回归对步行和自行车的分担率预测更为准确,而Bayes判别分析更适用于常规公交分担率的预测。
3)选取影响因素时考虑了出行者的个人属性和出行属性,并利用哈尔滨市的调查数据进行建模分析,在后续的研究中还需要补充考虑接驳环境等其他方面的影响因素,并对不同地区、不同城市的研究进行对比,进一步增强模型在实际应用中的可靠性。