考虑个体异质性的汽车分时租赁选择行为
2022-08-25侯宗廷吴海涛
杨 飞 ,侯宗廷 ,王 亮 ,吴海涛
(1.西南交通大学交通运输与物流学院,四川 成都 611756;2.中国城市规划设计研究院西部分院,重庆 401121)
异质性最先在遗传学领域被提出,表示遗传物质存在的差异性会导致后代个体在遗传性状的差异.在交通领域,体异质性理论表述了个体因先天条件或后天环境的差异,个体在外部特性、认知水平、感知态度以及价值观上表现各异,因此,不同出行者之间存在异质性,导致个体面对同一选择情景表现出不同的偏好,亦会面对同一影响因素时表现出敏感程度的差异.相关研究表明:影响出行者出行选择行为的异质性通常来自于自身,包括可观测的异质性和不可观测的异质性,前者包括出行者性别、收入水平以及小汽车拥有情况等个体社会经济属性,后者主要针对出行者的出行偏好、主观感受以及社会认知等;在出行选择行为研究中是否考虑个体异质性会直接影响分析结果,异质性会通过出行者对交通方式选择的偏好表征出来,从而更好地解释不同群体出行方式的选择偏好,提升模型的拟合优度和解释能力[1-2].
近年来运用在各个领域的考虑个体异质性的模型有很多,如混合logit模型、潜在类别条件logit模型、潜在类别随机参数logit模型以及Hazard模型等[3-11].混合logit模型通过将出行属性参数设置为随机参数,依靠随机参数标准偏差探究随机偏好差异,能够在已知的实际选择结果基础上开展对个体级别的偏好估计;潜在类别logit模型通过最佳分类准则将全体样本划分为若干个潜在分类子群体,每个类别群体的参数估计值不同,通过对比不同类别群体之间参数估计值可以分析出不同类别群体间偏好;Hazard模型在进行异质性分析时,考虑时间因素对个体异质性的影响,个体异质性会跟随时间的动态变化,其优势在于能够对不可观测异质性进行测量.这些模型都可以对个体异质性进行评估,但各模型的适用性未得到充分实证,可以通过不同选择行为问题以及样本进行具体分析,选择最适合的模型.
随着汽车共享与绿色出行相互融合发展,新能源汽车分时租赁逐渐成为一种新兴的出行模式.本文对新能源汽车分时租赁加入后的城市交通出行方式选择行为进行研究.为了更加深入地挖掘可观测的异质性对出行选择行为的影响,采用了混合logit模型以及潜在类别条件logit模型来测量个体异质性,既展现每个模型在个体异质性上的表现,也通过对比寻求拟合效果较优的模型,重点分析可观测的异质性所带来的影响,通过出行者个人属性与出行方式属性的交互影响,分析它们之间的偏好关系.
1 模型构建
首先,确定选择枝集合.基于目前城市出行中主要的交通出行方式,考虑与新能源汽车分时租赁存在竞争关系的出行方式作为备选项,确定选择枝集合为地铁、常规公交、出租车、私家车、新能源汽车分时租赁.其次,确定影响选择枝效用的属性,根据实际情况设置步行时间(包括找车)、候车时间、车内时间以及费用作为出行特征属性,同时出行者的性别、年龄、学历、收入和私家车拥有情况等社会经济属性也会影响个体的选择.
1.1 基于混合logit的选择模型
混合logit模型与传统logit不同,模型考虑了个体异质性,能够假设出行者对于出行方式存在偏好差异,模型更加符合实际情况.通过将出行方式属性参数设置为随机参数测量个体异质性,并能通过模型结果分析个体异质性对选择行为的影响.
在混合logit模型中,出行者n选择出行方式i的效用为
式中:Vni和 εni分别为出行者n选择出行方式i的效用确定项和效用随机项,分别为出行者n选择出行方式i的第k种出行相关属性和对应参数;K为出行相关属性的总数;Xni为能观测到的出行者n选择出行方式i的属性变量的完整向量, βn为对应的参数向量.
出行者n选择出行方式i的概率为
式中:Lni(·) 为多项logit模型中出行者n选择出行方式i的概率;f(βn|θ) 为 βn在条件 θ 下的随机参数概率密度函数; θ 为分布函数的参数.
本文将步行时间、候车时间、车内时间及费用对应的参数设置为随机变量,并且服从对数正态分布,则在混合logit模型中,Vni可表示为
式中:Cni为出行者n选择出行方式i的固有常量;snij为出行者n选择出行方式i的第j种个人社会经济属性;J为个人社会经济属性的总数; βnik、 βnij为对应属性的系数.
1.2 基于潜在类别条件logit的选择模型
潜在类别条件logit模型能够科学合理地进行样本分类和建模分析,提高行为选择模型精度和解释能力[12-13].假设有N个出行者,出行选择情景有W种,每个情景中有I种出行方式,运用潜在类别条件logit模型,根据最佳分类原则将总体样本分为M个不同类别.若第n个出行者属于m(m=1,2,···,M) 类,第m类的出行者n选择第w(w=1,2,···,W) 个场景中的交通方式i的总效用为
式中:Vnwi,m、 εnwi,m和Onwi,m分别为第m类的出行者n选择第w个场景中的交通方式i的固定效用、随机效用和出行属性特征向量; ξm为第m类权重向量.
假设出行者n属于第m类选择第w场景中的交通方式i的概率为
2 问卷设计与调查
2.1 问卷设计
根据《2019年中国分时租赁行业研究报告》[14]显示,新能源汽车分时租赁出行距离多分布于10 ~20 km的中等距离出行,因此,本文确定以15 km的城市内中距离出行为基础进行问卷设计.本文结合成都市中心城区客运交通的实际状况,以及新能源汽车分时租赁市场占有率较高的EVCRRD与GOFUN两类品牌收费对各属性的水平值进行设置,属性水平如表1所示,其中,私家车的费用包括油费和停车费.本文选择正交设计来获得合适的属性组合.正交设计可以保证各属性的独立性,避免属性的多重线性问题,有效地提高模型结果的精度.本文利用正交设计,通过均衡搭配形成具有代表性和典型性的属性水平组合,最终生成16个选择情境组成一套问卷.同时问卷采集了受访者的个人社会经济属性.个人属性水平与编码设置如表2所示.
表1 选择枝属性水平Tab.1 Levels of alternative attributes
表2 个人属性水平及编码Tab.2 Levels of individual attribute and coding
2.2 调查开展与样本分析
本文在成都市开展问卷调查,共收集有效样本378份.对有效样本进行整理分析,结果如表3所示.有效样本中,男性占比46.0%,女性占比54.0%,基本符合人口调查比例.年龄分布占比最多的是31岁 ~35岁,总体集中在18岁~ 40岁,较为符合新能源汽车分时租赁使用偏向中青年群体的特征.受访者的收入主要集中在5 000 ~ 10 000元/月.调查样本的年龄、性别与收入分布与抽样计划基本一致.
表3 样本个人属性统计Tab.3 Statistical results for individual attribute of surveyed samples
3 结果分析
3.1 混合logit模型标定结果及分析
本文借助NLogit 4.0,利用极大似然模拟,采用Halton序列抽样,对混合logit模型进行标定,抽取总次数为500次时模型估计结果稳定,具体步骤为:
步骤1已知对应参数的联合概率密度函数分布形式,给定 θ 值,用Halton抽样法从密度函数中抽取一个随机向量,记为,r为抽取次数,第一次抽取,r=1.
步骤2利用式(3)计算本次抽样的概率值
步骤3重复步骤 1、2共R次,R= 500.计算的均值作为近似概率来给出模拟概率Pni,即
步骤4本文样本为378份,出行方式为5个,构造样本的似然函数G(βn) 为
式中:yni为0-1变量,当个体n选择方案为i时,yni为1,否则为0.
取式(8)的对数形式得到模拟极大似然算子为
可以证明式(9)是关于 βn的凸函数,因此令K(βn)对 βn的导数向量为0, 此时达到最大值,求得其极大似然估计值.
步骤5改变 θ 值,重复计算步骤1 ~ 4,直到模拟极大似然算子取得最大值.
标定结果如表4所示.通过P值检验各参数的显著性.标定结果中,性别参数符号为正表示女性,参数符号为负表示男性;年龄、学历以及收入参数符号为正分别表示年龄越大、学历以及收入水平越高;而私家车拥有参数符号为正表示未拥有私家车,参数符号为负表示拥有私家车.
由表4可以看出:
表4 混合logit模型参数标定结果Tab.4 Calibration results of mixed logit model
1) 公交、地铁、出租车和新能源汽车分时租赁4种选择枝的固定参数均显著,说明这4种方式未被观测到效用对其总效用各有影响.新能源汽车分时租赁和出租车固定常数均显著,但前者参数符号为正,后者参数符号为负,说明相比于私家车出行,新能源汽车分时租赁具有一定的优势能够让部分私家车出行转移到新能源汽车分时租赁,出租车相对于私家车优势不明显.
2) 年龄、收入和是否拥有小汽车3个参数均显著.其中,年龄参数符号为正,收入与是否拥有小汽车参数符号为负,表明年龄越大的出行者对地铁或者公交出行存在偏好,使用新能源汽车分时租赁的年轻群体更多,而收入较高的有车群体更愿意选择私家车出行.
3) 步行时间、候车时间、车内时间以及费用4个变量均显著且符号均为负,说明这4个变量值越高选择该交通方式的概率越低,符合实际情况.其中,步行时间参数值绝对值最大,说明步行时间是影响出行方式选择较为重要的因素.
混合logit模型输出的属性变量的标准差值均显著,说明不同个体具有不同于样本均值参数估计的个体异质性.为了分析个体异质性的可能来源,本文假设设置的随机参数异质性来源于个体社会经济属性的差异,通过使各随机参数与个体经济属性相互作用来确定.本文利用NLogit软件分析个人经济社会属性与选择方案属性之间相互作用,得到的交互效应结果如表5所示.首先,分析个体收入属性.“步行时间-收入”、“候车时间-收入”和“车内时间-收入”交互作用显著且呈正相关,说明收入越高的群体对步行时间、车内时间和候车时间增加更加敏感.同时,“费用-收入”交互作用结果显著,符号为正,说明收入越高的群体对出行费用增加表现不敏感;综上,在个体异质性上收入越高的群体相比于出行费用更加注重时间价值,尤其是通勤出行时注重交通方式两端接驳的便利性,因此,更加合理和密集的租赁站点能够吸引这部分人群使用新能源汽车分时租赁.同理分析个体私家车拥有属性.步行时间、候车时间与私家车拥有情况交互作用显著,呈负相关,说明无车群体对步行时间和候车时间的增加表现不敏感,符合无车群体出行时多选择地铁、公交等传统公共交通方式的事实.“费用-拥车”交互参数显著且正相关,说明无车群体对于费用增加表现比较敏感,更偏好于公共交通出行.新能源汽车分时租赁步行、候车时间比传统公共交通短,比私家车长,出行费用比传统公共交通高但比私家车便宜,更能吸引无车群体的使用.
表5 个体社会经济属性与出行方案属性交互分析Tab.5 Interaction analysis of individual socialdemographic attributes and travel mode statistics
3.2 潜在类别条件logit模型标定结果及分析
潜在类别条件logit模型进行出行方式选择行为分析的第一步是确定出行者的最佳分类数.最佳分类数的确定基于定量与定性的考虑,通过一致的赤池信息准则 (consistent Akaike information criterion,CAIC)和贝叶斯信息准则 (Bayesian information criterion,BIC)定量确定最佳的潜在类别数量,CAIC值和BIC值越小,模型拟合度越高.实际运用时通过设置一个最大的分类数量,然后利用潜在类别条件logit模型对每个分类数量下的样本进行回归,从而获取每个类别数量对应的CAIC和BIC,一般情况选取CAIC和BIC最小时的分类数作为最佳的潜在类别数量,当无法同时满足时,通常取CAIC最小值的分类数作为最佳分类数.CAIC 和BIC分别为
式中:D为样本最大对数似然值;h为拟合模型参数的总数量.
运用stata编程得到不同分类数的CAIC以及BIC, 结果如表6所示,表中,LLF为对数似然值.
表6 潜在类别条件logit模型分类结果Tab.6 Classification results of latent-class conditional logit model
由表6可知:当潜在类别的数目增多时,模型适配LLF绝对值也在下降,当分类数为3时,其CAIC和BIC均为最小值,说明最佳潜在类别数量为3,因此,将通勤选择模型的样本划分为3个类别.对样本进行潜在类别条件logit模型回归,结果如表7所示.
由表7可知:步行时间、候车时间、车内时间以及费用4个变量参数值符号均为负,与混合logit模型结果一致,但不同参数估计值在不同类别中显著性各异,说明不同类别的出行者在对出行方式选择的偏好程度上表现出了较强的异质性.具体分析如下:
表7 潜在类别条件logit模型回归结果Tab.7 Regression results of latent-class conditional logit model
1) 类别1群体中步行时间和费用参数显著,候车时间参数不显著,费用参数绝对值为3个类别中最大,说明类别1群体属于“费用敏感型”,能够接受较长的候车时间,但不太能接受费用的增加,这类群体更偏好于选择地铁或公交出行.
2) 类别2群体中步行时间与候车时间参数显著且绝对值较大,费用参数不显著,说明类别2群体属于“时间敏感型”.这类群体出行时对时间因素更加关注,而对费用敏感程度不高,更偏好于私家车或出租车出行.新能源汽车分时租赁也属于小汽车出行,通过提升车辆品质以及个性化服务能够提升其对类别2群体的吸引力.
3) 类别3群体中4参数均显著,参数绝对值都介于类别1和类别2之间,属于“出行平衡型”.这类出行者选择交通方式时会同时关注时间和费用因素,不会对某一因素特别敏感,希望在各个出行属性上寻求平衡,而新能源汽车分时租赁服务特性能较好满足这类群体出行需求.
将类别3作为参考基准,出行者特性对潜在类别的影响如表8所示.由表可知:固定常数在类别1中不显著,在类别2中显著且符号为负,说明未观测到的固定效用对类别2的出行方式选择有抑制作用,类别2的群体有向类别3转移的可能;性别和年龄在类别1中均不显著,在类别2中均显著,且性别参数符号为正,年龄参数符号为负,即在类别2中女性更加愿意选择类别2群体所偏爱的私家车或出租车,且类别2群体随着年龄的增加,越不容易成为“时间敏感型”,因此,类别2中,年龄越大的女性可能更容易被能够提供优质服务的新能源汽车分时租赁所吸引;学历在类别1中显著且符号为负,在类别2中不显著,说明在类别1中,学历越高越不容易成为“费用敏感型”;收入在类别1和类别2中均显著,但前者参数符号为负,后者为正,说明收入越高对时间越敏感.
表8 出行者特性对潜在类别的影响Tab.8 Influence of travelers’ characteristics on latent class
3.3 模型对比分析
通过计算得到混合logit模型和潜在类别条件logit模型的拟合优度和命中率如表9所示.两个模型的各参数检验效果较好,具有一定的解释力,都是考虑个体异质性的出行选择行为模型.由表可知:潜在类别条件logit模型的拟合优度比混合logit模型提高了0.04,潜在类别条件logit模型的拟合效果更好.潜在类别条件logit模型的命中率比混合logit模型的命中率高16.57%,说明潜在类别条件logit模型对全体样本进行分类标定,对预测不同偏好的群体的选择行为有一定的优势;潜在类别条件logit模型对出行者进行了类别区分,区分度为0.908 4,能较好地对全样本群体进行群体偏好性区分,通过最佳分类数将出行者划分为不同群体,并同时对每一类群体进行标定,分析参数标定结果可以明确不同种类的特征以及出行偏好.综上所述,相较于混合logit模型,潜在类别logit模型拟合效果更好,模型解释力更强,对预测不同偏好群体的新能源汽车分时租赁选择行为具有一定的优势.
表9 模型对比分析Tab.9 Model comparison analysis