托运人在不同时空下的选择行为差异揭示
2020-02-28诸立超刘昭然
诸立超,刘昭然
(1.浙江财经大学工商管理学院,杭州310018;2.中国宏观经济研究院综合运输研究所北京100038)
0 引 言
我国货运业长期快速发展的同时,积累了诸多问题,特别是货运结构不合理.宏观层面的货运结构不合理,是微观层面托运人过多选择公路的集计体现.作为一种高能耗、高污染的运输组织方式,公路过多承担大批量、长距离货运任务,导致交通拥堵和环境污染严重.因此,2018年国务院及其办公厅发布《打赢蓝天保卫战三年行动计划》《推进运输结构调整三年行动计划(2018—2020年)》,将调整货运结构、优化资源配置上升为支撑我国经济社会可持续发展的战略性课题.优化货运结构,关键在于掌握需求侧托运人选择行为,并从供给侧提供符合需求的铁路和水路货运服务.
学者们已构建丰富多样的货运方式选择模型,研究托运人在不同货运情景中的偏好,并将模型用于时间价值估计和分担率预测.研究表明,受货运方式属性[1]、货物属性[2]和托运人属性[3]等影响,托运人选择行为表现出异质性.即便是最常被研究的时间和费用两个变量,对选择行为的影响也会随着空间和时间变化.美国马里兰州不同地区托运人的费用偏好差异巨大,某些地区托运人的选择行为甚至不受费用显著影响[4];对意大利罗马和西班牙桑坦德的城市货运而言,部分细分市场的托运人偏好存在一定相似性[5].此外,随着时间的推移,费用对西班牙托运人选择行为的影响从0.10 水平的不显著[6]变为显著[7];而加拿大安大略省和大多伦多地区的客运研究则表明,行为模型有效性在5年[8]至20年[9]间.通过梳理发现,使用相近地区或若干年前采集数据构建的货运模型,生成的参数先验值在大概率上不能准确描述当前特定地区的托运人选择行为,并会降低货运方式选择调查问卷设计的有效性[10];此类货运模型的实证应用,特别是成本收益分析,会导致政策制定者和货运服务供应商做出错误决策.
综上,既有货运研究缺乏从时空两个维度探索托运人选择行为变化,很难帮助政策制定者和货运服务供应商确定货运方式选择模型在不同时空维度的适用性,可能导致模型错误应用.在中国经济结构加快调整、货运转型升级背景下,有必要探索不同时空下的托运人选择行为差异及变化规律,明确货运行为模型在空间和时间上的适用范围,为后续的问卷有效设计和行为模型应用提供指导.
1 数据简介
中国是出口贸易大国,故本文聚焦从内陆城市至港口城市的出口集装箱内陆段运输链选择.建模数据采集于中国东部的蚌埠、常州、上饶和义乌4 个城市.从空间来看:蚌埠和常州离上海港更近,上饶和义乌离宁波港更近;4 个城市的出口集装箱均可通过公路或铁路运抵上海港及宁波港;蚌埠和常州紧邻长江,货物也可通过水路运抵上海港.从时间来看:常州、上饶和蚌埠的数据集分别于2010,2012,2014年采集,义乌数据分别于2009年和2015年两次采集,调查时间均为2~3 d,数据如表1所示.
问卷调查的货主和货代公司通过随机抽样确定,受访者为公司物流经理或熟悉出口集装箱内陆段运输的员工.基于对受访者一对一、面对面的调查,获取选择行为数据.在面对面调查过程中,调查者可及时解决受访者存在的问题,尽量确保所采数据能反映托运人实际的选择行为.就样本量而言,当数据集平均每个选项对应的样本量超过30时,才能得到可靠的参数估计值[11],本例符合这一最低要求,而后文参数估计的显著性则从后验角度证明了每个数据集样本量的足够性[12].本研究聚焦不同时空托运人选择行为差异,不涉及未来年分担率预测,故数据采集时间对研究结果无显著影响.此外,2009年义乌约10%的出口货物经上海港出口,2015年这一比例几乎降为0,故2015年问卷调查不再考虑经由上海港出口的运输路径.虽然货物属性和托运人属性也会影响托运人选择行为,但基于以下原因,本文建模仅考虑研究者公认的时间和费用因素:①为方便比较针对不同时空构建的模型,不同模型选取相同变量;②为尽量减小货物属性和托运人属性等因素的影响,所研究的4 个货运通道均位于东部,产业结构差异较小,所研究货物均为价值较高的集装箱;③在未考虑货物属性和托运人属性的模型中,这两类因素对托运人选择行为的影响仍可通过常数项体现,且不显著影响其他参数估计值.
表1 5 个数据集描述统计Table1 Descriptive statistics of five data sets
2 模型构建
2.1 模型简介
离散选择模型的基本思想是,托运人通过选择一条运输链而获取一定效用.为比较选择行为差异,不同时空下托运人n选择运输链i的效用函数Uni仅包含时间tni和费用cni,即
式中:Vni为仅能被研究者观察到的可观测效用;εni为捕捉到的未包含在Vni内的因素对效用的影响;i,j分别代表第i条,第j条运输链,r1,r2,w分别代表公路、铁路和水路运输链;βt,βc为待估计参数;Ci为常数项.托运人选择效用最高选项的概率为
可观测效用Vni一般被假定为属性的线性组合.联立式(1)和式(2),基于εni服从独立同分布的极值类I 分布假设,根据文献[13]推导得到多项Logit(Multinomial Logit,MNL)模型概率公式为
式中:J为货运通道运输链数量,如蚌埠J=3,上饶J=2.
MNL模型与混合Logit(Mixed Logit,ML)模型的最大差异在于随机偏好.前者将托运人偏好视为同质化,而后者将托运人偏好视为一个分布,能够处理托运人偏好异质性及同一托运人重复选择的潜在相关性问题[14].
式中:βnt和βnc分别代表个体n对时间t和费用c的偏好;βt和βc分别代表总体对时间和费用的偏好均值,σt和σc分别代表总体对时间和费用的偏好标准差;vnt和vnc分别代表个体n对时间和费用偏好异质性的随机数.因ML 模型概率为积分,概率计算和参数估计需通过蒙特卡罗模拟近似.
式中:为βnc的第r次抽样,r=1,…,R,R为抽样总数.
为进一步揭示托运人对时间和费用的风险态度,构建非线性效用函数[15]为
式中:α为待估计的风险参数.若α=0 ⇒c′=c,托运人为风险中立者;若α >0 ⇒c′<c,托运人感知费用低估真实费用,托运人为风险偏好者;若α <0 ⇒c′>c,意味着托运人将高估真实费用,为风险厌恶者.联立式(3)和式(6),得到非线性MNL(Nonlinear MNL,NMNL)模型概率为
2.2 估计结果
因3 个数据集由RP 和SP 数据组成,如表1所示,有必要使用巢式Logit 模型检查两类数据间的测度差异[16].结果表明,测度参数在0.10 水平上并不显著,可直接融合两类数据.针对每个数据集,构建线性和非线性效用的MNL和ML模型用于比较,最佳模型参数估计结果如表2所示.总体上,所有模型精度ρˉ2( )0 均大于0.35(达到0.2~0.4便可认为精度较高),说明仅考虑时间和费用的模型仍能对托运人选择行为做出良好解释.此外,所有时间和费用参数估计值在0.05 水平上显著,且正负符合预期.对大部分数据集而言,ML 模型解释能力最佳,而MNL 和NMNL 模型分别更适合2012 上饶和2014 蚌埠数据.此外,“我们习惯于蚌埠长时间、高费用的运输”“我们认为蚌埠的货运服务与其他城市并无太大差别”等主观观点,导致蚌埠托运人为风险偏好者,对这些属性变化不敏感.
3 行为差异
3.1 时间价值
时间价值(Value Of Time,VOT)是一种边际替代率,代表效用不变情况下,托运人为缩短单位时间而愿意多支付的费用,即
式中:V为VOT;Xcost和Xtime分别代表运输费用和时间;ΔXcost和ΔXtime分别代表运输费用增量和时间增量.根据配对样本t检验,不同城市拥有显著不同的货运VOT,即便是同一城市的不同年份数据.为确定VOT 影响因素,建立一个以VOT 为因变量,货运通道两端城市社会经济特征为自变量的向后多元回归方程,且所有变量采用对数形式,最佳模型为
式中:G代表人均GDP.回归模型表明,除货运方式时间和费用水平及托运人偏好外,货运通道VOT 也受起点城市社会经济特征影响,但与终点城市社会经济特征无显著关联.起点城市人均GDP 增长1%,托运人VOT 将降低1.135%.主要原因在于,东部城市拥有更强的产业基础和国际贸易,且更接近港口,货物运抵港口的时间更短.据此可合理推断,较短的运输链时间、更发达的经济,使托运人为进一步压缩时间而愿意支付的费用更低.因本例货运通道数量较少,未来需进一步检查VOT与其他变量的关系.
表2 不同货运通道最佳模型参数估计结果Table2 Estimation results for the best model of each freight corridor
3.2 弹 性
基于式(9)和表2的参数估计值,表3计算了选择概率相对于时间和费用的弹性.总体上,不同时空的托运人,对同一货运方式的时间和费用弹性存在很大差异.大部分情况下,因公路市场份额远高于铁路,导致铁路运输链时间和费用弹性大于公路,即公路概率增量相对减小,其时间和费用大部分缺乏弹性.
表3 不同货运通道最佳模型间的弹性比较Table3 Comparison of elasticity among the best models of different freight corridors
3.3 参数估计值
参数估计值在不同时空维度的可转移性指标分为非集计(托运人选择结果)和集计(市场分担率)指标,且前者更可靠.非集计可转移性度量指标包括可转移性检验统计量(Transferability Test Statistic,TTS)和转移指标(Transfer Index,TI)[17],即
式中:XTTS为可转移性检验统计量;XTI为转移指标;LA(βA)为使用货运通道A 参数估计值拟合货运通道A数据的似然值;LA(βB)为使用货运通道B参数估计值拟合货运通道A数据的似然值,A和B可以是同一个货运通道,但在时间维度上应不同;n为两个模型的变量数之差;为自由度为n、显著性水平为0.05 的卡方分布临界值;LA(C)为常数项模型似然值.
基于似然值,式(10)和式(11),表4计算了TTS和TI.TTS 越接近于0,TI 越接近于1(通常介于0~1),参数估计值的可转移性越高.所有TTS 均大于最大临界值12.59,仅有两个TI大于0,表明不同模型间参数估计值的不可转移性非常显著,即便是同一通道不同年份数据.此外,借助表4模型似然值和表1两个城市间距离的相关性分析,探究模型似然值变化趋势,如表5所示.结果表明,所有相关系数为负,即便它们在0.05水平上并不显著.这在一定程度上意味着,当使用货运通道A(由起点A1至终点A2)的参数估计值拟合货运通道B(由起点B1至终点B2)的数据时,两个起点城市(A1与B1)距离越短,模型间可转移的可能性越高.总体上,伴随时间的流逝,使用A参数估计值拟合B数据的不准确性将会减小,虽然这一变化趋势在统计上并不显著.
表4 使用货运通道A 估计值拟合B 数据的似然值、TTS 和TI 指标Table4 Likelihood,TTS and TI indicators of B data using estimators of freight corridor A
表5 模型似然值与两个城市间距离的相关性分析Table5 Correlation analysis between e model likelihood and distance between two cities
4 结 论
本文从VOT、弹性和参数估计值三方面出发,探究了不同时空的托运人选择行为差异.结果表明:不同空间的VOT 和弹性与年份并不存在显著相关性,说明不同空间维度的托运人选择行为存在显著差异;义乌2009年和2015年的参数估计值不可转移性,表明不同时间维度的托运人选择行为存在显著差异.上述结果进一步说明:即便是产业结构类似、地理区位相近的货运通道,由于货运服务水平差异等因素,也很难通过微调货运通道A参数以拟合货运通道B数据;同时,由于国内货运业的快速发展,托运人对货运服务偏好在短期内发生显著变化,缩短了货运方式选择模型适用年限,义乌实证表明,货运行为模型适用年限不超过6年.鉴于本研究有限的样本量,未来需采集更多不同时空的样本以论证所得结论.