APP下载

无车承运人平台线路定价模型研究

2022-10-26李佳骏王永忠王楷文张启凡万连成

关键词:无车总成本承运人

李佳骏,王永忠,王楷文,张启凡,万连成

(中国民用航空飞行学院 空中交通管理学院,四川 广汉 618307)

随我国无车承运行业的逐步兴起,承运线路的科学问价是众多无车承运人平台亟待解决的问题.无车承运人[1]是以承运人身份与托运人签订运输合同,自愿按合同承担承运人的责任与义务,通过无车承运人平台委托实际承运人完成运输任务的道路货运经营者.该平台具有网络效应明显、资源整合能力强、品牌效应广等特点,利用互联网手段和组织模式创新,有效促进货运市场的资源集约整合和行业规范发展,对于促进物流货运行业的转型升级和提质增效具有重要意义[2].国内的无车承运模式主要由货主、无车承运人平台和承运人组成.由货主通过平台发单,经平台信息匹配后由车主接单并进行实际的运输任务.

从无车承运人的视角来考虑,面向广大拥有运力资源的承运端司机.司机参考承运路线任务发布的价格并以此决定是否要承运此运输任务.为保证任务的承运,平台会采取动态定价的方式,若任务未被接单承运,将带来一定损失.如果在一段规定时间内,司机未有接单,则这条路线可以进行适度调价.每条线路任务最多允许发布3次价格,首次发布之后仍可进行两次刷新[3].快速成交和较低的承运成本是无承运人平台当前最关注的目标.

为快速成交和降低承运成本,首先应当解决无车承运人平台的定价问题.文中通过定量分析的方法,欲探索影响无车承运人平台进行运输线路定价的主要因素.利用数理统计的方式来分析这些问题,对这些因素进行相关性的分析并降维,确定影响定价的因素.

根据前期收集的数据,建立对成交货运路线历史交易数据中的定价进行评价的数学模型.对历史交易数据的定价进行评价,需要找出与定价最相关的指标,使用这些指标再利用评价算法来建立所需的评价模型.

建立有关路线定价的数学模型,探索出关于路线任务的总成本定价以及3次报价.给出调价策略,评价对线路任务所给出的定价.要给出定价需要对前期的数据进行拟合分析,得到定价与指标之间的相关性,基于拟合模型对数据指标进行拟合预测从而得到所需的3次报价及总成本.最终可以根据得到报价后的调价系数来给出调价策略,促进快速成交和降低承运成本.

1 定价因素的研究

1.1 数据的预处理

由于数据量非常庞大,为使得建立的模型更加准确的得出路线价格,需要对数据进行分析并通过相应的方法对其进行数据的预处理,这有利于后续模型的建立与求解.

通过对数据体的分析,将变量分为3类:文本说明变量,定量描述变量,事件类型变量.其中文本说明变量主要指数据的基本特征和完整情况,如任务ID、始发时间、出发省份等.定量描述变量主要描述数据的真实值,如路线价格、调价比例等.事件类型变量描述数据的类别,如业务类型、需求类型、是否续签等.

为更好的找出影响无车承运人平台进行货运线路定价的主要因素,首先对与定价无较强相关性的因素进行删除

在得到较为相关的变量之后对这些变量的含缺失值样本进行删除,从而得到预处理后的数据样本.

1.2 确定影响定价的主要因素

在结束数据的预处理之后需要对影响定价的主要因素进行筛选,对于数据进行降维的算法有很多,但因为变量中含有转为虚拟变量的事件类型变量,所以不能使用主成分分析、因子分析等来对定量变量进行降维算法处理,故选择逐步回归法对所有变量进行降维,并且主要考虑事件类型变量的选择,再用R聚类对定量变量进行降维,同时也可以验证定量变量选择的准确性.

1.2.1 逐步回归算法

逐步回归模型有3种操作方法[4].

1) 向前选择 首先模型中只有一个单独解释因变量变异最大的自变量,之后尝试将加入另一自变量,加入后整个模型所能解释的因变量变异是否显著增加这一过程反复迭代,最终达到没有其他自变量还能符合加入模型的条件.

2) 向后消除 把所有变量全部放入模型中,再把其中一个自变量剔除,由此来探寻整个模型解释因变量的变异是否产生了显著的变化,然后将其中解释量减少得最少的变量进行剔除;再由此过程进行不断迭代,一直要等到没有多余自变量再能符合剔除的条件即可.

3) 双向消除 对整个模型中的所有变量进行检验,剔除作用不显著的变量.目的在于尽量能够得到一个最优方案的变量组合结果.

再进行回归前对选择的变量进行描述性的统计,计算得到各变量之间的相关系数.斯皮尔曼相关系数并没有皮尔逊相关系数高,但皮尔逊系数要求数据的连续、正态性和线性相关性.为此本文还选取变量绘制了正态分布Q-Q图,如图1和图2所示.

图1 车辆长度与正态分布的Q-Q图

图2 线路总成本与正态分布的Q-Q图

由2幅Q-Q图上所描绘点并不近似于一条直线可以看出,存在变量不服从正态分布的问题.所以这里选择使用斯皮尔曼相关系数.

文中选用向前选择算法[5]剔除冗余变量后得到的32个剩余变量来建立模型并进行求解,得到显著性变量18个,模型汇总表和模型评价表如表1和表2所示.

表1 模型汇总

表2 模型评价

为检验剔除过后的变量是否还存在多重共线性的问题,对变量的膨胀因子进行求解得到Mean VIF>10 说明存在多重共线性问题,评价可能失真,此时需要对变量进行进一步的筛选.采用Rlasso算法来对变量进行筛选,Rlasso是一种严格的惩罚方法,它可以控制过度拟合.最终得到相关变量及系数如表3所示.

表3 最终变量

1.2.2 R型聚类算法及求解

R型聚类是一种聚类方法,一般用于对指标进行降维处理[6].通过编程建立模型[7]并将定量描述变量代入运行得到聚类树状图,如图3所示.

图3 聚类树状图

从图3可以看出指标总里程、线路总成本、线路指导价(总成本)具有较大的相关性,最先被聚类到一起.将指标分为4类,每一类指标以及最终确定的4个代表性指标如表4所示.

表4 各类别指标基本信息

从以上结果可得出,交易成功时长与其他指标存在区别,各为一类,其他类中各指标均有明显相关的联系.一般来说这几类数据都与最终的线路定价有相关性,这也说明本模型对于该问题具有较好的适应性.

2 基于专家打分-Topsis评价模型

要对已成交的货运线路历史交易数据中的定价进行评价,首先要选择合适的评价指标.因无车承运人在当前阶段较为关注的问题是如何快速成交并降低承运成本,结合表4中的代表性指标,如线路指导价、线路价格、交易成功时长、线路总成本等因素,对已经成交货运线路历史交易数据中的定价来进行评价.

专家打分法是一种定性描述定量化方法,它首先根据评价对象的具体要求选定若干个评价项目,在根据评价对象的具体要求选定若干评价指标[8].根据指标定出标准,聘请若干专家凭借自己的经验按此评价标准来给出各个项目的评价分值,并对其进行集结[9].其公式为:

(1)

其中W代表评价对象的总分值;n代表指标项数;wi代表第I项指标得分值.

1) 经专家打分法得到的各项权指标权重如表5所示.

表5 指标权重

3) 数据归一化处理,为了消除不同量纲对评价结果的影响,使用评价指标在同一个量纲体系下进行比较,需要对原始数据进行归一化处理.处理方法为:

i=1,2,…,160 008,j=1,2,3,4.

(2)

4) 确定最劣向量Z-和最优向量Z+,其中Z-为同一指标的最小归一化值,而为Z+同一评价指标的最大归一化值.

5) 计算各样本与理想解的加权欧式距离[10]及各历史订单与理想解之间的相对接近程度

(3)

(4)

6) 对得到的结果进行排序,得到专家打分—Topsis模型计算的点单ID得分排序.

3 定价预测模型

要给出所得数据的3次报价及总成本的定价,其实也就是结合前期求得数据中指标与定价之间的相关联系,将相关指标通过这种相关联系映射成3次的定价.为了方便之后对建立的模型进行评价,故选择线路成本、线路指导价、线路价格、交易时长为输出变量.

3.1 Levenberg-Marquardt-BP及求解

BP是一种为减小误差使网络的误差平方和最小而通过梯度下降的学习方式反向传播来不断调整网络的权值和阈值从而达到目标参数的多隐含层层前馈网络[11].高斯-牛顿法为避免发散可以调节下降步伐和方向[12].当发现网络训练梯度下降过快的时候,应当合理采用偏小的下降系数,从而使其更相似于高斯牛顿法,反之,当发现网络训练梯度下降过慢时,应选用偏大下降系数,使其更相似于梯度下降法.

通过Matlab神经网络工具箱设置参数并训练输出得到结果,其学习误差在迭代数64处达到最小.模型总拟合度达到 0.994 52,如图4和图5所示.

图4 学习误差下降曲线

图5 模型拟合度检验

3.2 Bayesian Regularization-BP及求解

贝叶斯决策理论是主观贝叶斯派归纳理论的重要组成部分.贝叶斯决策就是在不完全情报下,对部分未知的状态用主观概率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决策[13].该算法通常需要更多时间,但是对于困难,较小或嘈杂的数据集,可以得到很好的概括.训练根据自适应减重(正则化)停止.

通过Matlab神经网络工具箱设置参数并训练输出得到结果,其学习误差在迭代数216时达到最小,模型总拟合度达到 0.994 82,如图6和图7所示.

图6 学习误差下降曲线

图7 模型拟合度检验

3.3 Scaled Conjugate Gradient-BP及求解

共轭梯度法能够有效改善前馈神经网络的明显缺陷,例如局部震荡和收敛速度低.采用共轭梯度法会在共轭梯度方向进行修正权值的操作,并采用概率接受原则来对是否需要进行目标函数变化进行判断,共轭梯度法具有较快的全局收敛性[14].此算法需要较少的内存.当通用性停止改善时,训练会自动停止,验证样本的均方误差增加.

通过Matlab神经网络工具箱设置参数并训练输出得到结果,其学习误差在迭代数158时达到最小,模型总拟合度达到 0.993 55,如图8、图9所示.

图8 学习误差下降曲线

3.4 最优预测模型的选取及求解

为选取最优的预测模型,需要对上述3个模型的运行结果进行对比评价,如表6所示.

表6 模型评价

综合3个指标来看Levenberg-Marquardt是最优的模型,故使用它来对评价模型中的指导路线价格、路线价格、总成本以及交易时间来进行预测.其中指导价格对应第一次报价,路线价格对应第三次报价.由于前期数据未求出第二次报价,所以本文采用线性插值的方法来对第二次报价进行求解,调价策略由计算调价比例得到.

图9 模型拟合度检验

4 结语

随着我国无车承运行业的快速发展,各类商业模式迎来了百花齐放的时段.预计到达2020年年初的时候,在200多家的无车承运人试点当中,将会有45.6%是属于合同物流的业务,而大约66.4%将会从事与普货运输相关的领域,另外,其中的47.7%左右会选择从事传统物流与互联网转型这样的综合业务,除此之外还有47%是有关于互联网加物流的另一种综合业务,这类平台在货运行业的集约化程度已经可以看做十分健全有力了,在未来将整合社会零散运力大约135.1万辆,高效提升相关行业的集约程度,提高运转效率,但与之密切相关的承运线路科学合理定价问题却是大多数无车承运人平台急迫需要解决的.团队一直密切关注无车承运人平台科学定价问题,进行了积极研究,并依据文中所述的研究方法与结论,对无车承运人平台的科学定价提出以下看法与建议:

从所得出的相关系数表中可以看出,线路总成本是线路定价和线路指导价的最主要影响变量之一,其间满足强烈的正相关;而线路总成本又与总里程、车辆长度、车辆吨位有强烈的正相关关系;与运输等级与运输地区也有一定的相关关系.所以总里程较大、车辆长度与吨位较大时,线路的总成本就会较大,所以定价应该相对较高.

将已成交货运线路历史交易中的定价数据进行TOPSIS法建立了评价模型,并证实了基于TOPSIS评价模型而得到的评价效果能够适用于该平台的评价体系.

关于线路定价的数学模型,利用3种算法建立不同的BP神经网络模型,并利用现有的数据对3种模型的拟合效果做了对比,在考虑时间和拟合精度的情况下得到了最优的Levenberg-Marquardt-BP做为预测模型,为无车承运人平台的定价问题提供了参考.

猜你喜欢

无车总成本承运人
2020年中国棉花种植成本调查
数据驱动下的库存优化模型研究
空运单签署中的承运人识别
区块链技术在物流无车承运人平台中的应用研究
线性盈亏平衡分析在TBM隧洞工程中的应用
无车承运人问卷调查与结果统计
关于煤化工生产企业成本管控的思考
乘客因第三人侵权造成人身损害如何维权
无车承运人:模式全面开启
货运模式新变革——无车承运人