基于人口迁徙大数据的城市对外交通客运方式优势出行距离研究
2020-02-28徐铖铖于维杰华雪东
项 昀,徐铖铖,于维杰,华雪东,王 炜
(1.江西师范大学城市建设学院,南昌330022;2.东南大学城市智能交通江苏省重点实验室,南京210096)
0 引 言
随着我国区域经济一体化进程加快,城市对外交通联系日益密切,建立协同运行、高效便捷的一体化现代城市对外综合交通运输体系已引起人们的广泛关注.公路、铁路、航空作为城市对外交通的主要客运方式,迫切需要从过去追求单方式效率向提高多方式整体效率转变.通过研究各客运方式的优势出行距离,能够更深入地揭示各客运方式的合理使用范围,可以为优化客运资源的合理配置,构建各方式优势互补,协同运行的对外综合交通系统提供理论基础.
国内外学者对客运方式的优势出行距离开展了相关研究.Arbués等[1-2]通过居民的城市对外出行行为调查,获取出行方式选择的影响因素,构建交通方式选择离散模型,认为出行距离对交通方式选择有重要影响;Scheiner等[3]统计分析了26年间不同出行距离下交通方式选择数据,提出不同的出行距离范围对应不同的交通方式选择结果,即使改变出行者是否拥有小汽车、出行者性别、出发城市规模等参数,不同交通方式分担率与出行距离范围之间的相关性仍呈现稳定规律;Cattaneo等[4]通过探究航空客运航线覆盖情况对大学招生情况的分析,发现大学所在地航空方式的连通度在一定程度上影响了该大学对远距离考生的吸引力,反映出飞机的优势出行距离是长距离;Muller等[5]认为影响出行者从选择低成本的交通方式更换到高成本的交通方式的主要因素是出行距离,即每种交通方式都有其效益最高的出行距离;范琪等[6]基于广义出行费用对城市内部交通客运方式优势出行距离进行研究,构建了不同交通方式优势出行距离的概率密度曲线.
以往研究探讨了出行距离对客运方式选择的影响,明确了不同客运方式存在其优势出行距离,但关于优势出行距离的研究集中在城市内部交通方式,鲜见对外客运方式优势出行距离的量化研究.一方面,由于城市对外交通出行是跨城市出行,对于个人而言通常属于低频次出行,因此,难以获取较为丰富的研究数据.现有研究数据大多源自某个城市群或交通走廊的问卷调查,采集从短距离至超长距离且样本相对均衡的数据集极为困难,数据不足以支撑各客运方式的优势出行距离的量化分析.另一方面,现有研究多是讨论单一客运方式的特征或两种客运方式竞合关系,定性得出3种方式的出行距离为短、中、长距离,未计算3种客运方式优势出行距离的具体数值.
在互联网飞速发展的时代,腾讯、百度、阿里等互联网公司能够基于定位服务技术分析人口流动轨迹,所获取的海量数据能够为区域交通联系、城市交通结构、出行方式选择等提供新型的数据基础.本文在明确城市对外客运方式优势出行距离内涵的基础上,依托我国主要城市的人口迁徙数据,建立各客运方式的分担率函数,构建优势出行距离模型,量化分析我国现阶段城市对外交通中不同客运方式的优势出行距离区间.
1 数据采集
本文数据源自腾讯位置大数据中的“人口迁徙”数据,数据采集的链接为:https://heat.qq.com/qianxi.php.该数据平台通过手机用户的定位信息映射人口流动轨迹,根据手机用户经过的位置(汽车站、火车站、机场、高速公路、铁路线路等)、迁徙距离、速度来确定人们出行的城市起讫点及乘坐的交通方式,从而获取城市间客运交通方式分担率数据.
本文采集2015—2018年中400 d的数据,每个季节均获取了90 d 以上的数据记录,且包含“十一”黄金周、春运等特殊时期的数据,最终获取100余万条数据记录,覆盖全国不同区域.数据类型包括发布日期、起点(出发城市)、讫点(目的地城市)、交通方式划分(公路、铁路、航空分担率).具体信息为:(1)采集了我国361 个城市与其他城市客运流量当日排在前10位的城市,即客运发送量前10和客运吸引量前10 的城市名称及发布日期.将出发城市用O表示,O=1,2,3,…,361;将目的地城市用D表示,D=1,2,3,…,362,即采集了362个不同的目的地城市.(2)上述起讫城市对每日的交通方式划分情况,即提供从城市O至城市D的公路、铁路、航空客运交通方式分担率数值,记为、和.
2 城市对外客运方式优势出行距离建模
2.1 客运方式优势出行距离定义
本文借鉴货运优势运距的含义[7]将客运方式的优势出行距离分为两类:绝对优势出行距离和相对优势出行距离.
(1)绝对优势出行距离.
在某一出行距离区间内,当某一客运方式分担率数值大于其他任意一种客运方式分担率数值,此时,这一出行距离区间可称为该种客运方式的绝对优势出行距离.
(2)相对优势出行距离.
某一客运方式在某一出行距离区间内的分担率平均值大于该种方式在同样距离长度的其他任意出行距离区间内的分担率平均值,此时,这一出行距离区间称为该种客运方式的相对优势出行距离.
2.2 城市对外客运方式绝对优势出行距离建模
根据客运方式绝对优势出行距离的含义,构建客运方式绝对优势出行距离模型为
式中:φi(x)、φj(x)分别表示当出行距离为xkm时,第i、j种客运方式分担率函数,i=1,2,3,j=1,2,3,1,2,3 分别代表公路、铁路和航空;c,d均表示出行距离(km);[α,β] 是客运方式分担率模型所对应的出行距离区间.求解式(1)中的c,d值,即第i种客运方式的绝对优势出行距离区间为[c,d] .
2.3 城市对外客运方式相对优势出行距离建模
根据客运方式相对优势出行距离的定义,即可转化为当某一种客运方式基于距离的分担率函数与其对应的某一出行距离区间所围的面积数值大于该种客运方式分担率函数与同一距离长度下其他任意出行距离区间所围面积数值.此时,分别求解在一定面积下,公路、铁路、航空分担率曲线所对应的最短出行距离区间,即为公路、铁路、航空方式的客运相对优势出行距离.构建客运方式相对优势出行距离模型为
式中:k,l为出行距离(km);θ为相对优势出行距离区间的长度(km);ω为相对优势系数,该值大于1 2,取值可根据实际情况确定,本文取ω=1 3.求解式(2)中的k,l值,则第i种客运方式的相对优势出行距离区间为[k,l] .
3 实证研究
3.1 数据预处理
(1)匹配出行距离.
对所采集的100余万条数据匹配出行距离,即计算出发城市O至目的地城市D的出行距离.由于两城市之间的公路距离、铁路距离、航空距离均不同,为满足可比性,根据各个城市的经纬度计算各城市之间的距离L,即
(2)聚类并更新数据集.
鉴于数据集样本量很大,为减少噪声数据的影响,对数据进行聚类.经过多次不同粒度的聚类试算,发现当粒度为100 km时,公、铁、航3种方式的调整后拟合优度均趋于稳定状态,且数值均大于0.9.因此,将所有数据以出行距离每100 km 为粒度进行归类,分别计算各个类别的平均值作为该类别出行距离中位数的交通方式划分数值,再对各个样本的公路、铁路、航空分担率数值进行规一化处理,由此获得新的数据集
3.2 基于出行距离的城市对外客运方式分担率建模
(1)公路客运分担率模型.
(2)铁路客运分担率模型.
(3)航空客运分担率模型.
3.3 计算城市对外客运方式绝对优势出行距离
基于城市对外客运方式分担率模型绘制不同客运方式分担率曲线,并将公路、铁路客运方式分担率模型曲线的交点设为x1,将铁路客运与航空客运方式分担率模型曲线的交点设为x2,如图1所示.
图1 不同客运方式交通分担率曲线Fig.1 Mode share curves of different passenger transport modes
由式(1)及图1可知,当出行距离区间为[8,3000]km时,有
因此,公路、铁路和航空的客运方式绝对优势出行距离分别为[8,x1] km,[x1,x2] km和[x2,3 000] km.
求解交点x1和x2的值,可获取城市对外客运方式的绝对优势出行距离.分别求解式(4)和式(5)构成的方程组I,式(5)和式(6)构成的方程组II,且满足x∈[8,3 000]km.
总之,当出行距离区间为8~3 000 km时,城市对外客运中公路、铁路、航空方式的绝对优势出行距离区间分别为[8,119]km,[119,1 594]km,[1 594,3 000]km.
3.4 计算城市对外客运方式绝对优势出行距离
各方式分担率曲线如图2所示,依据式(2)和图2分别构建各客运方式相对优势出行距离模型并求解.
(1)公路客运方式的相对优势出行距离.
如图2(a)所示,设有k,l,m,n这4 个未知点与φ1(x)所围区域的面积,求解k,l值.建立出行距离区间为[8,3 000]km 的公路客运方式相对优势出行距离模型为
求得,l=8 km,k=463.28 ≈463 km,即公路客运方式的相对优势出行距离在[8,463]km范围内,其相对优势出行距离区间范围达455 km.
(2)铁路客运方式的相对优势出行距离.
如图2(b)所示,设有k,l,m,n这4 个未知点与φ2(x)所围区域的面积,建立出行距离区间为[8,3 000] km 的铁路客运方式相对优势出行距离模型,并求解k,l值.
图2 各客运方式相对优势出行距离区间示意图Fig.2 Relative dominant trip distance range of intercity passenger transport modes
求得,l=344.696 ≈345 km,k=1 043.695 ≈1 044 km,即铁路客运方式的相对优势出行距离区间是[345,1 044]km,其相对优势出行距离区间范围达699 km.
(3)航空客运方式的相对优势出行距离.
同理,如图2(c)所示,设有k,l,m,n这4 个未知点与φ3(x)所围区域的面积,建立航空客运方式的相对优势出行距离模型,再求解k,l值.
求得,l=2 476.50 ≈2 477 km,k=3 000 km,即航空客运方式的相对优势出行距离在[2 477,3 000]km 范围内,其相对优势出行距离区间范围达523 km.
总之,当出行距离区间为[8,3 000] km 时,城市对外交通中,公路、铁路、航空客运方式的相对优势出行距离分别为[8,463]km,[345,1 044]km,[2 477,3 000]km.
3.5 不同地域类别的城市对外客运方式优势出行距离
不同的时间维度或空间维度将对城市对外客运方式的分担率产生影响,进而影响其优势出行距离,如各客运方式的优势及竞争态势会随着时间变化而产生一定变化.研究时空差异性对各客运方式优势出行距离的影响非常有意义,可以体现各方式的竞争态势,是深化研究的重要方向之一.但由于本文所采集的数据集时间跨度不够长,暂无法支持相应分析.下面从不同空间维度对客运方式优势出行距离进行分析.
按照地域的不同,对数据集中的全部城市归类为东部沿海地区、南部沿海地区、北部沿海地区、长江中游地区、大西北地区、东北地区、黄河中游地区和西南地区8 类.仍基于最小二乘法,采用Matlab软件对各地域内的城市对外客运方式分担率数据进行拟合,获取各方式分担率函数及曲线.再代入式(1)和式(2),分别获得各地域的对外客运方式优势出行距离区间,如表1所示.
3.6 结果分析
通过采用人口迁徒大数据建模分析,获取了在[8,3 000]km出行距离区间内公路、铁路、航空3种客运方式的优势出行距离数值.
公路客运方式的绝对优势出行距离区间、相对优势出行距离区间分别为[8,119]km,[8,463]km,表明公路客运方式在中短途出行距离优势显著,这是因为公路客运方式具有便捷、速度中等及出行成本较高等特征.铁路客运方式的绝对优势出行距离区间为[119,1 594]km,相对优势出行距离区间为[318,983]km,说明人们在中长途出行活动中倾向于选择铁路出行方式,这是由于铁路客运方式具有较低的出行成本、较快的速度及比较便捷的特征.航空客运方式的绝对优势、相对优势出行距离区间分别为[1 594,3 000]km,[2 477,3 000]km,其在长途、超长途有着明显的优势,这是因为航空客运具有速度快的优点,但其出行成本高,前往机场及候机时间较长,因而中短途选择航空方式的旅客较少,随着出行距离的增加,航空客运方式的优势逐步显现.此外,考虑地域差异性,进一步获取了各地域的对外交通方式优势出行距离区间,结果表明,各方式的优势出行距离区间仍与各方式特征相协调,不同地域之间的交通方式优势出行距离区间略有不同.
表1 不同地域的城市对外客运方式优势出行距离区间Table1 Dominant trip distance range of urban external passenger transport modes in different regions (km)
4 结 论
采用绝对优势出行距离与相对优势出行距离来描述与反映客运方式优势出行距离的内涵,构建绝对优势出行距离与相对优势出行距离模型,利用我国人口迁徒大数据开展实证研究,建立基于出行距离的城市对外客运方式分担率模型,再进行优势出行距离的模型分析与求解,最终获得我国现阶段公路、铁路、航空3 种城市对外客运方式的绝对优势出行距离与相对优势出行距离.研究成果可以为城市对外客运交通资源合理配置、综合交通一体化协同运行提供技术支持.