江苏省过江特征与交通量分析
——基于多源数据融合技术
2020-12-29裴剑平
周 涛,裴剑平,唐 强
(1.中设设计集团股份有限公司,江苏 南京 210014 ;2.苏州大学 轨道交通学院,江苏 苏州 215131)
0 前 言
交通调查是进行交通规划和交通预测的基础,江苏省规划2018~2020年间新建9座过江通道,然而自2007年开展“江苏省主要公路机动车OD调查”以来,近10年全省性交通调查数据未跟新,因此,开展了本次全省过江OD调查。随着交通和信息化的快速发展,本研究结合大数据技术,充分利用行业数据、手机数据和微信问卷进行OD调查,并结合调查数据,采用大数据手段对数据进行聚类分析,形成以出行OD对为基础的出行链,分析各种出行属性的关联性。
1 全省过江调查与多源数据融合
1.1 基于多源数据的调查技术
本次结合江苏省的实际情况,调查主要采用高速公路联网数据、汽渡票根数据、行业统计数据、调查问卷数据和电信手机信令等5种数据。5种不同类型的数据均从特定的角度反映了真实的过江特征,本次调查需对获得的多源异构数据进行整合,形成具有法定效用的出行特征参数,供规划建设单位使用。本次调查综合各种调查方法的优势,采用取长补短,结合实际情况结合,针对全省23处过江调查采取不同调查方法。8处过江大桥(全部收费)分别指南京长江第二大桥、南京长江第三大桥、南京长江第四大桥、润扬大桥、泰州大桥、江阴大桥、苏通大桥和崇启大桥,采用高速公路联网收费数据进行调查;13处汽渡(全部收费)分别指板桥汽渡、镇扬汽渡等汽渡,采用票根数据进行调查;2处隧道分别为扬子江隧道和南京长江隧道(全部免费),采用隧道监控数据。
1.2 多源数据融合技术
多源数据融合主要分为三类:数据层融合、特征层融合和决策层融合。本次研究主要在特征层和决策层进行融合,采用集中式分布体系,通过对比分析不同数据源的出行特征、OD结果进行融合扩样,数据融合技术路线如图1所示。
本次获得的交通行业数据较全,基本满足过江OD出行分析及主要的出行频次、出行时间、载重等参数分析,因此,本次数据融合采用对比扩样法,以交通行业数据为主,以微信调查数据和手机信令数据为扩样对象,以每个过江通道的OD对小区为扩充对象,按照不同OD小区对交通量的差值进行出行特征扩样,并形成完整的出行特征表(包含OD出行对)。
多源数据处理首先要对数据进行清洗,包含无效数据剔除、数据自校核和数据对比校核;其次数据融合包含数据的融合和扩样。本次融合与扩样均以各通道的区县OD对为基础,首先,将客运单位统一归并到人,货运单位统一归并到t,完成单位归一化处理;其次,依据各通道各区县OD对的比例,对非全样本数据(微信问卷数据和手机信令数据)进行扩样,对应的其他出行特征相应进行扩样;然后,以各通道区县OD对为唯一标示码,用Python语句的Join功能将不同数据源进行连接,将问卷数据中出行目的、载货货种、载客人数、出发时间等信息链接到OD数据对后;最后对数据按照通道、和全省三各维度进行数据合并。最后,根据融合后的数据进行出行特征分析和可视化展示。
图1 多源数据融合体系框架图
2 全省过江出行特征
2.1 出行属性表与出行特征画像
为了深入分析过江出行规律,更好地建立过江出行模型,本次在完整的出行属性表之后,加入了时间、距离和费用参数。本次通过Python语句,调用高德地图的API接口,按照Driving模式,最短时间模式提取任何两个区县OD对之间的出行时间、距离和费用;并且,通过各区县的统计局统计各自的经济GDP数据,并将二者GDP链接到OD对属性表后面,建立了OD交通量、出行特征、时间费用以及经济参数一一对应的属性表,该属性表将为建立过江出行模型提供详实的数据基础。
经过OD数据对进行融合扩样后,将得到客货完整的出行属性表如表1所示。
表1 长江二桥客运出行属性表(整理后)
相比于以往的交通调查,本次调查不仅获得了真实完整的OD出行矩阵,并获得了完整的出行特征,并且建立了OD对与出行特征一一对应的关系;同时,加入的时间、距离和经济参数更加丰富了调查结果,理解任意两个OD对间过江量具有重要的意义。图2为出行特征画像。
图2 出行特征画像
2.2 全省过江出行主要特征
根据调查,获得全省过江量约84.6万pcu/d,其中客车占63.3%,货车占36.7%;全省8座大桥机动车过江标准车约为54.5 pcu/d,约占总量的64.5%;两处南京隧道过江机动车当量数约为21.1万/d,约占总量的25.0%,其余13处汽渡过江量约9万pcu/d,占比10.5%。在桥梁过江中,苏通大桥通过车辆约13.0万pcu/d,江阴大桥约9.9万pcu/d,南京长江二桥约9.4万pcu/d,此三座大桥拥堵已成为常态;节假日中,润扬大桥、长江三桥也加入了拥堵行列。跨江大桥主要解决长江南北城市间区域出行,而地处南京两座隧道解决江北新区与南京主城区之间通勤出行。融合分析手机信令数据和隧道流量监控数据,发现江北新区与主城区(江苏省南京市秦淮区、建邺区、鼓楼区等) 、江宁区之间流量占比超过81%。
从板块来看,全省区域过江出行形成了两头重中间轻的空间格局,南京和(沪)苏通过江出行占比超过50%,镇扬和无锡过江占比较低,常州过江出行成为洼地。从OD出行结构来看,一带两轴的过江通道特征明显,沿江两岸区县之间过江出行旺盛,占比超过54%,其次表现为沿我省中部通道和沿海通道沿线分布,通道特征与全省客流走廊基本一致。
从区域客运来看,呈现沿江城市连绵化发展趋势,省内客运出行约占81%,省内货运出行约占73%, 全省过江出行,以省内为主。省内出行占70.9%(隧道占全省25%),内外交通量(一端在省内,一端在省外)占23.9%,过境交通量出行(两端均占省外)只占5.2%。从对外出行结构来看,安徽和上海与我省联系密切,内外出行占比超过90%,说明我省是沿江大通道上核心省份,东西向交流十分密切;山东和浙江与我省联系较强,内外出行占比约占71%,过境交通约占29%,说明我省是沿海大通道上重要省份,贯通南北。
过江隧道高峰小时位于早7∶00—8∶00,高峰小时系数约为8.8%,大桥客运高峰小时系数约为9%;货运出行无明显高峰特征。受益于南京大力建设江北新区,拥江发展,南京市通勤高频次过江出行远高于全省水平。全省来看,区域出行以公务出差为主,但各个区段又各有特色。全省客车平均载客率为3.5人/辆,其中南京区段最高为4.2人/辆,苏通区段最低为2.6人/辆。全省货种运输中,农副产品、食品比例最高,达到16.5%,其次为金属及制品,其他货种占比较均匀。全省过江平均载重24.5 t/辆(含车辆自重),南京最高,为26.7 t/辆,锡常泰区段最低,为22.1 t/辆。
2.3 不同出行特征的关联性
采用大数据技术对各属性进行相关性分析,得到各相关性结论如下所示:①江苏过江出行在通道选择时,偏好选择出行时间短的过江通道;而且倾向同一通道往返;②客运交通量、载客人数与经济势差之间有明显的正比关系,而且两城市间经济差越大,二地间客流量越大;③出行时间越短,其交通占比越大,出行频次也越高,上班、上学等通勤出行特征更明显;数据显示,50%以上的过江出行的出行时间均小于1h,江苏省过江出行高频次特征明显;④货运量运输对出行费用更加敏感,客运出行对出行时间更加敏感;⑤通勤出行越明显,载客率越高;运输距离越近,载客率越高;商务出行和个人出行载客率较低;⑥城市的产业分布与货种密切相关,南京区段的运输设备、机械、电子通讯、石油、矿建等占比较高,镇扬区段各产业在全省占比较低,锡常泰区段的金属制品、物流快递占比较高,苏通区段的纺织原料、物流、农副产品、家具等占比较高。
图3为利用过江隧道及全省过江出行期望线图。
(a)两隧道总OD图
(b)板块热力图
(c)江苏省中区总量OD图
3 江苏过江交通量模拟
3.1 过江交通量影响因素
按照区县间OD对的属性表,对过江交通量进行模拟分析。数据显示,客运交通量主要与出行目的、出行频次、时间、费用、两地的经济相关以及过江通道数量有关;而货运交通量主要与两地经济、货种、出行时间、费用、过江通道数量以及货运政策相关。影响过江出行人数的因子主要有:起终点出行时间、出行距离、经济、人口、费用、出行目的等。对全省数万个OD对样本进行综合分析,过江人数与出行目的的相关显著性sig为0.029,与时间相关性最高,而距离、时间和费用三者自相关系数大于0.98,与人口与经济这两个因素的相关系数高达0.926。考虑影响因素之间的相关性后,发现可用出行目的、人口、经济以及出行时间模拟出行人数。
出行目的与人数相关,但相关不强;研究发现,分目的进行相关性分析之后,不同目的人数与人口、经济以及时间的相关性有所提升。本次研究选择按不同目的的出行人数W和人口P、经济G、时间T进行了4种组合,组合1为人口、经济和时间的线性组合;其他参照引力模型,分别建立3种组合,组合2为:W2=P起×E起/T2,组合3为W3E=E起×E/T2,
组合4为W4=E起×E中×P起×P/T4。其中P起代表起点人口,P终代表终点人口,
式中,E起为起点经济,E终为终点经济,Wi为第i种组合。
根据分析,采用引力模型较线性模型能更好地反映过江人数;而在引力模型的三种组合中,组合2(起点人口×终点人口)/时间2相关性最高,相关系数为0.098,sig小于0.01;本次研究选择组合2的方式进行数据分析。
3.2 过江交通量
通过区分出行目的进行人数分析,整体相关性明显提高,本次研究选择通勤出行、公务出差和休闲旅游三种出行目的分别进行出行人数模拟,得到出行各出行目的的方程如下。
上班上学:Y=3872.298×X+150.512,t检验变量之间显著性sig=0.004
休闲旅游:Y=46.666×X+301.427,其中t检验变量间sig=0.001
公务出差:Y=684.616×X+238.63,其中t检验变量间sig=0.0001
其中:W2=P起*E起/T2
以上结果说明自变量可以有效预测因变量,回归模型显著,得到的回归方程有效。
通过过江人数分析发现,过江人数与起点城市相关性最大,与起点城市的经济、人口因子呈正相关,与时间呈负相关,整体呈现以起点城市为核心的圈层结构。从不同出行目的来看,区县间基础过江人数约200~300人;城市人口与经济的发展,通勤出行的人数增长最快,其次是休闲旅游,区域公务出差人数增长最慢。
4 结 论
本次基于多源数据融合调查方法成功应用于区域OD调查实践中,按照交通特征层融合制定了详细的融合扩样规则,以区县OD对为标识码的出行属性表更加科学、高效,便于存入数据库中;加入出行时间、经济和费用等参数后,方便利用机器学习深入分析各出行特征与交通量的关系,通过区分出行目的进行过江人数拟合,得到的模拟方程更准确。数据表明,过江出行主要和起点城市相关,未来随着城市的发展,以通勤出行为目的的交通出行会快速增长,而区域增长相对较小。
[ID:010561]