上海市第五次综合交通调查综合校核技术
2016-12-14陈必壮沈云樟董志国
陈必壮,沈云樟,董志国
(上海市城乡建设和交通发展研究院,上海200040)
上海市第五次综合交通调查综合校核技术
陈必壮,沈云樟,董志国
(上海市城乡建设和交通发展研究院,上海200040)
居民出行调查主要依赖人工实施完成,受到各种人为因素制约,容易导致调查结果在反映真实出行特征方面存在偏差。因此,需要进一步利用和分析综合交通调查和其他相关数据进行综合校核。以上海市第五次综合交通调查为例,提出人员出行特征和车辆出行特征综合校核的技术方法。利用交通行业相关统计指标、交通大数据、其他专项调查以及交通模型对出行特征指标进行比对校核。重点阐述人员、客车、货车出行特征校核的方法及步骤。最后指出,与以往调查校核相比,本次校核大量应用信息化数据,有效地将传统调查与信息化调查成果相融合。
综合交通调查;综合校核;出行特征;上海市
城市综合交通调查是分析城市交通现状问题的必要途径,为建立交通需求预测模型以及分析交通的供需平衡、交通供需关系的发展趋势等提供基础数据。近年来,随着上海市城市规模扩大,人口和小汽车总量快速增长,城市客货运输规模持续增加,交通供需矛盾日益突出。为及时掌握交通需求特征和变化趋势,支撑政府部门科学决策,2014年上海市开展了第五次综合交通调查。与前四次相比,本次调查共开展五大类24分项[1],参与的单位和人员最多,调查对象范围最广,获得的数据规模也是历次最多。然而,由于这些数据来源于不同部门,采用的调查方法和手段不尽相同,各类数据的指标含义和调查范围有所差异,导致数据之间不可避免地存在不统一甚至矛盾冲突。因此,有必要对各类调查数据进行综合性的整合分析和校核比较,形成一套统一的数据指标反映城市交通特征。
1 概述
1.1 概念提出
上海市第五次综合交通调查内容十分丰富,但核心仍是反映城市两大交通需求特征的人员出行调查和车辆出行调查。其中,车辆出行调查分为客车出行和货车出行调查。通过这两大类调查可以得到其他调查无法获得的个体出行特征数据,为交通研究和模型建立提供重要的数据支持。然而,由于上海市人口规模巨大、交通特征复杂,若仍以传统抽样调查形式开展、采用人工问询的方式获得调查数据,则会导致调查结果受到调查方案设计、调查样本选取、调查人员与被调查人员素质、调查实施过程以及调查技术手段等各种因素的影响,任何环节的疏漏均可能左右数据的准确性。为保证调查数据真实、有效,需要围绕这两类调查开发综合校核技术来保证数据质量。该技术是以出行调查扩样数据为基础,利用其他相关的交通管理统计数据、交通信息挖掘数据、辅助专项调查数据以及交通模型技术,对出行调查的关键指标进行综合比对和校核,使得出行调查数据在宏观层面反映城市特征、中微观层面达到交通建模精度要求的技术方法。
1.2 校核思路
综合校核技术的主要思路是通过多源数据对出行特征指标进行比对校核,具体包括:
1)利用交通行业相关统计指标。
交通行业统计指标是为满足交通运输管理需要,由交通行政管理部门或交通运输企事业单位进行统计的常态性指标。这些指标大部分是通过对基础数据全样本统计得到,能够真实反映指标定义范围内的交通运行特性,是校核出行特征的重要依据。例如,轨道交通、公共汽车等客运量统计指标与对应交通方式的出行量调查指标之间存在必然联系,可进行换乘系数、接驳方式等关联参数的合理性判别;同理可对社会车辆数统计指标与相应交通方式出行量调查指标之间关联参数(出车率、日均出行次数和载客人次等)进行合理性分析。但是,在使用该校核方法时,应注意交通行业统计指标与交通调查对应的人口范围是否一致,若存在差异需采用一定的技术手段进行处理。例如,公共交通客运量统计指标的对应人口是城市总人口,而许多城市的居民出行调查覆盖人口往往是常住人口。
2)利用交通大数据。
交通大数据种类越来越多,规模越来越大,已广泛应用于交通各个领域,并成为出行特征校核的重要依据。例如,手机用户穿越交通核查线的信息可与出行的时空分布特征调查数据进行比对;公交一卡通的刷卡信息可与公共交通出行的时空分布特征调查数据进行比对。但是,在使用该校核方法时,除须注意大数据与调查数据的对应人口是否一致,还须注意大数据是否存在样本偏差和数据异常等问题。
3)利用其他专项调查数据。
由于受到一些调查条件的约束,将调查数据按照出行特征指标统计要求进行分组之后,部分组的调查数据可能无法符合该指标对应的人口实际特征,导致指标调查值出现误差。特别是大城市或特大城市的交通需求结构复杂、样本不足的情况更加普遍。例如,利用居民出行调查数据统计轨道交通出行特征时,调查样本分布很难兼顾所有轨道交通车站周边的用地结构与人口分布的实际情况,从而影响轨道交通出行特征相关指标调查统计值的准确性。其中,轨道交通接驳方式结构指标是最容易失真的指标之一,该指标与轨道交通乘客的居住地分布关系密切,居住地距离轨道交通车站越近,人们选择步行、自行车等交通方式换乘轨道交通的概率越高;反之,人们选择公共汽车、小汽车等机动化交通方式接驳轨道交通的概率越高。因此,许多城市一般还需要进行轨道交通客流问询等专项调查,与居民出行调查进行综合比对分析。
4)利用交通模型技术。
有些出行特征指标只有通过交通模型分析才能获得。例如,出行分布特征指标需要利用交通模型技术使用观测流量对调查样本进行扩样调整后才能获得;机动车行驶总里程、公共汽车客运周转量等指标需要统计全网所有路段(或公共汽车线路段)的流量与长度乘积之和才能得到,目前无论是交通行业统计数据,还是交通信息数据都无法得到,需借助交通模型技术才能实现。
1.3 校核标准
综合校核涉及大量的多源数据,一些数据反映宏观特征,例如全市性行业统计数据和规模性的交通大数据,一些数据反映中微观层面特征,例如交通信息、专项调查和交通模型数据等。这些数据相互关联但又存在差异,需要合理甄别和分析使用,建立针对出行调查的校核标准,使各类数据真正发挥作用。本次调查建立了以反映城市宏观特征为主、兼顾交通建模所需的中微观数据指标校核标准(见表1)。
2 人员出行特征校核
人员出行是城市交通的源头,其特征可以反映城市交通与土地利用、交通设施、交通政策等各方面的相关性,是综合校核最重要的内容。人员出行特征校核指标主要包括人均日出行次数、出行结构、出行时间、出行距离和出行分布等。
2.1 人均日出行次数
人均日出行次数校核采用分类、分层分析,并与出行结构同步校核。本次调查还首次利用手机信息对流动人口在沪停留时间和人均日出行次数进行分析。
基于上海市人口结构复杂、交通行为差异较大的特点,将全市总人口划分为三层(见图1)。第一层是按照在沪时间特征指标将总人口划分为常住人口、流动人口和流量人口三类。其中,常住人口是指在沪居住满6个月的本市户籍和非本市户籍人员;流动人口指在沪居住6个月以下、一天以上的非本市户籍人员;流量人口指当天进出上海市(不在沪过夜)的外来人口。第二层是按照户口类型和居住场所特征指标将常住人口划分为户籍常住人口、(社区)外来常住人口、(集体宿舍)外来常住人口三类。第三层是将户籍常住人口或(社区)外来常住人口按照年龄、职业和居住地等社会经济特征指标进一步分组,将(集体宿舍)外来常住人口按照学生宿舍、职工宿舍等居住场所特征指标进一步分组。
图1 上海市第五次综合交通调查人口结构划分Fig.1 Demographics of the 5th Shanghai Comprehensive Transportation Survey
考虑在沪流动人口对城市交通影响的差异,将流动人口划分为在沪长期停留和短期停留两种类型。其中,长期停留的流动人口居住场所以居民社区、集体宿舍等为主,在沪主要目的是探亲、就学、工作等,出行次数、交通方式等交通特征与常住人口十分相近,这在居民出行调查中的居家流动人口出行记录中已得到证实。短期停留的流动人口居住场所以旅馆为主,在沪主要目的是出差、办事、旅游等,交通方式主要为轨道交通、出租汽车及客车,在相关交通系统的客运量中占一定比例。
通过将调查人口进行多层次交叉分组,并根据不同人口类型特点制定针对性的分析校核方案,使得人均日出行次数指标能够反映在沪所有人群的交通特征。例如,(社区)外来常住人口人均日出行次数基于居民出行调查获得,(集体宿舍)外来常住人口人均日出行次数则依据集体宿舍问询调查。
2.2 出行结构
人员出行结构的校核以行业统计、交通信息等全样统计的运行指标为基准,利用专项调查数据,综合分析人员出行与系统运行之间的逻辑换算关系,确定各种交通方式的出行量和出行结构(见图2)。按照校核依据和换算方法,大致可分为三类:
表1 重要指标校核标准Tab.1 Crucial indices verification standard
1)公共交通。包括轨道交通、公共汽车、出租汽车和轮渡,均可从统计部门直接获得全市客运量或进站量指标,再结合问询调查、其他人工调查及信息化数据对各方式的换乘率、接驳比例等相关参数指标进行综合校核,从而推算出相应方式的出行量。
图2 人员出行结构校核技术方案Fig.2 Techniques of travel structure verification
图3 调查样本步行方式出行距离分布Fig.3 Distribution of walking distance
2)个体机动和非机动交通。包括班车、小客车、摩托车和非机动车,主要依据主管部门的拥有量统计数据,结合问询调查、其他人工调查及信息化数据对出车率、载客人数等相关参数指标进行综合校核,推算出相应方式的出行量。其中,小客车方式的出行特征指标还应与车辆出行调查的相关结果进行比对分析。
3)步行。由于步行出行空间范围受体力制约较大,出行距离比较稳定,主要通过分析出行距离分布比例的合理性进行校核,并与人均日出行次数校核相互迭代后最终确定(见图3)。
2.3 出行时间
人员出行时间分布校核尽可能利用交通信息数据进行比对分析(见表2),对于无法获得交通信息数据的方式(例如步行)则通过与其他方式的相互关系以及经验判断来确定(见图4)。
2.4 出行距离
人员出行距离的校核,按照不同交通方式,利用相应的交通信息、统计、专项调查以及交通模型数据分别进行校核,并最终加权汇总得到全方式人员出行距离(见图5)。各交通方式出行距离校核过程如下:
1)轨道交通。包括轨道交通系统内出行距离和系统外出行距离。前者指乘客从进入到离开轨道交通系统的实际距离,由利用轨道交通检票闸机统计的客流站间OD以及利用手机数据分析的客流换乘路径综合分析得到。后者指乘客从出发地到进入轨道交通车站以及从离开轨道交通车站到目的地的实际距离,需对轨道交通的接驳交通特征进行分析,利用轨道交通客流问询调查、公交IC卡挖掘技术信息[3]、轨道交通车站内的手机轨迹信息[4]以及交通模型等进行综合校核研究。
2)公共汽车。包括车内距离和车外距离。前者指乘客乘坐公共汽车的实际距离,利用跟车调查、车载GPS与公交IC卡匹配信息等综合分析得到。后者包括乘客出发地—上车站、下车站—目的地以及公共汽车之间换乘的实际距离,主要利用公共汽车站客流问询调查及交通模型等综合分析确定。
3)出租汽车。主要指乘坐出租汽车的实际距离,利用车载GPS信息[5]以及出租汽车出行调查等数据综合分析确定。
4)客车。包括乘坐客车的实际距离和出发地至停车位(或停车位至目的地)的车外出行距离,利用客车专项调查和交通模型综合分析确定。
5)摩托车、电动自行车、自行车、步行等其他交通方式。一般采用最短路径,利用专项调查和交通模型综合分析确定。
2.5 出行分布
出行分布校核即出行OD校核,综合反映土地利用、交通设施与人员出行需求在空间上的相互关系,因此,需通过多层次的数据控制和反复迭代综合确定,具体步骤如下(见图6):
1)分析各种交通方式出行量与用地、人口、就业岗位之间的逻辑关系,校核OD矩阵端点的出发量、到达量;
2)利用交通信息及专项调查数据,分析各种交通方式的合理出行距离分布曲线,校核OD矩阵空间结构;
3)利用交通信息及核查线调查数据,分析各种交通方式在区域之间的出行交换量,校核分方式OD矩阵空间结构,并首次利用手机核查线客流穿越量[4]调查对全方式空间分布进行综合比对;
4)利用交通模型技术平台,反复修正OD矩阵的端点出行量、出行距离曲线、区域间出行交换量以及交通量模拟精度,最终确定OD矩阵及出行分布特征指标。
3 小客车出行特征校核
近年来,私人小汽车的快速增长大大影响了城市道路交通的运行,因此小客车出行特征校核成为车辆出行校核的重点。小客车出行特征校核指标包括拥有量、出车率(车辆一日实际出行比例)、日均出行次数、载客人次、出行时间分布、出行空间分布等。
3.1 拥有量
小客车拥有量是车辆出行需求规模计算的基础。按照牌照类型可以将车辆分为市区号牌(沪牌)、郊区号牌(沪C)以及外地号牌。对于市区号牌和郊区号牌车辆,可以通过已注册数据获得精确值。但对于外地号牌车辆,则需要通过多源大数据进行挖掘后确定,主要包括保险业联合公会的外省市号牌在沪购买交强险数据、年检站的在沪参加年检的外省市号牌车辆数据、道路交叉口及高架路(桥)的车辆牌照识别数据、停车普查的牌照结构数据以及居民出行扩样拥有量数据等。
3.2 出车率、日均出行次数及载客人次小客车出车率、日均出行次数和载客人
表2 各种交通方式出行时间校核依据Tab.2 Travel time verification for different travel modes
图4 基于各类交通数据统计的出行时间分布Fig.4 Travel time distribution based on different transportation statistics
图5 各种交通方式出行距离分布Fig.5 Travel distance distribution of different transportation modes
次的校核,主要是采用多源调查数据比对和模型模拟等方法综合判断,避免单一调查数据存在的片面性。其中,出车率和日均出行次数主要对比分析年检站小汽车出行调查数据、居民扩样数据的可靠性,并结合历年趋势确定(见图7)。载客人次校核主要深入分析来自居民扩样、小汽车使用特征以及地面道路、高架路(桥)和对外道路出入口等不同渠道数据不一致的原因,再结合历年趋势及幅度等最终确定。
3.3 出行时间分布
图6 全市人员出行分布校核技术路线Fig.6 Techniques of travel distribution verification
图7 出车率历年变化趋势Fig.7 Annual percentage of vehicle travel over the years
小客车出行时间分布的校核应充分分析人工调查数据(包括居民扩样、小客车出行特征扩样、核查线流量调查数据)和信息化数据(包括越江大桥隧道、高架路(桥)、对外道路出入口的线圈及牌照识别数据[6]和高速公路收费数据)各自时间分布的可靠性和合理性,通过综合判定后确定(见图8)。
3.4 出行空间分布
小客车出行分布校核与人员出行分布校核类似,主要步骤包括:
1)根据居民出行调查扩样数据,获得初始出行分布OD矩阵;
2)根据已经确定的小客车总体特征指标(拥有量、出车率、日均出行次数和载客人次等),对OD矩阵总量进行修正;
3)根据核查线流量和重点路段观测流量等数据对OD矩阵宏观分布进行控制(例如基于越江交通量确定跨江出行分布);
4)根据人口、就业岗位和夜间停车分布资料,进一步细化修正出发量和到达量;
5)利用交通模型技术,分析和确定出行距离分布曲线,对出行分布OD矩阵结构进行修正;
6)利用交通模型技术,获取OD矩阵的路网模拟交通量,进一步与核查线、重点路段的观测流量进行比对,对流量误差情况进行分析,视具体情况返回至上述相应步骤进一步调整OD矩阵,直至流量误差达到满意结果(见图9)。
4 货车出行特征校核
随着上海市国际航运中心建设以及电子商务发展,货运交通的需求不断壮大,货车在道路交通中的比例也不断加大,掌握和确定现状货车出行特征对于相关规划和政策制定具有十分重要的意义。与小客车类似,货车出行特征校核指标主要包括货车拥有量、日均出行次数以及出行分布。其中,货运车辆的规模直接来自交通管理部门的统计资料,因此,本次校核主要是日均出行次数和出行分布指标(见图10)。
4.1 日均出行次数
货车日均出行次数校核充分结合人工问询和车载GPS数据挖掘[5],通过分析两类数据相同号牌车辆的出行特征,校验人工调查结果的可靠性。具体修正包括三个步骤:
1)基于人工问询调查获得分类型货车的初步日均出行次数。货运企业问询从样本规模和抽样方法上均比年检站问询可靠性高,因此以货运企业问询调查结果为主,经扩样可得到不同类型货车的业务运输出行的初步日均出行次数(非业务类出行及主要与人有关的出行不计入货车出行)。其中,由于调查表中将集装箱卡车回程出行归入其他出行,无法直接得到业务类日均出行次数,需进一步根据年检站调查情况、其他货车非业务出行比例及其与集装箱卡车的相对关系综合分析后才能剔除非业务出行。
2)基于车载GPS数据[5]修正集装箱卡车日均出行次数。通过比对车辆号牌,将车载GPS数据和企业人工问询调查中集装箱卡车号牌相同的车辆挑出,比对相同日期两个渠道的调查数据,发现车载GPS数据挖掘结果比人工调查结果高。进一步对这些车辆进行抽样检验,发现GPS路径信息反映的出行记录基本无异常。因此,认为GPS数据挖掘结果基本反映了集装箱卡车的真实出行情况。假定这些车辆所反映的日均出行次数差异适用于全样本,则可对基于人工问询调查的集装箱卡车初步日均出行次数进行修正。
3)基于集装箱卡车的校核结果对普通货车日均出行次数进行修正。基于集装箱卡车的校核结果,确定人工问询出行记录的漏报率(即上述修正系数)。由于普通货车和集装箱卡车问询调查的实施途径相同,假定二者的出行记录漏报率相同,基于人工问询结果进一步修正其他类型货车初步日均出行次数指标。
4.2 出行分布
货车出行分布校核与小客车较为类似,主要包括以下步骤:
1)基于分类型货车拥有量和日均出行次数确定出行量,并对经人工问询初步扩样的分类货车OD矩阵进行修正;
图8 不同来源小客车出行时间分布Fig.8 Car travel time distribution from different data sources
图9 小客车出行空间分布Fig.9 Spatial distribution of car travel
图10 货车出行校核思路Fig.10 Techniques of freight travel verification
2)根据道路核查线流量及变化趋势,综合判断获得分类货车宏观出行分布;
3)基于集装箱堆场、码头、货运站等分布情况,对部分货车的出发量和到达量分布进行校核控制;
4)基于人工问询的出行地址记录和GPS数据挖掘结果[5]确定分类货车出行距离分布曲线,对相关货车OD矩阵空间结构进行修正。
5 结语
通过对各类调查数据的深入分析和总结,上海市第五次综合交通调查综合校核使调查成果更真实地反映城市交通特征,为后续交通研究和模型研发提供必要的数据支持。校核技术方法围绕传统的人员出行和车辆出行,运用调查中的各类数据比对,最终确定合理结果。此外,与以往调查校核相比,本次校核大量应用信息化数据,有效地将传统调查与信息化调查成果相融合,也为大数据时代的交通分析提供新的思路和方法。
[1]上海市第五次综合交通调查总体方案[R].上海:上海市城乡建设和交通发展研究院,2013.
[2]上海市第五次综合交通调查技术报告[R].上海:上海市城乡建设和交通发展研究院,2015.
[3]上海市第五次综合交通调查:基于一卡通的交通特征挖掘[R].上海:上海市城乡建设和交通发展研究院,2014.
[4]上海市第五次综合交通调查:基于手机信息的出行特征挖掘[R].上海:上海市城乡建设和交通发展研究院,2014.
[5]上海市第五次综合交通调查:基于GPS的车辆出行特征数据挖掘[R].上海:上海市城乡建设和交通发展研究院,2014.
[6]上海市第五次综合交通调查:基于牌照识别的车辆出行特征挖掘[R].上海:上海市城乡建设和交通发展研究院,2014.
Data Verification of the 5th Shanghai Comprehensive Transportation Survey
Chen Bizhuang,Shen Yunzhang,Dong Zhiguo
(Shanghai Urban-Rural Construction and Transportation Development Research Institute,Shanghai 200040,China)
Because of the human factors in manually conducted household travel survey,there are often gaps between the survey results and real travel characteristics.Therefore,it is necessary to verify/rectify the data from comprehensive transportation survey with other relevant information.Taking the 5th Shanghai comprehensive transportation survey as an example,this paper proposes a comprehensive verification technique for individual and vehicle travel characteristics,that is,to take advantage of available statistical indexes from transportation industry,transportation big data,other specific surveys and transportation models for comparing and rectifying the travel characteristics.Techniques of travel characteristics verification for person,passenger car,and freight vehicles are elaborated.Finally,the paper points out that compared with existed survey data verification methods,the new verification techniques effectively integrate traditional survey and informatization survey results using mass informatization data.
comprehensive transportation survey;data verification;travel characteristics;Shanghai
1672-5328(2016)02-0043-08
U491.1+1
A
10.13813/j.cn11-5141/u.2016.0207
2015-11-30
陈必壮(1966—),男,上海人,教授级高级工程师,总工程师。主要研究方向:城市交通规划和政策、城市交通模型。E-mail:allanchenb@163.com