大数据背景下重庆市综合交通模型维护升级
2016-12-14吴祥国余清星
吴祥国,余清星,韦 翀
(重庆市交通规划研究院,重庆400020)
大数据背景下重庆市综合交通模型维护升级
吴祥国,余清星,韦 翀
(重庆市交通规划研究院,重庆400020)
利用传统交通调查数据开展交通模型维护升级工作存在抽样率低、样本量小、人工成本高、精度低、实施难度大等多种现实问题。在大数据技术不断更新完善的背景下,有必要探索新的模型维护升级技术和方法。首先,阐述重庆市交通大数据的发展历程、数据类型、数据采集与数据格式。其次,在重庆市综合交通模型的框架结构中,分别利用大数据资源探索公共汽车线网的构建、各等级道路流量延误函数标定、常住人口和就业岗位分析、出行分布特征分析和公共交通出行需求分析等相关技术方法。最后,以重庆市综合交通模型的应用实践成果验证模型的可靠性和准确性。
交通规划;交通模型;维护升级;大数据;重庆市
0 引言
城市交通模型的维护升级需要根据城市发展建设情况对模型基础输入数据和相关参数进行更新,确保模型分析结果的准确性[1]。然而,传统交通调查作为交通模型维护升级一般的基础数据来源,存在抽样率低、样本量小、人工成本高、精度低、实施难度大等多种现实问题,基础数据采集困难。此外,模型基础网络信息更新还存在工作量大、内容烦琐、模型维护难度大等问题。
随着计算机、通信、网络、传感等高新技术的快速发展,由互联网、移动互联网、移动通信、物联网、车联网等高端设备产生的交互和交易数据共同构成了大数据,具有大体量(Volume)、速度快(Velocity)、多样性(Variety)、价值密度低(Value)的4V特征[2]。虽然这些大数据最初并非为分析城市交通出行规律而产生,同时应用这些大数据面临数据采集、数据格式和数据分析等诸多方面的难题,但通过对多源大数据的深度关联分析挖掘,仍然可以为城市交通模型的维护升级工作提供丰富的数据基础。
1 重庆市交通大数据
2010年,重庆市已着手开展大数据在交通规划工作中的应用研究,代表性工程为重庆市交通综合信息平台,稍晚于2006年的深圳市城市交通仿真系统[3]。该平台实现了基于GIS技术的各类现状及规划交通基础设施数据的汇聚整合,并应用手机信令、车载GPS、交通视频图像等数据实现主城区实时车速、流量状况计算,可为政府部门、社会公众、运输企业、科研机构提供基础数据支持,同时也为重庆市综合交通模型维护升级提供重要的基础数据支撑。
1.1 数据类型
图1 重庆移动手机信令监测范围Fig.1 Mobile phone signaling coverage area for operator China Mobile in Chongqing
重庆市交通综合信息平台已汇集多家市级部门和社会企业的交通大数据,数据类型覆盖城市道路、公共交通、航空、铁路、公路、水运等交通领域,主要数据类型有:1)人员移动数据,包括手机信令数据、公交IC卡数据、轨道交通闸机数据等;2)车辆移动数据,例如出租汽车、公共汽车、客车和货车的GPS数据,射频识别(Radio Frequency Identification,RFID)数据,线圈与视频卡口数据,停车场收费信息等。
1.2 数据采集与格式
1.2.1 人员移动数据
重庆市交通综合信息平台中与人的移动相关的数据资源主要包括手机信令数据、公交IC卡数据和轨道交通闸机数据。
自2011年开始,重庆市交通综合信息平台陆续接入两家运营商的手机信令数据,其中重庆移动手机信令覆盖主城区及周边19个区县,面积约2.7万km2,基站约3万个,位置区109个(见图1);重庆联通手机信令覆盖主城区及周边38个区县,面积8.24万km2,基站约2.5万个,位置区94个(见图2)。手机信令的主要内容包括用户编号、基站编号、事件时间和事件类型。将事件类型按手机信令产生过程是否受到手机用户主观行为影响,划分为主动方式和被动方式。前者主要包括主叫、被叫、挂机、接收短信、发送短信、基站控制器(BSC)切换等。后者主要包括正常位置更新、周期性位置更新,即通信系统对于手机用户位置的定时更新记录。
重庆市公共交通刷卡比例逐年攀升。根据重庆城市通卡支付有限责任公司统计数据,截至2014年底公交IC卡持卡率达到81%,每天产生IC卡刷卡数据量540万条。公共汽车刷卡数据和轨道交通闸机数据的主要内容包括卡号、卡类型、交易类型、刷卡日期、刷卡时刻、交易金额、营运单位、设备号、公交线路号、公交车辆号、公共汽车签到卡号、轨道交通进站时间、轨道交通进站车站、轨道交通出站时间、轨道交通出站车站。
1.2.2 车辆移动数据
重庆市交通综合信息平台汇集的车辆移动数据主要包括公共汽车、出租汽车、“两客一危”车辆(即从事旅游的包车、三类以上班线客车和运输危险化学品、烟花爆竹、民用爆炸物品的专用车辆)的车载GPS数据以及道路流量数据(例如RFID数据、线圈或视频卡口数据等)。
车辆GPS数据中,公共汽车每天产生4 200万条数据记录,主要内容包括线路号、车辆号、定位时间、定位经纬度、速度、角度、营运单位;出租汽车每天产生9 400万条数据记录,主要内容包括车辆号、定位时间、定位经纬度、速度、角度、是否载客;“两客一危”车辆每天产生3 200万条数据记录,主要内容包括车辆号、定位时间、定位经纬度、速度、角度。
各类型道路流量数据中,线圈仅能够统计断面流量,无法识别车辆ID、类型等其他相关信息,而RFID和视频卡口可识别的车辆信息较为全面。重庆市主城区已投入运营的RFID监测采集点共计852个(见图3),覆盖主要道路与城市出入口,采集数据内容包括车辆ID、通过监测点时间、车型代码、号牌种类、使用性质、车牌归属地。视频卡口采集断面相对较少,仅有31个,而线圈布局有249个,其中视频卡口采集数据内容包括卡口编号、方向、车道号、车牌号、号牌种类、过车时间、车辆速度和车辆类型(见图4)。
2 重庆市综合交通模型维护升级
2.1 模型框架
重庆市综合交通模型采用传统的四阶段模型方法构建,包括出行网络模型和出行需求模型。前者主要包括道路网络、轨道交通网络和公共汽车网络及其附属属性和函数;后者指各阶段互相反馈的四阶段模型,主要模块为道路网络分配模型和公共交通网络分配模型(见图5)。
2.2 模型维护升级内容与方法
重庆市综合交通模型维护的主要内容为道路网络、轨道交通网络和公共汽车网络等基础网络资料和人口用地资料。模型升级的主要内容为流量延误函数、公共交通出行时间函数的标定以及四阶段模型中各模块相关参数的调整。
2.2.1 公共汽车线网构建
公共汽车网络是依附在道路网络上的路径系统,能够记录公共汽车线路运行的路段、节点次序以及车站位置。TransCAD和EMME等传统交通规划软件均含有公共汽车线网编辑功能。EMME软件要求公共汽车站必须位于路网节点上,手动编辑相对复杂;TransCAD软件允许车站位于路段的任意位置,但为与EMME软件兼容,一般在路段设置虚拟节点[4]。
图3 重庆市主城区RFID监测点位分布Fig.3 RFID distributions in Chongqing central district
图4 重庆市主城区线圈和视频卡口监测点位分布Fig.4 Distribution of video and loop detectors in Chongqing central district
传统公共汽车线网构建的方法主要有两种:1)通过TransCAD软件中的Route systems编辑器功能手动编辑线路和车站;2)首先进行全网络的公共汽车站定位信息调查,确定每条线路车站的经纬度及双向运行次序,再通过TransCAD软件中的线路车站间最短路径的方法构建公交线网。传统方法投入的人工和调查成本较高,工作量大,费时费力,一般适用于公共汽车线路较少的城市。
在大数据背景下,丰富的数据源为提高公共汽车线网构建的效率提供可能:1)通过公共汽车车载GPS定位数据构建公共汽车线网,即根据公交车载GPS数据的行车轨迹构建公共汽车线路。当公共汽车运行至车站时,运行速度降至0km·h-1,通过选定特定时段的线路经过较长时间的训练可以获取公共汽车站定位经纬度,进而获取各行车方向的线路车站信息以构建公共汽车线网。2)通过下载开源数据,例如百度、搜狗等网站的线路车站信息,通过相应的坐标转换、车站识别等操作,导入至本地交通模型中,构建公共汽车线网。
2.2.2 各等级道路流量延误函数标定
图5 重庆市综合交通模型框架Fig.5 Framework of Chongqing Comprehensive Transportation Model
流量延误函数(Volume Delay Function,VDF)是指路段行驶时间与路段交通负荷、交叉口延误与交叉口负荷之间关系的数学表达,是进行出行路径选择和交通分配的关键参数。主要函数类型包括美国公路局的BPR函数、加拿大INRO公司开发的Conical函数、Akcelik在Davidson函数基础上提出的Akcelik函数和以色列交通规划研究部提出的基于Logit的流量延误函数[5]。
传统标定流量延误函数的数据基础主要为人工交通量调查和跟车车速调查数据,一般采用的车道通行能力为经验值。由于调查费用高、样本量小,所以标定的流量延误函数精度较低,模型敏感度不高。
重庆市交通综合信息平台汇集了丰富的交通量识别数据,例如RFID数据、视频卡口和线圈数据、各类型车载GPS数据。充分采用上述数据,构建城市实时车速运行系统,可为各等级道路流量延误函数的标定提供丰富的断面流量和车速基础数据。根据交通流理论,对路段不同时段的流量、密度进行拟合分析,能够比较清晰地划分出畅通流、压缩流和饱和流状态,作为标定分段流量延误函数的重要基础。此外,根据分时段交通量和车速的统计分析,还可为不同区域、不同道路等级的单车道通行能力标定提供定量参考。
2.2.3 常住人口和就业岗位分析
常住人口和就业岗位是构建出行生成模型的基础和关键。获取常住人口和就业岗位数据的传统方法是利用统计局社会经济普查成果,根据各交通小区的居住建筑面积以及其他类型用地面积进行细分。然而,统计局通过抽样调查获取的常住人口数据抽样率较低,精度有待提高,且缺乏较为详细的就业岗位信息,难以获取较小区域(例如镇、街道层面)的人口和就业岗位数据。
应用手机信令数据进行人口和就业岗位分析是一种较为理想的技术手段。手机定位采用的是基于基站小区的模糊定位技术,移动通信网络能够定期或不定期、主动或被动地记录代表手机用户位置的基站小区编号,通过对每个用户连续出行轨迹的还原,进而判断用户的具体出行行为[6]。利用长期(1个月以上)的手机位置历史数据,可识别用户夜间休息时段稳定点为居住地、白天工作时段稳定点为工作地,并剔除非通勤用户的干扰,获取常住人口和就业岗位分布。
2.2.4 出行分布特征分析
出行分布是指各交通分区之间的交换量,是描述出行特征的重要指标。采用手机大数据的出行轨迹,能够较为准确地识别居民通勤出行的起讫点,分析得到居住人口的就业岗位分布或就业人口的居住地分布,适用于大区域或组团间出行OD矩阵、特定区域(例如机场、火车站)出行OD矩阵分析。
RFID数据记录了车辆ID和通过时间等信息,利用关键通道上几个连续的RFID断面,能够追踪车辆的运行轨迹,进而分析特定路段不同的流量、流向构成特征,可为模型校验和项目功能定位分析提供参考。
2.2.5 公共交通出行需求分析
公共交通出行OD矩阵是公共交通出行需求分析的重要依据。传统公共交通出行OD矩阵是在居民出行调查的基础上,采用四阶段模型进行出行方式划分分析得出。另外一种获得公共汽车出行OD矩阵的方法是采用小票法对全部公共汽车线路的上下车站进行调查,推算车站间OD矩阵和出行需求。总之,相关调查耗时耗力、调查样本少,影响数据精度。
轨道交通闸机数据记录了乘客出行的上下车站。公共汽车的IC卡数据并未记录乘客的上下车站,但通过与车载GPS数据的相同关键字段相匹配,以及相应的理论分析,可以推导得到公共汽车出行OD矩阵。将公交IC卡数据记录的车辆号、刷卡时间与车载GPS数据记录的车辆号、定位时间相匹配,可获取乘客刷卡时对应的定位经纬度,与调查的公共汽车站经纬度相匹配,即可推导出乘客出行的上车站。对于下车站推导,假设乘客单日全部出行是一个以起讫点为连接点的完整环状出行链,则可以假设乘客前一次出行的终点是下一次出行的起点,乘客当日最后一次出行的终点是第一次出行的起点。通过以上方法,可充分利用公交IC卡、GPS数据以及轨道交通闸机数据得到公共交通出行需求OD矩阵[7],从而减少人工调查费用和成本,提高抽样率和数据精度。
3 应用实践
3.1 公共汽车线网维护
重庆市主城区公共汽车线网维护充分利用开源大数据资源,通过下载—导入—坐标转换—导入模型路网—运行路径修正—车站识别等步骤,获取开源公共汽车线路车站数据,并通过与公交企业提供的线路表、原有公共汽车线网相对比,补充遗漏的公共汽车线路。目前,重庆市主城区共有公共汽车线路559条(见图6),其中开源数据与公交企业提供的线路表之间存在差异的线路有41条,公共汽车线网维护的工作量大大减小。
图6 重庆市主城区公共汽车线网Fig.6 Bus network in Chongqing central district
图7 重庆市机场高速(奥特莱斯段)单车道流量和速度时段分布Fig.7 Vehicle flow counts and velocity per lane on Chongqing airport expressway(near Outlets mall section)
3.2 流量延误函数升级
图8 重庆市机场高速(奥特莱斯段)流量延误函数Fig.8 VDF functions on Chongqing airport expressway(near Outlets mall section)
在整合路段的RFID车流量数据、视频卡口和线圈等监测设备分时段车流量数据、对应路段的GPS车速检测数据之后,可根据分时段的单车道流量值,取其95%分位值确定不同区域、等级路段的车道通行能力,并根据道路运行的畅通流、压缩流和饱和流状态进行分段流量延误函数的标定。图7为重庆市机场高速(奥特莱斯段)单车道流量和速度时段分布,早高峰(7:00—9:00)和晚高峰(16:30—18:30)时段单车道交通量分布在最大值区域,运行速度骤降,基本达到通行能力极限值,取其95%分位流量值1 700 pcu·h-1为本路段单车道通行能力。图8为对应路段的流量延误函数,在饱和流状态下运行速度随着饱和度增加迅速降低。基于上述基础分析成果,可以快速高效地标定出包括都市功能核心区、都市功能拓展区两类区域,高速公路、快速路、主干路、次干路和支路5类道路等级,桥梁、隧道、主辅路等多种断面形式共计30余种流量延误函数。
3.3 常住人口和就业岗位维护
利用主城区1个月以上的手机信令数据,持续跟踪手机用户在不同区域的出现天数、累计出现时长以及通信信号出现和消失的时间等信息,研究手机用户在不同区域、不同时段出现的规律性特征,进而训练并获取主城区的常住人口和就业岗位手机用户样本,再利用统计局发布的镇和街道层面的人口、年龄结构数据进行扩样分析。从常住人口和就业岗位分布密度(见图9和图10)来看,重庆市主城区常住人口和就业岗位高度集中于核心商圈区域,都市功能核心区3.3%的区域面积承载了主城区40%的人口和就业岗位[8]。
图10 重庆市主城区就业岗位密度Fig.10 Employment density in Chongqing central district
3.4 出行分布特征分析
利用手机信令数据训练的通勤出行OD矩阵可以用于分析各组团间的出行分布特征。东京、伦敦、纽约、北京、上海等国际大城市具有中心城区就业岗位集中、居住空间不足、通勤出行以中心放射型中长距离出行为主的特征。而重庆市主城区通勤交通并没有明显的射线向心特征,通勤主要流向是由内往外、由南往北、由中部槽谷至东西部槽谷,且绝大部分跨组团通勤出行发生在相邻组团之间(见图11)。这一交通分布特征充分体现了重庆市多中心组团式发展的城市布局,也从另一侧面反映了利用手机信令数据推导出行OD矩阵的可靠性和准确性。
此外,还可利用RFID车流量数据来分析交通模型的准确度及校核模型参数。以鹅公岩长江大桥为例(见图12),通过提取连续几个RFID检测断面的车流量数据可以得到:二郎立交桥以西区域至鹅公岩长江大桥的车流交换量为8%,江南立交桥以东区域至鹅公岩长江大桥的车流交换量为17%。该数值与现状道路交通模型对于鹅公岩长江大桥进行关键断面分析的结果基本一致,进一步验证了模型的可信性。
3.5 公共交通出行需求分析
基于公交IC卡、GPS数据以及轨道交通闸机数据反推公共交通出行需求OD矩阵、构建公共交通出行需求模型的技术,已成功应用于诸如重庆市主城区公共交通网络优化等规划项目中。在重庆市主城区公共交通网络优化项目中,利用公交IC卡刷卡原始数据330万条,成功推导出上下车站OD矩阵的出行乘次为225万次,推导成功率高达68.2%。然后,分别从推导出的站间OD矩阵的刷卡数据与原始刷卡数据的相对关系、各线路刷卡率两个层面对公共汽车站OD矩阵进行扩样。最后,根据公共交通车站与交通小区之间的从属权重关系,将公共交通车站间OD矩阵转换为交通小区出行OD矩阵,进行公共交通分配(见图13)。
4 结语
图11 重庆市主城区通勤交通出行期望线Fig.11 Desire line of commuting trips in Chongqing central district
图12 重庆市鹅公岩长江大桥关键路段流量流向分析Fig.12 Analysis of flow velocity and direction on key section in Egongyan Yangtze Grand Bridge
图13 重庆市主城区公共交通客流量分配Fig.13 Transit assignment in Chongqing central district
城市交通模型的维护升级是一项长期工作。大数据技术的不断发展和完善为城市交通模型的日常维护升级提供了良好的数据基础。重庆市主城区充分利用开源数据以及手机、公交IC卡、轨道交通闸机、RFID、各类型车载GPS、视频卡口和线圈等设备产生的大数据资源,在公交线网构建、各等级道路流量延误函数标定、常住人口和就业岗位分析、出行分布特征分析和公共交通出行需求分析等方面进行了较为成功的探索和应用。
未来,大数据技术将会越来越广泛地应用于城市交通规划,特别是城市交通模型的构建、维护与升级中。多源大数据资源应相互结合、相互校核、深入挖掘,才能迸发出更多更为真实、可信的成果。
[1]陈必壮,张天然.中国城市交通调查与模型现状及发展趋势[J].城市交通,2015,13(5):73-79.Chen Bizhuang,Zhang Tianran.Current and Future Development of Urban Travel Survey Methods in China[J].Urban Transport of China,2015,13(5):73-79.
[2]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代:生活、工作与思维的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013.Mayor-Schonberger V,Cukier K.Big Data:A Revolution That Will Transform How We Live,Work and Think[M].Sheng Yangyan,Zhou Tao,translated.Hangzhou:Zhejiang People's Publishing House,2013.
[3]丘建栋,陈蔚,宋家骅,段仲渊,赵再先.大数据环境下的城市交通综合评估技术[J].城市交通,2015,13(3):63-70.Qiu Jiandong,ChenWei,Song Jiahua,Duan Zhongyuan,Zhao Zaixian.Comprehensive Assessment of Urban Transportation Using Big Data[J].Urban Transport of China,2015,13(3):63-70.
[4]张天然.基于GIS的公交模型数据库构建及维护[J].城市交通,2014,12(5):65-71.Zhang Tianran.Development and Maintenance of a GIS-based Transit Model Database[J].Urban Transport of China,2014,12(5):65-71.
[5]温旭丽,吴忞,曹蕊.几种典型路阻函数的特性比较及参数选择研究[J].公路交通科技(应用技术版),2014(2):205-208.
[6]冉斌.手机数据在交通调查和交通规划中的应用[J].城市交通,2013,11(1):72-81.Ran Bin.Use of Cellphone Data in Travel Survey and Transportation Planning[J].Urban Transport of China,2013,11(1):72-81.
[7]吴祥国.基于公交IC卡和GPS数据的居民公交出行OD矩阵推导与应用[D].济南:山东大学,2011.
[8]重庆市交通规划研究院.重庆市主城区交通发展年度报告[R].重庆:重庆市交通规划研究院,2014.
Maintenance and Upgrading of Chongqing Comprehensive Transportation Models Under Big Data Era
Wu Xiangguo,Yu Qingxing,Wei Chong
(Chongqing Transport Planning Institute,Chongqing 400020,China)
Transportation models were maintained and upgraded highly relying on traditional traffic survey technology,which has raised a couple of practical issues,including low sample rates,small sample size,high labor cost,low accuracy,and implementation difficulty.As we are stepping into big data era,it is necessary to explore new ways for maintaining and upgrading transportation models.First of all,this paper illustrates the efforts in the big data development progress,data collection,and data structures Chongqing has made so far.Second,it highlights some critical achievements,including using big data to construct bus network,calibrate volume delay functions for various road types,analyze residential population and employment,discover trip distribution patterns and detect public transport demand under Chongqing Comprehensive Transportation Model framework.Finally,the paper demonstrates various real-world applications to justify the reliability and accuracy improvement of updated model.
transportation planning;transportation models;maintenance and upgrading;big data;Chongqing
1672-5328(2016)02-0051-08
U491.1+2
A
10.13813/j.cn11-5141/u.2016.0208
2015-11-30
吴祥国(1986—),男,山东聊城人,硕士,工程师,主要研究方向:交通需求预测。E-mail:wxiangguo@126.com