基于多源数据的迁居个体通勤方式选择研究*
2020-12-17吴静娴
吴静娴 胡 荣 赵 靖 杨 敏
(上海理工大学管理学院1) 上海 200093) (东南大学交通学院2) 南京 210096)
0 引 言
在城市化进程中,特大城市进行大规模的新区建设和老城改造,远城区因产业化滞后、功能用地单一导致新迁居民的通勤距离普遍较长,加之外围新区公共交通系统基础设施配建和服务供给相对不足,居民出行交通结构日趋机动化[1].以北京、上海、广州、南京为代表的中国特大城市,城市空间扩张和空间结构演变最为突出,小汽车出行比例增长迅速,城市内部频频出现潮汐性通勤流、高峰时段交通拥堵、尾气排放、环境污染等问题[2].2015年,南京新区仙林副城、江北副城和东山副城居民出行机动化显著,出行比例为33%,25.6%和32.1%,明显高于主城区(17%).
针对城镇化背景下城市迁居通勤机动化问题,国内外学者试图以微观城市规划和交通规划政策调控和引导个体出行.Timmermans等[3]研究发现,社区就业岗位数、商场休闲娱乐场所数量以及其他服务设施的配建对个体出行方式选择有影响.Cervero等[4]对比传统社区和郊区社区出行特征,发现高密度、混合型用地、高可达性的街区更利于居民非机动出行.在新迁社区配建自行车道、人行道和自行车停车场等非机动基础设施,利于个体居民的步行和自行车出行[5].与此同时,Winters等[6]表示社区主干道可达性越高,人们对于汽车出行的需求就越大.其他研究则关注于社区公交服务密度和质量对个体出行方式选择的影响.Aditjandra等[7]发现充沛的公交基础设施供给、高可达性的公交服务更利于引导社区居民的公交通勤.因缺乏城市土地利用数据,吴静娴等[8]基于回忆式问卷调查数据,分析主观感知的建成环境变化与迁居个体出行方式转移之间的相关性,发现社区轨道及公交服务可达性提升对迁居个体轨道通勤有积极的导向作用.
综观上述研究,数据来源整体较为单一,以居民出行调查数据或专项迁居个体通勤调查数据为主,通过横向对比宏观层面不同区域层居民通勤出行特征差异,或以个体主观建成环境数据替代社区微观土地利用数据,解释迁居通勤者出行机动化的原因.文中将弥补以往研究数据上的不足,以南京为例,融合实际问卷调查和多源网络爬虫技术,建立迁居人群通勤出行的多源数据库,利用Probit模型分析建成环境与迁居个体通勤方式选择微观层面的相关性,解释迁居人群通勤机动化的内在原因.
1 多源数据匹配与指标测度
1.1 数据源与网络数据爬取
数据源包括迁居人群通勤出行调查数据、基于百度地图API的网络数据和第三方城市数据团数据.两类网络爬虫数据以问卷调查数据为基础,通过问卷职住地址信息对应的经纬度,衔接两类网络数据,构建以个体微观视角的迁居人群通勤出行行为数据库.迁居个体通勤出行调查主要获取城市迁居通勤人群个人家庭属性、迁居住宅属性、通勤出行特征信息;根据问卷中个体提供的职住地址信息,用R语言编写函数通过百度地图API接口访问地图开放平台,获取与城市迁居个体职住地址匹配的路网通勤距离、通勤时间和城市建成环境相关的POI数据(point of interest);城市数据团主要负责提供城市道路网数据,通过地址信息匹配,获取缓冲区内与道路网相关的建成环境指标数据.
其中,建成环境指标相关的百度地图POI数据主要包括居民楼、公司企业、购物、餐厅、休闲娱乐、公交车站点、附近站点对应公交线路数等信息.百度地图提供多种POI抓取方法,行政区划区域检索、周边检索、矩形区域检索、和地点详情检索.本文采用API周边检索法,依据缓冲区半径、地址经纬度、搜索地点类型关键词,调用访问路径分类抓取目标地点缓冲区范围内的POI数量.此外,借助城市团数据平台存储的城市路网数据,根据既定的缓冲区半径确定目标地点周边的路网相关数据.具体数据来源与数据获取类型见图1.
图1 迁居人群通勤出行数据源与数据类型
1.2 建成环境指标测度
迁居常伴随居住社区建成环境的变化,建成环境是对城市街区物理特性的描述,是影响个体出行决策的重要因素.与城市交通关联的建成环境指标主要包括密度(density)、多样性(diversity)、街区设计(design)、公共交通可达性(distance to public transport)、目的地可达性(destination accessibility)和至中心区邻近度(distance to city center)六个维度.不同于以往建成环境指标数据,本研究采用是百度地图POI数据和城市数据团数据,要构建以上6类建成环境指标需对相关数据进行处理与指标测度计量,具体如下.
1) 密度 居住密度、人口密度以及岗位密度指标是影响个体出行的重要密度指标.研究根据百度地图爬取的住房、公司企业、政府、金融机构等类型POI数据,估算迁居个体所给地址确定半径(常用半径1 km)缓冲区域的单位面积住宅数量、POI总数和岗位密度.
2) 土地利用多样性 主要指标有土地利用混合熵、商业用地强度和职住比.通过统计修正的缓冲区各类POI值得出该三类指标值.其中,借鉴Ding等选用1 km的圆形缓冲区计算居住用地、商业用地、办公用地三种用地对应的混合熵来计算土地利用混合熵[10].在样本采集中,部分受访者所在居住区域或工作就业区域的用地开发相对滞后导致出现抓取后的POI点数过少现象.因此,本文对相关POI统计值进行人为修正,减少由此导致的混合熵计算偏差.具体修正为
(1)
式中:Pi为第i类POI的数量占POI总数的比例;n为POI的类型数.混合用地熵指数取值范围为0(用地单一,某类用地占主要部分,其他类用地面积比例较少)到1(用地混合复杂,且各类用地面积相当),取值越高表示混合度越高.居住区商业用地强度由缓冲区单位面积商业POI数计量,职住比指标则由缓冲区住就业岗位和住宅的POI统计值计算.
3) 设计 以缓冲区单位面积交叉口数衡量街道路网的连通性,结合城市团数据统计半径为500 m的街区交叉口数量[9].
4) 可达性 可达性主要描述公共交通服务的可用性与便捷性,城市常见公交服务主体有常规公交和轨道交通两种.城市常规公交接入方式以步行为主,建议缓冲区半径取值为500 m,而轨道接入方式种类相对较多,如共享单车与步行,可根据目标城市具体接入模式确定.
5) 目的地可达性 鉴于研究目标出行类型为通勤出行,研究以职住岗位是否隶属于同个行政区和基于百度地图爬取的最短职住通勤距离来描述目的地就业点可达性.
6) 中心区邻近度 中心区邻近度以居住区位、就业地区位,以及基于百度地图计算的居住区至CBD距离指标来衡量.就业地区位和居住区位根据问卷中地址信息定性判定,中心区邻近程度利用百度地图API计算居住点至CBD距离来量化.
2 实证案例研究
以南京为例,调查覆盖中心城区、仙林副城、东山副城、河西新城4个区域.调查于2017年3—5月份展开,社区选定综合考虑地理位置、地铁可达性、迁入率以及住房类型等差异,调查地点定于被选社区周边大型休闲场所,具体分布见图2.经调查与问卷回收检验,共获有效样本2 241份,调查样本信息,见表1.
图2 调查点分布
表1 样本基础信息统计(N=2 241)
根据受访者提供的职住地址信息,抓取百度地图公开的南京城市建成环境相关类别的兴趣点数据和城市数据图中的路网数据.基于迁居问卷数据和匹配多源网络数据,建立南京城市迁居人群通勤出行基础数据库.建成指标测算则根据文献[9]推荐的建成环境缓冲区半径,采用以1 km为半径的圆形缓冲区域为区域测度,统计南京迁居人群居住社区建成环境指标.同时,鉴于南京常规公交出行以步行接入为主,相关公交建成环境指标建议采用500 m(步行可达范围)为缓冲区半径,而轨道出行多以共享单车和步行接入为主,则轨道相关建成环境指标采用1 km服务半径计算.表2为基于多源网络平台数据的建成环境统计情况.
表2 建成环境指标统计(N=2 241)
3 模型建立和结果分析
3.1 多项Probit模型
多项Probit模型是基于效用最大化理论的常见离散选择回归模型之一,模型假定效用函数的随机误差项服从正态分布.结合Probit回归模型效用理论和当前迁居人群主要通勤方式,确定慢行交通-ACT、公共交通-PT和小汽车-CAR三项选择肢,构建迁居人群迁居后的通勤方式选择模型的效用函数:
(2)
式中:Uj和Vj(j=ACT,PT,CAR)分别为迁居后改用慢行交通(步行、自行车与电动车三类出行)、公共交通和小汽车通勤的效用函数和可观测效用变量;εj为效用函数中的不可观测误差项;βj为估计的变量参数;∑disc为3×3式的方差-协方差矩阵.误差项服从均值为0,∑disc方差为多元正态分布,函数视迁居后慢行出行通勤群体为参照,对另外两类使用公交和小汽车通勤的群体进行多项Probit回归.
3.2 基于Probit的迁居通勤方式选择分析
利用R语言构建建成环境与迁居个体通勤方式选择的多项Probit模型,以最大似然估计法标定建成环境指标变量参数.模型以非机动出行方式(ACT-步行、自行车和电动车)选择肢为参照,分别对迁居人群当前出行方式(PT-公共交通,CAR-小汽车)进行回归,模型回归后获得的最大似然估计值为-697.497 2,R2为0.15,模型整体效果较好,模型回归结果见表3.表3中与迁居通勤者出行方式选择显著相关的因素有土地用地混合熵、商业用地强度、职住比、交叉口数、公交站点数、轨道站点数、职住同区、居住区位、工作区位、职住通勤距离和通勤时耗.
表3 建成环境-通勤方式Probit回归结果
其中,居住区周边用地混合熵、商业用地强度、职住同区位、居住中心区位与迁居者的机动化通勤显著负相关.当社区居民所在地1 km范围内的用地混合度和商业开发强度较高时,个体迁居者更倾向于使用非机动方式通勤,即高混合度和高强度商业开发区域利于社区居民就近择业,适用于短途非机动通勤.职住隶属同个行政区的居民通勤距离相对较短,其采用非机动通勤的概率更高.居住于中心区的个体迁居者采用非机动通勤的概率更高,中心区土地用地更为紧凑、多元化,其就业资源和机会就更多,区内基本就能满足个体活动的需求,因此短途非机动出行比例更高.
居住区周边500 m范围内交叉口数与个体迁居者的小汽车通勤显著正相关,表示社区周边完备的道路基础设施对迁居个体的小汽车使用有促进作用.通勤时耗和职住通勤距离对两种机动化出行有显著正效应,中长距离、长时间通勤更适于机动化出行.工作地点区位、轨道站点数对迁居个体是否采用公交出行具有一定正效应,即工作点位于城市中心的人群和居住区域周边有轨道服务的迁居者其使用公共交通出行的概率更高,中心区公交服务覆盖率和可达性相对较高,更利于个体公交通勤.
另居住区公交站点和轨道站点对个体小汽车通勤显著正相关,可解释为:①在新一线城市,轨道沿线房源升值空间大也备受欢迎,因此,小汽车通勤群体购买该房源居住的概率也很高;②多数小汽车迁居通勤者对“P+R”模式(轨道交通+小汽车)持较积极的态度;③便捷的地铁或公交服务可便于小汽车通勤者家庭成员的日常出行.
4 结 束 语
文中针对城镇化背景下城市迁居通勤者出行机动化问题,突破以往宏观迁居出行研究惯例以及土地用地数据限制,以南京为例,融合迁居个体通勤出行问卷调查、百度地图API和第三方城市团网络爬虫数据平台,构建基于多源数据融合的南京迁居通勤人群出行数据库.针对迁居人群高比例的机动化出行,构建迁居人群体通勤方式选择的Probit模型,从微观层面探究迁居后个体居住社区的外部建成环境与个体通勤方式选择之间的相关性.模型结果显示,迁居后住宅周边用地混合熵、商业用地强度、职住同区位、居住中心区位对迁居者的机动化通勤具有显著负效应;社区周边交叉口数量、职住通勤距离、通勤时间、轨道站点数、公交站点数与个体迁居者的小汽车通勤显著正相关.