APP下载

基于机器学习模型的建成环境对小汽车拥有行为的影响

2020-09-01王晓全邵春福尹超英

交通运输系统工程与信息 2020年4期
关键词:居住地小汽车土地利用

王晓全,邵春福,管 岭,尹超英

(北京交通大学综合交通运输大数据应用技术交通运输行业重点实验室,北京100044)

0 引 言

随着城市化进程加快和社会经济水平提高,城市居民对小汽车依赖程度逐渐提高,小汽车依赖性增强带来的交通拥堵和尾气排放问题给城市交通及环境系统带来了严峻挑战.探究土地利用和小汽车依赖之间的关系被认为是解决小汽车增长带来交通及环境问题的重要手段.

既有研究对建成环境与小汽车拥有之间的关系进行了探讨.尹超英等[1]构建路径分析—离散选择一体化模型分析建成环境对小汽车拥有和使用行为的影响,结果表明,居住地建成环境对小汽车拥有行为具有显著影响.王晓全等[2]考虑交通小区之间的相关性,基于Bayesian层次模型分析了居住地建成环境对小汽车拥有行为的影响,结果表明,控制交通小区间的相关性和个体社会经济属性后,居住地建成环境仍对家庭小汽车拥有行为具有显著影响.丁川[3]构建考虑空间异质性的多层次序Probit模型,研究居住地建成环境对小汽车拥有的影响,结果表明,居住地建成环境对小汽车拥有具有显著影响.Yin等[4]同时分析城市层和社区层建成环境对小汽车拥有行为的影响,揭示不同尺度建成环境对家庭小汽车拥有行为的影响.Guo[5]以纽约市城区调查数据为例,分析居住地建成环境和停车可用性对家庭小汽车拥有行为的影响,发现在控制社会经济属性后,居住地的建成环境属性和停车供给均会影响家庭小汽车拥有行为.既有研究多关注居住地建成环境对小汽车拥有的影响,较少关注工作地建成环境对小汽车拥有行为的影响[6].此外,现有研究多是基于传统的统计模型分析建成环境对小汽车拥有行为的影响,模型结果仅给出建成环境变量和小汽车拥有行为之间的统计显著性,无法量化各个属性对小汽车拥有行为的影响程度,然而各个属性的作用程度对城市规划及交通政策的制定具有重要意义[7].因此,有必要构建机器学习模型量化捕捉居住地和工作地建成环境属性对小汽车拥有行为的影响程度.

在既有研究的基础上,本文将居住地和工作地建成环境同时纳入模型,通过构建梯度提升迭代决策树(Gradient Boosting Decision Tree,GBDT)模型量化捕捉建成环境各要素对家庭小汽车拥有的影响程度.研究结果可为通过优化城市土地利用缓解小汽车依赖提供理论支撑.

1 研究数据

以2012年长春市居民出行调查数据为基础,研究职住地建成环境属性对小汽车拥有行为的影响.长春市居民出行调查数据覆盖长春市5个行政区,237个交通小区.剔除缺失数据,共得到5 201条数据用于实证分析,样本数据中居民职住地位置分布如图1所示.家庭社会经济属性直接从出行调查数据中提取,包括性别、年龄、教育、家庭规模和家庭收入.

职住地建成环境属性均包括:到中央商务区(Central Business District,CBD)距离、土地利用混合度、公共交通站点密度及交叉口密度4个变量,分别用于度量建成环境的“目的地可达性”“多样性”“公共交通可达性”“设计”4个维度.建成环境各变量均基于ArcGIS平台计算得到.首先,根据出行调查数据中记录的居民居住地和工作地的地理位置信息对居民的职住地进行定位;其次,根据定位计算职住地到CBD的欧几里得距离;同时,根据长春市交通地图计算得到各交通小区的交叉口密度;最后,基于高德地图API 提取兴趣点(Point of Interest,POI)数据,计算交通小区公共交通站点密度及土地利用混合度.土地利用混合度基于熵指数法计算得到,计算所利用的11种兴趣点数据包括:住宅、宾馆、餐饮、超市、公园、广场、购物中心、学校、医院、银行及政府[8],计算过程为

式中:pij为交通小区j内第i种兴趣点所占的比例;Nj为交通小区j内包含的POI种类数.

居民社会经济属性和职住地建成环境属性的描述性统计结果如表1所示.

表1 变量描述性统计结果Table1 Descriptive statistics of explanatory variables

2 模型构建

因各影响因素度量方式(包括单位和数量级等)不同,传统的统计学模型难以估计各属性对因变量的作用程度.本文构建GBDT模型分析社会经济属性及职住地建成环境属性对小汽车拥有行为的影响程度.GBDT模型是一种基于迭代的决策树算法,被广泛应用于捕捉各自变量对因变量的作用程度[7-8].

近似函数定义为弱分类器的迭代形式,即

式中:γj、c为待估计参数;hj(x)为弱分类器j的估计结果;J为弱分类器数量.

通过梯度提升方法估计GBDT模型参数的计算过程如下:

Step 1算法初始化,设置F0(x)为常数值,γ为待估参数,,设置最大迭代次数M.

Step 2计算第m次迭代的残差,rim=

Step 3利用弱分类器hm(x)拟合Step 2中得到的残差rim.

Step 4估计乘子,

Step 5更新,Fm(x)=Fm-1(x)+γmhm(x).

Step 6判断是否达到迭代次数和精度要求.满足,则得到最终估计结果;否则,返回Step 2.

GBDT模型通过计算所有加法树的均值,量化捕捉外生变量对内生变量的影响程度,即

式中:为对小汽车拥有行为的影响程度;Tj为加法树j;为加法树j中自变量xi对小汽车拥有行为的影响程度;t为树的终端节点;H为终端节点数量;为调整因子;v(t)为用于判断i是否属于该分割区域的函数;当i属于该分割区域时,I(·)值为1,否则,I(·)值为0.

为量化社会经济属性和职住地建成环境属性对小汽车拥有行为的影响,利用五折交叉验证方法确定模型参数.数据被随机平均分为5份,在执行过程中1份数据作为验证集合,4份作为训练集合,程序执行5次能够稳定估计结果;将学习速率设置为0.001,树的复杂度设置为10.

3 模型结果

各外生变量对小汽车影响程度的估计结果如表2所示.由表2可知,社会经济属性对小汽车拥有行为的影响程度最大,为58.95%,表明与职住地建成环境属性相比,社会经济属性仍是影响小汽车拥有行为的最主要因素.对于建成环境属性而言,职住地建成环境对小汽车拥有行为的影响程度为41.05%,其中,居住地建成环境属性的影响程度为23.77%,工作地建成环境的影响程度为17.28%.尽管居住地建成环境属性对小汽车拥有行为的影响高于工作地,在推进城市土地利用政策时,对商业中心等就业岗位集中地区的土地利用规划亦是缓解小汽车增长的重要手段.

表2 各外生变量对小汽车拥有的影响程度Table2 Relative contribution of influential factors to explaining automobile ownership

社会经济属性中,家庭收入、教育水平和年龄是对小汽车拥有行为影响程度较大的3个因素.其中,家庭收入是对小汽车拥有行为影响最大的变量,这一结论与已有研究结果类似,如Yin等[4]针对中国48个城市的居民小汽车拥有行为进行建模发现,在中国社会环境下家庭收入是影响家庭小汽车拥有的重要因素.作为排名第2的变量,教育水平对小汽车拥有行为的作用程度为13.98%,也被诸多研究所证实[10].年龄对小汽车拥有行为影响程度排名第3,即10.67%.此外,家庭规模和性别对小汽车拥有行为的作用程度分别为6.05%和3.23%.

居住地建成环境属性中,除交叉口密度外,其他建成环境因素对小汽车拥有行为的作用程度均高于对应的工作地建成环境属性.其中,土地利用混合度是所有居住地建成环境中对小汽车拥有行为影响最大的因素,此结论为已有研究结论“土地利用混合开发可减少小汽车依赖行为”提供了理论支持[1].到CBD距离对小汽车拥有行为的影响程度仅次于土地利用混合度,为7.20%,表明居住地的空间位置是影响小汽车拥有行为的重要因素之一.公共交通站点密度对小汽车拥有行为的影响程度为5.83%.交叉口密度对小汽车拥有行为的作用较弱为1.02%.

工作地建成环境属性中,土地利用混合度仍是小汽车拥有行为最重要的影响因素.工作地交叉口密度对小汽车拥有行为的作用程度为5.94%,这也是工作地建成环境变量中唯一影响程度高于居住地建成环境的变量.此外,工作地到CBD距离及公共交通站点密度对小汽车拥有行为的作用程度分别为4.04%和0.87%.

由此可见,居民在小汽车拥有行为决策过程中,社会经济属性、居住地及工作地建成环境均发挥重要作用.

4 结 论

针对既有研究多忽略工作地建成环境对小汽车拥有的影响,本文基于GBDT模型对家庭小汽车拥有行为的影响因素进行建模,分析了职住地建成环境对小汽车拥有的作用程度.基于居民出行调查数据的实证研究表明,职住地建成环境均在小汽车拥有行为决策中发挥重要作用.本文可为通过城市规划手段减缓小汽车拥有提供理论基础.本文只考虑了各因素的作用程度,未能对各因素的影响方向进行分析,研究成果具有一定的局限性,未来在作用程度建模的基础上,分析各因素与小汽车拥有的非线性关系.

猜你喜欢

居住地小汽车土地利用
小汽车
你熟悉“成长经典”吗
我的玩具小汽车
拼一拼
鸟类居住地
土地利用生态系统服务研究进展及启示
流动人口参与居住地选举的困境及其实现路径
滨海县土地利用挖潜方向在哪里
山东:符合条件外来人口可在居住地申请低保
论低碳经济与转变土地利用方式