基于多源数据的轨道交通站点步行吸引范围确定方法
2021-09-10王宜堂
摘 要:城市轨道交通站点是乘客采用轨道交通出行的直接服务点和接口,分析城市轨道交通站点的步行吸引范围,能够在一定程度上提高城市轨道交通的线网服务水平。本文设计了一种基于多源数据的轨道交通站点步行吸引范围确定方法,以北京轨道交通站点为例进行了实例分析,更加符合实际的确定了城市轨道交通站点的步行吸引范围。
关键词:城市轨道交通;站点;步行吸引范围;多源数据
0 引言
轨道交通站点客流吸引范围可定义为轨道站点投入运营后对周边客流吸引所涉及的区域,即客流产生区域[1]。由于轨道站点周边居民到达轨道站点会采用不同的交通方式,因此不同的交通方式对轨道交通站点来说都会产生不同的吸引范围[2]。本文基于乘客出行调研、高德地图路径规划API等数据,研究乘客在采用步行接驳轨道站点时的吸引范围。由于步行接驳轨道站点主要受路网的影响,因此步行的吸引范围为站点周边的一定区域,这个区域包含轨道站点在内。
1 多源数据介绍
本文基于多源数据确定轨道站点的步行吸引范围,采用的多源数据包括高德地图POI数据、AFC数据、地产网站居民小区数据、乘客出行调研数据以及高德地图步行路径规划API数据。
1.1 高德地图POI数据
高德地图POI是指地图上的兴趣点,反映现实中的居民小区、写字楼、学校等在地图上的分布,是土地数据的集中反映。本文考虑了居住类、办公类和混合类的POI,其中三类POI包含的具体类别如表1所示:
1.2 AFC数据
目前北京市轨道交通乘客采用刷卡进出站的方式,乘客的刷卡信息都记录在AFC(Automatic Fare Collection)系统中,作为统计车站进出站量的依据,AFC数据的主要字段如表2所示:
其中AFC_ID作为乘客卡号,刷卡类型主要有一卡通和单程票两种。
1.3 地产网站居民小区数据
地产网站如链家、安居客等会提供居民小区数据,本文选取相对较全的链家网站作为居民小区获得的数据源,采用爬虫的方式获取链家网全北京的居民小区数据,获取的主要字段如表3所示:
1.4 乘客出行调研数据
本文通过在站点的高峰期和非高峰期采用RP调查的方式,获取到达轨道交通站点的乘客来源地、从居住地到轨道交通站点所采用的交通方式以及乘客的出行目的等,调研内容如表4所示:
1.5 高德地图步行路径规划API数据
高德地图步行路径规划API通过指定路径规划起始点和终点的名称或经纬度,主要返回步行路径规划API的实际距离和实际时间。
2 步行吸引范围确定方法
本文采用基于数据分析的方法确定轨道站点的步行吸引范围。吸引范围的确定分两步进行:第一步是确定步行接驳时间阈值,第二步是步行接驳时间阈值结合高德地图路径规划API确定步行吸引范围。
Step1:步行接驳时间阈值的确定
乘客最大接驳时间又被称为接驳时间阈值,接驳时间阈值会包含尽可能多的接驳该站点的乘客的接驳时间。接驳时间阈值的确定需要依赖于交通方式接驳轨道站点的接驳数据。对于步行的接驳数据采用调研获取时,由于站点较多,需要采用基于接驳时间阈值影响因素的聚类方法将站点分类,选取典型站点调研,分析其步行接驳时间阈值,再推广到全网站点。得到了步行接驳调研时间数据后,对其进行正态性检验,若接驳时间符合正态分布,则采用正态分布的作为接驳时间阈值,若接驳时间不服从正态分布,则采用DBSCAN聚类算法来确定接驳时间阈值。
Step2:多方式吸引范围的确定
确定了步行接驳时间阈值之后,结合高德地图路径规划API确定在这个阈值范围内乘客采用步行的交通方式能够到达的区域,这个区域即为站点的步行吸引范围[3]。本文步行吸引范围确定的技术路线如图1所示:
2.1 聚类要素与变量确定
城市轨道交通站点步行接驳时间阈值受到很多因素的影响,当城市轨道交通站点区位、站点周边圈层内的职住特性和交通设施因素、站点周边居民情况不同时,站点的步行接驳时间阈值都会发生变化[4,5]。本文从土地利用和站点自身的角度考虑其步行接驳时间阈值的影响因素,分别从站点区位特性、站点轨道可达性、站点周边土地利用的圈层分布情况和站点其他交通方式的可达性对站点进行聚类,所选择的聚类指标如表5所示:
对于轨道站点路网可达性,本文采用基于改进的空间句法的计算方法,设从城市轨道交通中一个站点到另一个站点的最短时间为这两个节点间的深度值,用表示。对城市轨道交通系统,将系统中某个节点到其他所有节点的最短时间的平均值作为分母,将这些最短时间的和作为分子,两者相除得到站点的路网可达性[6]。
其中表示城市轨道交通网络中的站点总数。城市轨道交通站点的路网可达性值越高,表示该站点的可达性越好。
对于站点自行车和公交的接驳可达性,采用基于高德地图路径规划API的接驳可达性计算方法,将站点周边半径2 km的矩形范围内的乘客采用相应的交通方式的平均接驳时间作为相应交通方式的接驳可达性。首先以站点为中心,以半边长为2 km圈定站点周边的矩形区域;然后,将矩形区域以边长100 m的网格进行网格化,取每个网格中心点;最后,对每个网格中心点到轨道站点调用高德地图路径规划API获取其采用自行车和公交方式的接驳时间,将所有网格中心点同一种交通方式的接驳时间的平均值作为该站点该种交通方式的接驳可达性。
2.2 聚类方法的选择
采用K均值算法进行站点聚类。
2.3 聚類过程与步骤
在进行聚类的过程中,由于聚类指标之间有着数量级的差异,因此需要首先对聚类指标进行标准化,这里选择Z-score标准化[7],然后采用基于损失函数SSE和轮廓系数的最优聚类数目确定方法。
获取了典型站点的接驳时间数据之后,对接驳时间数据进行正态性检验,本文采用构造检验统计量法,采用D检验和W检验来进行接驳时间的正态性检验。
根据接驳时间正态性检验结果,若其服从正态分布,则采用极大似然估计进行参数估计,估计出正态分布的参数。根据正态分布的原则,在正态分布的区间内,包含了原始数据99.7%的样本点,因此,本文选用此区间的右侧值,即作为接驳时间的阈值,在这个阈值下,包含了原始数据99.85%的样本点。
对获取的站点的多方式接驳时间数据,当其不服从正态分布时,采用DBSCAN聚类方法确定其接驳时间阈值。
DBSCAN聚类算法的两个设置参数为半径参数Eps和最小样本参数Min_Samples,采用基于轮廓系数和噪声数据比例的方法确定最优的半径参数和最小样本参数,噪声数据比例是一种DBSCAN聚类算法独有的聚类效果评判指标,噪声数据所占的比例越少说明聚类的效果越好,这里的轮廓系数和KMeans中的轮廓系数含义相同。
对站点多方式接驳时间数据DBSCAN的聚类结果,选取除噪声数据之外的最大的接驳时间作为接驳时间的阈值,这样可以使得尽可能多的数据包括在这个阈值之内。
在确定了站点的步行接驳时间阈值之后,调用高德地图步行路径规划API确定步行吸引范围,在调用高德地图步行路径规划API确定吸引范围时,其技术路线如图2所示:
3 案例分析
以北京市轨道站点为例,基于表5中的聚类指标,采用KMeans方法对全网310个站点进行聚类分析。在聚类过程中,聚类的数目和损失函数以及轮廓系数的关系如图3所示,从图中可以看出,最佳聚类数目为3。
根据最佳聚类数目进行KMeans聚类,聚类结果可视化如图4所示:
对于站点的分类结果,类别1代表的站点,以南邵、旧宫、传媒大学为代表,这类站点分布在城市的外围,站点自身可达性和周边其他交通方式接驳可达性最低,但由于这类站点周边的人口分布较多,且站点周边乘客可选择的交通方式有限,因此,这类站点乘客对采用步行方式接驳轨道站点的容忍程度最高,即步行接驳时间阈值最大。类别0代表的站点,以国贸、海淀黄庄为代表,这类站点周边的职位较多但人口不多,在北京市处于3~4环的位置,这类站点自身可达性和周边其他交通方式接驳可达性相比第1类站点较高,但是不及第2类站点,因此这类站点的步行接驳时间阈值处在第2类和第1类之间。类别2代表的站点,以西直门、西单为代表,这类站点周边的人口和职位分布居中且站点大部分分布在城市的二环内,站点可达性和周边的其他交通方式可达性最高,因此这类站点的步行接驳时间阈值最小。
在本文的研究中,站点分类结果用于选择调研的典型站点。
3.1 典型站点步行接驳数据调研
根据北京轨道交通站点聚类的结果,取各类的代表站点进行调研,选取了海淀黄庄、中关村、苏州街、人民大学、知春里、知春路、南邵、旧宫8个代表车站。调研时段涵盖工作日的早高峰、晚高峰和平峰。对每个站点收回的有效调研问卷数量及步行有效问卷数量如表6所示:
在获得调研数据之后,根据乘客来源点、接驳的轨道站点及采用的步行接驳方式,调用高德地图步行路径规划API确定实际的接驳时间,作为乘客的步行接驳时间。
3.2 站点步行接驳阈值确定结果
对问卷调查获取的调研数据,取采用步行接驳方式接驳的乘客的调研数据,对每一类站点,计算得到的调研站点阈值如表7所示:
对每一类站点,将这一类站点中调研站点的步行时间阈值的平均值作为这一类站点的步行接驳时间阈值,并将其推广到这类站点中的其他所有站点,如表8所示:
在确定了站点的步行接驳时间阈值后,需要结合高德地图路径规划API确定步行吸引范围。在实际的接驳过程中,乘客从居住地采用步行方式通过路网到达轨道交通站点,而通过路网的距离和直线距离有一定的差距,传统的研究一种是直接采用直线距离,另一种是采用路网的直线系数进行修正。这两种方式都有弊端,采用直线距离情况下有时候会产生很大的误差,采用直线系数进行修正的情况下往往是路网非常理想的情况,现实中这种理想的情况非常少。因此,为了解决这个问题,采用高德地图路径规划API返回的路径规划数据作为实际数据,能够反映乘客采用不同交通方式最真实的接驳距离和接驳时间。本文在确定步行吸引范围时调用了高德地图步行路径规划API,高德地图步行路径规划API指定的参数和返回的参数在上文中已有介绍。
以西直门和朝阳门代表车站,展示其步行吸引范围确定结果,如图5所示。
北京市全网所有站点的步行吸引范围如图6所示:
4 结论
本文分析了步行的吸引范围特点,采集了步行接驳轨道站点数据,提出了基于步行接驳时间分布特征分析和DBSCAN聚类的接驳时间阈值计算方法,并构建了基于步行接驳时间阈值和高德地图路径规划API的站点步行吸引范围确定方法,确定了站点的步行吸引范围。本文的创新点在于确定站点步行吸引范围时,采用了基于正态性检验和DBSCAN聚类的接驳时间阈值计算方法,并采用了高德地圖路径规划API作为路网的修正工具,实现了将吸引范围确定为更加符合实际接驳情况的不规则多边形。
参考文献:
[1]董婷婷.城市轨道交通站点客流吸引范围研究[D].大连交通大学,2017.
[2]杨京帅,张殿业.城市轨道交通车站合理吸引范围研究[J].中国铁路,2008(3):72-75.
[3]王宜堂.基于空间数据和广义线性贝叶斯的城市轨道交通OD预测[D].北京交通大学,2020.
[4]田国敏.基于城市轨道交通站点与城市空间节点耦合视角下的站点周边地区发展研究[D].长安大学,2017.
[5]李向楠.城市轨道交通站点吸引范围研究[D].西南交通大学,2013.
[6]陈涛.基于改进拓扑度量法的城市轨道交通网络可达性分析[J].2010年交通运输类院校研究生学术论坛委员会.全国交通运输类院校研究生学术论文集:2010:15-19.
[7]徐威,郑长江,马庚华,等.基于k-means聚类的城市轨道交通站点分类研究[J].贵州大学学报(自然科学版),2018,35(6):106-111.
[8]王淑伟,孙立山,荣建.北京市轨道站点吸引范围研究[J].交通运输系统工程与信息,2013,13(3):183-188.