城市轨道交通站点分类的聚类方法研究

2015-03-09李向楠

铁道标准设计 2015年4期

关键词：聚类分析城市轨道交通因子分析

李向楠

(中铁第四勘察设计院集团有限公司，武汉　430063)

城市轨道交通站点分类的聚类方法研究

李向楠

(中铁第四勘察设计院集团有限公司，武汉430063)

摘要：在城市轨道交通相关研究中，需要对站点进行划分，讨论不同站点的差异性。采用聚类分析的方法，选取站点自身特点和站点环境特征等相关的11个因素作为聚类分析的初始变量，对变量进行量化和标准化。对标准化的变量进行因子分析，从变量中提取隐藏的三个公共因子：步行环境因子、站点规模因子、站点接驳因子，达到突出特点和降低变量维度的效果。采用K-均值法，根据提取的公共因子进行聚类，最终将成都地铁1号线现运营16个站点划分为五大类。

关键词：城市轨道交通；站点分类；聚类分析；因子分析；K-均值法

1概述

在城市轨道交通站点周边空间土地开发与利用、基础设施衔接规划以及客流吸引特征等相关研究方面，不同类型的站点间往往存在着较大的差异性。这就需要对城市轨道交通站点进行类别划分，来讨论不同类型站点间的这种差异。国内对于站点分类研究主要是结合站点的节点属性和场所属性，做定性分析[1-2]。综合轨道交通站点的自身特点和站点周边环境等相关因素，采用因子分析和聚类分析的方法，对站点在这些因素变量上的相似程度做定量的计算，得到站点分类结果。这就为站点分类提供了定量的、更为细致的方法，在实际中更具有可操作性，同时也为后续的相关研究打下了基础。

2聚类变量的选择和量化

2.1聚类变量的选取和描述

城市轨道交通站点既是城市交通网络的重要节点和集散点，又是一个城市中的区域场所。站点自身属性体现了站点在交通网络中的节点功能和站点本身具有的特点，而周边环境因素则体现了站点周围建筑、步行环境、相关设施等的空间利用和开发功能特征。综合考虑站点自身特点和站点环境因素，选取站点规模、高峰小时乘降量、站点与中心区距离、站点出入口数量、站点平均间隔距离、站点周边建筑强度、密度、混合度、交叉口密度、接驳公交线路数、站点步行环境11个因素作为聚类分析的初始变量。变量描述见表1。

表1　初始变量的选取

2.2聚类变量的量化

此次研究选取的对象为成都市地铁1号线现在处于运营状态的天府广场站、省体育馆站、世纪城站等16个轨道交通站点，由于处于单线运营状态，研究未考虑轨道线路之间换乘因素的影响。在做相关分析之前，针对选取的聚类分析初始变量，做了相关交通调查，以便于变量的量化。

(1)站点自身特性因素量化

由于选取的5个站点自身特性因素均为数值变量，通过交通调查即可获得相关数据，因此可以直接使用调查数据。其中站点规模以候车面积为度量，体现了旅客等候的空间；高峰小时乘降量是在调查时高峰时段旅客出入站的数量，体现了站点的客流特征；站点与中心区距离体现了站点所处的区域特征；站点出入口数量为站点现使用的出入口数，体现了旅客进入站点的难易程度，是可达性的度量；站点间平均间隔距离是该站点相邻站距的算数平均值，体现了站点在线路中的节点属性。

(2)站点环境因素量化

站点环境因素中，建筑强度密度、建筑强度分别选取范围内的建筑容积率及建筑密度为衡量指标，为数值变量，直接取用。

建筑混合度是站点周边用地多样性和混合程度的度量，混合度一般采用熵值来表达。熵值是一个异质性指数，取值为0～1，数值越接近于1，表示混合度越大[3-5]。定义混合度的熵值为M，则其求值公式

(1)

式中，pi为第i种用地占总用地面积的比例；i表示站点周边区域内用地的种类；k表示用地的种类数量，选取居住用地、商业用地和其他用地，因此k取值为3。

站点建筑强度：选取站点周围500 m范围内容积率作为建筑强度指标。数值变量，直接使用。

站点建筑密度：站点周边500 m范围内建筑物的覆盖率作为建筑密度指标。数值变量，直接使用。

公交接驳条数：站点周围500 m范围内公交接驳条数。数值变量，直接使用。

交叉口密度：选取交叉口密度作为站点步行连接线路数的指标[6-7]，统计站点周围500 m内的交叉口个数。数值变量，直接使用。

站点步行环境[8-9]：体现了旅客步行到达站点的难易程度，步行环境的评价涉及到乘客的主观因素，为定性参数。在调查中采用询问评分的方法，把步行环境分位1-5五个等级，从而转换为数值变量。

(3)数据的标准化

在聚类分析时，由于各聚类变量的量纲不同，因而需要对不同量纲的变量进行标准化。本文采用Z-score标准化的方法

(2)

式中，μj为第j列样本数据的均值；σj为第j列样本数据的标准差。

(3)

(4)

原始数据标准化结果如表2所示。

表2　原始变量标准化结果

注：F1～F11为变量编号，1～16为站点编号(由升仙湖-世纪城)。

3聚类因子提取

由于选取了轨道交通站点的11个特征因素作为聚类分析的初始变量，研究变量数目较多，那么变量与变量之间有可能存在着不同程度的相关性，这就使得观测数据所反应的特征信息有所重叠，为了消除这种信息重叠的影响，选用因子分析的方法，从众多的变量中提取能解释原始变量的隐藏公共因子[10]。通过因子分析，降低了变量的维度和了解研究的复杂性，同时，使得在描述站点时，其特点更加突出。

3.1因子提取过程

(1)因子分析KMO检验和Bartlett’s检验

因子分析中，研究对象为成都地铁1号线16个轨道站点，用到了站点因素的11个变量。根据spss软件计算，得到KMO(Kaiser-Meyer-Olkin)检验值为0.683，变量之间存在较明显的相关性；P检验的值为0.000，数据结构效度较高，原始变量适合进行因子分析，输出结果如表3所示。

表3　因子分析KMO检验和Bartlett’s检验

(2)因子提取

本文采取主成分分析法进行因子提取，经过计算，提取结果输出如表4所示。因子提取结果显示，各原始变量因子提取数值均在0.5以上，说明公因子能有效提取原始变量的信息。

表4　公因子方差

如表5所示，经过因子分析，从11个初始变量中提取特征值大于1的3个公共因子。这3个公共因子所能解释的原样本中80.43%的信息量，因子提取在合理范围内，提取的3个因子可以解释原始样本。

3.2因子提取结果

为了更好地解释提取的公共因子，选择等量最大正交转换的方法，旋转载荷矩阵如表6所示。由表6可知，公共因子Factor1在站点与中心区距离、站点平均间隔距离、建筑强度、建筑密度、建筑混合度、交叉口密度及站点步行环境7个变量上有较大的变量载荷数值，为0.546～0.950，说明公共因子Factor1代表了离城市中心区较近、站点平均间隔较小、建筑密度较大、建筑强度较高、建筑混合度较大、交叉口密度较大、步行环境较好的站点，定义为站点步行环境因子；对于公共因子Factor2，在变量站点规模和站点出入口个数中有较大的载荷值，分别为0.933和0.845，因此公共因子Factor2代表了站点的规模，定义为站点规模因子；公共因子Factor3，在旅客乘降量、接驳公交条数两个变量中有较大的载荷值，分别为0.863和0.622，因此公共因子Factor3代表站点乘降量大、接驳公交线路数较多的站点，可定义为站点接驳因子。

表5　因子分析方差解释

表6　因子分析旋转载荷矩阵

从因子提取结果可知：站点与中心区距离、站点平均间隔距离、建筑环境、交叉口密度及站点步行环境等因素相关性较好，是因为越靠近城市中心区，轨道交通站点密度越大，建筑密集程度及强度相对较高，交叉口密度越大，步行设施越完善；公交接驳条数越多的站点，乘客换乘更加方便，因此旅客乘降量较大；同时由于成都地铁处于建设初期，对规划换乘站空间的预留，和城市中心的南移所导致的岗位的迁移，使得站点规模因素和站点客流量因素之间的相关性相对较差。因此，综合各方面因素考虑，因子提取的结果较为合理。

4站点聚类分析

4.1聚类方法的选择

本文K-均值法(k-means algorithm)进行聚类。K-均值聚类法基本思路是通过迭代算法，逐次的更新各聚类中心的值，直至得到最好的聚类结果。算法的一般步骤如下：

(1)首先适当选择K个类的初始“中心”；

(2)根据距离“中心”最近的原则，寻找与各个个体最为相似的类，将个体分配到各个相应的类中；

(3)在完成个体分配后，针对每一类，计算其所有个体的平均值，作为该类新的“中心”；

(4)根据距离“中心”最近的原则，重新进行所有个体到各个相应类的分配；

(5)返回步骤(3)，直到所有的点不能再分配为止。

4.2相似性度量

相似性度量是指利用原始的，与个体相关的变量值计算出的，能够确定个体之间相似性或距离的值。相似性度量有两种形式，一种是相似性系数法，另一种是空间距离法，以空间距离法应用最多。包括绝对值距离、欧式距离、平方欧式距离、切比雪夫距离等。本文选取平方欧式距离来计算，其定义为

(5)

式中，dij为第i个样本与第j个样本之间的距离；xik，xjk分别为第i个样本与第j个样本中的第k个指标。

4.3结果输出和类别的确定

以提取的三个公共因子为聚类变量，将聚类数据输入，分别选取K值为3、4、5、6对站点进行聚类，经过spss软件计算，输出对应于不同K值的聚类结果，结合实例情况和ANOVA表，聚类中心距离等数据的分析，最终确定K值为5时的聚类结果为本文轨道交通站点聚类结果。结果输出如表7所示。

4.4站点聚类结果及分析

通过spss聚类分析，得到站点分类结果，将所得类的集合定义如下：

Cluster A={升仙湖站、孵化园站、高新站、火车南站、金融城站}，此类别为一般性站点；

Cluster B={火车北站}，此类别为交通枢纽型站点；

Cluster C={骡马市站、文殊院站、人民北路站、桐梓林站、倪家桥站、省体育馆站、华西坝站、锦江宾馆站}，此类型为次级中心站点；

表7　聚类成员列表

Cluster D={天府广场站}，此类行为城市中心型站点；

Cluster E={世纪城}，为中心拓展型终端站点。

站点分类结果如图1所示。

图1　成都市地铁1号线站点分类结果

对所得聚类进行分析，所得结论描述如下所述。

Cluster A中站点一般特点是：距城市中心商务区的距离较远，在轨道交通线网中属于一般性乘降站点，周边土地开发密度及强度较低，旅客乘降量较小，其分类受旅客接驳因素影响较大。

Cluster B中站点一般特点是：驳线公交接路数多，交通用地比例较大，旅客乘降量及其他交通方式接驳换乘量较大，地区交通枢纽特征明显，属于交通枢纽型站点。

Cluster C中站点一般特点是：距离城市中心商务区区距离适中，站点周围步行环境相对良好，公交接驳较为便利，步行到达及离开站点的旅客数量所占比例较大，客流乘降量相对较大，属于城市次级中心站点。

Cluster D中站点包括天府广场站，主要特点为：位置靠近城市中心商务区，站点规模较大，有良好的步行环境；旅客乘降量大，公交接驳线路较多，公交接驳便利；周边用地以商业用地为主，建筑密度及强度较高，为城市中心型站点。

Cluster E中站点主要特点为：距离城市中心商务区较远，站点处于线路终端，旅客乘降量较大，现状常规公交服务相对不完善，外围长途公交所占比例较大；站点周边用地以商业办公为主，其次为居住用地，地铁周边岗位数较多，呈现出一定的城市中心商务区特点，为城市中心拓展型站点。

5结语

本文运用因子分析和K-均值聚类分析相结合的方法，将研究对象中的16个站点进行了5个类别划分，并根据相关调查数据特征和实例的现实状况，将它们的特点予以归纳，分别定义为一般站点、交通枢纽型站点、次级中心站点、城市中心型站点、城市中心拓展型站点。本文不仅为站点的分类提供了一种更具操作性的定量分析方法，也为相关领域的后续研究打下基础。

参考文献：

[1]金磊，彭建，柳昆，等.地铁车站分类理论及方法研究[J].地下空间与工程学报，2010，6(1):1339-1343.

[2]王佳，胡列格.城市轨道交通站点对常规公交客流的吸引范围[J].系统工程，2010，28(1):14-15.

[3]傅博峰，吴娇蓉，陈小鸿.郊区轨道站点分类研究[J].铁道学报，2008，30(6):19-23.

[4]吴娇蓉，毕艳祥，傅博峰.基于郊区轨道站点分类的客流特征和换成系统优先级分析[J].城市轨道交通研究，2007(11)：23，24.

[5]Cervero R， Jin M .“Rail+Property Development : A mode of sustainable transit finance and urbanism”[R]. California， 2008:21，37.

[6]Upchurch C， et al. Using GIS to generate mutually exclusive service areas linking travel on and off a network[J]. Journal of Transport Geography， 2004(12):23-33.

[7]Gutiérrez J, J.C. García-Palomares， Distance-measure impacts on the calculation of transport service areas using GIS[J]. Environment and Planning B: Planning and Design， 2008:480-503.

[8]秦观明.城市轨道交通接驳方式选择及客流吸引范围研究[D].哈尔滨:哈尔滨工业大学，2010.

[9]戴洁，张宁，何铁军，等.步行环境对轨道交通站点接驳范围的影响[J].都市快轨交通，2009：46-49.

[10]Kyung Whan Kim， Deok Whan Lee， Youn Hoo Chun. A Co MParative Study on the Service Coverages of Subways and Buses[J]. KSCE Journal of Civil Engineering, 2010,14(6):915-922.

Classifying Urban Rail Transit Stations Using Cluster Analysis

LI Xiang-nan

(China Railway Siyuan Survey and Design Group co.， Ltd.， Wuhan 430063, China)

Abstract：The related researches on city rail transit require the classification of stations and the discussion of the differences of different stations. This paper uses cluster analysis to classify stations by selecting 11 initial variables relevant to stations characteristics and environment conditions to quantify and standardize the variables. Then， the standardized factors are analyzed and the pedestrian environment factor， station size factor and feeder factor are extracted to highlight the characteristics and reduce dimension of the variables. Finally， the 16 stations of Chengdu metro line 1 are divided into five clusters with k-mean algorithm on the basis of the extracted common factors．

Key words：Urban rail transit; Station classification; Cluster analysis; Factor analysis; K-mean algorithm

中图分类号：U491

文献标识码：A

DOI:10.13238/j.issn.1004-2954.2015.04.006

文章编号：1004-2954(2015)04-0019-05

作者简介：李向楠(1989—)，男，助理工程师，E-mail：lxnfly@163.com。

收稿日期：2014-11-13