桂林市公交换乘网络的实证分析
2020-06-30覃炳发李科赞
覃炳发,李科赞
(桂林电子科技大学数学与计算科学学院,广西 桂林 541004)
1 引言
1.1 研究背景及研究意义
一座城市的交通网络系统的发展程度从侧面反映出了这座城市的发展水平,而城市的公交网络作为交通网络系统中的核心部分,对整个城市的发展以及市民的出行都有着十分重大的促进作用。公交网络发展的好与坏也标志着城市生活的发展水平,公交网络发展程度高说明了该城市市民出行会十分便利,同时也能在一定程度上减少私家车出行数量从而能够减少有害气体的排放,绿色出行,为建设使人民幸福的美好城市奠定夯实的基础。众所周知,公交车出行比小汽车出行能够节省不少的土地资源、建设材料、燃油量以及投资资金,因此,如果一个城市需要壮大发展,那必然是离不开要解决公共交通这一问题,而优先发展公交网络,是解决大多数城市交通问题的有效方法,对公交网络开展实证研究具有重要意义。
桂林市作为快速发展中的国际旅游城市,势必会导致桂林市人口密度持续上升。人口密度一旦上升到某一个高度,就会增加公众的出行以及公共交通的压力。桂林市目前的公共交通主要是依赖公交车,在面对私家车以及人口数量日益增长的严峻形势下,合理的选择就是优化公交网络,为市民提供最佳出行策略。本文的研究将有助于桂林市公交换乘网络的优化,并可以根据研究结果提供不同情形下的市民最优出行乘车选择策略。
1.2 国内外研究现状
在国外,复杂网络研究工作开展得比较早,最初对复杂网络的研究是对经典的七桥问题进行探讨,并以此为基础,数学家Erdös和Rényi对随机图进行了开创性研究[1-2]。在研究初期,人们通常利用规则网络或者完全随机网络来描述实际系统的结构。Watts和Strogatz在1998年的时候提出了WS小世界模型,这是一个从规则网络到完全随机网络的过渡模型[3],它能够更加准确和合理地描述真实系统的拓扑结构。在交通网络研究方面,2002年,Sen等人对印度的铁道网络进行了研究,通过实验结果发现印度的铁路网络是具有小世界特性的[4]。2004年,Seaton等人分别对波士顿和维也纳的铁路网络进行了研究分析,发现该网络也具有小世界特性[5]。2006年,Porta等人收集了几个不同城市的道路网络数据,用复杂网络方法对其进行分析之后发现这些网络不仅具有小世界性,还具有一定的无标度性[6-7]。
在国内,许多学者在复杂网络结构分析方面有很多贡献。2005年,周涛等人发现了真实网络中的小世界效应和无标度特性,这使得许多物理学家纷纷对复杂网络展开了研究[8]。刘涛等人对复杂网络中的一些基本的统计特性进行了比较详细的研究,例如对度分布、平均路径长度以及聚集系数等特性的研究[9]。2008年,李晓佳等人通过实验研究对检验网络的算法进行了评述[10]。2009年,刘建香在复杂网络应用、拓扑性质以及动力学行为等几个方面进行了一定的研究,综合分析了复杂网络今后漫长的道路上的研究重点[11]。2015年,秦李等人提出了一种评价网络中节点重要性的新方法,并通过实验对方法的正确性进行了验证[12]。2016年,刘通应用复杂网络对如何提取文本中的关键词展开了相应的研究[13]。2017年,乔少杰等人提出应用复杂网络大数据的重叠社区检测算法,该算法所需运行时间比传统算法要少[14]。2018年,陈伟华等人应用复杂网络理论,提出了一种评估系统脆弱度的新方法,通过仿真实验验证方法的有效性[15]。2019年,陈东明等人使用社团密合度这一评价标准,设计出具有比传统算法时间复杂度低的全新社团发现算法[16]。
最近几年,中国也有许多学者对不同的公交网络进行了分析,并得出了相应的研究结果。例如,赵金山等人对北京公交换乘网络进行了研究,发现了该网络具有和其他加权网络不同的点权分布这一性质[17]。王喆等人对成都市公交网络的拓扑结构进行了分析[18]。李英等人发现上海公交网络的度分布符合幂律分布,并且还是一个无标度网络[19]。马景富等人发现贵阳市公交网络度分布符合幂律分布[20]。陈强对哈尔滨公交系统进行了研究,指出了哈尔滨公交系统的一些不足之处,并对此给出了一些改善的建议[7]。李东辕比较了中国一些典型城市的公交网络特性,提出了公交网络的一些不足之处,给出了几种公交出行的方案[21]。
除此之外,在2015年,邓加兴运用复杂网络方法分析了桂林市公交站点网络的部分特性,并建立城市道路网络复杂度模型对桂林市两江四湖周围的道路网络进行复杂度分析[22]。张稀琦同时对桂林市的公交站点网络、公交换乘网络以及公交线路网络的特性进行分析,并对公交站点网络的演化机理进行研究[23]。然而,我们注意到,文[22]在研究桂林市公交换乘网络的时候,建立的是无权无向的网络,并未考虑部分公交线路存在上下行线路不一致的情况;文[23]则只是对桂林市公交站点网络进行了较简单的分析,并未对公交换乘网络进行详尽的分析。因此,本文在考虑公交上下行线路不一致的情况下,建立有向网络模型,进一步对整个桂林市区公交换乘网络进行分析。最终对比不考虑上下行线路不一致的情况下所得的结果,分析其中的差异性。
2 桂林市区公交换乘网络建模
2.1 前期准备
通过在网上查阅相关网站,收集到了桂林市区中具有常规编号的全部公交数据以及部分专线线路数据。数据存储的excel表格中,有3 145行数据,共包含了83条不一样的常规公交线路的上行线路和下行线路以及部分专线线路。数据中,不同的公交站点有693个,部分公交数据如表1所示:
表1 桂林市部分公交数据
通过对数据的不断筛选,最终发现桂林市一共有23条线路是上行线路与下行线路不一样的,具体数据如表 2所示。
表2 桂林市上下行不一致的常规公交线路汇总
所以针对这种情况,本文先假设在同一线路内到达终点站后,再从终点站前往后续站点的情形记为已经经历了一次换乘。如图1所示,从一条上下行线路不一致的公交线路的4号站点前往9号站点的时候,经过6号终点站的时候记为换乘了一次。公交线路上下行不一致时,构建模型应当采取相应的措施。因此,本文采用P空间方法[24]建立有向图形式的公交换乘网络。任意一个站点能够指向它在同一线路上不同方向下的前方所有站点,这样便可以很容易表达出公交线路上行和下行不一样的情形。
图1 上下行线路不一致公交线路示意图
考虑到专线线路对本文研究意义不大,因此将该数据剔除。最终用于研究分析的公交线路一共有72条,公交站点有687个。数据量十分庞大,需要对这些数据进行进一步的整理,使得分析数据的时候比较方便。整理数据的方法为,将这些公交线路以及公交站点分别按照处理好的数据表格从上到下,从小到大逐次地编号。
2.2 绘制网络连接图
对公交数据整理完毕后,绘制公交换乘网络的结构图。依据P空间构建方法构建公交换乘有向网络,定义公交站点为网络中的节点。网络中有节点a指向节点b的边,当且仅当节点a和节点b同时出现在同一公交线路的上行或者下行线路上,并且在线路运行方向上,节点b位于节点a的前方。所以,网络中的所有边均为有向边。若节点a指向节点b,同时节点b也指向节点a,那么节点a与b之间的边为双向边。如果两个站点分别在两条不同的线路上,那么就需要从一个开始站点乘坐到两条线路的公共站点,然后换乘另一条线路再到目的站点。在此种情况下,这两个站点之间的线路在网络中至少包含2条边,则需要的换乘次数至少是1次。
在绘制结构图之前,还需构建一个网络图的邻接矩阵,这是表示网络结构图的一种直接表示方法。因为本文需要构建的是有向网络,所以定义的邻接矩阵的结构如式(1)所示:
(1)
在公式(1)中,A(i,j)=1表示的是有从节点i指向节点j的连边,即节点i对应的公交站点可以直达节点j对应的公交站点;相反地,A(i,j)=0表示的是没有从节点i指向节点j的连边。
在构建完桂林市公交换乘网络的邻接矩阵之后,按照矩阵的数据利用Pajek软件绘制的桂林市全部72条常规公交线路以及687个公交站点的桂林市公交换乘网络图如图2所示。从图2中可以很清楚地看出,桂林市公交换乘网络的形状凝聚成一个团状结构,越靠近网络中心的站点所连接的公交线路就越多,即换乘便捷,交通十分便利。
图2 桂林市公交换乘网络示意图
3 桂林市区公交换乘网络特性分析
3.1 度与度分布
定义网络中节点的度值大小为指向该节点的节点数目以及该节点所指向的节点数目之和。度值累积概率分布pl(k)计算方法如式(2)所示:
(2)
图3 节点度值累积概率分布
公式(2)中,N(i)表示度值为i的节点的个数,N为节点总个数。
图3为桂林市公交换乘网络的累积度分布图,用excel对数据进行拟合,得出分布函数y=0.326ln(x)-0.833 2,相关系数为0.963 9,易知,此分布为对数分布。此外,从累积概率分布图中可以看出,在0到100这个度值范围内的累积概率上升速度比较快,这也说明了桂林市公交换乘网络中的节点度值主要集中在[0,100]这个区间内。
3.2 平均最短路径
从节点i到节点j的最短路径,记为dij,在连通节点i与节点j的所有路径中,dij要求是其中最短的。网络直径D=max{dij}。
平均最短路径L为
(3)
表3 平均最短路径
在Pajek构建完桂林市公交换乘网络之后,可以很便捷地求出网络中的平均最短路径,计算结果如表3所示。从表3可以得知,存在2 056个顶点对之间是没有路径连通的,约占全网络的0.436%,所占的比例非常得小,说明网络是具有很强的连通性的。在所有可达的顶点对中,计算得到平均最短路径为2.517 39。这说明在桂林市乘坐公交到达任意目的地的时候,平均需要换乘1.517 39次。与文献[23]构建的无权无向的公交换乘网络相比,本文的有向的换乘网络所得的平均换乘次数为1.517 39,大于文献[23]中的1.07。由于有向网络更贴近实际网络,这说明在实际的公交网络中的乘坐公交会繁琐一些,所需换乘次数更多。
此外,本文还计算得到了换乘网络中的网络直径为6。该直径是从站点编号为49的解放桥(滨江路)站到站点编号为190的电子科大尧山校区站的最短路径。这说明乘坐公交从解放桥(滨江路)站到电子科大尧山校区,期间至少需要换乘5次。造成这一情况出现的原因是,解放桥(滨江路)站点所处的道路为单行线路,仅有2路公交和一条观光专线停靠。如果要从该站点全程搭乘公交至电子科大尧山校区,途中会错过能够快速抵达电子科大尧山校区的站点(如10路车经过的解放东路站等),因此需要不断换乘线路。
3.3 聚类系数和平均聚类系数
记ni为与节点i相连的节点个数,Ei为这ni个节点之间存在的连边数目。定义聚类系数为
(4)
平均聚类系数为
(5)
表4 聚类系数
用Pajek软件求解网络中的聚类系数与平均聚类系数如表4所示。从表4可以看出网络中平均聚类系数的最大值为1,最小值为0.177 630 605,其中值为1的顶点数量为141个,说明这些顶点仅包含在一条公交线路上。平均聚类系数值是0.723 591 58,该值较高说明了网络中站点的聚集效应是比较明显的,即某邻居站点之间比较通畅,需要换乘的次数比较少。与文献[23]中建立的无向网络相比,本文所得的聚类系数为1的节点数目为141,大于文献中的127,但是平均聚类系数为0.724,小于文献[23]中的0.75。同样反映出实际公交网络所需换乘次数更多这一现象。
3.4 介数
定义节点i的介数为
(6)
其中,σst(i)=1表示从节点s到节点t的最短路径会经过i节点,σst(i)=0则表示不经过。σst表示从节点s到节点t的所有最短路径总数目。
表5 介数排序前十的节点
本文在用Pajek计算桂林市公交换乘网络的介数所得结果如表5所示,从表5得知网络中介数最大的是节点编号为57的桂林站,值为0.060 065。这说明在所有的节点中,通过桂林站的最短路径数目是最多的,可以说在桂林站换乘是比较便捷的。但是,介数值较大还反映着一个较大的问题,那就是很可能随时都会造成交通拥堵的情况。因为该站点通过的最短路径数目较多,所以会有较多的公交线路经过。侧面说明该站点的人流量十分密集,人们出行需求的交通方式也多种多样。这样会导致车流量迅速上升,因此很大几率会造成交通拥堵的现象出现。此外,表5中显示节点介数较大的站点还有解放桥站、西城南路北(花生唐)站、辅星路口站以及南门桥南(魅力花园养老公寓)站等公交站,这些公交站点时常也会发生交通拥堵的情况。
3.5 紧密度
定义节点i紧密度为
(7)
从表6紧密度计算结果排序中可以看出,紧密度最大的依旧是桂林站。结合之前的分析,可以说明桂林站在桂林市公交换乘网络中的作用十分重要。单从紧密度来进行分析,紧密度大则反映的是从该站点出发到达其他公交站点的时候,中途所需要换乘次数会比较少,说明桂林站的公共交通十分便捷。
表6 紧密度排序前十的节点
3.6 鲁棒性分析
研究网络的鲁棒性的时候以平均最短路径作为一个指标,因为这与平均换乘次数有着直接的关联。其次再以网络的连通度为另一个指标,定义网络连通度R如式(8):
(8)
其中,Nlink表示顶点对的连通数目,Nall表示顶点对的数量。
图4 平均最短路径及连通度的变化
攻击方式采用随机攻击和蓄意攻击两种。随机攻击是指以同等概率将网络中的节点以及对应的连边删除。蓄意攻击则是根据度值的大小,从大到小依次地将网络中的节点以及对应的连边删除。
从图4可以看出,平均最短路径和连通度在遭受随机攻击的时候,只要节点的删除比例不超过0.5,平均最短路径和连通度的数值基本保持不变。这说明平均最短路径和连通度能够保持不错的稳定性,同时也反映网络在随机攻击下的鲁棒性能良好。但是,网络遭受到蓄意攻击的时候稳定性却有很大的折扣。如图4a,蓄意攻击下,平均最短路径先单调递增,后单调递减,最后趋于平缓。这是由于删除度值较大的节点后,导致了大多数节点之间原有的最短路径遭到破坏,而现有的最短路径大于之前的,所以平均最短路径开始上升。当大量度值大的节点被移除后,网络结构遭到严重破坏,网络从一个大的连通图慢慢变成多个小的连通子图,因而导致后面平均最短路径会下降。同时,这也是导致图4b中连通度持续下降的原因。
3.7 基于PageRank算法的重要节点挖掘
如式(9)为改进的PageRank算法迭代格式[25]:
(9)
根据该迭代格式,编写Matlab程序进行计算。选取每个节点的初始PR值均为1,经过248次迭代后,迭代格式收敛。收敛后最终得到的是每个节点的PR值,表7给出了PR值排名前十的各节点信息。
表7 PR值排序前十站点
表8 度值排序前十站点
从表7可以得知,在所有站点PR值的排序中桂林站排名第一,这个和以站点的度值排序所得的结果一致。但是,和站点度值排序有区别的是,后续的站点排序和PR值的排序不一样,并且排名前十的站点也略有不同。尽管如此,结合表7和表8可知,排名前十的站点中都同时包含了解放桥、南门桥南、辅星路口、西城南路北(花生唐)、艺术馆、十字街(解放路西)、临政路口等站点。两种方法所得的前十个站点的相似比例高达80%。因此,对于此公交网络来说,度越大的站点通常越重要。
4 结论与建议
4.1 结论
桂林市素有世界旅游城市之称。以桂林市为例,运用复杂网络方法,通过收集桂林市公交数据,建立有向的公交换乘网络,并对网络的网络特性以及网络的鲁棒性等进行分析,得出主要结论如下:
1)桂林市公交换乘网络并不是强连通网络,其中存在少数节点对不存在连通路径。计算得到L=2.517 39,说明乘坐公交的平均换乘次数仅为1.517 39次,桂林市公交网络运行状况良好。
2)通过对网络的聚类系数、介数以及紧密度等特性进行分析,综合得知桂林市的交通状况良好,道路通行能力良好。
3)研究网络的鲁棒性的时候,得知两种攻击方法之下网络的鲁棒性能的变化情况以及稳定性有所不同。在遭受随机攻击的时候,能够维持更强的稳定性的是平均最短路径。网络一旦遭受到攻击,不管是什么攻击方式或者攻击强度如何,网络的连通度都明显下降。不过,蓄意攻击要比随机攻击下降得快一些。
4)采用PageRank算法对所有节点的重要性程度进行计算,并对其进行了排序。
5)与无向网络模型相比,更贴实际的有向公交网络所需的换乘次数会更多。
4.2 展望与建议
本文存在的不足之处如下:
1)本文在收集桂林市公交数据的时候,仅是收集桂林市区中含有编号的常规公交线路数据。这些数据只是囊括了桂林市大部分的公交线路,所含数据还不够全面。因此,若要完善桂林市公交换乘网络,可以收集更为全面的公交线路数据。此外,本文只研究了桂林公交的换乘特性,有一定的片面性,若要分析公交网络其他一些性质,还需要另行建模和分析。
2)在分析换乘网络的鲁棒性的时候,采用的攻击方法比较单一,今后可以考虑改进攻击方法对网络重新进行鲁棒性分析。
本文对桂林市公交换乘网络进行了多种分析,得知关于网络的一些特性。根据这些网络特性,给出关于优化公交网络的合理化建议如下:
1)不管是按照度值排序还是按照PR值排序,都是得出桂林站为网络中的最为重要的节点。而该站点的聚类系数和介数等特性的值在网络的节点中相对来说都比较大,说明桂林站虽然重要,却也经常会发生拥堵等交通状况。故而建议桂林市可以加强对桂林站乃至周围的交通的管理,降低桂林站在整个公交网络中的压力。
2)经计算可得,网络的平均最短路径为2.517 39,因而公交出行的平均换乘次数为1.517 39,所以乘坐公交的时候所需要的换乘次数还有待降低。桂林市可以考虑从本文建立的换乘网络中对最短路径较大的一些顶点对所在的公交线路进行优化,降低这些节点之间的平均最短路径,从而降低整个网络中的平均换乘次数,优化市民的出行效率和出行舒适度。