APP下载

基于大数据挖掘的城市公交站点生活服务评价方法研究

2019-04-04翁小雄刘永鑫卢炬康

现代电子技术 2019年2期
关键词:公交站点生活圈服务水平

翁小雄 刘永鑫 卢炬康

关键词: 智慧城市; 公共交通; 数据挖掘; 地理兴趣点; 生活服务水平; 小世界效应

中图分类号: TN919?34; S511; S502            文献标识码: A                  文章编号: 1004?373X(2019)02?0067?04

Research on big data mining based evaluation method for life service

level of urban public transport stops

WENG Xiaoxiong1, LIU Yongxin1, LU Jukang2

(1. School of Civil Engineering and Transportation, South China University of Technology, Guangzhou 510640, China;

2. Guangdong Planning and Designing Institute of Telecommunications, Guangzhou 510630, China)

Abstract: In allusion to the disadvantage of inability to accurately understand the actual resident life service level of public transport stops in the current urban management, a application platform for full?automatic acquisition of urban geographic points of interests (POIs) and bus line network structure data as well as visualization analysis is researched and developed on the basis of cloud computing architecture in the backgrounds of smart city and big data. A searching algorithm for living districts around public transport stops and an evaluation index based on geographic POI data for life service level of public transport stops are proposed. The verification results show that the method can quantitatively evaluate the life service indexes of public transport stops, accurately recognize the economic activity centers of various administrative regions of a city, and measure the gathering degrees of life resources. The method and application platform can provide an important decision?making basis for life service level evaluation of urban public transport stops and urban planning.

Keywords: smart city; public transport; data mining; geographical POI; life service level; small world effect

公共交通系统是现代智慧城市的重要组成部分:一方面,公交系统提供了城市各功能区间最广泛、最廉价的到达服务;另一方面,公共交通作为集约化的出行方式,能有效缓解城市道路交通拥堵,提升通行效率,降低碳排放。因此合理布局公交站點、规划线网成为当前城市规划尤其是交通规划中的热点课题。其中,公共交通站点的生活服务水平评价一直为该领域的难点。

国内外学者在公共交通评价领域开展了大量有关于公交线网服务质量尤其是乘客满意度方面的研究,部分国家或地区已有较完善的标准化手册[1]。国外的研究偏重于公交服务水平评价体系指标对服务满意度的影响[2]。国内,多位研究学者从公交线路站点、公交线路区段、公交线路整体三个方面分层次地对公交服务水平进行评价[3?5]。采用专家打分法建立路段服务水平的加权模型,制定一系列指标系数,应用层次分析方法和灰色关联分析法对公共交通服务水平进行评价研究。

综上所述,传统方式多以问卷调查获取公交线网服务水平反馈结果,但存在以下缺陷:一方面,问卷题目设置缺乏统一标准、答案受乘客主观意识影响强烈;另一方面,传统方法只针对公交系统本身的特征参数进行建模,忽略了城市公交站点承载的生活服务功能,并未揭示城市公交系统对于居民生活服务的真实水平。

针对以上问题,本文提出一套基于大数据的城市公交站点生活服务指数分析方法及应用系统。所开发的应用系统基于云计算架构并结合高德地图API与百度大数据可视化框架,实现海量数据的抓取、处理与可视化。该系统有效融合了城市地理兴趣点(Point of Interest,POI)及城市公交线网结构数据,得到了各个站点的生活圈覆盖范围以及居民生活服务水平,为智慧城市背景下的城市公共交通系统的居民生活服务水平评估及公交站点布局提供了有益参考。

1  系统设计

1.1  系统总体架构

本文系统架构如图1所示,系统软件部分可分为数据抓取、数据处理与数据可视化三大子系统基于云计算架构组建。其中,数据抓取子系统借助高德地图API[6]提供的公交查询接口与城市地理兴趣点查询接口,周期性抓取目标城市的公交线网结构轨迹数据;数据处理子系统为本系统核心模块,基于QT与Python混合框架[7?8]开发;数据可视化子系统则基于百度MapV与百度E?Charts实现空间数据可视化。

本系统硬件由云服务集群中两个节点共同完成。其中,采集与存储节点负责原始数据抓取、预处理,接收运算服务节点的处理结果、并向授权用户提供数据集的网络访问接口。

1.2  关键模块设计与实现

1.2.1  地理信息兴趣点抓取算法

地理信息兴趣点数据采集子系统由QT C++框架结合Javascript地图API开发,其工作流程如图2所示。由图2可知,在某区域地理兴趣点的采集过程开始前,首先根据目标区域经纬度极大值与极小值,将目标区域切分为多个50 m×50 m的正方形网格,并为数据采集节点中每一个线程分配均等数量的待处理网格,形成处理队列;采集开始后,每个线程均按图2所示流程遍历待处理队列直到采集结束。在此过程中,设定网络超时时间为10 s,即超过10 s未得到高德服务器的返回结果则暂停采集,并在随机间隔[tb(tb<10 s)]秒后继续采集。高德地图与百度地图使用不同的坐标系,因此采集得到的结果还必须进行转换。

1.2.2  站点生活圈搜索算法

为评价公交站点的居民生活服务水平,本研究定义公交站点所形成的生活圈为从该站點出发45 min内,经最多一次换乘,且步行距离少于600 m,能到达所有公交站点。为简化计算,车辆的行驶速度定[5]为18 km/h,乘客步行速度[6]为1.2 m/s。

将公交站点生活圈搜索问题按乘客从站点[si]到达站点[sj]附近的地理信息兴趣点[pk]方式分为三种情况分别讨论:

1) 直达(记为:[si→sj→pk]);

2) 一次换乘无需步行(记为:[si→t1→sj→pk]);

3) 一次换乘且需步行(记为:[si→t1t2→sj→pk])。

第一种情况,搜索算法直接通过线路轨迹以及公交车辆行驶速度搜索满足45 min内可到达的站点,流程如图3所示。

由图3可知,为进一步缩短搜索时间,本研究采用倒序法对整条线路的站点进行搜索。该算法由该线路在上下行方向上最后一个站点[slast]开始,计算其与起始站点[si]间的时间距离,若满足45 min可达的限定条件,则将[si]至[slast]间所有站点加入集合;否则,继续从[slast-1]向[si]搜索判断。

设第一步得到的集合为[Sd],则对于需换乘到达的站点搜索步骤为:

1) 计算[Sd]中各站点[Sd,k,Sd,k∈Sd],搜索其600 m步行距离内可达的所有站点集合,记为[Sp];

2) 对[Sp]中每个站点[Sp,kSp,k∈Sp]及其隶属线路,使用倒序法搜索由满足时间限制条件[tSi-Sd,k+tSd,k-Sp,k+tSp,k-Se,k≤45  min]的站点,这些站点记为[Se,k],又令[Se,k∈Se]

3) 由[si]所形成的生活圈为:[Sil=Sd∪Sp∪Se]。

1.2.3  站点生活圈服务指数

本文借助城市地理兴趣点评价站点[si]所形成的生活圈对居民生活的服务水平。首先,将由高德地图采集抓取的POI类型进行归并为餐饮、购物、生活服务3类;其次,对每个站点[si],提取出其生活圈[Sil]中每个站点500 m范围内的地理信息兴趣点,并由下式计算出该站点的生活服务指数[Li]:

[Li=mwmk1Dk,i]

式中:[Dk,i]为第k个POI点与[si]的距离;[wm]为第m类兴趣点的权重。在本文中,假设各类兴趣点权重相同。

2  系统测试与应用案例

本文以南方某城市为例,POI数据采集所覆盖矩形区域西北角经纬度为113.086 666E,22.444 382N;东南角经纬度为113.671 344E,21.873 718W;长为60 088.5 m;宽为63 455 m;划分为1 529 013个采集区域,分配给20个子线程;采集耗时约8.5 h;平均每个网格采集时间为0.19 s;共得到129 766个地理兴趣点。同时本系统提取了目标城市275条公交线路,经过处理分析,得到2 795个公交站点与2 794 781条线路轨迹,线路采集平均处理速度为每秒10.67条公交线路。

以目标城市唐家市场站为例,所形成的生活圈中各站点及其评分如图4所示,由图4可以看到唐家市场本身产生的生活圈中,评分值最高的站点与该站并不重合,而是偏移到珠海市中心。

主城区范围内各公交站点生活服务水平评分及其空间分布见图4b),生活服务水平较高的站点多为公交线路较密集的区域。其中,主城区评分值均在4分以上,远高于其他辖区;另一方面,虽然斗门区也拥有较为繁密的公共交通线网,但其大部分站点的生活服务质量评分均在1~2分,远低于主城区。

由图5可知,大多数(50.3%)站点评分值处于0~0.5的区间内,且随着评分值增加,满足要求的公交站点数量逐渐减少。表明该城市发展的“小世界”效应明显,即大部分资源只集中在少数基础设施周围。

全市范围内公交站点周边的兴趣点数量及生活服务指数分布见图6a),生活服务指数与穿过站点的线路数间的关系见图6b)。由图6a)可知生活服务指数随着地理兴趣点数量增加呈发散的线性上升趋势,得到的拟合模型为:y=0.003 58x-0.001 745([R2=0.94])。由图6b)知,某站点的生活服务指数与穿过该站点的公交线路条数并无直接关系。原因是该城區部分枢纽站点周围并没有配套足够的生活设施;而部分生活服务指数高的站点,如部分学校周边,经过的公交线路却不足5条。

为进一步验证本方法的有效性,以站点500 m范围内地理信息兴趣点个数为基准绘制主城区的公交站点服务水平评价图如图7a)所示,在相同数据可视化方法(色阶从数字最小值到最大值分7等份均匀分布)下,本方法得到的生活服务水平评价图如图7b)所示。假设将红点(服务等级最高)视为辖区经济活动的中心区。仅以兴趣点数量为参数的评价指标虽然也能识别出中国香洲、拱北与斗门三个辖区中的经济中心,但错过了南屏商业区(该市最大的购物广场),该商业区虽然600 m内兴趣点数量低于其他商业区,但所有兴趣点集中在公交站点周围,因此服务水平较高。以上试验说明本研究所提供的方法较常规方法具有更合理更高的可信度。

3  结  论

本文提出一套基于大数据的智慧城市公交站点生活服务水平评价方法,并提供了全自动化的数据抓取与大数据可视化分析平台构建方案。并利用该平台针对南方某城市进行了试验验证,结果表明,该方法能够非常有效地识别城市各辖区内的经济活动中心,为城市精准规划与公交线网优化布局的应用提供参考方向和决策支持。在本文的基础上,未来可融合其他数据,尤其是公共交通客流数据研究公交站点及其周围地理兴趣点对居民出行的影响,并探讨如何通过交通线网建设与城市规划避免资源过度集中,这也是本研究下一步需要做的工作。

参考文献

[1] TYRINOPOULOS Y, ANTONIOU C. Public transit user satisfaction: variability and policy implications [J]. Transport policy, 2008, 15(4): 260?272.

[2] EBOLI L, MAZZULLA G. A methodology for evaluating transit service quality based on subjective and objective measures from the passenger′s point of view [J]. Transport policy, 2011, 18(1): 172?181.

[3] 井国龙.基于多源数据的常规公交分层次服务水平评价模型[D].北京:北京交通大学,2010.

JING Guolong. Stratified measurement model of service levels for public transportation based on multi?source data [D]. Beijing: Beijing Jiaotong University, 2010.

[4] 梁利.基于变异粒子群算法的公交线网分层优化研究[D].兰州:兰州交通大学,2014.

LIANG Li. Research on hierarchical optimization of public traffic network based on particle swarm optimization algorithm with mutation [D]. Lanzhou: Lanzhou Jiaotong University, 2014.

[5] 周锐.基于IC卡数据的公交站点客流推算方法[D].北京:北京交通大学,2012.

ZHOU Rui. Passenger flow calculation for bus stations based on IC card data [D]. Beijing: Beijing Jiaotong University, 2012.

[6] 向玉云,高爽,陈云红,等.百度、高德及Google地图API比较研究[J].软件导刊,2017,16(9):19?21.

XIANG Yuyun, GAO Shuang, CHEN Yunhong, et al. A comparative study of Baidu map API, Lbs Amap API and Google Maps API [J]. Software guide, 2017, 16(9): 19?21.

[7] BLANCHETTE J, SUMMERFIELD M. C++ GUI programming with Qt 4 [M]. New Jersey: Prentice Hall, 2008.

[8] SANNER M F. Python: a programming language for software integration and development [J]. Journal of molecular graphics & modelling, 1999, 17(1): 57?61.

[9] WEI Y, SANTHANA?VANNAN S K, COOK R B. Discover, visualize, and deliver geospatial data through OGC standards?based WebGIS system [C]// Proceedings of 17th International Conference on Geoinformatics. Fairfax: IEEE, 2009: 1?6.

[10] WANG Y, LI Y, TIAN D, et al. A method of visual management platform for connected vehicles data [C]// Proceedings of International Conference on Connected Vehicles and Expo. Shenzhen: IEEE, 2016: 175?179.

猜你喜欢

公交站点生活圈服务水平
一段从“幼儿生活圈”开始的特别时光——浅谈促进小班幼儿开学适应的共育策略
呼和浩特市中心城区生活圈划分研究
遂宁市:提升社保服务水平 夯实保障民生基础
广州周边:价格洼地!“一小时”生活圈 7字头置业广州后花园
合肥市高铁南站公交线路优化研究
基于GIS的哈尔滨市118路公交站点选址优化
加强图书馆管理 提高服务水平
提升粮食流通社会化服务水平的举措构思
Vipersat升级版
——HeightsTM用高效率和智能化提升服务水平
当动物走进人类的生活圈