基于网络爬虫的南京市共享单车时空特征分析
2018-02-19黄梦雪朱艳慧
黄梦雪,殷 莉,朱艳慧,曹 敏
(南京师范大学地理科学学院,江苏 南京 210023)
0 引 言
自行车交通具有灵活轻便、可达性高、绿色环保等特点,相对于步行交通而言也具有相对更高的出行效率。因此,许多城市都开始大力支持、推广自行车系统发展,并将其视为未来城市交通体系中的重要组成部分之一[1]。其中,以共享单车为代表的慢行交通的出现,解决了轨道交通及地面公共交通难以实现“最后一公里”末端需求的弊端,充分展现出其定位与重要性。共享单车指得是企业在校园、交通枢纽(如公交站、地铁站)、居民区、商圈、公共服务区等提供有偿自行车共享服务,是共享经济的一种新形态。当前流行的共享单车主要为无桩型互联网共享单车,是通过APP寻找车辆,利用扫描二维码等智能方式一键解锁的自行车,可通过后台远程实时监控车辆健康和运营状态[2]。
国内外在公共自行车领域中的理论创新与实践应用为共享单车的诞生奠定了基础。我国移动互联网技术的蓬勃发展,为共享单车的诞生创造了必备的技术条件。共享单车的“无桩、共享”模式最早由ofo小黄车于2015年创始,经过三年多的发展,市场上己出现摩拜单车、小蓝单车、哈罗单车、酷骑、优拜等多家共享单车运营公司。已有的共享单车研究主要集中在对其盈利模式[3]、运营模式[4]、结合政策层面与用户层面的发展策略[5]等方面的分析,如:薛强[6]借助一系列在线调查手段,对我国共享单车用户的使用情况做出分析;李琨浩[7]借助PEST模型以及SWOT-PEST矩阵等工具,分析了共享单车在政府层面、经济层面、社会层面以及技术层面中存在的优势与劣势、机遇和挑战。同时,也有一些学者从定量角度,分析了共享单车骑行行为特征[8]。已有的这些研究多是定性层面研究,缺乏从定量角度深入分析共享单车的时空分布规律,在共享单车“随骑随停”这种看似毫无规律的“布朗运动”中,实际也存在一定的客观时空规律。而深刻地理解并把握共享单车这一时空发展规律,有助于提高共享单车服务效率,提升服务质量,从而更好满足共享单车用户的需求。
本研究中共享单车指的是无桩型互联网共享单车,自2017年初起,摩拜单车、ofo、小蓝单车等企业均已进入南京市场,共计投放了45万辆单车。本文将立足于共享单车,利用点模式分析方法对南京市共享单车分布特征进行研究,探讨南京市共享单车的日使用特征、空间分布特征和空间聚集特征。
1 南京市共享单车数据爬取
1.1 研究区域
南京市共辖11个区,83个街道办事处和17个镇,覆盖面积广。根据南京市人口密度、都市空间布局结构及路网结构,本文的研究范围选取南京市中心城区,即行政区划上包含玄武区、鼓楼区、建邺区和秦淮区的全部范围为研究案例区域(图1)。
图1 研究区域范围
1.2 基于Charles网络爬虫的单车数据爬取
利用Charles网络爬虫工具,对南京市摩拜单车、ofo单车的多时间序列的共享单车数据进行爬取,通过筛选、查重和实地验证等方式确定共享单车数据准确性,并进行地理坐标系投影转换,完成地理位置配准。以秦淮区为实例,爬取获得的共享单车数据及其属性表如下所示(图2)。
共享单车分布点数据获取的关键步骤为:① 对多个不同共享单车的APP及微信小程序进行抓包;② 使用Python语言编写代码,模拟微信小程序,获取ofo和摩拜单车数据;③ 进行一次抓取最终得到的数据内容包括单车ID、单车类型、单车位置坐标X,Y等;④ 将代码部署到服务器,获取南京市共享单车信息。截至2018年4月12日,共获取到南京市主城区共享单车2018年3月11日—4月12日共32天3 072份数据(图3)。
图2 秦淮区共享单车示例图及单车属性表
图3 共享单车日使用量统计图
2 单车核密度估计方法
核密度估计是探索事件热点区域的有效方法。地理事件在空间点密度大的区域发生的概率大,在空间点密度低的区域发生的概率低。通过对空间内每个实体设置一个核函数,利用该函数来表示数据在该点邻域内的分布。对于任一点S,影响核密度计算的因素主要包括:核函数所影响的领域范围(称为带宽)和各个点的核函数形状以及两点之间的距离。对于整个空间内点S的核密度估计见式(1):
(1)
式(1)中,n表示距离阈值范围内包含的空间实体的数量,K( )表示核函数,h表示距离阈值(带宽),d(s,sj)表示两点间的欧氏距离。
研究表明,带宽的选择需要经过多次试验研究才能确定,且带宽确定后,不同形式的核函数对核密度的估计影响很小。目前常用的核函数为四次多项核函数:
(2)
3 南京市共享单车时空特征分析
3.1 共享单车时间特征分析
选择天气情况良好的一周进行共享单车周特征分析,具体日期为3月11—17日,每隔15 min统计共享单车位置信息。以两次信息中单车编号相同、位置移动超过200 m的单车定义为被使用单车,将被使用的单车数量与单车总量的比值作为共享单车使用率。参考已有的文献,将早高峰期定义为6~9 h,晚高峰定义为16~19 h,分别计算早高峰、晚高峰、全天时段的共享单车平均使用率(图4)。
图4 共享单车使用率统计图
针对一周内共享单车使用率统计图分析得出:3月15日共享单车晚高峰使用率明显降低,当天下午天气为小到中雨,一定程度上说明共享单车出行受天气影响较大。共享单车的使用量具有明显的工作日和双休日差异特征,周一到周五的日平均使用量明显高于周六、周日,主要因为工作日包含了大量的以通勤为目的的骑行行为。工作日的单车使用率具有明显的早、晚高峰特性,其中早高峰使用量高于晚高峰时期使用量,而双休日的单车使用率则不存在显著的峰值特征。
为了更准确地确定共享单车使用量的峰值,本研究选取了骑行需求量最高的3月13日进行全时段分析,对摩拜和ofo两类共享单车的日使用量进行统计。如图3所示,研究发现:南京市中心城区摩拜单车和ofo单车使用量的峰值都在8 h和18 h,同时ofo单车在22 h出现了一个小峰值。结合共享单车骑行使用率增长特征,研究将早高峰时期确定为7∶00—9∶00,晚高峰时期确定为17∶00—19∶30。在这两个时间段内,骑行量出现短时间内的激增现象,因此这两个时间段是共享单车骑行供需承压的重要考验时间段,也将作为共享单车使用空间特征分析的重点时间段。
3.2 共享单车空间分布特征分析
针对获取到的南京市主城区共享单车3月11日—4月12日共32天3 072份数据,剔除受天气影响较大的日期数据,计算得到南京市中心城区各区域共享单车数量平均值(表1)。研究区内共享单车共110 563辆,其中摩拜单车42 688辆,ofo单车67 875辆。本文研究区面积约为265.97 km2,人口约为334.71万人。
本文采用数量指标和密度指标两类指标对各个行政区内共享单车分布情况进行统计分析。数量指标即统计各行政区域内各个单车的总体数量。密度指标分为:共享单车每万人拥有量,各行政区域内每万人所拥有的共享单车数量,用于表现共享单车在各行政区域内的供应强度;共享单车面积密度,即各行政区划内每平方千米的共享单车总数,用于表现共享单车在不同区域的分布强度。
表1 研究区共享单车数量及密度特征
从表1分析得出,每万人拥有共享单车数最大分布在建邺区,最小则分布在鼓楼区,这一分布特性一定程度上说明了建邺区的共享单车投放量大、供应充足,而鼓楼区的共享单车投放量小,存在一定程度的需求紧张特征。共享单车面积密度最大区域分布在秦淮区,而共享单车面积密度最小区域分布在玄武区,一定程度上说明秦淮区的共享单车分布较多而密集,鼓楼区的共享单车分布较为较少而分散。
图5 南京市共享单车核密度示意图
为了进一步探究南京市中心城区共享单车分布聚集性特征,采用核密度分析方法,对研究区共享单车冷热点分布区域进行探测(图5)。结果显示:南京市共享单车具有显著的冷热点分布特征,共享单车核密度较大的区域集中在朝天宫附近,而共享单车核密度较小的区域主要分布区域为江心洲街道、幕府山街道。在中心城区新街口、朝天宫、夫子庙附近形成较大的聚集圈。在莫愁湖街道、南苑街道形成聚集带以及建宁路街道、光华路街道、秦虹街道、河西中央商务区、沙洲街道形成聚集点。综上所述南京市共享单车分布形成了“一集聚圈、一集聚带、多集聚点”的这一重要的空间分布特征。
4 结 语
作为共享经济的产物,共享单车相对步行交通具有更高的出行效率,一定程度上解决了轨道交通及地面公共交通难以实现“最后一公里”末端需求的弊端。本文结合网络爬虫工具,爬取南京市共享单车数据,并经过准确性分析、坐标转换、无效数据剔除等数据预处理步骤,得到有效的用于时空特征分析的数据。结合统计分析、核密度分析等空间数据分析方法,探讨了南京市共享单车时间、空间分布特征。研究发现,在时间序列上,南京市共享单车具有周使用特征和日使用特征,受通勤行为影响,共享单车的使用量具有明显的工作日和双休日差异特征,在工作日的早8 h与晚6 h,共享单车具有两个明显的出行高峰值,而双休日不具备明显的峰值特征。在空间分布上,从共享单车每万人拥有量、共享单车区域分布密度两个角度,分析了南京市共享单车分布具有一定的集聚性特征,通过热点探测分析,揭示了共享单车密集区域分布具有明显的空间“一集聚圈、一集聚带、多集聚点”的特征。基于网络爬虫的南京市共享单车时空分布特征分析,为南京市共享单车的发展提供了一定程度参考作用,有利于相关部门提高共享单车服务效率。