APP下载

基于大数据统计分析的盐城市公共自行车服务系统研究

2017-06-07闫子吟

价值工程 2017年16期
关键词:统计分析大数据

闫子吟

摘要: 城市公共自行车网络是由管理中心、站点、调度中心、通讯网络和互联网业务平台共同构建组成的服务系统。研究公共自行车的借还车规律,为公共自行车系统规划分析决策提供支持,充分发挥公共自行车的综合优势,对改善居民的出行状况、缓解城市交通拥挤、促进城市交通可持续发展具有十分重要意义。本文针对江苏省盐城市公共自行车管理中心提供的数据,首先对所给数据进行预处理,构建了相关统计模型,运用SPSS17.0、EXCEL等软件进行统计分析求解计算,最后提出改进建议。

Abstract: The city public bicycle network is a service system composed of management center, site, dispatch center, communication network and Internet service platform. It is of great significance to study the borrowing and returning law of public bicycles, provide support for the planning and analysis of public bicycle system and give full play to the comprehensive advantages of public bicycles for improving the residents' travel situation, alleviating the urban traffic congestion and promoting the sustainable development of urban traffic. In this paper, based on the data provided by Yancheng Public Bicycle Management Center in Jiangsu Province, the data were pretreated and the relevant statistical models were constructed. SPSS17.0 and EXCEL were used to analyze and calculate the statistical analysis. Finally, the suggestions were put forward.

关键词: 公共自行车;大数据;统计分析;SPSS;EXCEL

Key words: public bike;large data;statistical analysis;SPSS;EXCEL

中图分类号:U491.2 文献标识码:A 文章编号:1006-4311(2017)16-0238-04

0 引言

公共自行车作为一种低碳、环保、节能、健康的出行方式,在倡導“绿色出行,低碳环保,便民服务”和实现经济社会的可持续发展等方面发挥了十分重要的意义。

盐城市公共自行车已实现了大市区全覆盖,现在共有425个公共自行车借还点,10000辆公共自行车。公共自行车系统运行以来,平均每辆车每天要被借用1至1.5次。盐城市公共自行车服务系统是基于在某个区域内,隔一定距离规划出一些停放自行车的点(如社区大门口),一个租赁点放置30辆左右的自行车,很多的自行车租赁点共同组成一个网络,并通过公共自行车管理系统来管理这些自行车。盐城市公共自行车服务系统使用最新的物联网技术,来对整个公共自行车租用系统进行智能化管理,各自行车站点真正实现24小时无人值守和通借通还功能,调度管理中心实时监控和调度各站点的使用状态。

在公共自行车服务系统中,自行车租赁的站点位置及各站点自行车锁桩和自行车数量的配置,对系统的运行效率与用户的满意度有重要的影响。

1 研究前提

1.1 模型假设

以自行车车站号做为借车车站的唯一标识;用户和借车卡之问是一一对应的关系;所搜集到的统计数据能准确描述公共自行车系统管理与运营状况,且真实可靠;用车时长在1min以下的均为异常数据,剔除后不影响数据的整体性。

1.2 数据预处理

观察整体数据发现有许多异常数据,对任意一天的数据统计发现共囊括了425个站点,但是104号站点是空缺值,即站点的编号是1~103和105~425。根据用车时间、用车方式、换车锁桩号、盐城市区公共自行车服务指南等信息剔除一些不合理数据。

①剔除部分用车时间在1分钟以下数据。对于用车时长为0的数据,推断为借车者从某一站点的某一锁桩借出后,在同一锁桩归还;对于用车时长在1分钟之内的数据,可推断为同一车站点借出,又在同一车站点归还的情况。

②剔除还车站号为0的数据。数据中有部分还车站号为0,而且车桩号为0,用车时间也为0。分析此种情形的原因有两点:借车者使用过后,并没有还车;该桩号的公共自行车被盗。这样的数据是没有意义的,理应剔除。

③剔除数据还车车站号不存在的数据。根据盐城市公共自行车站点地图可以知站号最大号为425,但在所统计的数据中,出现了还车站号为29999(不存在)的站号数值,这一类型的数据对研究没有意义应当剔除。

1.3 符号说明

yi:第i个站的频数;

Nk(k=1,2…20):第k天数据记录的有效总数(剔除后的数据);

Zij:第ti个时间在第j次记录中的出现次数;

dij:第i个站到第j个站的距离;

tij:第i个站到第i个站的所用最短时间;

pi:第i个站点的频率。

2 盐城市公共自行车借还车数据统计分析

2.1 研究思路

连续统计各站点20天内(2016年10月8—27日)每天和累计的借车和还车频次,而对于借车与还车频数,可引入0-1变量表示各站第i天借车和还车在j次记录中出现的频数。各站每天和累计的借车频数就是借出车站号在每天出现的次数和总天数的借车频数和,各站每天的借车频率是借出车站号在每天出现的次数与每天的有效数据,累计的借车频率是累计借车的频数比上总有效数据,对于借车每天及累计的频数类似,从而可建立相应的统计模型。根据以上分析,可统计出各站点每天和累计的借车和还车频次,进而可对所有站点累计的借车和还车频次排序。分析每次用车时长的分布情况,可运用相关软件将分布情况作出。

2.2 建立模型

2.3 模型求解

2.3.1 借、还车频次的计算

根据调研数据,代入以上模型,利用SPSS进行求解,得各站20天中每天及累计的借车和还车频次,部分结果如表1-2、图1-4所示。

2.3.2 借、还车累计频次排序

对以上统计的所有站点累计的借车频次与还车频次,根据频率或频数中的其中一个进行排序,因为频率的计算会有小数的误差,为了方便统计,用频数进行排序,排序结果见表3、表4。

由表3可知,累计借车频数最大的站点号为186(铜马广场),借车频数为3746,最小的站点为390(韩资园四期),借车频数为4。其差异原因主要是由于地理位置的不同,铜马广场在盐城市区位于商贸繁华的位置,周围有商场有酒店,借车数相对较多,而韩资园四期周围比较空旷人流活动少。

由表4可知,累计还车频次最高的站点号为186(铜马广场),还车频数为3685,最小的站点为390(韩资园四期)还车频数为4。其差异原因主要是地理位置的不同。

2.3.3 每次用车时长的分布

对于每次用车时长的分布情况,根据统计数据,用SPSS统计出分布时间对应的频数可画出用车时长的分布直方图。随机抽取20天中某几天用车时间与20天累积数据用车时间的分布对比图(图5,图6)。

由图形分布情况可以看出:每一天和20天内累计用车时长的分布情况基本相同,因此分析用车时长可以用20天内累计的数据。通过查找分布图可知,用车时长的分布近似服从对数正态分布。对分布情况观察发现时间基本集中在50min之内,超过1小时的用车频数很少。

3 盐城市公共自行车数据统计分析结论

针对当今城市機动化快速发展带来的若干问题,公共自行车系统作为一种新型无污染的交通方式得到了各界的广泛关注,目前我国很多城市都在建设公共自行车系统,本文根据盐城市公共自行车前期使用数据的统计,对统计数据进行各方面的研讨分析,主要研究结论如下:

①所有站点的用车量随周期性波动,且波动量较大。这时可以通过在低峰期超过一定时间少收费、不限时用车等措施鼓励居民在低峰期多使用公共自行车,避免车辆闲置而导致的资源浪费。

②各站点的借还车的频次存在差异。公共自行车系统主要通过后台控制中心和区域调度中心来完成车辆调配。通过各服务点自行车停放情况的跟踪统计,当车辆数低于某一个闭值时,启动调度,并对站点实行实时监控,保证调度最优化。

③通过对数据的分析,发现大部分借车时间均在6:00到22:00之间,加之夜间行车存在安全隐患,建议缩短公共自行车每天服务的时间,不再全天24小时服务,同时也可以降低公共自行车的运营成本。

④原数据中存在部分用车时间小于1分钟的借还车记录,可能是借车人借出车辆后发现车辆损坏,于是立即将车归还。建议启动报修系统,当借车人发现车辆损坏时可以进行网上报修,修理人员就可以及时对车辆进行维修,以保障供给车辆数目。

⑤对于用车时间非常长的情况,可制定惩罚措施,根据实际情况,对于用车时间超过一定程度的借车人进行警告等惩罚。

参考文献:

[1]黄建德.城市公共自行车系统发展研究[D].华中科技大学,2013.

[2] 吕月一“公共自行车服务系统”研究与大数据处理[J].数学建模及其应用,2013,2(11):20-41.

[3]姚遥,周杨军.杭州市公共自行车系统规划[J].城市交通,2009(4):30-38.

[4]钱俭,郑志峰,冯雨峰.杭州公共自行车设施现状调查与思考[J].规划师,2010(1):71-76.

[5]李黎辉,陈华,孙小丽.武汉市公共自行车租聘点布局规划[J].城市交通,2009(4):39-44.

[6]朱强,郭晟.广州市公共自行车交通系统实施策略研究[J].黑龙江交通科,2009:199-200.

[7]李正浩.城市公共自行车租聘站远期发展规模分析[J].交通节能与环保,2010(2):44-46.

[8]杨桂元,黄己立.数学建模[M].合肥:中国科学技术大学出版社,2008(8).

[9]姜启源,谢金星,叶俊.数学建模[M].四版.北京:高等教育出版社,2011(1).

[10]宣子岳,等.基于大数据处理的公共自行车服务系统研究[J].赤峰学院学报,2016,8(32):5-9.

猜你喜欢

统计分析大数据
如何发挥新时期统计工作的作用之我见
以统计分析为基础的房地产税收优化分析