交通一卡通大数据的公交客流分析与预测
2017-11-06田久鵾天津通卡智能网络科技股份有限公司
文/田久鵾,天津通卡智能网络科技股份有限公司
交通一卡通大数据的公交客流分析与预测
文/田久鵾,天津通卡智能网络科技股份有限公司
近年来,我国交通行业在智能领域的快速发展,已受到世界范围的关注,交通一卡通作为现阶段一种新兴的支付工具,其安全性、便捷性以及跨区性等优势对传统公共交通组织模式以及支付模式产生了前所未有的冲击。随着公交系统的不断升级与创新,以及智能公交概念的提出为构建智慧城市提供了动力,而城市智能化公交系统的实现需精准预测和把握当前城市公交客流。本文以交通一卡通大数据为基础,对公交客流的分布特征进行分析,旨在能够快速准确的预测出线路时段客流。
交通一卡通;大数据;公交客流;分析预测
1 国内外公交客流分析与预测现状
对于西方较为先进的发达国家而言,公共交通系统的建设在整个城市建设中占据较大比例。大部分西方国家普遍重视公共交通事业的发展,且随着城市日客运量的增加,公共交通出行比例不断增加,对公共交通的完善与优化便显得尤为重要,交通一卡通系统在国外的研究和应用,已相对成熟完善,尤其是在公交客流的分析及预测方面,由初级研究层次逐渐发展到新一轮的模型方法的研究,在新的客流基础之上,极大的提高了西方国家在公交客流分析与预测方面的精准性以及广泛性。而纵观国内在公交客流分析与预测方面的研究,仍旧停留在简单的客流层面,未能与西方国家一样,对线路类型、时段、天气状况、日期类型、全天内的温度变化以及风力等一系列不确定因素的影响,在一定程度上使得对公交客流的分析与预测,与实际公交客流存在较大的差异。
2 公交客流数据的采集
2.1 公交IC卡数据
交通一卡通之所以能够在公共交通中被广泛运用,主要是由于交通一卡通能够帮助乘客节省大量的时间,也可在一定程度上降低因现金丢失所带来的不必要麻烦。根据公交IC卡对当地某一城市中全天的刷卡数据进行记录,如刷卡时间、刷卡次数、刷卡地点、刷卡线路、刷卡终端ID、发卡地以及交通一卡通类型等数据进行采集,确保所采集数据的准确度,并将整合后的数据信息严格按照采集流程进行收录,便于运营单位的结算工作。具体公交IC卡数据采集流程如图1所示。
图1 公交IC卡数据采集流程
2.2 天气状况数据
当前阶段,城市的整体经济发展态势以及城市公共基础设施的建设水平,不仅是衡量其公共服务水平的重要指标,同时也是对公交客流影响因素的重要研究依据,这种客观性的影响因素,往往也是公交客流研究中的确定性因素,对整体公交客流的大小变化形成了一定的影响。但是通过不断的深入研究发现,其中也存在大量不确定因素,影响着公交客流的波动,例如,天气的变幻莫测、节假日人流量的变化、重大活动的开展、突发性的交通事故以及路段的维修等,均会对公交客流数据的采集产生不同程度的影响。
2.3 公交线路及站点数据
通过对城市公交线路的总体规划原则的分析得知,能够得到精准公交路线信息以及公交站点信息的公交线路以及公交站点,可根据该公交线路的具体长度以及公交站点的具体停站总数进行客流量大小的判断。通过向相关公交管理系统中一些资料数据的调查分析得知,公交线路信息主要有线路号、站点数、起点站名、终点站名、以及中间站名,而公交站点信息有站点位置、站点编号、相邻两个站点之间的距离等,可以在公交线路与公交站点的信息中挖掘客流数据。
3 公交客流的分布特性分析
3.1 公交客流的时间分布特征
交通一卡通工程是一项惠民利民的事业,受到当地广大群众的欢迎,且由于政府等相关部门在交通一卡通的推广与应用方面采取了积极的优惠减免政策,增加了公交一卡通的用户数量,其中出行次数较多且出行较为固定的人群大多为上班族,因此在时间上也形成了较为规律性的客流分布。从整体客流分布角度出发,就可以将客流量从工作日以及非工作日两方面进行划分。工作日的客流量比较有规律,全天之内出现两次高峰阶段,即早高峰(7:00-10:00)与晚高峰(16:00-19:00),两者在客流量变化上具有较大的差异性,首先早高峰客流大且集中,客流减少较为急剧,而晚高峰在客流量的高低变化上较为缓和,无较大的上下波动。非工作日主要泛指国家法定节假日,如中秋节、国庆节、劳动节以及周末等,每个节日由于休假天数的不同,其产生的客流量变化数据也不尽相同,通过对非工作日的客流量变化分析发现,周末的客流变化有一个明显的高峰期,主要分布在下午1点——3点之间,而其他重大节假日的客流量变化较为混乱,但总体呈现出一种中间少两头大的趋势。
3.2 公交客流的人群分布特性分析
从现阶段公交客流的分布特征来看,不同的客流人群对客流量的变化同样具有一定的影响。根据卡的类型通常可分为普通卡、学生卡以及老年卡三种类型,其中学生卡与老年卡群体的出行比较有规律,而普通卡则分为工作日与非工作日两种。学生卡工作日有早、晚两个出行高峰,非工作日只有晚高峰;老年卡通常只有一个高峰时段,主要集中在9:00-10:00区间,其他时间段的客流分布较为平均,无明显的高低起伏;普通卡无论是工作日还是非工作日,在客流量的分布上都呈现出两个高峰时段,通常工作如的高峰时段分布在7:00-8:00,晚高峰分布在17:00-18:00,而非工作日的出行早高峰主要集中在8:00,晚高峰为18:00。
4 结束语
综上所述,随着交通卡互联互通项目在全国范围内的推广与普及,多元化的数据来源以及信息数据的不断变化,交通一卡通大数据便在此背景之下应运而生,并受到广大学者及各大研究机构的关注。但是我国在现代智能化系统的建设与应用方面尚处于发展阶段,其实际应用过程中仍存在诸多矛盾与问题,尤其是在公交客流分析预测方面,缺乏综合性考虑是其中较为突出的问题之一。因此为进一步提高交通一卡通大数据中公交客流分析与预测的准确度,在未来研究中需对具体公交线路、时间段、温度变化以及天气状况等不确定性因素纳入研究范围之内,进而完善研究结构与研究模式,从根本上保证客流量分析的准确度。
[1]罗强,何利力,王晓菲.数据仓库中数据清洗技术分析[J].电脑编程技巧与维护,2015(2):161-162.
[2]邹巍,陆百川,邓捷等.基于遗传算法与小波神经网络的客流预测研究[J].武汉理工大学学报:交通科学与工程版,2014,38(5):1148-1151.
[3]高咏玲,杨浩.城市公交客流影响因素的改进灰色一致关联分析[J].交通运输系统工程与信息,2011,7(6):102-108.