APP下载

大数据背景下客流分析统计系统研究

2022-01-21席磊陈恒范阳明李耀甘肃省科学院自动化研究所兰州金诚视频技术有限公司

品牌研究 2021年36期
关键词:购票客流高速铁路

文/席磊 陈恒 范阳明 李耀(甘肃省科学院自动化研究所;兰州金诚视频技术有限公司)

一、研究背景及意义

(一)研究背景

以铁路为例,随着我国铁路建设大潮以及高铁网络的成型,使得我国铁路旅客的运行能力得到极大释放,同时高铁所具有的高密度、高速度、安全性、舒适性和准时性使其成为铁路旅客的主流出行方式。根据近年中国国家铁路集团有限公司召开的工作会议,会议明确了铁路工作的总体思路要坚持以供给侧结构性改革为主线,深入实施客运提质计划和复兴号品牌战略,实现铁路高质量发展。高铁客流作为高铁客运的基础,也是服务对象,高铁的客流分析统计系统极其重要且极具意义。高铁客流的快速增长给高铁发展带来新契机的同时,也对现有的高铁运营状况提出了更高的要求。高铁客流组织的理念需从运能紧张的供给需求向需求驱动转变,客流的组织方式也需从以前“粗放型”向现在的“精细化”转变。而大数据分析、人工智能、网络通信等技术的飞速发展和成熟应用,也给新环境、新目标下的高速铁路客流分析统计系统研究提供了可行性。

(二)研究意义

我国经济的飞速发展和日益增长的旅客出行需求带来了大规模的高速铁路客流,而高速铁路客流是高速铁路运营最重要的基础和依据。与此同时,高速铁路旅客出行需求的数据爆仓,传统的客流分析技术已无法满足高铁成网下的多样化、非常规以及时空变化的旅客出行需求。现阶段,大数据背景下的高速铁路客流分析统计是一个迫切需要研究的课题。

随着高速铁路客流信息的多源采集,高速铁路客流数据规模逐渐庞大。基于大数据技术的客流分析能够更科学、更全面、更合理地把握高速铁路客流的成长规律、分布规律以及出行规律,可以突破数据瓶颈,建立以需求为导向的客运产品设计,形成精细化的高速铁路客流组织,促进高速铁路客运资源的高效利用,提高高速铁路客运服务质量和经济效益,更好地满足高铁旅客的出行需求。

二、国内外研究现状

(一)铁路数据研究现状

在大数据的铁路运营管理方面,法国设有铁路运输营销机构,通过整合网络售票信息和旅客问卷调查能掌握大量的铁路客流数据,为铁路市场开发和客运运营设计提供数据支撑。日本铁路运输的信息化程度较高,大数据技术在铁路运输行业已得到广泛应用,如其在铁路货运开发的铁路列车货物运输GIS系统,能为铁路货运提供高效分析和有益决策。德国铁路股份有限公司通过规划建设统一的数据中心平台,实现铁路的分析与预测、决策与管理等。俄罗斯设立了铁道部门计算中心,通过全路联网构建大型数据信息仓库,研究旅客选择趋势和客运结构,实现对客运信息资源的实时把握和管理。

(2)相比于国外的铁路运营管理大数据研究,国内大数据技术的发展和应用起步都比较晚。自20世纪初大数据作为一种新兴技术掀起了全球思维变革的浪潮,我国对大数据技术也给予了极大重视和期待。2017年是铁路大数据的全面开局之年,指明了铁路大数据的工作方向,也为铁路大数据应用奠定了技术基础。在大数据铁路应用研究的宏观层面,代明睿等针对我国铁路应用大数据技术的发展方向,从开展客户关系管理、加强市场分析预测、发展铁路现代物流等多个方面,探讨铁路应用大数据技术的发展方向,提出铁路应用大数据技术的发展策略。在大数据铁路应用研究的微观层面,崔世卿等基于大数据的铁路旅客服务设备状态监测系统进行研究,实现对旅客服务设备全生命周期的信息管理、设备故障预警及告警和设备检修方案智能辅助决策等功能。

(二)客流分析现状

(1)国外铁路技术的发展比国内的要早,铁路运营时间较长,同时在铁路客流分析这方面也做了不少研究。他们指出,随着现代化信息技术发展,基于大数据、人工智能的客流分析是大趋势。在铁路客流分析研究方面,以韩国高速铁路为研究对象得出了运输服务质量对旅客出行行为有很大影响;基于协方差分析和回归分析研究了列车车门宽度对韩国城铁客流时间的影响;东京都市圈城市轨道交通客流分配模型。

(2)国内的铁路客流研究分析可以分为定性分析和定量分析。铁路客流的定性分析是指根据已有的历史资料和研究成果,通过访问、查阅文献等,结合研究者本身的工作经验和分析能力,再综合考虑多方意见,对客流构成、特点、趋势、分布以及规律所做的研究,此分析法古老且较为主观,对于现今的铁路客流分析研究意义不大。铁路客流的定量分析是根据客流的历史数据,基于数据统计分析、大数据技术分析、人工智能等各种方法,对客流数据进行统计分析、归纳总结、数据挖掘等,旨在分析客流结构、客流分布、客流时空特征、客流成长规律趋势及演变机理、客流与运输组织间的匹配度等。在现有的铁路客流分析研究中,铁路客流的定量分析已成为主流。

三、基于客票的高速铁路客流分析

基于数据挖掘Apriori算法对高铁客票数据进行先验分析,提取数据挖掘产生的旅客出行关联规则,总结、归纳得到旅客出行行为、客流时空特征以及票额分配状态等客流分析内容。

(一)基于数据挖掘的旅客出行先验分析

高铁旅客出行是指旅客乘坐高铁从出发地到目的地的一次出行,包括但不限于购票方式选择、车次选择、席别选择、时空出行选择以及提前购票时间等旅客出行行为。旅客出行先验分析是基于数据挖掘Apriori算法对客票数据中旅客出行信息的关联分析,目的是通过先验分析发掘潜在的、不易被发现的旅客出行行为关联。现以京广高铁为例:京广高铁2020年11月23日(周一)至2020年11月29日(周日)一周的上下行本线列车的客票数据,先经数据预处理,再基于Apriori算法分析旅客出行关联规则,对关联规则进行提取、总结归纳后可为客流分析提供方向,能最大限度挖掘客票数据中旅客的出行信息。

(二)旅客出行行为分析

根据数据挖掘Apriori算法产生的旅客出行行为关联规则,旅客出行行为关联分析可以从旅客提前购票时间与平日周末、购票方式与提前购票时间、发车时段与旅行时间等角度分析。通过对旅客出行行为的关联分析,可以更好地把握客流出行规律、更好地满足各类型旅客的出行需求,更加科学合理地指导高铁客运产品的设计、调整。在京广高铁客票数据中,旅客购票方式有窗口购票、代售点购票、电话购票、互联网购票、手机购票以及自售机购票,各购票方式的占比如表1所示:

表1 旅客购票方式占比

从表1可知,手机购票的高铁旅客比例最高,其次是窗口、代售点、互联网、自售机,电话购票的旅客占比极少。在旅客出行行为中,旅客的出行习惯不同其提前购票时间也不一,而不同购票方式的便捷程度也会影响旅客的提前购票时间。

(三)客流时空特征分析

高速铁路客流从高速铁路建成通车到往后的各个时期都是在不断发生变化的,而在一定时期内高速铁路客流会逐渐趋于稳定。通过客票数据分析高速铁路客流在时间、空间上的分布特性,可以得到一定规律,从而可以根据高速铁路旅客的出行需求每日动态调整列车运行方案,实施“一日一图”,精准匹配运力投放与客流需求。客流时间特征分析是通过对某一地区一定时期内高铁客票数据进行分析而得到其在不同时间粒度(时段客流、日客流、周客流、年客流等)、特殊时间节点的不同分布特征。客流空间特征分析是由于高铁沿线地区经济发展状况、人口数量、城市功能定位等因素造成旅客出行需求不同,在不同空间呈现不同的客流分布规律。高铁客流的空间分布特征可以从客流流向、站点客流、区段客流、客流运距等来进行分析。

四、结论

本文总结了国内外的高速铁路客流分析现状,针对现有研究不足,提出了基于大数据分析的高速铁路客流研究;接着论述了数据挖掘等大数据分析技术,并详细介绍了数据挖掘Apriori算法原理;然后针对本文基于客票数据和客座率数据的高速铁路客流分析阐述了其基础理论;再对基于Apriori算法的客票数据分析得到的旅客出行行为、客流时空特征逐一分析,并对分析结果给出了优化建议。通过研究可知,随着我国高速铁路的飞速发展,高速铁路客流的数据膨胀,传统的客流分析已无法满足市场化下的高铁旅客出行需求,而大数据技术的发展与应用也为高速铁路客流分析带来了新的契机。本文认为,客流分析统计系统离不开大数据技术的支持,只有不断加大大数据技术的投入,才能满足人们日益增长的出行需求。

猜你喜欢

购票客流高速铁路
市政道路下穿高速铁路技术简述及应用
城市轨道交通节假日期间大客流行车组织思考与实践
基于大小交路套跑对地铁不均衡客流的可靠性分析
预制胶拼架桥法在高速铁路工程中的实践
直击痛点的“候补购票”可多来一些
抢不到票?铁路候补购票服务扩大到全部旅客列车
网络购票时代 莫让农民工掉队
地铁换乘客流预警及应对
地铁线网客流优化配置研究与应用
高速铁路明确仅运行动车