APP下载

高铁网络大数据结构特征研究

2021-04-14吕珊孙琼

中国军转民 2021年16期
关键词:数据挖掘旅客高铁

■吕珊 孙琼

0 引言

互联网、移动互联网、大数据等技术的普及,为高铁网络大数据的发展提供了良好的孕育土壤。基于高铁网络大数据是通过应用信息和通信技术来开发、收集和使用来自网络、物理基础设施等平台的数据,以提高组织效率、旅客体验和高铁发展可持续性。随着高铁网络大数据的积累和大数据技术的应用,利用大数据分析手段和方法进行旅客出行规划成为高铁研究发展的新方向。

1 高铁网络大数据内涵

高铁网络大数据是指将大数据技术应用于高铁行业运营中,不只是数据采集技术、大数据分析技术和统计预测技术[1],还包括将大数据思想和概念应用于高铁行业。从更深层次的角度来看,数据将从传统的报告和统计数据分析转换为智能、准确、联网和协作的流程,从传统的结构化数据分析到非结构化数据挖掘的流程,将从有限的数据转换为具有更大维度、更细粒度的大量数据以及大量的模型和形状。

1.1 智能化

以云计算、物联网、虚拟现实以及大数据和智能管理系统等其他技术为代表的先进技术的应用为基于高铁出行的旅客信息管理的发展做出了贡献。这项技术在高铁部门中的应用已启动了铁路内部各个区域的知识转化、开发过程,从而提高了高铁建设的整体水平。“智能”不仅是现代设备的智能使用,也是对全部工作人员智慧化的发掘。

1.2 来源多元化

基于高铁网络的大数据来源渠道丰富,以互联网和社交媒体为核心数据来源,另有部分来自政府服务和企业运营平台。从数据收集的角度来看,大多数研究过程都使用相对低价且便捷的互联网和社交媒体。然而,由于诸如个人隐私或商业秘密之类的原因,从政府机构和企业获取数据并不容易。从数据处理的角度来看,由于接收到的大部分大型高铁出行数据都是半结构化的图像、语音和视频,因此处理过程变得更加复杂,容易造成处理结果的准确性下降。

1.3 研究工具和方法多元化

在云计算、物联网等技术的引领下,高铁网络大数据研究涉及了计算机科学、地理学、统计学等多学科的、综合性的研究工具和方法,具有研究工具和方法多样化特点。依托于计算机科学的研究工具,主要以数据挖掘和机器学习技术的应用为核心。将数据挖掘技术应用于高铁和旅游业,可深挖高价值的信息、探索消费者旅行意愿、为旅客优化出行线路、推荐旅游项目和目的地等[1]。借助于MapReduce 的计算框架,Hadoop、PUMA、Cosmos 等运算器,保障了高铁网络大数据分析的精准性和有效性。在地理学相关的工具应用上,主要用到了GPS 技术和GIS 技术,研究旅客需求[2]、旅游交通[3]、旅游流[4]等。在基于统计学的工具和方法开展研究时,通常将计算机数据挖掘技术与之结合,用于估计、预测、聚类和关联分析、多元统计分析、时间序列分析、复杂网络分析、模糊拟合分析等[5]。

1.4 应用综合性

高铁网络大数据分析系统是在大数据算法和模型的基础上开发的。它可以基于海量交通主数据、动态监控数据、系统运营数据和互联网数据为政府、相关企业以及游客提供挖掘、分析功能,从而提高铁路管理部门的行业监管能力,促进企业精准营销效能的提升。该系统主要包括基本信息管理、旅客流量概况分析、准营销分析、目的地流量分析、游客出行特征分析,目的地关联影响分析,交通出行指标分析等功能[6]。

高铁网络大数据系统不仅限于将下一代通信网络技术(如云计算和物联网)应用到专用工具以及巧妙的项目和服务管理方法上,使用各种高新技术和设备。由于智能出行的标准是确保交通行业的可持续发展,同时考虑到旅客的需求和高铁部门的管理需求。因而,诸如物联网和云计算技术之类的下一代信息技术只是完成智能出行的途径和手段,而不是目标。

1.5 连接性

现阶段很多交通部门相互之间及高铁内部每个部门系统相互之间的团结互助体制还未完善,外部独立性和内部分散性相对较大。这种情况不仅仅主要在协作的业务过程中表现出来,而且也发生在信息交换和资源共享中。这会导致整个组织服务项目的效率低下,陷入无法应对乘客的问题、及时解决旅客难题以及组织发展动力不足等困境。因此,实现基于高铁网络的大数据发展须首先完成信息资源的共享。

2 高铁网络大数据采集与分析

2.1 数据来源

数据收集和监控是基于大数据的高铁网络促进智能旅游发展的基础。通常在同一时间进行数据收集和监视活动。通常包括以下几种数据收集方法:第一,自主收集。数据收集是通过构建基站和铺设点来进行的。其次,数据集成。一方面,数据可通过业务处理系统(12306平台、火车票达人等)、电信运营商(移动、联通等)、OTA(同程、携程等)和目的地公司(如景区、酒店、码头等)的处理系统进行数据集成;另一方面还可借助百度搜索等搜索引擎、社交化网络、网络日志、微博、手机游系统等获取部分数据[7]。第三,数据共享。与铁路、公安、旅游、银联等部门实现旅客出行数据的强关联。当数据样本足够丰富时,可以将流量控制在特定区域中的特定点。如今,无论是城市还是景区,数据收集方法都比较完善和综合,数据收集和监视也正在成为管理的基本内容。

2.2 数据挖掘和分析

数据的挖掘和分析是基于大数据的高铁网络智能出行推进的依据。由大数据驱动的高铁网络智能出行服务于提取和分析有关旅客属性、旅行行为、消费者交易、出行目的地等数据,为营销决策和精准推送提供数据支撑。数据收集仅需要技术,而提取和分析则需要技术和市场敏感性。从大量大数据中提取和可视化数据结果是实现大数据价值的关键一步。借助旅客出行大数据可视化方式,准确、及时地获取和了解每日的订单数量、内容,分析客源地等信息。由此,从全局的角度来看,一方面可以看到全国客流分布行为的整体趋势,另一方面还可以根据数据和预期结果的偏差,引导市场中心更好地调整营销策略,提升绩效。

2.3 数据洞察和指导

高铁网络大数据的数据洞察和指导功能,可用于进一步指导高铁网络项目未来的建设与发展。通过数据洞察,深入梳理和分析所获得数据,更加精准地把握市场的发展态势,以及了解本地发展中可能存在的问题。如基于用户画像功能,可以加强对性别比例、消费偏好、用户轨迹、出行习惯等的判断,深化对目的地和目的地产品的指导与规划。因而,所谓的数据指导即通过数据洞察结果进行的就下一步发展、改善方向提出建议,明确下一步发展目标及重点的过程。

3 结语

高铁网络大数据以数据为中心,以通信网络为支撑,通过终端接口开放、智能化管理的多样化高铁服务网络,为旅客管理、旅客服务、旅游营销等领域提供服务。高铁大数据包括数据采集和检测、数据挖掘和分析、数据洞察和指导三个步骤。数据的采集和监测是基于大数据的高铁网络智能出行推进的基础,数据采集一般有自主采集、数据集成、数据共享三种方式。数据的挖掘和分析是基于大数据的高铁网络智能出行推进的依据。基于大数据的高铁网络智能出行即通过对旅客属性、旅客行为、消费交易、旅行目的地等数据进行挖掘和分析,为市场营销决策和精准推送提供数据支持。对数据的深入了解和引导为旅游目的的下一步发展提供方向。基于数据洞察功能,进一步增强数据挖掘和分析能力,以实现对市场趋势和本地发展问题的及时了解和精准把控。

猜你喜欢

数据挖掘旅客高铁
非常旅客意见簿
探讨人工智能与数据挖掘发展趋势
高铁会飞吗
我是人
基于并行计算的大数据挖掘在电网中的应用
人地百米建高铁
给小旅客的礼物
一种基于Hadoop的大数据挖掘云服务及应用
第一次坐高铁
基于GPGPU的离散数据挖掘研究