高铁网络大数据结构特征研究
2021-10-08吕珊孙琼
吕珊 孙琼
摘要:高速铁路(HSR)网络可以帮助改变旅游业乃至区域经济。高铁网络的大数据具有智能化、来源多元化、研究工具和方法多元化、应用综合性、连接性等特征。高铁网络的研究可以使用大量的基础数据,借助与数据收集、数据管理和数据分析相关的技术,从多重维度和角度更加系统地探讨具体的研究对象,以深刻理解研究对象;此外,还可以开展社会网络、消费者行为、客流、旅客聚集方式、旅游市场等方面的研究。
关键词:高铁;高铁网络;大数据
0引言
互联网、移动互联网、大数据等技术的普及,为高铁网络大数据的发展提供了良好的孕育土壤。基于高铁网络大数据是通过应用信息和通信技术来开发、收集和使用来自网络、物理基础设施等平台的数据,以提高组织效率、旅客体验和高铁发展可持续性。随着高铁网络大数据的积累和大数据技术的应用,利用大数据分析手段和方法进行旅客出行规划成为高铁研究发展的新方向。
1高铁网络大数据内涵
高铁网络大数据是指将大数据技术应用于高铁行业运营中,不只是数据采集技术、大数据分析技术和统计预测技术[ 1 ],还包括将大数据思想和概念应用于高铁行业。从更深层次的角度来看,数据将从传统的报告和统计数据分析转换为智能、准确、联网和协作的流程,从传统的结构化数据分析到非结构化数据挖掘的流程,将从有限的数据转换为具有更大维度、更细粒度的大量数据以及大量的模型和形状。
1.1智能化
以云计算、物联网、虚拟现实以及大数据和智能管理系统等其他技术为代表的先进技术的应用为基于高铁出行的旅客信息管理的发展做出了贡献。这项技术在高铁部门中的应用已启动了铁路内部各个区域的知识转化、开发过程,从而提高了高铁建设的整体水平。“智能”不仅是现代设备的智能使用,也是对全部工作人员智慧化的发掘。
1.2来源多元化
基于高铁网络的大数据来源渠道丰富,以互联网和社交媒体为核心数据来源,另有部分来自政府服务和企业运营平台。从数据收集的角度来看,大多数研究过程都使用相对低价且便捷的互联网和社交媒体。然而,由于诸如个人隐私或商业秘密之类的原因,从政府机构和企业获取数据并不容易。从数据处理的角度来看,由于接收到的大部分大型高铁出行数据都是半结构化的图像、语音和视频,因此处理过程变得更加复杂,容易造成处理结果的准确性下降。
1.3研究工具和方法多元化
在云计算、物联网等技术的引领下,高铁网络大数据研究涉及了计算机科学、地理学、统计学等多学科的、综合性的研究工具和方法,具有研究工具和方法多样化特点。依托于计算机科学的研究工具,主要以数据挖掘和机器学习技术的应用为核心。将数据挖掘技术应用于高铁和旅游业,可深挖高价值的信息、探索消费者旅行意愿、为旅客优化出行线路、推荐旅游项目和目的地等[ 1 ]。借助于MapReduce的计算框架,Hadoop、PUMA、 Cosmos等运算器,保障了高铁网络大数据分析的精准性和有效性。在地理学相关的工具应用上,主要用到了GPS技术和GIS技术,研究旅客需求[ 2 ]、旅游交通[ 3 ]、旅游流[ 4 ]等。在基于统计学的工具和方法开展研究时,通常将计算机数据挖掘技术与之结合,用于估计、预测、聚类和关联分析、多元统计分析、时间序列分析、复杂网络分析、模糊拟合分析等[5]。
1.4应用综合性
高铁网络大数据分析系统是在大数据算法和模型的基础上开发的。它可以基于海量交通主数据、动态监控数据、系统运营数据和互联网数据为政府、相关企业以及游客提供挖掘、分析功能,从而提高铁路管理部门的行业监管能力,促进企业精准营销效能的提升。该系统主要包括基本信息管理、旅客流量概况分析、准营销分析、目的地流量分析、游客出行特征分析,目的地关联影响分析,交通出行指标分析等功能[6]。
高铁网络大数据系统不仅限于将下一代通信网络技术(如云计算和物联网)应用到专用工具以及巧妙的项目和服务管理方法上,使用各种高新技术和设备。由于智能出行的标准是确保交通行业的可持续发展,同时考虑到旅客的需求和高铁部门的管理需求。因而,诸如物联网和云计算技术之类的下一代信息技术只是完成智能出行的途径和手段,而不是目标。
1.5连接性
现阶段很多交通部门相互之间及高铁内部每个部门系统相互之间的团结互助体制还未完善,外部独立性和内部分散性相对较大。这种情况不仅仅主要在协作的业务过程中表现出来,而且也发生在信息交换和资源共享中。这会导致整个组织服务项目的效率低下,陷入无法应对乘客的问题、及时解决旅客难题以及组织发展动力不足等困境。因此,实现基于高铁网络的大数据发展须首先完成信息资源的共享。
2高铁网络大数据采集与分析
2.1数据来源
数据收集和监控是基于大数据的高铁网络促进智能旅游发展的基础。通常在同一时间进行数据收集和监视活动。通常包括以下几种数据收集方法:第一,自主收集。数据收集是通过构建基站和铺设点来进行的。其次,数据集成。一方面,数据可通过业务处理系统(12306平台、火车票达人等)、电信运营商(移动、联通等)、OTA(同程、携程等)和目的地公司(如景区、酒店、码头等)的处理系统进行数据集成;另一方面还可借助百度搜索等搜索引擎、社交化网络、网络日志、微博、手机游系统等获取部分数据[ 7 ]。第三,数据共享。与铁路、公安、旅游、银联等部门实现旅客出行数据的强关联。当数据样本足够丰富时,可以将流量控制在特定区域中的特定点。如今,无论是城市还是景区,数据收集方法都比较完善和综合,数据收集和监视也正在成为管理的基本内容。
2.2数据挖掘和分析
数据的挖掘和分析是基于大数据的高铁网络智能出行推进的依据。由大数据驱动的高铁网络智能出行服务于提取和分析有关旅客属性、旅行行为、消费者交易、出行目的地等数据,为营销决策和精准推送提供数据支撑。数据收集仅需要技术,而提取和分析則需要技术和市场敏感性。从大量大数据中提取和可视化数据结果是实现大数据价值的关键一步。借助旅客出行大数据可视化方式,准确、及时地获取和了解每日的订单数量、内容,分析客源地等信息。由此,从全局的角度来看,一方面可以看到全国客流分布行为的整体趋势,另一方面还可以根据数据和预期结果的偏差,引导市场中心更好地调整营销策略,提升绩效。
2.3数据洞察和指导
高铁网络大数据的数据洞察和指导功能,可用于进一步指导高铁网络项目未来的建设与发展。通过数据洞察,深入梳理和分析所获得数据,更加精准地把握市场的发展态势,以及了解本地发展中可能存在的问题。如基于用户画像功能,可以加强对性别比例、消费偏好、用户轨迹、出行习惯等的判断,深化对目的地和目的地产品的指导与规划。因而,所谓的数据指导即通过数据洞察结果进行的就下一步发展、改善方向提出建议,明确下一步发展目标及重点的过程。
3结语
高铁网络大数据以数据为中心,以通信网络为支撑,通过终端接口开放、智能化管理的多样化高铁服务网络,为旅客管理、旅客服务、旅游营销等领域提供服务。高铁大数据包括数据采集和检测、数据挖掘和分析、数据洞察和指导三个步骤。数据的采集和监测是基于大数据的高铁网络智能出行推进的基础,数据采集一般有自主采集、数据集成、数据共享三种方式。数据的挖掘和分析是基于大数据的高铁网络智能出行推进的依据。基于大数据的高铁网络智能出行即通过对旅客属性、旅客行为、消费交易、旅行目的地等数据进行挖掘和分析,为市场营销决策和精准推送提供数据支持。对数据的深入了解和引导为旅游目的的下一步发展提供方向。基于数据洞察功能,进一步增强数据挖掘和分析能力,以实现对市场趋势和本地发展问题的及时了解和精准把控。
参考文献:
[1] Xiao W J, Xiang D G. Overview of tourism data mining in big data environment[J]. Advances in Computer Science Research, 2016, 59 (2) .
[2] Schianetz K, Kavanagh L, Lockington D. Concepts and tools for comprehensive sustainability assessmen for tourism destinations: A comparative review[J]. Journal of Sustainable Tourism, 2007, 15 (4) .
[3] 闫闪闪,靳诚.基于多源数据的市域旅游流空间网络结构特征——以洛阳市为例[J].经济地理,2019,39(8):231-240.
[4] 阮文奇,张舒宁,李勇泉.自然灾害事件下景区风险管理:危机信息流扩散与旅游流响应[J].南开管理评论,2020,23(2):63-74.
[5] 吴开军.旅游大数据研究热点及特征探析——基于国外文献的分析[J].统计与信息坛,2019,34(4):105-113.
[6] 胡可可,万红莲,毛楠,等.基于耦合模型的大数据高铁旅游效应研究——以宝鸡市为例[J].湖北农业科学,2020,59(14):184-188.
[7] 刘志霞.大数据在旅游管理中的应用探讨研究[J].广东技术师范学院学报,2016,37(4):95-102,111.
基金项目: 中国国家铁路集团有限公司科技研究开发计划课题(重大课题)“基于大数据的高铁网络经济研究”(K2019X018)。
(作者簡介: 吕珊,硕士,北京联合大学硕士研究生,研究方向为管理学;孙琼,博士,北京联合大学副教授,研究方向为企业管理、目的地旅游规划、旅游经济)