智慧旅游信息系统的旅游数据整合
2017-02-23王世运田兴彦伍振兴
王世运+田兴彦+伍振兴
在智慧旅游建设背景下探讨政府从管理型向服务型转变过程中如何将分散的旅游服务数据(如旅游咨询服务中心、游客集散中心、旅游信息网站、天气信息等)整合起来,为设计面向服务的智慧旅游信息综合管理系统提供理论依据,从而实现提供给游客良好的旅游体验感。
【关键词】智慧旅游 数据整合 信息系统
2011年,国家旅游局发布的《中国旅游公共服务“十二五”专项规划》中确定了旅游公共服务建设的重要性,把旅游公共信息服务作为提升旅游公共服务的切入点,明确要完善旅游信息咨询服务体系、旅游安全保障服务体系、旅游交通便捷服务体系、旅游便民惠民服务体系、旅游行政服务体系等 5大体系,要建立统一领导、分级负责,政府主导、全社会协同,公益性原则和市场化运作相结合的可持续发展的体制机制。
面向面向服务架构的智慧旅游信息系统通过对5大服务体系的融合,使得游客、企业、政府面对的不再是一个个孤立的系统,而是统一的服务窗口。在这统一的服务窗口,游客、企业等用户可以进行各种旅游事务的查询和申办、资源的统一获取、交互与协同。同时,通过该系统也可以提高政府的管理效率和管理水平,并能监控和优化相应的旅游服务质量。
1 旅游数据的研究
旅游数据是指旅游行业的相关企业、从业者及游客在从事旅游等活动时产生的各类数据,主要包括企业、景区、游客、导游、旅行社、酒店等所产生的管理或业务数据。可以将这些旅游数据描述成:游客数据(包括旅游行为、旅游习惯、消费习惯等)、旅游城市信息资源库、旅游地理信息(GIS)数据库、物联网数据、旅游行业资源信息库、旅游气象数据(PM2.5等)、旅游宏观经济数据、交通数据、网络舆情数据等,其中最为重要、应用价值最大是游客数据。根据面向服务架构的需求,可以将这些旅游数据化分为三大类。
1.1 游客数据
该类数据主要由游客从事于旅游活动产生的旅游需求数据和旅游活动数据,主要包括:旅游资讯查询、智能导游、旅游点评、旅游投诉、旅游活动推荐、产品销售、配套服务、消费模式、个人兴趣、爱好等等。
1.2 从业数据
该类数据主要是旅游从业者从事旅游活动时产生的业务数据或辅助数据等。主要包括:旅游产品信息、游客消费及行为分析、旅游信息发布、实时流量(人、车)监控和预测、客源地统计、接待统计、旅游舆情分析、灾害预警、拥堵预警、旅游市场精准营销等等。
1.3 服务数据
该类数据主要是政府服务或管理旅游活动时产生的业务数据,主要包括:游旅信息、旅游政策的管理、旅游行业信息库的管理、游客数量及趋势分析、旅游目的地及行为数据分析、游客消费行为分析、旅游舆情分析、旅游宏观数据分析及预测等等。
2 数据整合的方法
目前在数据整合领域有很多成熟的机制,结果智慧旅游信息系统的特性和需求,我们采用数据仓库整合机制。它的机制主要有:实现数据驱动的架构,它包括数据处理的分析、设计和数据整合的物理架构实现。
2.1 数据需求分析
旅游数据存在于众多旅游主体或活动之中,如旅游景区、气象管理部门、酒店、旅行社、饭店、旅游管理部门等。数据的采集工作需要根据用户的需求来采集,因此就需要对各用户的数据需求有详细的了解。旅游数据的采集除了可以主动采集外,也可以定期或定时采集某些固定的数据;定期或固定的采集方式可以利用相应的数据采集设备进行数据的实时采集,比如利用监控摄像头、GPS、人流量视频监控技术、环境检测仪等设备对相关的旅游地进行实地的旅游数据的采集。综上述,旅游数据可以分为:
(1)事务处理的数据。它的常见典型是联机事务处理的数据。
(2)网站(系统)数据。包括网站的来源IP、流量、网站的销售数据及政府游客服务中心的服务数据等等。
(3)数据仓库的数据。它们存储和处理着供用户使用的数据。
(4)分析数据。
(5)非结构化数据。它包括:文本(文档、笔记、记事和通讯录)、图像、视频、音频、社交媒体、传感器数据(如人流量、车流量统计)、天气数据等。
(6)半结构化数据。其中包括演示文稿、数学模型、电子邮件、图形和地理数据。
2.2 流程的规划
旅游数据从产生到利用需经历数据的采集、数据的分类、数据的选取、数据的装载、分析等过程,因此旅游数据的整合也需要建立在旅游数据的产生流程之中。
(1)首先从主动服务架构的角度,选择要产生的业务范围。
(2)选取该业务范围内的核心数据,即最有价值的数据(或与其它用户具有关联价值的数据),建立起关系型的数据。
(3)整理出来的关系型数据要支持整个系统的大数据分析、统计、汇总等。
(4)建立起要采集的数据的的标准,统一数据格式、采集方法、使用方式,设定一个共享的技术方法和目的。
(5)最终建成“统一数据架构”。实现有效、实时、精确地与现有的业务数据结合,产生精准的旅游业务整合数据。
2.3 技术方法
2.3.1 数据采集方法
各类旅游信息数据的收集、核准需要通过运用不同的采集方式,主要有:仪器设备实时采集和实地采集、走訪调研、网络收集等。
2.3.2 数据采集技术
目前主流的、成熟的大数据采集技术主要有:Kafka、Scribe和Flume,这里主要介绍下Kafka。
在旅游大数据系统中,常常会碰到这样一个问题,整个旅游大数据是由各个应用子系统来组成,各种类型的旅游数据需要在各个应用子系统中高速、低延迟的不停流转。传统的消息系统并不适合大规模的数据处理。Kafka的出现,解决了同时在线应用(主要指消息)和离线应用(主要指数据文件,日志),它降低了系统组网的复杂程度,它类似于插座,各个子系统类似于插头,插在它上面,即Kafka承担高速数据总线的作用。
Kafka将消息以topic为单位进行归纳。将向Kafka topic发布消息的程序成为producers。将预订topics并消费消息的程序成为consumer。Kafka以集群的方式运行,可以由一个或多个服务组成,每个服务叫做一个broker。producers通过网络将消息发送到Kafka集群,集群向消费者提供消息,如图1所示。
2.3.3 数据分析
旅游数据的分析主要利用分布式数据库或分布式计算集群来对海量的旅游数据进行普通的分析和分类、汇总等,以满足用户特别是政府和企业对旅游管理的需求。实时性的分析常用Oracle、GreenPlum的Exadata和 MySQL的列式存储Infobright等,而基于半结构化数据的分析则使用Hadoop。
2.4 大数据挖掘
与数据统计和分析过程不同,旅游数据的挖掘一般不会事先预定好主题,数据挖掘主要是在现有数据上进行基于各种算法的计算。比较典型算法有Kmeans和用于统计学习的SVM及用于分类的NaiveBayes,主要使用的软件工具有Hadoop的Mahout等。
3 总结
旅游数据的整合要以旅游信息咨询服务体系、旅游安全保障服务体系、旅游交通便捷服务体系、旅游便民惠民服务体系、旅游行政服务体系等 5大体系的业务体系为流程,规划出统一的数据标准,以此推动利用大数据来完善旅游目的地政府的旅游管理和决策、改善旅游行业的运营、提高游客的旅游体验感等。
参考文献
[1]罗成奎.大数据技术在智慧旅游中的应用[J].旅游纵览(下半月),2013(08).
[2]付业勤,郑向敏. 我国智慧旅游的发展现状及对策研究[J].开发研究,2013(04).
[3]徐波林,李东和,钱亚林,刘燕桃. 智慧旅游:一种新的旅游发展趋势——基于现有研究成果的综述[J].资源开发与市场,2013(07).
[4]徐舒. 基于智慧旅游的秦皇岛市旅游公共信息服务建设[J].商,2013(11).
[5]李丁,贾志洋,汪际和,陈旭.智慧旅游管理与智能推荐技术[J].中国管理信息化,2013(07).
[6]史云姬.体验经济时代下新一代通信技术在智慧旅游中的应用[J].科技视界,2013(09).
[7]林若飞.国内智慧旅游研究现状述评[J].旅游纵览(下半月),2013(03).
[8]张静.互联网+思维助推开封智慧旅游发展新思路[J].旅游纵览(下半月),2016(10).
[9] 徐菊凤,潘悦然.旅游公共服务的理论认知与实践判断——兼与李爽商榷[J].旅游学刊,2014(01).
作者簡介
王世运,海南省定安县人。现为海南热带海洋学院实验师。主要研究方向为数字媒体开发、网站开发等。
田兴彦,湖南省人。现为海南热带海洋学院教授。主要研究方向为虚拟现实、三维动画、信息系统设计等。
作者单位
海南热带海洋学院 海南省三亚市 572022