旅游大数据建设及应用的策略研究
2017-12-28牟进军罗国宽田兴彦熊志斌
牟进军,罗国宽,田兴彦,熊志斌
(1. 海南威斯达电子科技有限公司,海南 海口 570203;2. 海南热带海洋学院艺术与创意学院,海南 三亚 572022)
旅游大数据建设及应用的策略研究
牟进军1,罗国宽1,田兴彦2,熊志斌2
(1. 海南威斯达电子科技有限公司,海南 海口 570203;2. 海南热带海洋学院艺术与创意学院,海南 三亚 572022)
通过分析旅游大数据的意义,梳理建设旅游大数据所面临的困难点,提出了建设旅游大数据的途径,包括旅游大数据标准建设,数据共享法规建设,支持大数据的旅游数据中心建设,以及大数据人才队伍建设,最后阐述了开展以数据增值为目标的旅游大数据应用途径。
旅游信息化;旅游大数据;数据中心;数据共享;数据增值
0 引言
当今世界,信息技术与传统行业的交会融合引发数据迅猛增长,数据已成为国家基础性战略资源,是21世纪的“钻石矿”[1]。大数据的发展和应用正日益对全球生产、流通、分配、消费活动以及经济运行机制、社会生活方式和政府治理能力产生重要影响。2014年,“大数据”首次写入我国政府工作报告,2015年,《关于运用大数据加强对市场主体服务和监管的若干意见》和《促进大数据发展行动纲要》陆续颁布,党的十八届五中全会通过的“十三五”规划建议提出了“实施国家大数据战略,推进数据资源开放共享”的战略指导意见,2017年,工信部发布《大数据产业发展规划(2016-2020年)》。这几份重磅文件密集出台,标志着我国政府大数据战略部署和顶层设计正式确立,步入协同行动阶段,大数据将在各行各业得到开发和应用。旅游行业必须把握国家大数据战略机遇,主动迎接新技术挑战。鉴于此,本文以旅游业为视角,首先分析大数据在旅游领域的意义,其次梳理建设旅游大数据的难点,最后探讨了旅游业大数据的建设及应用策略。
1 建设旅游大数据的意义
1.1 提升旅游信息化水平
大数据涉及物联网、互联网/移动互联网、云计算、人工智能等新一代的信息技术,建设旅游大数据将促进信息技术的硬件和软件在旅游业的深入应用,全面提升旅游信息化水平,推动旅游业向网络化、数据化、智能化方向发展。大数据平台具备实时采集、存储、处理海量数据的功能,利用大数据的实时采集、处理数据的技术,对景区酒店客流量、旅游团队、旅游大巴、导游领队、旅行社客流数据进行实时监控,安全预警,应急指挥,实现旅游行业安全、高效、规范、有序的管理。
1.2 大数据挖掘,创新旅游发展
互联网和旅游是全球最具成长性的两大消费市场,融合叠加能产生强大的创新能力。旅游活动是成千上万游客参与的基于自然空间的一种位置移动活动,互联和旅游业具有深度融合的自然基础,在旅游活动过程中,游客在利用互联网的过程中,将产生海量的个性化数据信息,这些数据反映游客的需求,以及对旅游服务和产品的情感倾向,是有价值的数据资源。利用人工智能技术,旅游业能够挖掘这些数据资源的价值,促进旅游业与大数据企业产生技术和资源的融合,催生出网络精准营销、预约服务、个性化定制服务、大数据咨询分析服务,大数据交易服务等一批新技术、新产品、新业态和新模式。
2 建设旅游大数据的挑战
建设旅游大数据,要准确把握我国旅游信息化的建设现状,以问题为导向,从大数据的角度审查旅游信息化建设中存在的问题。国家旅游局确定2014年为“智慧旅游年”,旨在促进旅游业的信息化建设,到2016年底,国家旅游局相继完成了一些智慧旅游的硬件平台,构建了核心数据库,旅游业“初步解决了长期无统计的被动局面”[2]。旅游业信息化建设虽然取得巨大成就,但仍然落后于信息技术的发展形势,建设旅游大数据存在以下挑战。
2.1 数据资源难以充分共享
旅游大数据来源既包括旅游业内部的数据,也包括涉旅行业(如通讯、公安、交通、保险、金融、气象和卫生)的数据。由于旧的技术方案和部门之间的壁垒导致数据难以开放共享,严重制约了大数据隐藏价值的分析挖掘。
旅游业经过近年来的信息化建设,特别是旅游“515战略”实施以来,旅游信息化取得很大的成效。基本建成了国家-省-市-县四级业务系统,但在建设过程中缺乏顶层设计,没有全国统一的数据存储和交换标准,而且各系统采用的技术路线和技术方案也各异,即便在旅游业内部,这些数据也没有跨域、跨层级共享。旅游业内的数据未能充分共享,造成信息技术的潜能在旅游业中不能完全发挥出来。
另外,由于种种原因,不同部门之间的数据很难共享。虽然国务院在2007年发布了《政府信息公开条例》,但各级行政部门在思想上不愿公开,不敢公开,而且在法规上对数据开放共享和数据隐私安全方面也缺乏可操作的规范,这些无形的壁垒阻碍了数据跨部门的交流共享。在大数据时代,需要在政府的主导下,跨部门、跨行业共同协作,构建一个数据安全共享的法制基础。
2.2 软硬件都不适应国家的大数据战略
发展大数据产业链是国家一项重要战略举措,2015年国务院印发《促进大数据发展行动纲要》,2017年工信部发布《大数据产业发展规划(2016-2020年)》,国家在政策层面上推进大数据开放与共享、促进技术产品研发和深化应用创新,形成大数据产业生态体系。
2016年 8月,国家发改委发布《国家发展改革委办公厅关于请组织申报大数据领域创新能力建设专项的通知》,积极落实国家大数据战略,围绕大数据基础技术和应用技术两个维度,设立国家财政专项资金,建设 13个国家级大数据实验室,支持突破一批关键核心技术研发创新与应用,构建具有核心技术自主权的大数据产业链[3]。旅游业大数据同样面临硬件平台建设不足和技术创新不强的局面,需要加大投入人力物力,建设大数据平台,突破旅游大数据采集和存储管理、旅游大数据分析与挖掘、旅游大数据可视化、旅游大数据安全、以及数据结构化、非结构化数据处理等关键技术,为旅游大数据应用层面提供基础服务,为旅游业发展提供助力。
2.3 大数据应用水平不高
目前景区、酒店、旅行社等旅游企业都有自己的信息系统、部分景区也具备一定的数据采集条件,但是景区、酒店、旅行社的信息系统还停留在信息发布、网络营销等初级信息化应用水平,还没意识到数据中隐藏的价值,不能利用大数据分析挖掘工具发现游客需求,为游客提供个性化优质服务,进行精准营销,培养旅游新业态。如,很多企业有自己的网站,却不能用网站的搜索引擎进行业务分析,网站也缺乏游客互动分享的平台。企业网站搜索记录其实是一个很好的数据资源,搜索记录及时记载游客的搜索热点,反映游客的兴趣点和关注度,根据网站搜索记录建立预测模型,用于预测酒店预订量、景区客流量等。游客在网站上分享的旅游体验也是一种低成本的大样本的数据抽样,游客所反馈旅游过程中感受和情绪,能左右潜在游客的旅游意愿,利用人工智能技术采集、挖掘游客在旅游过程中产生的数据,对帮助景区、酒店和旅行社改善服务质量,增强企业效益是有重要的意义。
2.4 大数据产业支撑体系尚不完善
旅游信息采集设施不完善,阻碍了数据资源的积累。旅游大数据采集除了管理部门的数据填报外,更大量来自于游客移动端的数据采集,企业嵌入式系统数据采集,社交网络上的用户生成内容。这些数据采集需要优良的通信基础设施,需要景区部署数据采集设备,需要支持非结构化数据的海量数据存储设备。目前许多山岳型、高原型、滨海型景区景点的移动通信基础设施不完善,存在信号盲区,许多景区景点没有免费的WiFi网络,也缺乏基于传感器、无线射频数据采集的物联网,这些因素都制约了旅游数据的采集。
大数据人才保障不完善,制约了旅游大数据的建设和应用。建设旅游大数据涉及云计算、集群服务器等新一代的信息技术和设备,需要有一支技术过硬的开发团队和运维团队,才能保障旅游大数据平台的技术先进性和平台稳定性,才能保障旅游大数据建设的稳步实施和大数据业务的推进。由于旅游业的工资收入和IT业的收入相比差距太大,造成旅游业信息技术人才难招聘、容易流失的困难局面,严重制约了旅游信息化水平提升和旅游大数据的开发应用。
3 旅游大数据的建设途径
3.1 加快数据标准和数据安全共享法规的建设
大数据的数据源复杂,数据结构多样,据统计,互联网生成的海量数据里,非结构化数据已接近数据总量的 75%[4]。旅游业需要组织专家学者建立涵盖“吃、住、行、游、购、娱”旅游六要素的网络信息的行业标准体系,包括行业统一的数据采集、汇总、共享、交换的标准。鼓励地方和企业根据本地旅游业实际情况,对行业标准进行适当扩充细化,制定地方标准与企业标准,促进标准之间的衔接和互补。在旅游业内以行政手段和监督机制为保障、以大数据建设为平台、以数据开放共享和增值利用为核心,抓好旅游信息数据标准规范的推广和实施。
旅游大数据关系到个人隐私、商业机密、知识产权、公共安全和国家利益,如游客在旅游过程产生的数据涉及游客个人隐私保护问题,景区的地理信息数据涉及到国土安全问题,公安部门数据共享涉及公共安全问题。这些数据如何开放共享,开放共享到什么程度,这是建设旅游大数据不可回避的问题。目前国内关于数据安全共享方面的法律法规和制度还不完善,从国家到地方都需要政府主导,加快数据安全共享方面的立法,推动数据开放共享,在确保数据安全和隐私保护的前提下,合理开发利用旅游大数据。
3.2 推进旅游业务流程全数据化
旅游企业的业务数据是旅游大数据的重要数据来源,企业需要提升旅游信息化的应用水平,对业务流程实行全数据化处理,提高旅游大数据资源的掌控能力。鼓励旅游企业建设旅游网络营销平台和旅游社交网站,开展旅游产品和服务的网络营销,为游客提供旅游信息查询、旅游投诉与处理等功能;与交通、金融合作,实现机票、酒店、景区门票的在线预订和移动支付;景区景点利用物联网和北斗导航系统,实现景区电子导游导览,跟踪游客行踪,分析景区人流状况,使旅游业务全流程在线化、数据化。网络营销平台、旅游社交网站、景区景点实现流程全数据化,大大丰富了数据采集渠道,企业能够利用大数据的挖掘分析技术,了解游客的满意度,改善服务质量;分析客源地,扩大潜在的客源,实现精准营销;分析游客偏好,提供个性化的旅游服务,细分旅游市场,提高企业效益。
3.3 建设支持大数据的旅游数据中心
旅游数据中心应该采用先进的云计算技术,建成具备海量数据处理能力的大数据平台。从平台规划、平台搭建、运维管理、数据增值服务等几个方面,做好顶层设计,逐步落实,到达数据汇聚、开放、共享的建设目标,为旅游大数据的应用提供平台和数据基础。
(1)数据平台架构
规划大数据平台架构要考虑以下两点:一、数据平台架构要充分利用国家旅游局和省旅游局已有的信息化设备,避免重复建设和数据多头采集;二、数据平台的技术方案要有一定先进性,能支持大数据采集、存储和应用。随着网络数据的海量增长,包括地方政府、电信运营商、互联网企业、众多的互联网数据中心都开始积极推动大型云计算数据中心的建设[5]。云计算数据中心的服务器才用分布式存储系统,将分散在多台独立服务器设备上的存储资源进行整合形成统一的资源池提供存储服务。分布式存储系统采用分布式存储集群系统可横向扩展架构,多个存储节点的磁盘空间。I/O节点也可以按需增加,保证其性能能够满足大多数数据密集型应用对存储容量和性能的要求。从其它行业的经验来看,利用云计算技术建设旅游数据中心是一个可行的方案。
目前国家旅游局和部分旅游大省正在建设旅游数据中心,在技术方案可以用云计算技术整合现有的数据中心,建设国家级+省级旅游大数据平台,利用私有云的资源池集中汇聚存储数据。国家旅游局承建私有云资源池总节点,汇聚全国旅游数据集中存储。已建成的省级旅游数据中心作为私有云省节点,接入国家旅游局的私有云资源池。国家旅游局和各省依托大数据平台提供的IaaS、PaaS、SaaS服务,开展本地数据挖掘分析应用。
国家旅游数据中心要根据业务需求,规划设计相应的基础数据库,如建立旅游统计年鉴数据库、旅游企业直报数据库、旅游产业基础数据库等,省级旅游数据库要和国家旅游数据中心对接。根据不同数据类型和数据操作的性能要求,选择合适的数据库,为了充分利用现有设备,同时能支持大数据处理,数据中心的平台可以采用传统数据库和Hdoop的混搭架构。数据库包含传统的关系形数据库 ORACLE、MySQL、SqlServer等存储结构化数据,也包含非关系型数据库 MOGODB以及分布式列存储数据数据库HBASE,存储半结构化和非结构化数据。
(2)扩大数据来源
旅游企业的业务全数据化后,将大大丰富数据采集范围。除了政务系统所需各种统计年鉴的企业数据外,还可以依托互联网/移动互联网、物联网等信息技术,扩大数据来源,包括旅行社、酒店、景区等实体企业的基本信息,每天接待游客数量,导游团队情况,景区和酒店的接待能力,每天客流量,视频监控数据等等。借助人工智能技术,数据采集范围能扩大到旅游社交网站、微博、移动客户端等新媒体,这些新媒体每天会产生大量用户生成内容(如景点和酒店的评分和点评、旅游攻略、旅游传记、照片分享等),通过网络爬虫软件采集用户生成内容,对数据进行清洗,保存有价值的数据。通过与电信运营商、搜索引擎平台的合作能获得更多的游客数据,电信运营商能提供游客位置信息,能估计景点游客数量,搜索引擎平台能提供用户搜索的旅游景点的信息,作为预测客流量的参数。
旅游业是一个涉及多行业的综合性服务业,要得到比较完整的旅游数据需要政府部门、金融、公安、交通、保险等部门行业共享数据资料。由于制度的原因,这些部门的数据难以共享,需要政府主导,制定安全规范,建立政府与企业之间、行业与行业之间的数据共享机制,加强旅游业与其他行业的数据交换、促进行业合同协作,推进旅游业融合创新发展。
3.4 培养大数据人才
发展大数据产业的一个重要前提就是必须具备多层次、高素质的大数据专业人才队伍。与电商等行业相比,旅游业的大数据开发应用能力有很大差距,旅游大数据专业人才队伍不足是一个直接原因。旅游业要抓住国家正在实施的大数据战略机遇,分阶段、多元化培养和造就高素质的旅游业大数据开发应用人才。
短期目标内,对旅游管理部门和旅游企业的信息技术人员开展大数据知识和平台运维技能培训;同时改革薪酬制度和用人机制,吸引大数据技术人才加入旅游业,解决旅游业当前大数据人才极度匮乏的状况。中期目标内,与地方IT企业建立长效稳定的合作机制,使合作企业熟悉旅游大数据采集、存储、分析和应用等方面的业务需求,引领合作企业面向旅游领域研发大数据分析工具和数据服务。长效合作机制既可以借助 IT企业的技术力量稳步推进旅游大数据应用和数据增值服务,又可以造就一支熟悉旅游业务的大数据研发队伍,同时也延伸了旅游产业链。长期目标内,构建高等教育和职业教育相结合的旅游信息化专业人才培养体系,培养多层次的旅游大数据应用人才。鼓励高校设置大数据相关学科、专业,培养旅游大数据技术和管理人才;支持职业学校开展大数据相关职业教育,培育旅游大数据平台的运维技能型人才;鼓励高校和旅游企业就旅游大数据开展产学研合作。
4 旅游大数据的应用
4.1 旅游治理现代化
旅游产业是综合性的服务业,旧的治理方式难以适应旅游产业综合化发展的趋势,当前,一些地方出现了工商旅游分局、旅游警察和旅游巡回法庭等综合性治理模式[6]。大数据平台为旅游业的综合治理提供了物质基础和技术基础,根据目前信息业软硬件发展水平,能够建设基于旅游大数据平台的全国旅游政务系统,实现国家-省-市-县四级分级授权管理,避免重复建设,数据多头采集,打造“一站式”、“一体化”旅游服务监管体系。全国旅游政务体系数据标准统一,能够充分利用大数据平台上开放共享的数据资源,推进跨部门、跨层级、跨地域的业务协同合作,容易实现和工商、公安、法院等部门数据交流共享,业务协同,提高办公效率,加强了对全国旅游市场的服务和监管能力,实现旅游治理科学化、现代化,降低行业管理成本。
大数据平台具有数据采集实时性及海量数据存储处理能力,建立覆盖旅游景区、宾馆饭店等场所的实时数据和影像采集系统,对景点景区、宾馆饭店、旅游集散地、旅游交通工具进行实时安全监控。发挥大数据平台上数据开放共享的作用,推动与安监、公安、交通、质检、食药监、气象、医疗、保险等部门的数据对接,跨部门实现应急指挥中心的信息共享、业务协同联动,全面提高旅游业安全监控、应急指挥和救援能力。
4.2 智慧旅游
旅游大数据平台能让游客感受到一种“智慧”的旅游体验。旅游企业通过网络营销平台和移动APP,预测游客需求,主动给游客提供个性化的信息推送、在线预订、移动支付,给游客提供智能、便利的优质服务。旅游过程中,景区提供免费 WiFi、智能导游、电子讲解,为游客提供免费的虚拟导游服务,用可穿戴智能设备跟踪游客移动位置,及时将游客血压、体温等身体状况,以及周围环境的气象指数反馈给游客,给游客提供贴身的、智慧的旅游服务。
旅游大数据平台能给旅游企业提供“智慧”的技术方案。利用无线传感器、物联网等技术手段,平台能够实现从景区停车场、门禁系统到观景点、旅游餐饮、旅游购物等业务流程的全数据化管理。大数据平台接入北斗产业链,充分利用系统导航定位、通讯通话、足迹跟踪、危险预警、事故报警及事故救援服务功能,对旅游大巴、旅游船进行实时监测和定位,为游客自驾或徒步提供定位导航服务,在山岳型、高原型、滨海型等通讯信号覆盖差的旅游景区提供定位跟踪、预警救援等服务。在景区的人流集中区、环境敏感区、旅游危险区,实现视频监控、利用图像识别等人工智能技术对客流量、突发事件进行自动预警。
4.3 大数据挖掘分析
大数据背后隐藏着某些未被发掘的价值,数据已经成为公司资产、重要的经济投入和新型商业模式的基石[9],因此,大数据的核心就在于利用人工智能技术分析挖掘数据中隐藏的价值,实现数据增值。旅游业通过大数据分析工具,挖掘游客在旅游过程中生成的数据,能预测游客需求,优化旅游供给,更好地满足游客需求,实现旅游业科学化、精准化发展。
创新经营模式,提升企业效益。随着旅游的大众化,旅游需求日益多元化和个性化,旅游业要准确把握游客需求,最大限度满足游客需求,从而提升企业盈利水平。通过采集游客数量、客源地信息、年龄结构、职业、兴趣爱好、消费记录等数据信息,利用大数据分析挖掘技术,细分旅游市场,提供个性化旅游服务和产品,差别定价,实现企业效益最大化。
预测调控客流量,安全有序出游。旅游目的地和景区都有客流承载极限,大数据分析挖掘技术,能建立科学的客流量预测模型,从中长期引导游客错峰出行,短期内进行安全预警。通过历史数据、游客特征、国民收入等进行关联分析,可以长期预测客流量;通过搜索引擎旅游目的地搜索量、旅游社交网站的攻略计划、飞机航班预订、酒店预订等信息,可以中期预测客流量;通过景区入园闸机系统、旅行社团队数据、景区外交通信息、景区内视频监控系统等数据信息,可以短期预测景区客流变化,及时安全预警。
旅游营销精准化、发展战略科学化。旅游企业采集旅游社交媒体上用户生成内容、第三方搜索引擎等客源市场数据,挖掘分析游客兴趣点、关注度、消费行为、满意度、出游趋势等。以大数据分析结果为基础,开展市场分析,准确定位本地旅游市场发展方向,引导旅游业正确投资,优化旅游资源配置,有针对性的开展市场营销,挖掘潜在客源,实现旅游发展科学化,市场营销精准化。
掌握旅游舆情,旅游服务精细化。利用人工智能技术开发旅游舆情分析系统,在互联网、社交媒体、第三方平台多渠道实时采集旅游突发事件和游客分享的点评信息、旅游传记,跟踪旅游突发事件,挖掘分析游客情感倾向。旅游行业利用舆情分析系统能够及时掌握旅游突发事件,快速应对处理突发事件;能够分析游客满意度,及时处理游客诉求,为游客提供精细化服务。
5 结束语
大数据已经上升为国家战略,党中央国务院适时规划布局大数据产业,旅游业应该抓住战略机遇,开拓创新,建设旅游大数据,在现有的旅游信息化基础上,以建设支持大数据的旅游数据中心为基本途径,从制度上营造数据开放共享的政策法规环境,从业务上推进流程全数据化,从硬件上提高大数据存储处理能力,从人才上加强技术支撑力,从经济上增强数据增值的应用能力。旅游管理部门即是大数据的推动者也是大数据的应用者,既要通过行政手段推动旅游数据开放共享,更要示范性地做好旅游大数据的应用,利用大数据平台做到政务服务信息化,发展决策科学化,行业治理现代化。旅游企业是旅游大数据的主体,要加强大数据的基础建设,推进业务流程全数据化,全面提升旅游信息化水平,积累数据资源,以数据增值为目标,利用人工智能技术对数据资源挖掘分析,提升服务品质,创新经营模式,培育新业态。
[1] 大数据产业发展规划(2016-2020年)[R/OL]http://www.miit.gov.cn/n1146295/n1652858/n1652930/n3757016/c5464999/c ontent.html
[2] 李金早. 积极实施“三步走”战略奋力迈向我国旅游发展新目标—2017年全国旅游工作报告[R/OL] http://www.cnta.gov.cn/ztwz/2016nlydsj/jjqglvgzhy/201701/t20170113_8123 01.shtml
[3] 国家发展改革委办公厅关于请组织申报大数据领域创新能力建设专项的通知[R/OL] http://www.ndrc.gov.cn/zcfb/zcfbtz/201608/t20160830_816375.html
[4] 马建光, 姜巍. 大数据的概念、特征及其应用[J]. 国防科技, 2013, 34(02): 10-17.
[5] 徐玉. 全球数据中心发展趋势和特点[J]. 电信科学, 2011,27(12): 62-66.
[6] 郑彬. 设“工商旅游分局”将带来啥改变[N]. 经济日报,2016-02-03(005).
[7] 邢东伟. 三亚旅游警察创新旅游执法体制[N]. 法制日报,2016-03-03(003).
[8] 三皮. 旅游巡回小法庭 做出和谐大文章[N]. 海南日报,2016-07-12(A10).
[9] (英)维克托·迈尔-舍恩伯格, 肯尼思·库克耶. 大数据时代: 生活、工作与思维的大变革[M]. 杭州: 浙江人民出版社, 2012. 12.
A Strategy Study on the Building and Application of Tourism Big Data
MOU Jin-jun1, LUO Guo-kuan1, TIAN Xin-yan2, XIONG Zhi-bin2
(1. Hainan Weisida Electronic Technology Co., Ltd., Haikou 570203, China; 2. School of Art and Creativity,Hainan Tropical Ocean University, Sanya 572022, China)
The significance of tourism big data was analyzed; the difficulties in building tourism big data were listed. In this paper, the ways to build tourism big data was put forward, that included strengthening the standards of tourism big data, constructing the laws of sharing data, building tourism data center to deal with big data, and training talents who succeed the job of big data. Finally, the data value-added as goal, the application of tourism big data was stated as well.
: Tourism information; Tourism big data; Data center; Sharing data; Value-added data
TP311.13
A
10.3969/j.issn.1003-6970.2017.10.016
本文著录格式:牟进军,罗国宽,田兴彦,等. 旅游大数据建设及应用的策略研究[J]. 软件,2017,38(10):88-93
海南省重点研发项目资助(ZDYF2016166),海南省自然科学基金项目资助(20166225)
牟进军(1954-),男,云南昆明人,硕士,高级工程师,研究方向为智慧旅游、大数据;罗国宽(1982-),男,广东茂名人,工程师,研究方向为软件工程、云计算;田兴彦(1968-),男,湖南长沙人,博士,教授,研究方向为图形图像处理、人工智能。
熊志斌(1973-),男,湖北鄂州人,硕士,副教授,研究方向为机器学习、智慧旅游。