基于大数据的吉林省旅游国内客源地量化分析
2018-11-26马颖
马颖
摘要:随着旅游业的持续快速发展,业内竞争愈来愈激烈,其焦点集中在抢占旅游客源市场。根据吉林省旅游发展委员会相关数据显示,国内客源市场是其旅游业的主要组成部分。利用大数据对国内客源地进行量化分析,对提高吉林省旅游产业水平意义重大。
关键词:大数据 旅游 客源地 量化分析
中图分类号:F59 文献标识码:A 文章编号:1009-5349(2018)16-0196-02
旅游客源市场是旅游业赖以生存发展的必要条件[1],因此,如何准确可信地获取旅游客源信息成为旅游从业者积极追寻的目标。当下,互联网及其相关产业迅速发展,大数据技术成为实现这一目标较为经济快捷的方式。
一、研究对象
吉林省旅游业发展“十三五”规划对旅游业作出总体布局,长春、吉林两地是整个业态的“两核”。[2]鉴于篇幅所限,本文选择了两地最具代表性的旅游景点:伪满皇宫与松花湖。伪满皇宫是中国现存的三大宫廷遗址之一、全国重点文物保护单位、全国爱国主义教育示范基地、国家AAAAA级旅游景区、国家一级博物馆。松花湖风景名胜区总面积达700平方公里,湖面总面积554平方公里,最大蓄水量108亿立方米,著名诗人贺敬之游览松花湖后赋诗:“水明三峡少,林秀西子无。此行傲范蠡,输我松花湖。”
二、数据来源
(1)基于位置服务的地理大数据——“腾讯位置大数据”。腾讯公司目前是中国乃至世界领先的互联网增值服务提供商之一。它依托大量的产品数据,采取精准高效算法,实时获取客户端精准位置数据,从而收集到大量的地理定位数据,推出全国人口迁徙图。该图采用可视化呈现方式,及时且动态地反映出全国包括铁路、公路和航空在内三条线路中迁入、迁出最为频繁的城市排行榜。
(2)新浪微热点数据平台。未来大数据的核心是“社会化大数据”,就是把各种数据和人的社会化活动关联在一起。新浪微热点数据平台是国内领先的社会化大数据应用平台,在政务、营销、生活、旅游、汽车五大领域有深度应用。新浪微热点在上述五大领域上从聆听到数据分析、发现,到数据可视化呈现,再到最终应用形成一个完整的路径。
(3)百度指数数据平台。百度指数是一款基于统计线上数据搜索记录的数据综合平台,可以计算单个搜索词条的时空趋势、人群画像,即人群属性、地域分布、搜索时间等特征。本文所使用的百度指数搜索数据,是以“伪满皇宫”“松花湖”为关键词,时间跨度为2018年6月7日至2018年6月12日,所在地域为全国各个城市或地区的搜索指数数据,用于表征各个城市该时段的用户关注上述关键词的程度。
三、数据分析
(1)流入长春、吉林两地人口来源分析。根据腾讯人口迁徙图获取相关数据,时间段设置为2018年6月7日至2018年6月12日共6天。鉴于每日数据有小幅变动,需将每日数据按名次加权取和值,以便保证数据的稳定性。同时由于采集数据只取用每日统计的前十位,所以会出现统计次数少于6的城市。分析表1整体数据可以看出,参与统计的城市共有13个,所以对统计次数少于6的城市的权重进行差值补全,统一赋值为20(大于13即可,为了方便计算取值为20)。[3]不难看出,流入长春的人口来源地按热度递减依次为上海、南京、四平、北京、吉林、松原、郑州、哈尔滨、苏州、沈阳、天津、青岛、延边。
同样,采集腾讯人口迁徙图2018年6月7日至2018年6月12日共6天的数据,按照每次排名依次加权计算。如表2所示,这一时段流入吉林的人口来源地按热度递减依次为长春、上海、南京、北京、沈阳、哈尔滨、郑州、延边、通化、苏州、济南、大连、四平。
(2)具有去往长春伪满皇宫、吉林松花湖意向的人口来源分析。根据百度指数数据平台获取相(下转第195页)(上接第196页)关数据,时间段设置为2018年6月7日至2018年6月12日共6天。具有去往长春伪满皇宫意向的人口来源依次为长春、北京、沈阳、哈尔滨、吉林、上海、天津、大连、武汉、延边;具有去往吉林送花湖意向的人口来源依次为长春、吉林、哈尔滨、北京、沈阳、上海、延边、杭州、深圳、大连。
(3)长春伪满皇宫、吉林松花湖人口情绪地图分析。根据新浪微热点情绪地图获取相关数据,时间段设置为2018年6月7日至2018年6月12日共6天,與上述数据分析保持一致。如表3显示,对长春伪满皇宫表示喜悦情绪的地域分布依次为:吉林、北京、江苏、辽宁、天津、上海、广西、河北、陕西、内蒙古。
四、结论与对策
从上述三种数据分析过程来看,虽然时间段设置保持一致,但最后的数据结果略有差异,因为腾讯人口迁徙数据平台的人员流动着重考察实际运动的轨迹,即空间位置性,不附加其主观意愿。而百度指数平台和新浪微热点强调信息来源的社会意愿,具有较强的目的指向性。以江苏南京为例,在腾讯腾讯人口迁徙数据平台上,无论是去往长春还是吉林都稳居前列。与此同时,在百度指数平台上,江苏地域未能进入前列,而在新浪微热点上,江苏的名次与腾讯人口迁徙数据平台保持较大一致性。因此,江苏地域的人口来源可以认定为可信。百度指数上的差异可以归结为网络信息检索习惯使然,即这部分人口来源更乐意用社交媒介进行信息检索,而不是直接用搜索引擎。对于在情绪地图中出现的新面孔应加以重视,如四川、山西等地。因为这些人口来源对长春伪满皇宫、吉林松花湖都表示出极大好感,是重要潜在客源市场地域。为此,需要针对特定地域、特定人群精确投放旅游信息,进而转化为实际的旅游消费。
参考文献:
[1]赵娟.基于网络信息的河南——陕西两省入境旅游目的地国际知名度对比分析[J].长沙大学学报,2017(2).
[2]刘雪松.论吉林市旅游精品线路的构建[J].北华大学学报,2012(1).
[3]张洪,吕倩,孟浩.基于知识图谱法的我国文化创意旅游分析[J].资源开发与市场,2018(4).
责任编辑:孙瑶