APP下载

基于大数据的安徽省国家级风景名胜区游客行为方式研究*

2019-02-18唐晓岚张晶晶任宇杰

中国名城 2019年2期
关键词:名胜区游记安徽省

唐晓岚 陈 庆 张晶晶 任宇杰

1 前言

近年来,我国进行了以国家公园为主导的保护地体系建设,作为国家保护地体系的重要组成部分,我国的国家级风景名胜区取得了颇为丰硕的成果。截止到2017年3月份,我国经国务院审定批准的国家级风景名胜区共有244处。根据中华人民共和国国务院于2006年09月19日公布并自2006年12月1日起施行的《中华人民共和国风景名胜区条例》,中国国家级风景名胜区是指具有观赏、文化或者科学价值,自然景观、人文景观比较集中,环境优美,可供人们游览或者进行科学、文化活动的区域。产生于我国古代的山水文化的风景名胜区与其他保护地类型相比,除了本底属性重合之外,文化属性与旅游属性上具有显著的差异。[1]《中华人民共和国风景名胜区条例》第三十二条、第三十三条规定,风景名胜区管理机构应当根据风景名胜区的特点,保护民族民间传统文化,开展健康有益的游览观光和文化娱乐活动,普及历史文化和科学知识;风景名胜区管理机构应当根据风景名胜区规划,合理利用风景名胜资源,改善交通、服务设施和游览条件。综上发展国家级风景名胜区的旅游业,是国家级风景名胜区建设的重要任务之一。

安徽省是长江下游地区国家级风景名胜区最多的省份。2016年,国内旅游人数高达5.22亿,2017年的国内旅游人数更是达到了6.26亿。不仅客流量巨大,而且增长速度非常快。安徽省国家级风景名胜区是安徽省旅游产业的支柱,是安徽省最主要的旅游目的地。

游客行为方式指的是游客以在旅游时的娱乐行为、空间变化和与旅游有关联的生活行为方式,渗透于游客的饮食、住宿、游玩、出行、娱乐、购物的方方面面。涵盖了游客购买行动、空间移动、决策行为等。[2]对游客行为方式的研究可以回答游客从哪里来、游客的旅行状态、对景区是否满意等问题。[3]为安徽省国家级风景名胜区的建设提供合理的参照,对其制定旅游发展战略、进行景区管理等具有重要的意义。

随着信息技术的发展,大数据被应用到越来越多的研究领域。相较于传统的研究数据,大数据具有数据规模大、数据种类多、数据变化快、数据真实、应用价值高等特征。[4]任宇杰、马坤等提出克服传统规划动态性、科学性、公众参与度不足等问题的前提下,实现风景名胜区规划大数据时代高效、稳定、可持续的发展目标。[5]近年来,旅游相关的研究中,大数据被广泛的应用,闫闪闪、梁留科等人利用微博签到数据分析了洛阳游客的时空分布特征。[6]陈明运用多源大数据,以南宁大明山为例,对游客在景区内的消费行为进行了研究。[7]吴素娟、王欣以各大旅游网站分享平台为数据资料来源,探索了游客角度的景区文化建设优化的内容。[8]在游客行为的研究中,相较于传统的调查问卷的方式,[9]大数据更能直观的反映游客的真实状态,并且由于数据规模的的增加,使研究可以避免偶然因素的影响。目前网络上可供用于游客行为研究的数据主要是各个旅游网站的评价文本和游记文本。相比而言,评价文本太过简短,而游记文本可以更加精确、细致的体现游客的行为方式,是比较理想的数据来源。

2 研究区域概况

安徽省国家级风景名胜区共有10处,分布在滁州、安庆、黄山、池州、马鞍山、合肥巢湖、宣城6座城市,全部在安徽省的中部以及南部地区。按照中华人共和国建设部颁布的《风景名胜区分类标准》,安徽省的风景名胜区主要有山岳类、湖泊类、岩洞类、江河类四种类型。如果按照功能设施特征进行分类,则全部属于观光型风景名胜区。这10处风景名胜区不仅拥有优美的自然景观,还拥有深厚的文化内涵,或为宗教圣地,或有历史遗迹,人文景观也极为丰富(图1)。

3 数据来源与处理

3.1 数据来源

在马蜂窝的游记频道,分别搜索“采石矶”“巢湖”“花山谜窟”“渐江”“花亭湖”“黄山”“九华山”“琅琊山”“龙川”“齐云山”“太极洞”“天柱山”,由于花山谜窟-渐江国家级风景名胜区包括不相连接两个景区,所以对其进行了分开搜索,于2018年8月5日,用火车头采集器对搜索的结果进行了爬取,爬取的内容主要包括:游客出发的时间、出行天数、人物、人均花费、作者的常住地以及游记的正文内容,共计爬取游记文本3669篇。

3.2 数据清洗

将爬取的数据存储到Excel中,对数据进行浏览,删除信息缺失严重的游记以及火车头软件误爬的广告725篇,剩余2944篇,约490万字。然后逐篇阅读游记,删去其中重复的内容以及纯符号化的内容,例如这篇照片拍的还不错、给店家打个广告、欢迎大家与我交流等,经过筛选与整理,最终约482万字。

3.3 研究方法

根据对游客行为方式的定义,将游客行为研究划分为四个方面:游客的来源、游客的旅行方式、游客的关注点、游客的满意度。针对这四个方面分别选择合适的方法进行研究。

对“游客的来源”和“游客的旅行方式”,笔者将爬取到的数据直接进行统计分析。

对“游客的关注点”,运用词频分析技术,首先进行分词处理,安徽省风景名胜区特有的词汇如“迎客松”“翡翠谷”“宏村”等添加到自定义分词表,然后进行词频分析,从高频关键词中总结游客的关注点。

对“游客的满意度”,运用文本情感识别技术,利用ROST-CM软件对游记中文本中作者的情感进行识别分析,从游客的情绪是积极、消极还是中性来判别游客是否满意。

最后基于对游客行为方式的研究,提出识别安徽省国家级风景名胜区建设中存在的不足,提出合理化建议。

4 游客行为分析

4.1 游客的来源

笔者从空间与时间两个角度对游客的来源进行了分析,即安徽省国家级风景名胜区客源地的分布和游客的出行时间。

通过对爬取的安徽省国家级风景名胜区游记作者的常住地作为客源地的数据来源进行统计,得到的结果如表1所示。可以看出,安徽省附近的上海市占比最高,为14.92%;其次是北京,为12.45%;再次是江苏省省会南京,为7.11%。

根据统计得到的客源地中各城市的占比情况,计算出各省的占比情况,如图2所示。本省的游客仅占11.66%,紧邻安徽省的江苏省占比最高,为15.91%,此外与安徽省相邻的浙江、山东、湖北以及经济发展较好的广州也占比较高,分别是7.71%、5.73%、4.45%、6.32%。较为偏远的且经济发展水平较低的新疆与宁夏则为零(图2)。安徽省国家级风景名胜区的游客主要来源于省外,这必然与安徽省国际风景名胜区的知名度有莫大的关系,同时也得益于安徽省便捷的铁路交通系统。

以上可以看出,安徽省国家级风景名胜区的的客源地分布主要受客源地地理区位与经济发展两个因素的影响,距离安徽省较近或者经济发展较好的地区所占的百分比较高。

经济学界将居民的消费的演化划分为三个阶段:量的满足时代、质的满足时代和精神满足时代。[10]在精神满足时代所进行的精神消费的特点可概括为身心的旅行和游览。在我国经济发展较好的地区,随着人均收入增加和居民生活水平提高,精神消费已经是居民生活的重要组成部分,旅游已由奢侈性消费转变为大众性消费。[11]所以该地区居民的旅游需求会比其他的地区的居民强烈。安徽省的特殊铁路交通地位、丰富的旅游资源,则可以很好的满足他们的需求。

在时间方面,通过对爬取的游记作者出发时间进行统计(图3)。安徽省国家级风景名胜区的游客高峰出现在4月与10月,分别占全年游客比重的15.33%与12.78%。8月与12月份由于假期较少,气候舒适度较低等原因,游客最少,分别只占全年总游客量的5.82%与6.16%。

表1 安徽省国家级风景名胜区游记作者客源地占比情况表

安徽省国家级风景名胜区的面积普遍很大,适合多日游览。最大的巢湖风景名胜区面积1300平方公里;除太极洞以外,面积最小的是花山谜窟-渐江风景名胜区,为42.9平方公里。对于游记作者的旅行天数进行统计,结果见图4。大多数游客的旅行天数为2天或3天,分别占比24.6%和23.5%。旅行天数为1天的游客占19.9%。由于部分游客的旅游目的地不止一个,所以13.6%的游客的旅行时间超过了5天。

游客的时间分布不均,就需要安徽省国家级风景名胜区采取弹性的管理措施,保证游客高峰时段风景名胜区的正常运行与安全。多数游客的游览时间都超过1天,说明绝大多数的游客都是需要住宿的,合理解决游客的住宿问题,特别是旅游旺季游客的住宿问题,管理部门应该给予充分的重视。

4.2 游客的旅行方式

本研究主要从游客的出行方式以及消费水平两个方面来研究游客的旅行方式。

统计爬取数据中的安徽省国家级风景名胜区游记作者的出游方式,如图5所示。可以看出多数游客会选择和朋友或者一个人出游,两种出游方式的人数加起来占总人数的60.69%。最少的则是和同学,仅为1.9%。

除了以上数据之外,参加旅行团的出游方式也值得关注。对经过清洗之后的游记,运用BDP、ROST-CM、ROST-WordParser等工具或平台进行分词和词频统计之后(统计结果见表2),发现“团队”、“旅游团”等关键词出现的频率都较高,分别排第15和第17。所以参加旅行团也是一种比较普遍的旅行方式。

表2 安徽省国家级风景名胜区游记正文高频关键词表

安徽省国家级风景名胜区的规划与管理应该重视游客的出行方式,在住宿、餐饮方、景区坐凳布置、游览车辆的选择方面重点针对一个人出游、与朋友一起出游、跟团出游的游客,同时兼顾其他游客的需求。

对爬取的安徽省国家级风景名胜区游记中的消费数据进行统计,结果如图6所示。可以看出安徽省国家级风景名胜区的游客消费大致随着人均消费金额的增加,消费的人数逐渐减少。人均消费在0-500元之间的人数最多,占总人数的32%。

旅游消费环境的构建是影响游客满意度的重要因素之一。安徽省风景名胜区的游客消费偏低的原因有以下几点:(1)游客滞留时间短,从上文可知出游天数为三天以内的游客占大多数;(2)安徽省国家级风景名胜区的旅游周边产品开发不多,文创产业较为薄弱;游记文本中很少提到与景区相关的文创产品;(3)游客对消费环境不够满意,存在欺客现象、部分景区餐饮质量不高。例如游记文本中提到的“一个小杂鱼要卖到108元”的现象。

表3 安徽省国家级风景名胜区游客的关注点及对应的景区表

4.3 游客的关注点

安徽省国家级风景名胜区共有10处,各有特色,游客的关注点也不尽相同。笔者对表2中的高频关键词进行分类整理,筛选出游客的关注点,发现游客的关注点主要集中在宗教文化、历史典故、奇特景观三个方面。其中关于宗教文化的的高频关键词有:圆寂、旃檀林、财神、主持等;关于历史典故的高频关键词有:孝肃公祠、孙权、翠微亭、周瑜、茅盾、晋代等;关于奇特景观的高频关键词有:主峰、翡翠谷、世外桃源、翠竹、翠湖、珍禽等。分别对应的景点如表3所示。

安徽省国家级风景名胜区的类型主要以观光型风景名胜区为主,这类风景名胜区的旅游价值主要体现在观光游览方面,所以游客的关注点一般都会集中在景观上。景观包括自然景观与人文景观,安徽省国家级风景名胜区中大多是两种景观并存,相得益彰。从琅琊山风景名胜区和天柱山风景名胜区的游记文本中可以看出,游客的对安徽省风景游览,一方面是观赏景区内奇特的自然景观,另一方面就是了解与景区内人文景观相关的历史典故与宗教文化。

4.4 游客的满意度

文本情感分析技术是建立在人工智能与机器学习上的一种新技术,主要是通过搜索和识别文本中的情感关键词,并对于其关联的词汇进行分析侦查影响词,附于词汇一个和某项情绪的“关联”值。从而判断作者的情感是积极、中性还是消极。运用到游记文本的分析中则可以根据游客的情感判断游客的满意度。

运用ROST-CM中的文本情感分析板块,将2944篇游记的正文整理之后导入其中,结果显示游记作者的积极评价有2748条,占游记总数的93.34%。笔者对积极评价中积极情绪比较强烈的,分数高于500的98篇游记进行阅读,发现游客的积极情绪产生于游客游览的整个过程,主要体现在以下三个方面:(1)到达旅游目的地所产生的自豪感,比如游记文本中提到的“突然就从浑浑噩噩的状态中抽离了出来,无比亢奋!因为它是网红它是黄山的标志”;(2)欣赏优美景观的喜悦,如“看着蓝蓝的天,和昨晚尚未融化的残雪,真的难以想象的美丽,天是透明的,路途清晰了,视野开阔了,心情爽翻了”;(3)回味旅游过程的满足,例如“走走拍拍,湖光山色,美不胜收,天柱山给我留下十分深刻的印象!”

表4 安徽省国家级风景名胜区游客的消极情绪来源表

游记文本中中性评价有70条,占游记总数的2.39%;消极评价有126条,占游记总数的4.27%。总体而言游客满意度较高。笔者对126篇消极评价的游记进行了阅读,逐篇对游客的不满意因素进行分析,最后进行归纳,总结出游客的消极评价主要集中在购物、住宿、餐饮、交通、管理五个方面,并且多数与消费相关(如表4所示)。

本研究应用网络游记文本为基础数据,通过对大数据的采集、挖掘与整理,得出的主要结论有:首先,“在游客从哪里来”这个问题上,安徽省国家级风景名胜区的的游客受地理区位与经济发展的影响,主要来源于北京、上海、广东、江苏等地;游流高峰一般出现在四月以及十月,八月与十二月客流最少。其次在游客的旅行状态方面,与朋友或者独自旅行的人占大多数,跟团旅行同样值得关注;随着人均消费金额的增加,消费的人数逐渐减少,游客消费偏低;游客的关注点主要集中在宗教文化、历史典故、奇特景观三个方面;最后游客满意度较高,但是价格不合理、管理不善、安全问题等是游客不满意的主要原因。

大数据视角下的游客行为进行分析,可以在游客的角度反馈出景区建设所存在的问题。通过本文的分析看出安徽省国家级风景名胜区建设已经得到了一定的成果,但在游客视角看来仍然存在一些问题。随着我国经济的发展。旅游,逐渐从游玩观光转变为一种体验消费。游客的需求也逐渐从光游览转变为食、住、行、游、购、娱多方面的消费体验。[12]安徽省国家级风景名胜区存在的问题正是因为没有及时的完全适应这种转变。笔者基于以上分析,对安徽省国家级风景名胜区建设提出以下几点建议:

一是当地的国家级风景名胜管理机构和当地的政府应该注重各种大数据技术的应用。加快创建智慧景区,增加景区的便捷度的同时可以随时获得游客的反馈,然后运用云计算平台来搜集与分析关于景区的反馈数据,从而发现自身景区建设的不足,并且能够及时作出整改,同时依据数据库结果调配旅游服务资源。

二是提高游客满意度,改善游客的消费体验。对景区乱收费以及收费过高的问题进行专项整改,对于诈骗行为予以有效打击,为游客创造安全的消费环境。同时做好安全防护工作,增加雨雪天气的应急预案,做到在突发天气或者极端天气中也可以确保游人的安全。同时对景区的错别字进行仔细的盘查,优化升级配套服务设施,对存在问题的服务设施进行整改。

做好精细化服务,面对不同方式出游、不同出行时间、不同停留时间、不同消费水平的游客,安徽省风景名胜区要优化自己的管理措施与服务措施,做到满足大多数人的需求的同时兼顾少数人的需求,进一步提升游客的满意度。积极发展与国家级风景名胜区相关的文创产业,创新旅游产品,从供给端刺激游客消费。

三是借鉴其他省份旅游产业优化升级的经验。与安徽省相临近的浙江省与湖北省都有很成熟的旅游产业优化升级的经验。

浙江省通过产品创新、技术创新、管理创新,[13]不断地开发新的旅游应用,以大数据技术为依托,取得了众多的成果。其中“诗画浙江全域旅游信息服务系统”,被被纳入首批政府数字项目。在大数据技术以及精细化服务模式的带动下,浙江省近几年的旅游业得到了迅猛的发展,2017年接待游客6.4亿人次,实现旅游总收入9323亿元。将旅游业发展成为了江苏省的重要支柱产业。

湖北省的旅游产业在几年前面临着管理体制不健全、产品普遍存在档次不高、核心产品不明确等问题。[14]为了实现“打造国内一流旅游目的地和长江国际黄金旅游带核心区”的目标定位,湖北省进行了“总量控制、规范评定、定期复核、动态管理”的新的景区管理机制;推出了旅游景区“红黑榜”,促进景区的优质化建设;并且进行了旅游业的“扫黑除恶”专项活动,确保游客的消费安全。这些措施保障了湖北省的旅游业在产业优化升级中的健康发展。

安徽省国家级风景名胜区应该借鉴以上省份的经验,取长补短。适当的调整旅游发展战略。

四是安徽省国家级风景名胜区的规划与建设中进行特色景观的开发同时,应注重特色景观的保育以及生态环境的保护,进行生态风险以及环境承载力的评估。处理好保护与开发之间的关系。不能以牺牲特色景观或者生态环境为代价,促进旅游业的发展。

本文的研究尚有一些不足之处:一是游记文本数据相对于庞大的游客群体有些小众化,写网络游记的人只是部分游客,本研究的分析可能会有所偏差;二是没能运用大数据与传统的调查数据互相印证;三是没有对相关联的旅游目的地进行研究。

猜你喜欢

名胜区游记安徽省
上饶集中营名胜区
成长相册
马陵山风景名胜区红色文化教育园
安徽省家庭教育促进条例
安徽省家庭教育促进条例
安徽省家庭教育促进条例
地心游记(十)只剩我一个人
寻梦环游记
寻梦环游记
某风景名胜区悬索吊桥检测探讨