基于文本挖掘的青岛淡季旅游形象研究
2019-05-15张东晨
张东晨
旅游目的地形象感知是游客对目的地的认识和评价。按照游客行为的进行阶段,可以将游客感知划分为本底感知、决策感知、实地感知和最终感知。最终感知是指游客游览活动结束后,根据游览经历对旅游地信息进行再加工后,抽象、提炼出的对旅游地的最终认识,也称作旅游认知。本次研究通过对网络游记进行文本挖掘,分析青岛淡季的旅游形象,探索青岛淡季旅游产品开发方向。使用Rost Content Mining6软件(以下简称Rost CM6)获取高频词,初步得到四个旅游形象;然后运用内容分析法,构建青岛淡季旅游形象属性内容类目,并对样本进行编码,得到游客对各类旅游形象要素的感知程度;最后根据分析结果,对青岛淡季旅游开发提出建议。
一、研究综述
当前,国内外对淡季旅游的相关研究成果较少,而针对淡季目的地形象的研究更是少之又少。冯学钢等在《反季旅游与旅游季节性平衡:研究述评与启示》中对反季旅游做过相关研究,认为应从市场潜力的角度研究特定区域发展反季旅游的可行性与操作性。段正梁等在《基于网络文本分析的游客淡季出游行为研究》中通过网络文本分析的方法对淡季游客出游行为进行了研究,认为淡季时游客的出游主要是被淡季优点所吸引,这些游客主要来自东部地区及目的地周边城市地区,具有选择更为快捷的交通工具、出游时间较长、自由行为主的行为特征。同时,游客在淡季出游的感知深受内部和外部两大维度因素的影响。柴寿升在《青岛旅游业之季节性及其均衡对策研究》中认为缓解青岛旅游季节性应从旅游供给角度入手,建议开发建筑旅游、博物馆旅游、会议与展览旅游、宗教旅游、节庆旅游和康养类休闲旅游。Spencer、Holecek在大湖(Great Lake)地区进行了家庭电话调查,对北美秋季旅游市场进行了研究。结果表明,与夏季市场相比,秋季游客的年龄往往更大,且更喜欢结伴出门旅游。例如,在土耳其,德国和荷兰的入境旅游者年龄大多在50岁以上,也偏向选择淡季出游。此外,Moller研究了澳大利亚55岁以上旅游者的旅游行为,发现老年旅游者目的地的选择并没有太大变化,变化的是他们在淡季出游的愿望。另有研究发现,低价机票是淡季出游的刺激因素,也为淡季出游开辟了新的细分市场。由此可见,淡季出游具有一定的市场潜力,从供给角度来看,目的地应从提供文化类、康体类、节庆类旅游产品角度开发新产品,同时,满足游客寻求低价、安静、悠闲的心理。综上,从需求角度来看,银发市场是淡季出游的主力军。
二、研究方法与资料来源
(一)内容分析法
旅游目的地形象研究最为常用的数据获取方式为问卷调查法,但问卷调查对概率较小的隐含信息难以识别。同时,问卷设计者的主观因素和问卷发放时间都会影响调研结果。因此,在调研过程中,对问卷调查法的科学性和合理性应有较高的要求。
随着互联网的蓬勃发展,游客自主表达的手段愈发便利,网络游记、博客、朋友圈等新兴信息交流平台是获取旅游目的地形象的“新大陆”。
内容分析法是一种观察性研究方法,旨在通过对文本信息特征的识别得出研究结论。研究时需要将大量文本内容通过词频分析和编码进行简化、压缩和分类整理。词频分析是统计文本中的高频词汇,用于识别与研究相关的词汇,如万蕙、唐雪琼在《无羁的快乐,缺位的道德——对网络文本中傣族泼水节游客狂欢体验的内容分析》一文中运用该方法对网络文本中泼水节游客体验的内容进行了分析。
(二)资料来源
马蜂窝旅游网是2006年上线的旅游专业网站,本文以马蜂窝用户发表的游记作为抽样样本,以“青岛”为关键词进行搜索,共得到游记53660篇。青岛的旅游淡季一般为每年10月中旬至次年5月下旬,因此,本文以“2016年11月—2019年2月”为时间节点,剔除旺季游记,删除广告、疑似网络写手杜撰的游记以及有明显复制抄袭痕迹的游记。经过筛选,共计得到92篇游记作为样本,总字数329871。得到的92篇游记中剔除与研究对象无关的字句、表情符号、英文缩写、数字等内容,手工整理后,共得到103211字的分析文本。
三、研究思路
本文旨在进行青岛淡季目的地形象研究,基于马蜂窝网站青岛淡季游记文本,首先,使用Rost CM6提取描述青岛淡季旅游形象的高频特征词和频数,初步了解青岛旅游形象主题;然后,运用内容分析法,建构分析类目,对研究样本进行编码,检验编码结果信度,对青岛淡季旅游形象属性编码结果进行描述性统计,了解旅游形象属性主类目和次类目的频次分布,进一步完善对青岛淡季旅游形象的认知;最后,根据分析结果,提出青岛淡季旅游开发的建议。
四、研究过程
(一)高频特征词分析
将103211字的分析文本用Rost CM6进行词频分析(见表1)和社会语义网络分析(见图1)。将青岛的主要地名、景区名、店名、食品名等纳入自定义词典,得到301个高频词,其中,对语义相近的词汇进行了归并,如“孩子”和“小朋友”,“金口”和“金口路”;删除了无意义副词、动词,如“以上”“准备”“选择”等,整理后,共得到223个高频词,初步了解游客的旅游形象认知。由于文章篇幅有限,仅展示前60个高频词。
表1 词频排名前60位的词条及出现频率
图1 社会网络和语义网络分析图
(二)内容分析过程
1.构建内容分析类目
以Rost CM6分析的高频词为基础,结合淡季青岛的实际情况,根据旅游产业传统分类:吃、住、行、游、购、娱,额外加上环境,构成7大主类目;参考《旅游资源分类、调查与评价(GB/T18972-2003)》,设计23个次类目,共同构成旅游形象属性内容分析类目(见表2)。
2.编码
编码是将分析单位置于内容分析类目的过程。本文安排了3位编码员对92篇游记(分析单元)进行独立编码,并进行了信度检验。编码员间的交互判别信度计算公式如下:
R为交互判别信度,n是编码员数量,K是编码员之间的平均相互同意度。对于K的计算公式如下:
Mab是两位编码员编码结果完全相同的分析单元数,三位编码员的平均相互同意度KABC的计算公式如下:
由此,可得到本文各主类目和次类目的交互判别信度(见表3)。根据以往研究结论,交互判别信度在0.80以上即可接受,经计算,本文各项交互判别信度均在0.80以上,编码结果可用。
五、结论和建议
(一)青岛淡季旅游形象高频特征词分析
根据Rost CM6统计的223个高频词,可以发现其中名词类居多,共有178个,涵盖景点、地名、美食、交通、住宿等事物,反映了旅游者在淡季时期最热衷的青岛旅游资源;动词共计24个,展现了旅游者淡季来青岛的目的以及活动特征,如“享受”“度假”等;形容词、副词共计11个,主要反映了旅游者对淡季价格的感知、对旅游环境的满意度等,如“优惠”“免费”“不错”“美丽”。
表3 编码员之间的交互判别信度
根据高频词的整体情况,可以将淡季的青岛形象归纳为以下四个特征。
1.价格优惠
淡季时期是青岛旅游性价比最高的时期,“人少价好”为主要特征,是吸引学生族、穷游族、有条件错峰出游人群的首要因素。
2.室内活动为主
受温带海洋性气候影响,青岛11月、3月、4月、5月虽然气温偏低但气候较为温和,而12月、1月、2月气温较低,尤其是海边风力较大。因此,游客选择此时来青岛游玩,大多是为了满足看海的心理,游览活动也仅限于沙滩漫步或玩沙子等散步式游览,样本中没有出现“下海”“游泳”“海澡”等字样的高频词。此外,游客游览行程大多安排在室内场所,如博物馆、海底世界等室内景区,或者教堂、名人故居、咖啡馆、特色书店等室内文化旅游景点(“博物馆”“海底世界”“梁实秋”“闻一多”“1907光影俱乐部”“温泉”“教堂”等)。
3.文化旅游居多
被游客提及最多的旅游项目是文化类旅游项目,如“名人”“故居”“建筑”“光影”“民俗”“文艺”等。青岛历史文化悠久,经济发达,积淀下来的文化旅游资源众多,如“青岛啤酒博物馆”就属于发达的工业活动之后沉淀下来的青岛特有的文化资源。再如,“梁实秋”“闻一多”“郭沫若”等名人资源都为青岛文化旅游增添底蕴。
4.亲子、情侣为主要客源
根据市场调查,淡季旅游出行主力应为中老年群体,但网络游记的作者与其同伴年龄均偏低。据推测,应是中老年群体出游后没有写网络游记的习惯所致。因此,本研究所统计到的样本,出游市场为亲子、学生、情侣、闺蜜等年轻群体,与之对应,此类群体出游景点选择和出游习惯偏向年轻化。如景点选择在“游乐场”“海大(中国海洋大学)”“咖啡馆”“书屋”等;住宿选择在“青旅(青年旅社)”“民宿”等;游览方式更多为“压马路”“逛吃”等。
(二)青岛淡季旅游形象属性内容类目分析
根据本文所建构的“青岛淡季旅游形象属性内容分析类目”进行分析,92篇游记中共提及主类目367次,次类目1989次(见表4)。
被游客提及最多的类目是景观类,其他依次为餐饮类、住宿类、交通类、环境类、游览类、购物类。景观类和餐饮类的合计频次为247次,占比达到67%。这表明,淡季来青岛旅游的游客除了游玩景点外,主要以品尝美食为主。景观主类目中,最多的是水域景观,其他依次为生物景观、建筑景观、遗址遗迹、人文活动、地文景观、天象景观。与高频词分析结果相同,每个来青岛旅游的游客都有个“看海梦”,无论天气如何,既然来到海边就一定要去海边走走的游客占大多数(“大海是青岛之行绕不过去的情结”)。除了大海,淡季的青岛最受欢迎的旅游吸引物当属建筑类、生物类、遗址遗迹类和人文类(频次均超过百次)。青岛的万国建筑(八大关)、各类博物馆、教堂、栈桥、五四广场、书屋/书坊、小青岛、奥帆中心、情人坝、大学路、鱼山路、台东步行街、信号山公园、中国海洋大学是大部分游客的“必选项”。
餐饮主类目中,大多数游客更加倾向于特色小吃,大部分游客都会提到“劈柴院”;“崂山可乐”是很多游客尝试的特色饮品。住宿主类目中,虽然近几年民宿概念很火,但根据统计样本来看,大多数游客依然选择入住传统酒店。根据调查样本,推测原因主要有以下两点:一是青年学生居多,会选择在青年旅社、便捷酒店等价格实惠的地方,而动辄上千的民宿是少数游客的选择;二是像希尔顿、海景之类传统星级酒店,在淡季期间推出力度很大的促销活动,加上星级酒店拥有较好的服务环境和基础设施,所以在价格相近的情况下,游客会选择在淡季感受一下星级酒店的服务和环境。
表4 青岛淡季旅游形象属性的频次统计
交通主类目中,大多数游客会提到自己到达青岛所乘坐的交通工具,根据样本,出行选择以动车、飞机居多,因淡季飞机票价折扣大,很多游客相较之下会选择飞机出行;而在市内游览中,游客很少会提到具体的出行方式,“出去走走”“逛逛”之类的表达居多,与高频词中感知到的“休闲”“度假”出行特征相吻合。这也说明,全域旅游所提出的“目的地景区化”的要求非常贴合大众游客需要。另外,游记中提到最多的是胶州湾隧道,尤其是亲子出行的游客,都会特意去感受一下海底隧道的神秘感。
环境主类目中,物价环境和整体氛围是最受游客关注的形象属性。物超所值的价格、具有欧式风情的建筑所烘托出来的小资情调、梦幻浪漫的感觉,是游客普遍的感知形象。
游览主类目中,由于表达方式不同,有的游客只着重描述某个景点,有的游客则会描述整个行程。因此,样本统计出来的占比0.9%的“各个景点”的游览方式并非团队游客,依然以自由行的散客为主。据此可以推断,年轻的淡季出行游客几乎都会选择自由行的出行方式,游览大街小巷、品尝美食、打卡网红餐厅或景区(点)。此外,购物主类目中,游客提到的购物活动并不多,仅有的购物也以购买海鲜、樱桃为主。
综上,淡季的青岛依然存在巨大的客源市场挖掘潜力,未来可以继续深入挖掘淡季市场,优化接待体验,有效缓解旺季市场拥堵问题。除无法监测到的中老年市场外,亲子、学生、情侣、闺蜜皆是可以考虑开发的客源市场类型。此类人群喜爱自助游出行,游览线路参考网络攻略自行拟定,热衷网红打卡地,乘坐飞机、动车入境,怀着休闲放松的心态,以闲逛为主要游览方式。旅游吸引物中,海洋、栈桥、情人坝、五四广场、八大关、各类教堂、各类博物馆、劈柴院、奥帆中心、胶州湾隧道、书屋、小青岛、大学路、鱼山路、台东步行街、信号山公园是游客最热衷的景点,值得注意的是,除了青岛啤酒外,崂山可乐是游客来到青岛后热衷尝试的饮品。唯一遗憾的是,游客入手的伴手礼几乎没有,购物消费较少。
(三)结论和建议
本文使用Rost CM6对淡季青岛游记进行文本挖掘,探索淡季青岛旅游形象。先后运用了高频词获取和内容分析法,整理样本后分析得到游客对淡季青岛旅游形象感知的属性和特征。根据实证研究,得到如下结论。
首先,运用Rost CM6对92个样本文件提取描述淡季青岛旅游形象的60个高频特征词,初步得到四个旅游形象:价格优惠,室内活动为主,文化旅游居多,亲子、情侣是主要客源。然后,运用内容分析法对样本进行进一步分析,分类目获得具体感知形象。通过淡季青岛旅游形象内容分析类目、编码员信度检验、对样本进行编码,得出各类目频次,可以总结出旅游者对淡季青岛旅游形象要素的感知程度,依次为:景观、餐饮、住宿、交通、环境、游览、购物。
今后,淡季青岛的旅游开发与规划可以着重从以下几个方面入手:一是充分发挥价格优势,从“人少且性价比高”的角度入手做营销,变劣势为优势;二是重视室内景点旅游设施的完善,完善游客偏好的各类博物馆、各类教堂、海底世界、名人故居、书屋的自助游设备,如网络覆盖、指示牌、冷暖直饮水设备、自助导游系统、婴儿车寄存、打卡最佳拍摄点推荐等;三是深入挖掘青岛历史文化内涵,开发文化旅游产品,建议以“文化+体育”的方式进行开发,增强文化资源的体验感,如崂山太极拳体验、青岛啤酒+电竞足球体验等;四是完善适应独自游、情侣游、闺蜜游、亲子游等多种散客市场需求的旅游产品和基础设施,如一人食餐馆卡座、市内公共交通系统换乘优惠卡等;五是开发青岛特色伴手礼,如网红小吃便携装、中国海大系列文具、书屋购书专属印章等。
本文还存在多处不足,在今后的研究中将逐步克服。在数据源方面,可增加官方网站、其他著名企业网站和微博数据;在数据类型方面,应加入图片、视频等内容的分析;在技术手段方面,可运用火车头采集器、Nvivo10、SPSS等软件进行更加系统、深入的分析。