APP下载

基于网络文本分析的民族村寨国际旅游形象感知研究
——以黔东南州为例

2019-05-17张洪昌舒伯阳

关键词:高频词村寨入境

张洪昌,舒伯阳

(中南财经政法大学 工商管理学院,湖北 武汉 430073)

一、引言

民族地区拥有丰富而独特的文化旅游资源,发展入境旅游可以促进民族地区旅游,增强旅游品质,转换增长动能以及提升旅游目的地国际影响力。在经济全球化和“一带一路”战略背景下,发展入境旅游成为我国从旅游大国迈向旅游强国的关键。国际旅游形象是检验和衡量我国少数民族旅游地区创建国际旅游目的地的重要依据。因此,从入境游客的视角考察民族村寨的国际旅游形象感知,特别是对国外游客青睐的原生态民族传统村寨进行比较,审视民族旅游发展特征及问题,对少数民族地区国际旅游目的地创建目标以及提升国际旅游竞争力具有重要意义。

旅游形象感知是旅游者对旅游目的地的综合评价与表达。学者们将旅游感知形象分为认知形象、情感形象和整体形象三个方面[1,2]。Ruzzier(2010)认为,传统的旅游形象感知可作为目的地评估中的最重要方面,适当增加旅游意识、旅游质量以及旅游忠诚度的维——会让评估效果更佳[3]。不同群体的旅游形象感知存在差异,Papadimitriou(2015)通过对当地居民、过去游客和潜在游客三个不同群体进行比较研究后发现,居民往往受认知形象和情感形象的影响,而游客则主要依赖于整体形象感知。随着互联网的普及,网络信息对旅游形象和出游决策产生重要影响[4]。Kim(2017)以新浪微博为例,实证分析了旅游信息质量的内容和非内容线索在社交媒体中形成用户旅游目的地形象的作用。研究表明,作为非内容提示的若干内容线索和网页设计与认知形象和情感形象具有正相关关系[5]。国内学者主要围绕旅游形象感知的类型特征、影响要素、产品品牌开发等方面进行研究。王媛(2013)将古镇旅游感知形象划分为地理位置形象、旅游地类型形象和地方性形象,且旅游形象出现“长尾”特征和“非利基”形象,可以视情况进行差异化开发[6]。吕兴洋等(2015)运用实验法探讨在线信息搜索对目的地感知形象演化的影响机理,发现由于网上非目的地营销组织控制型信息源的存在,导致实验组的引致形象呈现出明显的长尾分布特征[7]。李萍等(2017)以北京市为例,对国内五大在线旅行商的点评数据进行分析,认为文化认知在情感意向中最为突出,并将城市旅游社区归纳为历史文化型、现代文化型和综合型三种类型[8]。孙晓东等(2018)对携程网中的游轮评论进行研究,发现我国游客的游轮形象感知表现出从核心到边缘的四个语义网络层级,同时,边缘层的长尾词汇主要集中在品牌特色方面[9]。通过梳理文献发现,目前尚未有学者对民族村寨的国际旅游形象感知进行系统研究。在研究对象方面,学者们主要集中在城市旅游、古镇旅游、社区旅游、游轮旅游等方面,关于民族村寨旅游形象感知的研究较少;研究人群以国内游客为主,对入境游客的考察较少;研究方法上,大部分是采用国内的Rost Content Mining 软件,该软件主要是处理中文文本,难以实现对外文文本材料的有效分析。因此,本文运用KH Coder对入境游客的英文评论进行文本分析,以考察民族村寨的国际旅游形象感知状况,为相关研究提供借鉴参考。

二、研究方法与数据来源

(一)案例地概况

黔东南苗族侗族自治州是我国苗族侗族人口最集中的地区,全州下辖16个县市,户籍人口475.99万人,少数民族人口占81.1%,其中苗族人口占43.0%,侗族人口占30.4%。州内民俗风情浓郁,旅游资源丰富。截至2018年末,黔东南州共有14个国家4A级景区,其中凯里市、雷山县、镇远县和施秉县各2个,黎平县、锦屏县、丹寨县、黄平县、剑河县和从江县各1个,国家4A级景区包括西江苗寨、郎德苗寨、肇兴侗寨、岜沙苗寨等民族村寨。另有18个国家3A级景区,包括大利侗寨、大塘苗寨、施洞苗寨等民族村寨。黔东南州村落资源丰富,州内50户以上的自然村寨多达3 922个,其中有409个村寨(行政村为主)共五批次入选了国家级传统村落名录,是国家级传统村落数量最多的地级行政区。2016年,黔东南州被国家旅游局批准创建中国国际特色旅游目的地。因此,选择黔东南民族村寨作为案例地,对入境游客民族村寨旅游形象感知研究具有代表意义。

(二)研究方法

KH Coder是一款免费的非结构化文本分析和数据挖掘软件。软件语言类型支持英文、日文、法文、德文、意大利文、西班牙文和葡萄牙文等七种文字,在分析外文文本方面比其他软件更为灵活、科学客观,主要功能有词频、词性、检索、聚类、相关等分析以及实现网络可视化;将待处理文本导入KH Coder就可以直接导出分析结果,避免了过多的人工干预。根据研究需要,结合网络文本材料,本文主要运用KH Coder的词频分析和语义网络分析功能。

(三)数据来源

文本资料均选取于Tripadvisor网站的英文评论内容。Tripadvisor是全球最大的旅游评论网站,覆盖超过190个国家的 750万个酒店、餐厅和景点。该网站共有真实旅行者超过6亿条以上的点评和建议,全球用户每日新增点评数量超过5万条。Tripadvisor网站支持28种不同语言进行点评,是境外旅游者使用最广泛和认可度最高的旅游网站。网站检索模块主要有酒店、景点、美食和目的地,评论模块包括标题、具体内容、整体评分、出游类型、评价时间等必填项和建议旅游周期、上传照片、购票建议、穿着建议、上网设施等选填项,这些固定模块确保旅游者评价更为便利和科学。同时,每一条评价都需要旅游者承诺内容属于亲身经历及真实想法,遵守网站关于严禁虚假点评的相关政策。这些入境旅游者相对来说文化水平较高,这在一定程度上也确保了评价内容更为客观。鉴于此,本文利用Tripadvisor网站中所有关于黔东南州少数民族村寨的入境旅游者评价进行研究,时间从2010年2月至2018年5月,覆盖14个少数民族村寨,共收集115条英文评论,剔除3条有明显错误的无效评论,最终得到112条入境游客评论用于本研究(见表1)。将所有文本资料整理为Excel文档,导入KH Coder软件中进行预处理(Pre-Processing),然后根据旅游形象感知需要进行词频分析和语义网络分析。

表1案例地概况及数据来源分布

三、形象感知分析

形象感知是旅游者的主观态度和认识,来源于旅游者的旅游体验,受到目的地资源特征、设施服务、制度环境等诸多客观因素和旅游者自身素质、性格、习惯等主观层面的影响。以下从整体形象、认知形象、情感形象以及长尾分布等方面进行形象感知分析。

(一)整体形象感知分析

从使用KH Coder提取的描述黔东南民族村寨旅游形象的60个高频特征词(见表2)可以看出,在系统剔除无效的介词和代词以后,高频词以名词和形容词居多,名词主要集中在旅游整体属性、吸引物以及旅游设施与服务等方面,形容词则主要体现在对旅游形象的态度与看法。其中,village(村寨)出现的频次最多,在112条评论中达到253次,同时Miao(苗族)和Dong(侗族)的频次分居第2和第6位,这与入境游客到黔东南主要是以游览苗寨侗寨有关,黔东南苗族和侗族的人口及村寨数量最多。排在前十位的还有local(当地)、place(地点)、house(房子)、people(人们)等词汇,反映了入境游客对黔东南当地热情好客的少数民族及其独特的木房建筑(如鼓楼和吊脚楼)的青睐。

在Tripadvisor网站评论模块上,每一条评论均设有五个等级的评价,包括非常好(excellent)、很好(very good)、一般(average)、差(poor)、很糟(terrible)。结合研究需要,可以从好评到差评分别赋以5、4、3、2、1的分值。通过梳理得出,黔东南州14个民族村寨的112条评论中,平均得分为4.12,整体上属于很好的评价水平。鉴于低于5条评价数量的景区缺乏一定的可比性和客观性,因此选取评论数量在5条及以上的7个景区进行比较分析。从表3可看出,郎德苗寨的得分最高,且变异系数最低。郎德苗寨是贵州省最早进行旅游开发的民族村寨,但由于郎德苗寨古建筑是我国重点文物保护单位,旅游商业化开发程度有限,且长期保留“工分制”的自治和分配机制,因此,入境游客对其认可程度最高;西江苗寨和肇兴侗寨的旅游开发比较成熟,旅游规模容量较大,是贵州省民族村寨旅游经济发展的标杆,但相比而言二者的得分仅属于中等水平。西江千户苗寨是中国乃至世界最大的苗族村寨,肇兴侗寨是2018年央视春晚分会场,吸引了大量入境旅游者观光游览,但普遍反映二者旅游开发过度商业化而评价不算高,当然,仁者见仁,变异系数偏大说明对于商业化的理解分歧较大;堂安侗寨毗邻肇兴侗寨,最初是由中外合作建设的生态博物馆,秉持保护性开发的理念让堂安保留着古朴浓郁的侗族文化,深得入境游客喜爱;南花苗寨则与郎德苗寨相依,旅游发展相对缓慢却也吸引了部分入境游客驻足;而位于凯里市北部的麻塘革(原为“亻革”字,因字库中无该字,故以“革”替)家寨旅游发展比较滞后,鲜有国内游客问津,却因革家特色文化吸引部分入境游客前往,但旅游体验的整体评价较差。因此,入境游客对民族村寨的整体形象感知与景区的旅游开发程度和知名度无关,相比过度商业化和游客拥挤的知名景区,他们更热衷于适度开发的原生态民族村寨,而基础设施未完善和缺乏文化活力的民族村寨亦非他们所爱。

表2样本高频词汇表

表3 部分景区入境游客评价状况比较

(二)认知形象感知分析

通过对高频词进行共现网络的聚类分析,选择模块化处理(modularity),得到共十组关系网络(如图1)。将共现网络图与词频进行对比分析,可看出民族村寨国际旅游认知形象主要表现在四个方面:旅游目的地、旅游吸引物、旅游设施服务、旅游环境氛围。

图1 共现网络分析图

第一,目的地的形象认知。以village(村寨)为核心,民族村寨成为黔东南最主要的旅游名片。如图1所示,与村寨相关的词汇形成一组,如Miao(苗族)、local(当地)、place(地点)、house(房子)、people(人们)、Kaili(凯里)等,表明入境游客总体上对黔东南少数民族村寨及当地居民的认知。

第二,旅游吸引物的形象认知。入境游客关注的吸引物主要是梯田景观、建筑景观、服饰文化、歌舞文化。梯田景观相关高频词如rice terrace(梯田)、hill(小山)、mountain(大山),建筑景观相关高频词如wooden(木质)、house(房子)、drum tower(鼓楼),Wind-Rain bridge(风雨桥),服饰文化如costume(服饰)、lady(妇女),歌舞文化相关高频词如performance(表演)、dance(跳舞)、sing(唱歌)等。大多入境游客认为这些旅游吸引物非常unique(独特的)、ancient(古老的)和authentic(原真的)。

第三,旅游设施服务的认知。交通方面,以前交通闭塞令民族村寨的可进入性较低,建议在巷道和梯田上walk(徒步)的频次达29次,同时便于亲身体验自然和文化遗产。随着贵州省实现县县通高速,大多旅游村寨形成了无缝连接,提到bus(汽车)的高达51次。贵广高铁和沪昆高铁通车后,提到train(火车)就有17次;食宿方面,集中关注shop(商店)38次、hotel(饭店)23次、restaurant(旅馆)22次、food(食物)19次,而提到fee(费用)和RMB(人民币)的次数相对较少一些,多数游客认为这些消费是worth(值得的),这大概与民族村寨旅游开发程度有限、物价水平不高、可消费体验的产品较少以及入境游客支付能力较强有关。

第四,旅游环境氛围的认知。入境游客认为黔东南村寨的少数民族比较友好,并未发生旅游安全问题和旅游矛盾纠纷。其中,friendly(友好的)出现13次,lovely(可爱的)出现9次,并有16次提到走访当地居民的home(家里)。随着黔东南民族村寨旅游开发热潮兴起,旅游环境和设施日渐完善,入境游客有10次认为其too commercial(过度商业化),另有10次认为touristy(适宜游览的)。热衷原生态民族文化的入境游客呼吁go before it 's too late(去得越早越好)。

(三)情感形象感知分析

情感形象感知一般包括积极感知、中性感知和消极感知。英文表达情感的词语及表达方式较多,文本中的情感形象感知主要集中在形容词和动词上。通过人工筛选,结合语境辨析每个关键词的不同含义,如在文本里like既有喜欢又有像的含义,同时要考虑是否有前缀un-或don’t等否定词,最后提取15个带有感情色彩的词汇。总体来看,积极感知远大于消极感知。积极感知来自于整体印象和对特色民族文化的认同,消极感知则主要来自于旅游发展的商业化以及尚未开发带来的各种不便。游客表示喜欢(love、like)的共有21次,表示感兴趣(interesting、interested)的达39次,认为值得的有19次(worth15次、worthwhile 4次)。认为苗寨旅游资源漂亮的共107次(good34次、beautiful31次、nice23次、great19次),难以置信的有13次(amazing10次、fantastic3次)。消极情感方面,入境游客对商业化(commercial10次)表达不满,他们认为过于现代化(too modern8次)和游客太过拥挤(crowd5次),甚至将旅游产品称作现代化的赝品(fake6次),因此部分游客认为此次旅行比较糟糕(bad6次)和不值得(not worth5次)。

(四)形象感知的长尾分析

长尾的概念最早由克里斯·安德森(Chris Anderson)在2004年提出。长尾理论认为,只要存储和流通的渠道足够大,需求不旺或销量不佳的产品共同占据的市场份额就可以和那些数量不多的热卖品所占据的市场份额相匹敌甚至更大[10]。区别于传统的二八原理,长尾理论以独特的视角挖掘更大的商业价值,因此在商业模式、产品开发、市场推广等方面得到广泛的应用。在旅游形象感知研究中,人们往往更加关注排名前列的高频词,对大部分位列中下游区间的词汇没有给予足够的重视。因此,本文试图应用长尾理论来分析国际旅游形象感知,从所有112条评论中的15 498个词条提取60个有效高频词,结合高频词的频率进行曲线拟合,拟合优度为0.959 7。黔东南国际旅游形象感知曲线呈现出幂函数的分布特征,函数系数为1.262 6,指数为-0.695。从图2可以看出,排名靠前的高频词仅占较为集中的“短头”,排名靠中后的高频词则呈现明显的“长尾”分布,“长尾”区域的比例远大于“短头”。因此,在提升地区国际旅游形象的实践中,不仅要关注游客反响较大的问题,其他普遍问题也要引起注意。

结合高频词特征分析,“短头”区域的高频词主要反映了黔东南旅游形象的景观、交通等硬件方面,这些硬件条件给了国外游客更加直观的感受。“长尾”区域则更多体现在对少数民族文化、旅游服务、旅游满意度等软件方面的客观认识。因此,在完善旅游硬件设施建设的基础上,突出少数民族文化优势,集中力量破解和提升地区旅游软实力。另外,围绕国外游客关心的普遍问题,抓住文化原生性和多样性的特征,在长尾中寻找利基市场,实施差异化战略,凸显地方性形象。

图2 国际旅游形象感知的长尾分布

四、结论及建议

(一)研究结论

以黔东南为例,基于Tripadvisor旅游网站的网络文本数据,运用KH Coder软件分析民族村寨的国际旅游形象感知。通过高频词和共现网络分析,发现入境游客对民族村寨旅游形象感知的高频词主要有Village、tourist、bus、house、Miao、Dong、Xijiang、Zhaoxing等。相比而言,适度开发的原生态民族村寨的评价得分较高,而过度开发和旅游接待条件较差的村寨得分相对较低。国际旅游认知形象感知主要表现在旅游目的地、旅游吸引物、旅游设施服务和旅游环境氛围四个方面。情感形象感知方面,除了常规地对旅游特征属性进行中性评价,更多还是以积极感知为主。少量的消极感知不容忽视,主要源于旅游过度开发导致的商业化,知名景区大量游客的拥挤和嘈杂以及开发有限的村寨因为旅游供给不足而造成的各种不便。另外,黔东南民族村寨国际旅游形象感知曲线呈现出幂函数的分布特征,具有明显的“长尾”分布。

(二)对策建议

第一,树立包容性发展理念,实施保护性旅游开发。大量的少数民族村寨被列为国家级传统村落,承载着悠久的农耕文明和乡土记忆,拥有丰富的物质文化景观和非物质文化遗产,因此要理清保护与开发的关系,坚持可持续发展目标,树立包容性发展的科学理念;权衡居民、政府、开发商、游客等各方利益主体的权利和义务,坚持以人民为中心的发展原则,建立当地居民的主人翁意识,不能以牺牲当地居民利益来开发旅游,要最大化调动居民的参与热情,实现多元主体的共商共建和共享共赢;注重适度开发规模,避免因大规模开发造成的过度商业化,杜绝违背少数民族文化保护发展宗旨的舞台化和符号化现象。

第二,挖掘旅游产品文化内涵,提升旅游管理服务水平。当前民族村寨旅游发展的主要矛盾是人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾,主要表现在长期的城乡二元结构导致的都市旅游与乡村旅游发展不平衡,旅游业与其他产业发展的不平衡,各方利益主体的旅游权益及参与程度的不平衡。旅游业是直接体现美好生活需要的产业之一,针对旅游供给不足和发展不平衡的问题,要推进旅游供给侧改革,充分挖掘旅游产品的文化内涵,加强旅游互动体验产品设计,让少数民族文化动态展示和活态传承,让入境游客全方位了解民族文化旅游产品。提升旅游管理服务水平,运用大数据技术监测和管控旅游安全问题,增强旅游舒适感和满意度。

第三,深化国际交流合作,塑造国际旅游品牌。加强与境外的政府、企业及非政府组织(NGO)开展旅游开发合作,借助境外的对口帮扶力量,高起点设计和培育国际旅游品牌。探索国际融资渠道,合理利用低成本的资金支持。借鉴国际旅游运营管理经验,发挥国际旅游智库的智力扶持。结合客源地特征,通过线上和线下布局全球化的营销网络。开发高质量的旅游体验产品,塑造一批特色民族文化旅游村寨,整合资源优势,抱团整体开发,创建国际知名的少数民族文化旅游目的地。

(三)研究展望

通过研究国外游客对黔东南少数民族村寨的旅游形象感知,审视民族村寨旅游发展存在的不足,提出相应的对策建议。论文还存在一些不足,有待将来作进一步研究和探讨。一方面,本文仅以TripAdvisor网站的评论内容为样本,随着互联网和自媒体的快速发展,下一步可以尝试利用大数据技术,通过其他国外旅游点评网站等渠道获取更多的样本数据;另一方面,由于少数民族地区的文化差异性较大,国外游客的评价是基于自我认知的基础上,因此评价结果的客观真实性有待考究,下一步可以采取与访谈问卷相结合的方法,并就游客评价内容与其他非游客评价以及官方宣传资料进行对比分析,以便更加全面和系统地研究少数民族村寨旅游形象感知。

猜你喜欢

高频词村寨入境
30份政府工作报告中的高频词
省级两会上的高频词
28份政府工作报告中的高频词
省级两会上的高频词
中国第三个国家级入境再制造示范区通过验收
无蚊村寨丁屋岭
中华人民共和国出境入境管理法
村寨——海坪彝寨
警查證截獲非法再入境男
别让民族村寨毁于当代