基于ROSTCM方法的游客满意度评价研究
——以5个国内梯田景区为例
2018-10-30许永华游细斌王亚男
许永华,游细斌,王亚男
(赣南师范大学 地理与规划学院,江西 赣州 341000)
0 引言
旅游目的地游客满意与否,直接影响着旅游业的经济效益,其测度指标一般用游客满意度。国外对游客满意度的研究始于1965年,美国学者Gardozo首次在营销中引入了“满意度”的概念,表明顾客行为可以由顾客满意度驱动[1]。而Pizam等学者则将满意度理论于20世纪70年代运用到了旅游业的研究中,为此后的游客满意度理论发展提供了基础。研究内容主要集中在游客满意度的内涵[2]、形成机制[3]、行为结果[4]、满意度评价[5]和满意度模型[6]等方面。国内从20世纪80年代末才开始有学者对游客满意度进行相关研究。近年来,以旅游为中心的管理理念已经成为现代旅游发展的新趋势,旅游活动中的旅游满意度已逐渐成为国内学术研究的热点。研究文献主要涉及游客满意度内涵[7]、测评体系和测评模型[8-10]、影响因素[11-13]以及实证研究[14-15]等方面。从以上文献可得出,在满意度研究中主要存在以下问题:①对游客满意度的定义模糊。目前学者普遍采用的是由Pizam 等提出的定义:游客满意是游客比较他们对目的地的期望和体验的结果,若体验与期望的比较结果使得游客感到满意,则游客是满意的,反之,则游客不满意[16]。本文将采用Pizam 等提出的游客满意度慨念。②样本数量存在一定的局限性,普遍采用问卷调研的方法收集数据,样本数量受到时间和空间的限制。③在测评方法上,目前相关研究多采用定性分析,研究方法和手段都较为单一。基于此,本文将尝试以大样本容量为研究样本,结合定性与定量的方法来测评游客满意度。
随着乡村旅游的推广,梯田成为地方旅游业的主打品牌,梯田旅游也逐渐成为学者们的研究热点。研究内容主要集中在梯田旅游开发现状[17]、旅游开发带来的影响及居民的感知[18-19]、梯田保护与开发[20-21]、梯田旅游利益相关者相互关系[22]等方面。研究手段和方法上,多数属于概念性和描述性研究,只有极少数学者从定量方面研究梯田旅游。研究视角更侧重于旅游客体,对旅游主体的研究较少;在满意度研究方面,仅从龙脊梯田这一旅游单体进行研究[23-24],相对于其他方面而言,梯田游客满意度方面的研究成果还是比较薄弱的。本文从游客视角,通过对多个梯田景区游客满意度的对比分析,找出梯田景区旅游发展的短板,为梯田景区后续的开发规划提供参考。
中国旅游市场已进入在线旅游时代,网络已成为游客发布和获取旅游信息的重要途径。各种模式的OTA网站都逐渐上线,在OTA网站上游客评论数据也在飞速地增长,这些评论数据在很大程度上真实地反映了游客对旅游目的地的形象感知和满意程度。近年来,国内外学者开始利用网络评论数据研究满意度,Zhou等对酒店在线评论进行了整理,挖掘了23个具体的因素来解释客户的满意度[25];Radojevic等证实了影响顾客体验最重要的因素是酒店星级,顾客满意度和房间的空调设备、酒吧配置之间存在显著的正相关关系[26];李龙梅等以网络点评数据为支撑,以西安市重点景区为案例,构建游客满意度评价模型,运用单层次模糊综合评价法进行游客满意度分析[27];何琼峰基于网络游客评论数据,利用扎根理论方法研究文化遗产景区游客满意度影响因素[28];赵鹏宇等以网络评论为样本,以平遥古城、云冈石窟和五台山为案例,分析了山西省世界文化遗产地的游客满意度[29]。从研究对象来看,学者们逐渐意识到测评文化遗产型景区游客满意度的重要性。
综上所述,关于梯田景区游客满意度的研究还只是简单分析梯田景区单体的总体满意度和各分项满意度之间的关系,缺少从多个景区的横向和纵向比较分析。在全球在线旅游时代背景下,本文将通过数据挖掘技术获取OTA网站上游客评论数据,采用内容分析法和ROSTCM软件对游客点评数据进行情感认知分析,测评游客满意度结果,以弥补研究数据的不足;并运用熵权法确定案例地游客满意度的主要影响因素及其权重,进而对梯田景区游客满意度影响因素对比分析。从横向和纵向比较哈尼梯田、龙脊梯田、紫鹊界梯田、云和梯田和江岭梯田等5个景区游客满意度差异,发现每个景区的相对优劣势,为国内梯田景区可持续发展提供理论依据,并且为提高国内梯田景区吸引力和竞争力提供参考。
1 数据来源和研究方法
1.1 数据来源
本文研究对象的选取主要是依据国内各梯田景区2011-2015年的购票总人次,选择排名前5的龙脊梯田、云和梯田、哈尼梯田、紫鹊界梯田和江岭梯田作为研究对象。本文研究样本来源网站主要是根据Alexa网站2015年统计的中国OTA网站用户覆盖数TOP30的网站,再分别浏览这些网站的评论特点,从中筛选出评价较全面的OTA网站,最终确定选择携程网、同程网、驴妈妈和到到网4个OTA网站作为研究样本网站。本文利用网络爬虫技术抓取了发布时间在2011年4月30日—2016年4月30日(共60个月)的游客点评数据作为计算数据。初始数据为14 068条点评,经筛选,获得有效点评13 956条。剔除原则如下:无关主题的点评,内容重复的点评,过于偏激或浮夸的点评,带明显商业性宣传的点评,未提到影响游客满意度因素的点评。与传统的问卷调查法相比,这种自由点评的优点主要有:样本容量大、成本低、获取方便,涉及内容丰富且无限制,时效性好且意见比较真实可信;其缺点主要有:样本覆盖面较窄,自由点评的主体多为青年人,点评主体为他者而非我者。
1.2 研究方法
内容分析法作为国内外常用的定性和定量相结合的方法,以网上评论为样本,利用计算机数据转换技术进行分类和编码,测量数量、比例和情绪倾向,最后结合其他数据进行定量分析,得出相关结论[30]。本研究主要采用内容分析方法对游客评论数据进行处理和分析,并通过ROSTCM软件的情感分析工具将其自动分为3种评论:正面评论、负面评论和中性评论。内容分析法是一种对内容进行客观、系统、量化分析的科学研究方法,自诞生以来被广泛应用于新闻传播学、政治学、图书馆学、社会学等领域。近年来,随着旅游业与互联网的结合,一些学者开始把它应用于旅游相关概念解析、旅游目的地形象感知、旅游动机、游客满意度、游客心理、区域旅游开发、旅游营销、旅游研究方法、旅游安全等[31]。与问卷调查和田野调查相比,内容分析法具有以下显著优势:①定量与定性相结合,并且不受时空限制,分析者可以在其方便的时间和地点展开其研究;②对非结构性资料的可接受性,即它可以将非结构性问题作为数据来处理;③高效性和低成本性,既不需要大量的研究人员,也不需要特别的设备支持。丛丽等采用内容分析和质性主题分析二者相结合的方法, 分析了中国旅游者在访问圈养环境中的大熊猫研究基地时的旅游体验[32];孙莹基于花费—收获理论模型,采用内容分析法对网络评论进行筛选、分析和分类,得出六大热门出境旅游地的游客单项满意度和总满意度结果[33]。与国内城市作为研究旅游满意度的研究对象相比,关于特定类型景区游客满意度的研究较少,本文是在前人研究的基础上,根据样本数据特点,运用内容分析法研究梯田这一类风景区游客满意度,以丰富这方面的研究内容。
本文采用内容分析法常用的辅助软件ROST Content Mining对网络评论文本进行处理,ROSTCM是一种内容挖掘系统软件,针对网页、论坛、博客、微博等网络信息源,进行词频统计、聚类、分类、情感分析、语义网络、社会网络、相关性分析,实现内容挖掘、文本分析、知识处理等[34]。ROSTCM软件能够对海量的人文资料进行量化的转变,可节省人力物力,提高研究效率,并可通过定量分析和定性分析的结合,从中归纳出普遍性结论。
2 数据处理
2.1 研究设计
本文按照样本采集——初级编码——类目构建——满意度计算——结果分析的设计步骤,以哈尼梯田、龙脊梯田、紫鹊界梯田、云和梯田和江岭梯田为研究对象,进行实证研究。研究样本主要来源于携程网、同程网、驴妈妈和到到网,收集有关案例地的游客点评并进行筛选;在阅读游客点评样本——初级编码——类目构建的过程中,主要依据文本意见挖掘的研究方法进行,借鉴最终得出的类目表尝试构建梯田旅游满意度测评指标体系。利用 ROST Content Mining内容挖掘软件对游客点评样本进行分析,得出高频词汇,结合游客点评样本内容对游客对梯田旅游的满意度水平进行非结构化分析。通过网络评论内容量化转换赋分、指标赋权重、满意度计算等步骤进行结构化处理分析。最后对研究结果进行分析和解释。
2.2 游客满意度测评指标体系构建
内容分析法可以借助计算机相关软件将游客点评文本数据转化为定量的数据,并依据这些数据对点评内容做出定量分析和做出关于事实的判断和推论。首先,把搜集到的5个梯田评论样本合并到一个文档中生成txt文本,利用ROSTCM6.0软件进行自动分词和词频分析,将结果进行统计并分类,对同义词进行合并,得出频数超过400次的高频特征词44个(见表1)。其次,为了直观反映出高频词之间的关联,利用软件的Netdraw工具,绘出高频词的语义网络分析图(见图1),图中每个高频词代表一个节点,节点间的数值越大,表明联系越紧密。从高频特征词及语义网络分析结果可以看出,游客比较集中关注景区服务、食宿、基础设施、旅游资源、环境、购物等方面。
表1 梯田景区高频特征词及频次统计
数据来源:作者计算。
资料来源:作者绘制。图1 梯田景区语义网络分析图
本研究主要是通过高频特征词表、语义网络分析图,与ROSTCM的情感分析工具相结合分析评论内容提炼出主要因子,在前人研究成果的基础上,按照科学性、全面性、可度量性的原则构建梯田景区游客满意度测评指标体系。基于此,梯田景区游客满意度测评体系由三级指标构成(见表2)。第一级即梯田景区游客总体满意度指标;第二级即项目层指标,包括交通、餐饮、住宿、购物、环境卫生、基础设施、景观特色、民族特色、娱乐活动、管理与服务、居民态度等11个指标;第三级即评价因子层指标,是由情感分析所分类的三类:正面评论、负面评论和中立评论,是对第二级指标评价内容进行自然语义情感分析后的满意度指标。自然语义情感分析,是对带有情感色彩的主观性文本进行量化分析,符合本文样本数据的特点。
表2 梯田景区游客满意度测评指标体系
数据来源:作者计算。
2.3 数据预处理
首先,在对每条游客评论样本分类时,将评论样本中包含满意度评价指标的语句进行分解,剔除其中的客观句,只保留主观句进行分析,直到每个主题句中只包含一个主题词为止;其次,根据以上确定的11个二级指标分别对哈尼梯田、龙脊梯田、紫鹊界梯田、云和梯田和江岭梯田的分解后的游客评论样本通过人工进行语义判断和归类,将每一个梯田的游客评论分类为以上十一大类,并保存为txt文本;最后,在十一大类别下,通过ROSTCM的情感分析工具对游客评论进行自然语义情感分析,分为三小类,即正面(满意)、中立(一般)、负面(不满意)。具体操作步骤如下:①分别将以上分类好的文本进行自动分词处理;②将分词后文本导入到ROSTCM软件的情感分析工具中;③统计情感分析结果,即可得到正面、中立以及负面评论所占的比例,对三级指标(即正面、中立、负面)应用模糊评判的计算方法和归一化处理,获得的权重分别是1,0.5,0.1,从而得出五大梯田景区的游客满意度的初始数据。
2.4 指标权重确定方法
运用定量指标进行游客满意度评价时,需要合理确定各指标的权重,它反映各个评价指标在总体评价中所起的不同作用,将直接影响评价的结果和效果。目前确定权重的方法由定性赋权法和定量赋权法两类组成。定性赋权法主要有模糊综合评价法、德菲尔法、层次分析法等,定量赋权法主要有熵权法、主成分分析法、人工神经网络法、回归分析法等。
熵权法是根据指标变异性的大小来确定客观权重的一种方法。一般来说,如果某个评价指标的熵值越小,说明指标变化值越大,其提供的信息就越多,评价的作用越大,权重越大。 当评价指标的熵值较大时,情况正好相反。熵权法客观性强,趋于成熟,可以适用于任何需要确定权重的过程,它充分利用了原始数据提供的信息,在实际应用中可操作性更好。此外,熵权法在具体应用时,也可以消除地区之间的一些不合理差异。因此,本文采用熵权法对定量指标体系赋予权重。本文在分析梯田景区游客满意度而建立的指标体系中, 希望二级评价指标的权重大小由影响满意度的信息量的大小来确定,结果如表2所示。熵权法确定权重的步骤如下所示:
(1)将11项评价指标的初始值标准化:
假设aij(i=1,2,…,m;j=1,2,…,n)是第i个评价对象第j项指标的满意度测评值,则由n个指标(本文中评价指标有11个),m个评价对象(本文中评价对象有5个)构成的游客满意度评价样本矩阵A为:
③
(2)计算11项指标各自的信息熵:
④
(3)确定各项指标权重Wj:
⑤
表3 五大梯田景区游客满意度排名和计算结果
数据来源:作者计算。
3 游客满意度分析
3.1 多空间维度满意度分析
从表3排名来看,被列入世界遗产的哈尼梯田景区的游客满意度排名第四,其中基础设施的游客满意度排名最高,交通和住宿的满意度稳居第二,然而环境卫生和管理与服务的游客满意度排名最低;这表明哈尼梯田景区的基础设施条件较好,但应当加强环境卫生和管理与服务所涉及的一系列工作。被列入第二批中国重要农业文化遗产的龙脊梯田景区的游客满意度以0.02分超过江岭梯田景区,排名第一,其中交通、购物、娱乐活动和管理与服务的游客满意度均以较大优势排名第一,说明龙脊梯田旅游开发过程中是较为完善的;但其景观特色和居民态度的游客满意度排名最后,主要原因是在旅游业发展快速的时代,地方政府大力进行旅游开发却严重忽略了当地居民的公众参与和地方特色的认同。
作为世界灌溉工程遗产的紫鹊界梯田景区游客满意度最低,其中交通、餐饮、基础设施和娱乐活动的游客满意度均是最低,并且游客对基础设施和娱乐活动的满意度趋近于不满意,其游客评论数量也是最少的,综合来看其主要原因是宣传力度不够,并且整个景区基本上处于待开发状态;但是作为历史悠久的梯田也有其优势所在,整个景区的环境卫生、景观特色、民族特色和居民态度的游客满意度居于首位,从这些方面来看,紫鹊界梯田景区是最具有地方特色的梯田。华东地区最大的梯田云和梯田景区的游客满意度以0.002分优势超过哈尼梯田景区排名第三,其中住宿的游客满意度排名第一,但是购物的游客满意度最低;从评论内容分析来看,我们发现最关键的原因是景区内的商品价格普遍高于一般的景区。江岭梯田景区的游客满意度排名第二,大多数单项满意度徘徊在第二、三名,餐饮游客满意排名第一,但其2011-2015年的售票总人次排名居于第五,从其住宿和民族特色游客满意度排名最低可以看出,主要原因是由于地方居民自我地方认同感较低,景区旅游宣传力度较低。
3.2 单一景区满意度分析
从表3的总体满意度结果来看,游客对五大梯田景区的总体满意度大多数均达到了《质量发展纲要(2011-2020年)》所提出的“2015年生活性服务业顾客满意度达到75以上”的要求,与实际发展情况较为一致,一定程度上反映了构建的梯田景区游客满意度测评指标体系的合理性。表3中的统计结果也反映了单一景区一些意料之外的信息:哈尼梯田景区各单项满意度之间存在一定的差异性,尤其购物和管理与服务引起游客的普遍不满,这表明哈尼梯田整个景区的管理方式不够规范,缺乏对商业设施的监管,并且服务力度有待加强,景区内利益相关者之间的关系有待协调;龙脊梯田景区各单项满意度基本持平且都处于较高水平,但是相比较其他而言,餐饮和景观特色有待进一步提高;紫鹊界梯田景区各单项满意度之间差异性最大,交通、基础设施和娱乐活动严重影响游客满意度,总体来看,整个景区的发展还处于起步阶段,需要进一步发展,应当综合自身条件积极地学习其他景区的突出优势,合理地加强开发力度;云和梯田景区各单项满意度之间差异性较大,游客对居民态度最为满意,说明当地居民具有较强的地方认同感,这也是它的突出优势以及对游客的吸引力之处,在这一方面,其他景区都是相当欠缺的,应当大力加强;江岭梯田景区各单项满意度基本处于稳定水平,在今后的开发过程中应注重加强地方性特色,适当结合客家文化开发出更独具一格的景观特色。
3.3 游客满意度影响因素分析
梯田景区游客满意度测评体系中(见表2),从二级指标的权重系数看,对游客满意度影响最大的是餐饮(0.409 62)和住宿(0.392 96),这两项指标的权重总和高达80%。具体来说,旅游景区的餐饮和住宿与其作为旅游活动六要素的首要地位相对应,从游客感知角度分析,说明游客对旅游地的满意度很大程度上取决于游客感知质量,即随着生活水平的提高人们对于生活质量的要求也逐步提升。基础设施(0.140 75)对游客满意度影响较大,基础设施是景区的硬件设施,说明在景区发展软件设施的过程中应当适当地加大对硬件设备的发展力度。权重系数在[0.008,0.01]的指标因子有:娱乐活动(0.016 80)、购物(0.013 47)、交通(0.010 91),作为旅游活动其中的三要素娱、购、行,很大程度上进一步验证了其普遍适用性。其他指标因子权重均低于0.008,这也体现了梯田景区在旅游体验方面取得的良好效果。因此,梯田在发展过程中应重点发展硬件因素,加强对景区食、住、行、娱、游、购旅游活动六要素的改善力度。
4 对策及建议
4.1 深入挖掘具有当地民族文化特色的旅游产品
从满意度影响因素和满意度指数看,餐饮作为最重要的影响因素,游客对国内梯田景区的餐饮满意度均不太高,根据游客评论内容分析来看,游客普遍认为价格昂贵且缺少当地特色,基于此,餐饮需要融入地方特色,丰富食品种类,加强卫生管理,使价格标准合理化。景区住宿方面,应重点完善旅游住宿设施等级体系,多层次多等级兼顾发展,以满足不同层次旅游者的需要。在购物上,应丰富旅游商品类型,改善购物环境,发掘文化内涵,创造独具地方特色和民族特色的旅游商品,同时应当注重协调景区利益相关者之间的关系。娱乐活动方面,由表3分析结果得出,有部分梯田景区游客满意度趋近于不满意,这是需要亟待加强与完善的,可以通过增加当地民间歌舞,向游客展示当地民族最具代表性的歌舞,并增设与游客的互动活动,让游客参与当地的生产生活,提升游客的参与体验感知度。
4.2 完善基础设施,提高管理服务力度
游客对梯田景区的交通评价中,负面点评比重较大,在后续的旅游开发中应将道路作为重点规划对象,政府部门也应当加大对景区周边道路交通方面的管理力度。景区公共服务设施方面,景区公共厕所和停车问题尤为突出,各景区应积极实践国家旅游局在2015年年初启动的“厕所革命”工作,在公共厕所建设中实现“数量充足、干净无味、实用免费、管理有效”的目标;公共休息场所和停车场需要建设和完善,景区缺乏系统的指导标志和公共休息场所,给游客造成了很大的不便,在引导标志物的设计与布局上应侧重于游客的需求与便利。景区管理服务方面,表3结果显示各个景区游客满意度都处于较低水平,管理者应加强对服务人员的规范化培训,同时应该加强管理制度的人性化;另一方面,从利益相关者的角度出发,应该加强各种角色利益相关者之间的联系度。
4.3 提升高峰期景区旅游接待能力
大多数游客都选择在节假日去景区游玩,评论中很多游客抱怨人太多、过于拥挤,这是引起负面情绪的重要因素。基于此,首先,应做好景区游客量预测工作,根据近几年景区游客量趋势做出相应的人数预测,以此为依据安排景区的各项接待工作;其次,通过景区的容纳量和环境承载力计算出景区节假日每天游览的合适人数,限制景区旅游人数;更重要的是,从景区可持续发展角度来看,景区管理者应积极利用现代化信息通信技术,建设数字化景区,提高景区的动态预测能力和监管水平,科学引导游客分流。
4.4 加强宣传力度,构建“梯田云”服务平台
从网络游客对5个梯田评论数量的参差不齐程度可以看出,其知名度与宣传力度的投入严重不符。传统的大众媒体已经广为人知,互联网时代带动的PC端和移动客户端的频繁使用,形成了新的传媒方式,尤其是自媒体的出现,为公众进一步提供了一个随时随地传播信息的平台,传统的纸质媒体的影响力已逐渐弱化,网络在线阅读成为年轻人首选的阅读方式。国内各梯田景区也应该与时俱进,吸收和利用现代技术,坚持“平台为王”,构建梯田旅游信息共享平台,例如通过微博、微信公众号传播梯田的美景,拍摄宣传片,推动梯田旅游的传播与发展,提升梯田的知名度与美誉度。
5 结论与讨论
本文利用OTA点评数据,依据评论内容和旅游目的地的类型、特色构建游客满意度测评指标体系,尝试结合内容分析法和ROSTCM软件的应用,对国内梯田景区游客满意度做对比分析,通过对携程网、同程网、驴妈妈、到到网中关于国内梯田的游客点评的文本分析,提炼分析结果,并提出一些有利于提高梯田景区游客满意度的建议。(1)从横向对比发现,梯田景区总体满意度由高到低依次是龙脊梯田、哈尼梯田、江岭梯田、云和梯田、紫鹊界梯田;影响满意度的因素除了本文中所列出的表象因素外还与各目的地的空间地理位置和国家政策息息相关。(2)从纵向对比发现,各分项满意度之间差异最大的是紫鹊界梯田,云和梯田和哈尼梯田的各分项满意度差异性趋于稳定,龙脊梯田和江岭梯田各分项满意度差异性最小;各同类型景区在发展自身的同时应相互借鉴以弥补自身不足。(3)从游客感知视角分析,国内梯田景区游客满意度较低的分项主要集中在交通、购物、基础设施和娱乐活动方面;在今后旅游规划发展过程中应将以上几个方面作为重点关注对象。(4)从影响因素方面分析,满意度的影响因素和旅游活动六要素相对应,梯田景区游客满意度的主要影响因子为餐饮、住宿和基础设施;其次,娱乐活动、购物和交通也是重要影响因素,应当引起当地政府的重视。
本研究仍存在一些不足之处:数据方面,本次数据采集来源也仅限于4个网站,尚未对全网数据进行采集,未来有待进一步拓展;本研究的数据来源于OTA,具有一定的局限性,无法采集发表评论的用户信息(年龄、性别等),难以确定本研究的对象是否具有代表性,且难以分析人口统计学层面的游客满意度,今后可与调查问卷和访谈数据相结合进行游客满意度的分析。研究方法方面,本文将内容分析法与情感分析技术结合分析网络评论以获得目的地游客满意度,这种方法在旅游行业中实践应用较少,今后应运用情感分析技术获取游客满意度的方法在不同的旅游目的地进行实践与验证,让此先进技术在旅游行业中得以充分应用,提高研究效率和价值。