APP下载

基于关联规则的湖北省5A级景区游客满意度研究

2021-09-25陈天宇张春燕谢双玉

资源开发与市场 2021年10期
关键词:项集关联景区

陈天宇,张春燕,李,谢双玉,2

(1.华中师范大学a.地理过程分析与模拟湖北省重点实验室;b.城市与环境科学学院,湖北 武汉 430079;2.中国旅游研究院武汉分院,湖北 武汉 430079)

游客在目的地游览后的体验结果与其本身对旅游目的地期望对比产生出的心理状态被解释为游客满意度[1]。旅游地发展需要从游客满意的角度多考虑延伸,以此满足市场竞争加剧下游客日益增长的期望需求[2]。通过游客满意度来设定游客评价机制,测评旅游吸引力及相关服务水平竞争力的掌握认知,可以促进旅游经济发展,提高景区竞争力,彰显旅游业的可持续发展价值[3,4]。满意度研究在旅游学科范畴内发展迅速,国外学者前期主要将研究视角 聚 焦 于 内 涵 测 度[5-7]、行 为 感 知[8,9],同 时 对 测评模型进行了一定程度的探讨[10,11],美国顾客满意度模型(ACSI)、欧洲顾客满意度模型(ECSI)和瑞典晴雨表模型(SCSB)是现有较为成熟的模型。国内研究较国外而言,起步较晚,研究热点多集中在内涵测度[12-17]、影响因子[18-26]及相关实证研究[27-31]中,研究尺度渐渐从宏观区域转为具体旅游地景区,其中省域尺度下的满意度研究亟需深入。研究方法上主要通过指标体系构建、网络与实地调研,运用IPA分 析[32-34]、结 构 方 程 模 型[35-40]、模 糊 综 合 评价[41-43]、回归分析法[18,44]等常用分析方法对满意度现状及相关影响因素进行探究。

纵观国内外现有的游客满意度研究,其研究对象囊括到旅游目的地及相关行业中的旅游产品,在内容对内涵测度进行思考的同时,研究模型及测评系统也日益发展完善。整体方法由定性向定量转变,但相比于满意度研究中不断被丰富完善的回归分析方法,数据挖掘这类高质量聚类分析技术在当今旅游与多学科交融促进的研究背景下应用还相对缺失。关联规则作为一项数据挖掘技术,在对空间数据进行挖掘后能够分析不同事件及现象间各要素存在的关联关系,其在土地覆盖变化、气象预报、医疗疾病研究等领域已被广泛应用[45]。杨鸿雁、周芬芬、田英杰借助关联规则,挖掘出食品安全满意度中潜在的关联信息,并向相关部门提供对策建议[46]。对比现有的研究方法,将关联规则作为研究新视角,分析游客满意度的优势体现于算法能够从纷繁复杂的研究内容中寻找出暗含的、不明的、游客存在兴趣点的、利于决策潜在价值挖掘的内容思路。通过关联规则,重新排序聚类分析中现存的研究影响因素,廓清更多潜在的影响关系,并通过与现有的研究成果对比,思考深化游客满意度相关研究[47,48]。

湖北省地处我国中部地区,自然与文化旅游资源丰富。湖北省文化和旅游厅数据显示,截至2019年底,全省共有A级景区412家,其中5A级景区11家。本文通过关联规则这项数据挖掘技术,聚类分析了湖北省2019年5A级景区游客满意度数据,探寻了不同5A级景区间游客满意度影响因子之间的相互关系,同时为该省旅游景区的未来发展提出了对策建议。

1 数据来源

数据来源于湖北省2019年游客满意度调查工作。调研于2019年10月在湖北省各5A级景区中进行,数据获取采用问卷调查的形式,调研方式为调研员随机选择游客进行面对面交谈式问卷调查,并当场回收问卷。调查内容主要涵盖两方面:一是游客的人口学特征,包括游客性别、学历、年龄、旅游方式、旅游目的等14个题项(表1);二是游客满意度维度,包括景区旅游形象、旅游资源、价格合理性等11个维度,共52个题项的满意度评价,每个题项提供很满意、满意、基本满意、不太满意、不满意和不清楚6个选项供被调查者选择,并根据李克特五级量表法描述游客满意度评价的主观心理感受。

表1 样本人口学特征描述性统计表(N=2061)

调查共收集问卷2150份,其中有效问卷2061份。其中,武当山景区294份、黄鹤楼景区108份、东湖景区125份、木兰生态文化旅游区175份、清江画廊景区199份、三峡大坝景区260份,三峡人家—屈原故里景区221份、神农架景区286份、神农溪景区38份、恩施大峡谷景区146份、三国赤壁景区209份。问卷有效率为95.9%。

2 研究方法

2.1 关联规则及涉及的概念

20世纪80年代末,国际人工智能大会提出了KDD概念,并在其基础上衍生出数据挖掘这一技术。数据挖掘内涵旨在提炼大量数据集中具有潜在价值意义的知识,以便从中提取没有显露但对策略决定具有参考价值的信息。1993年,美国IBM Almaden Research Center的Rakesh Agrawal等在对KDD研究中提出了关联规则这一重要课题[49]。

①项集:指项的集合,若项集中包含k个项,则称该项集为k-项集。

②支持度计数:指项集出项的频率,也是项集中的事务数。

③支持度(Support):支持度是事务集中同时出现两个项集的概率,记作P(A∪B)。表示如下:

式中,A、B分别表示两个项集,D为事务集。

④置信度:置信度是事务集D中,在项集A的项集出现后,项集B也同时出现的概率,记作P(B|A)。表示如下:

⑤频繁项集:最小支持度是指规则所必须达到的最小支持度阀值,最小置信度则是必须达到的最小置信度度阈值,规定将大于最小支持度要求的项集称为频繁项集[50,51]。

2.2 关联规则中的Apriori算法

1994年,Agrawal提出关联模型Apriori,该算法主要用于对历史交易数据信息的挖掘,通过发现频繁模式来提供决策支持。Apriori算法有两条性质必须了解:一是频繁项集的任何非空子集也是频繁项集;二是非频繁项集的所有超集也都是非频繁项集[52]。Apriori算法的主要思想是:首先找出所有满足支持度阈值的频繁项集,然后递归找出所有的频繁项集,最后通过比较最小置信度阈值,满足条件的便是有价值的规则。Apriori算法一般通过采用连接和剪枝的方法来搜寻全部频繁项集。其中,连接是产生候选项集的流程,剪枝则为去除非频繁项集的流程[53]。

3 研究设计

3.1 变量设计

游客满意度变量设计(图1):本文将5A级景区游客满意度作为因变量X,将游客的社会属性特征和旅游目的与方式作为自变量A集,游客对景区的旅游形象评价作为自变量B集,游客对景区的旅游资源评价作为自变量C集,游客对景区价格合理性的评价作为自变量D集,游客对景区服务水平评价作为自变量E集,游客对景区管理水平评价作为自变量F集,游客对景区旅游配套设施评价作为自变量G集,游客对景区旅游交通评价作为自变量H集,游客对景区旅游餐饮评价作为自变量I,游客对景区旅游购物评价作为自变量J,游客对景区旅游娱乐评价作为自变量K,游客对景区的总体感受评价作为自变量L。结合调查问卷设计,通过将5A级景区游客满意度作为因变量,采用游客对5A景区中各不同影响因素的满意度来评价游客感知,将游客期望与游客感知质量作为研究的前提变量,将游客对景区的总体满意度、重游意愿、推荐意愿来作为研究的结果变量,考察相关因素对因变量的影响程度。

图1 游客满意度变量设计

3.2 数据处理及算法选择

首先,检查数据是否达到挖掘要求,在此基础上,填补缺失数据,消除不合格数据并删除重复记录,将合格数据处理为布尔型,剔除无关指标,统一指标名称。对数据进行关联规则时使用Weka、R语言两个数据挖掘软件,旨在丰富数据挖掘的丰富性和完善性。同时,将两个软件得到的数据互相参考,确保关联结果更加准确合理。Weka处理关联规则的步骤为:运用Excel工具对原始数据进行预处理,采用Python将数据转换为CSV格式,排写为arff格式,运用Weka软件,通过Apriori算法挖掘数据信息。R语言处理关联规则的步骤为:运用Excel工具对原始数据进行预处理,另存为RStudio可以处理的CSV格式;通过RStudio将数据转化为“transaction”格式,用于关联规则分析;然后通过Apriori函数,设定相应的Support和Confidence数值,得到对应的关联规则。

4 结果及分析

4.1 数据分析

借助Weka及R语言中的Apriori算法,本文将研究结果进行数据关联,校验其关联结果,着重分析相关变量间存在的对应关系。通过软件间关联结果比对,充分发挥Apriori算法的特性,频繁项目的全部非空子集都必须是频繁的,从而缩减候选项集,尽量避免生成和计算无法成为频繁项集的候选项集,获得对象更少、结果精度更高的候选项集的集合。因此,本文能够获取到正确可靠且符合条件的关联规则。

将11个5A景区预处理后的数据导入Weka和R语言进行关联,通过分析不同景区间关联,结果发现,湖北省5A景区中仅有木兰生态文化旅游区和三峡人家两个景区频繁关联了各不同影响变量,其他9个景区的关联结果普遍反映出相关变量中游客感知质量重视度的缺失。具体划分为以下两类:一类是东湖、黄鹤楼、三国赤壁、神农溪景区游客对景区价格合理性相关变量缺乏重视度;另一类是恩施大峡谷、清江画廊、三峡大坝—屈原故里、神农架、武当山景区游客对旅游娱乐相关变量间缺乏重视度。在关联规则被不确定选项规则占据绝大篇幅的情况下,为了使研究更加全面,同时挖掘出更多景区潜在关联信息,在不影响其他选项研究的前提下,本文将景区中不确定选项数据剔除处理,再次进行关联规则数据挖掘。整理挖掘结果后,按照其关联特性分为以下3类:以东湖、三峡人家、神农架、武当山景区为主,突出强调自身重游意愿及推荐亲友旅游意愿关联景区其他变量之间的一类(表2);突出强调旅游目的与景区其他变量关联关系的恩施大峡谷、黄鹤楼、清江画廊、三国赤壁、三峡大坝—屈原故里景区的一类(表3);景区其他变量关系频繁关联景区服务性、娱乐性的木兰生态文化旅游区及神农溪景区一类(表4)。

表2 重游及推荐意愿与景区变量关联结果构成(以武当山景区为例)

表3 旅游目的与景区变量关联结果构成(以清江画廊景区为例)

表4 景区服务娱乐性与景区变量关联结果构成(以神农溪景区为例)

4.2 结果分析

从武当山景区关联结果发现,相关景区变量中强调愿意重游与推荐亲友旅游意愿的频繁关联项主要为宣传力度、旅游市场秩序、景区可进入性和内部交通几个变量,其他3个景区的频繁关联项各有不同,如东湖景区为景观吸引力、景区可进入性、交通引导标识,三峡人家为餐饮价格、景区门票价格、景区客流管理、景区可进入性,神农架为景区可进入性、旅游市场秩序、交通引导标识。此类景区中,旅游市场秩序、景区可进入性、交通引导标识的出现频率最高,关联性也最强,说明现在越来越多的游客选择自驾游作为出行方式,景区为了保证游客在计划时间内抵达旅游目的地,需要具备良好的交通可进入性和清晰醒目的交通引导标识,同时良好的市场秩序和客流管理能够方便游客提高自身有效游玩效率,这是影响游客满意度、重游率和推荐意愿的主要因素。将此类景区按重游、推荐意愿与景区其他变量间的相关性为划分依据将关联变量关系列出(表5),发现愿意重游这项变量与景观吸引力、景区可进入性、宣传力度、餐饮价格、总体满意度之间频繁关联。重游意愿高的游客普遍倾向于推荐亲友来该地旅游,且受教育水平较高的游客能够在将其他景区作为比较前提的基础上给予该景区合理的评价。景区要想获得较高的游客满意度,需要将丰富的旅游资源与优越的旅游交通条件、良好的旅游形象宣传多关联,游客在被景区资源吸引的同时,更突出关注景区价格的合理性。

表5 以重游及推荐意愿划分的不同景区间关联变量关系表

分析强调旅游目的与景区相关性的5大景区,发现其关联结果也不尽相同。在游客同样选择旅游目的为观光游览的前提下,黄鹤楼景区内游客频繁关联景区自身吸引力、游览价值和环境卫生条件;清江画廊景区游客则表达了对景区可进入性、内部交通和景区游览标识的在意;三国赤壁景区中自驾游占比较高,游客着眼于对旅游停车场的评价;恩施大峡谷和三峡大坝—屈原故里中大部分游客对景区内部交通与景区可进入性表示出了较高重视,但恩施大峡谷的游客倾向于关注景区价格合理性,三峡大坝—屈原故里的游客则侧重于选择景区旅游娱乐。总结而言,绝大部分选择观光游览的游客,其景区满意度中仍将旅游交通这一变量视为旅游关注的重点。以旅游目的与景区其他变量之间相关性为划分依据,将不同景区间关联变量关系列出(表6),发现旅游目的为观光游览的游客大多选择自驾游或亲友游,对景区可进入性、游览标识与指示牌等方面的关注度较大,愿意主动去了解景区内价格方面的合理性。

表6 以旅游目的划分的不同景区间关联变量关系表

最后分析频繁关联景区服务娱乐性关系的木兰生态文化旅游区和神农溪景区。木兰生态文化旅游区的关联结果显示,正面的工作人员服务态度(尤其在购物和餐饮方面)会对游客留下的就餐环境和食品卫生评价产生较大的积极影响,倾斜游客的景区整体满意度。三峡人家的关联结果体现出重游、推荐意愿主要关联交通引导标识、景区内部交通和旅游市场秩序几个变量,侧面反映出旅游者对旅游交通和市场秩序带给游客整体旅游感受的感知程度占比。神农溪景区较为准确的旅游形象定位有利于景区旅游娱乐的整体提升。符合游客心中景区旅游娱乐期望,景区可收获到更高的总体满意度。以景区娱乐服务性和景区其他变量间的相关性作为划分依据,将木兰生态文化旅游区和神农溪景区的关联变量关系列出(表7),发现工作人员服务态度与景区票务服务、市场秩序、游览价值、餐饮服务态度之间频繁关联,工作人员专业素质与景区形象定位、旅游市场秩序与相关人员服务态度、景区游览价值也频繁关联;景区娱乐项目的体验性、娱乐设施的完善性、娱乐活动的趣味性将关联性集中在景区形象定位、游客旅游目的和推荐意愿方面。这从侧面反映出游客会根据自身的旅游目的来检验景区形象定位是否匹配,在综合考量景区服务管理水平、旅游娱乐体验的前提下,评估自己对该景区的总体满意程度,分析景区的游览价值,确定是否推荐该地给亲朋好友旅游。

表7 以景区娱乐服务性划分的不同景区间关联变量关系表

5 结论、讨论与建议

5.1 结论与讨论

本文运用关联规则中的Apriori算法对湖北省2019年5A级景区的游客满意度数据进行了研究分析,将游客期望和游客感知质量(住宿、餐饮、娱乐、交通、购物等)作为前提变量,将游客总满意度、重游意愿和推荐意愿作为结果变量给予关联规则,分析了游客满意度影响因子之间的关联关系。主要结论如下:①对于前提变量中的游客感知质量而言,游客对景区价格合理性、景区旅游娱乐两大变量缺乏重视。②从前提变量与结果变量的关系视角切入发现,前提变量内正面的景区旅游交通、价格合理性和旅游娱乐各因素评价与满意的结果变量之间关联最为频繁,突出这几个变量在游客满意度中的影响力。游客对景区的重游和推荐意愿受宣传力度、景观吸引力、景区可进入性、餐饮价格、总体满意度等因素影响较大。数据挖掘的结果显示,游客文化程度越高,景区旅游宣传越好、交通越便利,游客重游和推荐意愿越强,总体满意度越高。近年来游客对旅游交通的重视程度愈发明显,选择自驾游来满足自身观光游览的需要,因此旅游交通对游客满意度的影响值得景区思考。③游客会根据自身期望有侧重地对满意度相关自变量做出评价,以此表达自身的满意度偏好。精准的景区形象定位有利于旅游娱乐的提升,游客满意度评价往往更高。同时,景区工作人员的服务态度、专业素质的评价好坏与景区其他满意度自变量因子之间相互影响。

从研究方法来看,利用关联规则可找出与传统回归方法不同的潜在信息知识,研究分析影响游客满意度的旅游形象、旅游资源、景区价格合理性、景区服务水平、景区管理水平、旅游配套设施、旅游交通、旅游餐饮、旅游购物、旅游娱乐等不同变量之间的关联关系;从研究结果来看,关联规则算法将满意度中的已知影响变量重新排序,通过关联出新的变量组合,提取更多潜在的影响因素,研究满意度嬗变中的新思路。但由于本文仅使用了2019年的调研数据,因此挖掘出的结果存在一定的局限性,希望在今后的研究中能够梳理、挖掘、分析出基于不同年份、不同季节等信息综合分析下的更具有效性的关联规则。

5.2 建议

一是政府应加强景区教育和基础设施方面投入。旅游产业要素在相互紧密的交织中被不断扩展,由做大到做强,从规模增长到高质量发展,成为当前我国旅游发展转型时期的重要思路。旅游的高质量发展需要地方政府的积极投入。丰富的旅游资源是湖北省景区发展的物质基础,但如何将其合理利用,满足消费者的心理需求,需要人力资本教育水平程度的提高。游客在进行消费等决策行为时,难免需要专业人员的建议和解惑;同时,教育与资本环环相扣,政府若重视教育和基础设施方面投入,会对景区健康发展产生积极影响。

二是优化景区体验设计,充分调动游客参与积极性。游客愈发突出的旅游体验需求,成为衡量旅游目的地吸引力的重要指标,不仅游客满意度的结果受游客体验质量影响较大,游客未来的重游倾向也与之密切相关[54]。针对研究结果反映出的游客对于景区商品价格、住宿价格、娱乐体验性和娱乐设施等相关变量缺乏重视这一问题,景区应从旅游体验的视角出发,梳理景区发展脉络,优化景区体验设计,设计出兼具文化特色和创意精神的文创商品,打造出能够提升游客娱乐体验特色的景点,带动商品经济发展,调动游客购物和娱乐的积极性。

三是加大景区形象宣传力度和旅游交通体系建设。旅游交通方式的发展会在很大程度上影响旅游目的地的演进[55]。从研究结论可知,在景区对游客具有吸引力的前提下,旅游交通体系越完善、可进入性越强,形象定位越准确、宣传力度越大的景区,其游客重游和推荐意愿越高。因此,相关部门应不断加强景区形象宣传力度,努力完善旅游交通体系建设及相关服务配套设施,满足游客日益增长的需求,推动旅游方式向多样化、有序化发展,为景区发展注入新活力,帮助游客“发现好景区,体验到景区”。

四是提高景区形象定位与景区服务管理关联水平。在信息的传播、获取都十分便捷的今天,游客可通过各种不同的渠道来辅助自己做出旅游决策。因此,如何在日益竞争激烈的旅游市场中崭露头角,需要旅游景区廓清自己的形象定位。关联结果中,游客在检验景区形象定位的同时也在对景区对服务管理水平做出评价,两者相辅相成、互相促进。如果从根本的游客意愿出发,在同一形象标准上,努力提高景区形象定位与景区服务管理的关联水平,可用人情气质来填补市场空隙和消费者心理空白,以此提高景区游客满意度。

猜你喜欢

项集关联景区
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
云南发布一批公示 10家景区拟确定为国家4A级旅游景区
『摘牌』
“摘牌”
“一带一路”递进,关联民生更紧
某景区留念
不确定数据的约束频繁闭项集挖掘算法
奇趣搭配
智趣
一种新的改进Apriori算法*