APP下载

基于网络文本数据分析的冰雪旅游游客满意度研究
——以哈尔滨为例

2022-04-01杨春梅徐西帅李威

企业经济 2022年3期
关键词:高频词旅游者哈尔滨

□杨春梅 赵 原 徐西帅 李威

一、引言

在旅游者体验过程中,游客满意度是一个非常重要的问题,直接影响到旅游者旅游行为。Pizam A(1978)首先提出游客满意度概念,他认为游客满意度是游客对旅游目的地的期望和实际体验比较后的综合评价。Churchill和Surprenant(1982)认为游客满意度不一定是与期望进行差异比较,属性绩效也会产生显著影响。Dunn Ross和Iso Ahola S(1991)则指出,态度是情感(例如愉悦),满意度则是对情感的评价。随后,如何提升旅游者满意度,成为众多学者关注的焦点。

对于游客满意度测量,众多学者采用的方法不尽相同,最早采用的是市场调查问卷,考虑到测量的科学性和合理性,研究方法逐渐深化。Yoon和Uysal(2005)运用结构方程模型分析旅游动机、顾客满意和顾客忠诚之间的因果关系。Brejla(2014)以Cruise Critic网站上的网络评论为基础,对游客评论及满意度进行分析。朱晓柯等(2018)等采用问卷调查、运用因子分析法、模糊综合评价法、IPA分析法等方法评价游客满意度。周坤(2020)对ECSI进行修正并构建历史街区游客满意度模型HBTSI。刘建国和晋孟雨(2018)、李志刚和孙瑜(2020)等学者采用案例分析方法和IPA方法研究游客满意度。张春晖和白凯(2018)运用Tetra-class模型,对游客满意度属性要素进行分类。随着网络的普及,部分学者开始进行网络数据挖掘方法,成永坤(2020)等采用词频分析、语义网络分析、情感分析方法对游客满意度进行分析。孙晓东和倪荣鑫(2018)、赵春艳和陈美爱(2019)等利用文本内容分析法从高频词特征、语义网络等进行游客情感等进行满意度分析。敖长林等(2020)采用词频-逆文档率(TF-IDF)和LDA文档主题生成模型两种典型的文本分析方法。

综上,网络文本分析方法大多集中在旅游形象感知、游客网络行为方面,而游客满意度研究大多集中于旅游城镇和旅游景区等方面,对冰雪旅游游客满意度研究相对较少。因此,本文选择网络文本数据分析方法,运用Python大数据挖掘技术,以哈尔滨为研究区域,选取冰雪大世界、太阳岛、圣索菲亚大教堂、冰灯艺术游园会、中央大街、亚布力滑雪场、伏尔加庄园、哈尔滨融创雪世界8个冰雪旅游项目,研究游客满意度问题。

二、研究区域介绍

哈尔滨冰雪旅游产业的效益日益显著,知名度和美誉度越来越高,冰雪旅游市场逐渐扩大,对社会文化和旅游产业的发展起到了重要作用。哈尔滨依靠传统项目,推进冰雪旅游创新项目,打造精品旅游线路,注重把冰雪旅游产业与其他产业相融合,能够把体育、教育、文化及冰雪制造设备业、商贸等融合,不断挖掘冰雪旅游资源优势,打造核心竞争力。例如,在教育融合方面,推出研学精品线路,打造学习基地;在文化融合方面,推出文化演出和传统节目相结合;在体育融合方面,推出森林穿越、摩托车、体育赛事、山地自行车等体育项目。除此之外,在交通、养生等方面,也不断拓展发展空间,推出不同的精品项目。

经过几十年的发展,哈尔滨塑造出一批知名的冰雪旅游品牌。哈尔滨被誉为“冰雪之冠上的明珠”,入选“2018年十佳冰雪旅游城”“2017-2018冰雪季滑雪旅游区十强”名单中,其中:亚布力滑雪场位居第四、亚布力阳光度假村位居第十名、拉布里滑雪场被评为国家优选旅游项目。“2017-2018冰雪季冰雪旅游节事十强”中,中国·哈尔滨国际冰雪节位居榜首。在众多冰雪旅游目的地中,哈尔滨依靠冰雪旅游资源优势及创新模式,深受游客喜爱,据统计,2018—2019年冬季,哈尔滨市旅游热度在全国省会城市中位列前十名,成为全国最热门的冰雪旅游城市之一。

三、研究方法和数据来源

(一)研究方法

网络文本数据分析方法属于内容分析方法,是利用网络消费者留下的数据痕迹进行信息检索、数据挖掘,从文本中抽取的特征词进行量化来表示文本信息的方法。网络文本分析一般包括三个步骤:首先明确数据来源,其次建立分析类目,最后量化分析数据。

旅游评论是旅游者实施旅游行为之后,对整个旅游过程的评价,包括吃、住、行、游、购、娱六个方面,通过旅游评论能够直观反映出游客的满意程度。本文选择比较有代表性的旅游网站作为数据来源,对旅游评论进行本文数据抓取,采用ROST CM6进行量化分析,从而分析出旅游者对冰雪旅游满意度问题。

(二)数据来源

本文选择实力比较强的5家旅游网站进行数据搜集,包括携程网、去哪儿网、猫途鹰旅游网、马蜂窝、途牛网,时间截至2020年10月31日。选择用Python数据挖掘技术,抓取5家网站带时间的游客评论信息,其中,携程网评论数量14621条,去哪儿网评论数量10507条,猫途鹰旅游网评论数量1350条,马蜂窝评论数量527条,途牛网评论数量10757条,共计37762条评论。在抓取数据过程中发现,除了携程网、去哪儿网、途牛网的冰灯游园会评论为0,其余的评论数量比较合理,哈尔滨融创雪世界2017年12月末开始运营,相对于其他冰雪项目,评论数量不是很多,但是发展趋势好,受到旅游者的欢迎,除了猫途鹰旅游网缺少评论,其他的评论都是逐年增多。因此,抓取的评论具有代表性,可以进行本文分析。

(三)数据预处理

1.文本去重

为了更为清晰分析抓取的评论,本文逐条进行检查,发现评论中出现商业宣传、企业概况介绍、游客重复粘贴评论、@用户名等没有意义的情况,进行去除。有的只是为了单纯的评论凑字数,因此把多余的字数去掉,例如“哈哈哈”“呃呃呃”。还有的评论完全相同,进行剔除,只保留一条。

2.手工压缩去词

采取文本去重后,还有部分评论重复,因此需要进行调整,例如“很厚很厚很厚”改为“很厚”,“不错不错不错”改为“不错”“冷冷冷”改为“冷”“特别特别特别好”改为“特别好”。

3.软件分词

中文分词是文本挖掘的基础,对中文准确分词,可以使电脑自动识别语句含义的效果。本文采用ROST CM6软件进行中文分词,ROST CM6分词的精度较高,效率快。例如:“值得一去人间仙境”,ROST CM6分词的结果是“值得/一去/人间/仙境”。“很好玩,多穿衣服,冰雪大世界,值得一去”,ROST CM6分词的结果是“很/好玩/多穿/衣服/冰雪/大世界/值得/一去”。

4.去停用词

评论中出现次数较多,且对评论意义不大的字词,例如“的”“我”“哦”等词对评论作用不大,进行删除。评论中出现的“还行吧”改为“还行”,去掉“吧”,“好好玩”改为“好玩”,“感觉棒棒哒”改为“感觉很棒”。经过数据处理之后,最终获得24万余字评论,将数据改为.txt格式,方便用于ROST CM6进行分析。

四、数据分析

(一)高频词分析

数据进行预处理之后,把数据导入到ROST CM6软件中,利用“词频分析”功能统计排名前120的词频,并进行人工排除与研究主题相关性不高,或者意义不大的词汇,共筛选出90个高频词,高频词见表1所示。通过高频词来确定影响冰雪旅游游客满意度的维度,作为游客满意度判断及优化策略的基础。

成永坤等(2020)对滑雪旅游进行文本分析,把高频词分类为目的地类、配套服务类、游客感受类三种。敖长林等(2020)对冰雪旅游形象进行网络文本挖掘,把高频词分为相关地标、旅游活动、景点建筑或风景特色、特色饮食及住宿、游玩价格五个方面。朱晓柯(2018)研究冰雪旅游游客满意度,提出冰雪旅游资源、旅游食宿、景区设施、景区服务与形象、门票价格五个方面。本文综合相关学者的研究和90个高频词的特征,对表1进行归纳整理,具体统计见表2所示。

表1 冰雪旅游游客评论高频词统计

表2 各类目高频词数量统计

1.冰雪旅游资源及景区类高频词

筛选出词汇包括“冰雪大世界”“中央大街”“太阳岛”“松花江”“教堂”“建筑”“步行街”“滑雪场”“游客”“亚布力”“伏尔加”“小镇”“庄园”“街道”“纪念塔”“异域”“城堡”“景点”“广场”“公园”。相关评论有“白天逛一下中央大街,吃个马迭尔冰棍,晚上去看冰灯”,可以看出哈尔滨冰雪旅游资源丰富,旅游者对冰雪旅游景区的喜爱,对冰雪旅游项目的关注度较高。

2.冰雪旅游形象类高频词

“特色”“风情”“风格”“欧式”“历史”“壮观”“艺术”“夜景”“东北”“超级”“环境”“童话”“夜晚”“文化”“著名”。相关评论有“得天独厚地理环境,它是中国北方最具特色旅游景点”“真激动坏了,冰雕太壮观了,太美太漂亮了”,从归纳高频词可以看出旅游者对冰雪旅游感知形象具有多维性。

3.配套设施服务类高频词

“冰雕”“门票”“滑梯”“冰棍”“项目”“各种”“冰灯”“灯光”“表演”“服务”“票价”“免费”“设施”“交通”“教练”“室内”“美食”“网上”“人员”“导游”“松鼠”。相关评论有“园区服务超级赞,每个人都会对你热情周到,看到小孩子排队还会照顾他让他优先些”,可以看出冰雪旅游景区提供的配套设施和服务比较齐全,旅游者对提供的配套设施和服务比较认可,也可以看出游客的需求情况。

4.游客感受类高频词

“值得”“漂亮”“方便”“寒冷”“好玩”“时间”“好看”“适合”“开心”“美丽”“感受”“便宜”“最好”“好吃”“震撼”“刺激”“天气”“冬季”。相关评论有“感受零下23℃寒冷,还很开心”“值得推荐,有趣好玩,体验很好,景色不错,大世界真是童话世界,很美好,玩很开心”,可以看出旅游者进行冰雪旅游之后的体会较多,有不同的感受。

5.游客行为类高频词

“滑雪”“建议”“排队”“拍照”“体验”“旅游”“游玩”“欣赏”“娱乐”“参观”“保暖”“选择”“注意”“入园”“提前”。相关评论有“体验很好,景色不错,值得推荐”,“做好保暖,要贴多点暖宝宝,足底也要,还有热水,里面比外面冷太多了”,可以看出冰雪旅游与其他旅游方式特性不同,旅游者的行为也不同。“滑雪”“保暖”“体验”等行为是游客必需,但也提出系列建议,如“白天晚上景色不一样,建议下午提前三点多就去,四点半左右就天黑了,拍出照片很漂亮”。

(二)语义网络分析

为了直观反映出游客评论中具有代表性的特征词的关联程度,本文抽取高频特征词,利用ROST CM6软件中语音网络分析功能,通过提取高频词表、去掉无意义词汇、提取行特征词表和共现矩阵词表,最后形成语义网络图,如下图所示。

图 语义网络图

从语义网络图中可以看出,该图共分为5个部分,第一层为核心层,表示哈尔滨冰雪旅游景区和项目,代表游客最关心的部分,从共变关系看,“中央大街”“冰雪大世界”“索菲亚教堂”出现次数最多,是旅游者认为哈尔滨最典型的冰雪旅游项目。第二层为次核心层,与“中央大街”“冰雪大世界”“索菲亚教堂”等词联系比较紧密的词有“俄式”“历史”“欧式”“特色”“正教”“俄罗斯”“风情”“异域”等词,表现了游客在游玩过程中,对冰雪旅游景区的形象认可,也体现了哈尔滨冰雪旅游塑造的形象定位。第三层为中间层,“滑梯”“冰雕”“门票”“冰雕”“鸽子”“冰棍”等词与次核心层产生共变关系,体现了冰雪旅游景区提供的配套服务设施,游客关注的服务重心。第四层为次外围层,“排队”“玩的”“冬天”“夏天”“进去”等词与中间层产生共变关系,体现了游客在旅游项目中产生的行为,从“排队”和“小时”可以看出,旅游人数众多,游客旅游中需要排队,所需时间较多。第五层为外围层,“开心”“方便”“漂亮”表现了游客的感受程度。外围层具有这样的特点:此层词汇之间没有共变关系,“方便”与其他层之间没有共变关系,说明旅游景区在一定程度上感知到旅游的方便性,但是还有待加强。“漂亮”一词与核心词紧密联系,说明游客在旅游中深刻感知到冰雪魅力,冰雪旅游在美观设计方面让游客满意度增加。

(三)游客情感分析

游客情感分析是旅游者对冰雪旅游项目及服务等是否满意的直接表达,对评论分析能够直接反映旅游者在旅游过程中的情绪变化,是冰雪旅游体验之后的赞赏或者意见的情感及满意程度,具体游客情感分析见表3所示。

表3 游客情感分析

从表3游客情感分析可以看出,旅游者对冰雪旅游总体满意度较高。其中,积极情绪的游客占大多数,数量为1263条,所占比例为82.07%,从中可以充分看出旅游者对冰雪旅游认可度较高,满意度较强。从积极情绪分段统计可以看出,“一般”“中度”和“高度”的比例相差不多,高度情绪比例为35.09%,中度情绪比例为22.16%,一般情绪数量为382条,所占比例为24.82%,比例较高,稍有不慎就会转化为中性情绪或者消极情绪,这里对冰雪旅游景区及哈尔滨冰雪旅游产业的发展、旅游者满意度的提升具有警示作用。

另外,中性情绪数量为93条,所占比例为6.04%,冰雪旅游景区也需要多进行关注,尽可能让旅游者的中性情绪转化为积极情绪,否则,中性情绪也可能向消极情绪转化,对哈尔滨冰雪旅游发展不利。

消极情绪数量为183条,所占比例为11.89%。从消极情绪分段统计来看,“一般”数量为138条,所占比例为8.97%;“中度”数量为31条,比例为2.01%;“高度”数量为8条所占比例为0.52%,可以看出0.52%的游客持高度不满意情绪,2.01%的游客持中度不满意情绪,8.97%的游客持低度不满意情绪。因此,提高哈尔滨冰雪旅游游客满意度是非常有必要的。总之,旅游者参与冰雪旅游体验是愉快的,满意度较高,但是从网络文本数据分析看出,部分游客的满意度还需要提升。

五、结论与建议

(一)结论

本文通过携程网、去哪儿网、猫途鹰旅游网、马蜂窝、途牛网5个网站抓取游客评论,运用ROST CM6软件进行高频词分析,利用“词频分析”功能统计筛选出90个高频词,并把高频词分成冰雪旅游资源及景区、配套设施服务、游客感受、游客行为和冰雪旅游形象5个类目;通过对评论数据进行社会网络与语义网络相结合的分析得出高频词之间的相关性,并对游客满意度作出倾向性分析;再通过对评论数据进行游客情感分析,积极情绪所占比例为82.07%,中性情绪所占比例为6.04%,消极情绪所占比例为11.89%。研究得出旅游者参与冰雪旅游体验是愉快的,满意度较高,但是从网络文本数据分析看出,游客的满意度还需要提升。

从对网络文本数据分析的结果可以看出,哈尔滨冰雪旅游游客满意度还存在不足:(1)游客冰雪旅游的便利性不足,评论中提到“排队”的频次为1627,“时间”的频次为1841,导致游客在旅游中产生消极情绪。(2)游客在冰雪旅游的门票价格稍高,评论中提到“门票”的频次为2609,同时也多次出现“宰客”现象,例如“景区门口的出租车司机和卖雪具的人话一句也别信,他们就是来宰客的”。(3)冰雪旅游的劣势是温度问题,评论中提及“寒冷”的频次为2480,“保暖”的频次为643,“天气”的频次为626,例如“做好保暖,要贴多点暖宝宝,足底也要,还有热水,里面比外面冷太多了”“哈尔滨是真冷,南方人难以承受冷,但是,冰与雪国度,真是另一番美妙”。(4)哈尔滨冰雪旅游的形象偏向于异域性,“俄罗斯”“欧式”“异域”等词出现频次较高,没有体现出中国特色文化。

(二)建议

1.提高服务质量,提升游客体验满意度

第一,做好保暖服务。哈尔滨的冬天最冷的时候达到-35℃左右,寒冷的天气也会让部分旅游者望而却步。因此,建议旅游景区提供充足的保暖设备,包括租赁羽绒服、帽子、手套、围巾、保暖袜子、棉鞋等服务,手机在寒冷的天气容易关机,也可以提供暖贴和暖宝宝等服务。同时,多设置游客参与项目,提升游客运动量,增强抵御严寒能力。第二,维持排队秩序,提升效率。设置多种购票方式,采用微信、二维码、门票预订、窗口、旅游网站等购票方式,尽量减少游客在室外购票及排队时间。同时,多设置进站口,凭借身份证等相关证件扫码即可进入,安排专门的服务人员维持秩序和管理工作。第三,加强管理,提升小商小贩诚信经营。对游客的餐饮、住宿、交通、购物环境加强管理,杜绝“宰客”“欺骗顾客”“销售假货”等现象,提升游客体验满意度。

2.改变定价策略,提升游客购票满意度

哈尔滨冰雪旅游项目的门票价格,只有在旅游网站购票时有些优惠,但是力度不大。例如,冰雪大世界门票大致为280-330元,网络购票优惠10元左右。因此,部分游客表示门票“小贵”,为了提升游客购票满意度,建议实行差别定价策略,除了景区规定的学生票、老人票、本地票以外,还可以实行折扣定价策略,例如,购买一次的游客8折,购买二次的游客7折,旅游次数越多,折扣就越多,以此来刺激旅游者重游意愿。也可以购买数量采取折扣定价,家庭旅游采取折扣定价,以此刺激旅游者人数的增加。

3.挖掘文化内涵,打造冰雪旅游文化新形象

从网络文本数据中分析,旅游者对冰雪旅游文化认知多集中在“异域风情”“欧式”“俄罗斯”等方面,可见冰雪旅游忽视本土文化塑造,缺乏本地文化底蕴和艺术创新。为了提升游客满意度,要结合本地文化和中国文化打造冰雪旅游文化新形象。除此之外,还需要将影视、明星、动漫、音乐创作、文化节庆活动等融入冰雪旅游中,给旅游者不一样的感受。

(三)不足之处

本文通过旅游网站进行网络文本数据挖掘,利用ROST CM6软件,采用大数据收集及定量与定性方法相结合的分析方法,最终研究出旅游者对冰雪旅游满意度问题,具有一定的科学性与实用性。但是,本文研究也存在一定的不足:第一,在网络本文数据处理过程中,采用人工处理方式,不可避免存在人工处理误差;第二,本文研究的群体是在网站上评论的旅游者,忽略没有在网站上评论人的感受,导致研究的群体覆盖面不全;第三,本文搜集的数据以网络评论为主,没有涉及游客游记和攻略方面。在未来的继续研究中,要扩大研究范围和研究群体,尤其是旅游者不同特征、不同偏好,进行更深入的探讨和分析。

猜你喜欢

高频词旅游者哈尔滨
我平等地嫉妒每一个去哈尔滨的人
30份政府工作报告中的高频词
省级两会上的高频词
28份政府工作报告中的高频词
省级两会上的高频词
喀拉峻风景区旅游者的生态意识和生态行为研究
奇妙的哈尔滨之旅
旅行社未经旅游者同意安排购物属违约
《老哈尔滨的回忆》国画
感受哈尔滨的冬天