基于数据挖掘的旅游者消费行为数字足迹特征分析
2016-10-18张维亚教授严伟汤澍金陵科技学院人文学院南京210038
■ 张维亚 教授 严伟 汤澍(金陵科技学院人文学院 南京 210038)
基于数据挖掘的旅游者消费行为数字足迹特征分析
■ 张维亚教授严伟汤澍(金陵科技学院人文学院南京210038)
本文基于旅游者消费行为数字足迹分析指标,采用数据挖掘方法,分析旅游者消费行为数字足迹特征。研究结果显示:人口统计特征方面女性游客、青年游客、城市游客更喜欢在线消费;行为偏好方面在线预订以住宿和交通为主,消费者倾向使用自媒体分享旅游体验,智能手机是数字足迹的主要载体,空间信息是数字足迹主要表现形式。
旅游者消费行为数字足迹数据挖掘
引言
中国在线旅游发展迅速,行业正在处于快速成长期,具有长期发展潜力。与消费旅游前沿美国相比,中国在线旅游市场将释放出巨大的市场潜力。在线旅游消费的兴起带来了旅游市场的结构变化,提出了旅游产品的新要求,旅游地利益相关者如何应对这一变化,推动旅游可持续发展是一个值得深入研究的问题。
信息化社会的发展对旅游者消费行为的研究方法的创新也提出了要求。旅游者消费行为的传统研究方法通常是通过现场发放问卷的调查方法收集数据,然后进行统计分析。随着大数据时代的来临,数据调查方法扩展到基于互联网的网络调查和数据挖掘技术、基于射频识别(RFID)与全球定位系统(GPS)技术的追踪系统法、基于遥感与地理信息系统(RS &GIS)技术的空间信息收集等方面。数据分析方式除了传统的统计分析,产生了许多新的数据分析方法,如关联规则分析、语义网络分析、GIS分析、神经网络分析、遗传算法、模糊时间序列及灰色理论等。如何将上述研究方法运用到旅游者消费行为研究中,也是值得关注的问题。
表1 旅游者消费行为数字足迹特征测量指标
旅游者消费行为数字足迹
旅游者消费行为数字足迹是指旅游者消费过程中在网络中留下的数字痕迹,包括网络产品感知、信息搜寻行为、在线旅游预订、在线旅游体验和在线旅游分享等内容。旅游者消费行为数字足迹主要体现在决策、体验和评价三个行为阶段。
(一)决策阶段
1.旅游者感知。旅游者感知是旅游者在对旅游地特征的预期或理解基础上形成,是个体对旅游地的整体感知和精神描述。旅游者感知的形成不仅受营销信息的影响,还受主观感知的影响。随着网络对旅游影响的增加,研究者开始关注在线口碑效应对旅游地形象的影响。邹宏霞、罗芬和向晶(2010)发现当旅游者在游前同时从旅行社和互联网两种途径获得旅游地形象信息,与单一从旅行社获取旅游地信息相比,旅游者对旅游地的游前形象感知更差,但是这种感知效果会随着旅游者的互联网体验和旅游者信息收集能力的增强而逐步得到改善。黄莎、陈金华和陈秋萍(2012)认为网络评论具有丰富化与差异化、分散化与整体性、参与性与传导性等特征,并通过对福建武夷山的实证研究发现,传统口碑和在线口碑组成的双向传导模式有助于提高发射性形象与接受性形象的吻合度。
2.在线信息搜索。随着因特网的普及,旅游者之间的虚拟交往变得常见,旅游者评论成为旅游地吸引游客的重要因素。旅游者在进行消费决策之前通常会在信息平台、旅游论坛或在线社区以收集相关信息。旅游者评论对于旅游这种体验型消费的影响尤为明显,因为体验型商品的质量在消费之前难以判断,消费者不得不依赖口碑效应和在线评论来评判体验型商品的优劣。在旅游者态度方面,研究发现在线口碑效应对旅游者态度具有重大影响。Vermeulen和Seegers(2009)发现正面的在线评论会让潜在游客对旅游地产生好感。武传表和武春友(2012)认为旅游者的游后在线口碑传播意愿受到旅游满意度、旅游体验、利己主义和网络涉入的共同影响。在线口碑效应是影响旅游者旅游意向和旅游地选择的重要信息源。与旅游地营销广告提供的信息相比,其他旅游者提供的信息更易让旅游者感知为最新、愉悦和可靠。胡兴报和苏勤(2011)发现旅游在线评论已经成为游客收集旅游地景点、住宿和服务等相关旅游信息的重要渠道。赖胜强、唐雪梅和朱敏(2011)认为网络评论、旅游博客数量及图片数量等与旅游地接待量具有显著的正相关关系。
3.在线预订。在客户进行线上旅游产品预订的影响因素方面,年龄、教育背景、网络浏览量以及互联网使用年限、以往的网络购买经历、对于网上旅游产品的信任度、满意度和忠诚度等是影响旅游者在线旅游消费的主要因素。此外,旅游者态度也是影响旅游者最终做出决策的重要影响因素。旅游者态度是伴随特定行为的旅游者积极或消极评价的心理趋向。Vincent和Thompson(2002)认为旅游者态度包括感知、情感和行为。感知在态度形成中起到评价的作用,情感是旅游者在表达偏好时的心理影响因素,行为是旅游意向的外在表现。杨瑞和白凯(2008)发现旅游者态度是旅游者做出前往某个旅游地旅游决策的情感前导因子。
(二)体验阶段
旅游体验是一个以旅游地地理特征为背景的主观表现行为,这些地理特征通过旅游者与旅游地之间的交往最终形成不同的物理、认知、社会和情感维度。旅游体验具有复杂性特征,需从体验密集度、感知耦合、情感因素和旅游者多样性等角度进行测度。从感知角度分析,旅游体验涉及视觉、听觉、触觉、嗅觉和味觉等。旅游者通过上述感觉获得地方感知体验,从而形成目的地整体旅游体验。旅游研究者从营销学角度构建了基于旅游者与地方、人和人工物之间相互关系的体验模型。
基于时间维度网络对旅游者体验的影响可分为路线体验(从客源地到目的地的旅行过程中获得的体验)和旅游地体验(在目的地旅行中获得的体验)。旅游地体验包括旅游者对目的地的感官感觉、对目的地的情感、与当地居民的交往、对目的地的独特理解、目的地与客源地的差异感等;旅游路线体验是指抵达目的地的交通方式体验和旅游路线吸引物体验。
基于空间维度网络对旅游者体验的影响可分为地标知识、路径知识和调查知识。地标知识,即关于具体空间特征的信息,代表了当人们穿越边界时从地方特征和空间特色角度认知地方的能力。当人们体验地方时,在线旅游工具可以帮助人们发现具体特征从而使人们能够识别地方。路径知识是指与地理特征的时空关系有关的信息,代表了地标是如何在环境中相互连接成路线的信息集合。也就是说,路径知识与距离和方向的感知密切相关。使用在线旅游工具可以帮助人们收集和获取代表他们距离感、方位感和追踪自身运动能力的路径知识。最后,在线旅游工具在帮助人们获取调查知识方面也有影响,这些调查知识可以弄清众多地标、路径的主次关系和相互关系。总而言之,借助在线旅游工具,人们获得关于地方的知识,并且使用这些地理知识获得与空间有关的有意义的体验。
(三)评价阶段
随着技术的进步,人与人之间的沟通交流的发生地点已经从实际地理空间转移到赛博空间上(cyberspace)。媒介的变化是传统口碑与在线口碑最大的区别所在。随着互联网技术的飞速发展和广泛应用,旅游口碑效应的传播与影响产生了革命性的变化,在线口碑效应引起了企业界和学术界的双重关注。Litvin、Goldsmith和Pan(2008)认为旅游在线口碑效应是旅游者对目的地做出的评价(积极或消极)通过因特网对个体和组织产生的广泛影响。
对于旅游者而言,在网络上表达旅游体验时更加真实自如。Morgan、Pritchard和Piggott(2003)在调查新西兰旅游者后发现,消极口碑效应对旅游地形象具有致命影响,旅游者更倾向于传播负面评价,传播速度更快,影响越广。在线口碑的高可达性意味着信息可以传播给海量用户,口碑效应可以长时间存在,潜在客户可以发现他们想要了解的产品或服务。由于在线口碑具有允许网络用户建立虚拟关系和社区的特点,评论团体的能力有可能超过企业。如果在线口碑信息是匿名在线传播,那么传统口碑交流将会变得更加可信。由于传统口碑通过面对面进行信息交流,交流双方彼此熟悉,相互信任,因而是一种有效的传播方式。身体语言和音量声调也能增强信息传播效果。根据Mohammad,Neda和Behrooz等(2012)的研究,在计算机媒体环境下,在线口碑意见领袖具有区别于非领袖的特质。在线口碑意见领袖在涉入程度、创新程度、拓展行为和自我感知方面要比非领袖水平高,计算机技能水平、网络使用经验和频率都要高于非领袖。Weber和Roehl(1999)通过消费者撰写在线旅游评论动机研究,提出在线口碑传播的七个动机:愉悦、凝聚集体、表达消极情绪、关心他人、帮助公司、表达积极感受和自我增强。该项研究揭示了愿意帮助旅行公司、关注其他消费者、愉悦和积极自我增强是导致在线旅游评论的主要因素。从这些在线口碑动机研究结果来看,关心其他消费者和表达积极情绪的诉求或自我增强是人们愿意进行在线口碑交流的主要原因。
旅游者消费行为数字足迹特征测量指标
根据上述对旅游者消费行为数字足迹的分析,本文构建了测量旅游者消费行为数字足迹特征的指标体系(见表1)。该指标体系共有三个一级指标,八个二级指标和15个测量项目。一级指标分别为决策行为、体验行为和评价行为。二级指标根据一级指标进行细分,其中在线决策行为分为在线产品感知、在线信息搜索和在线产品预订;在线体验行为分为路线体验和旅游地体验;在线评价行为分为自媒体评价、公共媒体评价和其他评价。
表2 旅游者消费行为数字足迹统计
旅游者消费行为数字足迹特征数据挖掘
(一)研究方法
本文使用关联分析模型分析中的Aprior 算法挖掘旅游者消费行为数字足迹特征。Apriori算法的具体操作如下:第一步读入数据。第二步改变变量属性。将种类设置为标签,数值选读取,方向设为输入、输出或双向。第三步添加Apriori节点。第四步设置Apriori节点参数得出结论。第五步,用网络节点看属性关联度。
(二)数据收集
数据收集方式采用网络调查,首先根据上述指标测量项目设计好问卷,邀请被调查者填写网络问卷,调查时间为2015年5月和6月。共发放问卷1000 份,回收850 份,有效问卷823份,有效问卷率82.3%。
(三)数据整理
调查问卷分为两大部分。第一部分为旅游者在线消费行为。共设置了15个问题,回答者选择是或否。为后面数据处理需要,统计时设置是为1,否为0。最后根据问卷结果制作表格(见表2)。
第二部分为旅游者统计特征。共设置了八个问题,分别为性别、年龄、婚姻状况、户籍、教育程度、职业状况、职务和月平均支出。为后续数据处理需要,分别对每个问题的备选项赋以1以上的数值。最终根据问卷统计结果制作表格(见表3)。
(四)数据处理
1.建模。本文使用SPSS Clementine 12.0建立分析模型。模型由三个部分,分别为数据源、Apriori分析模块和网络分析模块。具体建模步骤为,先选择Clementine界面下方的源选项,选择EXCEL数据源,然后打开建模选项菜单,选择Apriori模块,再打开图形菜单,选择网络项,最后用箭头连接各个图标。
2.消费行为事实关联数据处理。首先进行旅游者消费行为数字足迹之间关联规则挖掘。将在问卷统计基础上形成的旅游者在线消费行为表转为EXCEL表格式,作为数据源上传到Clementine软件中。然后设置消费行为数字足迹关联分析参数,将字段类型设为“标志”,数值范围从表中自动读取,方向选择“两者”。最后使用SPSS Clementine 12.0 软件中Apriori 节点实施关联分析。
如表4所示,当支持度为20%,置信度为80% 时,得到9926条关联规则。当支持度为20%,置信度为100% 时,得到6371条关联规则。当支持度为80%,置信度为100% 时,得到173条关联规则。当支持度为90%,置信度为100% 时,得到33条关联规则。
3.统计特征与消费行为数字足迹关联处理。将旅游者消费行为数字足迹表与统计特征表合并为一张EXCEL表格式,然后作为数据源上传到Clementine软件中。设置关联分析参数。将字段类型设为“标志”,数值范围从表中自动读取,方向选项统计特征选择“输入”,消费行为选择“输出”。如表5所示,当支持度为10%,置信度为80%时,可以得到4144条关联规则。当支持度为50%,置信度为90%时,可以得到99条关联规则。当支持度为50%,置信度为100%时,可以得到65条关联规则。当支持度为60%,置信度为90% 时,可以得到36条关联规则。当支持度为60%,置信度为100%时,可以得到22条关联规则。当支持度为70%,置信度为90%时,可以得到11条关联规则。当支持度为70%,置信度为100%时,可以得到5 条关联规则。
表3 旅游消费者人口特征统计
表4 旅游者消费行为数字足迹关联规则统计
表5 旅游者消费行为数字足迹与统计特征关联规则统计
旅游者消费行为数字足迹特征分析
(一)决策行为数字足迹特征分析
1.旅游者游前决策依赖网络,注重在线预订住宿和交通。首先对通过Apriori算法得到的决策阶段消费行为关联规则进行分析(取支持度90%、置信度100%条件下得到的33条有效关联规则)。由于置信度都是100%,所以按照支持度由高到低进行排序。支持度最高为96%,一共有9条规则,具有较高的应用价值。这9条规则分别是:在线预订机票或火车票→在线预订酒店;在线预订酒店→在线预订机票或火车票;在线预订机票或火车票→游前上网查看旅游产品信息;游前上网查看旅游产品信息→在线预订机票或火车票;在线预订酒店→游前上网查看旅游产品信息;游前上网查看旅游产品信息→在线预订酒店;在线预订酒店同时在线预订机票或火车票→游前上网查看旅游产品信息;在线预订酒店同时游前上网查看旅游产品信息→在线预订机票或火车票;在线预订机票或火车票同时游前上网查看旅游产品信息→在线预订酒店。从这9条规则内容来看,都是属于游前在线消费行为,说明游客在游前阶段进行在线消费的概率很高。同时,这9条规则都只是涉及到游前上网查看旅游产品信息、在线预订酒店、在线预订机票或火车票三个行为,说明这三个消费行为相互之间的必然关系。
2.女性更喜欢使用网络搜索旅游信息和在线预订。分析旅游者统计特征与消费行为数字足迹关联规则,本文采用支持度60%、置信度100%条件下得到的22条有效关联规则。支持度最高(72%)的5条规则都与性别有关,其中有4条是在游前阶段行为。这4条规则分别是:性别:女→旅游过程中上网查找信息;性别:女→在线预订酒店;性别:女→在线预订机票或火车票;性别:女→游前上网查看旅游产品信息。这说明相比较男性,女性更喜欢在线消费;女性在线消费行为具有延续性,不仅在出发前通过网络了解旅游产品,在旅游过程中还喜欢使用网络继续搜集信息。
3.青年人更喜欢使用网络搜索旅游信息和在线预订。旅游者统计特征与消费行为数字足迹关联规则中,支持度第三(64%)的一共有4条规则,都与年龄有关。这4条规则中有3条发生在游前阶段,这3条分别是:年龄:20-29→游前上网查看旅游产品信息;年龄:20-29→在线预订酒店;年龄:20-29→在线预订机票或火车票。
(二)游览行为数字足迹特征分析
1.游览行为数字足迹是游前决策行为数字足迹的延续。对通过Apriori 算法得到的决策阶段消费行为关联规则进行分析(取支持度90%、置信度100%条件下得到的33条有效关联规则)。支持度都是92%的共有24条规则,除了涉及到游前阶段消费行为的相互关联外,还发现旅游体验阶段的活动(旅游过程中使用智能手机导航功能找地方)与游前消费行为关系密切。这说明选择游前在线消费的游客在旅游体验过程中通常会借助移动设备继续在线消费。
2.智能手机是游览行为数字足迹的主要载体。在旅游者统计特征与消费行为数字足迹关联规则中,一些支持度较高的规则都与使用智能手机相关:性别:女→旅游过程中使用智能手机导航功能找地方(支持度72%);教育程度:本科→旅游过程中使用智能手机导航功能找地方(支持度68%);年龄:20-29→旅游过程中使用智能手机导航功能找地方(支持度64%)。说明游览阶段旅游者习惯使用智能手机辅助旅游活动。
3.空间信息是游览阶段游客数字足迹主要内容。在游览阶段的行为方式中最为出现频率最高的是“旅游过程中使用智能手机导航功能找地方”,远远超过“旅游过程中留意周围是否有WIFI”、“旅游过程中上网查找旅游信息(食住行游购娱)”、“在景区使用智能手机进行导览”和旅游过程中通过网络媒体及时发布旅游行为动态。说明在游览阶段游客对空间信息的需求强烈,因此留下的数字足迹体现明显的空间性。
(三)评价行为数字足迹特征分析
1.倾向使用自媒体分享旅游体验。对通过Apriori 算法得到的决策阶段消费行为关联规则中,涉及“回来后通过微信、QQ、博客等发布旅游评价”的关联规则数量和支持度高于“回来后在旅游网站上对产品进行打分”、“回来后在旅游网站上发表评论”和“回来后在旅游网站上撰写旅游攻略”。说明旅游者在游览后倾向于使用自媒体工具而不是公共媒体工具分享旅游体验和发表旅游评价。
2.城市青年女性旅游者喜欢采取在线分享行为。在旅游者统计特征与消费行为数字足迹关联规则中,“性别:女→回来后通过微信、QQ、博客等发布旅游评价”;“性别:女→回来后在旅游网站上撰写旅游攻略”;“年龄:20-29→回来后通过微信、QQ、博客等发布旅游评价”;“年龄:20-29→回来后在旅游网站上发表评论”;“户籍:城镇→回来后通过微信、QQ、博客等发布旅游评价”支持度较高。说明旅游者群体中青年、女性和城镇人口习惯旅游结束后通过网络发表旅游评价和分享旅游感受。
结论与启示
通过对旅游者的消费行为数字足迹问卷调查,运用关联规则数据挖掘分析,本文发现旅游者消费行为数字足迹具有以下特征:一是消费行为数字足迹具有阶段性。旅游者消费行为数字足迹可以分为三个阶段。第一个阶段是游前阶段。在游前阶段留下的数字足迹主要有网路旅游信息搜索行为、网络预订行为等。第二个阶段是游中阶段。在游中阶段留下的数字足迹主要有使用智能手机导航、使用智能手机景区导览等。第三个阶段是游后阶段。在游后阶段留下的数字足迹主要有使用自媒体工具进行旅游体验分享和评价。二是消费行为数字足迹具有连续性。旅游者的数字足迹在旅游三个阶段均留下痕迹:在游前阶段通常会上网查看旅游产品信息,并预订酒店等旅游产品;游中阶段使用智能手机上网导航或查询旅游地旅游信息;游后阶段通过网络叙述旅游经历和发表旅游体验评价。三是消费行为数字足迹具有关联性。在消费行为数字足迹之间,游前上网查看旅游产品信息、在线预订酒店、在线预订机票或火车票、游前上网查看旅游产品信息、旅游过程中使用智能手机导航功能找地方五种行为密切相关。四是消费行为数字足迹具有独特性。从时间先后来看,从开始到结束,消费行为数字足迹频率逐渐减弱。游前消费行为数字足迹最为常见,游后评价行为最少。在线预订行为中大多数游客消费住宿和交通,景区门票消费很少。在游后评价行为中多倾向使用自媒体工具进行旅游产品评价和旅游体验分享。五是消费行为数字足迹与遗产旅游者统计特征有关。从统计特征上看,女性比男性更喜欢在线消费,青年人比老年人更喜欢在线消费,城镇人比农村人更喜欢在线消费。消费行为数字足迹频率与婚姻状况、收入、职业和职务没有明显关系。
本文研究结论对智慧景区建设具有以下实践启示:首先旅游景区首先需要确立以旅游网站建设为重点的发展思路,提升网络产品的感知质量。旅游网站需要提高信息质量,提高网站设计水平。其次,旅游景区需要以网络营销渠道拓展为方式,构建景区的智慧形象。积极施行细分网络营销策略,发挥在线口碑营销优势,激发旅游者的在线口碑传播动机,发挥意见领袖的影响力,利用积极在线口碑效应,打造满意旅游体验,策划网络事件营销活动,建设成熟网络社区。第三,旅游景区需要以游客数字足迹分析为依据,提高景区的智慧管理水平。监控游客活动,控制游客流量,引导游客流向,构建网络旅游监管机制与反馈平台,设立智慧旅游体验中心,营造良好旅游信息化氛围,提升旅游景区网络形象。
数字足迹研究是旅游者消费行为研究的新课题,本文研究深度尚显不足。后续研究可结合数字足迹研究的最新进展,继续通过实证研究探索该过程及规律,为我国智慧旅游发展决策提供理论依据。
1.邹宏霞,罗芬,向晶.信息涉入差异对旅游目的地行前形象影响分析[J].经济地理,2010,30(8)
2.黄莎,陈金华,陈秋萍.基于网络信息嵌入性的旅游目的地形象传导研究[J].人文地理,2012(3)
3.Vermeulen,I.E., Seegers,D. Tried and tested: The impact of online hotel reviews on consumer consideration[J]. Tourism Management,2009,30(1)
4.武传表,武春友.游客网络口碑传播动因实证研究——以赴大连游客为例[J].科技与管理,2012,14(4)
5.胡兴报,苏勤.黄山国内旅游者网络旅游信息搜索行为研究[J].安徽师范大学学报(自然科学版),2011(3)
6.赖胜强,唐雪梅,朱敏.网络口碑对游客旅游目的地选择的影响研究[J].管理评论,2011,23(6)
7.Vincent,V.C.,Thompson,W.T. Assessing community support and sustainability for ecotourism development[J]. Journal of Travel Research,2002,41
8.杨瑞,白凯.大学生旅游消费行为影响的实证分析——以西安市大学生为例[J].人文地理,2008(5)
9.Volo S.Conceptualizing experience: a tourist based approach.Journal of Hospitality Marketing and Management,2009,18
10.Chang R C Y,Kivela J, Mak A H N.Attributes that influence the evaluation of travel dining experience: when east meets west.Tourism Management,2011,32
11.Tussyadiah I P, Fesenmaier D R. Mediating tourists experiences access to places via shared videos.Annals of Tourism Research,2009,36
12.陈岗.旅游吸引物符号的双层表意结构与体验真实性研究.人文地理,2012(2)
13.Tussyadiah I P, Zach F J.The role of geo-based technology in place experiences. Annals of Tourism Research,2012,39(2)
14.张维亚,严伟.基于结构方程模型的ICT对旅游体验影响研究.技术经济与管理研究,2013(10)
15.Litvin,S.W.,Goldsmith,R.E., Pan,B. Electronic word-of-mouth in hospitality and tourism management[J]. Tourism Management,2008,29(3)
16.Morgan,N.J.,Pritchard,A.,Piggott,R. Destination branding and the role of the stakeholders: The case of New Zealand[J]. Journal of Vacation Marketing, 2003,9(3)
17.Mohammad R.J., Neda S., Behrooz D., et al. Examining the structural relationships of electronic word of mouth, destination image, tourist attitude toward destination and travel intention: An integrated approach[J]. Journal of Destination Marketing & Management,2012,19(1)
18.Weber K , Roehl W S. Profiling people searching for and purchasing travel products on the World Wide Web[J]. Journal of Travel Research, 1999, 37(3)
教育部人文社科基金规划项目(14YJC790171);江苏省政府留学金资助
F590
A