基于网络游记的景区游客画像构建研究*
——以上海迪士尼乐园为例
2020-07-30周晋名毛润泽
周晋名,毛润泽
(上海师范大学 旅游学院,上海200234)
0 引言
在互联网时代,“大数据”是一个热门词汇,它可以通过海量的数据弱化个体的干扰因素,从而体现出群体的共性。目前它已被广泛应用于医疗、金融、交通以及商业等领域,其中商业领域应用较为成熟的是对消费者的研究。通过大数据,我们可以洞悉消费者的共同需求,提高产品或服务的实用性与满意度。但在实际的运用中,我们发现大数据本身所含的信息包罗万象,得出的结论也是高度抽象的,而企业与组织希望得到的是一个具有针对性的可参照的具体对象,“用户画像”也就应运而生,它先将用户的每个具体信息抽象成标签,再利用这些标签将用户的整体或典型形象具体化,从而为用户提供更加具有针对性的服务。它还是描述用户特征以及连接用户需求和产品功能的有效工具,目前已被广泛应用于各个领域。
通过用户画像还可以抽象出企业的典型用户,每一个强大的企业品牌背后都拥有一个价值观一致的群体,该群体按照其典型性又分为若干个次级群体,每一个次级群体都拥有着相同或相似的行为或偏好,我们将这一次级群体的整体称作典型用户。刻画典型用户不仅可以帮助企业锁定目标用户,还可以为企业发现潜在用户。
游客画像就是在用户画像的基础上发展而来,属于用户画像的一个分支,它是建立在海量数据基础上借助数学建模描述游客基本情况的标签化画像[1-5]。其作为景区实施目标市场精准定位、旅游产品精准设计和营销的有效工具,目前已在景区营销中逐步得以应用。相较于传统的景区市场分析方法,游客画像的高度可视化使其可操作性更强。本文基于网络游记对景区游客画像的构建展开研究。网络游记是游客记录旅行的一种方式,游记中不仅包含游客的旅游经历,还包含游客在旅行中的感受,是获取游客信息的宝贵资料。
1 相关研究述评
1.1 用户画像模型的构建方式
用户画像模型的构建方式多种多样,Liana Razmerita等提出了一种基于本体的通用用户建模架构(Ontob UM),应用于知识管理系统(KMS)的上下文中作为捕获用户偏好和能力的简单方式[6]。Hyoung-Rae Kim等则设计了一种分裂的层次聚类(DHC)算法,从用户访问的一组网页中学习用户的兴趣层次结构。首先将单词(主题)分组为一个层次结构,然后将每个网页分配给层次结构中的节点,以进一步处理学习和预测兴趣[7]。
在中国,关于用户画像模型的构建部分是参考国外的构建方式,如郑建兴等利用目标用户的友邻集,借助本体用户模型构建微博用户的友邻主题兴趣集,计算更新友邻主题兴趣度,提出友邻—用户模型的实现算法[8]。也有学者结合中国本土化的特点,提出了自己的构建方式[9],如刘海鸥等通过对微博、QQ 群、天涯论坛、人人网等社交平台的深入挖掘,从用户基本信息、用户行为偏好信息、用户情景信息三个维度构建了在线社交活动中的用户画像模型,并对其信息传播行为的时间统计特征进行实证分析[10]。徐英楠在文本主题与用户人格具有相关性结论的基础上,提出了用户人格主题的概率生成模型及其改进模型,并在真实数据集上进行实验[11]。许鹏程等提出数据驱动下用户画像数据化→标签化→关联化→可视化的驱动主路线,从自然维度、兴趣维度、社交维度,构建多维度、多层级、立体化的用户画像模型[12]。董哲瑾等通过散点图分析挖掘影响用户成长值的因素,借助用户内容数据、用户行为数据、社交关系数据,提取行为特征和相对稳定的时间特征,改进了COREG 算法,整合不同模型的优势,建立了预测准确度较高的模型[13]。
从上述内容可以看出用户画像模型的构建以研究目的为导向,并没有统一的标准,重点在于维度的划分。目前在旅游领域,票务代理公司的用户画像一般包含个人身份信息、价值特征、行为偏好、购票行为、其他特征这五个维度;OTA 行业的用户画像则一般包含个人信息、消费特征、出游偏好、兴趣特征这四个维度。本文在综合考虑了与研究目的的契合以及数据的可获得性的基础上,确立了三个主要构建维度:游客基本属性、游客人格类型、游客兴趣偏好。基本涵盖上文中所提到的各个维度,游客基本属性包括了用户基本信息、个人身份信息等内容;游客人格类型作为影响游客行为方式、消费习惯、社交模式、兴趣爱好的重要变量可以反映用户行为偏好信息、价值特征等;游客兴趣偏好包括了出游偏好、兴趣特征等内容。
1.2 用户画像的应用研究
1996年Tom Fawcett等就曾将数据挖掘与机器学习技术相结合,基于受诈骗客户的行为来构建用户画像,以此检测电话欺诈性。实验表明,这种方法几乎与用于检测欺诈的最佳手动调整方法一样好[14]。此后,Geyer-Schulz等又提出基于用户随机购买事件行为画像的图书推荐服务系统,降低了读者文档的搜索和评估成本,方便了图书管理员的馆藏管理[15]。Qiu L等则将用户画像应用在学术圈,利用概率主题模型对提取的用户配置文件进行建模,构建出学者的用户兴趣模型[16]。目前用户画像的应用研究正在渗透到媒体传播、图书馆、企业营销等各个领域[17-20]。
在旅游业,用户画像也得到了应用,Ravi等利用社交网络的数据来完善个性化的旅行推荐系统,使其具有更好的预测和更高的准确性[21]。刘建平等通过IPA 分析加工用户画像的性别、年龄、应用偏好等信息,分析用户画像每一标签的对比情况,为互联网亲子游的游客勾勒出了用户画像[22]。单晓红等以在线评论数据为基础,从用户信息属性、酒店信息属性和用户评价信息属性三个维度构建用户画像模型的概念模型,并研究了三个维度之间的关联,完整刻画了酒店用户的特征[23]。刘海鸥等基于游客基本属性数据、用户行为属性数据以及用户情境属性数据建立了游客画像概念模型,提出了基于游客画像的旅游情境化推荐模型,并设计了一个景点推荐测试系统进行实验测试[24]。
从上述内容可以看出,相对于其他行业,旅游业对于用户画像的应用尚处于初级阶段,主要以研究用户的性别、年龄、行为、情感倾向等基本信息为主,对于用户数据背后的隐性信息挖掘不够。本文在之前研究的基础上,以情报学的文本分析和旅游学的旅游凝视等理论为依托,分析游客的游记文本与图片,挖掘游客的人格类型与兴趣偏好,提出了一种基于网络游记构建景区游客画像的方法。
2 游客画像概念模型与构建流程
2.1 游客画像概念模型
如上文所述,本文在构建景区游客画像概念模型过程中,以现有的研究为基础,在充分考虑模型与研究目的的契合性以及数据可获得性的基础上,确立了三个主要的构建维度:游客基本属性、游客人格类型、游客兴趣爱好。
维度一:游客基本属性
游客基本属性是指游客的一些基本信息,如性别、年龄、学历、收入、地域等,这些属性反映了游客的基本情况,且不会轻易改变。在本研究中,发现网络游记中包含以下基本信息:性别、现居地、出行时间、出行天数、出行方式、人均消费等。上述信息是作为游客的标签在游记的内容上方直接列出,获取难度不大。
维度二:游客人格类型
目前游客人格类型这一维度在国内的游客画像构建中尚未有文献涉及,但国外早在1999年就有研究指出了人格类型与用词偏好以及情感表达方式的相关关系,而网络游记正是研究游客用词偏好与情感表达方式的绝佳样本。人格类型作为影响人们行为方式、消费习惯、社交模式、兴趣爱好的重要变量,在游客画像的刻画中是必不可少的。本文引入大五人格模型,利用游客在游记中的用词偏好以及情感表达方式对游客人格的五大维度分别评测并加以解释。
维度三:游客兴趣偏好
游客兴趣偏好是游客画像在OTA 领域中最重要的一个维度,也是企业最关注的一个维度,它决定了企业的产品设计、营销策略、销售模式以及服务的提升方式。传统的游客兴趣偏好是通过游客的行为数据或调查问卷分析得出,该方式的优点是准确度较高,针对性强,但难点在于数据的收集,操作难度和成本都比较大。本文借助隐喻抽取技术(ZMET)通过分析游客在游记中上传的照片来刻画游客的兴趣偏好。
游客画像的概念模型如图1所示,分为整体和典型游客画像两个部分。整体游客画像是依据游客基本属性刻画的,而典型游客画像是从整体游客画像中提取而来,除基本属性维度外,还包含人格类型和兴趣偏好两个维度。其中,游客的基本属性对于其人格类型以及兴趣偏好均有影响,如性别、客源地以及消费能力等都会对游客的人格类型以及兴趣偏好产生影响。游客人格类型也会对其兴趣偏好产生影响,美国约翰·霍普金斯大学心理学教授John Holland就提出人们对教育的期望会因其人格类型的不同而有所差别,如研究型和社会型人格类型的学生更倾向于保持更高的教育期望[25]。国内学者殷章馨等也提出不同人格特质的游客的自拍需求也不尽相同[26]。可见,人格类型是影响兴趣偏好的重要指标之一。反之,基于De Fruyt
F等的研究[27],个人的兴趣偏好也可以对其人格类型起到一定的验证作用,提高模型的可信度与准确性。
图1 游客画像概念模型
2.2 游客画像构建流程
基于网络游记的游客画像的构建主要分为七个步骤:第一步,确立研究对象,包括构建该游客画像的目的以及需要的数据;第二步,收集相关数据,即收集与研究对象相关的网络游记;第三步,提取典型形象,主要是根据游记中提供的游客的基本信息;第四步,筛选相关游记,即每一个典型形象所包含的游记,这一步可以通过游记网站的自动筛选功能来实现;第五步,画像素材的准备,主要工作为爬取典型游客游记中的文字并汇总游记照片,文字的采集本文采用Python 自动抓取,游记照片指的是游记中游客上传的旅游途中拍摄的照片;第六步,游客画像的实现,即基本属性采集、人格评测以及兴趣偏好的分析;第七步,游客画像可视化,借助可视化软件对游客基本属性、游客人格类型以及游客兴趣偏好做可视化处理,完成对游客画像的刻画[28]。具体构建流程如图2所示。
图2 基于网络游记的游客画像构建流程
3 游客画像模型的实现
3.1 数据来源与筛选
本文的数据来源主要为马蜂窝旅游网的游记版块,主要信息包含三个部分:游客基本信息(游客的性别、现居地、出行时间、出行天数、出行方式、人均消费等)、游客游记正文文本以及游记中游客上传的照片。数据的筛选主要是根据游客的基本信息以及游记的质量,首先通过网站的自动筛选功能统计各类基本信息分类的游记数量,从中获取整体游客画像并抽象出典型游客画像,然后在筛选出的各类典型游客的游记中根据游记的质量进行第二次筛选,得到最终的数据源。其中用户游记正文文本借助Python自动抓取并利用Jieba分词器对文本进行预处理,借助八爪鱼软件抓取游记中的图片。
3.2 人格类型的评测
在评测人格类型之前首先要构建人格词典,本文人格词典的构建主要分为三个部分:否定词词典、程度副词词典以及特征词词典。否定词词典参考了知网Hownet情感词典,是指包括不、甭、勿、别、未、反、没、否等这一类否定词的词典;程度副词词典也是参考知网Hownet情感词典建立;特征词是指可以用来推断用词者人格特征的词,特征词词典是参考了知网Hownet情感词典、sc-liwc词典,并结合游记中的特征词建立的,包含情感历程词、生气词、冠词、应和词等,如表1 所示。
表1 特征词词典词汇分类及示例(部分)
在完成了人格词典的构建后,接下来要确定人格类型评测指标的计算方法,根据汉语的表达习惯,除了单独的特征词外,一般有“否定词+特征词”(不开心)、“程度副词+特征词”(很开心)、“否定词+程度副词+特征词”(不是很开心)、“程度副词+否定词+特征词”(很不开心)这四种搭配方式。对于单独的特征词,我们可以根据语言使用频次与人格特征之间的皮尔逊相关系数计算(语言使用频次与人格特征之间的皮尔逊相关系数参考1999年Pennebaker and
King等在研究中给出的数值);对于“否定词+特征词”,否定词会改变特征词的极性,所以要在相关系数前添加负号,同时否定词还会削弱情感强度,因此得分还应除以2;对于“程度副词+特征词”,程度副词会改变特征词的强度,权值参考知网How Net词典,但由于特征词典侧重于判断情感倾向,而人格词典侧重于识别情感表达方式,所以本文在结合情感的具体表达方式的基础上对权值做了一些调整。具体见表2。
表2 程度副词分类及权值(部分)
对于“否定词+程度副词+特征词”和“程度副词+否定词+特征词”两种搭配,由于程度副词与否定词位置的不同,所表达的情感也会有所不同,如:“不是很高兴”和“很不高兴”表达的就是不同的意思。前者表达的情感程度较为缓和,而后者表达的则是一种强烈的负面情感。因此,前者在计算得分时,要除以2,而后者不用。综上,五大维度的人格得分可表示为:
其中i取1,2,3,4,5,代表人格评测的五个维度;j表示的是特征词所属的词汇分类,共有45类;P ij代表的是属于j类的词汇与i人格维度的相关系数;Q j代表的是属于j类的单独特征词的数量;q j代表的是属于j类的只与否定词搭配的特征词的数量;w jk代表的是属于j类的第k个特征词前的程度副词的权值;n j代表的是“程度副词+特征词”组合的数量;m j代表的是“否定词+程度副词+特征词”组合的数量;o j代表的是“程度副词+否定词+特征词”组合的数量。
借助以上算法计算出典型游客的五大人格维度的得分,最后对五大维度的得分进行标准化处理,得到最终的评测结果。
3.3 图片采集与分析
图片采集的范围是游记中游客上传的照片,借助图片采集工具采集图片并下载至本地,依靠人工筛选出其中画面清晰、主题明确的照片。主要步骤:第一步,借助人工识别的方法将照片中的元素提取出来,并计算每个元素出现的频次,同一张照片中出现的相同元素按一次计算。第二步,将提取出的元素“人、物、景”分类,其界定标准如下:“人”是指游客、演职人员等,无须赘述;“物”是指游客拍摄的静态的物品,如卡通雕塑、创意小商品、城堡等;“景”是指动态场面的静化,如游客的购物场景、迪士尼的花车巡游、演艺节目等,虽从图片上来看是静止的,但明显是动态的活动。第三步,以分类后的元素为起始意象,结合隐喻抽取技术(ZMET)以及游记中的文字描述,构建游客的旅游意象层次图。第四步,基于构建的旅游意象层次图,结合旅游凝视理论分析游客的兴趣偏好。具体分析过程见下文对上海迪士尼乐园的实证分析,在此不做赘述。
3.4 游客画像的生成
游客画像分为整体游客画像与典型游客画像,整体游客画像仅针对游客的基本属性,而典型游客画像更为精细,包括游客的人格类型和兴趣偏好。其中游客基本信息包含性别、现居地、出行时间、出行天数、出行方式以及人均消费;游客人格类型包含游客五大人格维度的评分;游客兴趣偏好包含游客对上海迪士尼乐园的初始意象、连接意象以及终结意象。在完成以上信息的收集、分析以及整理后,最后利用可视化软件将以上信息用图表的形式直观地表示出来,生成最终的用户画像。
4 上海迪士尼乐园游客画像实证分析
基于前文提出的游客画像模型,本文选取迪士尼乐园作为实证分析对象,数据来源于马蜂窝旅游网站,刻画上海迪士尼乐园游客画像;分别从整体游客画像和典型游客画像两个层面来刻画,其中典型游客分为家人亲戚伴游型和同学朋友伴游型两类。
4.1 整体游客画像
通过游客的基本信息可以从整体上刻画游客画像,首先通过网站自带的筛选功能统计上海迪士尼乐园每个分类下的游记数量,其中游记总数3 166篇。各个分类统计结果如下:现居地主要集中在华东地区,游记数量1 200篇,占比37.9%;出行时间除11~12月为淡季外,其余分布较为均匀,相对集中在5~8月,游记数量1 241篇,占比39.2%;出行方式多为家庭出游或与同学朋友出游,游记数量2 463篇,占比77.8%;人均花费多在500~3 500元范围,游记数量2 305篇,占比约72.8%;出行天数多在三天以下,游记数量2 631篇,占总数的83.1%。
由此可以刻画出上海迪士尼乐园游客的整体游客画像:中产阶级,来自华东的富庶地区,喜欢在夏季和家人、亲戚或同学朋友一同外出游玩,停留时间一般不超过三天。
4.2 典型游客画像
典型游客画像是从整体游客画像中细分出来的具有普遍性和代表性的游客形象,本文选取出行方式为拆分维度,筛选出“家人亲戚伴游型游客”和“同学朋友伴游型游客”两类典型形象。选择出行方式作为拆分维度主要是因为出行方式的不同深刻影响着游客的旅游行为以及旅游体验。本文中游记的筛选主要依靠网站的自动分类功能结合人工进行筛选,以资料的完整度、游记的质量为主要筛选标准,共筛选出家人亲戚伴游型游客的游记211篇,同学朋友伴游型游客的游记197篇。
4.2.1 家人亲戚伴游型游客画像
家人亲戚伴游型游客的游记共有211篇,在对游记中的信息分类后,首先统计筛选出的游记中游客的基本属性,统计结果如下:家人亲戚伴游型游客主要来自华东地区,占比42.7%;出行时间多集中在7月到10月,占比45.5%;人均花费为1 515元;平均逗留2.5天。
接下来采集汇总文本内容以及照片。文本内容经过剔除影响分析的专有名词(如文本中的迪士尼乐园项目名称,节目名称等),统一格式等预处理后,得到共计516 394字的研究文本;照片的收集由于游客游记中的照片数量过于庞大,所以本文人工随机挑选了游记中主题明确、元素清晰、图文相关的照片697张。
家人亲戚伴游型游客人格类型的评测利用Python编程实现,首先将文本导入,然后利用Python中的Jieba分词对原始文本数据进行分词处理,最后再运算,公式在上文中都已给出。计算结果如下:外倾性维度得分184.24,神经质维度得分-254.19,宜人性维度得分417.70,责任心维度得分128.32,开放性维度得分-428.41,如表3所示。
表3 家人亲戚伴游型游客人格类型评分
家人亲戚伴游型游客兴趣偏好的刻画是基于游客在游记中上传的照片,首先要提取出照片中的主要元素,并根据旅游凝视理论分类,计算每个元素出现的频次。在采集的照片内容元素中,“人”是指游客及演职人员等,无须赘述;“物”是指静态的物品(如旅游纪念品,雕塑等);而“景”是指动态过程的静止化(如记录花车巡游、游客体验项目过程的照片),虽然照片是静止的,但可以合理推断出其所记录的是一个动态的过程。结果如表4所示。
表4 家人亲戚伴游型游客凝视元素统计
通过观察可以发现这些元素中,游客自拍、植物绿化、门票、游客游玩、动画截图的出现频次较少,予以删减;此外迪士尼乐园App截图占5.6%,这说明该App的实用性较强,但其不属于意象元素,所以在绘制迪士尼乐园旅游意象层次图时也不纳入考虑。最终筛选出了10个起始意象,对照游记中关于这些元素的文字描述以及它们的基本属性,又构建出相应的连接意象,最后抽象出终结意象,如图3。
图3 家人亲戚伴游型游客迪士尼乐园旅游意象层次
分别汇总计算图片中包含的三个终结意象元素的数量,三个终结意象元素的总数为1 146。其中,“幸福氛围”共689 个元素,占总数的60.1%,这与其人格类型宜人性、责任心维度得分偏高相呼应;“美好享受”共923个元素,占总数的80.5%;“奇幻体验”占总数的29.1%(由于单个起始意象可以归于多个终结意象,因此占比总和大于100%)。从中可以看出美好享受是家人亲戚伴游型游客最关注的兴趣点,这种美好的享受不仅是视觉和味觉上的,更多是心理上的一种享受,这种享受源于对可爱、精致的喜爱以及对于梦幻的向往;其次是幸福氛围,幸福氛围的营造主要依靠家庭成员,同时迪士尼乐园演职人员的友善态度以及活动现场的梦幻氛围也提升了家人亲戚伴游型游客的幸福感;而奇幻体验并非家人亲戚伴游型游客的关注焦点,这可能与家人亲戚伴游型游客的家庭角色和选择偏好有关,父母将更多的精力放在了孩子身上,而不是游乐项目上,在游乐项目的选择上,家人亲戚伴游型游客更加偏好较为平和的项目。
再结合上文中游客人格类型各维度的评分,依据大五人格理论,可以刻画出上海迪士尼乐园家人亲戚伴游型游客的画像:主要来自华东地区,喜欢夏秋季出行,停留2~3天,消费能力较强。他们乐于助人,适应力强,遵守规则,喜爱参加能够营造幸福氛围或带来美好享受的集体活动。
4.2.2 同学朋友伴游型游客画像
同学朋友伴游型游客画像的刻画与前文家人亲戚伴游型游客画像基本相同,在此不做赘述,仅给出197篇游记的分析结果。
基本属性统计结果:主要来自华东和华北地区,占比57.4%;出行时间多集中在4月到7 月,占比42.1%;人均花费为1 328元;平均逗留1.9天。
人格类型评测结果:外倾性维度得分164.91,神经质维度得分-169.15,宜人性维度得分214.09,责任心维度得分-67.18,开放性维度得分-231.96。再将以上得分做标准化处理,结果如表5所示。
表5 同学朋友伴游型游客人格类型评分
同学朋友伴游型游客的兴趣偏好分析在游客意象的选择上较家人亲戚伴游型游客有几处调整,统计结果见表6。
表6 同学朋友伴游型游客凝视元素统计
根据以上内容,绘制出同学朋友伴游型游客迪士尼乐园旅游意象层次图,具体见图4。
图4 同学朋友伴游型游客迪士尼乐园旅游意象层次
通过计算可得:元素总数为1 572个,其中“融洽氛围”意象包含546个元素,占总数的34.7%;“美好享受”意象包含1 274个元素,占总数的81.0%;“奇幻体验”意象包含702个元素,占总数的44.7%。从中可以看出,“美好享受”是同学朋友伴游型游客最关注的兴趣点;“奇幻体验”较家人亲戚伴游型游客要高,占比接近半数,这也与其人格类型开放性维度得分较家人亲戚伴游型游客要高相呼应。出乎意料的是,与家人亲戚伴游型游客注重“幸福氛围”不同,同学朋友伴游型游客对“融洽氛围”的重视程度并不高,这可能是家庭关系和朋友关系亲密程度不同造成的。
再结合上文中游客人格类型各维度的评分,依据大五人格理论,可以刻画出上海迪士尼乐园同学朋友伴游型游客的画像:主要来自华东和华北地区,喜欢春夏季出行,停留1~2天,消费能力一般;他们富于想象力,适应力较强,缺乏组织性,喜爱参加能够带来美好享受或奇幻体验的集体活动。
5 结论与讨论
本文提出了一种新的基于网络游记的游客画像的构建方法,主要是根据游客的基本属性、人格类型和兴趣偏好三个维度的信息来构建。基本属性是通过游记的标签信息进行统计分析,以此刻画出游客的整体游客画像并提取出典型游客;然后对典型游客的人格类型和兴趣偏好展开研究,其中人格类型根据游客游记正文的文本分析来确定,依据是不同人格类型的人在用词和情感表达上有不同的偏好;兴趣偏好是通过提取游客游记照片中的元素,以旅游凝视理论和隐喻抽取技术(ZMET)为理论基础,分析并挖掘游客的兴趣偏好。并且以上海迪士尼乐园为例刻画了该景区的整体及典型游客画像,针对游客画像中体现出的特征,从景区营销、景区服务、景区管理三个方面指出了上海迪士尼乐园在经营管理方面需要注意的问题。
本文提出的基于网络游记构建游客画像的方法在理论与实践上都有一定的价值和意义。其理论意义主要表现在三个方面:第一,目前国内游客画像的研究多采用简单的统计分析,本文将自然语言处理技术和隐喻抽取技术应用于游客画像的研究,刻画游客的人格类型和兴趣偏好,丰富了游客画像的研究方法及工具,这也是本文的创新点所在;第二,与以往的研究相比,本文将人格类型这一新维度引入到了游客画像的研究中,丰富了游客画像的内涵;第三,本文以迪士尼为例展示了景区如何通过游客画像为游客提供更好的服务,拓宽了游客画像的应用领域。
本文的实践意义包括:第一,从景区营销角度,刻画游客画像可以使旅游景区的旅游营销更有针对性。以迪士尼为例,依据家人亲戚伴游型和同学朋友伴游型这两个游客画像,可以在目前推出的家庭套票与亲子票的基础上增加闺蜜票。第二,从景区服务角度,刻画游客画像可以使旅游景区的服务更加人性化。如针对来到迪士尼的家人亲戚伴游型游客责任心较强、情绪稳定性高的特点,可以给予其更多的自主权,包括免押租用一些儿童用品或其他辅助设备等;而对于同学朋友伴游型游客,针对该群体神经质维度的评分偏高的特点,要注意照顾其在游玩过程中的情绪,如在排队时安排演职人员与其互动,并对需要长时间排队的项目及时与其沟通。第三,从景区管理角度,刻画游客画像可以提高景区的管理效率。如针对来到迪士尼的家人亲戚伴游型游客对于“美好享受”的需求要高于“奇幻体验”的特点,迪士尼乐园要注意维护景区内的卫生环境;而对于开放性维度评分较高的同学朋友伴游型游客,该群体更富于想象力,也更有好奇心,因此可以针对该群体设置一些具有刺激性的游乐项目。
本文的不足之处在于文中语言使用频次与人格特征之间的相关系数由于在国内未找到相关研究,参考的是国外的文献,由于国外的文化背景与中国不同,汉语的语言结构也与外语有所差别,因此在人格特征的评分上可能存在一定的误差。在后续工作中将考虑以问卷为基础,尝试建立一个完整的基于景区游客游记中的用词偏好和情感表达方式推测游客人格类型的量化模型,进一步提高景区游客画像的精确度与准确性。除此之外,本文选取网络游记作为研究样本具有一定的局限性,原因在于大多数愿意创作网络游记的游客对上海迪士尼是持积极态度的,这就导致对于迪士尼景区的消极方面(如游客极度拥挤、极限运营、禁带食品和搜包等)不能如实反映。但尽管如此,网络游记中的景区游客画像的刻画对于研究实际游客市场轮廓仍具有重要指示意义,这类似于小说与现实的关系,虽然小说不是现实,但揭示了现实。