基于百度AI开放平台的北京市共享住宿顾客满意度及需求层次研究
2021-03-30谢秋逸周年兴马小宾
谢秋逸,周年兴,2,轩 源,3,马小宾
(1.南京师范大学地理科学学院,江苏 南京 210023)(2.江苏省地理信息资源开发与利用协同创新中心,江苏 南京 210023)(3.广东省城乡规划设计研究院有限责任公司,广东 广州 510290)
共享住宿是一种非标准住宿产品,能利用自有或租赁住宅,通过共享住宿平台为房客提供短期住宿服务. 与传统酒店相比,共享住宿有多元化的房源供给类型和更加个性化的房主服务. 随着《共享住宿服务规范》的发布和市场的不断规范,共享住宿逐渐受到游客的青睐. 共享住宿产品是共享经济的重要组成,能够有效地将非活跃资源货币化,研究共享住宿产品的顾客满意度和顾客需求层次不仅有利于酒店业的可持续发展,而且能对共享经济的研究作进一步的补充,有较强的理论意义和实践指导价值.
顾客满意度能反映消费者对产品或服务的评价,并对提高产品质量具有指导意义[1]. 1989年,Fornell[2]总结的顾客满意指数理论被视为顾客满意度研究的基础. 酒店顾客满意度的相关研究主要集中在满意度模型搭建和影响因素测评[3-4]. 近年来,随着线上OTA平台的发展和大众旅游时代的到来,海量的线上顾客评论数据逐渐成为顾客满意度研究的重点内容. 丁于思等[5]运用自然语言处理,基于网络点评对五星级酒店的顾客满意度影响因素进行测评;俞越[6]通过高频词分析对上海不同档次的酒店顾客满意度进行研究. 在此基础上,酒店顾客满意度相关研究逐渐产生了学科交叉和跨领域现象,计算机数据分析、人工智能等技术被应用于酒店顾客满意度研究中[7-9].
如何合理应用机器学习、深度学习等计算机算法,提高酒店顾客满意度的实际应用价值是亟待解决的问题. 笔者认为,人工智能在酒店顾客满意度的实证研究中存在以下三个阻力:(1)计算机算法的准确率均无法达到100%,在应用中很难确定用哪种算法能得到更好的应用效果[10];(2)单一算法的细粒度较差,而算法融合的人为干扰因素过多;(3)人工智能对网络文本分析是基于有监督学习,该方法需要大量的有标签训练集,个人很难建立庞大的训练集,研究时很难产生应用价值. 综上所述,本文引进了百度AI开放平台作为技术手段. 百度AI开放平台是百度旗下开放的人工智能服务平台,基于百度搜索引擎的庞大数据库,能够对酒店顾客满意度提供海量的语料库支持,并提供准确度较高的免费测评服务. 本文应用百度AI技术,有效地避免了繁杂的计算机工程,规避了难以确定的算法选用问题,能够对酒店顾客满意度的应用研究提供更多思考,并对相关产业的满意度研究提供范式.
1 研究方法和理论构建
随着人工智能的不断发展,各国纷纷布局人工智能战略[11],全球各互联网公司积极开展AI项目. 目前,国内已形成一批有一定规模和市场的落地项目,如百度AI开放平台、华为云AI、阿里AI等. 百度AI作为国内最大且最容易获取的人工智能平台,能够对中文进行准确的自然语言处理,市场测试准确率高达95%,包括254项场景能力、解决方案与软硬一体组件,并提供EasyDL定制化训练平台、深度学习开发实训平台AI Studio、自定义模板OCR等定制化平台. 在自然语言处理应用技术方面,以多场景技术应用为导向,提供可直接应用于产品策略的NLP技术.
本文主要选择情感倾向分析技术和评论观点抽取技术. 情感倾向分析指对包含主观信息的文本进行情感倾向性判断,评论观点抽取指自动分析评论关注点和评论观点,并输出评论观点标签及评论观点极性. 操作的具体方法为:通过百度账号登录百度AI开放平台,在页面创建应用,获取API KEY及Secret KEY. 在python3.8环境下,复制百度提供的子项目分析代码,输入API KEY、Secret KEY及评论数据,选取相应的API并调用接口,即可通过百度AI开放平台的控制器获得对评论文本的分析结果.
2 实证研究
2.1 背景分析
北京市作为中国的首都,承载着多项重要职能,包含政治中心、文化中心、国际通信中心、科技创新中心等. 随着国内外游客数量的不断增长,旅游配套设施需求的数量和质量也不断提升,旅游住宿作为旅游环节的重要一环,在大众旅游时代和互联网科技的推动下急剧扩张和变革. 共享住宿作为以房主服务为主要特色的住宿产品,能提供深入地方特色的社交体验,能满足游客多元的、自主的、深入体验式的休闲旅游需求.
2.2 数据获取
本文运用Python爬虫抓取技术在Airbnb官方网站进行房源数据的收集,数据包括北京市2014—2019年共享住宿房源ID、经度、纬度、房源类型、房源介绍、评论内容、评价时间等. 完成抓取工作后,将数据进行初步梳理,删除非中文评价,得到房源数据共7 667个,评论数据76 000条.
3 结果与讨论
3.1 北京市共享住宿顾客满意度总体情况
运用百度AI开放平台中的情感倾向分析API,对所有房源评论的情感倾向作出分析,得出北京市共享住宿顾客满意度. 北京市共享住宿产品的满意度整体水平较高,平均满意度达到了97.7%,满意度超过95%的共享住宿数量占总数的87.3%. 整体上看,共享住宿产品的满意度与游客评论数量呈正相关,说明通过网络文本分析顾客的满意度及需求层次存在现实合理性.
3.2 北京市共享住宿顾客满意度及需求层次分析
需求层次理论一般指马斯洛需求层次理论[12]. 1943年,马斯洛在《人类动机理论》一文中提出了“需要层次”的理论,将人的价值体系分为5种基本需要[13]. 在消费服务业,获取顾客需求并准确计算其重要性排序能够使商家尽可能设计和开发满足顾客需求的产品,从而获取更大的竞争优势[14].
顾客对影响要素的重要性判断能反映其需求层次[15]. 传统的网络文本分析,由于语言本身矩阵维度过高,在计算机表达中存在一系列困难,且顾客的评论可能存在多个情感倾向,容易引起较大的语义模糊和不确定的问题[16],因此通过传统的网络文本挖掘游客的需求层次难度较大. 本文运用百度AI开放平台中的评论观点抽取项目,能够基于百度数据库的海量文本和词典,提取出顾客一条评论中的多重情感,抽取其“评价情感词”和“评论对象”的映射. 该方法能够有效地规避顾客情感倾向偏差,也避免了传统自然语言处理文本矩阵维度过高的问题.
在python3.8环境下,对76 000条共享住宿评论文本进行停用词、分词处理,删除“不错”“较好”等情感词,保留特征词中的名词、形容词等,对文本进行词频统计,结合共享住宿的特征、词频分析的结果及前人的研究[17],将顾客满意度的影响因素大致分为基础设施、装修环境、房主服务、主观感觉、周边交通、房源价格6个因素.
3.2.1 共享住宿顾客满意度总体特征
调用百度AI开放平台中的评论观点抽取API,对76 000条共享住宿评论文本进行观点抽取,共得出一一对应的“评价要素”和“情感倾向”联结1 656组,删除表意不清,剩余1 588组. 分别对顾客的评价要素和情感倾向进行词频统计,如表1、表2所示.
顾客的评价要素和情感倾向基本围绕基础设施、装修环境、房主服务、主观感觉、周边交通、房源价格展开. 通过顾客评价要素词频分析,顾客对“位置”“房间”“氛围”和“环境”等要素的关注较多,分别占比23%、17.8%、10.6%、9.7%. 在顾客的情感倾向中,顾客最容易给出“好”“方便”“干净”“不错”的评价,分别占比40%、9.7%、8.9%、7.7%. 在6个要素中顾客关注度最高的是周边交通,其次是基础设施和房主服务,而对装修环境、主观感觉和房源价格的关注度较少.
通过Gephi软件对顾客评价的“评价要素”和“情感倾向”联结作可视化处理,如图1.
表1 共享住宿顾客评价要素词频统计表Table 1 Shared accommodation customer evaluation elements word frequency
表2 共享住宿顾客情感倾向词频统计表Table 2 Shared accommodation customer emotional tendency word frequency
图1 顾客评价要素和情感倾向词关系图Fig.1 Relationship between customer evaluation elements and emotional tendency words
运用Fruchterman Reingold布局如图1(a). “好”“不错”的情感倾向和“房间”“热情”“干净”等评价要素在评价要素-情感倾向联结中起到枢纽作用. “好”“不错”等情感倾向词的聚类系数较高,反映了顾客评价的常用情感态度;“房间”“感觉”等作为评价要素的重要节点,说明顾客更常用笼统的词作为评价.
运用OpenOrd布局如图1(b). 顾客的评价要素-情感倾向联结呈现明显的聚集社区组团特征,形成以好(感觉好、服务好)、不错(房间不错、房子不错)为核心的大社区,以方便、热情等为核心的小社区,这反映了顾客在评价时容易给出的情感倾向及其评价要素的结构形态. 此外,网络核心节点的相关联结权重较高,而边缘节点的相关联结权重较低,网络形成一定的“核心-边缘”结构.
总体看,顾客的评价要素-情感倾向联结分布较为集中,易集中于特定的词组. 考虑现实,应与顾客的评价习惯及参考他人评价的从众心理[18]相关.
3.2.2 共享住宿顾客满意度局部特征
顾客对评价要素产生的情感倾向通常用到形容词和副词. 为研究顾客对共享住宿评价要素的具体情感指向和情感程度,将顾客评论根据词性划分为以“热情”“方便”“舒服”等形容词为主的情感指向词,和以“非常好”“很好”“好”“差”等副词为主的情感程度词.
将评价要素-情感指向词联结作可视化处理如图2. 根据图2(a),评价要素-情感指向词联结形成聚集社区式网络结构,形成网络“小世界”特征. 根据图2(b),情感指向词与对应评价要素的词频呈线性正相关,如情感词“热情”与评价词“房东”出现的比率均较高,“干净”和“卫生”的相关性也较高等. 即可以通过单独的顾客情感态度或评价要素得出其对酒店的意见和建议. 此外,有少量情感指向词只能反映顾客的偏好,而不能反映积极或消极的情感态度,如“高”“小”等,存在于“楼层高”“房间小”等联结中,酒店需要对游客的评价建议酌情采纳.
图2 顾客评价要素和情感指向词关系图Fig.2 Relationship between customer evaluation elements and emotional orientation words
根据《知网-中文信息结构库》情感极性表[19]将情感程度词分为“不满意”“中”“较满意”“满意”“很满意”5类,并作评价要素-情感程度词联结如图3. 从网络结构看,以5类倾向为核心形成以斥力为阻抗的线性分布,5类满意度情感倾向彼此关联度低. 其中,“满意”的度中心性最大,“较满意”的度中心性其次,“不满意”的度中心性最小,顾客对共享住宿产品情感倾向程度适中.
图3 顾客评价要素和情感程度词关系图Fig.3 Relationship between customer evaluation elements and emotional degree words
如图3所示,顾客对风格、装修等要素很满意,对感觉等要素满意,对小区、味道等要素较满意,对采光等要素评价一般,对空调、隔音等要素不满意. 总体来说,顾客对基础设施、装修环境、房主服务、主观感觉、周边交通、房源价格6个要素的情感偏好不同,顾客更容易对基础设施不满意,而优质的房主服务、装修环境、主观感觉能够让顾客给出很满意的评价. 顾客对不同要素有不同的情感偏好说明了顾客对不同要素心理预期的差异,即顾客的需求层次. 相比较而言,对于共享住宿产品,卫生环境是顾客的基本需求,而房东表现及服务和感觉体验是顾客的附加需求.
3.2.3 共享住宿顾客需求层次分析
顾客的底层需求是顾客最低的心理预期,即当顾客的底层需求无法得到满足时,顾客给出差评;而顾客的顶层需求是顾客最高的心理预期,当产品超过顾客的心理预期时,顾客的顶层需求得到满足,顾客会给出超好的评价,因此从“不满意”到“很满意”的5个满意度恰好能反映顾客需求层次从低到高的5个层面. 将归一化处理后的顾客情感程度调整为顾客需求层次,并作顾客需求层次和评价要素关系图,如图4.
图4 顾客需求层次与评价要素关系图Fig.4 Relationship between hierarchy of customer’s needs and evaluation elements
如图4所示,顾客的5个需求层次及其评价要素有明显的分层现象:顾客最低的需求即图中的第一层,主要包括价格、卫生间、隔音、空调等要素;第二层需求主要包括位置、采光、环境等要素;第三层需求包括设计、周边等要素;第四层需求主要包括设施、地点、态度、服务等要素;第五层需求主要包括体验、地段、地理位置等要素. 根据顾客满意度影响要素分类,作顾客需求层次图,如图5.
图5 顾客需求层次图Fig.5 Hierarchy of customer’s needs
顾客的需求层次从低到高依次为:房源价格、基础设施、周边交通/装修环境、房主服务、主观感觉. 共享住宿的房源价格是顾客的最低层需求,说明顾客在选择共享住宿产品时首先看重产品的价格,也可说明大众普遍认为共享住宿是一种中低端的酒店产品,且其目前的定价过高. 基础设施是顾客第二层的需求,包括卫生情况、采光、隔音等,基础设施是满足顾客生理需求的基础,基础设施在顾客需求层次中处在较低层,这与马斯洛需求层次相吻合. 周边交通和装修环境处在顾客需求层次中的中层,虽然周边交通出现的词频数最高,但在需求层次中并不在突出位置. 房主服务和顾客的主观感觉是顾客需求层次的顶层,可视作顾客的附加需求,优质的房主服务能给顾客“超值”的感觉;主观感觉包括直观感觉、体验、家的感觉等,很难将其具体分类,可以理解为共享住宿产品给予顾客整体和谐的感受,因此主观感觉是顾客需求层次中的最高层.
4 结论
本文运用百度AI开放平台对北京市共享住宿顾客满意度及需求层次进行研究,在词性分类的基础上对顾客的网络文本评价作结构分析,得出主要结论如下:
(1)顾客的情感倾向和评价对象呈明显的“核心-边缘”结构. 顾客最容易给出“好”“不错”“热情”“干净”等情感评价,评价对象主要集中于“房间”“位置”等词. 说明与传统酒店比,顾客更关注共享住宿中的周边交通、基础设施和房主服务等内容,而对装修环境、主观感觉和房源价格的关注度较低.
(2)将顾客的情感倾向词根据词性划分为情感指向词和情感程度词. 顾客的情感指向基本围绕基础设施、装修环境、房主服务、主观感觉、周边交通、房源价格这6个方面;顾客的情感程度有明显的“从众效应”. 综合来看,顾客越满意则网络文本评价描述越具体. 在不满意的情况下,顾客通常用“不满意”等笼统的词汇表示不满,而顾客感到满意时,通常使用“热情”“好客”等更具体有指向对象的形容词.
(3)顾客对共享住宿产品需求层次从低到高依次是:房源价格、基础设施、周边交通/装修环境、房主服务、主观感觉. 房源价格是顾客的最低层需求,大众对共享住宿的定位是中低层酒店,而目前部分共享住宿产品定价过高,一定程度影响了顾客的价值判断. 房主服务和感觉体验是顾客的顶层需求,说明相比于传统酒店,顾客对共享住宿产品的服务和整体氛围有更高的预期.
(4)共享住宿改变了传统住宿的消费结构,其成本低、部署快、扩张迅速的特点对传统酒店业造成了一定的冲击[20]. 然而,顾客一方面对共享住宿产品性价比存在追求,另一方面又希望共享住宿提供顶层服务,对共享住宿产品存在“不合实际”的预期,这也导致部分共享住宿产品演变为以“个性化”为噱头的高价低质产品. 对于目前存在的困境,共享住宿产品应在维持好顾客的基本需求的同时,努力提高资源利用率,降低价格和运营成本,增加个性化与定制化服务,在多方面拓宽优势.