APP下载

短租民宿在线评论语义网络及感知维度研究
——基于途家网和Airbnb的文本挖掘

2022-02-12刘云强

资源开发与市场 2022年2期
关键词:途家主题词网络结构

蒋 乾,刘 莎,唐 宏,刘云强

(1.内江师范学院 地理与资源科学学院,四川 内江 641100;2.四川农业大学 管理学院,四川 成都 611130)

在当前大众休闲旅游日渐火热的趋势下,消费者对旅游目的地住宿提出了更加多元化的要求,加之共享经济理念的渗透,短租民宿逐渐发展壮大起来。国务院办公厅在《完善促进消费体制机制实施方案(2018—2020 年)》中明确指出,鼓励发展租赁式公寓、民宿客栈等旅游短租服务。民宿作为一种区别于传统酒店统一化微笑管理与千篇一律标准化布置的新兴业态,吸引着年轻人、家庭、穷游一代与长时间旅行的游客[1]。短租民宿一方面为消费者营造了“家”的氛围,给每种心情找到一个合适的归宿,使旅途更加温馨、熟悉与安心[2];另一方面,为房东与客人提供了共享住宿的机会,增强了主客互动,让陌生人之间的信任度与好感度飙升,在无形中推动了信用社会的健康发展。短租民宿在以独特的住宿体验与差异化的服务满足消费者个性化、多样化需求的同时[3],也盘活了房东的闲置房产资源,提高了资源的利用率,为房东带来了额外的收益,受到了旅游市场的青睐和游客的热捧。同时,短租民宿在带动就业、促进地区经济发展等方面也发挥着不可忽视的作用。

《中国共享经济发展报告(2020)》指出,2016—2019年我国共享民宿收入的平均增长速度是传统住宿业态的5.8 倍;2019 年共享住宿交易规模增长迅猛,达到225 亿元,较上一年增长了36.4%。随着短租民宿的市场认可度和使用率的大幅提升,其成为自由行旅客住宿的首选[4]。从长期来看,短租民宿的潜力将持续迸发。

但面对海量的房源信息,准确掌握消费者需求特征是平台与房东脱颖而出,吸引潜在消费者的关键。在线评论作为平台、房东和潜在消费者的隐形桥梁,为潜在消费者传递出大量有价值的信息,辅助购买决策[5]。环球网2016 年调查报告显示,6%的在线评论可影响将近50%的消费决策,90%的消费者表示购买产品前会浏览在线评论,近半数消费者购买决策依靠评论信息。可见,在线评论信息已经成为影响消费者购买决策的主要因素。同时,在线评论还能为平台和房东提供公开优质的反馈信息。相比市场调研方式,挖掘评论文本信息能够帮助平台与房东更迅速掌握消费者对产品的关注焦点及消费偏好,更准确地预测潜在消费者的需求。同时,有助于他们掌握竞争对手的消费者满意情况,从而有针对性地提高产品与服务质量,提升竞争力[6,7]。因此,识别短租民宿消费者感知维度与传统酒店的异同,研究不同运营模式线上短租平台消费者感知维度的相似性与差异性,可为消费者优化购买决策,为房东和线上短租平台提升房源与服务质量提供有价值的参考。

1 文献综述

1.1 短租民宿的相关研究

学者对短租民宿的研究聚焦于短租民宿对酒店业的影响、消费偏见、信任问题、运营模式等宏观视角。如,Dogru、Hanks、Mody等[8]通过构建回归模型,得出Airbnb房源的增加对酒店业收入、每日房价和入住率都产生了负向影响的结论;Blal、Singal、Templin[9]研究表明,酒店每间可用客房的收益受到Airbnb房源平均价格的影响,Airbnb 细致入微的情景互补与替代效应对酒店销售业绩产生了重大影响;Farmaki、Kladoa[10]与Marchenko[11]分 别 从 房 东 与消费者两方面研究发现,在Airbnb 平台上主客双方对种族与性别均存在偏见;李立威[12]通过对平台、人际关系与产品三层信任的分析,提出制度、信息与交互是三者信任构建与相互联系的主要方式;王家宝、敦帅、薛曼等[13,14]分别对C2C 模式与B2C+ C2C模式的短租民宿商业模式与竞争优势进行了分析;宋琳[15]通过对比不同运营模式短租平台的信任问题,发现C2C 模式的短租民宿存在更大的信任风险。目前,较少有研究从微观视角研究短租民宿消费者行为。如,吴江和靳萌萌[16]采用问卷调查的方式,从任务相关线索与情感相关线索两方面研究了短租民宿房源图片对消费者参与意愿的影响。

1.2 消费者感知维度的相关研究

消费者感知维度的识别方法主要包括主题建模、扎根理论与语义网络分析3 大类。①主题建模。LDA主题模型按照主题的思想识别大规模分散文本数据中潜藏的消费者感知维度。如,Jia[17]使用LDA主题模型识别了中美两国消费者到餐馆就餐的动机,发现中国消费者注重体验,而美国消费者更注重娱乐;Guo、Barnes[18]利用LDA 模型对超过20000 家酒店进行了主题识别,发现客房体验与服务质量是消费者最为关心的维度;董爽、汪秋菊[19]利用LDA模型对我国矿山公园景点的游客在线评论的感知维度进行了主题识别,发现功能客体是消费者主要关注维度。②扎根理论。扎根理论提供了从零碎的非结构化定性文本中分析与归纳现象背后理论的方法与步骤。如,白丹、马耀峰、刘军胜[20]基于扎根理论提取了世界遗产旅游地游客感知评价的32 个二级维度与5 个核心维度;焦彦、徐虹、徐明[21]以点评网站上的分享内容为依据,逐级提炼出游客对商业性家庭企业感知的设施、文化与生活场景3 个维度。③纵观现有关于语义网络的绘制方法,ROST CM 软件是使用最为广泛的工具。如,刘萌王月、陈效萱、吴建伟等[22]采用ROST CM6.0 工具提取蚂蜂窝网上游客对5A 级景区的在线评论主题并构建语义网络,以识别游客感知维度,为游客理性决策提供指标参考;汪会玲和吴梦颖[23]借助ROST CM软件构建了游客对家庭旅馆评论中的关联高频词的语义网络,以识别消费者对家庭旅馆感知的主要侧重点。

1.3 语义网络结构的相关研究

从语义网络结构已有的研究进展来看,网络结构指标包括整体结构指标与个体结构指标两大类。如,Hou Z、Cai F、Meng Y 等[24]从图密度、平均度、网络直径等整体网络结构指标出发,对旅游网站在线评论语义关联网络结构进行了分析;何有世、李金海、马云蕾等[25]以单条在线评论为节点,评论间的语义相似度为链接构建评论网络,基于平均度、平均路径长度与聚类系数3 个整体网络结构指标对在线评论网络的全局统计数据进行了论证;王耀斌、杨玲、孙传玲等[26]从个体网络结构指标出发,借助UCINET软件对旅游网站上甘肃省旅游景区网络游记语义网络的点度中心度、接近中心度与中间中心度进行了度量,以识别旅游资源的吸引力程度;宋振春、赵彩虹、李旭东[27]通过对节点属性中的程度中心性分析了国人对出境游认知的核心要素与要素之间的联系。以上研究都是基于社会网络理论,采用社会网络分析法剖析语义网络结构特征,近年来在社会学、心理学、管理学中得到了较为广泛的运用,不仅在社会关系、空间关联上构建联系,也被用于语义关联关系的测度。

1.4 文献述评

综上所述,国内外学者主要从宏观视角对短租民宿进行了较为深入的研究,但是较少聚焦于微观消费者行为视角,特别是针对短租民宿消费者感知维度的视角。消费者感知维度的研究主要采用LDA主题建模、扎根理论与语义网络分析3 种:LDA 主题模型虽然能够发现评论文本中主题的分布情况,但是在主题词关联关系及可视化方面存在着一定的缺陷[28];扎根理论虽然被一致认为是定性研究与理论构建最科学的方法论,但是解释主义主观性较强的缺点十分明显;语义网络分析主要利用ROST CM 软件,虽然在可视化方面取得了突破,但是对整个网络结构特征及主题社区识别领域仍存在着不足;语义网络结构的研究多聚焦于旅游产品,对短租民宿的研究不足。因此,本文基于两个不同运营模式线上短租平台的在线评论内容,采用定性与定量相结合的研究方法揭示了语义关联网络结构特征与消费者感知核心维度,对比分析了短租民宿与传统标准酒店、不同运营模式短租民宿消费者感知的相似与差异性,基于此,提出平台提升竞争力、吸引消费者的针对性措施。

2 研究设计

2.1 研究框架

为了缓解消费者购买决策面临的巨大感知风险,平台与房东不能准确掌握消费者需求的双重难题,通过网络爬虫获取不同运营模式短租民宿的评论文本,运用定性与定量相结合的分析方法识别消费者感知维度与在线评论语义网络结构特征。一方面,对提取出的主题词进行归类,结合现有关于酒店消费感知维度的研究成果,采用扎根理论编码初步识别民宿与传统酒店消费者感知差异及不同运营模式民宿消费者的关注焦点;另一方面,根据主题词之间的联系,将处理后的评论数据生成语义关联二元共现词组,结合社会网络分析法揭示在线评论语义网络结构特征,并将语义网络可视化,进一步验证扎根理论的分析结果。研究框架如图1 所示。

图1 研究框架Figure 1 Research framework

2.2 研究方法

扎根理论:扎根理论被认为是构建理论最科学的定性研究方法[29]。围绕“民宿消费者感知维度是什么”这一核心问题,本文采用扎根理逐级编码进行了初步探索。运用NVivo10 质性分析软件,通过开放性编码与主轴编码自下而上逐级对感知维度进行归纳分类,最终形成两个线上短租平台消费者感知的主题维度,并初步对比了解短租民宿与传统酒店、不同运营模式短租民宿之间感知维度的相似性与差异性。

语义关联分析法:语义关联分析法利用自然语言处理技术定量测度主题词关联关系及关联程度,相对于传统主题词词频统计方法有更好的文本分析效果[30]。本文使用NLTK 中文语料库中的Bigrams生成语义关联二元共现词组,并统计共现频率,为在线评论语义网络结构特征识别与可视化分析提供数据基础。

社会网络分析法:在测度在线评论主题关联关系的基础上,使用复杂社会网络分析工具Gephi,从整体网络结构指标、个体网络结构指标与模块化3个层面揭示语义网络的结构特征。其中,图密度、平均度、平均聚类系数与平均路径长度揭示短租民宿在线评论语义网络的整体结构特征,度数中心度、中间中心度与接近中心度被认为是个体网络结构的核心指标[31]。模块化用于检测语义网络中的消费者感知核心社区[32],并通过可视化网络图直观展示消费者感知维度,验证扎根理论的分析结果。各指标定义及算法如表1 所示。

表1 网络特征指标Figure 1 Network characteristics indexes

2.3 数据收集

为了比较短租民宿与传统酒店及不同运营模式的短租民宿消费者感知维度的差异,本文选取Airbnb与途家民宿网作为本研究的数据源。其中,Airbnb(https://www.airbnb.com/)是C2C 运营模式的典型代表,支持房东把控房源、自主经营,成为世界上最大的民宿短租提供商[8],其在线评论信息丰富完整;途家民宿网(https://www.tujia.com/)则采取以B2C为主,B2C+ C2C 的混合运营模式,在消费者满意度、市场份额、房源质量与数量等各方面均居国内民宿短租行业首位[14],成为中国本土共享民宿的领军者。根据世界旅游城市联合会发布的《2019 年世界旅游城市及发展排名》,选取北京市、上海市、天津市、广州市、杭州市、重庆市、成都市、西安市、昆明市、青岛市作为途家民宿网的样本城市,New York、London、Los Angeles、Sydney、Miami、Melbourne、Bulgaria、Edinburgh、Chicago、Toronto 作为Airbnb 的样本城市。考虑到评论数据的代表性,本文选取总评论数100条以上的民宿,最后使用网络爬虫提取两个线上短租平台2019 年1 月1 日—12 月31 日的在线评论数据,包括民宿名称、地点、评分、评论内容、时间、评论者昵称等字段,总共得到途家民宿网和Airbnb在线评论数分别为162388 条与94366 条。

2.4 数据预处理

两个线上短租平台收集到的所有评论数据均被进行了预处理,具体步骤包括数据清理、分词、停止词删除和主题词词频统计。数据清理的目的是过滤掉无用的信息,以减少其对分析结果的影响[28]。首先,删除广告和无关文本,确保数据的准确性。其次,同一个用户的重复评论可能会使统计结果产生偏差,因此重复的评论数据将被清除,只保留1 条记录。最后,由于Airbnb 民宿消费者多数直接称呼房东姓名,为确保分析结果可靠,将姓名统一替换为房东。

分词是词汇分析的一种形式,它将文本流分解为关键字、短语或其他有意义的元素[34]。虽然中文词语不同于英文单词,句子中没有明显的空白作为自然分界符[35],因此需要采用中文分词工具对收集到的评论数据进行分词处理。现有的中文分词工具很多,且在不同的文章中都有所应用,如盘古分词[36]、庖 丁 解 牛 分 词 系 统[37]、NLPIR 分 词 系 统[38]、jieba中文分词工具包[39]等。本文中,国内文本挖掘和分析中广泛使用的中文分词组件jieba 被用于提取评论文本主题词。停用词是在句子中起衔接作用,对构成文本意义无实际价值的词语。在分词的基础上,本文结合相关领域比较全面的哈工大扩展停止词表,使用jieba 比较停用词并删除,最终生成主题词列表,并对两个平台在线评论主题词频率进行统计。

3 结果及分析

3.1 短租民宿消费者满意度

评分是衡量消费者满意度最直观的指标,直接影响了消费者点击在线评论进一步了解民宿的意愿。两个线上短租平台的评分均在4—5 分区间内分布。首先,计算得出途家与Airbnb 的平均评分分别为4.91分与4.79 分,表明途家民宿消费者的满意度高于Airbnb消费者的满意度。其次,根据短租民宿的总体评分,分为较满意、满意与很满意3 个维度,4—4.4 分为较满意,4.5—4.9 为满意,5 分表示很满意,并绘制出短租民宿消费者满意度雷达图(图2)。途家消费者对民宿的评分多集中于满意,4.9 分为主,几乎没有较满意的评价,表明消费者不太倾向于对民宿产品打低分[17],民宿产品质量得到认可。Airbnb消费者大部分对民宿表示很满意,但较为满意的评分明显高于途家,导致平均评分略低。这与Airbnb的C2C运营模式相关[15],房源得不到有效监管、民宿质量参差不齐,拉低了消费者整体满意度。消费者个性化的需求也使得同一类民宿产品较难使所有消费者满意,导致民宿评分差异大。

图2 短租民宿消费者满意度雷达图Figure 2 Radar chart of consumer satisfaction of short rent B&B

为了提高消费者对短租民宿的满意度,从而提高平均评分,吸引潜在消费者,需要进一步挖掘消费者的核心感知维度,有针对性地提升房源与服务质量,制定营销策略,满足消费者需求。

3.2 消费者感知维度

主题词统计分析能够发现评论文本中反复出现的实词,但进行简单的频率统计分析忽略了主题词本身的上下文含义与主题词之间的联系[40]。因此,需要对主题词进行分类,以便更准确地了解消费者的感知维度。结合现有研究,对传统标准酒店消费者感知维度的分类标准与民宿“类家性”的特征,借鉴王新歌、虞虎、陈田[41]对游客乡愁文化元素维度构建与刘萌王月、陈效萱、吴建伟等[22]对旅游景区网络舆情指标体系构建的方法,基于扎根理论自下而上逐级归纳短租民宿消费者感知维度,提高分类的准确性和严谨性。编码工作由两名作者独立完成,并在每一步编码结束后对结果进行讨论与修正,先后经过开放性编码与主轴编码两阶段对消费者感知进行分类。

开放性编码阶段:开放性编码包括两个具体步骤:①将原始资料打散,并对现象进行概念化;②对比分析发现概念之间的联系,并对同类概念聚龙进行范畴化。在线评论主题词的提取一定意义上属于开放性编码中概念提取的过程[41]。分别选取频率最高的前200 个主题词导入NVivo10 软件,围绕消费者感知维度这一核心研究问题,将无关主题词剔除,最后分别提取出途家与Airbnb 两个平台180 个与176 个主题词并作为初始概念。结合评论文本语境,反复推敲,不断比较分析概念之间的区别与逻辑联系,将同属性的概念聚为一类并进行范畴化尝试,并建立新的节点,如干净、整洁归属于卫生维度。以民宿与传统酒店消费者感知的相似性与差异性为标准,逐个对主题词进行归类,最后整理出13 个初始范畴:卫生条件、设施保障、性价比、室内环境、服务态度、服务项目、交通、周边、舒适性、满意度、家庭硬件、装修风格、主客互动。其中,家庭硬件、装修风格与主客互动3 个二级维度是区别于传统标准酒店的民宿消费者独特感知。

主轴编码阶段:主轴编码的主要任务是挖掘初始范畴之间的逻辑联系并进一步聚类。本文在开放性编码基础之上通过反复比较,分析了13 个初始范畴间的内在逻辑关系,梳理了新的节点,进一步建立了更大的分类维度。编码过程中发现服务态度、服务项目与主客互动都与房东或管家相关,其中管家主要针对途家托管试房源的入户管理,成为与房东类似甚至更加贴心的房屋保姆。最终13 个二级维度被进一步提炼为民宿、房东或管家、位置与体验4个短租民宿消费者感知一级维度,各维度逐级编码如表2 所示。

表2 消费者感知维度逐级编码Table 2 Level by Level coding of consumer perception dimersion

词的频率高低是衡量词语在文本中相对重要性的指标,出现频率更高的词语代表更令人关注的问题[42]。为了更好地了解短租民宿消费者感知与传统酒店的异同,比较各个维度在两个线上短租平台上的分布差异,本文对两个平台的高频词进行了归类。借鉴Donohue于1973 年提出的计算高频词阈值的方法[43],本文得出高频词与低频词的界限值,计算公式如下:

式中,T是高频词与低频词的界限值,也称为高频词的阈值,表示高频词中末尾一个词的频率;I1是频次为1 的主题词的数量,计算结果见表3。途家民宿网与Airbnb 的高频词阈值分别为189.01 与158.89,对应的高频词数量分别为803 与675。考虑到高频词数量不统一可能会影响统计分析结果,适当扩展主题词数量能有效解决这一问题,因此本文分别选取两个线上短租平台前1000 个主题词来揭示消费者感知维度的分布情况。

表3 消费者感知高频词统计Table 3 Statistics of high frequency words perceived by consumers

2000 个主题词依次被纳入13 个二级维度,由于房东、民宿等主题词不能具体归属于13 个二级维度,因此直接分别归纳到4 个核心维度中;旅行、度假等作为目的的主题词,与消费者民宿感知维度无关,不能笼统纳入各维度中,因此不计算在内。分类完成后绘制感知维度分布差异图(图3),横轴代表各维度高频词在两个线上短租平台中的百分比,百分比数值越大,表明该维度受到越高程度的关注;纵轴则代表消费者的感知维度。

图3 消费者二级感知维度分布Figure 3 Distribution of secondary perception dimensions of consumer

总体而言,无论是途家还是Airbnb 消费者,对短租民宿的感知在80%以上与传统酒店相似,其中房源的整体质量感知占25%以上,是消费者关注的焦点;其次周边环境与交通二级维度占比也较高,表明周边的景点设施便捷程度与交通的通达性是消费者考虑的重要因素。短租民宿消费者感知与传统酒店也存在差异,其中主客互动占比较高,表明相较于消费者与酒店疏远的关系,短租民宿消费者更注重社交功能,更向往真情的交流[44];其次为装修风格,对短租民宿的消费者而言,他们更加追求乡愁情怀,希望在异地拥有家的氛围。

值得注意的是,两个不同运营模式的线上短租平台消费者感知维度也有相似性与差异性。图4 显示,两个平台消费者对位置与体验的关注程度十分相似,对民宿维度的感知最明显,表明途家与Airbnb的消费者均最为关注住宿条件;从分布差异来看,民宿维度在途家占比高于Airbnb,卫生条件、设施保障二级维度是途家消费者对民宿最大的感知。相较于Airbnb,途家民宿消费者更注重“宿”之根源,其分散式酒店管理方式与传统标准酒店更为相似。房东与管家在两个平台上的关注度差异巨大,Airbnb(27.68%)明显高于途家(18.43%)。具体而言,主客互动二级维度在Airbnb 消费者感知中占比最大,这是因为Airbnb 平台C2C 的运营模式使得消费者能够直接与房东互动交流;而途家民宿网采用的是以B2C为主,B2C+ C2C的混合运营模式[15],房源的全托管使得消费者更多接受管家的标准化服务,缺少与房东共享住宿、交流互动的体验。

图4 消费者一级感知维度分布Figure 4 Distribution of consumers first level perception dimensions

3.3 在线评论语义网络结构

评论文本中同时出现的词往往具有某种关联,单纯对文本主题词进行统计难以准确把握消费者的真实感知、各感知维度的内在联系与关联程度。WLTK中文语料库中的Bigrams 被用于生成语义关联二元共现词组,统计共现频率,揭示主题词之间存在的语义关联。本文分别从途家民宿网和Airbnb提取出双词共现短语100 万次与98 万次。为了更好分析主题词之间的语义关联,本文统计了每个平台前2000 组共现词组,其共现频率都在100 次以上,包含了大部分的主题词,能够较好展示消费者的感知维度。表4 展示了每个平台前10 组共现词组。总体来看,两个平台消费者感知维度与传统酒店存在相似性,主要从“房间—干净”“舒服—房间”“很棒—住所”等共现词组中体现。两个线上短租平台消费者感知维度也存在着明显的差异,途家消费者感知维度与传统国内星级酒店更为相似[45],房间的清洁度、设施的齐全性、入住的体验成为途家消费者主要的关注维度;而Airbnb 消费者感知主要集中于房东与住所两个维度,房源质量与房东服务对消费者影响较大。

表4 语义关联二元共现词组统计Table 4 Statistics of semantically related binary co- occurrence phrases

语义关联二元共现词组虽然能够反映词与词之间特定意义上的内在联系,但是不能揭示评论文本更深层次的网络结构关系[46],复杂社会网络分析工具Gephi用于处理前2000 组二元共现词组,将主题词作为节点,主题词的共现频率作为节点之间的关系,由此构建无向的在线评论语义网络。运用统计功能分别测算整体网络结构指标、个体网络结构指标与模块化指数,比较分析两个线上短租平台的语义网络结构。第一,整体网络结构特征测量结果如表5 所示。①图密度与平均度用于衡量在线评论网络主题关系的疏密程度和话题集中程度[28]。途家民宿网的图密度指数(0.094)大于Airbnb 网络密度指数(0.056),表明途家民宿网的在线评论语义网络比Airbnb更密集,主题词之间的关系更密切,有利于更有效识别消费者的需求特征。从平均度指标来看,Airbnb 的平均度(14.546)明显小于途家的平均度(18.866),进一步印证了消费者在途家民宿网的消费需求较为集中,而Airbnb 平台消费者讨论话题表现出更分散的特征,这与消费者个性化的住宿需求相关[45]。②平均路径长度指标用于衡量网络的连通性,聚类系数反应主题的聚集程度与抱团现象,二者共同反应网络的小世界特性[25]。一般认为,当一个网络的平均路径长度小于6,且具有较高的平均聚类系数,则该复杂网络具有小世界属性[47]。两个平台的平均路径长度分别为1.908 与1.943,远小于界限值6;平均聚类系数的取值范围为0—1,测算结果显示途家民宿网与Airbnb 在线评论网络的平均聚类系数分别为0.905 与0.929,均趋近于1,表明主题词周围有较强的聚集性。可以认为,两个在线评论语义网络都具有明显的小世界网络特征,主题之间联系紧密、信息传播效率高,表明细节的满意度能够影响整体满意度,且消费者对民宿消费的满意度易受其他消费者做出的评论的影响。

表5 整体网络结构特征指标Table 5 Characteristic indexes of cverall network structure

第二,个体网络结构指标用于测量节点在网络中的地位与作用。途家与Airbnb 两个平台的点度中心度、中间中心度与接近中心度指标计算结果如表6 所示。由于篇幅限制,本文只展示了前10 个节点的中心度指标。①从点度中心度来看,点度中心度越高,节点所拥有的关系数越多,越处于网络的核心位置[27]。从表6 可见,首先,房间维度在途家的点度中心度最大,处于网络的核心位置;房东和住所两个维度在Airbnb 的点度中心度十分接近且均超过了200,是网络中的双核心主题词,成为吸引消费者的关键。其次,途家在线评论网络中点度中心度超过100 的节点包括干净、房东与住;房间、干净、公寓等在Airbnb网络中也拥有较高的点度中心度,是消费者的次核心感知维度。由此可见,途家与Airbnb消费者感知维度与传统酒店具有相似性,都十分关注卫生条件及住宿体验,不同之处在于房东的服务与互动是吸引民宿消费者的重要属性。从两个平台的差异来看,房东是Airbnb 消费者较为核心的感知维度,而在途家消费者心中却是次要的。②从中间中心度来看,如果网络中很多节点需要依赖某个节点直接或者间接相连,表明该节点起到沟通其他节点的桥梁作用,则拥有较高的中间中心度[31]。表6结果显示,途家的房间节点、Airbnb 的房东及住所节点都表现出极高的中间中心度,对其他节点具有较强的控制力。两个平台消费者均关注民宿的各个维度,表现为房间及住所节点处于中心位置,其他节点散发地分布于它们的周围,与传统酒店消费者感知具有相似性;Airbnb 消费者除了关心民宿各维度,还对房东的各种特征十分在意,于是以房东为中心的话题被广泛讨论,这是民宿消费感知与传统酒店的最大区别。此外,两个线上短租平台中间中心性为0 的节点分别占总节点的73%与77%,表明一半以上的节点对其他节点都不具有控制力。③从接近中心度来看,接近中心度的指标值越大,主题之间联系越密切。途家网路中的房间与Airbnb网络中的房东节点接近中心度都为1,住所在Airbnb的接近中心度也接近1。表明这3 个核心主题几乎与其他主题直接联系,话题主要围绕核心主题展开,便于把握消费者的核心需求。途家与Airbnb 的平均接近中心度分别为0.52 与0.51,表明两个网络主题间的联系程度十分相似;在平均值以下的节点分别占75%与63%,表明仍有大部分主题对其他主题的依赖性较强,受其他主题的控制。

表6 个体网络结构特征指标Table 6 Chacracteristic indexes of individual network structure

第三,模块化指数可以用来检测社区结构,衡量在线评论网络中社区的独立性,一般模块化指标大于0.44 则表明网络社区相对独立[24]。途家民宿网与Airbnb模块化测算结果显示,两个平台的模块化指数分别为0.063 与0.055,明显小于0.44,网络中社区不具有独立性,社区间联系紧密。社区数计算结果均为5,较少的社区数表明消费者对民宿的评论内容较为集中,消费者感知聚集在几个核心话题团体。因此,准确辨识消费者感知核心要素可提升民宿的吸引力。

在统计模块化指数的基础上,为了能区分消费者评论的话题团体,在线评论网络可视化用于以更加直观的方式展现消费者感知维度之间的联系及网络社区关系。模块化将各社区节点采用不同的颜色加以渲染,便于平台管理者和房东快速识别并把握消费者对民宿产品的核心感知维度,从而有针对地提升民宿及服务质量,提高消费者满意度,吸引潜在消费者。途家民宿网与Airbnb 的可视化网络图分别如图5、图6 所示。

图5 途家民宿网在线评论网络可视化Figure 5 Online comment network visualization of Tujia B&B network

图6 Airbnb在线评论网络可视化Figure 6 Online comment network visualization of Airbnb

总体来说,两个在线评论语义网络中的“房间”、“住所”“房东”核心社区表明,民宿与房东或管家是两个平台消费者较为核心的感知维度。具体来说,从民宿消费者与传统酒店相似的感知维度来看。民宿维度上与“房间”“住所”社区相连接的“干净”是最大的子社区,表明消费者对住所的卫生条件十分敏感;“设施”“空调”等关联主题词反应民宿设施保障仍然是消费者的刚性需求。值得注意的是,两个短租平台都出现了以“酒店”为节点的语义网络,这是由于住短租民宿的消费者通常会将民宿与酒店作对比,从而对短租民宿的性价比拥有一个整体感知。体验维度作为“房间”与“住所”的子社区,与民宿维度联系紧密,越满意的体验越能促使民宿消费者表达真实意见,对提升房源的吸引力十分有利。在房东或管家维度上,以房东为核心社区的关联主题词包括“热情”“细心”“行李”等,表明民宿消费者依旧对服务人员的专业化服务态度与提供的各类服务项目诉求强烈。在位置维度上,地理位置的优越性、交通的便捷程度与周边设施的齐全性均是消费者考虑的重要因素。

从民宿消费者区别于传统酒店的独特感知维度来看,主要体现在民宿与房东或管家两个方面。首先,在民宿维度上,与“房间”和“住所”社区联系紧密的“装修”“装饰”等特征词表明装修风格对消费者入住民宿具有巨大的吸引力。其次,从房东或管家维度来看,与“房东”社区连接紧密的“房东—很漂亮”“房东—时尚”等共现短语是对房东外在形象的评价;“姐姐”“哥哥”关联主题是对房东的亲切称呼;“沟通”“感谢”等主题词与房东关联性强,表明消费者期待与房东如朋友般相处。短租民宿提供给房东与客人共享空间的机会,营造家庭氛围,拉近主客关系,从而使陌生人之间的信任与好感上升。

两个线上短租平台对比来看,途家与Airbnb 消费者感知最大的差异体现在房东维度。途家语义网络“房东”社区相对较小,主要包括“服务”“贴心”等体现房东服务态度的关联主题,表明房东不是影响途家消费者满意度的主要因素;而Airbnb“房东”节点最大,并与其他3 个社区联系紧密,以“房东”为中心的主题词主要集中于主客互动方面,分为实际交流经历与交流基础上的个人评价两方面。“沟通”“建议”等关联主题反应消费者与房东真切交流与经验分享的事实,“美丽”“有趣”等特征词表明消费者在与房东交流沟通基础上对房东做出的整体评价。从分析可知,Airbnb 民宿消费者对房东的关注不再局限于对专业素养的评价,更注重与房东的互动性。总体来看,途家民宿消费者感知维度更接近传统标准酒店,而Airbnb 消费者感知更加个性化,更接近共享经济的本质。

4 结论与展望

本文基于途家民宿网与Airbnb 线上短租平台的消费者在线评论文本数据,采用扎根理论初步了解民宿消费者感知维度,运用语义关联分析法与社会网络分析法揭示了在线评论语义网络整体结构特征、个体结构特征与模块化程度,并通过可视化对比分析了民宿消费者与传统酒店消费者、不同运营模式短租民宿消费者感知维度的异同,主要结论如下:①从网络结构特征看,整体网络结构上两个线上短租平台极其相似,主题词之间联系较为紧密,小世界网络特征明显,不仅有利于潜在消费者获取信息,还便于平台及房东识别消费者核心感知维度;个体网络结构上,途家网络中的房间节点与Airbnb 网络中的房东和住所节点均具有高点度中心度、高中间中心度与高接近中心度,处于网络的核心位置,且起到联系其他节点的作用。第三,两个网络的模块化指数均显著小于0.44,网络社区间联系十分紧密,民宿消费者对民宿产品具有较高的认同感,评论质量较高,有助于民宿产品吸引更多消费者。在语义关联网络构建的基础上,未来研究可进一步讨论语义关联网络背后的驱动机制。②从消费者感知维度分析结果来看,短租民宿消费者感知维度与传统酒店既有相似,也存在差异。民宿消费者感知维度在80%以上与传统酒店相似,其中民宿质量是消费者感知的核心,其次为地理位置,差异性主要体现在民宿的装修风格与主客互动性上。从两个线上短租平台消费者感知维度对比来看,卫生条件、房间内部设施、住宿的舒适性与房源位置是两个平台消费者共同关注的维度,不同之处表现在房东或管家维度的感知差异上,途家消费者重视服务态度,而Airbnb消费者更加重视与房东的主客互动性和建立社交关系等。

上述研究结果对平台与房东准确掌握消费者感知维度,从而有针对性地提升房源及服务质量具有一定的参考价值。①在房源质量上,着重改善民宿的卫生条件,及时维护或更新设施设备,提升民宿整体功能性,注重选址地综合优越性是关键。特别是在新冠肺炎背景下,更应注重公共卫生、安全防疫,完善监管机制,重拾消费者信心。②在房东素质方面,对房东综合素质进行考察,采取免费首页推荐等奖励方式与末位淘汰等惩罚措施,吸引真正热爱民宿事业的房东参与进来。③在运营模式方面,面对单纯C2C 模式的信任风险与B2C 消费者共享民宿体验不足的问题,针对不同消费群体的实际情况,实行B2C+ C2C的混合业态十分必要。④在消费者差异化服务方面,实行更加个性化地服务,引入更多不同装修风格的民宿,并根据检索信息,对消费者进行更加精准的推荐。

猜你喜欢

途家主题词网络结构
快递网络结构研究进展
基于AutoML的保护区物种识别①
智能传感器的智慧战略,新技术创造新价值
途家网:旅途中的家
途家2016年又一大并购
基于互信息的贝叶斯网络结构学习
万科牵手途家,尝试管家式服务
非常规突发事件跨组织合作网络结构演化机理研究
取消公文主题词的真正原因是什么?
公文主题词消失的原因浅析