在线评论有用性影响因素实证研究
——基于Tripadvisor.com酒店评论数据
2015-04-13卓四清冯永洲
卓四清 冯永洲
(武汉大学经济与管理学院,湖北武汉 430072)
在线评论有用性影响因素实证研究
——基于Tripadvisor.com酒店评论数据
卓四清 冯永洲*
(武汉大学经济与管理学院,湖北武汉 430072)
随着互联网的迅速发展,消费者购物决策越来越依赖于在线评论。从信息接受模型对信息有用性影响出发,构建在线评论有用性投票增量的时间窗,建立在线评论有用性影响因素模型,研究在线评论内容和评论者对在线评论有用性的影响。基于TripAdvisor.com的4 258条酒店评论数据,运用负二项回归进行实证分析。研究发现评论内容长度、评论极端性、评论有用性投票数、评论者认可度和个人信息披露对在线评论有用性具有显著正影响,这对在线零售商和消费者具有重要的启发和建议。
在线评论;评论有用性;负二项回归;大数据
随着互联网的迅速发展,电子商务凭借其快捷、方便和低成本优势已占据着重要地位,越来越多的消费者通过网上购买商品和服务。基于互联网的高效性、共享性、匿名性等特点,消费者愿意将产品的特征描述、购物后的使用体验发表在博客、论坛或第三方评论网站上,与他人分享商品使用心得,即消费者在线评论。越来越多的人在网络购物时将其他消费者发表的在线评论作为购物决策的重要参考。在线评论作为网络口碑的重要形式,逐渐替代了传统的商品口碑。据德勤咨询调查显示,阅读并发表商品评论的网络购物者占总人数的63%,71%的用户乐意选择购买带有网上在线评论的商品和服务。消费者越来越依赖于在线评论作出购物决策,对产品和品牌的认知态度受到在线评论的巨大影响,在线评论已成为影响消费者进行购买决策的关键因素[1-2]。在线评论不仅能够帮助企业树立良好的品牌形象,也是销售的重要宣传方式。因此,在大数据日趋成熟的时代,对于海量在线评论数据的挖掘和运用,预示着新一波生产率的增长和消费者盈余浪潮的到来。
根据消费者购买决策理论,购物决策过程包括5个阶段:需求认知、搜索信息、评估方案、购买决策和购买后评价。为了减少不确定性,增强购买信心,消费者会尽可能搜索相关的产品信息。但对于海量的在线评论,什么样的评论对消费者购物决策具有参考价值?为了解决信息过载的问题,许多电商和第三方评论网站开发了信息评估系统,消费者可以对在线评论进行有用性投票。例如,每条在线评论后面,TripAdvisor.com会问“这条评论对您有用吗?”,亚马逊还会在评论旁边提供评论有用性的参考信息(如“30/50人认为此评论有用”)。这些有用性投票成为诊断评论信息的指标,作为提示用户过滤信息的信号,以提高用户决策效率[2-4]。
目前,对在线评论有用性的研究存在诸多缺陷。首先,几乎所有研究者将有用性投票数占总投票数的百分比作为有用性的测度标准。但对于只提供了在线评论有用性投票数,而没有提供总投票数的网站则不能用这种方法来度量,以前的研究没有为这种情况构建理论模型来测度和解释有用评论的影响因素。其次,百分比会隐藏一些重要的信息,比如,“50/100人认为此评论有用”和“500/1000人认为此评论有用”应该具有不同的解释。第三,过去的研究大多聚焦于在线评论本身,少有学者将评论内容和评论者结合起来。鉴于此,本文在前人研究的基础上建立了在线评论有用性影响因素概念模型,并基于TripAdvisor.com酒店评论数据,从评论内容和评论者特征两个信息源维度出发,进行实证研究在线评论有用性影响因素。
1 国内外研究综述
1.1 国外研究现状
消费者在购物决策中,如果受到在线评论的影响,则会对商品和服务的原有认知发生改变或者认同,该评论对消费者就具备了有用性。Mudambi和Schuff借鉴信息经济学中搜索型商品和体验型商品范式,建立了在线评论有用性的概念模型,通过对2类6种产品的1 587条评论研究发现,产品类型、评论深度和评论极端性会对在线评论感知有用性产生影响[2]。Forman的研究表明,评论长度对在线评论有用性具有正向影响,搜索型商品比体验型商品这种影响作用更强[8-9]。Korfiatis发现,评论极端性与有用性呈正相关关系,尤其是对于体验型商品,评论极端性的影响更为明显[10]。Ghose和Ipeirotis采用文本挖掘方法和回归统计技术,将评论类型作为调节变量,并把评论文本的可读性、极端性和评论发表时长作为模型的影响因子,运用计量经济学的方法建立回归模型,预测文本的有用性[7]。
Forman和Ghose研究亚马逊网站上的评论发现,在线评论的发布者提供的与自己身份有关的信息,可作为消费者购买决策和评估有用性的补充信息,在线社区中的消费者对包含评论源身份信息的评论有较高的评价,消费者非常注重评论信息发布者的特征[8]。Pan Yue等人发现评论者的特征对评论有用性也有影响。评论者暴露越多有关个人的信息,其评论对其他消费者购物决策的影响越大[9]。
1.2 国内研究现状
彭岚等人从传播说服理论的视角构建在线评论有用性影响因素模型,他们从信息本身、信息发送者、信息接收者和信息反馈4个维度出发,发现评论等级、好评率、评论长度和互联网使用经验对在线评论有用性具有重要影响[11]。郝媛媛在改进Ghose等人研究的基础上,把研究对象锁定在体验型商品领域,以影评数据为对象研究在线评论有用性的影响因素,发现评论长度和评论发表时长对评论有用性具有正向影响[6]。祝珊以社会网络理论为基础,利用社交网站上的在线评论数据,研究了评论内容和评论者对在线口碑的有用性影响,发现评论极端性、评论长度、评论者受关注度和历史评论数量对在线口碑有用性具有重要影响[12]。
2 理论模型与研究假设
2.1 理论模型
根据Sussman和Siegal提出的信息接受理论模型(图1),信息内容质量和信息源可靠性是影响消费者对在线评论感知有用性的直接因素[14]。由于在线评论具有匿名性,信息内容质量和信息源可靠性是减少消费者感知风险的关键因素。
图1 信息接受模型
消费者作出购物决策前处于信息不对称的条件下,通过阅读在线评论以获取关于商品和服务的信息,从而来减少决策风险和损失,这构成研究在线评论有用性影响因素的逻辑起点[5,13]。通过对前人研究的总结,本文考虑评论内容和评论者特征,构建了在线评论有用性影响机制模型(图2)。该模型主要考虑了评论内容方面的评论长度、评论极端性和有用投票数的影响,以及评论者的个人信息披露和评论者认可度两个方面。
图2 在线评论有用性模型
2.2 研究假设
2.2.1 评论内容特征
消费者在线评论包含数字评论和开放式文本评论。开放式文本评论是评论者购买使用商品或服务后对该产品的语言描述、用户体验或购买建议。此外,在线评论系统也提供了以星级(1~5星)的形式给产品或服务评分,将评论分为5个星级。低星级评分(1星)代表对商品或服务的极端差评,高星级评分(5星)代表对商品或服务的极端好评,3星为中性评论。张小泉等研究了评论效价和评论长度对在线评论有用性的影响,表明评论效价和评论长度对在线评论有用性具有显著正影响[9,19]。消费者可以通过评论评分来直接判断商品好坏,以此减少不确定性,增强购买信心[2,16]。星级评分代表了消费者对产品或者服务的总体态度,在一定程度上反映了在线口碑的评论效价[20]。评论长度能够增强信息的诊断性,在线评论越长,消费者在不需要花费额外的时间和物质成本情况下,能够获得更多的商品信息,在线评论的感知有用性就会更高。Mudambi和Schuff认为信息深入性能够增强消费者的信心,从而促进消费者的购买决策过程[2]。根据马太效应,当一个评论获得较多的有用性投票时,那么它后续获得有用性投票数的可能性更大。因此作出如下假设:
H1a:评论长度对在线评论有用性具有显著的正影响。
H1b:评论极端性与评论有用性正相关,极端评论比中性评论更有用。
H1c:评论的有用投票数对评论有用性具有显著正影响。
2.2.2 评论者特征
根据信息接受模型,评论者提供的有关个人信息也会影响消费者对产品或服务的评估[9]。传统的社交是熟人间面对面的交流,建立在相互信任的基础之上。在虚拟的网络环境下,消费者之间通常都是陌生人,只能根据评论者发出的信息和暴露的个人信息来判断信息真实性。评论者提供的个人信息越充分,该评论者暴露商品有用信息的可能性就越大,有利于消费者作出准确的购物决策[9]。评论者将个人信息展示出来,可以给消费者更多的信息,让消费者从信息源上建立自信。评论者评论数量也是衡量其评论经验的指标,参与评论的数量越多,网购经验越丰富,其发表的评论会更加专业,从而得到更多的消费者认可。基于社会心理学,Forman研究了评论者个人信息暴露,如真实姓名和住所对其在同行中的认可度的影响,以及个人信息暴露和评论效价对有用性的交互影响[8]。本文对评论者的两个重要特征做出如下假设:
H2a:暴露个人信息的评论者发表的评论有用性更高。
H2b:评论者的评论认可度与在线评论有用性显著正相关。
3 研究设计
3.1 数据收集
为验证上述模型和研究假设,本文以TripAdvisor.com上的酒店在线评论作为研究对象。首先,TripAdvisor.com是全球最大的旅游网站,拥有超过1 000万的注册会员以及15 000多万条评论,可以得到大量的评论数据,保证对海量数据的需求。其次,作为第三方评论网站,旅行者的真实评论是其最大特点,从而保证在线评论数据的质量和真实性,以便得出科学研究结论。
通过LocoySpider从网站上获取相关数据,为了计算有用性投票数的增量,让设计科学合理、数据收集分为两个阶段。第1个阶段(2014年9月),收集了需要的所有相关指标,每条评论数据都包含以下变量:(1)星级评分:消费者对产品的星级评分(1~5星);(2)评论长度:评论文本的字数;(3)有用投票数:该条评论获得有用性投票数;(4)每条评论的评论者年龄和性别(如没有则为0);(5)每个评论者的总评论数量和总计有用性投票数量;(6)每条评论发布的时间。第2阶段(2014年10月),收集了第1阶段已经得到的评论对应的有用性投票数。
3.2 变量设计
3.2.1 因变量
TripAdvisor.com对每一条评论后面的问题“这条评论对您有用吗?”提供了一个选项“Yes”,统计了在线评论的有用性投票数量。有用性投票数在某种程度上反映了在线评论的感知有用性,但是不能直接用来衡量评论的有用性。因为评论发布的时间会影响有用性投票数的绝对量,而且有用投票数是一个长期投票的累积量,不能用来衡量评论在短期的有用性[7]。所以,采用两个阶段的有用投票数的差值,即有用投票数在同一段时间内的增量作为因变量。
3.2.2 自变量
解释变量包含评论内容特征和评论者特征两个部分。评论长度表示评论文本的字数。评论极端性用消费者星级评分来测度,为检验H1b中评论极端性的影响,我们设置了评分和评分的平方项。有用性投票是指我们第一次抓取数据时,每条评论得到的有用性投票数。评论认可度是指评论者所有评论得到的有用性投票数之和占该评论者总评论数的比,它表示评论者发表评论被消费者认可有用性的大小。评论者个人信息披露是指评论者是否将自己的年龄或者性别公开,它是个虚拟变量,评论者披露了个人的年龄或性别的赋值为1,反之赋值为0。通过数据清洗,得到了204家酒店4 258条有效评论。
3.2.3 控制变量
在实际中,评论的发布时间会对评论有用性投票产生影响,进而影响评论的有用性。评论发布的时间越早,得到的绝对有用投票数越多,而有用投票数的增量越少。因此我们将评论的暴露时间作为控制变量。
3.3 分析方法
本文运用负二项回归对模型进行估计。负二项分布是统计学上的离散概率分布,它表示一个事件在伯努利试验中出现的概率为P,在一系列独立的伯努利试验中,事件刚好在第r+k次出现r次的概率为
x=r,r+1,…,其中r为一个固定的整数。
负二项回归适合用来拟合离散的计数数据,要求数据的方差大于条件均值。通过比较负二项分布和样本数据分布特征,运用负二项回归比较理想,尤其当观测数据中具有较多的0时,用负二项回归来拟合模型更加合适。一方面,运用负二项回归是由数据特征决定的,有用性投票数是消费者感知有用性投票的累计结果,是一个计数数据。其次,因变量包含了大量的0值(见表1),负二项分布能够修正0值的影响效果。此外,尽管我们基于大数据选择了一个大样本,潜在的选择性偏误仍然可能存在[2]。因为TripAdvisor.com没有显示有多少人浏览过该评论,它仅提供了得到有用性投票的那部分数据,运用OLS估计就会存在较大偏误。具体的回归模型如下:
Helpfulness(ΔHelpfulVotes)=β1ConsumerRating+β2ConsumerRating2+β3ReviewLength+β4HelpfulVotes+β5InformationDisclosrue+β6PeerRecognition+β7ExposureTime+ε
4 模型估计和结果分析
4.1 描述性统计分析
变量描述性统计分析结果显示(表1),绝大多数有用性投票数增量(因变量)为0,平均增加的有用性投票数也接近0,但最高也可以达到6。有用性投票数均值不到1,而最大值为11,说明很多评论没有得到有用性投票,有些评论得到了较多有用性投票,表明大多数消费者并不热衷于对在线评论的有用性投票,只有当评论对其特别有价值的情况下才会投有用票。消费者评分的均值、第一四分位数和中位数都在4附近,表明大部分消费者倾向于给高分。平均评论长度为152,最大值可达到3 425个字数。评论者信息披露的均值为0.68,表明披露个人信息的评论者和没有披露个人信息的评论者各占68%和32%,更多的人乐意将自己的个人信息公开。评论者发表评论的认可度最小为0,均值为0.67,说明大部分评论者发表的评论得到消费者认可的较小,有的评论者根本没有被消费者认可,最大值为18.34,表明有的评论者发表的评论得到大多数人的认可,并给予了很高的评价。
表1 变量描述性统计分析结果
变 量最小值均 值最大值因变量00.086消费者评分1.004.025.00评论长度261523425有用性投票数00.6311个人信息披露00.681评论认可度0.000.6718.34暴露时间1188274
4.2 回归分析
回归分析结果表明(表2),模型中的参数都具有较高的显著性水平。模型的拟合优度R2为0.467,调整R2为0.482,与同类研究相比,模型的拟合结果较好,表明模型能够在很大程度解释在线评论有用性影响因素。
表2 回归分析结果
注:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1 ‘’1
4.3 结果分析
从表2中发现,评论长度具有较高的显著性水平(p=0.0029),证明评论长度是影响在线评论有用性的重要因素。其参数为正(β3=0.0007),说明评论长度对在线评论有用性具有正向影响。消费者评分和消费者评分的平方项都通过了显著性检验,且具有较高的显著性水平。消费者评分的平方项系数为正(β2=0.234),说明该影响是一个“U”形关系,表明极端好评和极端差评比中性评论的影响作用更大,充分证明了原假设。评论有用性投票数也通过了显著性检验(P=1.19E-05),其参数为正(β4=0.172),表明评论已经获得的有用性投票数对后续消费者的有用性投票会产生影响,该评论持续获得有用性投票数越多,后续感知有用性也会相应提高。评论者个人信息披露估计参数为正(β5=0.002),说明个人信息披露会对评论有用性产生正向影响。评论者的评论认可度具有较高的显著性水平(P=0.007),该参数为正(β6=0.108),对在线评论有用性具有较大的正影响。
评论暴露时间也具有较高的显著性水平,其参数为负(β7=-0.015),说明评论暴露的时间对有用性也会产生影响,评论暴露的时间越长,其后续获得有用性投票会越少,随着时间的推移,评论有用性呈现出衰减的状态。研究假设检验结果见表3。
表3 假设检验结果
5 总结与展望
5.1 研究结论
本研究在大数据的背景下展开,通过构建多元回归模型进行实证分析,发现在线评论内容和评论者的特征是在线评论有用性的根本影响因素,最终得到以下结论:
5.1.1 评论内容本身特征影响在线评论有用性
评论长度与评论有用性正相关,评论长度越长,消费者对评论的感知有用性就越高;评论极端性与在线评论有用性显著正相关,极端好评或极端差评比中性评论更有用;评论的有用性投票数对评论有用性具有显著正影响,消费者对评论的感知有用性受到评论已经获得的有用性投票数影响,消费者对有用性投票数较多的评论认可度较高。
5.1.2 评论者的特征是在线评论有用性的重要影响因素
评论者认可度与评论有用性正相关,其发表的评论被同类消费者感知有用性程度越高,该评论者的评论更有用;评论者个人信息披露与评论有用性相关正相关,有个人信息披露的消费者评论有用性更高。
5.2 启示和建议
首先,在线零售商应该合理设置在线评论系统,引导消费者撰写有价值的评论[17,21]。在线评论系统可以用来提升消费者购物经验和增强公司的盈利能力。有用评论将帮助企业和零售商增加销售和提升品牌形象。由于评论长度对在线评论有用性具有正面影响,企业和零售商应该完善在线评论系统,让消费者的评论更加详细。其次,在线零售商应该鼓励消费者对其认可的评论进行投票,有用性投票数通常是消费者衡量评论有用的直接指标,有用性投票数将会影响消费者对评论的感知有用性,也对后续消费者阅读评论产生影响。第三,在线零售商不必对负面评论产生恐惧,极端评论,包括极端好评和极端差评,都被消费者认为具有较高的有用性。负面评论的存在让消费者会更加相信在线评论的真实性和客观性。
对于消费者而言,在识别有用评论作为购物决策参考时,不仅要关注评论内容本身,还应当参考评论发表者的特征。消费者应该选择那些较长的和消费者认可度较高的评论者发表的评论作为参考,尽量不要参考那些中性评论,极端评论比中性评论价值更高。其次,评论者的个人信息披露情况也是筛选有用性高的评论的参考标准,个人信息披露越完善的评论者发表的评论更可信。通过筛选有用的评论,能够提高购物决策效率,减少搜索成本,增强消费信心。
5.3 研究局限和未来展望
在研究过程中,对构建模型、理论支撑选择、数据收集和模型估计都进行了严格控制,但是仍然存在一定局限性。首先,解释变量仅考虑了评论的数字指标,没有考虑评论文本的影响,有研究表明文本可读性和主观性对在线评论有用性具有重要影响[15,18]。因此,未来的研究可以将数据挖掘和文本挖掘的方法相结合。其次,研究结论基于消费者对评论的有用性投票得到,没有测度那些没有进行有用性投票和认为评论不具有有用性的在线评论。
[1]Chevalier J A,Mayzlin D.The effect of word of mouth on sales:Online book reviews[J].Journal of Marketing Research,2006,43(3):345-354.
[2]Mudambi S M,Schuff D.What makes a helpful online review?A study of customer reviews on Amazon.com[J].MIS quarterly,2010,34(1):185-200.
[3]Ghose A,Ipeirotis P G.Estimating the socio-economic impact of product reviews:Mining text and reviewer characteristics[J].NYU Stern Research Working Paper CeDER,2008,18(7):48-56.
[4]Willemsen L M,Neijens P C,Bronner F.“Highly Recommended!”The content characteristics and perceived usefulness of online consumer reviews[J].Journal of Computer-Mediated Communication,2011,17(1):19-38.
[5]刘送英.在线顾客评论有用性研究[D].泉州:华侨大学,2011.
[6]郝媛媛,叶强.基于影评数据的在线评论有用性影响因素研究[J].管理科学学报,2010,19(8):78-88.
[7]Archak N,Ghose A,Ipeirotis PG.Deriving the pricing power of product features by mining consumer reviews[J].Management Science,2011,57(8):485-509.
[8]Forman C,Ghose A,Wiesenfeld B.Examining the relationship between reviews and sales: The role of reviewer identity disclosure in electronic markets[J].Information Systems Research,2008,19(3):291-313.
[9]Pan Y,Zhang J Q.Born Unequal:A Study of the Helpfulness of User-Generated Product Reviews[J].Journal of Retailing,2011,87(4):598-612.
[10]Korfiatis N,García-Bariocanal E,Sánchez-Alonso S.Evaluating content quality and helpfulness of online product reviews:The interplay of review helpfulness vs.review content[J].Electronic Commerce Research and Applications,2012,11(3):205-217.
[11]彭岚,周启海,邱江涛.消费者在线评论有用性影响因素模型研究[J].计算机科学,2011,32(8):205-207.
[12]殷国鹏,祝珊.网络社区在线评论有用性影响模型研究——基于信息采纳与社会网络视角[J].图书情报工作,2012,(16):140-147.
[13]殷国鹏.消费者认为怎样的在线评论更有用?——社会性因素的影响效应[J].管理世界,2012,(12):115-124.
[14]Sussman S W,Siegal W S.Informational influence in organizations:an integrated approach to knowledge adoption[J].Information Systems Research,2003,14(1):47-65.
[15]Ngo-Ye T L,Sinha A P.Analyzing Online Review Helpfulness Using a Regressional ReliefF-Enhanced Text Mining Method[J].ACM Transactions on Management Information Systems,2012,3(2):1-20.
[16]Poston R S,Speier C.Effective use of knowledge management systems:a process model of content ratings and credibility indicators[J].MIS quarterly,2005,29(2):221-244.
[17]郭林方.影响在线评论有用性的相关因素研究[D].大连:东北财经大学,2012.
[18]Ghose A,Ipeirotis P G.The EconoMining project at NYU:Studying the economic value of user-generated content on the internet[J].Journal of Revenue & Pricing Management,2008,37(16):241-246.
[19]Walther J B,Liang Y J,Ganster T.Online reviews,helpfulness ratings,and consumer attitudes:An extension of congruity theory to multiple sources in Web2.0[J].Journal of Computer Mediated Communication,2012,18(1):97-112.
[20]Klionsky D J,Abdalla F C,Abraham R T,et al.Guidelines for the use and interpretation of assays for monitoring autophagy[J].Autophagy,2012,8(4):445-544.
[21]Zhu F,Zhang X.Impact of online consumer reviews on sales:The moderating role of product and consumer characteristics[J].Journal of Marketing,2010,74(2):133-148.
(本文责任编辑:孙国雷)
Empirical Study of Online Consumer Review Helpfulness Determinants——Based On Hotel Review Data of Tripadvisor.com
Zhuo Siqing Feng Yongzhou*
(School of Economics and Management,Wuhan University,Wuhan 430072,China)
With rapid development of the Internet,consumers have increasingly relied on online reviews prior to making purchase decisions.This paper discussed the determinants of helpfulness of online consumer reviews from the perspective of information adoption model.By designing time window of helpful votes and building concept model of review helpfulness,the paper mainly discussed the influence of review content and reviewers’ characteristics on review helpfulness.Based on 4258 hotel review data of Tripadvisor.com,the paper did empirical analysis by using negative binomial regression.The results found that review length,rating extremity,number of helpful votes,peer recognition and information disclosure have significantly positive influence on review helpfulness.The conclusions would give some important implications and suggestions for both online retailers and consumers.
online reviews;review helpfulness;negative binomial regression;big data
2014-12-04
卓四清(1965-),男,副教授,研究方向:管理科学与工程和数据挖掘。
冯永洲(1989-),男,硕士研究生,研究方向:管理科学与工程和数据挖掘。
10.3969/j.issn.1008-0821.2015.04.011
F724.6
A
1008-0821(2015)04-0052-05