信息视角下网络商品评论国内外研究综述
2017-08-25王倩倩潘雪莲
王倩倩+潘雪莲
[摘要]网络商品评论对于消费者决策以及商家收集反馈信息有着非常重要的价值和现实意义,如何对现有文献进行梳理是深化网络商品评论的关键问题。对近年来发表的国际权威文献进行梳理,通过关键词聚类以“数据流”、“信息流”、“知识流”为主线,深入解析网络商品评论的研究进展,并提炼出网络商品评论研究的焦点和重心,归纳出“评论传播”、“评论挖掘”、“评论使用”、“评论评估”四个层面的研究单元,并提出未来可在弹幕评论、图片挖掘、协同购物、评估分类等领域展开更多的研究。
[关键词]网络商品;在线商品评论;评论传播;评论挖掘;评论使用;评论评估;综述
前人按照评论对象将网络评论分为了四类:新闻评论、图书评论、影视评论和网络商品评论Ⅲ。笔者认为只要评论对象是通过网上交易得来的,均在网络商品评论的范畴之中。因此,网络商品评论就是指在网络环境下消费者对所购买的商品发表的观点性的文本陈述。网络商品评论作为一种新型的口碑传播方式,对消费者了解商品和服务,对商家改进商品,提升用户满意度都具有非常重要的作用。国际著名市场研究公司Jupiter Research的调查分析显示:超过75%的消费者在线购买商品前会参考互联网用户所写的产品评论信息。2008年以后随着淘宝网、京东、苏宁易购等各种电商网站的大量崛起,越来越多的非结构化数据、异构内容、个性化、网络化的评论文本为学界和业界带来了更多的机遇和挑战。
尽管相关领域的研究非常丰富,尤其自2010年起有关网络商品评论的文献数量大幅增加,但由于存在多种平台、不同类型的评论以及多种研究方法,产生了很多碎片化的研究。这些研究主要集中在评论的有用性、评论挖掘以及评论检测等方面。这些研究虽都取得了令人瞩目的成果,但把网络商品评论作为一个整体进行分析的文献并不多见。因此,更换一下研究的视角,笔者发现尚存在其他深入挖掘的空间。笔者回溯国内外网络商品评论的相关文献,以信息视角为主线,拟归纳出网络商品评论的研究单元,分析国内外网络商品评论的研究进展,拟指出其中存在的问题并给出未来的研究方向。
1研究方法和框架
为深入了解国内外的研究进展和尽可能全面的搜索相关的文献,本研究主要搜索“web of science”和“中国知网”两个数据库,搜索的英文期刊主要有:Management、MisQuarterly、Information Systems、Tourism Management、Journal of Consumer Studies、Journal of MarketingManagement Research、Decision Support Systems、Electronic Commerce Research等;搜索包含“e-WOM”、“online word of mouth”、“online reviews”、“productreviews”、“online consumer reviews”的关键词。中文文献的搜索主要集中在以下期刊:情报学报、中文信息学报、软件学报、情报杂志、情报科学、现代图书情报技术、管理科学学报等,搜索主题包含“网络商品评论、网络口碑、在线商品评论”等关键词,并对收集到的文献进行筛选,最终得到168篇英文文献和178篇中文文献。
尽管网络商品评论的研究有着强烈的跨学科、跨领域的特性,但许多研究重心和焦点可能是学者们共同关注的。笔者从收集到的文献中提取了752个关键词,通过对关键词的清洗和预处理,最終确定了538个关键词作为分析基础。通过BlueMC在线数据分析软件,将538个关键词取TOP100,拟通过关键词的聚类分析挖掘网络商品评论研究的重点。绘制了标签云团如下图1所示。
笔者在分析后将这些关键词聚类为4个层面:①评论传播(包括评论的发表、转发、追加等)②评论挖掘(包括特征词提取、情感判断、情感强度等)③评论使用(评论的搜索、阅读、回复)④评论评估(给评论打分,投票、排序等)。从第一个层面到第四个层面经历了数据流、信息流、知识流这样一种过渡和衔接,具体如下:
1)将网络商品评论作为一种参与社会交换的物质视角(数据流)。按照社会交换理论,发表和传播口碑除了服务社会以外,评论发布者还期望获得一种声誉、地位、愉快等的交换。发布网络评论者为网络用户提供商品信息和购物体验,是在相互传递和交换信息的过程中形成的一种无形的数据交流网。
2)将网络商品评论作为一种信息流。社会网络是由代表个体参与者的节点和代表连结参与者的社会关系的图表组成,信息流发生在一个项目通过关系图从一个节点传递到另一个节点中。电子商务市场是由卖家信息流、买家信息流、信誉机制信息流(包括网络商品评论的信息流)、资金流、物流等组成的,这些信息流的流通和共享使得电子商务市场有序的运转下去。
3)将网络商品评论的研究看作是客户知识的管理研究(知识流)。网络商品评论表达了消费者的使用感受,传达出潜在客户的需求,成为一种关键的战略资源和竞争要素,是一种重要的客户知识来源。通过对网络商品评论的研究可以很好地发掘潜在客户的需求,了解客户知识的产生、客户知识处理以及客户知识的信息化管理等问题。
故本文将网络商品评论的文献分为“评论传播”、“评论挖掘”、“评论使用”和“评论评估”4个层面,具体研究思路如下图2所示:
2主体内容
2.1评论传播
评论传播在本研究中指的是评论的发表、转发和追加。目前对于评论传播的研究大多集中在对评论动机的研究。本研究对网络商品评论动机的文献进行梳理,根据评论的内在属性可以分为两类:①正面口碑的心理动机。消费者传播正面口碑的心理动机,即为了展现他们满意的购买或者无私地与他人分享自己的专业知识,获得社会认同以及自我认同,网上评论可作为消费者展现他们的专业知识和社会地位的方式。②负面口碑的心理动机。有研究发现消费者之所以散播负面口碑,或是出于发泄敌意,或是为了寻求报复。
从评论的外在属性来看,影响评论传播的因素有四类:①产品因素。产品质量的好坏、产品的使用体验、产品使消费者满意的程度都是用户参与评论的直接原因。有学者调查了德国消费者参与网络产品评论的状况,强调了消费者愿意评价的原因主要是情感释放,特别是对商品质量、商品使用情况不满意的抱怨。②商家因素。商家的态度和服务可以对评价的结果产生重要影响,甚至可以改变消费者原本的评价动机。商家的激励措施也是促进消费者进行网络商品评论的主要动机,如果发布网络商品评论能够获得奖励、商品价格折扣,消费者表示更愿意主动地、积极地进行对商品进行评价。③自我主义。无论是传统环境还是网络环境下,自我意识、希望获得尊重、希望自我实现都是消费者进行网络商品评论的重要原因。有研究表明提升自我形象、社区兴趣、情感分享、信息回报这几种因素对消费者参与网络商品评论发表行为有着显著影响。④利他主义。有学者通过问卷调查分析了消费者参与网络商品评论的利他主义动机有:乐于分享、知识贡献、提醒和忠告、助人为乐4个测度项目。
2.2评论挖掘
对用户发布的网络商品评论进行数据挖掘和分析,可以更好地理解用户的行为,为政府、企业或其他潜在消费者在决策时提供重要依据。笔者对文献梳理发现网络商品评论挖掘方面的研究主要集中在特征词挖掘和情感倾向性挖掘两个方面。
2.2.1特征词挖掘
从网络评论中挖掘出产品特性词已经成为评论信息发掘和语言处理两个领域的热门话题,其中最具代表性的是Hu和Liu提出的超越传统评论信息挖掘的方法。特征词的挖掘可以分为自动方法和人工方法。人工提取方法就是针对该领域的产品建立属性特征词表,邀请该领域的专家对产品的属性特征进行定义。比如以电影评论为挖掘对象,找出电影的产品特征属性;或者采用词性标注的方法,选取出频繁特征集来确定产品特征。人工挖掘的工作难度和工作量较大,产品属性的可移植性较差。如果更换了文本语料库,那么又需要聘请专家再次进行挖掘,重复利用率低。自动提取方式是指通过对计算机输入指令和程序,通过软件进行词性标注、句法分析等自然语言处理技术对产品评论中的语句进行分析,从中识别产品属性。其中精准度较高的是Popescu等的研究,他们利用Konwitall系统自动生成的鉴别短语和提取词的PMI值,根据贝叶斯分类筛选出产品的属性特征词。自动提取产品特征词的优点是计算速度快,节约人力,但是提取出的属性精准度不高,因为目前的评论大多是非结构化的自然语言,而计算机很难像人的大脑一样通过语义进行判断。
2.2.2情感倾向性挖掘
情感倾向性挖掘的目的是判断一些主题或整个评论文档的上下文极性或判断评论者的态度是支持还是反对。Titor等人利用已知的产品特征,将特征作为评论文本的主题,再对每个主题赋予一个情感标签,得到“my soup wascold”,“The chicken is great”鸡汤“冷”、鸡肉“好”这样的情感词;也有研究者利用窗口概念,以主观情感词为中心,凡是在窗口中的名词和名词性短语都被认为是产品特征词。这两种方法无论是用特征词找情感词,还是用情感词来找特征词,都能得到较为满意的结果。我国的郝媛媛,邹鹏和李一军等对影评研究也具有一定代表性,他们利用面板数据(Panel data)能够很好控制不可测因素和随时间变化的优点,根据数字评分等级对评论文本的倾向性进行分类,提高了情感分类的合理性和准确性,在国内引起很大反响。
总之,网络商品评论挖掘的核心问题在于评论对象的特征词挖掘和情感倾向性判断。目前的研究虽取得了可喜的进展,但是现有的机器学习、语义分析等技术还不能够做到完全精确。中文的情感倾向分析技术发展相对比较滞后,目前主要集中在网络舆情的监测预警方面。
2.3评论使用
对评论使用的研究文献进行梳理发现,研究主要集中在两个方面:一是消费者为什么要使用网络商品评论;二是消费者在使用商品评论时有何影响。因此,本研究从这两个方面进行梳理:
2.3.1使用动机
根据目前的研究,网络商品评论的使用动机指的是参与搜索查看网络商品评论的动机,主要集中在以下几个方面:①获取购前信息。消费者在该市场中会自发地寻求信息,更主动咨询有经验的购买者,获得更加具体完整的产品信息以消除对市场和产品的不确定性,降低购买风险。②购后了解产品。在消费者购买行为结束以后,可能在使用产品的过程中出现一些问题,有些消费者通过查看评论内容以找到问题的解决办法,或者希望通过网络商品评论来查看其他消费者是否也遇到类似的问题,印证自己选择的正确性。③参与社交。网络购物环境也是一个社会网络,在该网络中,网络的节点处会有一些活跃的评论者对网络起到很好的链接作用。优秀的评论者懂得参与网络商品评论也是虚拟社区知识共享的过程,渴望参与社交、建立社交地位是有些消费者积极搜索评论、回复评论、给评论打分投票的重要动机。④经济因素。使用和搜索网络商品评论有利于消费者比较价格、降低购买成本、降低感知风险和提高议价能力。
2.3.2使用影响
网络商品评论使用最直接的影响就是商品的销量,经过文献调研发现,研究的重点有以下几类:①产品类型的中介调节作用。网络商品评论对销量的作用在电子科技产品中影响最大,对于保险、理财等产品的影响则较小,因为这些产品必须线上和线下相结合,而且受到地域的限制,因此这些类产品的销量更容易受到传统的口碑的影响,人们更倾向于听从朋友和家人的推荐。②产品的热门程度。网络商品评论对销量的效用還受到热门产品和非热门产品的影响,例如,网络商品评论对销量的效用根据图书的热门程度不同而不同,以此为商家的营销和管理提供建议。③时间的调节作用。基于在线产品评论数量和票房收入的研究发现,在线产品评论数量和票房收入都对在线产品评论数量产生影响,同时网络商品评论数量的增加反过来又会增加电影的票房收入,两者之间是相互影响的,但这种影响仅仅在前几周,特别是对刚开始几周的票房有显著影响。
网络商品评论除了影响着商品的销量外,也影响着消费者的感知和购物过程。研究认为先前消费者发表的网络商品评论信号比来自商家提供的商品信号更可靠,感知有用性更大。Mudambi和schuff的研究表明,网络商品评论影响着消费者购买的全过程(查看网络商品评论阶段、选择产品和购买决定阶段以及购后行为阶段)。
2.4评论评估
笔者从大量文献中了解到,学者们进行评论评估的目的主要是对评论信息质量的评估,是在一定范围内量化评论的质量或根据质量对评论进行分类,或研究影响评论质量的因素,并在此基础上对评论进行过滤、排序、识别等研究操作。因此,对于评论评估的研究主要集中在两个方面.一是评论信息的有效性;二是评论信息的可信性。
2.4.1有效性
有效性指网络商品评论提供的信息量可以给人以参考,从中获得有助于自己决策的信息。目前学者们对于有效性的研究主要集中在以下两个方面:
1)评论本身对有效性的影响
有观点认为网络商品评论中如果提到的商品关键词较少,则对消费者的购买决策没有帮助。因此,有学者从“相关性”和“体验性”这两个指标进行分析:评论的相关性主要考虑评论者的评论内容是否涉及到产品和卖家的主要特征;评论的体验性主要考虑评论者是否具有丰富的网购经验、是否使用过产品、是否客观无矛盾地进行了评价。Ghose和Ipeirotis针对搜寻品(如多媒体播放器、数码相机等)指出,评论的主客观倾向及主客观混杂度对商品评论有用性的影响,提到了负面评论的效用以及产品类型对效用的调节作用。然而Sen和Lerman却认为并不能直接说是正面评论有用还是负面评论有用,网络商品评论的效用还会受到产品类型的调节影响。除了研究商品类型的调节作用以外,Susan和David的研究还加入了评论极端性(情感强度)、评论深度这些属性对评论有用性的影响。因此,从评论内容的角度看,影响评论有效性的主要内容包括:评论的相关性特性、产品类型特征、评论语法特征(词性、比例),语义特征(肯定、否定)和评论的元特征(评论时间、得票数等)。
2)评论者要素对有效性的影响
在意见领袖的研究领域,意见领袖有着较好的交际圈,较高的社会地位,可以给出有关产品的专业知识和权威的建议以帮助公司很好地促销产品。因此,网络商品评论发布者的权威性对网络商品评论的作用有着正向影响。其次,网络购物环境是一个虚拟的环境,如果评论者的身份可以被公开并提交,那么该网络商品评论会有很大的影响力。Forman的研究结果表明发布者身份的“真实性”和“公开性”对网络商品评论的作用和产品的销售有着正向影响。另外,网络商品评论发布者对产品的熟悉程度以及购买经验影响着评论的深度,也影响着评论的有用性。因此,从评论者的角度看,影响评论有效性的因素有:评论者的社交特征(意见领袖、权威性)、评论者的身份特征(公开、匿名)、评论者的经验特征等。随着研究的深入,垃圾评论也被作为一个广泛讨论的话题。但是区分垃圾评论并没有那么简单,有时候界限很模糊,需要基于计算机技术的处理来进行判断一条评论到底是有用的还是垃圾的。
2.4.2可信性
网络商品评论的可信度是消费者对网络商品评论真实性的相信程度。网络商品评论的可信度受三个方面的制约:一是网络商品评论的内容本身;二是网络商品评论的传播者;三是网络商品评论的发布平台。
对于在线评论可信度影响因素的研究,学者们从不同的方面给出了不同的看法。Liu等认为评论者的经验(Reviewer Expertise),评论的写作风格(Writing Style)和评论的时效(Timeliness)这三个因素是主要影响在线评论的可信度。另外,评论内容中产品描述信息的详细度、情感倾向的客观性、发布者身份的明确性、信息发布的及时性、其他评论阅读者的认同度等指标都会对评论可信度产生正面影响。再次,学者们对于虚假评论的研究也是可行性研究的一个重要方面。虚假评论与垃圾评论不同,虚假评论是针对评论的可信度而言的,如果虚假评论没有被识别,可能会被认为是有效性很高的评论;如果被识别,则是没有任何效用,甚至是反效用。
3研究总结及未来展望
本研究从评论传播、评论挖掘、评论使用以及评论评估四个层面系统地对国内外文献进行总结归纳,研究发现网络商品评论的内容挖掘、评论动机、质量分析、效用及影响巳经在众多的研究中得到了很好的解决,并取得了不错的成果。但随着网络商品评论数量的不断增大,在以下方面仍有可以继续研究的空间。具体如图3所示。
3.1评论传播方面
通过对相关文献的总结归纳,笔者发现学者们对评论传播的动机、前因关注较多,如传播正面评论动机(情感分享、助人为乐等)、传播负面评论动机(抱怨、发泄情绪、警示他人等)、发表评论内在动机(知识贡献、社会认同、提高声誉、)、外在动机(激励因素等)。后续的研究还可以引入心理学的构念:如失落心理、漏报偏差等指标,突破传统评论动机的研究框架。但鉴于网络产品的多样化以及网络产品评论新形式的出现,一些视频产品的弹幕评论尚未得到一定的关注。弹幕评论数据是与视频时间点对应的评论文本,能够反应出用户在观看过程中的瞬时情感和及时褒贬评价。未来可研究评论情感随观看时间的变化情况并可考虑可视化的展示,建立视频评论检索的新途径,满足用户更多元、个性化的观看需求,为用户选择视频类产品提供决策参考。
3.2评论挖掘方面
目前面向中文网络客户评论的产品特征挖掘研究都无法实现自动评论挖掘功能。由于网络客户评论在书写时随意性较大,遣词造句基本没有约束。如果是监督性方法对其进行挖掘需要首先从语言学的角度对这种主观性的文本进行研究,包括语料收集、分析语言规律、研究标注规范和方法等。但在国内的研究中,这方面的基础研究还做得很少。如果实现非监督型的挖掘方法,就可以降低人工参与程度,所以对于中文客户评论中的产品特征挖掘亟需进一步研究。未来可以从以下方面进行考虑:①挖掘更细粒度化。②实现动态监测情感演化规律。③观点结合任务挖掘,以形成比“赞同”、“反对”更有价值的结论。④图片挖掘。网络产品评论中的“买家秀”、或者餐饮等产品的“晒图评价”中包含了大量的图片評论内容,目前学者对评论中的图片挖掘和图像采集方面的工作尚存在不足,未来研究可以多关注图片评论的挖掘和检索。⑤数据挖掘方面能够与云计算技术、语义网等相关技术结合,将会获得更加广阔的发展前景。⑥其他行业评论数据挖掘。除了零售业的网络商品评论,其他行业如:餐饮行业(如饭统网、大众点评网、饿了么等网站)、地产行业(如搜房网、链家网、爱屋吉屋等网站)、短租行业(如airhnb、途家网、小猪短租等网站)、汽车行业(汽车之家、瓜子二手车直卖网、人人车等网站)都存在网络商品评论,未来可对这些领域的评论进行舆情分析与检测,提高市场决策能力。
3.3评论使用方面
评论使用者在使用信息时,对于评论的使用影响和使用动机研究的较多,但对于使用评论先后顺序的研究还是一块较新的领域,即是先看正面的评论还是先看负面评论,先看数值评分还是先看文字评论。未来研究还可探索使用脑电实验、眼动追踪等相关方法研究用户观看评论网页的跳转,或者其他用户对评论的使用过程。另外,大多数文献研究的是一个消费者对评论信息的使用,但在协同购物中,会产生多个消费者同时对评论信息的使用,进而后续的研究可以考虑网络商品评论对双重或更多信息使用者的决策影响。还有评论的使用是使用移动搜索还是桌面搜索,评论的使用者是“网络原住民”还是“网络移民”,这些都可以在未来进行对比性的分析。另外,由于购物网站在线声誉系统设置以及网络商品评论使用对象认知偏差和认知负荷等问题,真正被大部分用户浏览到的网络商品评论只有排名靠前的那一小部分,因此在评论使用方面也存在着长尾现象值得关注和研究。
3.4评论评估方面
在研究范畴上,评论的评估主要分为对有效性的评估和对可信度的评估,但就目前的国内研究而言,评论可信度与评论有用性的区分尚不明显。本研究认为虚假评论的识别、垃圾评论过滤和检测是可信度研究的体现,而垃圾评论的识别和检测是有效性研究的后续。在研究方法上,对评论信息的分析粒度的分类较多,每种分类都是针对一种或者一些特定的产品评论,缺乏一种普适性的分类方法对评论信息进行客观评估。另外,对于评论信息评估的关注度可以上升到信息生态的层面,如网络商品评论信息超载、垃圾评论对信息生态的污染以及人们受到不良信息影响引发的信息焦虑、信息恐惧等信息综合症,也将是未来研究的话题。