基于共词分析的国内在线商品评论研究热点探讨
2017-11-09王倩倩
王倩倩
〔摘要〕国内随着2004年网购的兴起,研究在线商品评论的文章开始逐年增多,本研究尝试利用文献计量学的方法对国内在线商品评论的学术文献进行统计分析,以探寻该领域的研究热点。以CNKI期刊全文数据库为数据来源,以BlueMC和SPSS软件为工具,对国内在线评论文献的关键词,通过词云图聚类和共词分析探索研究热点。提炼出在线评论研究的4个基本分析单元:内容、技术、用户、应用;五大研究热点:口碑传播效应、信息服务与使用、口碑传播心理、信息质量评估和知识挖掘与发现;以及三大研究层面:形态层面、受众层面和效果层面,为把握在线评论的研究现状和相关内容的进一步研究奠定了基础。
〔关键词〕在线评论;共词分析;聚类分析;文献计量
DOI:10.3969j.issn.1008-0821.2017.10.026
〔中图分类号〕F71336〔文献标识码〕A〔文章编号〕1008-0821(2017)10-0158-07
〔Abstract〕With the rise of online shopping in 2004,the articles of online reviews began to increase year by year.This study tried to use the method of literature metrology to explore the research hotspots in the field of online reviews in China.This study used CNKI periodical full text database as the data source,used BlueMC and SPSS software as tools,and used clustering and co-word analysis method to explore research hotspots.The paper extracted four unit-of-analysis(content,users,technology,application);five research hotspots(word-of-mouth effect,information services and use,word-of-mouth psychology,information quality evaluation and discovery and knowledge mining);three main research aspects(morphology level,audience level and effect level).This research could lay the foundation for understanding the research status of online reviews and studying the related content in the future.
〔Key words〕online reviews;co-word analysis;clustering analysis;bibliometrics
在线商品评论(Online Reviews)是网络口碑的一种,是Web20时代人们在网络上针对所购买的商品发表的意见、看法的文字性陈述,评论内容能够为其他消费者的购买决定提供参考,同时也为商家改进商品、收集消费者偏好提供依据。随着2004年网购的兴起,研究在线商品评论的文章从2006年的仅仅几篇开始逐年增多,到2017年在线产品评论的研究已经和数据挖掘、情感分析、用户心理学、自然语言处理、语义分析等内容结合在一起,成为了交叉型、复杂型的研究领域,研究融合趋势日趋明显。近年来,一些学者尝试利用文献计量学的方法对该领域的学术文献进行统计分析,然而这些研究的关注点主要集中在论文的发表时间、期刊、主题[1]、作者关系、文献互引[2]等外部信息方面,或是针对外国口碑传播研究热点的分析[3],缺少深入探讨国内在线商品评论文献的研究热点此类的内在信息。
本研究采用词云图聚类和共词分析法,通过对国内在线商品评论领域文献中的高频关键词进行分析,然后得出共词矩阵,绘制网络图,用各节点之间的距离来反映文献中主题内容的亲疏关系,进而系统的揭示其研究结构、研究维度和理论基础,以期进一步把握国内在线商品评论的研究现状、研究重点和发展方向。该方法与共被引分析法相比,共被引分析法是通过分析以往发表论文的被引情况来探究人们目前关注的焦点,研究的文献已形成比较固定的学术流派;而共词分析法关注的是文献中的研究主题,比较适合寻找新兴学科的范式,因为新兴学科研究者分布广泛,作品内容比较分散,被引情况也不稳定。因此采用共词分析法比较适合自2004年网购大量兴起才建立的在线商品评论研究领域,该方法对于关键词和主题词的分析能够很好地表现该学科领域的研究热点和发展方向。
1词云图分析
尽管在线商品评论的研究有着强烈的跨学科、跨领域的特性,但许多研究的重心和焦点可能是学者们共同关注的。笔者从收集到的文献中提取了674个关键词,通过对关键词的清洗和预处理,最终确定了510个关键词作为分析基础。通过BlueMC在线数据分析软件[4],将510个关键词取TOP100,拟通过关键词的聚类分析挖掘网络商品评论研究的重点,绘制的标签云团如图1所示。
笔者分析这些关键词后发现,尽管不同学科的学者从不同角度、不同理论和不同方法对国内在线评论进行了研究,但是基本的研究单元却非常稳固,结合在線评论研究的关键词云图,笔者将分析单元归为以下4类:
1)内容单元,即与在线评论密切相关的概念和内容。例如,网络评论、在线评论、正面口碑、负面口碑、口碑效应、口碑传播等,主要研究在线评论背景的出现,在线评论的类型以及在线评论的内容传播。endprint
2)技术单元,即分析在线评论所用到的技术、方法和软件系统等。例如,数据挖掘、特征抽取、关联分析、知识分类、文本挖掘、情感计算等,主要是对在线评论研究中用到的具体方法或者算法的改进和渗透。
3)用户单元,即在线评论所连接的两类用户的行为和态度,一是消费者,一是商家。例如,消费者满意度、个性化推荐、评论动机、垃圾评论预测、消费者偏好、意见领袖等。主要研究消费者的满意行为、发表评论的行为或者动机以及商家的营销行为等。
4)应用单元,即基于在线评论的利用价值分析或高效率应用分析。例如,社会网络、观点挖掘、投票打分、评论排序、自动摘要、社会化媒体等关键词。主要研究如何更好地利用在线评论的信息为潜在消费者、商家或者社会服务。
2高频词共词分析
共词分析(Co-word Analysis)是通过对同一篇文献中出现的词汇、短语或者反映文献主题内容的关键词进行统计分析,研究文献内在联系和科学结构。一般认为词汇在同一篇文章中出现的次数越多,这两者之前的关系就越为紧密。由此可以分析主题词两两在文章之间同时出现的频率,在共词频率的基础上再把众多关键词之间的共词网络关系简化为树状图直观的表示出来,通过图可以很清楚地观察出每一领域分支的组成。
21数据源与预处理
本文为了收集有关在线商品评论学术期刊论文的关键词,选取了CNKI数据库中期刊索引里2008-2017年最近10年的所有相关的文献题录,共检索到文献523篇。剔除不相关的文章,得到文献446篇,获得原始关键词约2 011个,选择词频不低于10次的关键词共37个。其中“在线评论”出现的频率最高,约为178次,但鉴于“在线评论”与本研究的内容完全重合,在共词分析中难以发挥作用,予以舍弃。
22高频词共词矩阵数据
剩余36个关键词进行两两共词检索,统计它们同时出现的频率,形成一个36×36的共词频次矩阵,部分数据(前15组)如图2所示:
该矩阵为对称矩阵,对角线的数据定义为缺失,非对角线上数据为两个关键词共同出现的次数。比如,“口碑营销”与“情感倾向”的共词频次为28,表示有28篇论文同时使用了这两个关键词。
23 聚类分析
本文以SPSS21为统计分析工具,采用系统聚类的分析方法对在线商品评论论文的关键词进行分析,方法选择Ward方法,以反映出该领域的研究热点和研究结构。在聚类分析的基础上绘制出树状图,描述各关键词之前的相关性和与外部的联系,范围选择3~8。 得出的结果如图3所示。
经过高频词聚类分析确定聚类结果为5类,综合考虑每一类各关键词的性质,分别命名为:口碑传播效应、信息服务与使用、口碑传播心理、信息质量评估、知识挖掘与发现。这些类别代表了国内在线商品评论的主要研究结构,具体如表1所示:
3结果分析
通过上文的聚类分析结果,下面笔者将结合相关文献的具体内容对这5类的主要内容进行分析和阐述。
31热点一:口碑传播效应
口碑传播效应是指口碑的传播和接受所引起的消费者心理、行为反应以及由此产生的口碑营销等问题。21世纪以后,随着计算机技术的飞速发展,以及各大电商网站客户反馈系统和信誉平台的建立,以网络为载体评论飞速增长,为产品的销售和企业的形象带来了前所未有的影响。消费者自身的消费经历和体验,导致了最初在线评论的产生,可以帮助其他买家购物决策,也可以帮助卖家根据消费者的评价调整自己的营销传播策略。
正负面传播效应。对于个人而言,促使他们传播正面口碑的一个主要心理动机是,通过展现他们不同凡响的购买选择或者无私地与他人分享自己的专业知识,以获得社
图3高频词聚类分析结果图
会认同以及自我认同[5];而发表负面口碑的心理动机是为了表达不满,或是出于发泄敌意,或是为了寻求报复[6]。
推荐行为是精准营销的结果。基于在线评论数据的口碑营销,有利于把握消费者的偏好,对用户数据的分析产生个性化的精准推荐。对线下商家而言,传统团购低价竞争的路线已经被证明了不可持续,未来电子商务市场必然走向精准化运营的道路。
消费者满意度是口碑营销的目的。消费者满意度反映了消费者的一种心理状态,它来源于顾客对企业的某种产品或服务所产生的感受与自己的期望所进行的对比,也就是说“满意”并不是一个绝对概念,而是一个相对概念。相关研究表明,企业不能闭门造车,留恋于自己对服务、服务态度、产品质量、价格等指标是否优化的主观判断上,而应考察所提供的产品服务与在线评论反映的顾客期望、要求等吻合的程度如何[7]。
32热点二:信息服务与使用
帮助消费者决策是在线评论信息被使用的直接原因。查看其他购买者的评论,得到更多有关商品的信息是购买者目前认为最可信的手段,在线商品评论已经成为消费者进行网络购物的重要信息来源之一。随着用户评论这一功能的广泛应用,策略的焦点从评论的存在转移到了消费者对于评论的看法和利用上。因此,对在线评论的动机以及激励的研究也相应的展开而来,利用在线商品评论进行决策的趋势也在逐年上升,关键词“评论动机”和“消费者决策”正好印证了这点。
有学者探索了在线评论有效性对销量的影响,尤其是评价者的特点和购买偏好对销量的影响,也有研究者证明了这些影响会随着产品类型变化而改变,产品类型起到了调节的作用。例如,在线评论对销量的效用在电子科技产品中影响最大,对于保险、理财等产品的影响更小[8],因为这些产品必须线上和线下相结合,而且受到地域的限制,因此这些类产品的销量更倾向于受到传统的口碑的影响,人们更倾向于听从朋友和家人的推荐。
关键词“个性化服务”、“营销策略”和“消费者偏好”表明反馈系统已经被许多流行的购物网站广泛采用,在线评论系统不仅仅提高了电子市场的功效,而且也有利于制造商和销售商收集和了解消费者的偏好。从在线评论中搜集有用的信息进行分析和使用,有利于根據消费者偏好提供个性化的营销策略。例如,有学者从亚马逊中国网站筛选出具有代表性的商品的在线评论,对这些在线评论信息的使用有利于高效地制定出诸如“完善商品详情页面、调整网页色彩、设计比价系统、增加促销力度、完善售后服务等”相关的网络营销策略[9]。endprint
33热点三:口碑传播心理
口碑传播心理包括动机与意愿两类。顾客参与在线评论的动机研究目前可以分为两种:一是参与发表在线评论的动机研究,即口碑传播;二是参与搜索查看在线评论的动机研究,即口碑接受。另外还有研究将消费者参与发表评论的动机分为主动动机和被动动机。主动动机是由内在心理决定的主动参与动机,如自我实现,社交利益;被动动机是由于外部激励,如评论能够获得奖励、商品价格折扣等[10]。
近几年,学者们探究消费者进行网上评论的动机,开始着眼点于消费者和产品的特点,还有一些因素在近几年的研究中也被发现,譬如成为意见领袖,展现自己产品熟悉度以及原創的本能等等。有研究表明意见领袖对顾客口碑传播网络的信息传播速度和传播范围有较大的影响,而且对传播范围的影响要大于对传播速度的影响[11]。
“社会交换”、“知识共享”关键词表明将在线评论作为一种参与社会交换的物质视角,散布口碑者为网络用户提供商品信息和购物体验,是在相互传递和交换信息的过程中形成的一种无形的用户交流网,为现实社会提供了前所未有的舆论多元空间。人们逐渐习惯在网上交换关于产品的信息和看法,在线评论成为人们知识共享的重要方式之一。优秀的评论者懂得参与在线评论也是虚拟社区知识共享的过程,渴望参与社交、建立社交地位以及获得声誉是有些消费者积极搜索评论、回复评论、给评论打分投票的重要动机。
基于“社会网络”的口碑传播心理是将网络购物环境看作是一个社会网络,在该网络中,网络的节点处会有一些活跃的评论者对网络起到很好的链接作用。
“垃圾评论”和“虚假评论”这两种评论加剧了网络信息的不对称性,把握这两种评论的传播心理是治理和净化网络环境的切入点,有利于保护网络信息生态环境[12]。
34热点四:信息质量评估
信息质量评估主要在“可信度”和“评论有用性”两个方面。可信度就是消费者对在线评论真实性的相信程度。在线评论的可信度受3个方面的制约:①在线评论的传播者(比如传播者之间的关系强度)。例如,人们在同亲友交流时,对方的可信度通常是为自己所知的,这种关系强度也是最强的,因此在现实生活中亲友的评论往往被认为是可信度较高的。②在线评论的内容本身(比如产品特征)。由于大多数网上情境中缺乏社交情境线索,我们必须使用其他信息,如评论的内容,去鉴别评论者的可信度。从在线评论本身的内容来看,在线评论中提到的产品特征词的重要性,都是影响在线评论可信度的要素。③在线评论的发布平台。发表在线评论的平台可信度,例如网站的知名度和信誉度也是影响在线评论可信度的重要因素。
在线评论的有效性是指在线评论所提供的信息量可以给消费者提供参考,帮助消费者进行购买决策,使消费者的需求得到满足。郝媛媛等学者认为在线影评中的正向情感、较高正负情感混杂度以及较长的句子对评论的有效性具有显著的正面影响[13]。许多电子商务网站,如亚马逊、当当、京东、淘宝等都提供在线商品评论的效用评价功能——依据每条评论获得的“有用”投票数占总投票数的比例对商品评论进行排序,获得支持票数越多的评论说明该条评论的效用越大。
不论买家还是卖家,作为在线商品评论的读者都希望从中获得有助于制定决策的信息。然而,针对一件商品的在线商品评论往往数量众多而且内容质量参差不齐,不是所有的评论都是有价值的,也不是所有的评论价值都是相等的,这就使得在线评论的质量成为了研究的重点。例如,有学者通过文档频率阈值、信息增益、互信息、卡方统计、词项强度等指标来对评论质量进行量化判断,是一种定量的研究方法[14]。还有学者以在线评论的有用性、可信性、影响力等因素的研究,来从侧面反映在线评论的质量。比如在线评论A比B对商品销量、收藏率、点击率的影响大,那么就可以认为在线评论A的质量比B的好。
“数据挖掘”和“机器学习”是在线商品评论质量检测与评估的技术手段,可以利用自然语言处理技术,判断消费者在线评论的质量高低。例如,有学者通过机器学习技术分类审查情绪,开发了一个词典,对在线评论的情感倾向进行分类,从无用的垃圾评论中抽取出有用的评论[15]。
35热点五:知识挖掘与发现
“知识发现”涉及文本挖掘、人工智能、认知科学、信息科学、信息分析等领域。在线评论领域的知识发现,研究重点是在线评论作为语料库对其进行文本挖掘,提取在线评论中有用的信息。“语义分析”、“极性强度”、“情感倾向”、“自动摘要”、“评论排序”这5个关键词,反映了知识发现实践运用的全过程。语义分析是在线评论知识挖掘和发现的技术基础,是国内情报学界对在线评论、网络口碑研究的重点和热点。对前人的文献进行总结发现,挖掘的方法主要有以下几种:构建本体的方法,基于句式、语义的方法,线性模型方法,马尔科夫模型,基于搜索引擎片段等方法。
从网络评论中挖掘出产品特性词,即“产品属性词”已经成为信息发掘和语义分析两个领域的热门话题。对于中文的评论,由于语言和句式的差异,现存的国外挖掘成果很难运用到中文评论中来。我国学者们针对面向电子商务的中文网络客户评论中产品特征提取及相关技术进行研究,探索了中文环境下网络客户评论的产品特征挖掘方法,该方法基于改进关联规则算法,实现了针对中文产品评论的产品特征属性挖掘,查准率和查全率较高[16]。但是,对于中文评论中的产品特征挖掘研究还是起步阶段,利用语言学知识对在线评论中的特征词性进行标注,这些知识的建立需要大量的人工工作。
文本挖掘是分析非结构化文本数据,进一步使用数据和文本挖掘技术提取相关的内容,这些技术被应用到各种各样的在线产品评论分析。基于情感倾向性挖掘的文献也很多,一般将挖掘后的情感词用于判断情感词的正负、强度分类等,分类的结果体现了评论者的态度是支持还是反对。目前面向中文网络客户评论的产品特征挖掘研究都无法实现自动评论挖掘功能。由于网络客户评论在书写时随意性较大,遣词造句基本没有约束,给国内在线商品评论的文本研究带来了一定的困难。endprint
“自动摘要”和“评论排序”是知识挖掘与发现的两个重点应用层面。自动生成摘要是根据关键产品特征词以及用户对于这些特征词的态度,进而组成简单明确的评价摘要,让消费者在大量的在线评论面前一目了然,不必逐一阅读评论就了解评论的观点。评论排序的目的是将最有价值的评论排在前面,避免消费者在海量无序的评论中“摸不清方向”,使得消费者在短时间内找出自己所需要的信息,为购买决策提供了更好的参考价值。例如,有学者根据商品特征关联度对购物客户评论按照可信度进行排序[17],使得消费者只需要阅读前面的评论就可以真实、客观的了解产品评论的信息,进而减少消费者搜索的时间成本。
4结语
通过上述四大研究单元和五大研究热点的分析,筆者发现国内在线评论的研究主要集中在3个层面:
1)形态层面。形态层面上仍是继UGC(用户自生成内容)研究和网络口碑研究之后的主导内容,只是在研究领域上更多的偏向电子商务、网络营销;在研究的数据平台上更多的是分析零售业网站(淘宝网、京东网、亚马逊网等)上的评论;在研究对象上更多针对的是商品的评论,而非微博的评论、新闻的评论或者时事政治等其他类型的评论。而之前有关UGC和网络口碑的研究范围则更广,比如微博、博客、微信等其他所有承载网民心声的平台。
2)受众层面。在受众层面,不少学者都从受众接受、受众传播的角度进行研究。尽管在线商品评论属于UGC的一种,但与之前UGC的研究不同,在线商品评论的受众的双向的,即消费者和商家这两类;而UGC的受众往往是单向的受众,只不过是之前的信息阅读者转变成了信息发布者。
3)效果层面。在效果层面,多为信息质量检测、垃圾评论、虚假评论辨识等角度进行的,在此层面上与之前UGC的研究区别不大。UGC的研究也是在内容的监督、管理和评价等方面的文献较多。
结合目前的研究现状和研究热点,笔者认为对于国内在线评论的研究领域,应该从以下两个方面加强:
1)在效果层面的研究加强力度。目前的研究虽取得了可喜的进展,但是现有的机器学习、语义分析等技术还不能够做到完全精确,中文的情感倾向分析技术发展相对比较滞后,目前主要集中在网络舆情的监测预警方面。如果是监督性方法对其进行挖掘需要首先从语言学的角度对这种主观性的文本进行研究,包括语料收集、分析语言规律、研究标注规范和方法等。但在国内的研究中,这方面的基础研究还做得很少。如果实现非监督型的挖掘方法,就可以降低人工参与程度,所以对于中文在线商品评论的挖掘亟需进一步研究。
2)在形态层面和受众层面加强广度,对在线商品评论的剖析应该多角度、全方位的开展。例如,除了销售网站的在线评论,还可以关注病人在“丁香医生”等网站、APP或者微信公众号等平台上的留言评论,从缓和医患关系的角度鼓励病人发表评论、意见和建议,有利于避免因消极评论而导致的网上投诉、医闹等状况。另外还有最近比较流行的视频网站的“弹幕”评论,即大量的评论如同“子弹”一样从视频的屏幕上飞过。该评论来源于ACG(Animation,Comic和Game)文化,是一种脱胎于“二次元”文化的新型的在线商品评论,对于这类新型评论的传播形式、传播效果和传播影响的研究还有很大的开垦空间。
本研究以共词分析为基础,采用多元统计方法探讨了在线商品评论领域的研究现状及热点,通过关键词之间的关系揭示不同主题之间的内在关系,试图帮助其他研究者寻找并挖掘相关的研究主题,清晰定位研究的层次。但是本研究尚存在一些不足,比如所考察的文献类型全部来源于学位论文和期刊论文,并没有涉及其他类型的学术文献,比如会议论文、专利论文等。如果将这些论文也统计在内的话,也许会对研究的结论起到一定的修正作用。
参考文献
[1]陈农.在线评论研究中的主题结构:社会网络分析视角[J].现代情报,2015,35 (1):61-67.
[2]Yaqin Li,Yuequan Yang.The bibliometric analysis of online consumer reviews research [J].2014 4th International Conference on Applied Social Science (ICASS 2014):194-199.
[3]杨晶.基于共词分析法的国外口碑传播研究热点分析[J].情报杂志,2013,32 (11):80-85.
[4]BlueMC在线数据分析软件[EB].http:www.bluemc.cn.
[5]张紫琼,叶强,李一军.互联网商品评论情感分析研究综述[J].管理科学学报,2010,(6):84-96.
[6]李宏,喻葵,夏景波.负面在线评论对消费者网络购买决策的影响:一个实验研究[J].情报杂志,2011,30(5): 202-206.
[7]李燕飞.在线评论对消费者满意度及商品销量的影响研究[D].广州:广东工业大学,2016.
[8]盘英芝,崔金红,王欢.在线评论对不同热门程度体验型商品销售收入影响的实证研究[J].图书情报工作,2011,24(4):126-131.
[9]赵金财.基于在线评论分析的亚马逊中国网络营销策略研究[D].哈尔滨:哈尔滨工业大学,2015.
[10]阎俊,蒋音波,常亚平.网络口碑动机与口碑行为的关系研究[J].管理评论,2012,23(12):84-91.
[11]罗晓光,溪璐路.基于社会网络分析方法的顾客口碑意见领袖研究[J].管理评论,2012,(1):75-81.
[12]邱云飞,王建坤,邵良杉,等.基于用户行为的产品垃圾评论者检测研究[J].计算机工程,2012,38(11):254-257.
[13]郝媛媛,邹鹏,李一军,等.基于电影面板数据的在线评论情感倾向对销售收入影响的实证研究[J].管理评论,2009,21(10):95-103.
[14]聂卉.基于内容分析的用户评论质量的评价与预测[J].图书情报工作,2014, (13):83-88.
[15]佘维军.基于语义情感信息的评论有用性研究[D].重庆:重庆大学,2016.
[16] 李实,叶强,李一军.中文网络客户评论的产品特征挖掘方法研究[J].管理科学学报,2009,12(2):142-152.
[17]黄婷婷,曾国荪,熊焕亮.基于商品特征关联度的购物客户评论可信排序方法[J].计算机应用,2014,34(8):2322-2327.
(本文责任编辑:郭沫含)endprint