APP下载

C2C电商平台的刷评可信度及影响因素研究
——以淘宝网为例

2023-01-17李正华刘芃希葛世伦

关键词:店铺商家电商

李正华,刘芃希,葛世伦

(江苏科技大学 经济管理学院,江苏 镇江 212100)

近年来,线上交易日趋繁荣,C2C(Customer to Customer)类型的电商数量越来越多,商家之间的竞争也越来越激烈。消费者在网购过程中,商品评论是判断商品质量的重要依据,商品评论成为商家最重视的商品属性之一[1]。因此,为了提高销量和店铺信誉,一些商家通过刷评方式吸引消费者。卖家通过非正常方式为自己店铺增加销量或好评,即正向刷评;卖家通过非正常方式为竞争对手的店铺或商品发表差评,即负向刷评。

社会普遍认为刷评是一种不当的竞争行为,甚至是违法的[2],因为刷评损害了消费者的知情权和利益,因此刷评的内容是不可信的。然而由于C2C电商行业存在“赢者通吃”的马太效应[3],一些新进入的电商商家由于销量低、好评少,尽管商品物美价廉,却依然无法吸引消费者。在这样的情形下,一些商家会在确保商品质量的情况下被迫刷评,其目的在于更好地打开市场[4]。此外,一些研究认为,好评返现是刷评的一种手段,是一种违法行为[5]。而笔者认为好评返现本质上是一种消费者推荐奖励计划,是企业为了激励老顾客向他人推荐购买其产品对老顾客的推荐行为进行奖励的策略[6-7]。推荐者或评论者进行评价的动机可能源于对产品或服务的满意,也可能是为了获得奖励所带来的满足感[8]。由此可见,刷评现象不仅客观存在,对C2C电商平台卖家而言,部分刷评行为具有一定合理性。因此,不能完全否定好评返现的可信性。

在商品评论充斥大量刷评的情境下,消费者难以判断商品的真实品质。一方面,普通消费者难以完全分辨出正常评论和刷评。不管是正向还是负向刷评,其目的都是误导消费者对商品品质的认知[9]。刷评使得消费者无法确定能否以评论信息判断商品品质,以及哪些商品的品质能以评论信息判断。另一方面,在确定某个商品存在刷评的情形下,消费者更关心的问题并非是如何识别刷评,而是如何判别商品的真实品质。

在商品评论可信度存疑的情形下,学界和业界都进行了很多研究和实践,意图通过理论解释和机制设计剖析和解决此问题。在学术研究方面,研究者主要从平台特征、评论发布者特征、评论内容特征三方面研究评论可信度的影响因素。平台特征包括网站声誉、网站可信度等[10];发布者特征包括评论者的经验、写作风格[11]、在社交网络中的影响力[12];评论内容特征包括好评与差评数量[13]、评论文本的长度、词汇结构与可读性等特点[14]。这些方法在一定程度上为消费者判别评论的可信度提供了参考,但同时也存在一些不足。首先,这些方法对消费者提出了较高要求,甚至需要消费者有专业的知识和工具,在实际网购过程中的可操作性不强;其次,总体评论包括刷评具有可信度,一概而论会导致研究结果有一定偏差。在具体操作上,一些电商平台引导用户对评论可信度打分、对评论进行再评论等方式以提升评论的可信度。然而C2C电商平台引入的打分或评论机制是消费者在购物之前进行的,由于尚未完成购物过程,其对评论的打分或者评论的认知存在主观性,并不能完全反映评论的可信度,而完成购物过程的消费者则不太可能去看别人的评论并对之进行评价。

为了弥补现有研究和实践的不足,为消费者提供更合理的辨别商品真实品质的方式和途径,笔者在问卷调查的基础上,明确了刷评的类别和特征;选取淘宝网部分类别商品的评论数据,对刷评进行识别;从商品详情页中识别出能反映“刷评”可信度的关键信息。由此回答两个关键问题:刷评是否不可信?普通消费者可以通过什么信息来判断商品的真实品质?笔者对刷评现象提出了新的观点,认为刷评也有可信的一面,通过对刷评可信度影响因素的研究,为消费者提供商品评论之外的商品品质判断依据。

一、 研究基础及假设

(一) 刷评方式及特征

C2C电商刷好评一般有请朋友购买、刷单刷评、好评返现、与消费者联系请求好评等方式。为进一步明确商家刷评方式及特征,本研究通过社交平台发放问卷进行调查。本次调查共回收543份问卷,其中有效问卷501份。调查问卷的核心问题及调查结果如表1所示。

表1 刷评现象问卷调查

续表

通过对调查问卷的结果分析,并辅以专家访谈等方式,明确当前C2C电商平台商家刷评主要有好评返现及刷单刷评两种方式,且以好评返现为主。

1. 刷单刷评

刷单刷评是指为了获取商品销量、服务评价、店铺信誉、市场排名等特殊利益,经营者与特定行为人联合进行虚假交易,以谋取市场竞争优势的行为[15]。刷单过程中的虚假消费者可以是无组织的个人,如商家的熟人;也可以是某种评论群组,有组织地刷单[16]。对于想获得大量刷单好评的商家而言,拥有众多刷手的刷单平台是更好的选择。

刷单刷评商品的特点在于评论时间的相对集中性。在正常情况下,除了诸如“双11”等促销活动以及商家自主促销的情形之外,一件商品的每日评论数量不会有太大波动。刷单平台接受卖家的刷评任务,对卖家商品进行大批量刷评。调查结果显示,95.9%的刷单任务都有时间限制。因此,刷手在接受刷评任务后,会在短时间内进行集中刷评。同时,由于刷评收益与刷评量相关,刷手会尽快完成任务,以获取更多收益。因此,刷单刷评具有时间聚集的特点。调查也发现,75.3%的刷单任务有评论模板,因此评语也会有一定的文本相似性。

2. 好评返现

调查显示,98.6%的被调查者都收到过商家对于好评返现的承诺。好评返现是商家允诺给消费者某种利益上的好处,如现金红包、购物优惠等,诱使消费者完成交易后给予商品好评。

调查发现,商家好评返现行为具有比较明显的特征。卖家要求消费者发表一定字数的评语,并附上商品图片。在正常情况下,消费者对商品评论的主要动机是为了表达负面情绪或者寻求网络平台帮助[17]。即使消费者对商品比较满意,大部分人也不愿主动发表评论,更不会对商品追加评论。因此,没有好评返现的商品一般会有大量的负面评论,或者虽然好评率较高,却没有太多带图片且字数多的评论。而好评返现的商品往往评论带有大量图片且评语较长,多为正面信息。此外,调查发现77.4%的消费者在进行返现评论时,会参考其他用户的好评,这表明好评返现评语有一定的文本相似性。

(二) 刷评与虚假评论

Jindal等于2008年最早提出了垃圾评论(Review Spam)的相关研究问题,并将之区分为虚假评论(Untruthful Opinions)、无关评论(Reviews on Brands Only)以及非评论信息(Non-reviews)[18]。其中,虚假评论是指不基于评论者真实的产品或服务体验,而蓄意吹捧或贬低产品声誉的欺骗性评论。然而很多研究对这三者并没有严格区分,认为它们在本质上是一致的,即通过互联网发布不真实的、具有欺骗性的评论[19]。

笔者认为刷评与虚假评论既有联系亦有差异。刷评是指通过某种方式获得额外的好评或差评,这种评论的可信度因刷评方式而异。刷单方式的评论虽然有真实的交易过程,但其交易目的是最终的评论,而不是为了满足消费者的需求,因此这是建立在虚假交易基础上的虚假评论。而好评返现具有一定的可信性。调查显示,在接受好评返现的消费者中,有76.3%的好评原因是“产品质量确实不错”;而在不接受好评返现的消费者中,有58.5%的不接受原因是“产品质量不好”。这表明,返现得来的好评在一定程度上反映了商品的真实质量。当然,也可能有部分消费者在产品质量不完全满意的情况下,由于好评返现的诱惑而对商品进行了虚假好评。综上,笔者认为刷评部分可信、部分不可信。刷评与虚假评论的关系如图1所示。

图1 虚假评论与刷评的关系

(三) 研究假设

信息接受模型[20]是研究评论信息可信度的重要理论基础[1]。依据该模型,信息内容质量及信息源的可靠性是信息有用性的重要影响因素。信息内容质量是对信息内容本身的衡量,包含信息内容的真实性、准确性、及时性和完整性,是中心路径;信息源可靠性包括专业性、可靠性和吸引力,是边缘路径。由于本研究关注的是刷评可信度的影响因素,刷评内容与一般评论内容没有显著差异,因此中心路径失效,笔者主要基于边缘路径研究刷评的可信度影响因素。由于研究目的是从普通消费者角度出发,识别出影响刷评可信度的因素,因此主要分析消费者所能看到的商品详情页中关于商品和店铺的信息,包括店铺的信誉、店龄、描述得分、服务得分、物流得分、是否消费者保障服务、是否7天无理由退货承诺、30天内累计销量等信息。其中,声誉是一个电商平台店铺最重要也是最重视的无形资产,好声誉需要长时间的累积,店铺可以通过销售高质量商品赢得自己的声誉。一般情况下,店铺声誉越高,其刷评的可靠性越高,可信度也越高。在店龄方面,鉴于当前电商进入门槛日益提高,新进入者必须小心经营并销售高质量的商品才能得以生存及发展,除此以外,用户评价对店铺发展至关重要。因此店龄越小,其刷评的可靠性越高,可信度也越高。描述、服务及物流三者是消费者在购物后对商品三个方面的评价打分,其中,描述是指商品详情页中的商品描述与商品真实品质的匹配程度。描述得分越高,其刷评可信度也越高,而服务及物流与商品的品质没有关联。商家提供的消费者保障服务是卖家与电商平台签署的消费者保障服务协议,在发生争议的情形下可以通过平台维权,是对消费者的权益保障。由于引入了平台监管,因此提供消费者保障服务的商家吸引力相对较高,其刷评的可信度也相对较高。同样,承诺7天无理由退货的商家会尽量保证商品质量,其刷评可信度也相对较高。商品销量同样能反映商品质量,质量好的商品销量才高,因此30天累计销量越高,其对应的刷评可靠性和吸引力越高,可信度也越高。综上,本研究作出以下假设:

假设1:店铺的声誉正向影响刷评的可信度。

假设2:店铺的店龄负向影响刷评的可信度。

假设3:商品的描述得分与刷评可信度显著正相关。

假设4:提供消费者保障服务正向影响商品刷评的可信度。

假设5:提供7天无理由退货承诺正向影响商品刷评的可信度。

假设6:商品的30天累计销量正向影响刷评的可信度。

二、 研究方法及数据获取

(一) 研究方法

本研究首先计算每一条评论的情感得分,然后基于刷评的特征识别刷评及对应商品,再判别刷评可信度,最后研究刷评可信度的影响因素。

1. 评论情感得分计算

情感得分计算首先分词,然后去除停用词,再将分词文本匹配情感词典,依次读取情感词库、否定词库和程度副词库。提取并记录文本中的情感词及其在文本中的所在位置,查找记录情感词在情感词库中对应的情感值,然后提取并记录文本中的否定词及其在文本中的位置,最后提取并记录程度副词及其在文本中的位置,查找记录程度的副词在程度副词库中对应的情感分值。笔者使用的情感词库来源于BosonNLP情感词典。计算情感得分的规则如下:设情感词的权重为ω,从情感词典中获得该情感词的情感值Q,检测其对应的否定词和程度副词,设否定词的数量为F,程度副词程度分值为C,则情感得分:

D=ω×Q×(-1)F×C

第k条评论的情感得分Dk为该评论所有情感词的情感值之和与该评论长度的比值,即:

2. 刷评识别

刷评区别与其他一般评论主要体现在三个方面:评论内容特征、评论时间特征、评论文本相似性。问卷调查结果显示只有3.7%的刷单评论要求刷差评,因此本研究只从感值为正的好评中识别刷评,不考虑负向刷评。

刷评的评论内容特征体现在正向评论内容过于丰富。因此,将评论文本长度大于20字,并且在评论中附有多张图片的评论标识为疑似好评返现评论。如果一件商品的所有评论中疑似好评返现的比例超过50%,则将疑似好评返现评论确定为好评返现评论,对应的商品也可确定为好评返现商品。

刷评的评论时间特征体现为评论的时间聚集性。商品的评论数量会随商品销量的增加而增加,但刷手为了尽早完成任务会立刻完成评论,而普通消费者会在使用商品一段时间后再评论。因此,刷评的时间聚集性明显。以3天为时间窗,以平均值加3倍标准差为异常值判别标准,如果时间窗内的平均好评数量异常,则认为该商品存在刷单行为,可确定为刷评商品。

刷评的评论文本相似性特征识别采用Simhash算法以及汉明距离结合的方法[21]。其主要任务是对文本进行降维,生成一个Simhash值,通过比较不同文本的Simhash值进而比较汉明距离(Hamming Distance),从而判断两个文本的相似度。Simhash算法主要有五个过程:分词、Hash、加权、合并、降维。汉明距离是信息论中表示两个长码字x=(x1,x2,…,xn)和y=(y1,y2,…,yn)之间的距离,计算公式为:

其中⊕表示模2加运算,xk计算过程为:计算同一件商品所有评论两两直接Simhash距离,取最大相似数值,与评论文本形成映射。

3. 刷评可信度分析

将刷评商品的所有评论分为刷评和普通评论,刷评的情感得分表示商品刷评品质,普通评论的情感得分表示商品实际品质。若刷评品质与实际品质无显著差异,则表示该商品的刷评是可信的;若两者有显著差异,则表示该商品的刷评不可信。

4. 刷评可信度的影响因素研究

应用多元回归探索刷评可信度的影响因素。因变量Y为商品的刷评情感均值与普通评论情感均值之差的倒数并归一化,Y越大表示刷评越可信。自变量为消费者在商品详情页中能找到的关于商品和店铺的客观信息,包括店铺的信誉Rep、店龄Age、描述Des、服务Ser、物流Log、是否消费者保障服务Cus、是否7天无理由退货承诺Pro、30天内累计销量Sale,控制变量为商品种类Cati和商品价格Pri。其中,Rep及Sale取自然对数之后归一化处理;Age为当前年份减开店年份再加1,而后归一化;Cus为虚拟变量,商家提供“消费者保障服务”则用1表示,否则用0表示;Pro为虚拟变量,商家承诺7天无理由退货则用1表示,否则为0;Cati为对应不同商品类别的多个虚拟变量;Des、Ser、Log、Pri等变量为同一类别,因此作归一化处理。

(二) 数据获取

本研究选取了女装、食品、数码产品和化妆品四大类商品的评论数据。这些类别的商品在平均价格、购买频次、售后服务模式、不同品牌商品功能差异性等方面存在一定区别。爬取每类商品销量排行前90位的商品,共计360个商品,爬取每个商品最多前500条评论数据,最终获得89 586条评论。在剔除无效样本之后剩余77 131条评论,各类商品样本的评论数量如表2所示。

表2 各类商品评论数据统计表

从表2可以看出,食品类商品平均评论数远高于平均值,化妆品和女装评论数相当,电子产品评论总数相对较少。每一种商品的评论中好评都占绝大多数,电子产品类商品评论中的带图评论及追加评论所占比例较大。

三、 刷评可信度分析结果

(一) 商品评论情感分析

通过基于情感词典的文本情感分析,计算出每一条商品评论的情感值。情感值大于0为好评,小于0为差评,等于0为中评。各种类商品的三种评论情况如表3所示。结果显示,商品评论中好评占有绝大部分。其中,食品类商品好评率相对较低,差评率较高;女装好评率相对较高,差评率较低。

表3 各类商品情感值统计表

(二) 刷评识别

从评论情感分析结果中选取所有好评评论,分别分析评论内容特征、评论时间特征、评论文本相似性。

1. 基于评论内容特征的识别

评论字数超过20且带有图片的评论为疑似好评返现评论,一共有12 815条,占所有评论的20.68%。若某个商品的疑似好评返现评论占该商品评论数的50%以上,则认定该商品为刷评商品。据此原则,识别出56件好评返现商品,平均好评数量350条,其中返现好评平均为32.82%。

2. 基于评论时间特征的识别

三天的时间窗内评论数量出现异常值则视为疑似刷单评论。数据分析显示,疑似刷单商品129件,占比35.8%。剔除疑似刷单销量30件以下的商品,剩余18件刷单商品。这18件商品平均日销量为7.6件,而刷单时平均日销量为50.1件,最高81件。

3. 基于评论文本相似的识别

使用Simhash算法以及汉明距离计算文本相似度,再根据每条商品好评的最大相似度确定是否存在刷评。根据汉明距离计算文本相似度的一般规则,最大相似度大于0.8则认定为相似文本。剔除文本长度小于10字的短文本,识别出文本相似度高的刷评商品99件,相似文本评论平均占评论总数34.1%。

综上,基于三种特征的四类商品刷评识别结果如表4所示。可见,电子产品类的刷评数量相对较少,其原因可能是由于其固有的购买频次低、平均价格高等属性所致。由于其刷评数量相对较少,后续研究剔除这一类别的商品。

表4 基于多种特征的刷评商品数量统计

(三) 刷评可信度分析

将每件刷评商品的评论划分为刷评和普通评论,并分别计算每件商品的两类评论情感均值,对化妆品、食品、女装三类商品的两大类评论分别进行配对样本T检验,结果如表5所示。

表5 两类评论t检验结果

虽然表5的结果显示所有类别的商品刷评情感均值均显著高于普通评论情感均值,即总体而言,所有类别商品的刷评是不可信的。但在分析单个商品的两类评论情感差值后可发现,其差值在[0.03,1.73]范围内,且呈均匀分布。由此可见,有些商品的刷评品质与真实品质相近,而有些商品的刷评品质与真实品质相差较大。结合上述分析可知,商家刷评的目的不尽相同,不能完全否定刷评的可信度。

(四) 刷评可信度影响因素分析

多元回归的相关变量均值、标准差及相关性分析结果如表6所示。从中可以看出,Rep、Age、Des、Cus、Sale等变量与因变量呈显著性相关,变量的相关系数都小于0.7,说明变量之间不存在明显的多重共线性。

表6 变量的均值、标准差和相关系数

表7是各自变量和因变量的回归分析结果。其中,模型1是店铺属性对刷评可信度影响因素的回归分析结果,模型2加入了电商交易相关属性,模型3加入了控制变量的回归模型。从三个模型分析的结果来看,Rep、Age、Des、Cus、Sale在三个模型中均与刷评可信度有显著相关性。这表明店铺的声誉、店龄、商品描述得分、是否提供消费者保障服务是判断刷评是否可信的重要依据。由此,假设1至假设4得到验证,而假设5和6未得到验证。其原因可能是当消费者购买了质量差的商品而要求退货时,如果商家拒绝则很可能会被消费者投诉或者差评,而这会大大影响商家的声誉,因此7天无理由退货逐渐成为电商的普遍承诺。销量未能反映商品质量,进而未能判别刷评的可信度,其原因可能是消费者未能正确识别商品质量,这也进一步从侧面证明了本研究的重要性。

表7 多元回归分析

续表

四、 研究结论与启示

(一) 研究结论

本研究通过对C2C电子商务平台的商品评论文本进行情感分析、刷评识别和刷评可信度影响因素分析,证实刷评是客观存在的,而且并非完全不可信,可以通过其他信息来判断商品的真实品质。由调查问卷和数据分析结果可得出以下结论:

首先,电商刷评现象比较严重,但不同类别商品的刷评现象差异比较大。如电子产品价格高、购买频率低,刷评现象不明显;日用商品诸如食品类价格相对较低、购买频率高,刷评现象明显。可见,商品的固有属性很大程度上决定了商家是否采用刷评手段促进商品销售。因此,消费者在选购商品时需重点考虑其对商品固有属性的需求,如功能、性能、价格、售后等。对于价格相对较低和购买频次较高的日用品,商家会较多采用刷评手段。

其次,电商平台刷评可信度差异较大。以刷评情感值与普通评论情感值之差衡量的刷评可信度差异较大。某些商品的刷评品质与实际品质相差较小,表明其实际品质是优良的,其刷评行为可能是为了拓展市场而进行的广告行为。另有一些商品的刷评品质与实际品质差异很大,其刷评行为误导了消费者对商品的认知。

最后,刷评可信度受多种因素影响。多元回归结果表明,刷评可信度受店铺的声誉、店龄、商品描述得分、是否提供消费者保障服务等因素影响。其中,店铺的声誉、商品描述得分、是否提供消费者保障服务与刷评的可信度显著正相关,而店铺的店龄与刷评可信度显著负相关。信誉是一个店铺重要的无形资产,为了维护它,网店会特别注重其运营,将商品质量保证放在重要位置。店龄与刷评的可信度显著负相关,即新开的店铺的评论可信度相对较高。这也验证了新店铺确实在保证其产品质量基础上使用刷评方式开拓市场。商品描述分值较好地反映了商家的信誉及其评论的可信度。而通过提供消费者保障服务,保障消费者权益,对店铺起到了一定的震慑作用。

(二) 理论贡献

首先,笔者将口碑传播的“消费者奖励计划”理论拓展到C2C电商平台的商品评论领域,将电商平台客观存在的刷评区分为可信刷评和不可信刷评,弥补了以往将电商刷评笼统判定为不可信或者违法的不足,厘清了刷评与虚假评论的联系与区别,分析了刷单刷评和好评返现两种形式,并论证了好评返现的合理一面。

其次,基于信息接受理论,在中心路径失效的情形下,通过边缘路径的分析,找到除了商品评论之外判定商品真实品质的方式,论证了消费者可以通过店铺的声誉、描述、店龄、是否提供消费者保障服务等其他信息合理地判断商品的品质。

(三) 实践启示

消费者在C2C电商平台购物浏览评论时,需要注意不要被商品详情页中图文并茂的好评所蒙蔽,而要留意评论在某段时间内集中出现的评论,并且需要留意评论的内容是否类似,特别是对日常用品类商品更应保持警惕。很明显,具有这些特征商品的好评中有接近一半的评论是“刷”出来的。消费者在通过一些特征发现某商品存在刷评现象,则其评论是否可信是不确定的。为了能更好地判断商品的真实品质,需要结合店铺的一些其他信息进行综合判断。如果店铺具有以下一些特征,如店龄小、信誉高、提供消费者保障服务、商品描述综合分值高,则其商品的好评在较大概率上是可以信赖的。

猜你喜欢

店铺商家电商
电商助力“种得好”也“卖得火”
中国人不骗中国人
老店铺杂事
电商赢了,经济输了
苏轼的店铺
No.4 快手电商:已帮助至少50万线下商家恢复生意
加快农村电商全覆盖
农资电商逃得过地推吗?
春节黄金周陕西省商家揽金二百一十亿元
2015五道口店铺回访