商品评论对消费者行为的影响研究
2021-02-04殷丽朱曙旸史逸兴
殷丽 朱曙旸 史逸兴
摘 要:随着大数据技术的应用使得企业更具有竞争力。本文基于亚马逊网站的商品数据,采用灰色关联分析、方差分析、动态回归模型,探究评论对消费者行为的影响机理。实证表明:具体的评论内容对消费者行为影响较大,同时,专业人士等易被信赖群体的评价对潜在顾客影响显著,已有的特定星级评定会引发后续相应的评论,因此企业要密切关注易被信赖群体和低星级评定。本文的模型为企业提供了一种快速、便捷的决策方法。
关键词:大数据;灰色关联分析;方差分析;动态回归模型;消费者行为
中图分类号:F063.2 文献标识码:A 文章编号:2096-0298(2021)01(b)--04
近年来,随着在线市场的普及(如淘宝、亚马逊等),人们购物越来越依赖商品评价与评分,而非传统的实体店体验。同时,由于大数据等新兴技术的发展,线上零售企业也使用这些数据来深入了解市场竞争情况,以及产品的未来发展前景,以便作出最优的决策。这些海量的数据,对于企业来说无疑是一笔宝贵的隐形财富。线上交易的普及,使得商品评论成为影响消费者选购与否的一大动力,而通过对商品评论的分析,企业可以有针对性地制定产品的营销、设计等策略和更好的经营决策。
对于商业大数据挖掘与应用方面,Milan Kubina [1]等(2015)建立了大数据信息系统模型,为成功利用信息以获得市场竞争优势奠定了基础;宋杰鲲[2]等(2020)基于大数据背景,构建了包含产出、能力和资源三方面的企业竞争情报系统评价(ECIS);陈冬梅[3]等(2020)基于大数据和人工智能,探究了数字化战略管理的可行性;肖君[4](2014)研究了大数据下企业的成本控制问题。根据已有的文献可以发现,大多数研究仍处于宏观层面,模型较为复杂,需要花费较大的时间成本。而本文基于线上购物的数据,探究消费者星级评定与评论对产品市场的影响,从而为企业提供快捷的在线销售策略,以及识别产品的潜在市场。
1 数据处理与变量说明
在这里,我们选择2020年MCM/ICM竞赛C题中的数据,包含亚马逊市场上出售的微波炉(1615组数据)、婴儿奶嘴(18939组数据)和吹风机(11470组数据)三种产品客户提供的评分和评论。
为了减少误差,在进行分析前需要对数据进行清洗。对于数值型数据,如果是缺失值,由于各个评论数据间相互独立,无法弥补,且极少数缺失数据相较于整个样本占比很小,可以直接剔除;如果是异常值,可以采用K近邻法进行校正,以提高结果的精度。对于文本型数据,由于数据来源于美国,评论主要由字母组成,因此它们之间的关联度大大降低[5],处理过程中需要将大写转换为小写,并删除标点和空格等。
对于消费者的行为模式,可以看作买或不买,用购买率量化表示(购买人数占总样本比例)。而影响购买率的因素主要是星级评定(从1分~5分,1分代表最低,满意度最差;5分代表最高,满意度最高);评论得分(具体的评论信息);帮助等级(他人评价对自己决策的影响程度);是否为Amazon Vine成员(Amazon Vine为亚马逊发起的一个评论项目)。以下将通过实证分析判断这四个因素对消费者行为的影响机理。
2 模型设计与实证分析
以下将用灰色关联分析、方差分析、动态回归模型,探究上述四个因子对消费者行为的作用及其内在关系。
2.1 灰色關联分析
以下采用灰色关联分析法讨论消费者行为(可视作购买率B)对星级评定(S),评论得分(P),帮助等级(F),是否为Amazon Vine成员的判断因子(G)等因素的依赖性。
为比较第k个影响因素下,数列对参考数列对的关联系数,其中为分辨系数。
和分别为两级最小差及两级最大差。
定义为序列对参考序列的关联度。
根据上述灰色关联模型,通过MATLAB得到各因素对采购率的灰色关联度。对于这三种产品,我们发现评论与购买率之间的灰色关联程度最大,而帮助等级与购买率之间的灰色关联程度最小。例如,婴儿奶嘴的购买率与评论的灰色关联系数为0.7503,而帮助等级与购买率之间的灰色关联系数为0.5175。这说明,具体的评论内容对消费者购买决策的影响较大,而帮助等级关联度较小的原因可能是消费者的决策是一个综合的过程,各个评论间的帮助程度没有显著差异。具体数据如表1所示。
2.2 方差分析
为了探究是否为Amazon Vine成员对消费者行为的影响,以下进行了方差分析。这里需要说明的是,Amazon Vine是一项邀请亚马逊最值得信赖的评论者针对新商品发布他们的看法,以帮助其他买家作出明智的购买决定计划。亚马逊会根据买家针对其在亚马逊上所购商品发布的评论是否深刻,邀请买家成为Vine 评论者。而参与该计划的卖家可以提供免费商品,以便这些选定的 Vine Voice 为其申请的商品发布买家评论。因此,Amazon Vine也是评论的一个方面。
首先,计算星级评定、评论得分、帮助等级和是否为Amazon Vine成员的相关矩阵。以婴儿奶嘴为例,在表2中,括号内为相关系数的P值。如果P<0.01,相关系数可以认为是非常显著的。如果P<0.05,则认为相关系数显著。
从表2可以看出,Amazon Vine与其他变量的相关性最小。同时,评论得分与星级评定的相关性最大,为0.3044。例如,正面评价与高星级评价一致,反之亦然。这符合我们的实际情况,因为评论是评分的具体说明。以下的第三点将对此进行详细分析。
接下来,采用单因素方差分析研究是否为Amazon Vine成员的判断因子(G)对星级评定(S),评论得分(P),帮助等级(F)和消费者行为(B)等变量的影响。数据通过了常方差检验和正态性检验。
我们首先讨论判断指数(G)的变化对星级评定的影响。
变量S表示星级评定(S)的样本,当,即不是Amazon Vine成员时,是的平均值,当,即是Amazon Vine成员时,是的平均值。总共选择了个样本,其中,的有个,的有个。
为了讨论对消费者行为的影响,以是否是Amazon Vine成员为控制变量,研究了各变量的均值。从表3可以清楚地看到,加入Amazon Vine有助于产品在在线市场上取得成功。由于篇幅的限制,在这里列出婴儿奶嘴的结果数据。通过对另外两种产品的研究,我们也发现了相似的规律。
从表3的结果可以看出,第一个是0.7987,说明结果并不显著。因此,在是否加入Amazon Vine的星级评定上没有显著差异。而其他三个都小于0.05,可以说是有明显的不同。换句话说,成为Amazon Vine的一员对评论得分(P),帮助等级(F)和消费者行为(B)有显著影响。虽然这是选取国外的数据,针对的是亚马逊网站的个例,但不可否认的是这种精选评论的项目对消费者选购本产品仍有显著的影响。例如淘宝、京东上的星钻级买家的評价对潜在消费者影响更大。
2.3 动态回归模型
为了衡量特定的星级评定是否会引发更多的评论,将星级评定作为自变量(X)。同时,考虑到评论对消费者决策的帮助程度,得到修正后的评论得分(R),并将其作为因变量(Y)。在之前的研究中,发现2006年的微波炉数据太少,不具有代表性。因此,使用线性插值来弥补。由于动态回归中时间序列的平稳性不是必要的,因此只检查它是否是白噪声。LB测试表明,每个系列都不是白噪声。通过对序列的相关系数和偏相关系数的分析,建立了动态回归模型。
式中,和分别是t年和t-1年修订的评论得分(R)的值。是在第1年的星级评定。(i=0,1,2)分别表示常数项和变量前的系数,且是随机误差项。我们引入了以消除其自身的影响,并且的系数 (即)将显示先前的星级评定对修订后的评论分数的影响。由于其他因素间相关性较低,因此这里没有采用更多的变量。特别是该模型还可以通过以后的建模结果来确定,并发现残差是白噪声。
运用MATLAB,可以得到这三种产品的动态回归模型,如式7~9所示。
接下来,对残差序列进行LB检验。测试结果表明,残差序列为白噪声序列,即信息已被充分提取。因此,该模型是有效的。
以上结果显示,为正数,通过5%显著性检验,说明星级评定对文本评论得分有正向影响。这一结论与实际情况相符,特定的星级评定会引发更多类似的评论。例如,客户在看到一系列高星级的评价后,更可能写出正面的评价。不过,如果之前的星级评定较低,他们对评论的正面贡献将低于高星级评定,而且随后的评论可能不会那么好。这一结果的主要原因是星级评定对潜在消费者的影响更大,低星级评定会让顾客气馁,因为他们下意识地认为产品不好。
最后,利用已有的动态回归模型对评审得分进行预测。2016年吹风机、微波炉、婴儿奶嘴的预测评论得分分别为-0.0091、 -0.0019、-0.0482,比2015年有所提高。以婴儿奶嘴为例,其预测如图1所示。
3 结语
本文探究了四个主要因素(星级评定、评论得分、帮助等级、是否为Amazon Vine成员)对消费者行为的影响,并预测了三种产品的得分。从实证分析中可以看出,具体的评论内容对购买率影响较大,同时,专业人士的评价更能影响潜在消费者,已有的特定星级评定会引发后续相应的评论。这给予了企业一个思路,密切关注专业人士等容易让潜在顾客信赖的群体和打低星级评定的用户,剔除恶意差评后,充分了解消费者的需求,改进相关产品,以求产品市场的长远发展。本文的研究为线上购物产品的销售策略和前景预测提供了一种建议,帮助企业更快地作出决策。
参考文献
Milan Kubina, Michal Varmus, Irena Kubinova. Use of big data for competitive advantage of company[J].Procedia Economics and Finance,2015(26):561-565.
宋杰鲲,赵志浩,张业蒙,等.大数据背景下企业竞争情报系统评价研究[J].情报杂志,2020(08).
陈冬梅,王俐珍,陈安霓.数字化与战略管理理论——回顾、挑战与展望[J].管理世界,2020,36(05):220-236+20.
肖君.基于大数据的电子商务企业供应链成本控制[J].信息记录材料,2020(21):95-96.
John H.L.Hansen,Gang Liu. Unsupervised accent classi?cation for deep data fusion of accent and language information[J]. Speech Communication, 2016(78):19-33.