淘宝卖家信用度影响因素分析
2017-10-18曾玮萱
曾玮萱
【摘 要】随着电子商务的越来越普及,其信用问题也越来越引人关注。卖家信用是消费者是否进行电子商务的重要考虑因素,本文将以淘宝商家信用评价体系为例分析影响电子商务信用的因素。
【关键词】电子商务;信用评分;淘宝
一、淘宝卖家信用评价体系现状
从淘宝网公开信息中可以总结出,淘宝网会员在完成每一笔交易后成功,双方会互相对交易情况进行信用评价,采用累计计分方式。评价的好评、中评、差评分别对应“+1、+0、-1”计算,不同的分数区间有其相应的级别,而且分数和等级出现店铺的页面中。消费者对宝贝与描述相符、卖家的服务态度和卖家的发货速度等三个方面进行评分,系统会通过收集的评分对店铺进行评分,并在店铺首页中显示将近半年数据。
但是在实际操作中可以看出目前评分标准存在不足:卖家仅用好评、中评、差评来计算得分,只用卖家信用分这一项指标来区分淘宝商家的级别,有些单一;店铺首页涉及到许多评价指标,但没有一个总的指标可以展示卖家的整体的好坏情况;评价体系只针对单次交易情况进行评分,忽略了商家的基本情况,比如商家规模的大小等。基于以上的不足,本文将对影响卖家信用的因素进行处理,设计更符合现实的评分模型。
二、数据的收集与处理
(一)数据收集
通过淘宝对店铺的基本信息的公示,收集了300个店铺信息,选择了以下几个变量作为初始数据:主营占比、买家信用、最近半年好评数、最近半年中评数、最近半年差评数、宝贝与描述相符、卖家服务态度、物流服务质量、近30天售后速度、近30天售后率、近30天纠纷率、近30天处罚数、保证金额度、宝贝总数、月销量、店铺类别、卖家信用度。
(二)数据处理
在进行数据清理后得出,“主营占比”的缺失值有6个,“物流服务质量”的缺失值有1个,“近30天售后率”的缺失值有1个,由于缺失值比较少,所以手动将缺失值用零值来代替。而后对因变量“卖家信用度”进行对数转换,使其可以进行以下线性回归分析操作。
三、实证分析
(一)回归分析前的准备
基于该评分模型以好评数的累积方法为主要原理。先使用线性模型,将卖家信用度和最近半年好评数进行拟合,得到该模型的F统计量为89.358比较大,而且P值小于0.05,可见模型显著,所以只用好评数就可以很好模拟卖家信用度。因此,在分析数据时,先删除“最近半年好评数”这个变量,再进行构建模型。
然后计算了所有变量的相关系数后,发现“卖家服务质量”、“宝贝与描述相符”、“物流服务质量”直接两两相关系数比较大,它们两两的相关系数分别为:0.932、0.823、0.856,剔除变量“卖家服务态度”。
经过梳理,最后剩下了16个变量,其中2个定性变量和14个定量变量。
(二)回归分析
1.选取“进入”法进行初步分析
将筛选后剩下卖家信用度对数值,进入模型。观察初步的结果分析。
“进入”法的回归分析结果:= 0.412 说明卖家信用的变动中有 41.2% 可以由自变量解释,调整 R 方为0.383,R = 0.642,说明卖家信用与自变量之间的相关程度为 64.2% 。标准估计的误差为 0.78547699。在给定显著性水平 α = 0. 05下,店铺类别,淘字号,买家信用,最近半年的中评数,最近半年的差评数,物流服务质量,近30天售后率,保证金额度,月销量的 p 值都小于α,说明其对卖家信用的线性关系显著。但同时,主营占比,宝贝与描述相符,近30天售后速度,近30天纠纷率,近30天处罚数,宝贝总数的 p 值都大于 α,则这六项未通过t 检验,对卖家信用的线性关系不显著。而 F =14.285,p = 0. 000。因为 p < α,所以回归方程线性关系显著。同时在结果输出的系数表格中,显示了容差和VIF。在表中几乎所有的变量的容差< 0.2或VIF > 10,该模型是存在多重共线性的。
综上所述,我们需要对模型作进一步的调整。
2.使用“逐步”法进行重新建模
将筛选后得到的卖家信用度对数值,进入模型。
“逐步”法的回归分析结果:= 0.350 说明卖家信用的变动中有 35% 可以由自变量解释,调整 R 方为0.336,R = 0.592,说明卖家信用与自变量之间的相关程度,为 59.2% 。标准估计的误差为 0.81500802。在给定显著性水平 α = 0. 05下,店铺类别,淘字号,买家信用,物流服务质量,近30天售后率,保证金额度,月销量的 p 值都小于α,说明其对卖家信用的线性关系显著。而F =24.180,p = 0. 000。因为 p < α,所以回归方程线性关系显著。
3.变量的对数转换再进入逐步回归分析
对该模型中的自变量与因变量同时取自然对数,再观察其回归结果。
最终回归分析结果:=0 .725 说明卖家信用的变动中有 72.5% 可以由自變量解释,调整 R 方为0.721,R = 0.852,说明卖家信用与自变量之间的相关程度,为 85.2% 。标准估计的误差为 0.62908。在给定显著性水平 α = 0. 05下,店铺类别、买家信用、保证金额度、月销量的 p 值都小于α,说明其对卖家信用的线性关系显著;而F =172.217,p = 0. 000。因为 p < α,所以回归方程线性关系显著。
回归残差服从正态分析,所以模型可以精简为
= -0.932+0.935* + 0.256* + 0.424* +0.106* + ε
四、结果分析
月销量、买家信用、保证金额度以及店铺类别的系数都为正,即在其他不变的情况下,随着月销量,买家信用,保证金额度以及店铺类别这些变量中任意变量的增加,卖家信用也会相应增加。其中,月销量的系数最大,说明淘宝网店铺的月销量的情况对于卖家信用的影响最为显著,所以销量是保证卖家信用分高的一个基础。卖家若要提高信用分就要扩大销售量,要花大量的心思在店铺建设中。而有一些店铺即使有不少的差评,但由于销售量大,还是有较高的信用分,所以存在着一定的弊端。会导致卖家专注于提高销售量,而忽视了质的提升;而保证金额度次之,若一家店铺未缴纳保证金,则买家对其产品质量、售后保障等更易产生质疑,而此店铺如果缴纳了保证金或者保证金额度有所增加,消费者的信心会显著增加,卖家信用更会增加;买家信用对卖家信用的影响相对较小,而店铺类别对卖家信用的影响最小。不同类型的商家的信用特性有些差异,其主要信用影响因素也略有不同。
【参考文献】
[1]吴培红.淘宝网卖家信誉影响因素研究.天津: 河北工业大学,2011
[2]刘博.淘宝网商的信用评价模型研究.北京: 对外经济贸易大学,2009endprint