基于多元线性回归模型的产品在线评价数据研究
2020-07-06邵柏岩彭皓崧汤海龙
邵柏岩 彭皓崧 汤海龙
摘要:客户反馈,如产品评级和评审是产品质量的最直接指标.对产品和反馈进行详细的分析,对未来的市场发展以及相应的销售运作模式具有重要的指导意义:深入分析这些数据,探索某些变量之间的內在联系:本论文在消除冗余信息后,多元线性回归,对每个数据集中的数据进行预处理。基于产品正面和负面评论的情感水平,每一个都给出一个百分制评分。情感越积极,分数越高允许文本评论量化。
关键词:多元线性回归;灰色预测;网上购物
1.引言
近年来,网上购物越来越流行,它具有节省时间、方便和廉价等优点。亚马逊等在线商店使用产品评级系统作为影响顾客决策的重要因素,帮助顾客从更大数量的产品中选择想要的东西。购买商品的用户提交的这些评级和评论对客户和公司都有很高的参考价值。商品评估为诚信交易提供参考。它可以保护购买者的利益,并促使卖家最大程度地进行诚信交易。
2.统计分析
为了找出给定的数据,如星级和评价的产品之间的相关性,我们使用软件SPSS和STATA进行数据分析。
2.1描述性统计
应用SPSS软件对三个产品数据集进行描述性统计。
2.2数据预处理
(1)删除不相关的因素,如“市场”、“客户ID”、“评论ID”、“总选票”和“生产厂家”,它们被认为是冗余数据。
(2)我们根据评审的情感强度来评价产品的满意度,并给每篇评论打分,从0(失望)到100(很好)。
(3)将定性数据“Vine”和“确认购买”转换为定量数据,并建立虚拟定量数据“Vine(1)”、“Vine(2)”、“确认购买(1)”,“确认购买(2)”。
2.3建立多元回归模型
为厂探索变量之间的关系,我们使用“星级”作为因变量和其他变量作为自变量,建立多元回归分析模型。
星级i=α·等级i+β·有用性i+∑rnvinen+∑λk·确认购买k+C
其中n=1,2;k=1,2;i=1,2,3。
编写STATA程序求解该模型。
星级1=0.04930·等级1+0.00001·有用性1-0.00702·vine1-0.00876·確认购买1+0.56156
星级2=0.04946·等级2+0.00020·有用性2-0.00922·vine2+0.02596确认购买2+0.51173星级3=0.04923·等级3+000180·有用性3-0.01036·vine3-0.00523·确认购买3+0.57133
注:Vinei因共线性而省略。因为共线,省略了确认购买i。
2.4结论
通过这些结果,我们可以得到三个数据集的F分布的p值,它们是0<0.05,这样我们就可以拒绝原来的联合显著性假设。
H0:α=β=γn=λk=0
低于95%置信水平的显著性检验。我们可以安全地得出结论,星级评价和其他变量之间有很强的相关性。
类似地,我们进一步分析结果,发现吹风机和微波数据集中的评级和确认购买变量的P值和P<0.05,因此这两个变量都强烈地影响星级。
2.5模型评价
(2)如图1所示,我们以吹风机数据集为例绘制了其星级核密度估计(左)和每个数据集的残差和拟合值的散点图(右)。然后利用BP检验进行分析,发现模型通过异方差检验,没有理由拒绝BP假设的原始假设。
(3)考虑到所有的变量避免了本土化的影响,模型结果是一致的。符合事实,合理性和适用性好。预测具有良好的可预测性和通用性。这种多元回归模型可以推广到其他领域。
3结论与建议
通过本文的研究可以得出:星级和评论与产品质量有很大关系,应该对这一点加以注意。星级和客户评论是产品质量最重要的指标。通过多元回归分析,我们可以发现产品星级评分与评论显著相关,并且具有很强的一致性。此外,确认购买也显著影响星级,其他变量影响相对较小。可以看出,星级是一个综合评价标准和反映产品质量。
我们给出下面的建议:可以为产品做些事情来提高声誉和积极的评价;可以采取一些措施来促进口碑营销,以提高产品意识,从而提高产品曝光率和吸引更多顾客。在制定销售策略时有许多因素需要考虑,在做决定前要三思。