基于机器学习算法的电商直播满意度影响因素分析
2023-04-07周国福
周国福
(福建水利电力职业技术学院 经济管理学院,福建 永安 366000)
近几年电商直播营销发展地如火如荼,直播真实的体验感以及快速聚集人群为营销注入新流量的能力[1-2],让电商营销行业看到了快速发展的契机。本研究旨在运用科学有效的方法来研究目前公众对直播营销的满意度和直播营销过程中影响公众下单行为的因素,并从电商平台、商家及消费者三个角度对电商直播营销提出切实可行的建议,以期促进直播和电商行业的发展,也为后续的调查提供数据支持。
1 基于AIDA模型的调查数据分析
1.1 调查项目及内容
问卷的项目内容主要根据AIDA模型进行设计[3-4],该模型主要有以下几个方面:引起注意(Attention)→产生兴趣(Interest)→刺激欲望(Desire)→行动购买(Action)。根据该模型将问卷设计为以下五个部分:基本信息、对电商直播营销的注意(Attention)、对电商直播营销产生兴趣(Interest)、刺激公众参与直播营销的欲望(Desire)、对电商直播营销产品产生购买(Action)[5]。
1.2 样本数据分析
问卷分析了影响电子商务现场营销满意度的因素,共发放问卷677份,回收有效问卷596份,问卷无效的原因主要是:群众对问卷中的个别问题不理解、不愿意回答或明显随意填写的。问卷回收统计数据如表1所示。
1.2.1 公众对电商直播营销的注意分析(Attention) 受访者直播营销参与程度如图1所示。
图1 受访者直播营销参与程度图
从图1中可以看出,有95.13%的受访者表示参与过直播营销,仅有4.87%的受访者从未参与过直播营销;其中有56.21%的受访者观看直播营销的频率较高。由此看来,市民对直播电商营销的参与率高,反映出所得到的数据能够代表大多数参与过直播营销者的想法,有助于得出正确的结论并提出精确有效的建议。
从图1中可以看出,有95.13%的受访者表示参与过直播营销,仅有4.87%的受访者从未参与过直播营销;其中有56.21%的受访者观看直播营销的频率较高。由此看来,市民对直播电商营销的参与率高,反映出所得到的数据能够代表大多数参与过直播营销者的想法,有助于得出正确的结论并提出精确有效的建议。
1.2.2 公众对电商直播营销产生兴趣分析(Interest) 受访者认为直播营销最重要的三个优势分别是“激发好奇心,利于宣传”“聚焦同类用户,增强营销效果”和“全面了解商品”[6-7]。传统网页模式已经无法满足人们的好奇心,直播视频对消费者来说更新颖。同一直播间内聚集着具有相同兴趣的人群,这会让消费者拥有归属感,能增强消费者对商品的信任度,从而促使消费者下单。直播营销平台优势图如图2所示。
图2 直播营销平台优势图 图3 通过直播下单的情况图
1.2.3 刺激公众参与直播营销的欲望分析(Desire) 通过调查显示:49.16%的受访者表示平均每月通过直播营销下单的数量为1~4单,17.79%的受访者平均每月通过直播营销下单数量为5~8单,另外还有3.86%的受访者平均每月通过直播营销下单数量达到9~15单,但是也有29.03%的受访者几乎不通过直播营销下单,这说明电商直播营销的参与率虽然很高,但下单率却未达预期,表明直播营销的销售转化率还有待提高,通过直播下单的情况如图3所示。
1.2.4 公众对电商直播营销产品产生购买分析(Action) 促进公众选择电商直播营销最主要因素有“与检验机构合作,现场检验直播产品质量”[8],“增加直播中不同人对商品的试用”及“增加产品的制作包装等流程直播”等,表明公众网购时比较在意商品的质量。故直播营销在未来的发展中应更加注重产品的质量,且通过较为可信的方式适当地展现给消费者,让消费者买得更安心。促进选择电商直播营销购物影响因素分析如表2所示。
表2 促进选择电商直播营销购物影响因素分析表
2 电商直播营销满意度影响因素分析
2.1 电商直播营销的人工神经网络分析
人工神经网络,是所有神经网络的最基本原型,通过节点数量,节点之间的连接权重,还有激活函数的调整可以得到不同的运算结果[9]。神经网络是一种模拟人的神经元记忆的方式设计的模型。模型的结果则取决于网络的结构、网络的连接方式、权重的设置以及激活函数的选择。
利用BP(Back Propagation)神经网络来分析性别、年龄、文化程度、月收入、职业、平均每个月网购次数等因素与消费者对电商直播营销的总体满意度的关系。首先把数据进行划分训练集和测试集,在各大城区收集到的数据中的500份数据作为训练集,作为模型的输入训练,另外96组作为测试集,用于测试模型的拟合效果,神经网络路径图如图4所示。
图4 神经网络路径图
需要注意的是,这里没有使用过多分类的变量,大多使用的是数值变量,一是神经网络适合数值型变量,二是由于分类变量过多会大大增加模型的复杂性,导致过拟合的风险。从BP神经网络的拟合结构图中可以看到,输入层为9个节点而隐含层为3个节点,每个链接之间的权重为边值上的数值,可以看到,不同组合对应的权重不同,最后组合输出节点为因变量总体满意度。神经网络结构比较清晰,而MSE(均方误差)为5.615,RMSE(均方误差根)为2.370,但是可能由于节点过多导致过拟合使得误差较高。
2.2 电商直播营销的SVM(支持向量机)分析
利用支持向量机(Support Vector Machine, SVM)模型来分析性别、年龄、文化程度、月收入、职业、平均每个月网购次数等因素与消费者对电商直播销的总体满意度的关系[10]。首先把数据进行划分训练集和测试集,为方便比较人工神经网络和支持向量机模型的预测拟合性能,本次支持向量机模型采用的数据集的划分方式与前面人工神经网络相同,程序运行结果如图5所示。
图5 支持向量机模型图
在支持向量机模型中,可以看到选择的核函数为radial核函数,该核函数比线性核函数在本例中更稳健一些,模型的cost值为1,gamma值为0.045,所使用的支持向量个数为455个,可以说比较多了,这是因为数据集相对较大,数据维度相对较高,而模型的精度在0.1,这个精度已经够用,是因为满意度大概都在1~5到之间,当然也可以用更高的精度,比如0.01,但经尝试后,和0.1相差不大,由于模型的误差不大,模型已经拟合得比较好了。支持向量机模型MSE为0.579,RMSE为0.761,说明拟合程度较高,预测结果如表3所示。
表3 预测结果比较
神经网络是一个“黑匣子”,无需了解其中机制,只需输入数据,调整好参数,就能得出结果。但是如果在样本量比较小的情况下,神经网络易造成过拟合问题。而支持向量机理论基础扎实,相较于神经网络基于经验风险最小化,SVM是基于结构风险最小化,泛化能力较好,具有全局最优性,因此小样本量使用SVM更合适。这里的500份多数据,和平时数据挖掘工具常用样本量相比,属于相对小样本,模型的训练结果告诉我们BP神经网络的保值率MSE为5.615,RMSE为2.370, 而支持向量机对应的结果为为0.579和0.761,可以看到支持向量机的结果要明显更优,误差相对较小,可能的原因是神经网络出现了过拟合问题,不能达到全局最优,数据集一旦更换变动,误差则较大了。对本例来说,更倾向使用支持向量机模型,支持向量机的预测结果的部分展示如表4所示。
从表4中数据可以看出神支持向量机预测值与实际值较接近,这说明以上性别、年龄、文化程度、月收入、职业、平均每个月网购次数等因素对满意度确实有影响。
3 公众下单行为影响因素研究
3.1 有序logistic模型构建
根据爬虫所得100家店铺的每小时下单数量,发现下单数量大致集中在五个区域,所以将各直播间的每小时下单数量划分为五个层次,转化为定序变量,将其作为因变量,将网络爬虫所得的各项指标(粉丝数、累计获赞数、在线人数、总销量、动态数目、每小时弹幕量及每小时加入购物车数目)进行标准化,所得的数据作为自变量,分别设为x1、x2、x3、x4、x5、x6、x7进行有序logistic回归,β1、β2、β3、β4、β5、β6、β7为回归系数建立模型,分别如公式(1)-(4)所示:
3.2 定序logistic模型的拟合检验
可行性定序logistic模型拟合信息表如表5所示:模型的全局性检验值小于0.05,表示该模型有统计学意义;从3个伪决定系数来看接近1,该模型在接受范围之内,因此该模型拟合度较好。
表5 可行性定序logistic模型拟合信息表
3.3 定序logistic模型结果分析
定序logistic模型的结果分析由表6所示。
表6 定序logistic参数估计表
从表6中数据分析可得,粉丝数量、动态数目、每小时弹幕数的显著性检验均小于0.05,表明显著性较好,且这些因素的回归系数为均大于零,exp(βi)大于1或接近1,即这些因素对公众下单行为有正向影响,提高人们对这些因子的可行性评价,也能促进公众下单行为。
对于在线人数、累计赞数、总销量和每小时加入购物车数目对公众下单行为不显著,回归系数甚至还出现了负值。对此提出了疑问,对调查的部分直播间进行了再一次调查,发现一些直播间示的在线人数与直播间中显示的弹幕量、下单量、加入购物车数量严重不符,我们提出了一些直播间在线人数及其他一些指标具有严重虚假成分,这也解释了回归结果中在线人数等自变量对公众下单不显著。对此提出了可以运用对直播间的粉丝数量、累计赞数、在线人数、总销量、动态数目、每小时弹幕量等数据进行分析来判断直播间显示数据是否有造假。研究结果表明,网民对电商直播营销的总体满意度较高,且影响公众对直播营销满意度的主要因素为“职业”“弹幕评论数量”以及“平台宣传程度”。
4 总结
本文运用问卷调查方法探究社会公众对电商直播营销满意度及用户下单行为的影响因素。运用神经网络和支持向量机对比分析影响电商直播营销满意度的因素;运用AIDA模型设计问卷,对获取到的数据首先运用描述统计和各类图表分析法进行概括分析,然后运用神经网络和支持向量机对比分析影响电商直播营销满意度的因素,运用定序logistic模型对店铺信息与下单量进行回归分析,探究哪些店铺信息会影响用户下单行为,对直播电商营销现状有了较为全面的认识。并结合计划行为理论和行为经济学做进一步分析。