基于BP神经网络的网络直播皮革服装销量预测
2021-06-18张志新石文奇程凡陈志军
张志新,石文奇,程凡,陈志军
(1.陕西国际商贸学院,陕西 西安712046;2.丝路文化创意产业研究中心,陕西 西安712046;3.武汉纺织大学,湖北 武汉430073)
近年来,随着互联网技术的快速更迭,网络电商直播带货模式发展迅猛。有关数据表明,截至2020年6月,国内电商直播用户规模超3.09亿,主播人数超40万,观看人次超500亿。对此,国内的服装服饰商家企业也相继转移到线上直播主战场。相比传统的网络购物,直播能全面地展示商品,再加上主播与消费者粉丝不断建立情感连接,互动性高且受众范围更广。这为皮革皮草服饰商家企业聚焦粉丝,实现引流拓客目的,催生了更大的市场[1]。与此同时,网络直播带来的大数据也为商家企业和学者了解其市场需求和预测未来的销量提供了宝贵的资源,网络直播市场的需求预测成为新的研究热点。
目前,针对网络服装服饰销量的预测主要通过采集挖掘各个影响服装服饰产品销量的因素进行多元、逻辑回归分析,拟合得出预测公式[2,3]。但由于数据的差异性,各个影响因素与销量是否有线性、非线性的关系变得不确定[4]。网络直播带货影响销量的因素更为复杂多变不可控。近年来,人工神经网络把大量无法用具体公式描述的数据逐渐引入到服装服饰的各项预测中[5-8]。因BP神经网络对信息具有极强信息综合能力,在处理非线性复杂和不确定关系中具有自适应性和灵活性,且使用范围极其宽广。基于此,本文将网络直播皮革服装服饰采集到的各项影响因素数据作为输入数据,以最终的支付订单数为输出数据,构建BP神经网络模型,并从中选取样本作为验证数据,实证分析直播带货皮革服装服饰销量预测的效用。
1 BP神经网络
BP((back propagation)神经网络是一种按误差反向传播训练的人工神经多层前馈式算法。因处理信息时不需要严谨的模型,只需要采集原始数据,通过不断修正网络参数(权值和阀值),使得网络的输出值和期望值的误差不断下降,并最终用相应的曲线来表述变量之间的映射关系,目前已成为最为广泛的模型[9]。一个基本的BP神经网络包括三层以上的结构。本文以三层输入单元层、隐层数据处理单元层、输出单元层进行建构说明,每个层包括一定的神经元。如图1所示。
图1 BP神经网络模型结构Fig.1 Model structure of BPneural network
2 研究流程图
BP神经网络将网络直播中采集到的各项数据进行输入、输出网络学习训练,构建相应的模型,然后通过测试样本数据进行仿真评估预测未来的销量数据。其研究的流程步骤为:
(1)通过各类直播平台采集某皮革服装服饰旗舰店一名固定主播一段时间内直播带货的各项数据并尝试构建训练样本集和测试样本集;(2)对数据进行奇异值、主成分样本分布预处理;(3)构建基于BP神经网络网络直播销量的预测模型;(4)利用MATLAB软件对训练样本集构建模型进行网络训练;(5)借助测试的样本集对训练好的模型进行直播销量的预测仿真。如图2所示。
图2 研究流程图Fig.2 Research flow chart
3 BP神经网络模型构建设计
3.1 输入层和输出层设计
因网络直播每个主播的风格差异较大,再加上直播平台数据产生较多,且相对复杂,为准确构建模型、便于研究,以抖音平台国内某知名皮革服装品牌旗舰店的一名固定主播为例,借助手淘淘平台对其某1个月直播带货的数据进行采集,去除奇异值,同时进行主成分分析。影响网络直播有粉丝评论、互动、主播自身、引导用户进店等主要因素[10,11],因此本文选取影响皮革服装网络直播销量的直播观看数、评论次数、点赞次数、粉丝互动人数、平均观看时长(秒)、封面点击率、引导加购人数、引导进店人数8个影响因素变量数据作为BP神经网络预测直播销量的输入层,将支付订单数1个变量作为网络直播销量的输出神经元。
3.2 神经网络数据处理
从3.1可以看出,输入层的节点数为输入变量的个数8,输出量为订单支付数,输出层节点数为1。输入层、隐含层和输出层层数都设为1。同时在BP神经网络中,采集的各项数据的物理意义和量纲不同。因此,在输入层和输出层的样本数据要进行归一化处理,将数据落在[0,1]之间。其归一化公式(1)为:
其中,Xi为标准化的数据,X为采集的原始数据,Xmax、Xmin分别为原始数据中采集的最大值和最小值。其部分数据处理后如表1所示。
表1 部分原始数据归一化处理结果(保留4位)Tab.1 Partof Normalized Processing Resultsof Raw Data(4 bits reserved)
3.3 隐含层神经元设计
在隐含层中神经元的数量多少会影响BP神经网络的性能。如果神经元数量过少,其收敛速度快,但预测的精度系数可能会降低;反之神经元过多,预测精度提升,但网络会出现收敛过慢或不收敛。隐含层神经元数量的多少会影响感知器神经网络的性能。因此,选择合适的隐含层神经元显得非常重要。本文借鉴经验公式进行计算。其中,m为输入节点数,n为输出节点数;a为调整值,范围在[1,10]之间的整数。根据设定的输入和输出神经元数量,得出本文的隐含层神经元数量范围在[4,13]之间。
4 BP神经网络模型实践
4.1 模型训练
以输入节点数为8,输出节点数为1,隐含层神经节点数初始值为4,一直尝试到13,逐一进行全部样本训练模拟仿真。节点传递函数使用tansig函数,训练函数使用trainlm函数,输出层采用purelin函数,其余采用系统默认进行网络神经训练[12,13]。BP神经网络界面处理和网络训练过程如图3、图4所示。
输入不同隐含层神经元节点数处理后,其均方误差都有变化,经反复训练,确定隐含层神经元数为6时,其均方误差最小,仿真效果最优。其样本训练数据回归系数效果图如图5所示(依次是训练样本、验证样本、测试样本和全部样本)。由图可知,其中样本的数据集和全部样本的R值均大于0.99,样本的数据点基本分布在直线上,这表明拟合线性效果较好。R值越接近1,表明输入层的变量对输出层的解释能力越强。
图3 BP神经网络处理界面Fig.3 Processing interfaceof BPneural network
图4 BP神经网络训练状况图Fig.4 Training status diagram of BPneural network
图5 BP神经网络直播销量回归效果图Fig.5 BPneural network livebroadcast sales regression effect diagram
4.2 预测结果性能分析
对4.1确定的程序做最终的保存,对预测得到的订单支付数据进行反归一化处理,对模型进行误差校验对比,网络直播下皮革服装销量的预测结果、误差结果如表2所示(误差在±20%以内均认为是合格值)[14]。
由表可知,BP神经网络在网络直播预测销量中,平均绝对值误差为6.79%,具有一定的可靠性。这也证明本文设计的神经网络预测模型输入变量和输出变量之间的关系信度较高,表明直播观看数、评论次数、点赞次数、粉丝互动人数、平均观看时长(秒)、封面点击率、引导加购人数、引导进店人数对网络直播下皮革服装服饰的销量具有重要的影响。这也从侧面显示电商直播涉及的影响因素主要体现在“人”“场”和“货”三个方面。皮革服装商家企业在皮革服装选品上需要选择有特色代表性的“货”;同时注重直播规划方案的设计;加强主播“人”对皮革服装专业化程度上的认知和提升;因各直播平台提供“场”,扮演流量分配、规则制定、场景服务角色,商家企业针对直播各平台要“有的放矢”,把需要走货爆单的皮革服装特色内容例如材质、色彩、工艺、款式、模特着装效果等各项捕获眼球的卖点信息、感知价值、体验通过主播传递给用户粉丝,抓好私域流量转化机会,吸引更多的点赞、评论、互动,缩短“人”与“货”之间的距离,促进销量的提升。
表2 BP神经网络预测结果误差校验Tab.2 Error verification of BPneural network prediction results
5 研究结论
本文以影响网络直播带货的因素作为输入变量,构建了基于BP神经网络的皮革服装网络直播销量预测模型。通过对网络层数、输入、输出、隐含层神经元节点的设计,对网络模型进行了训练和仿真测试。实验结果表明,隐含层节点数为6,仿真效果较优。同时,从预测结果来看,平均绝对值误差为6.79%,仿真结果基本与实际数据相符合,具有一定的参考价值,可满足网络直播下皮革服装服饰的销量预测。但文章仍有许多不足,例如对网络直播下的主播和粉丝的特质、“网红”的带货能力等因素未进行考虑;样本的容量设计只是基于1个月,数据的精准度还不是很够,模型的校验还有继续降低误差的空间。在未来进一步的研究中,将探寻更多的影响因素变量,寻找更好更优的网络参数,提升网络直播销量的预测能力。