基于混沌RBF神经网络的电商市场 销量预测模型技术研究*
2023-10-30刘电威牛龙龙
刘电威,牛龙龙
(1.广东科学技术职业学院 商学院,广东 珠海 519090;2.湘潭大学 数学与计算科学学院,湖南 湘潭 411105)
0 引言
随着互联网技术的广泛应用,网络购物已经成为重要生活方式,电商平台作为网络购物的主要渠道,促进了互联网经济,也成了社会经济增长的重要引擎.据国家统计局数据显示,2019年,我国线上零售额达到13.1亿元,同比增长11.02%,在社会消费品零售总额中占比24.5%,位居全球第一.在经济增长动力不足,市场竞争激烈环境下,商品销量的预测变得非常重要.通过对商品销量历史数据分析和研究,能够精准地预测商品销量,帮助平台和商家实现精细化的商品库存、采购、营销等经营工作,有效降低经营成本,并且精准把握客户需求信息.根据研究表明,商品销量的影响因素比较多而且复杂,因此,这些数据具有非常明显的非线性特征[1-2].
目前关于商品销量预测的主要方法包括时间序列法和神经网络法[3].罗洪奔等[4]针对金融市场中存在的诸多干扰因素,提出了一种基于合作对策的股指时间序列智能组合预测方法.付敏娟[5]在指数平滑模型较大的预测误差和神经网络的过拟合问题进行分析的基础上,提出了用二次指数平滑序列改进BP神经网络的指数平滑神经网络太阳能热水器销售预测模型.圣文顺等[6]用遗传算法改进传统的BP神经网络,并用时间序列对模型进一步校正,大大降低了预测误差.王建伟[7]利用产品销售共性提取产品聚类簇,再使用时间序列模型得出预测结果并通过隐马尔科夫预测模型给出预测结果的概率分布.Takens 等[8]对各种方法在时间序列中的可预测性及其性能方面做了分析和对比,得出这些方法在需求相对时间基本稳定行业能够达到良好的效果.然而,这些方法并不适用于电商平台商品销量预测,因为这些需求受到多种因素的影响,如天气、国家地区、评论等.因此,需要探索更加综合和精准的预测方法来应对这些复杂的影响因素.
以上方法的预测是建立在大量稳定数据前提下,对于受促销活动、季节变化等因素造成的销量影响缺乏敏感度.为此,针对电商商品销量变化的复杂非线性特点,本文提出基于混沌RBF神经网络的商品销量预测模型.该模型将混沌特性与神经网络的非线性逼近能力结合起来,提高了对于非线性影响因素的敏感度.其中,混沌特性用于优化神经网络的参数,从而提高了预测的精度.同时,采用RBF神经网络结构,减少参数数量,避免过拟合现象的出现,提高预测速度.最后,通过真实销售数据的测试,证明了本文建立的混沌RBF神经网络的商品销量预测模型具有更好的精度与速度.本文的创新点在于将混沌理论应用到神经网络模型中,建立了更加综合和精准的商品销量预测模型,对于电商平台和商家具有实际应用价值.
1 混沌时间预测理论
目前混沌理论作为智能科学的一个热点研究领域,混沌时间序列分析方法已经在工程领域得到广泛应用.然而,混沌时间序列分析方法的应用也有它的局限性.在工程实践中应用之前,需要先判断应用对象的混沌特性,并进行相空间重构的前处理.为此,Takens[8]提出了用延迟坐标法对混沌时间序列相空间进行重构的理论,证明了可以从一维混沌时间序列中重构一个与其原系统在拓扑意义下等价的相空间,从而分析得出混沌系统的规律.
商品销量是对未来预测的一种重要指标,但由于其无法直接测量数值,需要通过影响商品销量的相关因素进行分析和计算.假设商品销量时间序列为{qi},(i=1,2,…,N),选取一个合适的延迟时间τ将原有序列q(t)等价变换为一个m维相空间的相量[9],即:
q(ti),q(ti+τ),q(ti+2τ),…,q(ti+(m-1)τ),i=1,2,3,…,M.
(1)
要将混沌时间序列分析方法应用于电商平台商品销量预测中,第一步需要评估电商市场商品销量数据序列与混沌序列的相关性,基于混沌时间序列分析的方法主要包括Lyapunov指数分析、功率谱法、信息搜索分析等.本文采用Lyapunov指数分析法,通过对电商市场商品销量模型进行李亚普洛夫指数(Lyapunov指数法)值的判定,与零值进行比对,评估电商市场商品销量数据模型时间序列的混沌特性.
具体地,本文通过对电商市场商品销量模型进行Lyapunov指数法值的判定,并将其与零值进行比对,以评估电商市场商品销量数据模型时间序列的混沌特性.此外,本文还将功率谱法和信息搜索分析等方法进行了梳理和比较,最终选择了Lyapunov指数分析法作为本研究的混沌时间序列分析方法.
具体而言,本文采用了Lyapunov指数分析法来评估电商平台商品销量数据序列的混沌特性.该方法通过计算系统中所有相邻轨迹之间的Lyapunov指数,判断系统是否是混沌的.本文将此方法应用于电商平台商品销量的时间序列分析中,以确定其是否具有混沌特性.此外,本文还对其他混沌时间序列分析方法,如功率谱法和信息搜索分析法等进行了梳理和比较.最终,选择了Lyapunov指数分析法作为本研究的混沌时间序列分析方法,因为该方法具有较高的准确性和可靠性,能够较为准确地评估电商平台商品销量数据序列的混沌特性.
目前常用相空间重构方法有以下几种:函数关联法、信息互动法和C-C方法[11-13].其中,C-C方法是一种基于混沌时间序列分析的相空间重构方法,旨在将高维的时间序列转化为低维的相空间表示,并且能够有效地处理非线性时间序列数据.与其他相空间重构方法相比,C-C方法具有较强的鲁棒性和预测精度.
针对商品销量预测的特点,本文选用了C-C方法结合小数据量方法来进行相空间重构,改进Lyapunov指数算法[14],这样能够同时确认嵌入维数m与时间延迟τ的值[15],具体计算步骤如下:
步骤1:用Lyapunov指数法对商品销量序列的混沌特性进行判断,通过快速傅里叶变换(FFT)得出序列的平均周T;
步骤2:用C-C方法计算重构相空间的嵌入维数m、时间窗口τw及时间延迟τ的结果,C-C计算方法的步骤如下:
1)计算给定时间序列的标准差σ;
(2)
(3)
(4)
选择20天内的序列数据,通过式(2)、式(3)、式(4)对数据序列的相关性进行分析.
3)通过式(3)中第一个极小值确定时间序列的第一个独立局部最大值[9],得到对应的延迟时间τ=tτs.同理,利用Scor(t)最小值就能够得到时间窗口τw=tτs,并根据式(5)计算出重构相空间嵌入维数m.
τm=(m-1)τ.
(5)
(6)
(7)
步骤5:假定相空间内第i个点按照最大Lyapunov指数为速度进行发散,得到di(j)=Cieλi(jΔt),此处Ci是初始分离距离常数,通过对数变换处理,可知lnDi(j)=lnCi+λ1(jΔt),i=1,2,…,n.此式表达为近似平行线组,式中λ1可以归纳为直线组的斜率.然后通过最小二乘法拟合求得最大Lyapunov指数λ1,如下:
(8)
2 混沌RBF神经网络预测模型
2.1 混沌RBF神经网络模型
RBF神经网络是一种前馈型神经网络,其具有分析预测与学习能力强大、非线性映射能力强等特点[16],其网络结构包含输入层、隐含层、输出层[17].通过对输入层数据实施非线性变换处理,并在隐含层对数据进行映射和处理,然后通过输出层对隐含层数据实施线性组合处理,得到最终的输出结果.RBF神经网络具有网络结构简单、快速学习、非线性逼近效果好等特点,对非线性系统的建模提供了一种更好的研究方法.其网络结构如图1所示:
图1 RBF神经网络结构图
RBF神经网络数学表达式如下:
(9)
(10)
式中:f∈R1为网络输出向量;x(n)∈Rm为网络输入向量;φ(•)为Gauss函数;φ=[φ1,φ2,…,φm]T为隐含层输出向量;m为隐含层单元数;ci和ri分别为Gauss函数的中心和宽度;W=[w1,w2,…,wm]T为该网络输出层的权值向量.
本文将运用混沌理论对RBF神经网络进行改进,设计了混沌RBF神经网模型,用来研究商品销量的预测问题,建立起预测模型.通过混沌算法对网络的连接权值wi和高斯函数径向基中心ci进行优化,能够有效提高网络速度与精度,并实现全局最优.
网络训练时定义目标函数为:
(11)
式中:n为样本数;xk(j)为第j个样本数据中第k个输入值;yjd为j个样本中输出值;网络节点数m、半径ri的初始值可以根据经验确定;wi,ci经过训练后得出.
2.2 混沌RBF神经网络预测步骤
1)计算商品销售量的Lyapunov指数,并利用功率谱方法识别商品销售量的混沌特征.
2)根据C-C方法[13,18],计算销售量的混沌时间序列的相空间重构的最小嵌入维数m,m<2D+1,计算时间延迟τ.
3)基于混沌神经网络技术构建电商市场商品销量的预测模型,通过混沌优化算法对隐含层高斯函数径向基中心ci和输出层连接权值wi进行重构,获得隐含层高斯函数最优解.
4)对混沌神经网络进行训练,使目标函数J取最小.
5)确定最终数据采集方案,并重构和优化试验数据的相空间,基于混沌神经网络技术对重构优化后的试验数据模型预测与优化仿真,并与其实际值进行分析对比.
3 商品预测模型仿真实验
3.1 混沌特性判断
基于上述C-C算法评估 Lyapunov指数对电商市场商品销量数据模型的时间序列具有混沌特性.首先,通过对商品实际销售数据进行时间序列的快速傅里叶变换(FFT),计算时间序列的平均周期,然后能量加权平均值的频率是时间序列的频率为0.061 7.其倒数就是周期平均周期,即为16.2.通过前面介绍的C-C法可求出τ=2,τw=10,m=6.然后通过最小二乘法求出最大Lyapunov指数为0.062 1>0,因此,可以证明商品销量时间序列具有混沌特性[8],从而可以对其进行短期预测分析.
3.2 试验数据采集方案
目前对于商品销量预测研究主要以周、月为周期.随着电商平台迅猛发展,平台之间竞争越来越激烈,商品销量的变化越来越复杂,无法用以往的预测方式来适应这种变化.因此,本文建立的商品预测模型从时间维度划分为观察窗口与预测窗口,预测单位可以精确到日销量.
数据采集方案选择某电商平台上某商品的销量数据作为样本.该电商平台某商品的销售特点是,除了特殊节假日和重大促销活动影响之外,该商品的销量具有明显的周期性,以一个星期为周期,而周末的销量相对于工作日呈现出较大的增长趋势.周末因子是指周末与非周末之间销量的比值,该比值可以反映出周末对商品销量的影响.在建立商品销量预测模型时,考虑到周末因子的影响,可以将其作为一个重要的预测因素加入模型中.因此,预测模型主要采集历史日销量数据、历史日浏览量、平均浏览时长以及周末因子等多个方面的数据来观测该商品的销量变化.为了预测该平台未来一周的商品销量,本文选择该商品在一、二季度的历史销量数据作为数据样本.总共有181条数据,其中151条数据来自1月至5月,用于训练模型,另外的30条数据来自6月份,用于测试模型的预测准确度.本文的数据采集方案如图2所示.
图2 数据采集方案
3.3 RBF神经网络训练与预测
在电子商务平台上收集同一商品的5×500销售数据,并对其做归一化处理.其中,选取4×500组数据(1 s、2 s、4 s、5 s内)作为训练样本,另外的1×500组数据作为检验样本.RBF神经网络结构输入层包含4个节点,隐含层包含12个节点,输出层包含1个节点,学习步数为3 500,允许误差为0.01.RBF神经网络模型的预测效果如图3所示.
图3 RBF神经网络模型预测
3.4 RBF神经网络训练与预测
图4 混沌RBF神经网络模型预测
3.5 误差分析与比较
表1展示了RBF神经网络商品销量预测模型和混沌RBF神经网络预测模型的误差及用时对比结果.通过对图2~图3和表1的数据分析验证,可以得出结论:这两种商品销售预测模型都具有良好的预测精度,但是混沌RBF神经网络商品销量预测模型在精度和速度方面的表现更好.这证明了利用混沌理论优化RBF神经网络模型设计可以进一步提高预测精度.此外,混沌RBF神经网络模型的模型训练和运行响应速度显著快于RBF神经网络模型.
表1 商品销量预测模型误差及响应速度
4 结论
本文提出了一种基于混沌RBF神经网络的商品销量预测模型,并分析了商品销量时间序列的混沌特性.在电商平台上采集了真实数据作为训练样本数据和测试样本数据,并利用Matlab平台对预测模型进行了仿真实验.仿真结果表明,采用混沌优化方式可以显著提高基于RBF神经网络的商品销量预测模型的预测精度,同时也提高了模型的响应速度,能够为电商企业提供更准确的销售预测结果,提高企业的经济效益.因此,该模型可以在电商平台中得到广泛应用,帮助电商企业更好地管理库存和采购计划,提高营销效果,降低经营成本.同时,该模型还具有较强的可解释性,可以通过对模型参数和结构的分析,深入了解商品销售数据的内在规律和特征,为电商平台提供更为全面的数据支持.