APP下载

Prophet-LSTM混合模型对卷烟投放的预测

2022-11-21马勋政张吴波

关键词:卷烟神经网络混合

马勋政,张吴波

(湖北汽车工业学院 电气与信息工程学院,湖北 十堰 442002)

需求预测是对未来市场需求的整体分析和判断,卷烟需求预测是卷烟市场预测的中心目标.为了优化卷烟货源供应,落实公平合理投放策略,要求卷烟企业制定科学合理的卷烟投放预测策略.许多学者对卷烟销售的预测方法进行了研究.罗艳辉[1]等采用ARIMA模型对卷烟月度销售数据建模,实现了对卷烟月销量的预测.王伟民[2]等基于灰色马尔可夫模型,针对卷烟需求趋势与波动并存的特点,对卷烟需求量做出预测.刘璐[3]等利用支持向量机(SVM),建立阴历月计量的烟草销售模型.李敬德[4]等基于信息熵和BP神经网络方法,实现对信号奇异点进行智能检测.蒋兴恒[5]等提出基于LM算法改进的BP神经网络,实现卷烟月销量的预测.单个模型的预测对样本自身的要求比较特别,由于现实应用中的数据没有充分符合线性规则或样本量不足,对估计效果会造成一定程度的负面影响.因此,将多种预测方法的预测结果结合起来,建立组合预测模型,可以得到更准确的预测结果.王诗豪[6]等用ARIMA模型和SVR模型构建的组合模型,对铜仁市卷烟需求进行了预测.谷嘉炜[7]等提出XGBoost-ESN组合模型预测方法,提高了对股票价格的预测精度.朱俊江[8]等使用小波变换、回归分析和BP神经网络构建混合模型,对乡镇为单位的卷烟销售量序列进行预测.罗彪[9]等基于偏最小二乘法回归(PLS),采用ARMA和Holter-Winter季节模型拟合的组合模型,预测合肥省卷烟销售.本文亦构建混合模型,提出Prophet-LSTM混合模型.实验结果表明,基于Prophet-LSTM的混合预测模型与单模型相比,有更优的预测效果.

1 研究理论与方法

1.1 Prophet模型

Prophet算法[10]是Facebook开源的时序预测框架,它的核心在于分析周期、趋势、假日效应等时间序列特征.趋势项允许突变点以分段、线性的方式拟合,采用傅立叶级数建立周期模型.需要考虑节假日和特殊情况时,通过表格形式指定节假日和相关天数.Prophet模型为:

式(1)中,g(t)表示趋势的变化函数,包含逻辑回归函数和分段线性函数,用于拟合数据中的非周期性问题.基于逻辑回归的趋势项:

式(2)中,C表示模型承载量,k表示增长率,m为数据偏移量,伴随t的变化,g(t)趋向于上限C.基于分段线性函数的趋势项为:

式(3)中,k为增长率,δ表示增长率的变化量,m代表数据偏移量.

s(t)为周期项,表示数据的季节性趋势,通过傅里叶级数(Fourier series)拟合灵活的周期性效应,表达式为:

式(4)中,P为某个确定的周期,2n为希望在算法中使用的周期数目.

h(t)为节假日项,在真实环境中节假日或者某些大事件会对时间序列预测造成重大影响,而这些点周期性很难判断,所以,模型为其设置了一个虚拟变量.节假日项h(t)可以表示为:

式(5)(6)(7)中,Ki表示某一特定节日前后几天的影响;Di表示第i个变量,i为节假日,Di表示窗口期中包含的时间t,如果时间t为虚拟变量,那Di值等于1,否则为0;ε(t)为误差,表示模型无法预测的波动,其服从正态分布.

1.2 LSTM模型

长短期记忆网络[11](Long Short-Term Memory LSTM)是循环神经网络(RNN)的一种特殊类型.LSTM的基本结构是一个存储单元(细胞),用于记忆和显式传播不同时间步长的信息.LSTM的记忆单元利用细胞不同状态记忆不同时间的上下文信息.随着输入序列长度的增加,循环神经网络越来越难以捕捉最早阶段的信息——梯度消失.LSTM模型由遗忘门、输入门和输出门组成,使得LSTM拥有让信息选择性通过的能力,从而选择和保留重要信息,过滤与预测结果无关的信息,弥补RNN的缺点,解决梯度消失问题.

第一步,决定应该从细胞状态中遗忘哪些信息,由Sigmoid函数决定,输出的值,越接近0表示遗忘,越接近1表示保留.

第二步,决定应该在细胞状态中存储哪一些新信息.输入门决定哪些it应该更新,数据通过tanh函数得到一个新的候选值向量.这两个数值的计算:

第三步,更新LSTM旧细胞状态信息:

第四步,输出门决定应该输出哪些信息.在这一步中输出门Ot决定哪些细胞状态必须输出信息,然后细胞状态通过tanh层(值从-1到1),并在输出门乘以Ot.

式(12)和(13)中,σ为Sigmoid函数,U*和W*表示权重系数矩阵,b*表示偏置向量.

2 模型构建与预测

2.1 数据来源与处理

本文数据来源于湖北省十堰市烟草公司.收集汇总十堰市辖区范围内正常经营的14179户零售客户卷烟订购数据,形成以周为单位的卷烟订购时间序列.从中选取有代表性的商铺,将2019年7月到2020年10月的投放数据作为训练数据,2020年11月份到2020年12月份的投放数据作为预测测试数据.

为了使数据集更好地与模型拟合,使模型梯度下降,算法更快收敛,将数据导入模型之前,先对数据集进行归一化处理.归一化公式:

式(14)中,X为原始样本数据,max为样本的最大值,min为样本的最小值,N为归一化样本.

2.2 Prophet-LSTM混合模型

本文针对时间序列预测提出基于Prophet模型和LSTM神经网络模型的优化组合预测模型,并将BP(Back Propagation)神经网络[12]作为拟合模型.混合模型的主要思想见表1.

表1 混合模型算法

为了得到更精确的预测结果,首先针对卷烟投放数据建立Prophet模型和LSTM模型,设定LSTM模型在时间t的输出为ypreLSTM,Prophet模型输出为ypreProphet,t=1,2…n,采用具有10个隐藏层的BP神经网络拟合预测结果.

定义Prophet-LSTM混合预测模型为:

式(15)中,yprediction是Prophet模型和LSTM模型经过BP神经网络拟合的预测值;Y=[y1,y2,…yn]为t时刻神经元输入;F为激活函数;wi,b0分别为权重与阈值.通过BP网络拟合后得到Prophet-LSTM卷烟投放预测模型,见图1.

图1 基于Prophet-LSTM的卷烟预测流程

2.2.1 Prophet模型构建

Prophet模型对时间序列数据有着优秀的拟合能力,使用Prophet模型对卷烟投放量数据建模并进行数据预测.

第一,根据Prophet模型建模.Prophet算法依赖于两个主要参数,即ds列(日期戳)它必须是YYYYMM-DD格式,和变量值y列.

第二,调整Prophet模型的趋势参数和季节参数,根据经验设置changepoint=0.16,打开周季节性参数weekly_seasonality=True,调整模型拟合灵活性changpoint_prior_scale=0.5.指定预测区间为2020年11月份到2020年12月.部分参数设置见表2.

表2 Prophet部分参数设置

第三,生成Prophet模型拟合预测结果图,生成趋势项分解图.趋势曲线显示,这家商铺卷烟订购量呈现出稳步上升趋势.

2.2.2 LSTM模型构建

LSTM模型投放量的预测不仅与历史数据相关,还受到邻近数据的影响.LSTM模型的输入由窗口大小(w)和输出由水平因子h(水平因子表示进行预测的距离)控制,实验中,w取3,水平因子h取2,构建投放量预测矩阵见表3.

表3 LSTM预测矩阵

采用4层LSTM构建循环神经网络,设置随机化中子数seed=1,迭代次数为5000,激活函数选择ReLU.

为了优化LSTM模型的训练效率,优化器采用Adam算法,模型学习率设置为0.001,损失函数使用均方误(Mean Squared Error,MSE).

2.2.3 BP网络模型构建

采用MATLAB神经网络GUI工具箱创建BP拟合模型.模型隐藏层的神经元设置为10,隐层神经元的传递函数采用TRAINLM函数,为了优化BP网络拟合速度,采用LM(Levenberg-Marquardt)算法对模型进行训练,模型最佳验证性能为第6轮.

3 实验结果与分析

3.1 模型效果评估

为了测试和检验所模型预测的准确性,本文中使用均方根误差(Root Mean Square Error,RESE)和平均绝对百分误差(Mean Absolute Percentage Error,MAPE).公式为:

式(17)(18)中,n是误差评估计算中涉及的数据数量,y是实际数据,y*是预测数据.RMSE和MAE值越小,预测模型的预测精度越高.

3.2 模型预测结果

引入LSTM模型作为对照组,Prophet-LSTM混合模型和LSTM模型的预测结果见图3.可以看出,Prophet-LSTM组合模型精度最高,预测效果明显优于其他模型,并且其预测曲线十分接近于真实值曲线.

图3 预测结果对比

使用RMSE和MAE指标来评估Prophet、LSTM模型和Prophet-LSTM混合模型.Prophet-LSTM混合模型的准确率最高,LSTM其次,Prophet模型准确率相对最差.Prophet-LSTM混合模型更适合对卷烟投放数据进行预测.

4 结论

本文提出Prophet-LSTM混合预测模型,预测烟草公司卷烟投放策略对卷烟市场的影响.实验结果表明,Prophet-LSTM混合模型的预测精度最高,与单个模型相比,大大提高了预测精度,对于卷烟订购量预测具有一定的应用价值.

在时间序列数据众多预测算法中,目前更多的是针对时间序列本身进行分析,主要考虑的是单一因素的预测,如何将更多的影响因子考虑进来,并在此基础上引入新的模型,从而得到更准确的预测结果,将是未来的研究方向.

猜你喜欢

卷烟神经网络混合
混合宅
卷烟智能自助迷你仓配送服务模式探索与应用
基于递归模糊神经网络的风电平滑控制策略
基于消费心理学的卷烟市场营销策略探究
浅谈农村卷烟市场拓展和网建水平提升
一起来学习“混合运算”
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
基于支持向量机回归和RBF神经网络的PID整定
用购进已税烟丝生产的出口卷烟,能否扣除外购已税烟丝的已纳税款