基于混合模型的卷烟销售量预测
2016-11-16朱俊江何湘竹王建树李孝禄张远辉
朱俊江,何湘竹,王建树,李孝禄,张远辉
1 中国计量大学,机电工程学院,浙江省杭州市下沙高教园区学源街258号 310018;
2 中南民族大学,电信学院,武汉市洪山区民族大道182号 430074;
3 湖北省烟草专卖局(公司),信息中心,湖北省武汉市乔口区解放大道618号 430030
基于混合模型的卷烟销售量预测
朱俊江1,何湘竹2,王建树3,李孝禄1,张远辉1
1 中国计量大学,机电工程学院,浙江省杭州市下沙高教园区学源街258号 310018;
2 中南民族大学,电信学院,武汉市洪山区民族大道182号 430074;
3 湖北省烟草专卖局(公司),信息中心,湖北省武汉市乔口区解放大道618号 430030
为科学制定市一级烟草专卖局的烟草投放策略,提出采用小波变换、回归分析和神经网络算法构成的混合模型对乡镇为单位的卷烟销售量序列进行预测。通过小波分解,将非平稳性销售量时间序列转化为低频分量、中频分量和残差分量三部分,分别用于模拟整体趋势、季节性波动和非平稳波动。然后,采用回归分析和神经网络算法对不同分量分别进行预测,最后将各部分预测结果叠加形成最终预测结果。以湖北省某市的卷烟销售数据为例,对所提方法进行了验证,结果表明:相比于自回归移动平均模型和神经网络算法,混合模型分别降低预测偏差率4.62%和2.58%。
卷烟销售预测;混合模型;小波分解; 线性回归;神经网络
烟草专卖局(公司)根据烟草专卖制度对卷烟进行销售和管理,将卷烟投放到持有烟草专卖许可证的卷烟零售户,零售户将卷烟销售给消费者。烟草公司在对卷烟进行投放时,必须考虑市场真实需求。否则,不仅会因为分配不当使得客户满意度下降,而且会导致零售户之间的“窜货”、“囤货”等现象,甚至引发社会矛盾。
目前市一级烟草公司的投放策略人为因素过重,带有很强的主观性,容易导致不公平现象。卷烟营销市场化取向改革[1]的提出为解决这一问题提供了新的思路。在烟草行业市场化取向改革的大背景下,建立科学、适用的卷烟销售预测模型,对于烟草商业公司合理地组织货源、有效地进行投放、为零售客户提供适销对路的卷烟商品意义重大。
目前,对卷烟销售量预测的方法包括两种:第一种方法通过建立宏观总体信息或微观个体信息指标和销售量之间的回归模型预测[2,3],宏观总体信息包括人口指标和经济指标[3],例如,地区总人口、地区GDP总量、居民消费总额、居民消费额指数、居民消费水平指数等。微观个体信息包括吸烟者每天吸食量、性别、年龄、教育程度、个人收入、饮酒量等[2]。另一种根据历史销售数据直接对销售量进行预测。典型方法包括神经网络算法[4]、马尔科夫链[5]等。显然,后者更具有易于收集数据,并且具有成本小和数据可靠等优点,因此具有更高的准确性和可操作性。然而目前根据卷烟历史销售量进行预测的研究多针对全国[5]或全省[4]范围进行,销售时间序列较为平稳,相对容易获得较好预测效果。而实际上,以乡(镇、办事处,以下简称乡镇)为单位的卷烟销售量已经具有稳定的规律,而且其行政区划足够小,因此准确预测乡镇卷烟销量对于市烟草专卖局制定投放策略具有很强的可操作性和实际意义。与全省和全国的销售量序列类似,乡镇卷烟销售量也具有二重趋势变化的特点,即整体趋势变动性和季节波动性。同时还受到很多随机因素的影响,因此数据还表现出很强的非平稳性。传统单一的预测模型针对卷烟销售量时间序列表现出的某一方面特征进行预测,方法不够精细化,因此在对乡镇销售量预测中难以取得较好的预测精度。最近基于小波分解和人工智能算法的一些混合方法开始被用于风力发电预测[6,7]和水质预测[8]等方面,这些方法具有更高的精细化程度,因此能够比传统方法取得更高的精度。基于此,本文提出一种混合模型,思路首先利用前置分解方法将卷烟销售序列分解为模拟不同波动特性的若干个分量,然后再针对分量特性进行单独预测。不同分量根据特定的分解方法得到,因此分量本身的特性已知,并且很容易辨识,故而这种对分量分别进行预测得到的结果必定更加准确。
1 方法
卷烟销售序列中整体趋势、季节性波动和随机波动的区别在于波动频率不同,因此基于混合模型预测方法首先采用小波变换对卷烟销售序列分解和重构,将原始序列划分为频带成分不同的分量,然后采用不同方法对每一分量分别进行预测,最终的预测结果是所有分量预测结果之和。
图1 混合预测模型Fig.1 Structure of hybrid forecast model
图1 给出了混合预测模型的架构。首先,选择小波分解算法对卷烟销售序列进行J层分解。将原始序列分为低频分量、中频分量和残差分量三部分。低频分量用于模拟卷烟销售量的整体趋势,这部分变化较为缓慢,是一种稳态过程,可以采用自回归模型(autoregressive model, AR)进行预测;季节波动性部分频率成分高于整体趋势,主要通过中频部分体现,因此可以采用自回归移动平均模型(autoregressive moving average model, ARMA)进行预测;残差分量由随机事件造成,波动具有不确定性,也具有更高的频率,是非平稳部分,可以采用人工神经网络(artificial neural network, ANN)进行预测。三部分预测结果的叠加就是整个销售序列的预测结果。
1.1 小波分解
小波分解可以通过Mallat算法实现,其思路是将信号正交投影到空间vj和wj,能对应得到分辨力j下的轮廓部分aj(n)和dj(n)细节部分。令j由零逐级增大,Mallat算法不断对上一级的轮廓部分进行分解,如图2所示。
图2 小波分解示意图Fig.2 Wavelet decomposition
对信号进行分解和重构后,最终得到:
在本文中,选用db6作为小波母函数,每次分解时高低通滤波器系数如表1所示。分解层数选为4层,第j层分解和重构后得到的分量的轮廓部分和细节部分分别记为aj(n)和dj(n)。得到的第4层的细节部分a4(n)记为低频分量:v(n),中频部分w(n)=d3(n)+d4(n),残差部分u(n)=f(n)-v(n)-w(n)。
表1 小波分解时采用的高、低通滤波器系数Tab.1 High-pass and low-pass filter coefficients for wavelet decomposition
1.2 AR模型
设v(n)之前的p个数据{v(n-p),v(n-p+1),...v(n-1)}已知,则AR模型利用这p个数据的线性组合预测v(n)的值:
采用AR模型对分解得到的低频分量进行预测的步骤如下:首先,选取训练数据,通过最小化预测值和真实值v(n)之间的误差可以得到系数{ak};其次,根据AIC准则计算p值;最后,将系数带入式子(2),并根据新的数据序列{v(n-p+1),v(n-p+2),...,预测得到下个月的预测量(n+1)。
1.3 ARMA模型
ARMA模型由自回归模型与滑动平均模型为基础“混合”构成。在零售研究中,用于具有季节变动特征的销售量、市场规模的预测等。通过小波分解得到的中频部分是季节性变动特征的体现,因此采用ARMA模型进行预测。设w(n)之前的p个数据{w(np),w(n-p+1),···w(n-1)} 已知,则 ARMA 模型可以给定如下:
其中,系数{ak}为自回归系数,{bj}为滑动回归系数,{ε(n)}为{w(n)}与独立分布的白噪声。E{ε(n)}=0,var{ε(n)}=σ2,ARMA 模 型 记 为:ARMA(p,q)。采用ARMA模型对中频分量进行估计的步骤如下,首先,根据样本,利用最小二乘估计、样本矩估计法对自回归系数、滑动回归系数和白噪声方差进行估计,可以得出{ak},{bj}和σ2;其次,根据AIC准则确定模型的阶数,p和q;最后将新的序列 {w(n-p+1),w(n-p+2),··(n)} 带入模型,得到新的估计(n+1)。
1.4 神经网络算法
神经网络是一种兼具自适应与自组织能力的学习型系统,能够精确描述非线性系统的变化规律[9],成为各个领域的主要预测方法。BP神经网络具有自学能力强、推广和概括能力强等特点,使其成为一种有效的预测工具。采用神经网络对残差分量进行预测时根据前N个月的残差分量预测下个月的销售量,具体步骤为:首先设计出一个包含输入层、输出层和隐含层的三层前馈神经网络结构,如图3所示。实验验证发现当p选为11时,预测效果较好,由此确定输入层的神经元个数为11。由于输出层输出数据只是一个月的预测值,因此设置输出层的神经元个数为1。隐含层的神经元个数由实验方法确定,最终设置为17个;其次,构造出长度为p的销售序列样本,{uj(n-p),uj(n-p+1),···uj(n-1),uj(n)},j=1···J, 以 {uj(np),uj(n-p+1),···uj(n-1)} 作为输入,uj(n)作为输出,采用Levenberg-Marquardt算法对神经网络进行训练,设置学习率为0.05,网络的动量因子为0.9,最高迭代次数为10000次,训练目标误差为1e-5;最后,通过新的序列,{uJ+1(n-p),uJ+1(n-p+1),···uJ+1(n-1)},预测出下个月的销量+1(n)。
图3 三层BP神经网络结构Fig.3 Structure of a three layer neural network
2 数据来源及预测结果
2.1 数据来源
本文数据来源于湖北省咸宁市烟草公司。将地理位置位于同一乡(镇、办事处)的零售客户销售数据进行归总,最终以月为单位形成了销售量时间序列。咸宁市共有11个乡、51个镇、6个办事处,收集到其中30个乡(镇、办事处)2010年1月份到2015年10月份的销售量时间序列。根据咸宁市的实际销售经验,将每条售价在40元(含)以下的卷烟划分为1级烟,40-80元(含80元)之间的卷烟划分为2级烟,80-150元(含150元)之间的卷烟划分为3级烟,150-240元(含240元)之间的卷烟划分为4级烟,240-400元(含400元)之间的卷烟划分为5级烟,400元以上的卷烟划分为6级烟。考虑到待处理数据的物理意义相同,且为统一量纲,故先确定了2010年1月到2015年10月之间销售数据的最大值和最小值,然后根据这两个值进行统一的归一化换处理,最终将所有销售数据归一化至[0,1]之间。将2010年1月到2014年12月的销售数据作为训练数据,2015年1月份到2015年10月份的销售数据作为预测测试数据。
2.2 结果
2.2.1 小波分解结果
采用小波分析法的分解与重构算法对卷烟销售序列进行4层分解和重构。按照章节2.1所提的方法将原始序列分为低频分量、中频分量和残差分量三部分。以R镇1~4级卷烟的销售序列为例,给出分解结果如图4所示。
图4 R镇1-4级卷烟销售序列的分解结果Fig.4 Decomposition results of sales sequence for the level1-4 cigarettes in town R
观察图4可知,低频分量反应了销量的整体变化趋势,从R镇各级卷烟的低频分量图可以看出该镇1级卷烟的销售量呈下降趋势,2级、3级、4级卷烟呈上升趋势,引起这种变化的原因可能是随着经济发展,消费者更加注重烟的质量和品质,也可能是卷烟价格上涨或烟草公司投放策略的变化等。相比于原序列信号,中频分量的波动性更明显,且通过分析其变化规律能够发现,中频部分更为突出地反映了随着季节的变换尤其新年前后的卷烟销售情况。采用小波分解得到的分量可以实现对卷烟销售季节性、周期性和随机性特点的有效模拟,具有明确的物理意义。
2.2.2 预测结果
(1)分量预测结果
采用单位根检验对低频和中频分量的平稳性进行检查,所得到的单位根统计量ADF分别为,-13.2523和-0.1572,都小于显著性水平1%~10%的ADF临界值,所以拒绝原假设,该序列是平稳的。采用LB模型对三种分量进行白噪声检验,滞后阶数为1~4时,Q值均小于P值,所以拒绝原假设,认为该三种序列不是随机序列。因此,分别采用AR模型,ARMA模型和神经网络模型对销售序列经小波分解、重构后得到的低频分量、中频分量和残差分量进行预测。针对R镇3级烟,在2010年1月到2014年12月销售数据的基础上,得出2015年1月到2015年10月的预测结果如图5所示。
图5 R镇3级卷烟的低频、中频和残余分量的预测结果Fig.5 Prediction of low-frequency part, mid-frequency part and residues for the level 3 cigarettes in town R
在图5中,虚线代表了实际的销售量,实线表示预测结果。从图5中可以看出,采用的三种方法对对应分量的预测结果和销售情况一致性较好,证明本文所提方法是有效的。
(2)总体预测结果
将各部分预测的结果相加后可以得到混合模型的预测结果。直接采用神经网络算法和ARMA模型对销售序列预测的结果与混合模型预测结果对比如图6所示。
采用平均偏差率对三种方法进行衡量。平均偏差率的计算公式如式(4)所示。
其中,(n)表示第m个乡镇的第n个月的预测值,fp(n)表示第m个乡镇的第n个月的真实销售量。1~6级烟的预测结果如表1所示。
图6 R镇3级烟预测结果Fig.6 Final prediction result of the level 3 cigarettes in town R
图6 给出了分别采用3方法对R镇3级卷烟进行预测的结果对比。以2015年1月份的预测情况为例,采用混合模型得到的销量预测值为17221箱,比实际销售量15814箱多出1407箱,相当于该乡镇2.67天的实际销量。从表2中可以看出,采用混合模型对2级烟进行预测时能够达到最低的预测偏差5.78%,对6级烟的预测偏差最高,达到10.67%;平均偏差为9.06%。相比于ARMA模型和神经网络模型的13.68%和11.64%,分别降低了4.62%和2.58%。这是因为采用混合模型对销售量序列数据进行预测时能够根据分量的不同特性,选取不同的预测方法,并能够考虑到销售过程中的随机因素对预测结果的影响,提高了方法的精细化程度[7]。总之,相比ARMA模型和神经网络模型,混合模型法在处理乡镇卷烟预测时更有优势。
表2 平均预测偏差率对比Tab.2 Comparison of average error rate for each method
3 总结
为科学制定市一级卷烟专卖局的烟草投放策略,采用基于小波分解、回归分析和神经网络算法构成的混合模型,对乡镇为单位的卷烟销售量进行了预测。主要创新点包括:
首先,针对乡镇卷烟销售序列包含稳定分量和非稳定分量的事实,通过引入小波变换,将待预测的序列分解为三种分量。分量的物理意义明确,本身特性已知,因此可以针对不同分量选择适宜的预测方法。
其次,根据分量不同的特性,分别采用AR模型,ARMA模型和神经网络模型对低频部分,中频部分和残差分量进行了预测,方法更为精细化,因此得到的结果更加准确。
采用以乡镇为行政单位的卷烟销售量区域划分方法可以避免个体预测随机因素太多,和县(区)区域太大操作性不强的缺点。所提的混合模型比传统处理方法更加精细,不仅能够获得更低的预测偏差,为科学制定分配策略提供依据,而且为解决其他领域类似问题提供了新的思路。然而,文中的混合模型仅以历史销售数据为输入,相关结论在数据存在行政干预时可能并不适用。行政干预可能以突兀的方式作用于销售数据,也可能以平滑的方式作用于销售数据。因此,很难仅依靠数据分量本身的特征排除。后续的研究中,会将现有模型与宏观经济数据、社会库存数据和消费者数据等外部因素相结合对卷烟需求进行科学预测,以此减小行政干预因素的影响,找出更加准确的市场需求。
[1]凌成兴. 在2014年全国烟草工作会议上的报告[N]. 东方烟草报,2014-01-17002.
LING Chengxing. Report at 2014 National Tobacco Work Conference [N]. OTIENTAL TOBACCO, 2014-01-17002.
[2]王毅辉. 我国卷烟需求预测研究述评[J]. 中国烟草学报 ,2012(04)∶88-93.
WANG YiHui. A Review of the Studies on Cigarette Demand Prediction in China [J]. ACTA TABACARIA SINICA, 2012, 18(4)∶88-93.
[3]姚婷婷,毛正中,胡德伟. 价格与收入对中国居民卷烟需求和烟草控制的影响[J].现代预防医学 ,2010,37(10)∶1890-1892.
YAO Tingting, MAO Zhengzhong, HU Dewei. Impact of Prices and income on Cigarette Demand and Tobacco Control in China [J]. MODERN PREVENTIVE MEDICINE, 2010, 37(10)∶1890-1892.
[4]蒋兴恒, 朱素蓉. 基于Levenberg-Marquardt算法改进BP神经网络的卷烟销量预测模型研究[J]. 中国烟草学报 , 2011, 17(5)∶81-86.
JIANG Xing heng, ZHU Surong. Prediction model of cigarette sales based on BP neural network improved by Levenberg-Marquardt algorithm[J]. ACTA TABACARIA SINICA, 2011, 17(5)∶81-86.
[5]王伟民,汪沄,张国安. 基于灰色马尔科夫模型的全国卷烟需求预测研究[J]. 中国烟草学报,2009,15(06)∶66-69.
WANG Weimin, WANG Yun, ZHANG Guoan. Grey markov predicting in the analysis of cigarette demand in China[J]. ACTA TABACARIA SINICA, 2009, 15(06)∶66-69.
[6]De Giorgi M G, Campilongo S, Ficarella A, et al.Comparison Between Wind Power Prediction Models Based on Wavelet Decomposition with Least-Squares Support Vector Machine (LS-SVM)and Artificial Neural Network(ANN)[J]. ENERGIES, 2014, 7(8)∶5251-5272.
[7]Haque A U, Nehrir M H, Mandal P. A Hybrid Intelligent Model for Deterministic and Quantile Regression Approach for Probabilistic Wind Power Forecasting [J].IEEE TRANSACTIONS ON POWER SYSTEMS, 2014,29(4)∶1663-1672.
[8]Seo Y, Kim S, Kisi O, et al. Daily Water Level Forecasting using Wavelet Decomposition and Artificial Intelligence Techniques[J]. JOURNAL OF HYDROLOGY, 2015,(520)∶224-243.
[9]Ticknor J L. A Bayesian Regularized Artificial Neural Network for Stock Market Forecasting [J]. EWPERT SYTEMS WITH APPLICATIONS, 2013, 40(14)∶5501-5506.
Cigarette sales volumes forecast based on hybrid model
ZHU Junjiang1,HE Xiangzhu2,WANG Jianshu3,LI Xiaolu1,ZHANG Yuanhui1
1 Mechanical & Electronic Engineering Institute, China Jiliang University, Hangzhou 310018, Zhejiang, China;
2 Telecommunication School, South-Central University for Nationalities Wuhan 430074, China;
3 Information Center, Hubei Provincial Tobacco Monopoly Administration, Wuhan 430030, China
Forecast of cigarette sales in towns by method of time series analysis is meaningful, yet difficult. In order to improve the accuracy of forecast, a hybrid forecast model based on wavelet composition, autoregressive model, artificial neural network was presented. By using wavelet composition, non-stationary cigarette sales time series was decomposed into three parts∶ low-frequency part, mid-frequency part and residues,which corresponded to overall trend, seasonal change and stochastic volatilities, respectively. The low-frequency and mid-frequency parts were predicted by using linear regressive model, and the residues part was predicted by using artificial neural network. The method was tested by using cigarette sales data from X city in China’s Hubei province. Results showed that the hybrid forecast model outperformed autoregressive moving average model and neural network model by reducing prediction error rate by 4.62% and 2.58%.
cigarette sales prediction; hybrid forecast model; wavelet decomposition; linear regressive; neural network
朱俊江,何湘竹,王建树,等. 基于混合模型的卷烟销售量预测[J]. 中国烟草学报,2016, 22(5)
国家自然科学基金资助项目(No. 61302191)
朱俊江(1987—),博士,讲师,信号分析与处理,Email:zhujunjiang@cjlu.edu.cn
2016-04-19
:ZHU Junjiang, HE Xiangzhu, WANG Jianshu, et al. Cigarette sales volumes forecast based on hybrid model [J]. Acta Tabacaria Sinica, 2016, 22(5)