基于R语言编程的移动平均方法在卷烟产品销量状态分析中的应用
2020-12-03冯洪涛何雪峰吴家灿
张 涛,冯洪涛,何雪峰,吴家灿,杨 蕾
(云南中烟工业有限责任公司 技术中心,云南 昆明 650231)
销量数据科学分析结果对于指导产品市场策略有重要意义.目前,历史销量数据的研究主要用于未来销量预测,常用的数学分析方法有移动平均、指数平滑、线性回归等,但在实际应用中产品销售的历史数据样本量有限或不能完全满足线性规律,特别是卷烟产品,不同于一般在售产品,受政策、环境、节假日影响较大,基于卷烟产品销量的变化特征,近年来,一些数学分析方法譬如趋势分析法、时间序列预测方法、ARIMA 模型、BP 神经网络模型等被用于卷烟销量预算的研究分析.
曹鲁东以国内一类卷烟2009年到2012年月度数据为样本数据,进行季节性时间序列分析,并建立季节性时间序列分析模型,用于预测卷烟未来销量[1].李嘉霖选取2004年至2016年全国卷烟销量季度销量数据,采用时间序列确定性因素分解模型,对其趋势特征和季节波动进行分析,拟合出全国卷烟销量模型[2].吴明山等以2006~2017年全国卷烟销量数据为基础数据,选择ARIMA 模型、基于梯度下降算法的BP 神经网络模型、基于Levenberg-Marquardt 算法改进的BP 神经网络模型等3 种模型为单项预测模型,并利用BP 神经网络对各单项预测模型进行动态加权,构建非线性组合模型对2018 年1~4 月全国卷烟月度数据进行预测[3].
然而,目前对产品本身的销量状态、销售势能进行分析研究的相关报道还比较少.传统的研究方法在针对具体产品时通常采用年份销量的同比概念来确定产品销量趋势[4~6].美国著名市场营销学家菲力普·科特勒提出了产品生命周期包括:导入期、成长期、成熟期与衰退期4个阶段[5~7].对于卷烟产品来说,新品上市后的市场培育阶段,即导入期往往在2年以上或者更长.因此,对于上市后不满2年的新品,其销售状态的评价如果仍采用传统同比的方式,很大程度上会导致评价结果的失真,从而不能对卷烟新品销售趋势及未来走势给出相对准确的预判.
为了解决上述问题,提高卷烟产品销量状态、趋势分析的准确性,本文采用移动平均结合产品销量趋势判断和结果数据表格格式整理的方法在R程序平台上自编程构建了产品销量状态分析体系,并以全国范围(或特定价位特定省份)内不同卷烟规格2017~2018年共24个月的卷烟销量数据为基础数据,进行了提取及运算分析,对云产烟四大品牌和强势竞争具体产品销量数据进行了对比分析,发掘出常规、细支、中支、短支、爆珠等不同类型卷烟产品市场状态的趋势信息,以期为卷烟产品发展变化情况的分析提供更有效和及时的信息反馈,对于快速制定产品市场策略也具有重要价值意义.
1 材料与方法
1.1 数据来源
本文以2017~2018年全国不同卷烟规格商业销量数据为数据基础,数据格式见表1、表2,并通过后续的分析体系开发完成卷烟产品销量状态分析展示.
表1 全国不同卷烟类型数据基础格式样式示例表
表1用于筛选卷烟品类,可作为结果格式输出中分类汇总的前提;另外可以通过商业销量排序,并对上四分位数的卷烟规格进行筛选作为竞争产品,云产烟产品的识别主要是针对4大品牌“云烟”“玉溪”“红塔山”和“红河”在卷烟规格指标中进行模糊识别.
表2主要用于销量趋势情况的计算分析,利用月度数据为基础通过移动平均可以进一步提取产品销量趋势,而进行判断.
表2 全国月度数据基础格式样式示例表
此外,针对不同区域趋势的分析,可以通过输入特定省份地区譬如:HB省、BJ市进行自定义筛选.
1.2 分析方法
趋势数据提取本文采用移动平均方法对产品销售趋势进行分析.所谓移动平均,是选择一定的用于平均的时距项数K,采用对系列逐项递移的方式,对元系列递移的K项计算一系列序时平均数,一定程度上消除原序列中短期偶然因素引起的不规则变动,从而起到一定的修匀或平滑作用.当序列包含季节变动时,K应与季节变动长度一致,才能消除其季节变动;若序列包含周期变动时,K迎合周期长度基本一致,才能较好的消除周期波动.
值得注意的是,K为奇数时,只需一次移动平均,其移动平均值作为移动平均项数的中间一期的数值;而当K为偶数时,移动平均代表的是这偶数项的中间位置的水平,无法对正某一时期,则需要再进行一次相邻两平均值的移动平均,才能使平均值对正某一时期,这称为移正平均,也叫中心化的移动平均[9].
为了消除卷烟销售在传统春节和中秋等节日期间可能出现的销量骤增的趋势影响[10],本文利用移动平均方法对表2中具体卷烟产品规格的月度数据进行趋势提取分析,以两年为一个周期,通过12个月为步长的12次移动平均,及移正平均最终获得趋势数据.
销量趋势判断通过上述的12次移动平均结合移正平均后获得的趋势数据,一般情况下会呈现两种状态:1.趋势平顺且明显;2.趋势波动需进行数据截取后判断.具体表现如下:
(1)趋势平顺且明显,如图1.如果趋势处于上升状态(图1左),则利用最高点的趋势销量数据减去最低点的趋势销量数据获得的增量为反映当前卷烟产品的发展状态;如果趋势处于下降状态(图1右),则利用最低点的趋势销量数据减去最高点的趋势销量数据获得的减量为反映当前卷烟产品的发展状态.
(2)趋势波动需进行数据截取后判断,如图2.如果趋势处于波动状态,则根据趋势出现的拐点数来判断,一般根据背景数据的容量大小状态认为处于3个拐点数的趋势波动状态基本能囊括该产品的趋势发展状态.原则性判断为当处于一个拐点状态时,利用最后趋势点的数据减去拐点所在的数据来表示其趋势发展状态(图2左);当处于两个拐点状态时,利用最后趋势点的数据减去第二个拐点所在的数据来表示其趋势发展状态(图2中);当处于第3个拐点状态时,利用最后趋势点的数据减去第三个拐点所在的数据来表示其趋势发展状态(图2右).
图1 针对计算后趋势数据平顺且明显的示例图
图2 针对计算后趋势波动需进行数据截取后判断示例图
基于R程序平台的集成实现将上述的移动平均、产品趋势判断以及相应的结果进行整理,通过R平台中自编辑的程序予以实现;并利用Excel的VBA程序完成重点符号标示,其销量及趋势数据表现状态示例为:刚上市○,退市╳,趋势上升↑,趋势下降↓,趋势平稳-.具体步骤如图3:
图3 卷烟产品销量状态分析在R程序平台的实现步骤
2 结果与分析
2.1 基于不同价区不同规格产品的结果格式
利用不同价位的表1和表2以及卷烟产品销量状态分析集成程序,通过R平台运行后可生成如表3所示的示例表.本文以云产二类卷烟为例,进行了相关运算结果的演示.从表中可以得到年度商业销量的排序,按价位、规格、品类和计算后的趋势量、趋势方向,当前上市的省份地区数以及不足两年上市的产品时长等信息.根据这些信息,我们可以快速判断全国范围下云产二类烟中销量较大的产品、上市不足两年的新品及特殊品类产品的发展态势、增量快慢、覆盖范围特点等.
表3 云产二类烟销量及时间序列趋势情况示意表
2.2 基于特定省份不同价位不同规格产品的结果格式
利用特定价位的表1、表2和特定省份以及卷烟产品销量状态分析体系集成程序,通过R平台运行后可生成如表4所示的示例表,以150元零售价位的二类卷烟为例,在表3的基础上,以BJ市及HB省两个特定地区为例,进行相关运算结果的演示.从表4可以看出,该价位段卷烟产品在特定省份中云产品牌、竞争品牌、以及各个品类烟的综合趋势说明.我们还可以快速判断150元零售价位的云产二类烟在这些区域的销售及发展状态,排名在上四分位数的竞争产品规格发展状态,以及各品类烟数量及发展趋势方向.
表4 150元价位全国趋势处于稳定上升的BJ市、HB省各类别卷烟销量情况汇总示意表
3 结论与讨论
通过实例验证,本文方法体系具有如下优点:(1)可以消除传统卷烟新产品销量同比变化判断的不准确性,从而对上市不足两年的新产品发展状态及发展趋势给出相对准确的预判,(2)使用的移动平均方法有效消除了节假日等因素对卷烟销量变化的影响,提取的产品正常发展水平可信度较高,(3)整个产品销量状态分析体系主要通过R语言自编程执行实现,相比传统繁琐的手动分析,可有效节约时间,提高效率,对于快速掌握市场状态,有效预测产品未来发展趋势,指导产品市场策略具有重要意义;未来可望用于加载到产品销售大数据分析系统中,成为产品市场表现实时监控判断功能的一部分.
但是该产品销量状态分析体系也还存在一定不足,譬如:在趋势波动的状态下,目前只针对后部的趋势方向进行了截取,如果和趋势较为明显的产品在同一个层面上比较可能会存在一定偏差,后续可以考虑在平均周期增量的情况下进行增减量效果的判断从而增加发展状态变化的合理性;其次,在数据处理分析中发现,对于趋势存在波动的拐点其实可以作为趋势变化的重要节点.后续可以根据拐点的产生进一步寻找销量出现变化较大的省市地区,有助于及时发现产品发展存在变化的问题和原因.