数据驱动卷烟市场调控的探索与实践
2019-09-04林少华倪震海周飞
林少华,倪震海,周飞
1 中国烟草总公司浙江省公司,杭州市将军路9号 310001;
2 浙江省烟草公司湖州市公司,湖州市环城东路288号 313000
1 研究背景
行业几十年的发展历程一再证明:“稍紧平衡”是卷烟营销良性发展的法宝。坚持和维护“稍紧平衡”越来越成为行业共识。但是,“稍紧平衡”的实际操作却很难,从浙江烟草发展历程看,对市场趋势的判断存在以下难题:
一是卷烟销售出现拐点,市场趋势判断难。2012年以来,浙江烟草卷烟销量从最高的260.66万箱下降到2016年的240.89万箱,2017年开始出现触底回升的势头。如何科学预测市场,准确判断趋势,对指导货源衔接、布局市场、满足消费、调好状态是行业要克服的重要难题;二是效益增长高度依赖结构提升,结构空间探知难。2012年,全省卷烟销量达到顶峰以后,全省卷烟销售效益全部依赖于结构的提升。2012-2018年,全省单箱结构提升了1.33万元,年均增加2200元以上,而同期全国结构提升了0.84万元,年均增加1400元,浙江与全国的单箱结构差距从2012年的9200多元提高到2018年的1.4万元以上。如何探知结构空间,把结构提升建立在真实的市场需求基础上,既做足市场,又不盲目透支,需要多维度数据的综合分析;三是品牌竞争日趋激烈,波动明显加大,品牌状态评价难。品类之间、价类之间、品牌之间竞争激烈,细支、中支、短支、爆珠烟等创新产品成为一二类烟增量的主力,对传统优势品规产生较大冲击。如何更好培育品牌,按照市场状态投放,保持零售库存合理,市场价格稳定,品牌持续发展难度加大。
省级烟草公司承担着全省销售计划的确定和地市公司的货源分配的功能。为此,建立一套数据化的市场预测机制和市场调控机制迫在眉睫,对年度销售目标制定、销售节奏把握、维护市场状态、保证零售户盈利等具有深远意义。
2 研究目标和思路
从2012年开始,浙江烟草已经建立了涵盖“经济社会数据、批发数据、零售数据、消费数据、专卖管理数据”等“五维一体”的数据采集体系,不断对大数据进行针对性挖掘。在此“五维一体”的大数据基础上,探索更为深入、更为精准、更为科学的数据化决策和实践成为可能。论文旨在通过市场化的评价办法,智能化的工具和算法,着力提升省级烟草公司市场评价和预判能力、需求预测水平和数据化精准调控水平,减少非市场因素对经济运行工作的干扰,从而防范经济运行可能出现的市场风险,提升运行调控水平。
论文将数据驱动市场调控作为整体,分为发现市场问题、预测市场走向、调控解决问题三个方面,设计了一套依托于浙江烟草“五维一体”数据采集工作的评价、预测、调控体系,通过大数据动态评价市场状态、设定状态标准,评价市场运行的“稍紧平衡”状态;通过宏观经济预测常用的多层神经网络算法,预测未来每月(季度或年)的零售市场销量和发展趋势;通过两者的集合,依托模型开展数据化的宏观调控,形成一整套可判断、可预测、可调整的市场化“稍紧平衡”调控机制。
图1 稍紧平衡调控机制的总体思路Fig.1 The overall idea of a slightly tight balance control mechanism
3 实施途径
3.1 市场状态评价机制
省级烟草公司管理着总量、价类、价位段、品牌、规格及地市市场等不同维度的市场状态,为此建立数据化、动态的评价标准是市场调控机制构建的核心和关键,精准有效、逻辑清晰、符合实际的评价标准将极大地提升省公司营销决策的一体化、数据化管控水平。
表1 “五维一体”数据解析Tab.1 "Five-dimensional integration" data analysis
3.1.1 数据来源
浙江烟草历时10年,建立了“五维一体”的数据采集体系,积累数据资产规模已达38T,每天采集近10G的数据,这是浙江烟草数据运行分析体系的重要基础,具体如表1所示。
3.1.2 评价流程和方法
对烟草行业而言,通过价格和零售存销比(可销天数)来评价整体市场已经成为公认的标准。浙江烟草在10多年的数据分析应用过程中,扩展了支付宝结算零售价格指数,又增加了消费者行为数据和专卖查获量数据,对市场状态进行更精准的描绘,具体如表2所示。
表2 评价体系表Tab.2 Evaluation System Table
状态评价流程是:先按照零售存销比、支付宝结算零售价格指数进行阈值观测和状态临界值定量划分,再利用消费数据、专卖查获量数据进行定性验证。
状态评价的主要方法是:使用成熟的零售存销比指标,采用统计学的3σ准则来测算零售存销比(可供天数)阈值区间,最后根据运用移动存销比进行动态调整。
3.1.3 状态评价实施
表3 引入移动平均的终端存销比指标Tab.3 moving average terminal-storage ratio indicator
(1)选择评价指标。为了解决目前使用的当年终端存销比反应市场状态不灵敏的问题,采用移动平均终端存销比指标(MA)平滑异常波动,具体如表3所示。
图2 2015年-2019年全省总量移动存销比变化图(月)Fig.2 Change in the total mobile storage ratio of the province from 2015 to 2019 (month)
运用长期指标反映长期情况加短期指标反映趋势的方法,更加接近市场实际波动情况,可实现零售存销比动态化监测的目标。
(2)评价计算。如图3所示,采用统计学的3σ准则来测算零售存销比(可供天数)阈值区间。在样本数量充分大的情况下,对正态或近似正态分布的样本数值分布在(μ-σ,μ+σ)中的概率为68.26%,数值分布在(μ-2σ,μ+2σ)中的概率为95.44%,数值分布在(μ-3σ,μ+3σ)中的概率为99.72%,由此得出五个区间作为阈值区间划分依据,具体如表4、表5所示。
图3 3σ准则区间划分图Fig.3 3σ criterion interval division diagram
(3)阈值的动态调整。由于市场消费瞬息万变,为实现阈值区间既能反映市场长期趋势,又实现对短期市场更高敏感度的目标,在计算过程中引入动态调整系数:α
动态调整系数α=长期移动存销比(365天)/短期移动存销比(30天)
注:短期移动存销比越低,说明市场动销越快,则阈值区间相应进行扩大。
即:合理阈值=长期阈值*长期移动存销比(365天)/短期移动存销比(30天)
如表5所示,计算得出总量、五类烟、价位段、主导品牌、主导规格、地市公司、客户类别等多维度的存销比阈值标准,来判断各维度的市场状态,形成正常值、临界低值、临界高值,预警高值、预警低值五个方面的状态评价。
同时,通过实证比对,合理阈值区间的结果比长期阈值结果更能反映短期市场的变化,更适合作为用于中短期市场的调控依据,见图4。
表5 2018年全省总量维度阈值区间表Tab.5 2018 province total aggregate dimension threshold interval table
图4 总量存销比动态阈值区间表Fig.4 Total reserve ratio dynamic threshold interval table
3.1.4 状态评价结果
根据阈值计算移动平均修正结果,可以清晰实时计算出各维度的5种市场状态,分别为:正常区间、微调高值、微调低值、预警高值、预警低值,分别意味着稍紧平衡、偏松、偏紧、松、紧5种市场状态。说明该方法能客观、量化的评判市场状态,可用于后期市场量化宏观调控工作中,见图5。
3.1.5 评价结果修正
在实际操作中,为使状态评价更接近工作实际,可以用消费数据和专卖查获真烟数据来修正评价当期市场状态,见表6。
表6 消费数据及专卖查获真烟数据Tab.6 Consumption data and monopoly seizure data
3.2 市场需求预测
近年来,人工智能预测逐渐兴起,被广泛应用于宏观经济预测和商业预测,浙江烟草积累了“五维一体”足够大的数据量,可以更好地开展精准预测。
3.2.1 市场需求预测方法
由于卷烟零售是一种复杂的、非线性系统,难以用传统的方法进行预测,为此基于大数据的分析方法成为首选。本文选择了神经网络模型开展零售市场预测,作为一种先进的人工智能模型,多层的神经网络模型被广泛应用于经济预测和商业预测中。
如图5所示,通过对浙江烟草“五维一体数据”的分析,本文构建了神经网络预测模型。整个模型有六个输入、一个输出。其中,V1为时间点,V2为历史批发数据,V3为历史零售数据,V4为专卖查获数据,V5为经济增长数据,V6为消费者数据,P为下月终端数据。运用python软件进行不断的尝试,本文选取四层隐藏层构建神经网络模型,每层32个神经元,输出层1个神经元,共97个神经元。
3.2.2 预测流程
根据数据“五维一体”的特点,整体的神经网络采用relu函数作为神经元的激活函数。线性整流函数(Rectified Linear Unit,ReLU),是一种人工神经网络中常用的激活函数,通常指代以斜坡函数及其变种为代表的非线性函数。
图5 “五维一体”数据多层神经网络模型Fig.5 "five-dimensional integration" data multilayer neural network model
为了提高模型的预测精度,最大化学习效果,本文采用了动态的学习率(learning rate)参数。学习率直接影响每一步学习的进展速度,学习率越大,理论上学习的速度越快,但是有可能使损失函数不会缩小,也就是所谓的学习失败,过小则会让学习过程变得缓慢。
动态学习率初始值为0.1,这是一个较快的学习率。当学习过程中损失值不再下降时,模型自动把学习率缩小十倍,继续学习,整个学习过程一共缩小学习率两次。
为了提高学习效率,本文采用了Adam优化算法进行小批量(mini-batch)学习。Adam算法是动量梯度下降算法(Gradient Descent with Momentum)和RMSprop(Root Mean Squared prop)算法的结合,是一种比较高级的学习算法。除了逐步衰减的学习率超参以外,Adam算法的另外四个超参数取值分为为:用于动量梯度下降的动量窗口尺寸(Momentum Window Size) ,用于RMSprop的滑动均值窗口尺寸(RMSprop Window Size)β1=0.9,分母修正系数β2=0.999,Mini-Batch尺寸为64个数据点。
由于是用于预测实数数值的回归模型,本文采用平方误差作为损失函数,鉴于训练数据量的量级不大,因此在损失函数上加了L2正规化(Frobenius Regularization)处理以抑制模型过拟合(Overfitting),正规化参数λ=0.1。
正规化的损失函数如下:
3.2.3 预测结果
通过2015年1月至2018年12月浙江省经济增长指标、卷烟批发销量、卷烟零售销量、专卖查获真烟净流入量、活跃消费者人均消费量学习和计算,模型可以学习到零售销量的季节波动情况。除部分由于宏观调控的时点外,准确率均在95.2%以上,部分月度准确率高达97%以上,证明该方法准确可行,准确率可用于后期的市场调控工作,如表7所示。
表7 2015年1月-2018年12月月度零售销量预测表Tab.7 Monthly retail sales forecast for January 2015-2018
对于零售数据的预测,神经网络总体给出了较为精准的预测结果,说明整体预测方法精度较高。但由于重大节日的样本量还不够多,还需要更多的数据积累才能不断提高预测的准确率。
零售销量的预测是未来“互联网+卷烟营销”工作的重要基础,随着各项指标数据的积累和完善,随着多层神经网络算法的不断迭代,零售销量的预测准确率会越来越准,整体推动卷烟营销预测工作从经验判断向数据驱动转型。
3.3 卷烟投放调控模型
3.3.1 调控思路和方法
按照供应商管理库存的理念,通过预测下期零售销量,计算下期零售库存,判断下期末库存是否处于目标状态区间,从而开展基于市场状态的针对调控。
下期零售库存=期初零售库存+下期预投放量-下期预测零售销量
下期零售存销比=下期末库存量/下期预测日均销量
图6 数据化调控流程图Fig.6 Data flow control flow chart
根据市场状态判断和市场销量预测以及零售数据情况,建立了以月为基础的省级精准调控模块,通过输入不同的预投放量来判断下一期市场松紧状态,设定合理的存销比区间指导货源投放,提供量化的精准投放依据,推动卷烟货源供应从经验营销向数据营销进行转变。
3.3.2 建立宏观调控模块
根据数据化调控思路,通过省局层面6个维度的调控模块,形成不同层级的宏观调控机制,确保不同维度的市场状态保持在“稍紧平衡”区间,如表8所示。
表8 省级公司调控模块功能分布Tab.8 Function distribution of provincial company regulation module
主要应用方向有:
应用1:实施宏观调控。调控总量状态。评价当前市场状态是否稍紧平衡,通过设定预排供应量,总体把握下一期市场状态。
调控地市区域状态。通过实时监测地市状态,预测地市销量,跟进地市公司货源预排,调控地市投放工作,调控颗粒度可以细化到价类、主要品规。
调控品牌规格状态:通过品牌状态精准预测,分区域指导精准投放,调控颗粒度可以细化到具体的业态、客户类别。
应用2:指导货源预排。通过设定合理的目标市场状态值(稍紧平衡状态区间),测算下期货源预排量(区间),根据全省销量计划,进行统一的货源供货安排,实时衔接工业货源。
应用3:工商培育品牌。工商针对目标品牌、目标规格的市场状态,在全省的层面进行调控;预设品牌的目标状态值,根据深度学习模型预测零售销量,在全省范围内进行精准投放。
3.3.3 宏观调控结果
以浙江烟草T+1月运行调控为例,根据各价类、主要品牌、主销规格的“稍紧平衡”零售存销比(可供天数)区间,T月末都处于目标状态,按照神经网络算法预测T+1月零售销量,结合全省各地市T+1月批发销量预排数,预测T+1月末零售库存状态,出现预警的相应做出调整,见表9所示。
表9 运行状态调控表案例Tab.9 Operating status control table
4 小结
论文从浙江烟草“五维一体”的大数据入手,重点阐述了浙江烟草数据驱动卷烟市场调控体系的构成,详细研究了市场状态评价、市场预测、宏观调控三个方面的内容及研究的成效。
浙江烟草商业从2012年开始探索形成的数据驱动卷烟市场调控体系,实现了量化评价、量化预测和量化调控的目标,有效减少了市场调控的人为因素,提高了市场数据化调控的水平,提升了调控的精度和准度。随着大数据的积累完善,人工智能算法的加速迭代,将进一步有助于烟草商业企业透视市场变化,准确把握市场状态,推动卷烟营销从经验营销向数据驱动决策转型,对实现行业高质量发展具有重要的现实意义。