基于互信息的卷烟货源分配模型研究
2019-05-20谭建肖正中欧增发胡艳琼
谭建,肖正中,欧增发,胡艳琼
1 贵州财经大学,贵州贵阳 550003;
2 贵州烟草投资管理有限公司,贵州贵阳 550003;
3 贵州省烟草公司黔东南州公司,贵州凯里 556000
随着卷烟销售市场化的不断完善,卷烟货源投放模式发生了巨大变化。根据卷烟零售户的销售特征,合理化地制定各类型卷烟分配比例以及卷烟分配量,有利于提高卷烟市场整体销售水平[1-2]。在卷烟营销“稳产销、提结构、降库存、增税利”的调控方针下,深入挖掘卷烟零售户的销售潜力是一项重要的工作。零售户的经营能力是货源投放的基础,只有对零售户进行精准的分类,并通过精准的货源匹配才能更充分挖掘客户销售潜力,所以对客户和货源的精准分类是货源投放的关键。关于货源分配策略已有学者进行了相关研究,张红梅等(2012)引入区位商理论分析了卷烟货源分配策略[3]。张伟丰等(2013)通过分析区域货源投放量、实际销售量与零售价格之间的相互关系,采用BP神经网络预测建立了卷烟零售量价控制模型调控各品类的投放量[4]。王晓宇等(2015)基于相似度计算优化和指标加权优化的改进K均值算法研究了货源精准投放策略[5]。陈皓(2015)则基于客户经营能力,根据进货量、进货金额等因素对客户进行评分分类,然后使用近邻分类KNN算法,根据客户商圈、业态等客户属性确定客户类别用于指导新入网客户的客户分类,并据此进行货源投放[6]。邹亮(2015)提出了以价值评价为基础、以价值量分配为核心、以单项资源为总体的货源分配方法[7]。徐亚雄(2015)通过建立客户分级评价体系,根据客户真实销售情况,核定客户货源供应总量上限,按货源属性并结合价类、地区、客户级别、客户需求等因素制定卷烟投放策略[8]。许泓和刘文倩(2016)利用数据挖掘(DM)方法计算新产品属性重要程度,再结合模糊综合评价法对零售户的销售能力进行评分,获得零售户的G值,最后根据G值排序进行货源投放[9]。
上述研究主要基于零售户的不同特征,采用不同的算法对零售户进行分类后进行货源投放,而全面考虑零售户的各类特性并结合各类品牌历史销售数据研究货源投放的模型鲜见。每个卷烟零售户有多种不同属性,包括所属行政区域、市场类型、经营业态、经营规模、商圈类型、客户分档等,这些属性的不同使得货源投放也存在差异。卷烟货源分配方案还需要考虑多种因素,例如零售户销售量、平均销售价格、销售量变化趋势、销售价格变化趋势、历史满足率等,其中销售量、销售量变化趋势以及满足率影响卷烟分配量,销售价格和销售价格变化趋势影响卷烟分配类型。
本文将零售户销售量、销售量变化趋势定义为卷烟零售户销售特征。根据卷烟零售户属性在理论上存在40万多种属性组合,将所有属性组合纳入到零售户销售特征分析中显然是不合理且不必要的。不同零售户属性作为影响零售户销售特征的内因,对各项销售特征存在不同程度的作用。本文将零售户属性对零售户销售特征的影响进行定量化分析,以便找到影响不同属性的最优的属性组合,用于分析卷烟零售户销售特征的共性信息,以帮助制定卷烟货源分配策略。卷烟货源分配模型整体思路如图1所示。
图1 卷烟分配模型示意图Fig.1 Schematic diagram of cigarette distribution model
1 基于互信息的属性分类
相关性系数用于衡量两个变量的线性相关性,两变量相关性系数的绝对值越高,说明两变量之间的线性相关性越强。相关性系数无法度量变量之间的非线性相关性,而互信息可以用于度量非线性关系。考虑到行政区域、市场类型等卷烟零售户的特征属性为分类变量,且这些变量与卷烟销售之间的关系难以用线性关系刻画,本文使用互信息方法刻画零售户属性对零售户销售特征的影响程度。
1.1 零售户属性
零售户属性分为行政区域、市场类型、经营业态、经营规模、商圈、客户分档等6个维度,零售户销售特征分为各等级卷烟销售量和销售量变化趋势。零售户的属性会对销售特征产生一定的影响,例如黔东南州卷烟销售数据显示,不同行政区域卷烟销售量变化趋势不同,75%的地区平均销售量逐年上升,只有丹寨、三穗、天柱、镇远4个地区有下降趋势。不同属性对不同销售特征的影响程度不同,例如市场类型对销售价格的影响很大,但是行政区域对销售价格的影响相对很小。
1.2 零售户销售特征
零售户卷烟销售特征用一至五类卷烟的销售量以及销量趋势刻画,共10个分量。卷烟按照零售价格分为以下5类:一类烟零售价180元/条以上,二类烟零售价130-180元/条,三类烟零售价60-130元/条,四类烟零售价30-60元/条,五类烟零售价30元/条以下。下面将对卷烟销量和销量趋势作具体定义。
卷烟销量:考虑到单个销售周期内各卷烟零售户卷烟销量具有较大的随机性,不利于发现卷烟销量和零售户属性之间的真实规律。因此本文取窗口为3期进行平滑处理,即计算当前销售周期t,以及t-1和t-2销售周期内卷烟零售户卷烟销量的均值代替当前销售量。
卷烟销量趋势:通过线性回归方法定义卷烟销售趋势,具体方法如下:记t销售周期的销售趋势为k,收集五个连续的销售周期中的卷烟销售量,线性回归方程记为:其中ε代表随机项。采用最小二乘法计算卷烟销售趋势k,对于线性回归模型运用最小二乘法估计模型参数
1.3 零售户属性与零售户销售特征互信息
两个离散随机变量 和 的互信息定义为:
其中p(x)与p(y)分别表示随机变量X和Y的边缘分布,p(x, y)表示随机变量X和Y的联合分布。互信息的取值介于0到1之间,互信息值越大说明两个变量之间的关联性越强。本文使用互信息刻画零售户属性与零售户销售特征之间的关联。X属于零售户6个维度属性中的一种,Y属于销售特征中的一种。例如计算某行政区域 X与销售量Y之间的互信息时,X表示所有零售户行政区域离散值组成的向量,该向量的每个维度均对应一个零售户的行政区域属性,Y表示所有零售户销售量离散值组成的向量。
在定义零售户卷烟销售特征后,本文收集了黔东南州两万户家零售户近三年来的卷烟销售数据,并对零售户属性和卷烟销售特征进行互信息分析,结果如表1所示。
根据表1,选择每个销售特征最大的两项属性,最终发现任意类别卷烟的销售量均和经营规模以及市场类型的互信息最大;而销量趋势和客户分档以及行政区域的互信息最大。经营规模对销售量的影响是显然存在的,因此可以判定表1中互信息度量方法的可靠性。
根据每个销售特征影响力度最大的属性集合可以对零售户进行分类。例如与销量趋势关系最大的两个特征为客户分档和行政区域,客户分档共含30个档次、行政区域分为等16个,则所有零售户的销量趋势分为480类,每个属性组合对应一个子类。每个子类内部的销量趋势具有一定的共性,可视为影响销量的内在因素,子类总体的销量趋势将作为分析子类内部零售户销量趋势的重要组成部分,进而影响卷烟货源分配方案。
表1 零售户属性与零售户销售特征互信息Tab.1 mutual information of retail properties and retail sales characteristics
2 卷烟货源分配策略
在使用互信息分析了卷烟零售户的属性与其卷烟销售特征之间的关系,并利用与卷烟销售关系最密切的属性对黔东南州卷烟零售户进行分组之后,本节将结合零售户自身销售特征和其所属类型的共性销售特征对卷烟货源进行分配,并给出具体的分配模型。
市场上卷烟类别用j表示,第j类卷烟品牌规格数量为nj,假设卷烟零售户个数为m ,销售周期t内m个零售户的j类卷烟零售数据构成矩阵,其中表示销售周期t内第i个卷烟零售户第j类卷烟销售额。卷烟零售户i当前销售周期内销售特征是一个十维向量,其中hj表示第j类卷烟销量特征;其中cj表示第j类卷烟销量趋势特征。销售周期t + 1各类卷烟市场可以用t周期内的销量特征和销量趋势特征表示:。
对于每个特征采用互信息分类方法对零售上进行分组,记录每个分组中包含的各个零售户。对于每个零售户的每个销售特征,都可以找到相应的分组,并计算组内所有零售户该特征的均值,将其记录为:
假设各零售户对各类卷烟品牌规格的需求量构成需求矩阵D:
定义竞争权重矩阵:
假设卷烟类别j的第kj种品牌规格卷烟库存为则卷烟类别j中kj品牌规格分配给卷烟零售户i的数量为:
3 货源分配策略仿真
本文运用MATLAB软件以黔东南州2017年 月一类烟实施卷烟分配为例,其中第 月和 月卷烟分配数量是根据传统星级客户策略实施的数据。根据互信息分析结果,本文分别从经营规模以及市场类型、行政区域来分析货源分配策略,具体结果如表2、表3所示。
为评价本文的分配策略效果,采用许泓和刘文倩(2016)中分配量提升度α计算公式:
表2 不同经营规模以及市场类型卷烟分配结果(单位:条)Tab.2 Cigarette distribution results under different business scales and market types (unit∶ carton)
根据表2可以看出,在第 月货源投放总体提升度为17%,其中大型规模和中型规模分别提升29%和11%,而小型规模的分配数量有所下降。这也表明大型规模零售户有较大销售潜力可挖。
表3 不同行政区域卷烟分配结果(单位:条)Tab.3 Cigarette distribution results in different administrative regions (unit∶ carton)
从表3可以看出,雷山卷烟分配提升度最高达到34%,岑巩、从江、剑河、锦屏、黎平、榕江、台江等地区均超过20%。由此也表明这些地区零售户也有较大销售潜力。
通过上述仿真可以看出,基于互信息的卷烟分配策略在公平的基础上能充分有效地挖掘客户潜力,同时也表明了本文分配策略的有效性。
4 结论及展望
本文构建了一种结合卷烟零售户个性特征与所属子类共性特征进行卷烟货源分配的模型,该模型可以有效避免单独使用卷烟零售户个性销售特征进行货源分配时,因个性销售特征的噪声波动所造成的分配方式的不合理变化。子类共性特征代表了卷烟零售户所在子类的共性部分,是比较稳定且具有实际市场含义的货源分配指标。本模型中个性特征与共性特征决定卷烟货源分配方案的权重比例仍需要后续研究完善。