APP下载

基于决策树算法的卷烟零售终端价值评估研究

2024-12-21江明珠徐立伟

中国市场 2024年36期

摘要:文章结合E市卷烟零售终端发展情况,依次确立经营能力(规模)、位置匹配性、局部可达性、全局可达性和经营业态五个零售终端价值评价指标,利用决策树算法建立动态评价模型,对E市零售终端的当前价值和潜在价值进行识别与等级评定,并引入资源投放作为决策变量,预测投放效果,为E市卷烟零售终端管理决策提供支持。

关键词:卷烟零售终端;价值评估;决策树

中图分类号:F274文献标识码:A文章编号:1005-6432(2024)36-0105-04

DOI:10.13939/j.cnki.zgsc.2024.36.027

1引言

随着新零售终端的加入、现有零售终端的退出,以及零售终端自身规模、经营环境、业态等的变化,各零售终端的价值也随之改变,需要建立科学的价值动态评估模型。文章利用构建的评价指标对E市卷烟零售终端的当前价值和潜在价值进行计算,确定所属类型,通过不断调整给予不同零售终端合理的资源投放,达到零售终端整体优化的目的。

2决策树算法应用介绍

卷烟零售终端系统积累了大量的历史销售数据,其销售状况受到人口流动、政策调控、城市规划等的影响,一般可通过数据挖掘方法将销售数据中的潜在规律挖掘出来,应用于烟草公司对其零售终端系统的管理中。当前E市烟草公司零售终端系统管理中亟待解决的两个主要问题是合理确定零售终端评级和识别异常零售终端。

决策树分析是研究数据分类的一种数据挖掘方法,可将数据在没有“先验”知识的情况下进行科学分类。因此,可以根据历史数据将零售终端的多个适配性指标作为其属性,研究各属性和零售终端销售额/量之间的关系,从而获得合理的分类标准,为零售终端评级提供依据。同时还可对新加入的零售终端进行初步评估,为零售终端系统调整提供决策参考。基于这些优点,文章在对E市烟草公司零售终端进行价值评估时采用决策树算法。

3基于ID3算法的零售终端价值分析

3.1零售终端价值的影响因素分析

ID3算法运行时间短,算法描述简单,构造的决策树平均深度小,分类速度快,适用于数据量大、属性较少的情况。基于当前收集到的E市烟草公司零售终端数据,采用ID3算法对其零售终端价值进行评价,选择的指标包括局部可达性、全局可达性和位置匹配性三个终端空间适配性指标,以及经营能力(规模)、经营业态两个表征其状态的指标,对五个指标进行离散化处理(见表1)。

“经营能力(规模)”对零售终端的影响最显著。规模较大的零售终端通常所售商品品类更齐全,更容易成为消费者购物的首选渠道,吸引消费者的能力更强,在局部终端分布密度较高的情况下,规模大小成为影响终端业绩的最重要因素。

“位置匹配性”对零售终端的影响排在第二位。这个指标一方面能够反映出零售终端覆盖市场容量的大小,另一方面终端局部分布密度过高会导致匹配性降低。当前E市卷烟零售终端的空间分布过于密集的问题已经影响到零售终端业绩的表现,匹配性对于零售终端购进额影响显著。

“局部可达性”对零售终端的影响排在第三位。这个指标的影响与卷烟消费强调便利性的行为特征一致,结合卷烟消费的场景,购买通常发生在空闲时间,就近步行购买成为主要方式。

“全局可达性”对零售终端的影响排在第四位。虽然交通便利性、多种业态组合优势对零售终端存在一定的影响,但在卷烟消费的就近、便利场景需求下,其影响相对较弱。

“经营业态”对零售终端的影响最弱。一方面是由于在E市卷烟零售终端中便利店业态类型占比达到89%,使得该指标的影响不明显;另一方面是由于卷烟消费者行为特点,超市、商场等业态并不具备相比便利店业态类型的显著规模、信誉等方面的优势。在E市卷烟零售终端存续分析上,有47.3%的超市业态终端无法实现五年存续,这也从另一个角度说明卷烟零售终端的业态属性影响并未得以显现。

3.2零售终端价值的分析结果

选择E市城区存续达到五年及以上、地址信息完整的2523个零售终端作为训练样本,训练模型得到合理的指标体系,将各零售终端的购进金额2022年增长率作为结果变量并处理成离散值,以五年及以上存续零售终端2022年增长率均值10.56%为离散化基准,高于10.56%则为潜在价值高,取值1;低于10.56%为潜在价值低,取值2。利用2019年新加入并存续达到四年、信息完整的840个零售终端作为测试样本,11.38%(843个终端2022年增长率均值)为结果变量增长率的划分基准。样本训练汇总见表3。

选择存续时间五年及以上的零售终端作为训练样本点,主要是考虑到零售终端的培育需要时间,E市烟草公司渠道管理的政策实施效果也能在这些节点属性上得到更充分的体现,能够更好地挖掘哪些零售终端属性具备重要价值。同时,卷烟销售一般是零售终端销售的其中一类商品,选择存续时间长的终端能够有效去除经营方面与卷烟销售无关的因素影响。

由于样本数据集合数据量比较大,文章将不采用K次交叉验证的方法,而是根据实际情况分设训练样本集合和测试样本集合,样本集合中潜在价值“高”和“低”的终端分布情况如表4和表5所示,可以看出训练样本和测试样本分布特性和总样本保持一致。

在基于ID3算法的分析模型中,输入零售终端的属性值,可以对其潜在价值进行计算并分类,分为一般价值终端和较高价值终端,结合依据购进额和毛利率给出的现有价值评估,则可进一步将零售终端划分为现代功能提升店、全功能示范店、基础功能店和标准功能店,为E市烟草公司零售终端管理提供决策支持。表6为根据2022年数据进行零售终端价值分析的部分结果。

4基于CART算法的零售终端价值趋势预测

ID3算法无法处理连续型变量,应用仅局限于对属性分类。在完成零售终端价值分析的基础上,文章进一步采用CART算法,探索E市烟草公司资源投入、促销策略等对其新增零售终端销售情况的影响,模型的变量取值见表7。

模型以2022年的数据为分析基础,其中5493个零售终端信息完整,随机选择其中2500个终端作为学习样本,1000个作为测试样本。购进金额设置单位为万元,然后保留两位小数来简化计算。

由于无法实际追踪、计算2018—2022年单个零售终端具体的资源投入量,同时为与E市烟草公司当前的渠道策略保持一致,模型以优质现代终端、标准现代终端、普通终端、直营终端代表资源投入的四个等级。根据前述ID3算法的结论,经营业态、全局可达性对零售终端购进额的影响较小,针对购进额的预测模型中仅保留局部可达性、位置匹配性、经营能力(规模)。

基于CART算法的结果,输入测试样本达到的预测准确度为87%,说明模型有较好的适用性。其中资源投放对购进额的影响最显著,说明E市烟草公司当前的渠道策略收效明显,但现代终端的划分标准和终端购进额相对于该分析结果也存在一定影响,建议公司对渠道资源投放进行跟踪记录,后期可以对资源投放的量化方式进行修正。终端经营能力(规模)、位置匹配性、局部可达性对购进额的影响显著,其影响程度排序和前述ID3算法模型分析结果一致。以上CART算法模型采用的是2022年数据进行的训练和测试,经训练得到的模型可用于对未来年份的运算,为后续零售终端资源投入提供决策支持。

5结语

文章结合E市卷烟零售终端发展情况,引入局部可达性、全局可达性和位置匹配性三个指标,结合经营能力(规模)、经营业态,构建零售终端价值评价指标,对E市零售终端的现有价值和潜在价值进行识别与等级评定,对新加盟点当前能力和未来发展水平进行预测评估,为公司零售终端优化提供决策支持。

参考文献:

[1]艾凯龙.D市烟草公司卷烟零售终端建设与改进策略[D].成都:西南财经大学,2019.

[2]张艺.D公司供应链网络零售终端评价与选择研究[D].济南:山东财经大学,2021.

[3]梁晓庆.现代卷烟零售终端建设的探索和实践[J].中国商论,2021(4):40-42.

[4]徐杨菲.城市空间中的消费活力与区位价值:影响因素与作用机制[D].北京:清华大学,2017.

[5]李琰.“新零售”背景下对CCGW烟草跨界零售终端管理的优化研究[D].成都:西南财经大学,2021.

[6]秦朗.北京市“菜篮子”产品零售终端空间格局研究[D].北京:中国农业科学院,2021.

[基金项目]湖北省烟草公司鄂州市公司2023年度科技创新项目“卷烟零售终端资源的适配性及优化研究:模型与应用”(项目编号:2023EZ4CGJCYX2B001)。

[作者简介]江明珠(1991—),女,湖北鄂州人,硕士研究生,中级会计师,研究方向:财务审计、工商管理;徐立伟(1987—),男,湖北黄石人,本科,卷烟营销中心主任,研究方向:卷烟营销、营销转型、营销信息化。