APP下载

基于K-Means聚类算法的净菜店客户管理

2019-06-28胡朝晖张革伕

物流工程与管理 2019年6期
关键词:净菜客户关系聚类

□ 胡朝晖,张革伕

(1.南华大学船山学院,湖南 衡阳 421001;2.南华大学 管理学院,湖南 衡阳421001)

1 引言

衡阳的一家连锁洗净菜企业在O2O高速发展下迅速成为一颗明星。在互联网支持下,洗净菜企业开设了以自主销售门店为示范。没有客户就没有收益,净菜门店更需要客户。研究客户行为,无疑能更好地把握企业的经营决策。研究客户管理者众多,客户管理能力是现代服务业发展所必需的[1],而信息与技术成为现代客户管理的最佳工具[2]。客户关系管理是客户管理的核心内容,备受重视。Adam Idzikowski等[3]研究了客户关系管理哲学在企业管理中的意义。Yangfan Li等[4]用实证方法研究了客户关系管理的商业价值,构建了一个两阶段模型,证明了客户关系管理可带来高额利润与价值。Wouroud Elfarmawi[5]研究了客户关系管理与产品创新之间的关系,使用客户关系管理系统可以吸引潜在客户,留住老客户。

通过客户关系管理改善企业经营,或者通过对客户行为的分析来发现经营的问题,这是一个问题的两个方面。本研究旨在研究洗净菜门店的客户行为,以帮助企业找到问题所在,提出解决策略。

2 K-Means聚类算法

K-Means是经典的客户聚类算法,通过计算客户特征数据之间的空间距离来把客户划分到不同类群体中。每一类群体内部具有良好的同质性(距离相近),而类之间则具有显著的差距。陆静[6]研究了K-Means算法在电信客户关系管理中的应用。K-Means算法简单,算法过程如下:

①从N个样本数据中随机选取K个对象作为初始的聚类中心;

②分别计算每个样本到各个聚类中心的距离,将对象分配到距离最近的聚类中;

③所有对象分配完成后,重新计算K个聚类的中心;

④与前一次计算得到的K个聚类中心比较,如果聚类中心发生变化,转②,否则转⑤;

⑤当质心不发生变化时停止并输出聚类结果。

距离的计算可以采用欧几里得或者曼哈顿方法,也可计算非连续型数据之间的相似性,一个类群内部中心与组成样本点之间的距离之和或者相似性之和稳定不变,那么这些样本点即构成一个类群。把客户分群可针对群体特征,制定管理策略,用好用准资源。

3 基于K-Means的净菜店客户聚类模型

IBM公司的数据挖掘工具Modeler建模都是透明的,用户无须了解计算细节,用户只需要通过调整几个改善计算性能的参数,即可快速获得比较理想的聚类效果,帮助企业进行客户关系管理。

3.1 数据预处理

本研究从菜店POS系统数据库中提取了近2年的交易数据,约8000条支付记录。经过筛选,提取了从2015-1-1到2015-3-1之间的数据1045条来聚类。从系统数据库导出的数据字段包含了:序列号、支付创建时间、交易额、余额、客户账号等信息,考虑采用RFM模型来进行客户关系管理,保留了支付创建时间、交易额和客户账号字段。数据预处理过程如下图1所示。在“过滤”节点,去掉了不相关的序列号、余额等等字段。在“RFM汇总”节点,设置了观察时间点为“2015-12-1”,由此计算出“R”因子即购物周期、“F”因子即频次数、“M”为货币因子数,共获得386条记录。

图1 数据预处理

3.2 K-Means模型

IBM的数据挖掘平台Modeler提供了透明的K-Means建模工具,其特点是把K-Means模型当成一个流节点,插入到数据流中,如图1所示。根据RFM模型,将“R、F、M”三个因子分别作为K-Means模型的输入,如下图2所示。按照K-Means算法,模型就是求取“近因、频数、货币”三个变量之间的距离。数据被分成2个区,一个50%的数据用于训练建模,一个50%的数据用于检验。模型预定聚类数量为3,标签说明用字符串。进行的迭代次数最大为150次。点图2中的【运行】按钮,即生成门店客户的“K-Means”聚类模型。生成结果拖入原数据流中,如图1中的输出节点。

图2 模型参数设置

3.3 客户群结构分析

运行结果表明,上述客户聚类模型的聚类结果为三类:第一类(“聚类-1”)客户占比95.3%,第二类(“聚类-3”)客户占比4.3%,第三类(“聚类-2”)客户占比0.4%,从第16代开始就没有再出现簇群中心点改变。聚类效果处在“好”的评级范围。

图3 菜店客户分群状态

从模型给出的分群来看,非常有意思,活跃客户只有11位,2个月时间内购买了约19次,金额为460元,最近的一次消费在20天前。观望型客户观察期内只消费了约3次,金额161元;冲动型大客户就1户,只消费了一次,一次性采购花费了2328元。显然,这种情况对于企业是不乐观的。菜店作为连锁门店才开张,观望人群最近一次消费比活跃型的长,而活跃型的则消费周期越来越拉长了。因而,门店的经营越来越不乐观。

事实上,随后的几个月情况确实亦如此。继续使用原有1-6月数据,观察点设在“2015-7-1”利用所建聚类模型再对其进行聚类。发现:“活跃型客户”群体虽然在扩大,但是平均最近一次购物行为发生在39天前,购物金额和频次都在减少;“观望型客户”群体规模减小,但购物金额和频次同样在减少,最近一次购物发生在137天前;“冲动采购型”则维持原有状态,再也没有来采购过。

更符合实际需求的是:决策层需要明白哪些客户属于何种类型客户,从而对症下药,继续留住或进行诱导转化,下图3为部分客户聚类分布状况,“idmember”为客户编号代表唯一客户。

图4 部分客户聚类分布

4 结论与建议

菜篮子工程关系民生,是居民幸福指数感知高低的因素之一。连锁净菜企业经过了大半年的运行后,在第二年仍然没有进入正轨,可以从其客户聚类分析中反映出来。在前后两个不同的时点观察发现:门店“活跃型”客户逐步蜕变成了低迷型,与“观望型”日渐合并,“观望型”逐步演变成“退出型”,“采购型”客户变成了“异常型”。显然,门店的客户体验变得糟糕,主要体现在:净菜菜品多样性差、包装后重量误差太大、门店服务响应速度慢。企业决策者必须清楚净菜店赚取的是时间、新鲜与服务中间的差价,需要制定严格的、标准的加工与包装流程,以保证净菜菜品的品质,增加菜品的多样性,加快配送速度和上架速度。

猜你喜欢

净菜客户关系聚类
一种傅里叶域海量数据高速谱聚类方法
净菜上市了
关于客户关系管理的思考
“净菜上市”对农业意味着什么?
净菜上市有“钱景”亦有隐忧
北京:分阶段推进净菜上市 实现农产品垃圾源头减量
面向WSN的聚类头选举与维护协议的研究综述
改进K均值聚类算法
企业客户关系管理研究
浅谈商业银行零售业务的客户关系管理应用