APP下载

基于K-Means聚类分析的电商学生客户细分研究

2022-05-30张玉琨

商场现代化 2022年8期

摘 要:进行精准客户细分,维护客户关系,优化客户管理是电子商务行业大数据应用的一个重要方向。为了了解高校学生在线上平台消费的倾向和偏好,满足高校学生客户的多元化需求,提高客户认可度和核心竞争力,本文以收集的真实高校学生消费数据为基础,通过改进的RFM模型和K-Means聚类分析对数据进行处理和分析。本文以手肘法确定分类类别数K值,以提高电子商务客户细分的准确性,获取更好的分类结果。最终根据客户的细分结果,进行分析解读,为不同客户群制定对应的营销方案和服务建议。

关键词:客户细分;K-Means聚类;RFM模型;手肘法

根据《中国电子商务市场竞争及企业竞争策略分析报告》显示,2011年-2019年我国电子商务交易额呈逐年增长态势,年均复合增速高达24%。2019年我国电子商务交易额为34.81万亿元,同比增长10.05%。突如其来的新冠疫情导致的封控措施更是推动了线上成交额的飞速上升。

虽然电子商务市场呈现出突飞猛进的发展趋势,但其存在的一些亟待解决的问题仍不容忽视。根据中国商业联合会调查的数据显示,69%的电商客户对网购商品的质量极不满意。客户是企业赖以生存和发展的基础,客户关系是企业极为重要的资源,把握好客户关系是进行企业管理和市场营销的关键,而进行客户精准细分是把握客户关系的重要步骤,线上客户亦是拥有更为明显的消费特征,因此对于线上客户的进行细分研究对于当前的发展来说是极其必要的。

一、K-Means聚类简述

1956年,美国经济学家温德尔·史密斯首次提出了市场细分的概念。其主要概念是根据客户的不同需求,把整个市场划分成一些具有共同特征的子市场。这个概念一经提出,就引发了相关学者的广泛研究和探讨。有很多学者在这一基础上展开了更为细致的研究和应用,实践表明客户细分理论的有效应用能够为企业带来了非常大的收益。德萨罗等认为客户细分对企业具有非常重要的指导作用,有助于企业制定科学高效的营销策略。弗兰克等学者通过对比客户细分策略和传统的价格歧视理论发现,客户细分策略能够更好地应对广阔的市场以及顾客差异性带来的挑战。市场细分是客户关系管理理论的一个主要分支,它既为企业盈利作出贡献同时也提高了客户满意度。随着市场多元化的发展,企业实行差异化营销显得尤为重要,客户细分理论可以有效识别客户价值,通过分析高价值顾客的需求和选择偏好,从而为企业节约资源,有利于企业实现精准营销。

RFM模型首先由美国数据库营销学家休斯在1994年发现。后续学者在自己研究的基础上进行了改进和创新。徐翔斌等用利润指标替换金额指标提出改进的RFP模型。徐文瑞用层次分析法确定RFM模型中的各指标权重,将定性和定量结合进行研究。包志强等加入客户贡献时间以改进RFM模型。熊兰等将客户的价值按产品类别进行分类。倪枫等加入客户的活跃时间构造RFMT模型来衡量客户价值。靖立峥,吴增源在经典RFM模型的基础上增加客户消费行为特征,构建了融入客户线上行为特征的RFPAV客户细分模型。

聚类的目的是将全部样本划分成若干类别,适合应用在客户细分的相关研究上。其中K-means聚类能够更快更好地处理数据量大的样本集。K-means聚类是由麦奎因提出的,其主要做法是选择K个聚类中心,按照最近原则将全部样本分为各个聚类。由于K-means聚类算法存在一些限制性较大的缺陷,如聚类中心、K值不易选取等问题。相关学者针对这些缺陷进行了相应的改进。王虹、孙红针对层次聚类法和K-means聚类法的缺陷,提出将二者相结合的改进算法。任春华、孙林夫等提出一种层次K近邻密度峰值初始聚类中心选取方法。

本文通过以往的研究并结合本次研究对象对RFM模型进行改进。并且运用手肘法确定K值,将客户分为对应价值的客户群。

二、模型建立

传统的RFM模型起源于20世纪60年代的公司直接营销,在1994年由营销学家休斯正式提出。如今RFM模型已经广泛应用于各个行业的客户细分,中外各个学者也对模型进行了相应的改变和扩展。传统的RFM模型是通过客户最近的购买时间R(recency)、购买频率F(frequency)、购买金额M(monetary)三个基本数据指标来衡量相关的客户价值。F、M值越大,通常客户价值越高。

本研究是主要针对高校学生电商客户的研究,因此收集了202个高校学生在某电商平台的真实消费数据。该数据是根据该电商平台统计的人生账单作为原始数据,记录样本学生的最近消费时间并计算样本学生平均一年内的消费次数和消费总金额。本数据收集时间为十一月下旬,考虑到电商平台“双十一”活动参与的广泛性和时间统计的抽象性,本研究将最近消费时间分为十一月之前以及十一月的上、中、下旬,分别设定值为1、3、5、7。由于消費金额和消费次数通常成正比,存在一定的共线性问题,容易使研究产生误差,因此本研究根据原始数据计算单次的平均消费金额来作为M值。

考虑到部分学生的消费情况与一般同学相比差别较大一起分析会产生较大干扰,本文采用离差规范化法来消除这种干扰。离差规范化法受到最大值和最小值取值的限制,且经过该法处理后的结果数据都为小数,无较大差别,能够有效地消除纲量和数据取值范围的影响。离差规范化法对样本数据进行处理时会在[0,1]内映射出原始数据的线性变换。

其转换公式为

x*=(x-min)/(max-min)

公式中的min和max是样本中同类数据的最小值和最大值,x为初始数据值,x*为处理后的数据值。

数据归一化处理后进行聚类可以更好地得到结果,以便进行相应分析。K-means聚类是聚类研究中最常用的聚类算法,也广泛地应用于各个行业的客户细分。其基本思路是在选定聚类中心(即质心)后,逐一比较每个个案与质心的距离,将距离最近的一个个案首先与质心划为一类,然后进行反复计算和迭代,直到满足设定的要求为止。简单来说,K-均值聚类就是根据欧几里得距离把n个个案观测值自动聚集为k(k

K-means聚类算法适用于观测数据较多且为连续变量的情况,适合对个案的聚类。该方法的缺点是需要自行设定分类类别K值。分类类别值对于最后的聚类结果具有较大的影响,仅根据经验随机设定往往缺乏客观科学性。因此本研究选用手肘法来确定最佳聚类数。

手肘法核心思想如下:

随着分类类别数的增加,SSE的下降幅度会骤减,然后随着K值的继续增大而趋于平缓。也就是说误差平方和SSE和K值的关系图是一个手肘的形状,而肘部对应的K值就是本次聚类的最佳聚类数。手肘法即为选取肘部对应的那个拐点。

核心指标:SSE(sum of the squared errors,误差平方和)

Ci是第i个簇,p是Ci中的样本点,mi是Ci的质心(Ci中所有样本的均值)

SSE是所有样本的聚类误差。

本文设置K的范围为[2,8],根据误差平方和SSE绘制分类效果图如下图所示。根据手肘法确定最佳聚类数K=4。

不同聚类数目下的SSE值

聚类情况如下。

三、结果分析

由上文可知,分类类别为四时聚类效果最好。根据得到的分类情况和最终聚类中心,可以看出不同类别的客户群有着不同的差异,差异在消费时间、消费次数以及消费金额上均有体现。以下是对聚类出的不同客户群进行分析。

第一类客户群总共有27个个案,占全部样本的13.37%,所占比例较小。该类客户群购买频率最高,距离最近购买时间最短,整体客户群购物金额跨度较大,平均单次消费金额不高。该类客户习惯于从该电商平台购买日常所需用品,但价值不高,因为该客户群通常较少购买大金额用品或者涉及金额较大的物品购置时则更多地考虑线下实体店购买。

该类客户可划分为次优质客户群组。针对此类客户,应该在原有的客户维护基础上,推出更多的承诺保障,针对大金额产品提供更多的保险服务和保障措施,使客户充分信任平台,相信平台能够最大力度地保证消费者的全部权益,即使是较大金额的产品也可放心购买,从而开发该类客户在该平台对于大额产品的消费潜力。

第二类客户群总共有15个个案,占全部样本的7.43%,所占比例最小。该类客户群平均单次购买金额最大,距离最近购买时间较短,顾客群的购买次数跨度较大,但整体来看较高。该类客户不会过于频繁地从该电商平台购买日常所需物品,但如果其有相应商品的购买需求,不会过于在意商品的价格,购买顾虑较少,该客户群通常消费水平较高或者是出于对该平台的信任习惯从该平台购买大额产品。

该类客户可划分为优质客户群组,对该电商平台的信任程度较高,购买频率较大,价格敏感度低,具有极高的客户价值。对于本类客户,要做好相应的客户维护工作,要注意根据客户的需要定期推送相关产品以避免和其他电商平台的竞争,在进行产品推荐时要更注重质量而非价格。保证客户的购物体验是轻松愉快的。

第三类客户群总共有127个个案,占全部样本的62.87%,所占比例最大。该类客户群的平均单次购买金额、购买频率和距离最近购买时间间隔均居中,不会从该电商平台过于频繁购买或购买大额商品,客户价值一般,但是却具有较大的开发空间。

该类客户可划分为潜力客户群组,拥有固定从该平台购买的商品清单,购物时间、次数和金额均相对稳定。针对此类客户,该电商平台应该在做好基础的客户维护上,对比线下实体店和其他电商平台,根据后台数据统计的客户需要有倾向性地推送本平台的优势产品,提供更多保障以提高客户信任度,充分开发客户的购买潜力。

第四类客户群总共有33个个案,占全部样本的16.33%,所占比例较小。该类客户群的购买频率和购买金额均是最低的。可知,该类客户较少从该电商平台购物且单次购物金额较少,客户价值最低。

该类客户可划分为一般客户群组,缺乏对该电商平台的信任,更多地从实体店购物或是在其他电商平台消费。针对此类客户,该电商平台应当多进行相应的产品推送和活动推荐,刺激客户的消费需求。平台可先推送一些性价比较高的低价商品,根据客户的反应情况,再做后续的维护和推广。

四、结语

在物质经济和科学技术高速发展的今天,客户细分及关系管理对于电子商务行业乃至各行各业都具有极大的意义。而随着互联网技术的飞速发展和广泛应用,企业可以快捷地根据自有平台统计的客户消费数据对客户的消费行为进行分析并总结出对应的消费规律,将具有相似特征的消费者归为一个客户群,从而有针对性地制定不同的营销策略,也可以给客户带来更多的便捷。本文以改进的RFM模型和加以手肘法辅助的K-means聚类对收集的高校学生消费数据进行分析,高校学生是电商平台的重要客户和优质潜力客户,因此本研究具有一定的研究价值和应用意义。通过手肘法确定K值,并以改进的RFM模型进行分析,得到了较好的分析结果。从研究结果中可以看到,高校学生的客户价值是普遍较低的,并且上下差异较大。但高校学生还是具有较大的消费潜力,高校学生目前主要经济来源是家庭资助和学校的奖助,其消费能力相对有限,出于对价格的敏感性和生活的便捷性,较多地从电商平台购买日常所需物品。未来,高校学生毕业工作后,拥有较大的自主消费能力后,还是会习惯性地从线上购买相关所需物品。因此,做好对高校学生客户的客户关系维护是十分必要的。

当然本文也存在诸多不足,比如选取样本的数量较少且分布较为集中,对RFM模型的相关数据指标还可以更加细化。相信未来的研究一定可以克服各种困难和不足,达到理想的客戶细分效果。

参考文献:

[1]王润清.基于聚类分析的航空旅客在线购票行为研究[D].中国民航大学,2020.

[2]徐翔斌,王佳强,涂欢,穆明.基于改进RFM模型的电子商务客户细分[J].计算机应用,2012,32(05):1439-1442.

[3]徐文瑞.基于RFM模型的顾客消费行为与顾客价值预测研究[J].商业经济研究,2017(19):44-46.

[4]包志强,赵媛媛,赵研,胡啸天,黄琼丹.基于改进RFM模型的百度外卖客户价值分析[J].西安邮电大学学报,2019,24(01):105-110.

[5]熊兰,高炳.基于RFM多层级客户价值模型的客户细分研究[J].商业经济研究,2017(05):55-57.

[6]冀慧杰,倪枫,刘姜,赵燚.基于灰色关联度和K-Means++的电子商务客户价值分类[J].计算机系统应用,2020,29(09):249-254.

[7]靖立峥,吴增源.基于改进K-means算法的电子商务客户细分研究[J].中国计量大学学报,2020,31(04):482-489.

[8]王虹,孙红.基于混合聚类算法的客户细分策略研究[J].电子科技,2016,29(01):29-32.

作者简介:张玉琨(1997- ),女,汉族,河北沙河人,硕士研究生在读,研究方向:服务营销