APP下载

聚类分析技术在CRM中的应用研究

2015-03-27郑州航空工业管理学院实验室管理处计算中心王海燕李晓玲

电子世界 2015年18期
关键词:车主数据挖掘聚类

郑州航空工业管理学院实验室管理处计算中心 王海燕 李晓玲

1 引言

客户关系管理(CRM,Customer Relationship Management),可以理解为应用信息技术为企业提供全面的、个性化的客户资料,从而使客户与企业间所有的过程和互动能够有助于维系和拓展这种互利关系的一种商业战略。其核心思想来自市场营销理论,强调以客户为中心,通过完善的客户服务和深入的客户分析来满足客户的需求,不断提高客户的满意度和忠诚度,进而实现客户的终生价值。在过去的几年CRM已经变成每个企业获得成功的重要部分。

而CRM的核心是客户理解,“正确的客户理解和由此引导的行动可提高顾客的终身价值。不恰当的客户理解将导致冒险盲目的行动和措施 ”。因此本文利用数据挖掘中的聚类技术对客户进行分析,理解客户的分布和特征。

2 相关概念介绍

2.1 CRM与数据挖掘的关系

不同的数据挖掘工具可以从客户数据库抽取不同目的的信息,同时通过分析顾客的问题来为企业吸引更多的客户。在数据挖掘中最早和最简单的分析步骤是描述数据,例如,总结它的统计特征(例如平均值和标准差),用图表和图形可以形象地观察,查看数据域内值的分布情况。用数据挖掘技术中的关联规则来详细地分析客户的交易数据,从中得知顾客同时会购买哪些商品,基于规则可以组合流行产品,基于规则可以让营销人员和企业决策者制定市场营销策略或操作规则,并且积极提供客户感兴趣的产品[1]。用数据挖掘中的聚类来为客户进行分群,将具有相似消费行为的客户归为一组,理解客户并提供相应的个性化服务。数据挖掘中的分类可以用于客户行为预测,挖掘潜在消费人群,刺激其消费。

2.2 聚类分析

聚类,顾名思义,即物以类聚,人以群分。所以聚类的定义为将物理的或抽象对象的集合分成相似的对象类的过程成为聚类(cl ust er ing)[2]。簇(cl ust er)是数据对象的集合,这些对象与同一个簇中的对象彼此相似,而与其他簇中的对象相异。简单地说,从人类对这个社会具有认知性开始聚类活动就一直存在,我们会通过不停地改进下意识的聚类模式来学习如何识别苹果和梨,通过寻找和区分对象所具有的特征来区植物和动物等等。

聚类分析已经广泛应用于图像处理、模式识别、数据分析和市场研究等领域。在商业领域聚类能够帮助市场分析人员根据顾客的购买模式从客户数据库中发现不同的顾客群,总结顾客群的特征,就是我们所说的“人以群分”,比如可以识别具有高水平索赔额的汽车保险持有者组群,进而提出具有针对性的市场营销策略。在生物领域,聚类分析可以用来推导不同物种的分类,根据相似功能对基因进行分类,获得对种群中固有结构的认识。

由聚类所用标准的不同可以将聚类分为划分方法、层次方法、基于密度的方法和基于网格的方法。

3 挖掘过程

下面依次经过数据预处理、算法分析、结果解释和提出针对性意见等步骤来实现将聚类分析应用到客户关系管理中。

3.1 数据预处理

本文所用数据为某4s店的客户消费数据,为了便于分析,需要将某些属性量化处理。将分类数据进行量化处理,以上挑选出的分类属性有“车主姓名”、“性别”、“所在行业”、“车主婚姻状况”、“车主教育状况”、“车主家庭收入”、“配置”等。“车主家庭收入”的属性值取的是一个个的取值范围,比如“3000-5999元、6000-9999元、10000-14999元……30000-50000元、50000元以上”,所以也要对其进行量化处理。对于有高低之分的属性取值如“车主教育状况”、“车主家庭收入”、“配置”量化时就按数字从高到低进行。

3.2 算法描述

DBSCAN算法为聚类分析技术中应用广泛且成熟的经典算法,因此本文也选用此算法建模对数据进行分群分析。DBSCAN[3](Densit y-Based Spat ial Cl ust er ing of Appl icat ions wit h Noise)可处理噪声的基于密度的空间聚类算法是一个基于密度的聚类算法。表1描述核心对象的定义是如果一个对象的ε邻域内包含至少MinPts个数据对象,则此对象被称为一个核心对象。DBSCAN具体步骤如下:

表1 DBSCAN算法描述

本次建模算法运行中参数设置MinPts=4,半径ε= 0.9。

表2 聚类结果簇特征分析

3.3 结果分析及对策制定

经过分析数据集被划分成四个簇,簇1包含3578条数据,所占比例为70%;簇2包含1240条数据,所占比例为24%;簇3包含123条数据,所占比例为2%;簇4包含181条数据,所占比例为4%。最后总结各个簇的特征,并给出相应的建议,如表2所示。

4 总结

本文将聚类分析应用到客户关系管理中,目的用来理解客户,相比传统的统计总结而言,本方法不仅可以根据客户特征对客户进行分群,还能更好的总结出各个群体的特征。

下一步尝试将关联规则分析、分类分析也应用到CRM中,利用关联规则来详细地分析客户的交易数据,基于规则组合流行产品,让营销人员和企业决策者制定市场营销策略或操作规则,并且积极提供客户感兴趣的产品,利用分类可以预测客户行为,挖掘潜在消费人群,刺激其消费。

[1]Chen R S,Wu R C,Chen J Y,Data Mining Application in Customer Relationship Management Of Credit Card Business,in proceedings of the IEEE,29th Annual International Computer Software and Applications Conference,2005.

[2]Jiawei Han,Micheline Kamber著;范明,孟小峰译.Data Mining Concepts and Techniques[M].北京:机械工业出版社,2004.

[3]Ester M,Kriegel H P,Sander J et al.A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise,Proceedings of 2nd Int.Conf.On Knowledge Discovery and Data Mining[C].Portland,OR,1996:226-231.

猜你喜欢

车主数据挖掘聚类
探讨人工智能与数据挖掘发展趋势
基于K-means聚类的车-地无线通信场强研究
听伴:抓住车主的耳朵
基于并行计算的大数据挖掘在电网中的应用
基于高斯混合聚类的阵列干涉SAR三维成像
汽车车主的移动应用
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法
一种基于Hadoop的大数据挖掘云服务及应用
百名车主评新车