基于聚类分析的证券业客户分层实证研究
2016-05-18刘凤艳淮南师范学院金融学院安徽淮南232001
刘凤艳(淮南师范学院 金融学院,安徽 淮南 232001)
基于聚类分析的证券业客户分层实证研究
刘凤艳
(淮南师范学院金融学院,安徽淮南232001)
摘要:客户管理的依据是客户价值.本文根据客户对证券公司提供的价值,采用聚类分析方法对某证券公司提供的2014年6月到2015年6月总资产在50万~100万之间93个客户共1116条记录进行实证分析,研究客户的分层情况.通过细分结果可以对不同类的客户提供和设计不同的服务项目并提供个性化服务策略.
关键词:客户细分;聚类分析;证券业;客户价值
引言
近年来,证券企业行业的竞争越来越激烈,在各个企业中哪个单位能把握住客户的真正需求并且能保留住老客户且吸引新客户,才能有更高的收益;哪些客户的投资回报率最大,哪些的亏损率多,谁能根据以往的海量的交易数据,提出合理的投资建议,提取更多有价值的信息以便帮助各个企业有更好的发展,是各个企业重要的目标.而在金融证券业对客户的相关数据的挖掘越来越重要,其对企业未来的发展趋势可以进行预测,此种方法已得到广泛的应用,本文是利用聚类分析对证券公司提供的总资产在50万到100万的客户数据进行实证分析.
1 聚类分析的介绍
聚类分析是根据建立模型简化数据结构的方法,可以对变量进行聚类也可以对样品进行聚类.聚类的方法也很多,常见的有系统聚类,快速聚类法及有序聚类.而系统聚类根据类与类之间距离的定义不同又分为最短距离法,最长距离法重心法及类平均法等等.在系统聚类中因为需要计算出不同样品或变量的距离还要在聚类的每一步都要计算类间距离,相应的计算量较大,特别是容量很大时需要占据很大的计算机内存空间,这会给计算带来很大的困难.所以在数据量较大时可以采用快速聚类法,得到的结果比较简单易懂,对计算机的性能求不高,所以应用比较广泛,本文就是利用快速聚类来进行分析.
聚类分析的应用比较广泛,常被应用在在以下几个方面:生物学方面,聚类分析可以用来进行动植物的分类,可以对基因进行分类;商务方面,聚类分析可以帮助企业人员从庞大的客户数据库中发现不同类别的客户群,并且根据客户群特征提供相应的服务;经济研究中,为了研究不同地区城镇居民生活中的收入和消费情况;在地质学中,为了研究矿物勘探,需要根据各种矿石的化学和物理性质和所含的化学成分把它们归属于不同的矿石类;在人口学研究中,需要构造人口生育分类模式、人口死亡分类模式,来研究人口的生育和死亡规律.
2 客户分层管理介绍
客户关系管理(简称CRM)20世纪90年代初出现在美国,90年代末期进入中国.客户关系管理应用的最终目标的帮助企业获取更多的客户、保留原来的老客户、提高客户的忠诚度,从而达到客户创造价值的目的.客户关系管理的实质是利用网络系统的优势实现对消费者的一对一营销,企业向客户提供个性化的服务,尽量让每个客户都认为这种服务是完全针对他个人的.要做到这一点,就要区别地对待不同的客户,具体的实施步骤可以分为以下四个阶段:第一阶段:识别你的客户,第二阶段:对客户进行差异分析,第三阶段:与客户保持良性接触,就是同客户的交流和沟通,第四阶段:调整产品或服务以满足每一个客户的需求,即企业向客户提供个性化的服务,进行市场营销.利用统计方法,分析出有效的客户价值信息,有利于企业把握优质客户,发展潜力客户,认识到客户间的差异,从而为客户提供一对一的差异化服务.最终达到增加客户满意度、提高客户忠诚度、挽留优质客户的目的,并实现企业利润的最大化.
而客户分层最重要的就是客户细分.客户细分就是指根据客户的某种属性或特征将大的客户群体划分成若干个小的客户群的过程,同属一个客户群的消费者彼此相似,而隶属不同客户群的消费者彼此不相似.客户细分可以使企业全方位的、有目的性的分析、提取客户数据库中的有效客户信息,同时使得企业可以根据细分群采取不同的方式为处于不同群的客户提供优质服务.客户细分的方法有很多种,基于客户统计学特征的、基于客户生命周期的、基于客户交易行为的以及基于客户价值指标的都是比较常见的细分方法.
本文针对淮南市某证券业提供的数据进行客户细分,以便提出合理的分群方法,提供不同的服务.
3 客户细分模型的建立
客户细分是客户关系管理重要的实现手段之一,采用基于客户交易行为的客户细分是一个可选的方法.针对证券业庞大的客户群,通过一定的划分方法,将客户分为优质客户、潜力客户、一般客户,有利于证券公司提供差异化的服务,有利于客户关系管理的成功实施.
3.1模型中变量的解释
客户细分的变量属性有动态属性,也有静态属性.调查的数据是2014年7月到2015年6月底,资产在50w到100w之间的客户.调查的动态属性变量有期末资金,期末资产,交易量,成交笔数,净佣金,佣金,股票盈亏,成交金额-买入,成交金额卖出,静态属性变量有证券代码、交易时间、客户姓名、客户年龄等.
3.2数据的预处理
分析过程中最重要的是数据预处理.在现实生活中,数据对象并不都是规范的,大多会有噪音、冗余、数据不一致等问题出现,为了能够提高数据挖掘的质量、效率,就必须对这些存在缺陷的、不完整的数据进行预处理,使得数据挖掘过程更简单、更有效、更实用,结果更能准确地反映客观情况.数据预处理可以概括为以下三个阶段:
(1)数据选取
由于从数据库中随机选取的历史交易数据属性繁多、数量巨大,这就需要人为地设定标准以便从众多的数据中选择有用的数据.
(2)数据变换
数据的观侧值可能相差很大,因为数据库中的各个数据对象具有各种不同的性质属性,通常都有不同的度量单位.所以,绝对值相对较少的变量起不到应有的作用,绝对值较大的变量可能会影响到绝对值较小的变量.为了保证各变量在聚类分析中所处的地位相同,有必要对数据对象进行数据变换.标准化变换是常见的变换方法.
标准化公式为:设共有n个客户,设计p个属性(变量),设xij是第i个对象的第j个属性i=1,2,…,n;j=1,…,p,算得第j个属性的平均值为,而样本的标准差为则标准化后的数据为(i=1,2,…,n;j=1,…,p).
在经过标准化变换后,各数据对象的变量属性的均值为0,且标准差均为1.也就是说各变量属性的基点相同,并且变化范围也相同.
3.3快速聚类的算法:
此方法的实现有以下三步:
(1)初始重心的选择.重心选择的好坏能够影响到聚类结果是否是有效的.
(2)进行修改,逐个分派样品到其最近均值的类中,重新计算接受新样品的类和失去样品的类的重心.
(3)重复上步,直到没有元素进出.此时聚类结束.
4 实例验证
本例所选的具体数据选自淮南某证券公司柜面系统中2014年7月到2015年6月底,资产在50w到100w之间的客户部分客户历史交易数据,经过数据的选取、清理后选取94个客户信息,每个客户所用数据为一年的平均值.其中包含的观测变量有期末资金,期末资产,交易量,成交笔数,净佣金,佣金,股票盈亏,成交金额-买入,成交金额卖出.处理的数据是一年的平均值.利用PASW Statistics 18软件进行K均值聚类:
指标的含义及计算方法
因上述指标数量级差别较大,若直接放在一起进行运算,则数量级大的指标将掩盖数量级小的指标,为了保证各变量所处的地位相同,有必要对数据对象进行数据变换,而标准化后的数据根据准则,应该都是介于-3到+3之间,通过统计方法处理,最后删掉异常数据,最后剩下82个客户的数据.利用剩下的数据,利用K-均值聚类进行分析,得到结果如下:
初始聚类中心
迭代历史记录a
最终聚类中心
每个聚类中的案例数
可以看到在第一分类中有4个客户,第二个分类客户中有62个客户,第三分类中有19个客户.在第二分类中客户最多,是所有大客户中比例最多的.
从最终聚类的重心可以看出,客户细分结果得出三个质心,三个质心分别为:
第一个质心为
(389386.681,9210.025,6142706.393,89.167,3081199.564,3061506.828,2614.587,1982.649,16435.200);
第二个质心为
(410626.495,88931.742,721038.618,19.116,357467.390,363599.010,839.049,766.991,22087.037);
第三个质心为
(548603.918, 55948.980, 2870916.795, 41.864, 1435940.978, 1434975.817, 2035.590, 1741.470, 25414.573)
这三个质心的数据分别代表三种不同类型的客户:
(1)第一类代表着优质客户,从最终聚类中心中可以看出这类客户股票操作频率频繁、资金量大,手续费收入多,客户数量很少,但贡献的手续费收入很多.表示这类客户资金雄厚,热衷于股市,是证券公司获得利润的重要客户,证券公司可以从这类客户身上获得颇丰的收入.对于优质客户,企业要积极与这部分客户沟通,了解客户的需求,进行细致入微的访谈,必要时进行“一对一”的服务.优质客户可以优先享用证券公司的资源,如信息提前通知,高频率的电话回访等.最终达到客户满意、公司盈利,并挽留客户的目的.
(2)第三类代表着潜力客户,从表中可以看出,这类客户操作频率可观,手续费收入比优质客户少一些,由数据表明这类客户有发展成为优质客户的潜质,如果公司服务不到位也可能面临着这部分客户的流失.因此,证券公司要掌握这类客户的有效信息,如个人爱好、购买特点,抓住客户的心里需求,从而提供积极主动的服务,让客户有被尊重的感觉,可以放心地在公司办理一切业务,以至最终达到客户满意公司提供的服务、信任公司,发展成优质客户.
(3)第二类代表着一般客户,一般客户占有的比例较大,但这类客户由于种种因素,对股票的操作频率仅为19.116,手续费收入相对不高,股市参与度相对较低.一般客户对公司的利润贡献最少的,但是人数众多,总的受益还是很客观的,对这类客户要努力开发成潜力客户,这类客户的资金也很多,开发的潜能很大.证券公司要注意提取有价值信息,辨别一般客户是否有成为优质客户的潜力,对症下药,为其提供与之相适应的服务.
5 小结
根据以上分群,首先,可以对对公司的贡献价值对不同的客户提供差异化服务,为贡献度高的客户优先配置有限的资源,为贡献度不大的客户配置资源放在次要顺序,这样就实现了顾客的区别对待;其次客户可以根据自身的条件选择不同的服务;最后,企业为获取增长性、持续性的利润的就必然要提供差异化服务,满足客户合理需求.
参考文献:
〔1〕邢留伟.K-Means算法在客户细分中的应用研究[D].西南财经大学,2007.
〔2〕娄至涛.基于聚类分析的证券业客户关系管理研究[D].西北农林科技大学,2010.
〔3〕刘莉.K-means算法在移动客户细分中的应用研究[J].信息通信,2008(6).
〔4〕王荇,郑成增.聚类算法在证券公司CRM中的应用[J].常州工学院学报,2008(4).
〔5〕王园.证券业客户细分模型构建及时政研究[J].上海管理科学,2012(2).
基金项目:淮南师范学院教师社会实践项目;淮南师范学院科学研究项目(No.2014xj45)
收稿日期:2015-11-5
中图分类号:F830.91;F270
文献标识码:A
文章编号:1673-260X(2016)04-0099-03