基于IBM SPSS决策树之客户流失分析
2017-01-13邱文俊
邱文俊
【摘要】 商务智能是从大量的数据和信息中发掘有用的知识、并用于决策以增加商业利润,是一个从数据到信息到知识的处理过程。在 IBM SPSS Modeler中,使用四种常用的决策树演算法对顾客流失进行数据挖掘分析,帮助企业对留住顾客做出最有利的决策。
【关键字】 企业 顾客流失 数据挖掘 决策树
一、背景
商务智能是从大量的数据和信息中发掘有用的知识、并用于决策,以增加商业利润,是一个从数据到信息到知识的处理过程。商务智能辅助商业活动作出快速反应,加快知识的获取速度,减少企业不确定性因素的影响,满足管理层和决策层对信息知识的时间性和准确性的要求。超过2000个世界领先的品牌依靠IBM数十载的商务经验改善业务洞察和执行,帮助企业向客户和合作伙伴增加交付的价值。政府或企业都需要在海量的信息中获取有价值的信息,并据此做出科学的评估和决策。SPSS( 社会科学统计程序)是一套集数据信息的采集、处理、分析、评估、预测、并给出专业人士可接受解决方案的软件。IBM在收购SPSS后发布了IBM SPSS,在原有SPSS基础上融入商务智能理念,拓展了分析、评估、预测模型,具有了更加丰富强大的智能决策支持能力。
二、问题分析
市场调查显示:一个公司平均每年约有10%-30%的顾客却在流失。但很多公司常常不知道失去的是哪些顾客,更不知道这样会给他们的销售收入和利润带来怎样的影响。冷静地研究分析顾客流失,对于企业挽救危机、健康成长具有十分重要的意义。
顾客流失是现代公司通过计算一位顾客一生能为公司带来多少销售额和利润来衡量顾客价值。寻找他们流失的原因即流失客户的特征,通过数据处理,根据以前拥有的客户流失数据建立基本属性、服务属性和客户消费数据与客户流失可能性的数据模型,找出其潜在的关系,分析出客户流失的因素,预测客户是否流失的可能性。对于客户的基本数据、行为数据及消费数据,进行数据挖掘研究已流失客户数据,从中找出先前未知的、对企业决策有潜在价值的知识和规则,发掘潜在流失客户,让企业适时把握住市场及客户动态,掌握客户流失的规律。
三、解决算法
决策树演算法
人们认识事物时往往先把被认识的对象进行分类,以便寻找其中同与不同的特征,从而构建特征模型。在数据挖掘中一般用规则或决策树模式表示。
一个决策树的架构,是由三个部分所组成:叶节点、决策节点以及分支。决策树演算法的基本原理为:通过演算法中所规定的分类条件对于整体数据进行分类,产生一个决策节点,并持续依照演算法规则分类,直到数据无法再分类为止。在IBM SPSS Modeler中,主要提供了四种常用的决策树演算法供使用者选择。使用者可依据数据类型以及分析需求的不同,选择适当的决策树演算法进行分析。虽然不同的决策树演算法有各自适用的数据类型以及演算架构等差异,但概括来说,决策树的主要原理均为通过演算法所定义的规则,对数据进行分类,以建立决策树。
①C5.0由C4.5演化而来。此演算法的分类原理主要是利用资讯衡量标准来构建决策树,并对每一个节点产生不同数目的分支来分割数据,直到数据无法分割为止。C5.0的目标字段测量级别,不适用于连续类型的测量级别。而输入字段的数据型态则适用连续类型的测量级别。②CHAID此演算法和前述的C5.0概念很像,均可以在每一个节点产生不同数目的分支来分割数据,用来建立决策树。但是在背后分类的原理则利用卡方分析检定来进行分支,通过卡方检定来计算节点中的P-value,来决定数据是否仍须进行分支。另外,CHAID的目标字段的测量级别可适用于连续类型的测量级别,但在输入字段则只适用分类类型的测量级别。③QUEST此演算法是利用统计方法分割数据,即以判定决策树是否仍需进行分支,以建立二元的决策树。QUEST在变数的数据型态限制上,跟C5.0一样,目标字段测量级别,不适用于连续类型的测量级别。但在输入字段的测量级别则适用连续类型的测量级别。④C&R Tree 又称为 CART,构建决策树的原理是使用Gini Ratio作为判定决策树是否仍须进行分支的依据,并建立二元的决策树。此演算法不管是在目标变数以及输入字段的测量级别均适用连续类型的测量级别做分析。
四、方案对策
随着国内各种企业的改革,激烈的竞争下各企业都面临严重的客户流失问题。大量的客户流失延长了企业利润回收的周期,给企业造成了巨大的损失。在这种形势下,如何分析客户行为预测客户的流失,并结合竞争环境的变化制定有效的客户挽留以实现企业利益的最大化,已成为企业的一个重要课题。减少客户流失的具体措施:开展品牌工程建设、开展个性化服务、做好客户关系的开发和维持工作、积极参与建立公平的市场秩序、完善自身业务能力、做好营销队伍建设等。
参 考 文 献
[1] 刘小虎,李生. 决策树的优化算法[J]. 软件学报. 1998(10)
[2] 王秀岩. 决策树算法及其应用[J]. 电子技术与软件工程. 2014(05)