APP下载

数据挖掘在银行客户关系管理系统的应用研究

2015-07-21蔡晓龙

信息化建设 2015年6期
关键词:数据挖掘商业银行

蔡晓龙

摘要:数据挖掘技术日渐成熟,出现了多种挖掘技术和方法,在多个实际领域得到广泛应用。本文在对银行管理信息系统中典型的客户关系管理系统研究的基础上,介绍了数据挖掘技术在银行客户关系管理系统中的应用情况,并针对实际应用中存在的问题,给出相应的对策,最后指出数据挖掘技术未来可能的研究方向。

关键词:客户关系管理系统;数据挖掘;商业银行

0引言

大数据时代,最早被麦肯锡公司提出。大数据在医学、物理学、军事、金融、通讯领域存在数年,这些行业的企业在生产运营中积累了海量的数据。互联网和信息技术的发展,使人们更加关注如何从海量的数据中采集有效数据,进而分析数据,得到有用信息,为未来决策提供支持。金融行业是国民经济的综合部门,关乎各行各业企业的发展。商业银行作为重要的金融中介,对于如何从多年积累的数据中挖掘出有用的信息,做出正确的、符合经济发展的决策的研究,其价值不可忽略。数据挖掘技术应时代需求而生,并在商业银行的管理信息系统中得到广泛的应用。

本文就数据挖掘技术在商业银行的管理信息系统中的实际应用,以客户关系管理系统为例,进行分析研究,指出未来可能的研究方向。

1商业银行管理信息系统

商业银行作为重要的金融中介,调剂着社会资金余缺,在“流动性、效益性、安全性”三性原则的基础上经营,主要包括负债业务、资产业务和中间业务,其客户分布在社会的各个行业。数据挖掘技术在商业银行管理信心系统中的应用能够帮助商业银行从大量客户数据中,发现潜在的规律和知识为管理决策提供支持,帮助商业银行制定有效的战略决策,在以客户为中心的主导思想下,有效的分析客户的需求、实现高效的客户管理,提供优质的客户服务。

2 数据挖掘技术简介

不同学者对数据挖掘给予多种不同的定义,其中认可度比较高的,是1995年第一届数据挖掘大会的定义,“数据挖掘又称为数据库中的知识发现,是指从大量数据中提取有效的、新颖的、潜在有用的、最终可被理解的模式的非平凡过程[1]”。

其中,非平凡是指不是简单地进行数据统计、查询或者运算,而是要根据各种模型和算法对数据进行深层次的加工处理,同时还要利用技术使该过程自动地智能化的進行。因此,

数十年来,数据挖掘研究的一个重点就是各种数据挖掘技术,从最初的关联规则、聚类、粗糙集方法,扩展到信息融合与神经网络结合,Hibert空间、动态规划、信息熵等方法。

数据挖掘是面向应用的,是多学科知识的的交叉应用,各个不同的主体开发的数据挖掘软件只符合自身的标准,导致该领域出现了诸如:1)不同的模型和技术难以继承;2)很难用统一的语言来描述数据挖掘的问题,在交互中出现问题;3)各种主体知识的独立性与异质性,使知识发现功能难以实现跨平台或嵌入大型应用。最终,经过研究,在数据挖掘的业界标准的过程标准、接口标准、语言标准和网络标准上都有了一定的成果。

3 数据挖掘在商业银行客户关系管理系统中的应用

进行数据挖掘之前要做好信息的收集、建立数据仓库的工作,数据仓库存储来自银行不同业务的大量的历史数据,与一般数据库不同,历史数据可供分析和决策支持,但是不能对其进行修改。

在商业银行的客户关系管理系统中,其主要解决的问题包括:1)客户概况分析,将银行的客户根据消费情况分为不同层次、了解不同层次客户的爱好和消费习惯,便于制定策略调整未来的产品和服务;2)客户忠诚度分析,使用重复交易率、持久性等指标判断客户对该银行金融产品的忠实程度;对忠诚度好的顾客可以给予一定的优惠政策,减少该类客户的流失率;3)客户利润分析,不同级别客户的一次消费行为为该银行带来的边际利润、顾客总体消费带来的总利润、净利润等;4)客户性能分析,根据不同客户对各类金融产品的偏好、购买渠道、购买地点等计算出顾客的销售贡献率。

3.1数据准备

数据准备阶段包含数据集成、数据选择、数据预处理等过程。

首先从银行客户关系管理系统的目标中选定需要解决的问题,对问题进行初步分析,确定问题的类型。根据问题的类型,选择与之相关的现实数据库,确定挖掘的目的或任务,制定挖掘计划,根据计划收集与问题相关的、有代表性的数据。银行的数据的存储一般使用SQL Server、oracle、DB2、sysbase等数据库,累积的数据量比较大,且格式不统一。进行数据预处理的目的是将数据库中数据变换成可以挖掘的形式,即合并多数据库运行环境中的数据,消除数据库中的重复记录、补缺确实的记录等,避免出现二义性的语义、消除不规范的脏数据,建立标准化的、统一的数据视图。所选数据的数量和质量直接影响数据挖掘的结果,因此,不相关的数据要尽量排除,减少数据的处理量,以免影响数据挖掘的处理效率和最终结果。

随着金融机构之间竞争的加剧,各种创新的金融产品不断进入市场,对客户而言,可选的范围增加,对客户效用的取得大有益处。然而,多数金融机构的产品之间并无太大差异,因此,在相似或者同质金融产品的竞争方面,银行客户的忠诚度分析意义重大。此处以客户的忠诚度分析为例,需要准备的数据大致包括:同一客户对该银行不同种类金融产品的消费量、老顾客对新产品的交易率、通过调研得到的客户对企业的满意度等数据。

3.2数据挖掘

该步骤是核心环节。根据第一步设定的挖掘目标,从各种数据挖掘的技术和算法中选出适合该类挖掘的模型,并选定最终需要测试的数据。完成以上步骤后,开始进行数据的挖掘分析,得出数据挖掘的结果。所选模型会呈现不同的挖掘结果。

3.3模型评价和检验

前一个步骤的测试数据,可以对挖掘的结果进行检验,并计算误差率,若未达到计划目标时,可重回之前步骤,再次进行数据挖掘。

数据挖掘的结果对决策的支持作用并不绝对,有些挖掘结果对决策是无用的,甚至完全偏离事实,因此,对决策者而言,需要结合自身的知识与经验,并结合多种其他指标,形成多元化的评价体系,从而判断数据挖掘的有用性。

4 数据挖掘技术在银行客戶关系管理系统的应用存在的问题及相关策略

我国多数大型商业银行都在客户关系管理中引入数据挖掘技术,但是应用成功的案例相对较少。存在的问题:1)数据挖掘系统的构建成本高,但是使用频率较低;2)算法的选取等原因,导致挖掘结果不能支持决策,或有违事实的情况发生;3)数据挖掘系统难以适应挖掘需求的频繁更变;4)数据挖掘的效率较低,对于同时处理多种不同类型数据的挖掘,缺乏高性能的挖掘算法。

对解决以上问题,需要关注以下几个方面的研究:

4.1高性能数据挖掘算法

大型数据库中每日产生的、多年积累的巨量记录,有一维至多维、单层至多层及不同组合记录。其中,有结构化数据、空间数据、时间序列数据、WEB数据、多媒体的音频视频图像等半结构化或无结构的数据,无可避免的出现数据噪音、脏数据等。

因此,要设计能够处理多种类型或组合类型数据的高性能的数据挖掘模型,或为了提高挖掘效率,研究并行挖掘、分布式挖掘和增量挖掘的方法。

4.2知识验证机制

数据挖掘的结果的有用性需要结合实际的知识来进行验证,只有符合人们认识规律、能得到事实支持的数据挖掘结果才具有可用性。

4.3知识解释

数据挖掘的结果所呈现的规律,必须通过形象的解释,并以直观易用的形式呈现出来,才能更好被更广泛的接受和使用,因此,要注重对知识解释过程的研究。

5结束语

面对经济全球化的趋势,商业银行的竞争的范围和强度不断增大,对银行高层有效决策的要求也不断加强。数据挖掘能够帮助决策者从客户关系管理系统的历史数据中挖掘出有助于决策的信息,有助于留住老客户、开发销售渠道、吸引新客户、开法新产品和进行有效的风险管理。

本文介绍了数据挖掘技术在商业银行客户关系管理系统中的应用步骤,指出了其中存在的问题,并针对这些问题,指出了未来研究数据挖掘技术可能的研究方向。

参考文献:

[1] Fayyad U M, Piatetsky-Shapiro G, Smyth P,et al. Advances in Knowledge Discovery and Data Mining. AAAI/MIT Press,1996

[2] 刘明亮,李雄飞等.数据挖掘技术标准综述[J].计算机科学.2008.

[3] 周晶平.数据挖掘在银行分析型CRM系统应用中存在的问题与对策 [J]. 2010年3月第1期

[4] 聂文海.挖掘技术的客户忠诚满意度模型及其应用研究[M].华中科技大学,2006.

[5] 吴志华.基于知识发现的时序数据挖掘算法研究[M].华北工学院,2002.

[6] 吴志鸿.数据挖掘技术在CRM中的应用[J].现代情报.2003年7月第7期

[7] 邹志文, 朱金伟.数据挖掘算法研究与综述[J].计算机工程与设计.2005年9月

猜你喜欢

数据挖掘商业银行
探讨人工智能与数据挖掘发展趋势
商业银行资金管理的探索与思考
关于加强控制商业银行不良贷款探讨
基于并行计算的大数据挖掘在电网中的应用
数据挖掘技术在中医诊疗数据分析中的应用
国有商业银行金融风险防范策略
我国商业银行海外并购绩效的实证研究
一种基于Hadoop的大数据挖掘云服务及应用
我国商业银行风险管理研究
发达国家商业银行操作风险管理的经验借鉴