APP下载

大数据时代下数据挖掘技术在银行中的应用

2015-05-30霍魁

2015年26期
关键词:大数据时代数据挖掘银行

霍魁

摘要:伴随着信息技术的飞速发展,各行各业各个领域都在积极引进信息技术,银行工作也是如此。当今时代已经成为了富含海量数据信息的大数据时代,想要在此背景下从众多信息中迅速挖掘出想要的信息,比以往要困难很多。对于银行工作来说,数据基本决定了其发展,但是有些银行目前却还没有发现海量爆炸性数据所造成的威胁,对此,相关工作人员必须加以重视,引进数据挖掘技术,实现银行业的可持续发展。

关键词:大数据时代;银行;数据挖掘

随着时代的发展和进步,对于银行来说,需要不断完善计算机系统中的操作数据存储。数据库群、企业数据仓库、主数据存储等建设相应的基础网络。NoSQL、Lucene、Hadoop、MapReduce等技术的发展适当的增加了银行掌握数据的能力。现阶段,无论银行面对的是外部数据和是内部数据、非结构数据或者结构数据,已经具有比较成熟的产生、整合、存储以及访问数据的技术,此外,要想最大限度实现数据的价值,需要银行全面分析挖掘数据的发展趋势和规律,并运用到银行运行中。

一、大数据时代银行面临的挑战

(一)银行中传统方式对银行企业文化的冲击

随着大数据的发展,对银行产生很多影响和冲击,对于银行企业文化发展的影响主要包括以下几方面:第一,摒弃偏爱纯净数据和有条理数据,转向接受非结构数据,允许少量不精确数据。第二,逐渐从局部冲击变为全部冲击,因为大数据时代不同于以往的情况,需要大量数据,因此全面冲击企业文化。第三,企业文化与数据逐渐冲因果关系变为相关关系[1]。

(二)银行面临的数字化挑战

大数据分析对于银行决策来说就是一定的扩展数据、快速分析数据的作用,支持银行发展目标。随着大数据时代的发展和进步,银行面临着一些挑战,一方面要使银行内部不断开发新业务和新产品,另外一方面就是传统数据结构性能问题。数字化的发展使得银行需要面对大量的数据,数据增长速度快、规模庞大;类型多,数据类型除了传统的结构以外,还具有语音、视频、文字、图片等形式,结构复杂,内容繁多;分析规则复杂,一般有价值的数据藏的都比较深,需要利用多种算法进行分析;具有很高的实时性,随着数字化发展,数据处理的速度更快,实时性更强,需要及时准确地进行处理[2]。

二、数据挖掘技术

(一)数据挖掘概述

1.数据挖掘技术应用步骤

数据挖掘实际上就是在海量数据中利用各种分析工具来发现数据之间的关系和模型的过程,预测数据关系和模型,以便于可以很好的找到潜在的数据关系,发现被忽视的原因,因此,是目前解决数据爆炸的有效方式,被称作KDD。数据挖掘属于反复的过程,主要包括以下步骤:

第一,定义问题和分析主题。在挖掘数据的时候,需要分析应用领域,主要包括应用目标和知识[3]。定义问题可以适当的充分了解实际情况,熟悉背景以及用户需求,不能定义缺少背景的知识。在确定用户实际需求以后,需要评估历史数据,利用数据挖掘来不断满足用户需求,然后制定合理的数据挖掘计划。

第二,准备数据。数据挖掘需要处理的数据不但具有大量数据,还会存在一些冗余数据和噪音数据以及不完整数据。准备数据主要包括数据清理、集成数据、选择数据、变换数据、归约数据以及数据质量分析。

第三,建立模型。主要就是通过已知知识和数据建立模型,能够有效的分析和描述知识和数据,可以在未知数据中进行应用。建模实际上就是把一般规律、相关经验形成抽象的分析模型,挖掘数据就是依据模型分析、处理、预测数据的过程。

第四,评估模式。评估模式主要就是通过知识来体现用户需求,然后优化挖掘数据过程中的数据,直到符合规范。

2.数据挖掘技术算法

数据挖掘技术算法实际上具体实现数据挖掘方法,主要包括模型表示、模型评价标准以及发现方法三部分。数据挖掘技术算法主要包括决策树、遗传算法、K—近邻算法、神经网络等。具有最佳搜索空间的方式就是遗传算法,利用应用遗传算法的适应函数来合理的搜索方向,然后通过人工算法来模拟一些生物种群的优胜劣汰和多样性,从而进行周而复始的一代代演化。决策树是利用树状结构来体现影响数据变量的分析预测模型,属性就是决策集合或者分类集合,通过自上到下的回归方式,树的叶结点代表不同种类、非终端结点代表属性。合理计算每个树期望值,得到最优解。K—邻近算法是在距离度量分类的基础上进行的,假设所有集合不包括数据集,并且包括很多类别的期望值。神经网络是能够模仿人类大脑思考结构的分析方式,利用非线性预测,来进行识别,从而得到各网络单元的数据。数据挖掘工具核心内容就是算法,主要包括分类分析、聚类分析、关联分析、统计分析、时间序列、相关分析以及值预测。一般比较常用的就是分类算法、值预测和聚类分析[4]。

表一数据挖掘工具比较分析

三、数据挖掘技术在银行中的应用

(一)贷款方进行信用风险评估应用

贷款方进行的信用风险评估是银行应用数据挖掘技术的主要方式之一,可以建立一定的评级模型,例如,神经网络模型、FICO评估模型以及贝叶斯分析模型等来进行贷款方风险评估。在评估银行账户信誉的时候,可以适当的使用直观量化的方式。依据信用评分为基本例子,在确定权重的时候,按照数据挖掘模型,对于申请过程中的每一项进行打分,累加起来就是申请人的实际信用情况。然后银行依据信用评分来确定是否接受申请人的申请以及信用额度[5]。

(二)客户关系管理中应用

客户关系管理也是银行数据挖掘技术应用的重要方式之一。发现以及开拓新客户是银行发展过程中比较重要的部分,利用探索性挖掘数据的方式,可以适当的发现数据中心的特征以及预测营销活动的实际响应率,例如,自动探测聚类。利用聚类分析的方式把客户进行分类,然后依据客户风险、服务收入成本等来分析、预测以及优化相关因素,以便于能够发现并达到盈利的目标。利用决策树的方式来合理计算客户贡献期望值,以此来分类客户,然后依据不同期望值进行分组,可以分为三种类别 ,包括黄金客户、顶级客户以及一般客户。然后依据不同种类客户的实际特点来提供一些特色服务,从而可以有效提高忠诚度。数据挖掘技术运用到银行中,可以适当的预防流失客户,在风险出现流失客户的时候,需要通过特殊待遇、额外增值以及激励忠诚度来对客户进行保留。例如,在预测客户停止在此银行放贷,变为去别的银行,可以利用适当降低利率以及增加额度来保留客户。数据挖掘可以在一定程度上及时转移关联因子,找到客户中比较类似的转移者,然后利用分析孤立点的方式来体现异常客户行为,以便于银行能够最大限度降低客户流失[6]。

(三) 关联规则挖掘在电子银行产品推荐中的应用

随着信息化技术的发展,电子技术也在不断进步,传统的银行柜面服务模式已经逐渐不能符合社会发展需求,电子银行应运而生。在推荐电子银行产品的时候运用关联规则,从大量银行数据中可以适当抽取一些有价值、有效的数据信息来推荐电子银行产品,也是关联技术的具体实践,可以在一定程度上带动销售、挖掘客户以及开发客户等的发展。电子银行发展,在一定程度上改变传统的银行模式,不断提高银行处理系统的智能化水平,让客户充分了解电子产品的优势,满足客户实际需求,建立相应的可以存储大量数据的数据库,利用简单的方式进行操作就可以得到数据信息,需要从多角度、多层次进行关联。关联规则运用到推荐电子产品中,可以在一定程度上调节资源配置,解决人力和资金,提高销售率,科学的进行市场预测,吸引客户,以便于可以获得更多利益[7]。

(四) 金融监管应用

第一,随着金融市场的不断发展和进步,保证金融市场正常运行的就是金融监管,同时也是预防市场风险的主要方式。现阶段,金融监管方式应用数据挖掘及时最主要的就是集中在反洗钱方面。在反洗钱中应用数据挖掘中的分类研究、孤立点分析、聚类等方式具有很大优势,利用上述挖掘数据技术可以保证金融机构可以有效的监测洗钱行为。

第二,监管非现场。在监管非现场的时候,进行数据挖掘,依据实际风险情况、资源情况、流动性情况、应力情况等,利用定量分析以及模型技术来逐渐累积监管模型库,以便于能够及时的计量银行经营情况。客户情况以及风险情况,进行纵向和横向比较,可以从根本上了解现场监督以及警示非现场监督。

第三,数据可视化。数据挖掘最重要的就是大量数据,对数据进行可视化处理可以为分析数据提供可靠图形,为金融监管人员提供保障和基础[8]。

结语

总而言之,随着大数据时代的发展,银行以往通过利息差来当作主要收入的形式已经成为过去,银行不仅面临大数据时代临挑战和冲击,还需要面对越来越激烈的行业竞争,因此,需要从以往的产品为中心的模式变为客户为中心的模式,充分发挥数据挖掘技术的作用,掌握好客户实际需求,并且开展一些具有一定针对性的营销活动,为客户服务,提高客户价值,从而打造出具有竞争力的银行。(作者单位:中国人民大学)

参考文献:

[1]王日宏,王晓龙.大数据时代下数据挖掘在银行中的应用[J].电脑知识与技术,2014(7):1369-1370,1374.

[2]于上上,陈璐,孙璐等.银行数据挖掘的运用及效用研究[J].计算机光盘软件与应用,2014(6):25-26.

[3]戴玉勤,景广军,谢俊元等.基于数据仓库技术的银行决策支持系统设计和实现[J].计算机工程与应用,2012,38(5):224-227.

[4]贺本岚.大数据时代数据挖掘在银行客户关系管理中的应用研究[C].//第八届中国管理学年会——中国管理的国际化与本土化论文集.2013:1-6.

[5]彭敢.Apriori算法在银行系统数据挖掘中的应用[J].电脑编程技巧与维护,2012(24):62-63.

[6]郭莹,张晓燕.数据仓库和数据挖掘技术在银行客户关系管理中的应用[J].科技管理研究,2013,23(2):75-78.

[7]周晶平.数据挖掘在银行分析型CRM系统应用中存在的问题与对策[J].湖北大学学报(自然科学版),2010,32(1):46-49.

[8]黄昶君,王林.大数据助推银行零售业务量化经营——大数据时代的零售数据挖掘和利用探索[J].海南金融,2014(1):66-69.

猜你喜欢

大数据时代数据挖掘银行
探讨人工智能与数据挖掘发展趋势
10Gb/s transmit equalizer using duobinary signaling over FR4 backplane①
基于并行计算的大数据挖掘在电网中的应用
保康接地气的“土银行”
大数据时代下图书馆的服务创新与发展
大数据时代高校学生知识管理
从“数据新闻”看当前互联网新闻信息传播生态
“存梦银行”破产记
一种基于Hadoop的大数据挖掘云服务及应用
银行激进求变