数据挖掘在金融领域中的应用及发展趋势
2020-03-12花亚博
花亚博
(淮北师范大学信息学院,淮北 235000)
目前,不论是银行还是其他金融机构,每天都要处理信贷、投资、储存等海量金融数据,而面对这些海量数据时,先进的数据挖掘技术则必不可少[1]。而将这些数据通过数据挖掘技术进行定点、针对性的处理,则能够完成对相关关键数据信息的全面、有效提取,从而保证金融机构储存数据的完整可靠和高质量,促进金融机构的良性发展。随着互联网技术、第三方支付平台等的出现和大力发展,数据挖掘也开始深入到网络金融借贷中去。不过传统银行业也在积极地利用数据挖掘技术,来进一步稳固其在传统存、贷、汇业务上的优势地位和拓展新市场[2]。本文将对数字挖掘在金融领域的应用、流程、现状和发展趋势等方面进行系统研究。
1 数据挖掘在金融领域中的应用
在目前这个信息科技大力发展的时代,数据挖掘技术由于其极好的数据信息提取能力能够有效助力于信息决策、信息管理、科学研究等,从而使其具有了广泛的应用前景[3]。同时,数据挖掘与各个行业之间实现有效结合,也为其大力发展注入源源不断的活力,数据挖掘正以一个前所未有的发展速度向未来社会迈进。目前,数据挖掘技术已经在金融领域里得到了广泛的应用,在金融领域主要体现在多维数据分析、贷款偿还预测、客户信用政策、目标市场客户分类和聚类以及对金融犯罪防范等方面。
1.1 多维数据分析
数据挖掘在金融领域中的多维数据分析主要包括对金融数据进行分析后,对相关的数据挖掘设计以及为相关金融机构建构对应的数据仓库,从而掌握相关数据的一般性,助力于金融机构相关业务的开设和开展[4]。例如,在贷款上,其在对象上可分为国家、企业、个人和其他;在时间上可分为第一季度、第二季度、第三季度和第四季度;在标准上则分为正常、次级、关注、可疑和损失等,同时也可以根据地区不同、部门不同等因素,分析负债、收入等情况,从而获得相关数据的最大、最小、平均等信息,从而进行相应金融行为的选择。
1.2 贷款偿还预测
放贷是银行最主要的业务之一,因此做好贷款偿还预测有助于银行相关业务的顺利展开[5]。而在银行实际的数据挖掘中发现,需要充分用到特征选择等方法对各种因素进行有效识别,并选取重要因素,排除非相关性因素,从而实现最为准确的贷款偿还预测[6]。例如,某金融机构,在对信贷申请人进行相关信息分析时,会使用相应的数据挖掘模型,对每一位申请人超过万条的信息数据进行有效的挖掘和分析,而整个过程只需要几秒,就能对申请人万条以上的信息数据得出相应的行为指标,从而得出综合结论,以便相关人员进行标准评判。事实表明,该金融机构的违约情况还低于行业现行违约率的50%。这表明,在贷款偿还预测上,将信贷申请人过往信息数据进行挖掘分析,并与数据仓库中的全体借贷人信息进行比对,从而得出该申请人最大的违约概率,并与一个最大风险概率进行二次计算评估,从而得出申请人最终的相关信息数据发展趋势,并以此来匹配最终的偿还能力,从而决定是否放贷。
1.3 客户信用政策
做好客户信用政策有助于银行相关业务的顺利展开[7]。而在银行实际的数据挖掘中发现,需要充分用到特征选择等方法对各种因素进行有效识别,并选取重要因素,排除非相关性因素,从而制定最为准确的客户信用政策[8]。例如某金融机构的资产估值为100亿元人民币,而在该金融机构的信贷业务上,其在对潜在客户进行风险识别上,就需要做好对客户信用的识别,以将其的放贷风险尽可能的降低。而在客户信用政策建设上,该机构首先是将其内部核心系统与相关信用系统进行交互连接,形成决策引擎来处理相关的信贷申请信息。并且,该机构还需要针对低收入客户进行相关性的信用评估。而在数据挖掘技术的应用下,在处理相关客户的信用数据以及提供对应的信用评分上的花费时间仅需要几秒钟,这使得该机构能够在一个月内处理近10万份申请材料,而根据该机构相关数据报告显示,在相关数据挖掘技术的加持下,该公司一年内的贷款支付失职情况整体下降了55%。这表明在数据挖掘技术的加持下,不仅提升了处理信贷业务的速度,也提升了处理信贷业务的质量,能够推进信贷行业的高效发展。
1.4 目标市场客户分类和聚类
数据挖掘在对金融领域目标市场客户的分类和聚类上,主要是对目标客户进行有效识别和对目标市场进行有效分析,并通过分类和聚类将目标客户分划到相应的客户群体中,从而推动目标市场的建立[9]。例如,某金融机构通过数据挖掘将100位目标客户进行金融产品投资选择上的分类和聚类,将其中分析得出喜好基金投资的40位客户分到基金客户群,并向其进行基金市场构建,从而帮助相关客户完成了资本5%的增值。这表明,做好客户的分类和聚类有利于金融市场与对应用户的集中,从而促进相关金融市场的发展。
1.5 防范金融犯罪
金融犯罪是指在金融活动中,出现对金融管理法规和金融管理秩序的违反和破坏,例如洗钱、庞氏骗局等[10]。而这些犯罪活动往往能够因为其资金涉及范围广泛,对金融环境的建设造成极大的负面影响。例如,某金融犯罪事件,两名犯罪嫌疑人相互勾结,于2010年以某香港证券公司名义在上海注册并成立了一家投资咨询公司,两名犯罪嫌疑人指使相关员工以打电话等形式拉拢投资者,向其承诺投资金额可在百倍放大后用于外汇保证金等,而两名犯罪嫌疑人在获取资金后将人民币以非法渠道流入境外,从事违法犯罪活动,据官方资料显示,仅某一地区就有306人被骗,被骗金额高达3 000万元人民币。再比如某地两年时间处理的金融犯罪事件就有10起,涉及金额达9 510万元。
因此,做好金融行业犯罪的防范工作,减少不必要的人力、物力、财力消耗是十分必要的。利用数据挖掘技术,可以将数据库信息进行有效集成,应用多种分析工具识别出其中出现异常的模式,并对其进行定点追踪。例如在数据链上识别出在某一段时间内,某一对象频繁出现了大量现金流量,且资金流向存疑等,面对这样的异常模式,相关人员需要通过可视化、分类、联接等多种工具进行系统化地分析,获取相关犯罪事实。
2 数据挖掘在金融领域中应用的流程
金融领域的数据挖掘工作技术性很强,需要一定的流程来完成相应引导,保证挖掘工作的有序完成,达到有效挖掘的目的[11]。因此,在进行数据挖掘之前,需要制定出相应的步骤、流程,并标示出每一步需要完成的任务和目的,从而保证挖掘工作能够在一定秩序下顺利进行。在当下的数据挖掘中,市面上出现了众多软件供应商提供的挖掘模型,以满足相应用户数据挖掘工作的有序进行。例如,SPSS公司推出的5A数据挖掘模型等。在数据挖掘模型中,总体流程主要是问题定义、数据库建立、数据分析、数据准备和模型建立、评价与实施五个部分。
2.1 问题定义
问题定义是数据挖掘开始前最重要的一个步骤,因为虽然数据挖掘的具体结果具有不可预测性,但是相关问题相对来说却具有可预测性[12]。因此,在问题定义上,需要相关人员做好相关数据和业务的了解和掌握情况,必须要对相关目标数据和业务有一个十分明确的定义。例如,在提升大众储蓄资金的金融产品投资比例上,需要弄清楚是提升全部储蓄用户的金融产品投资比例,还是提升某片区储蓄用户的金融产品投资比例等情况,在确定相关定义后,才能进行相应问题建模。
2.2 数据库建立
建立数据库,有利于对底层数据的直接利用,减轻工作量,提升工作效率。在建立数据库上,通过对相关数据的收集,并根据相关数据的描述进行相应数据的选择等,从而完成对相关数据进行分类和整合,最终建立起数据库。
2.3 数据分析
数据分析是为了找出对相关数据信息最具有预测价值的数据字段,以实现相关任务的有效完成。显然面对庞大的数字集,人工分析是难以保质保量地完成的,因此,引入数据挖掘相关软件程序,可以实现对相关数据信息的高效分析。
2.4 数据准备
数据准备是数据建模前的一个重要环节,主要是为了完成相关变量的选择、创建和转换工作。在数据选择上,主要是对目标客户的全部数据信息进行有效搜索,并从庞大的数据中选择出适合相关数据信息,以满足接下来的挖掘工作。在数据的创建上,则是对相关备用数据的质量进行研究,并做好相关数据挖掘操作的创建工作。在数据转换上,则是将相关数据信息进行针对挖掘算法的分析模式的转换,助力于数据挖掘工作的顺利进行。
2.5 模型建立、评价和实施
模型建立、评价和实施是数据挖掘中最为实用化的一个过程。模型的建立过程是一个反复的过程,在建立前需要充分考量不同模型与对应问题之间的相关性。一般情况下,都是采用对一部分数据进行建模,并用余下数据进行不断地训练和测试,以此来获取最为准确的数据模型。在模型评价上,对于已经建立好的模型,还需要经过一个评价的过程,从而实现对相应数据模型价值的验证。在模型实施上,相关数据模型经建立并得到相应评价后,则将其匹配到相应数据挖掘工作之中去。
3 数据挖掘在金融领域中应用的现状
目前,随着我国经济的大力发展,金融领域中的各种数据大量增长,从而使得金融行业在对数据挖掘技术的应用上更加广泛,应用能力也更加的扎实。如今,大多数金融机构在面对迅速增长的数据都能够对其进行很好利用,从中分析出相应的价值信息,发现相应的模式和规律,使其竞争力得到有效地提升。例如,从就业薪资上说,金融IT是热门的就业行业,其薪资水平也远远高于其他行业,年薪在12万到40万不等。而毕业生在同等水平、待遇下,在IT技术岗位上,数据挖掘岗位的薪资仅低于算法岗位薪资,排在第二位。目前,数据挖掘岗位的定义是虽然需要用到算法解决相关的实际问题,但是又不单单是算法工作,其还需要做大数据相关工作,而且目前该岗位还属于空位阶段,在未来几年都有相当大的就业前景。但从数据挖掘岗位的就业前景来看,目前数据挖掘在金融领域的发展势头迅猛,发展前景极好。
4 数据挖掘在金融领域中的发展趋势
在我国经济的大发展背景下,我国消费金融得到了迅猛发展,在2015年年底,我国的信贷规模达到了94万亿元,在需求上推动了我国金融行业的发展。例如某银行2014年-2018年的全年新增借贷规模统计表如表1所示。
表1 某银行2014年-2018年的全年新增借贷规模
由表1可知,随着我国对消费金融政策的放开、大数据征信试点、第三方支付平台规模等的大力扩展,我国消费市场的活力被激发,内部消费潜力十分巨大,使我国消费金融得到了充裕发展,这同样也助力于我国金融行业的进一步发展。这也表明,以数据挖掘为代表的先进技术在金融领域的充足发展,使我国金融行业能够面对庞大的数据实现准确、及时的数据信息分析,从而助力于我国消费金融的大力发展。目前,数据挖掘在金融领域中的发展趋势在整体上是呈现高科技化的,主要集中在应用探索、可视化和多系统集成上。在应用探索上,数据挖掘技术正在不断探索、扩大其在金融领域里的应用范围。例如,如今正火的网络金融信贷,就是在数据挖掘技术的大力支持下,使得相关方对放贷要求进行适当的增减来完成相关放贷。在可视化上,数据挖掘进行可视化操作能够对相关数据的特性进行图像化的展示,从而实现更为直观的观察和把握,这是一种发现重要数据的有效方法,因此,可视化数据挖掘技术是目前数据挖掘研究和发展的一个重要方向。而在多系统集成上,数据库系统已经成为金融领域数据信息处理系统中的主要部分,将不同的系统集成在一个统一的框架之中,实现数据的可获得性和一致性以及相关系统的可伸缩、移植等,也是目前的发展大趋势。
5 结 语
数据挖掘技术在金融领域中已有一定的基础,主要是对金融市场中的特定对象演变和发展趋势进行分析,并根据分析结果进行相应预防,从而实现信用评估和预防诈骗,同时在投资上也应用在对股票的分析,以满足客户稳健投资的要求。随着互联网技术的大力发展,网络金融借贷业务得到了迅猛发展,为人们金融业务办理提供了新选择。在数据挖掘技术发展过程中,还伴随着隐私、信息安全等问题,并且由于其发展深度还不够,使其在相关应用领域研究上还存在着诸多挑战,因此,还需要不断加强研究和应用力度,从而实现最大的经济效益和社会效益。