大数据技术在商业银行信用风险管理中的应用探讨
2020-11-09刘芹安徽师范大学
文 / 刘芹,安徽师范大学
目前大数据的发展已经取得了一定的成就,在技术方面也日渐成熟,并且已经形成了一套特有的架构体系,但在银行风险控制与管理方面的应用,始终处在摸索的阶段。对于如何把大数据技术与银行风险管理结合起来,构建一个基于自身业务特点的风险管理体系是当前亟需解决的问题。在大数据逐渐升温的背景下,就大数据在银行风险管理的应用等相关问题进行了分析研究,希望能对大数据在银行风险管理方面的运用起到一定的借鉴意义。
1 大数据技术在银行信用风险管理中的应用现状及问题
1.1 大数据技术的应用现状
2011年,大数据技术开始盛行,但是国内的各企业、机构较晚接触到大数据,所以它们对大数据技术的应用了解还不够深。在国内金融领域,大数据技术主要应用在以下几方面:
信贷领域:大数据技术的兴起引发了大量互联网信用评估机构诞生,银行可以通过这些评估机构来完善对个人信贷风险的评估。
征信领域:以大数据技术为基础,商业银行可以记录客户的信息数据和评估他们的行为,将这些数据进行分析和还原,可以全面评估客户的风险状况,完善市场征信体系。
金融安全领域:随着大数据技术在各个领域的广泛应用,利用大数据技术做违法的事也就屡见不鲜,所以维护金融领域安全就逐渐受到了重视。
1.2 大数据技术在银行信用风险管理应用中存在的问题
现在,国内银行已经在信用风险管理应用中取得了相不小的成就。但是由于外部环境的不断变化,商业银行风险管理体系仍然面临着两个主要的问题:一是风险识别和管理方面的技术手段比较落后,进而就会让风险防控滞后。二是管理层大多会将风险管理重点侧重于操作风险、合规风险,没有全面风险防范的理念。
2 基于大数据技术的商业银行信用风险管理系统设计
2.1 设计原则
2.1.1 业务相匹配;系统设计要满足信用风险识别、计量、监测和控制的要求,确保可以实现数据采集、存储、计量、风险监测、风险控制等功能,要具有灵活性,在一定程度上可以保持银行的自主性。
2.1.2 模块与分层;在技术层面,大数据框架里会包含数据采集、存储、处理、分析、应用等层次;在业务需求方面,信用风险管理又囊括了风险识别、计量、监测与控制等程序。不管从哪个角度去看都对系统分了层,在分层架构中,每层都是相互独立的,这样应用起来比较灵活,如果各层间接口不变,整个过程几乎就不会互相影响,这样对系统的维护也是有利的。
2.1.3 数据要可靠;本文所设计的系统不是业务系统,不能从源头上收集到数据,更多的数据是来自于银行内部其他业务系统和外部系统。在采集过程中,对相关数据标记它的来源,从而提高数据的可靠性,尽可能对数据进行预处理,最大限度保证数据的质量。
2.1.4 职责相分离;在系统设计中体现为,参与风险计量模型开发的人员,就不能进行风险计量、风险监测、风险预警、风险控制以及其他方面的控制;有访问计量模型训练数据权利的人员,不能对计量模型应用数据进行访问;对推翻和更新进行评级的人员,不能进行风险监测、预警、控制等等。职责分离可以把业务任务真正落实到几个特定人员身上,这样就可以提高效率的同时也降低了操作风险。
2.2 架构设计
2.2.1 采集接口层;这个层次的设计主要以 Flume 为例,阐明系统的采集及预处理是如何进行的。Flume是由各个Flume 代理(Agent)组成的,它们分布运行在不同主机系统中,Flume 代理是由 source(数据来源)、channel(内存存储传输数据)以及 sink(数据目标)三部分组成的。靠近边缘的Flume代理主要是负责采集数据,紧接着就是将数据转发给负责汇总的 Flume 代理,最后储存到本系统存储层,数据预处理模块,在负责汇总的Flume代理中执行。
2.2.2 数据存储层;通过采集接口层采集到的数据将它们存储在分布式文件系统中,No SQL数据库对其进行管理,这样就能够实现大规模、多类型数据的存储与管理。这个存储系统采用的是Hadoop集群下的HDFS分布式文件系统与HBase列式存储数据库。HDFS和HBase都是运用主从节点的设计方式。
2.2.3 风险计量层;大数据系统不仅要采集内部数据也要采集外部数据,因为数据具有稀疏的特征,采用分布式结构对数据进行存储计算,方便分层,所以可以采用母子结构方式去设计计量模型,母模型的输入就是子模型的输出,这样可以把数据逐层加工。子模型中有运行与备用两个模型,一旦运行下降,备用模型就可以进行替补。在这个模型的学习过程中,要开发合适的算法。计量模型的开发是一个监督学习的过程,Logistic回归算法就比较适合概率决策,解释性较好,所以可以选取其作为母模型算法,决策树、神经网络、支持向量机可以较好地处理稀疏数据,所以就将其选做子模型算法
2.2.4 应用接口层;应用接口层的作用主要是将其他业务系统与综合风险应用平台进行衔接,可以把信用风险计量的结果、风险监测的结果和业务控制的结果导出来。在这个层面设计上,要注意协调与配合其他系统,这样可以让数据结构和传输方案保持一致。
总结全文,大数据技术的应用,对商业银行的全面风险管理来说无疑既是机遇又是挑战,所以银行应该要掌握技术的重点,通过对数据整理体系进一步完善,对数据存储设备进一步研发等措施来提升自身风险管控水平,这样才能够促进我国商业银行健康有序发展。