大数据风控在金融实践教学中的应用探讨
2020-06-15刘恩猛刘家鹏
刘恩猛 刘家鹏
摘 要 大数据的应用为金融风险管理提供了更多的决策信息,也对金融风险管理技术提出了更高的要求。本文讨论了金融工程专业相关实践课程中引入大数据风控相关内容的可能,意在提高学生风险管理意识和管理技术水平,适应社会人才的需要。
关键词 大数据风控 金融风险管理 实践教学
0引言
2008年全球金融危机后,我国经济增速放缓,金融市场波动加大,风险控制与管理成为金融部门或企业工作内容不可或缺的一部分。然而,传统金融风险管理主要是定性分析和一些传统的(系统内数据)定量分析相结合来构建风险管理体系,这在应对当前金融市场的频繁波动时显的不够灵敏。这些金融风控中的不足可以利用大数据风控加以改进,而这些改进所需知识和技术,可以融合在金融工程专业本科教学的一系列相关实践课程中,比如应用统计学、金融计量学、金融数据挖掘、金融风险管理、保险学(保险精算)、量化投资、互联网金融等,这对原有的金融实践课程教学提出新的挑战。
1大数据风控的特点
大数据的出现与应用让金融风险控制方法和信息来源都有了质的飞越。大数据具有数据量大、信息丰富等优点,但也存在数据结构复杂,处理难度大的问题。风险管理中若能用好大数据,可以增加信息来源,为多源信息融合提供有利条件,可以提高风险管理有效性。当前利用大数据做风险控制既有优势也有困难,优势是:覆盖面广、信息维度丰富、数据获取及时;注重强相关信息,忽略弱相关信息;可以丰富数据的广度和深度;困难是:隐私得不到保护,数据查得率不高,数据覆盖率不高,匹配率不高,饱和度不高,鲜活度不高。随着网络信息监管的加强,信息来源也会越来越规范,为提高大数据质量提供了有利条件。
2大数据风控在金融实践教学中的应用
将大数据的理论与应用融入金融教学实践中,可以增加学生获取、利用大数据的技术手段,提高其风险管理的技术水平;开拓学生视野,提高金融风险管理的能力,加强学生利用大数据进行金融风险管理的意识。和传统的风险控制理论相比,金融大数据的搜集(多种技术手段)和应用(传统数据、商业数据库大数据和网络搜集的数据等多源信息的综合利用)可以提高风险管理效率,在原有传统的风险管理理论基础上增加风险信息来源与决策模型的选择,提高风险管理的有效性,适应社会人才需求。学生可以在不同的课程中学习大数据风控方法和技术,比如我们可以将其融入到下列课程中。
2.1在统计学、金融计量学、金融数据挖掘等课程中讲解大数据统计理论
大数据的出现与应用,对传统统计工作提出了挑战,原有的统计方法可能在面对大数据时会无能为力,需要提出新的统计方法才能解决现实问题,如高维变量的选择、并行计算,利用文本挖掘等技术获得数据等,这些可以在讲解统计模型理论时提及,让学生对大数据问题有所认识,在金融数据挖掘课程实验中重点讲解适合大数据风控的模型。
2.2在python语言、金融数据挖掘课程中讲解相关获取和利用大数据的技术
大数据信息可以由视频、语音、图片、文本、数字等形式表现,但这些信息中90%是以文本的形式体现的,所以信息的提取技术非常关键,常用的技术是网络爬虫和文本挖掘等,这些可以在python语言、金融数据挖掘等课程中讲解相关技术。另外,大数据获取后的清洗、整理与利用也非常关键。数据清洗是python的强项,处理与应用可以在金融计量(常用的是Eviews软件)或金融数据挖掘(常用的r语音)中讲解。
2.3在金融风险管理、互联网金融课程中讲解大数据风控的应用
利用网络爬虫、文本挖掘等方法获得大数据,并将其利用在欺诈行为识别、贷前风险控制、运营风险管理等。如对P2P平台借款者违约风险评估中,平台能通过金融系统获得一些传统的征信数据,仅凭这些数据提供的决策信息有限,借款人可能有大量的信用相关信息散落在网络上,这些信息重要但分散,需要利用相关数据挖掘技术查找并提炼,比如可以找出借款人经验及能力信息、居住稳定性信息、借款人及其家人健康信息和信用风险方面的信息(如不良信用记录、拖欠税费、电费等情况,还款能力问题等)。
2.4在信用评级课程中,利用大数据改善传统评级方法中信息利用的局限
评级机构搜集被评级对象的公开信息与非公开信息,传统的搜集方法容易遗漏,造成评级时的信息不充分。这里可以借助大数据,在网络上搜集各类公开或非公开的文本信息进行提炼和加工,为划定评级结果提供更多的信息。比如可以利用文本挖掘技術搜集有关被评级公司运营的情况,包括物流信息、与合作伙伴关系(如拖欠货款、交货逾期等)、消费者对其的评价等。
信用评级中的几个难点可以利用大数据得到缓解,比如被评级主体的战略风险和还款意愿的量化问题。这两项在机构评级中往往作为调整项,无法真正量化,但两项内容对应违约风险来说是非常关键的。我们可以利用文本挖掘,采集、挖掘公司相关信息,评估公司的还款意愿,评估战略风险对违约风险的影响。比如在专利数据库可以利用文本挖掘技术,发现企业主营产品的技术创新趋势,和企业的创新战略作对比,判断企业战略的合理性。在网络信息中挖掘被评级对象的信用风险相关信息,确认其还款意愿的高低。
2.5保险(精算)学课程中,可利用大数据提高精算精度、甄别理赔欺诈等
现在保险行业对投保人或标的物的风险评估已经不再局限于历史数据和行业数据。以车险为例,车载传感器设备收集的驾驶员行为数据、二手车交易数据等大数据的获取和利用,为风险特征描述和数据资源的获取都带来了便利。对保险精算师来讲,充分利用大数据资源,可以建立更有效的模型,更精准的识别对象的潜在风险,提高精算准确度,帮助公司更准确的评估风险和计算准备金。
另外,通过保单数据、理赔记录(不限于公司内)、社交网络数据、犯罪记录等多样化的大数据源,辅之以有效的算法和模型可以识别投保人存在的欺诈风险、理赔中可能存在的骗保等欺诈行为,还可能挖掘出欺诈的方式等。
3可行性分析
以中国计量大学经济与管理学院为例,分院建有金融工程实验室,为大数据风控引入实践教学提供了硬件基础;分院还购买了wind、同花顺等金融数据库,再借助网络爬虫、文本挖掘等技术就构建多源信息的大数据,为风险控制与管理提供数据支持。本校的金融工程系学生(二年级及以上)具备了良好的经济、金融知识和定量分析的基础,对于学习大数据理论及模型应用奠定了坚实的基础。有了获得大数据的技术支持,相关教学中案例数据可以经常更新,让学生接触实际中大数据应用的需求,认识大数据的价值。
4总结
本文从金融实践教学的角度讨论了对大数据风控的引入,目的是使学生学会大数据统计思维,并学习大数据在金融风险管理方面应用的技术,为将来适应社会需求、从事风险控制工作做好准备。网络时代带来了信息爆炸,如何应用好海量信息是金融风险管理者需要思考的问题。我们认为从金融(工程)的本科教育就开始灌输大数据统计思维,教授大数据技术是个不错的尝试。
参考文献
[1] 陈晓华,曹国岭.互联网金融风险控制[M].人民邮电出版社,2016.
[2] 黄晓斌,赵超.文本挖掘在网络舆情信息分析中的应用[J].情报科学,2009(01):96-101.
[3] 刘兰,赵新力,李艳.基于文本挖掘和技术路线图的技术创新机会发现[J].中国软科学,2007(06):102-105.
[4] 王星等.大数据分析:方法与应用[M].北京:清华大学出版社,2013.
[5] 朱建平,谢邦昌,马双鸽,张德富,方匡南,潘璠.大数据统计理论、方法与应用[M].北京:北京大学出版社,2019.