APP下载

大数据风控在互联网金融领域的应用

2017-04-15重庆市第八中学张李遥

电子世界 2017年23期
关键词:风控借贷信用

重庆市第八中学 张李遥

大数据风控在互联网金融领域的应用

重庆市第八中学 张李遥

大数据时代下互联网技术的发展,使得大数据风险控制在金融行业得到了较为广泛的应用。目前,许多金融机构都在各自的风险控制体系中加入大数据处理技术,以提高风险控制系统的准确度和性能。本文首先介绍了大数据风控的基本概念和特点;然后,分析了大数据风控在互联网金融领域的应用;在此基础上,引出互联网征信和互联网借贷案例,详细分析大数据技术在金融风险控制中的具体应用,最后对本次研究做出总结。

风险控制;大数据;互联网金融

互联网金融是指依托大数据、云计算等互联网技术,实现金融业务的一种新兴金融。互联网金融是大数据时代的新产物,它不是互联网技术和金融的简单结合,而是将互联网思维融入到具体的金融业务中,深度融合了传统金融和互联网精神的新型金融。

大数据环境下,互联网金融市场的竞争转变为平台、数据、金融相互渗透、影响的格局。随着数据资源化这一趋势,金融领域海量数据的收集和处理显得十分关键。那么,将大数据技术应用到金融风险控制中,就尤为必要。

1 大数据风险控制

大数据风险控制(简称“大数据风控”)是基于大数据技术的风险控制和风险提示。风控的核心方法在于通过对相似群体的相关数据的分析,用机器学习建模的方法来评估用户违约率。大数据风险控制具有三个特点:

(1)数据维度大:采用的数据全面,涵盖社会行为、人际关系等各个方面。

(2)数据实时有效:实时有效的数据对于风险评估结果影响很大,所以大数据信用评估体系重视用户的最新信息。

(3)结果精准:大数据风控模型由海量数据训练得出,分析角度多样,评分结果更加准确。

2 大数据风控在互联网金融领域的应用

互联网金融领域中大数据风控的基本过程是:从数据源出发,首先对数据进行预处理操作;然后,进行特征提取;最后,研究和比较多个先进的算法,训练得出最优的风控模型。由此得出准确性、稳定性和普适性都相对较高的信用评级体系,最后将其应用到互联网金融产品中。下面将针对几个关键点进行详细介绍。

2.1 数据来源

数据源主要分为三大类:

(1)互联网数据,例如IP位置、网络行为数据等。除此之外,借贷机构较看重各类黑名单数据。

(2)用户授权数据,例如运营商数据、电商数据、信用卡数据等。

(3)第三方数据,例如传统信贷数据、合作机构数据等。

2.2 应用模式

互联网金融企业的风控模式主要分为两种,一种是利用已有的大量数据独立建立风控模型和信用评级体系,这种模式一般出现于阿里巴巴、京东商城等拥有海量用户数据的大型平台;另一种是通过第三方平台共享数据来获得信用评级和风险控制服务,这种模式多应用于中小金融机构。

2.3 与传统金融风控的对比

相比于传统金融风控,大数据风控具有适用性更广、数据更全面、建模方法更科学、变量更丰富、运行效率更高效等特点,这使大数据风控在金融领域中的地位逐步提高。

3 案例分析

大数据风控在互联网金融领域的应用范围较广,本次研究着重选择互联网征信和互联网借贷中的大数据风控展开论述。本节将举例介绍芝麻信用(征信领域)和拍拍贷(网络借贷领域)的现状、存在的问题和解决方法。

3.1 互联网征信案例——芝麻信用

3.1.1 数据来源和数据类型

芝麻信用的主要数据来自阿里巴巴的互联网产品,数据类型分为基本信息、注册类型、兴趣爱好、支付和资金、人脉关系、黑名单和外部应用等。

3.1.2 芝麻分计算模型

信用评分有三个目标:准确性、普适性和可解释性。其中,准确性是信用评级体系的基本要求。由于黑箱模型缺乏可解释性,芝麻信用评分体系选择了透明模型和分群评分卡机制。分群评分卡可以在模型训练中将企业自身的理解与专业经验结合,使之更具有普适性。分群的准确合理是分群评分卡的关键,芝麻信用为了模型的适用,应用多种方法得出了最优的分群方案。

3.1.3 灵芝系统

灵芝系统是芝麻信用为小微企业定制的信用评分系统。它的数据源更为丰富,数据形式更加多样,信用评估的计算采用更大规模的机器学习算法。同时,它的信用评估和风险预测因人而异。灵芝系统通过信用评分和指数、风险监控预警、关注名单、风险云图和信用报告五方面测评得出不同的风险策略。

3.1.4 存在问题与解决方法

目前,互联网征信中依旧存在很多问题。其中,数据的质量问题和电商平台的刷单问题最为严重,这导致了征信公司的信息数据严重失真。除此之外,身份欺诈、冒用等问题更是给金融领域的风险控制体系带来了巨大的挑战。

针对这些问题,阿里巴巴在不断完善数据类型,提高数据质量。一方面,菜鸟裹裹、蚂蚁金服能通过一些常规数据来确认信息真实性。另一方面,面部识别、指纹识别等高科技手段也逐渐开始应用于互联网金融行业。除此之外,还有一些手段可以被展望。

第一,打破数据孤岛。大数据资源的透明化程度对征信系统有着重要作用。目前,我国互联网金融公司各自为营,将信息数据隐私化,各公司的风险控制系统仅仅局限于分析自己独有的数据,导致征信体系难以完善。因此,打破数据孤岛,各公司团结协作,让更多的信息数据共享于企业间,可以极大地完善征信系统。

第二,推动物联网+。在物联网的全面覆盖下,生产交易过程的数据都可以被获取,从而提高数据的真实性。因此,金融企业想要获取更全面的数据信息,积极布局“物联网+”是必不可少的。

3.2 互联网借贷案例——拍拍贷

2015年3月24日,由拍拍贷历时八年研发而成的基于大数据的风控模型“魔镜风控系统”问世。该系统拥有600万在线用户和近40亿条数据,被行业内认为是首个大数据风险控制系统。

3.2.1 魔镜系统的风控流程

魔镜风控系统采用2000多个数据维度,评判材料全面。该系统继往开来,新收纳了海量互联网行为数据。这些丰富多样的数据信息大大降低了风险。

在风险控制阶段,拍拍贷构建了反欺诈系统、魔镜评级系统和风险定价系统来综合全面地分析数据。其中,反欺诈系统决定是否放贷,魔镜评级系统决定放贷额度,风险定价系统决定放贷利率。最终,根据以上三个风险控制系统准确匹配出借贷人的借贷方案,有效避免违约风险。

3.2.2 存在的问题和解决方案

大量非活跃用户以占便宜为目的,投资新平台拿到奖励后便撤资离开,这就是“羊毛党”现象。他们的出现大大增加了新平台的负担,扰乱了平台的运营秩序。针对上述问题,提出如下解决方案。一方面,适当提高投资门槛,使“羊毛党”因害怕风险而拒绝投资,减少“羊毛党”数量;另一方面,完善实名认证制度,保证用户质量。

4 总结

大数据风险控制打破了传统的风控思维,通过多维度分析海量用户数据,得出更为高效、准确的风控体系。随着大数据技术的日臻成熟,大数据风险控制在互联网金融领域的应用越来越多,应用范围也越来越广泛。虽然大数据风控尚存在用户线上线下状态迥异、互联网社会行为数据真实性低等问题,但是业界也逐渐在利用技术手段,从经济学、金融学、社会学等多个角度改善风控体系,并取得了较好的成效。

[1]巴曙松,侯畅,唐时达.大数据风控的现状、问题及优化路径[J].金融理论与实践,2016,(02):23-26.

[2]俞枫,苑博,叶小同,冯必成,侯秦.大数据技术在金融行业风险控制中的应用探讨[J].新经济,2016,(36):52-53.

[3]叶文辉.大数据征信机构的运作模式及监管对策——以阿里巴巴芝麻信用为例[J].新金融,2015,(07):60-63.

[4]唐时达,李智华,李晓宏.供应链金融新趋势[J].中国金融,2015,(10):40-41.

[5]倪海鹭.P2P网络借贷平台征信需求与管理研究[J].征信,2014,32(05):46-49.

[6]梁伟利.P2P网络借贷平台风险管理研究[D].西南财经大学,2016.

[7]曹亚廷.P2P网贷与征信系统关系研究[J].征信,2014,32(11):15-18.

[8]董明,刘娜娜,王允保.构建大数据风控平台 严控互联网金融风险[J].金融电子化,2016,(11):28-30.

张李遥(2000—),男,重庆人,重庆市第八中学高三学生,研究方向:计算机科学与技术。

猜你喜欢

风控借贷信用
为食品安全加把“信用锁”
新监管框架下银行的风控和内审体系
信用收缩是否结束
让民间借贷驶入法治轨道
信用中国网
宁波P2P网贷发展问题研究
信用消费有多爽?
银行双录的现状和问题
论小微企业融资的风险控制
民间借贷对中小企业资本运作的影响