大数据背景下个人征信评分业务发展探讨
2022-06-28郅曼琳
秦 苑,郅曼琳
一、问题提出与文献梳理
个人信用评分业务是最早开发的金融风险管理工具之一。根据美国的《公平信用报告法》中对信用评分(credit score)的定义,“信用评分,又称风险预测或风险评分,是一种统计工具或者模型体系,旨在帮助放贷人员预测信贷行为未来违约的可能性”。①D.J.Hand and W.E.Henley,“Statistical classification methods in consumer credit scoring:a review”, Journal of the Royal Statistical Society.Series A(Statistics in Society),vol.160,no.3,1997,p.523.随着大数据时代的到来,数据挖掘和统计建模技术越来越先进,能用于评估个人信用的信息越来越多,大数据背景下的新兴信用评分模型走入了人们的视野当中。
从实践应用看,传统信用评分模型使用以逻辑回归和线性回归为基础的机器学习算法,新兴信用评分模型使用以树类模型(tree-based models)、神经网络(neural networks)为基础的机器学习算法。两者区别在如下几个方面:一是数据来源与数据特质不同。相较传统信用评分模型,新兴信用评分模型数据维度高(如多变量)、数据来源广、数据价值密度低(如包括非信贷关联数据)、数据质量差。二是变量的选择方法不同。传统信用评分模型一般只有几十个变量,而新兴信用评分模型变量可达到成千上万个。三是建模方法不同。传统信用评分模型多采用以逻辑回归和线性回归为基础的统计方法和较为简单的数据发掘算法,主要研究线性的因果关系,而新兴信用评分模型更多通过识别多样化的数据特征,着重关注数据的非线性相关性。
在目前的信用评分领域中,由于传统应用的先发优势,传统的风险评分模型及其评分依赖的两大支柱——逻辑回归和线性规划,还是占有绝对的优势,但由Fair Isaac 公司推出的FICO 评分系统方法一统天下的地位已不复存在,其在美国受到了越来越多数据挖掘公司的挑战,如SAS、Oracle、Equifax、Experian、TransUnion。人工智能分支机器学习的发展使一些新兴人工智能和机器学习公司,以及像Capital one 这类创新能力比较强的银行开始抛弃FICO 这种传统风险评分模型,再加上计算机运算能力的提升,人工智能技术如机器学习在金融界的使用也开始普遍起来。
2004 年我国个人征信数据库开始试运行。18 年过去了,我国的个人征信体系经过不断创新和发展日趋完善。近年来,随着国内信贷市场的发展,信用评分业务也逐步应用起来。而大数据时代的到来,国内金融科技和互联网金融的兴起,给信用评分业务带来了不少机遇和挑战。随着社会信息化水平的提高,市场化的征信机构数量不断增加,个人征信环境也随之改变。当下,吸取国外征信评分业务的先进经验并结合我国国情,推动我国个人征信评分业务的发展,对维护我国金融稳定和经济健康发展具有重要意义。从已有的研究成果来看,黄大玉最早在我国引入信用评分,他提出我国应该建立适合本国国情的信用评分方法,信用评分的指标体系包含个人收入、资产、借贷历史。①黄大玉、王玉东:《论建立中国的个人信用制度》,《城市金融论坛》2000 年第3 期。戴志敏、姜宇霏指出客户的信贷行为不是一成不变的,信贷次数和金额在不断变化中,银行应当根据客户的信贷行为来调整信贷额度,建立动态评价机制。②戴志敏、姜宇霏:《关于我国银行个人信用评估模型的设计》,《企业经济》2003 年第4 期。传统银行业往往依据自身的业务信息来源将客户的个人基本信息、信贷记录、经济来源和工作信息等作为个人征信评分的指标。大数据时代,多维度、多角度的数据挖掘将大量的碎片信息整合起来,如芝麻信用将用户的个人消费记录、生活信息、资金往来等信息构建评分系统对用户进行分析。叶文辉指出阿里旗下的芝麻信用以用户在淘宝、支付宝等APP 的金融数据、消费记录、生活缴费数据、社交数据等为基础为用户进行信用评分,评估用户的信用水平。③叶文辉:《大数据征信机构的运作模式及监管对策:以阿里巴巴芝麻信用为例》,《新金融》2015 年第7 期。在此背景下,本文基于大数据背景,探讨建立一套个人信用评分系统的可行性,并着眼于评估个人信用现状和未来发展潜力,选择最优的数据建模方法,确保模型的有效性和稳定性,为构建具有特殊意义的个人信用评价体系提出建议。
二、国内外个人征信评分业务发展现状
(一)美英个人征信评分业务发展现状
1956 年,BillFair、EarlIsaac 共同创立了Fair Isaac 公司,并于1989 年共同发明了FICO 评分方法,FI⁃CO 评分目前仍是美国普及率最高的一款评分标准。FICO 评分是一个统称,包含上百种评分。不同的FICO 评分有不同的模型、数据和应用领域。FICO 评分的模型由Fair Isaac 提供,客户信息则来源于Equi⁃fax、Experian 以及TransUnion 三大征信调查机构所采集的个人信息。FICO 通过五维评分指标的加权评分来衡量客户的信用等级,这五个维度及权重分别是信用偿还历史(35%)、信用账户数(30%)、使用信用的年限(15%)、正在使用的信用类型(10%)和新开立的信用账户(10%)。总而言之,FICO 评分体系是将客户的历史信息输入自主研发的评分模型,再根据模型输出的分数得出客户未来信用状况的期望值。此外,Equifax、Experian 以及TransUnion 还联合开发了Vantage 评分,但由于FICO 评分已经处于相对垄断地位,Vantage 评分普及率并不高。Vantage 评分的评分维度包括六个方面,分别是支付历史、信用账户类型和开户时长、信用额度使用比例、负债情况、近期信贷行为、可用信贷余额。可见,FICO 和Vantage 的评分依据主要是个人的借贷信息。但从美国的情况来看,全美依然有3500 万人由于缺乏信贷历史记录无法被传统征信体系所覆盖。
为帮助美国无征信记录的人群获得评分服务,Fair Isaac 公司与Equifax、Lexis-Nexis Risk Solutions 合作,引入了电信、水、电、煤气付款等信息,推出FICOXD 评分。Vantage 评分也融入了电信、公用事业、车辆、驾驶员违约等非信贷信息,以提高自身的覆盖面,拓展市场。放贷机构Zest Finance 在信贷信息的基础上还引入了非结构化数据作为补充,可以为无FICO 评分的客户和FICO 评分低于550 分的客户提供评分,克服了传统信用评分系统过分依赖信贷信息的不足。
英国商业银行在个人无抵押贷款的催收应用中使用了信用评分模型,并取得了良好的效果。个人无抵押不良贷款因数量大、单笔金额小且没有抵押品需处理,一般采用集中催收的方式,按成本收益情况决定是否由银行内部完成催收,或需委派专业的外部机构协助催收。信用评分模型在催收流程中主要运用于客户因欠款被移交至催收中心时,对客户违约风险的大小进行评估,如按高、中、低风险分类,以便匹配对应的催收流程。银行内部对于不同违约风险的客户,会采用不同的催收策略、工具及启动时点的组合。例如,是致电还是直接会面,是在进入催收中心第3 天后就致电还是在第7 天后致电。当信用评分模型按客户违约概率将客户按风险高低分层后,催收中心便能快速地在客户进入催收中心第一时间大批量、快速有效地匹配最合适的催收流程。催收流程的维护,需要依靠大批能使用SAS 编程语言的分析员,通过监控日常催收业绩数据或按监管机构新要求对其不断调整优化。因为每家银行的违约客群特征不同,所以每家银行的催收工具虽然大同小异,但催收流程会根据客户反应做出不同的安排。通过维护催收流程,亦可进一步通过验证信用评分模型对违约客户风险高低的判断是否有效来维护模型,形成一个良性互动的循环。
(二)国内个人征信评分业务的发展现状
自2006 年3 月中国人民银行征信中心设立以来,企业和个人征信系统(即金融信用信息基础数据库)日益完善,目前已经建设成为世界范围内最大的信用信息基础数据库。截至2015 年4 月底,征信系统已经收录了8.6 亿多自然人。其依据的信息主要是银行信贷信息,还包括公共事业单位所提供的社保、公积金、环保、欠税、民事裁决与执行等公共信息。接入机构既包括商业银行、农村信用社等传统商业银行,还包括信托公司、财务公司、汽车金融公司、小额贷款公司等各类放贷机构。
除中国人民银行征信中心外,国内还有数十家企业开展个人评分业务。其中包括传统商业银行的个人消费贷款信用评定和个人信用卡信用评分,蚂蚁金服的芝麻信用、腾讯的财付通、平安集团的前海征信等互联网集团设立的独立法人机构,百融云创、同盾科技等具有金融科技背景的独立第三方机构。
中国人民银行征信中心推出的信用报告“数字解读”是中国人民银行征信中心与美国Fair Isaac 公司合作开发的,用来量化个人信用报告信息,可以帮助信贷机构预测个人客户的信贷行为在未来发生违约的可能性。“数字解读”将个人信用报告中的信贷信息分为五大类,分别是还款情况、负债水平、信用历史、近期信贷申请、产品种类,通过综合考察这五大类信息最终得到“数字解读”值。可见,信用报告“数字解读”考察的主要是信用历史数据和财务状况数据。其他传统银行业金融机构在审批信贷业务时也主要参考未结清贷款余额、贷款和信用卡还款记录、收入偿债比等信用历史信息和财务信息,有时也会通过人工考察借款人的道德诚信、生活背景等,但没有相应的量化指标。综上,央行和传统银行业金融机构在信贷审批时往往过分依赖自身渠道积累下来的信贷历史与财务数据。这些数据虽然与个人信用状况高度相关,但在一定程度上也将那些缺乏信贷历史的个人排除在外。
我国的金融科技公司和互联网金融公司属于创新型业态,风险隐患较多,故受到严格的监管,难以获得全面的银行业信贷数据。许多互联网金融企业不得不挖掘其他数据源,以开发出新的大数据信用评分模型。以芝麻信用为例,其包含五类评分指标:基本信息类、消费偏好类、支付和资金类、人脉关系类和黑名单信息类。这五类评分指标下面还包含非常多的小指标,指标数量多达几千甚至几万个,信息也更加多元化。很多年轻客户虽然在传统银行业缺乏信用历史,但是互联网消费行为却十分普遍,大数据信用评分模型的出现使这部分数据得以利用起来。但这些信息也有明显的缺陷——与个人信用状况的相关性较低,而且可能存在刷单等模型套利现象,不适合大额的信贷审批。
三、国内个人征信评分业务存在的问题分析
(一)信用评分在国内传统个人信贷领域应用不够深入细致
相较于国外发达的信用评分市场,我国的信用评分业务还停留在贷前审批阶段,对于贷中的行为评分和贷后的催收评分都鲜有涉及,对信用评分缺乏深入的应用。就信用评分方法而言,对信用风险的预测以及通过模型揭示的洞察力或可解释性至关重要。①Noel Capon,“Credit scoring systems:a critical analysis”, Journal of Marketing,vol.46,no.2,1982,p.83.英国商业银行除了为新客户或正常还款客户构建信用评分模型,还单独为违约客户建立独立的信用评分模型,以捕捉违约客户的特征,从而更好地对不同风险程度的客户针对性使用更有效的催收策略及工具。而我国商业银行在此方面还未曾涉及,信用评分模型的应用不够细致、精准。
(二)公共征信机构的覆盖能力受限
欧美经过几十年的发展,已经建立了一套相对完善的征信体系,对于个人信贷数据的储存、使用及销毁,其已有一套完备的政策及程序,所以欧美银行在构建信用评分模型时,能够取得客户于市场上所有银行的信贷往来记录,增加模型对客户全面性的特征描述,使信用评分模型的预测更为准确。而目前我国在个人征信领域,只有中国人民银行征信中心能够获得比较全面规范的数据,其他的征信公司由于在信息安全、技术能力、运营成本和数据规范等方面受限,规模和覆盖能力都有限,深度和广度难以兼顾。
(三)个人信息安全问题突出
《个人信息保护法》的出台,标志着我国个人信息保护立法体系进入新的阶段。但在现实生活中,个人信用信息的安全问题仍十分突出,表现为数据服务与个人征信边界不清,一些机构随意收集、违法获取、非法买卖个人信息,数据采集范围涉及敏感信息以及个人评分透明度不高,评分准确性得不到保障等。新兴信用评分机构认为自己采集的信息不是借贷信息,只是个人的身份、支付、消费等信息,在《征信业管理条例》涵盖的信用信息范围之外,其提供的评分也仅用于客户分层与筛选,不作为偿债能力的判断,不应纳入征信监管。此外,部分机构不公布自己的评分规则和维度,这对社会公众来说相当于一个“黑箱子”,而且其获取的信息准确度与关联度低,例如从公司住址推测收入水平,通过车险支出推测车辆财产价值,用户的信息在用户知情权没有得到保障的前提下就被采集和应用。
四、个人信用评分模型的比较及其适应条件
因零售信贷业务具有笔数多、单笔金额小、数据丰富的特点,银行通过信用评分模型,运用数理统计模型,对借户信用历史和业务活动记录进行深度数据的挖掘、分析和提炼,将反映借户风险特征和预期信贷表现规律量化,以评分方式作为科学的管理决策建议,来实现人工智能化、标准化、高效率的管理模式。当前银行广泛使用的是以逻辑回归为基础的传统信用评分模型,但由于银行对精细化管理的要求越来越高,同时计算机对大数据挖掘处理的能力越来越强,因此以随机森林为基础的新兴信用评分模型也越来越受银行业欢迎。
(一)传统个人信用评分模型——逻辑回归模型
在传统信用评级模型中,银行运用最广泛的是逻辑回归模型,其运用逻辑回归(Logistic Regression)建立信用评分卡,来预测个人客户的违约/信贷风险。逻辑回归是监督式的机器学习模型中用于分类的模型,属于广义线性回归模型的特例,因其简单、高效、可解释性强,长时间受到银行业界广泛使用。逻辑回归分析的核心任务是估计事件的对数概率,在实际操作中,银行使用逻辑回归多元线性回归函数定义划分客户,y 是目标/预测变量,p 是违约概率,x 为解释变量。逻辑回归是解决二分类问题的监督机器学习算法,用来估计违约的概率,其直接预测值是表示0—1 区间概率的数据,基于概率再划定阈值进行分类,而求解概率的过程就是回归的过程。
通过逻辑回归模型构建的信用评分卡量化了客户的违约风险/信贷风险,主要有以下8 个步骤:
1.样本数据选择:将最初样本拆分为开发和验证数据,开发数据将100%用于信用评分卡的开发,跨时间样本将用于验证。
2.定义目标/预测变量:因目标/预测变量只有两种类型,即“好”与“坏”,银行需清晰定义什么是好客户,什么是坏客户。
3.排除非标准个例:需剔除特殊情况,只保留按日常一般机制进行信贷风险管控的客户。
4.引入要素:解释变量的选择要求在银行内部及外部征信机构的数据中选取代表要素,包括用分项的方式将较少数量分类合并,并通过证据权重选取对于目标/预测变量来说预测能力强的解释变量。
5.细分分析:识别整体样本是否具有相似特征的子集需开发不同的评分卡。
6.逻辑回归模型开发:首先,用单因素分析,逐一检测单一要素的辨别力,只保留辨别力强的要素。其次,用多元因子分析,测试不同要素的组合,只保留辨别力强的要素组合。最后,通过指向双奇数将违约概率转换为评分,完成模型开发。
7.模型验证:将用于开发和验证的数据样本输入完成开发的模型,以验证预测的准确性及有无过拟合的状况。
8.书面记录:清晰记录模型构建过程及结果,以备查。
逻辑回归有很多优点,例如简单、计算量小、速度很快、存储量低、易于理解,但在处理大量多类特征或变量或非线性特征时,也存在欠拟合、准确度不够高的缺点。
(二)新兴个人信用评分模型——随机森林模型
新兴信用评分模型中,银行运用最广泛的是树类模型,也就是“随机森林”(Random Forest)。①杨力、汪克亮、王建民:《信用评分主要模型方法比较研究》,《经济管理》2008 年第6 期。随机森林是由大量的决策树构成的,不同决策树之间没有关联。当输入新的样本时,森林中的每一棵决策树会独立进行判断和分类,并得到独立的分类结果,决策树的分类结果中最多的分类就是随机森林的分类结果。随机森林是一种非线性监督式的机器学习模型,弥补了传统信用评分模型欠拟合、不能处理非线性特征的缺点,增强了预测的准确性。
决策树是随机森林模型的构成基础,它是一种树形结构,通过层层推理来实现最终的分类,包括3 种元素:根节点,样本的全集;内部节点,特征属性测试;叶节点,决策的结果。决策树是一种基于if-thenelse 规则的有监督的学习算法,它的这些规则是通过训练获得,而不是人工制定的。决策树是最简单的机器学习算法,它易于实现,可解释性强,符合人类的直观思维,应用广泛。
大量的决策树构成了随机森林,其构建步骤如下:
1.随机抽样,训练决策树。一个样本容量为N,有放回地抽取N 次,每次抽取1 个,形成N 个样本,这些样本可以作为决策树根节点处的样本,用来训练决策树。
2.随机选取节点分裂属性。每个样本有M 个属性,当决策树的每个节点需要分裂时,随机从这M 个属性中选取m 个属性,要满足m < 3.不断重复步骤2,直至节点属性重复。当下一次该节点选出的属性与其父节点分裂时用过的属性相同时,该节点无须继续分裂,所有节点一直分裂到无法再分裂为止。整个决策树在形成过程中没有剪枝。 4.由步骤1 至3 建立起的大量决策树构成了随机森林。经过决策森林的集体判断,可取得平均违约概率,从而可对好坏客户进行分类及评分。 相较其他机器学习模型,随机森林有不少优点。它处理特征很多的数据,无需做特征选择,不容易过分拟合,训练速度快,执行比较简单,如果有很大一部分的特征遗失,仍可以维持一定的准确度。但缺点是在某些噪音较大的分类或回归问题上会过分拟合,对于取值划分较多的属性会极大影响属性权值的准确性。相较传统信用评级模型,随机森林的算法需要强大的数据挖掘和计算系统,但因其可以处理非线性特征,预测结果更为准确,所以更符合精细化管理的要求。 传统信用评分与大数据信用评分有各自的优势与局限性,将两者结合起来可以取长补短,从而最大限度地服务于信贷决策。在大数据时代,传统的信用评分模型难以满足各类群体的风控要求,而金融科技公司难以获得传统银行业的信贷历史信息。因此,只有打破信贷数据、模型技术之间的壁垒,加强大数据信用评分模型在传统信贷领域的应用,才能更准确、更全面地提供信用评分服务。 加强信用评分业务中贷中的行为评分和贷后的催收评分,构建完善的信用评分体系。我国商业银行还应构建个人信用评分模型与不良贷款催收策略及工具的有效衔接,从整体上挖掘和分析数据优化催收流程,从而达到精细化、数据化管理。 我国《征信业管理条例》第二条指出,“个人征信业务是对个人的信用信息进行采集、整理、保存、加工,并向信息使用者提供的活动”。此处提到的个人信用信息并不局限于个人信贷信息,那么某些机构采集个人非借贷信息并将其应用到经济交易活动中,从实质上说已经涉及对个人信用状况的判断,因此应当受到中国人民银行的监管。 只有提高个人信用评分的透明度,才能让信息主体了解到自己哪些信息被采用,这些信息的采用有没有经过个人的同意,信息的使用是否侵犯了个人隐私,这些信息内容是否完整、准确。阳光之下才能有效打破信用评分的“黑箱子”,信息主体的合法权利才能得到保护。但需明确的是,维护信息主体权利并不是要求机构公开模型的每一个细节,机构开发模型所涉及的商业机密也应当得到保护。 信息孤岛、数据覆盖率低和真实性不足一直是制约个人征信行业发展的大问题。区块链技术凭借分布式、不易篡改、去信任化等特点可以应用于个人征信。利用区块链等新技术,高效地对海量繁杂的诚信数据来源、采集、加工、应用等全流程进行见证、真实性验证比对、价值链上权益分配,从而实现数据可追溯可审计并在保护数据安全和隐私的前提下进行数据协同和数据计算结果的契约式共享,这些可为个人征信评分提供技术和诚信的支撑。特别是区块链可以让用户参与到记账系统,构建价值互联网,有效地消除信息不对称,解决信息孤岛问题,提高信用评分体系的效率和安全性,最大限度地实现资源的优化配置。五、大数据背景下我国个人征信评分业务的建议
(一)加强大数据信用评分模型在传统信贷领域的应用
(二)构建完善的个人信用评分体系,加强业务衔接
(三)将互联网金融机构提供的个人评分纳入征信监管
(四)提高个人信用评分模型和使用数据的透明度
(五)运用区块链技术改造个人信用评分模型