神经网络在金融信用风险评估中应用综述
2021-01-15□文/雍华
□文/雍 华
(东北财经大学管理科学与工程学院 辽宁·大连)
[提要] 神经网络模型一直是信用风险评估方法中的研究热点,本文归纳总结我国学者针对神经网络在信用风险评估中应用的研究文献,为今后信用风险评估方法的研究提供借鉴。
一、引言
金融信用风险是指交易对方没有意愿或没有能力履行既定合同条件造成违约,致使债权人遭受经济损失的可能性。信用风险的评级是金融信贷领域风险管理的基础,尤其是在利率市场化的大背景下,对信用风险的精准评估是金融机构盈利的关键。最早的信用风险评级依赖评级人员的经验和能力对信用状况作出判断。后来以财务数据为基础,以判别分析模型为代表的统计方法逐渐开始流行。进入20世纪90年代以来,各种新技术不断涌现,大多是针对统计方法的不足提出的。在众多新方法中,神经网络方法作为一种具有自组织、自适应、自学习特点的非参数方法,对样本数据的分布要求不严格,不仅具有非线性映射能力和泛化能力,而且还有较强的“鲁棒性”和较高的预测精度,这些优异的特性,使神经网络在信用风险评级领域取得了长足的发展。本文从文献分析的角度,归纳总结了神经网络在我国信用风险评估中应用的发展情况。
二、神经网络在信用评估中的应用类型
(一)验证型。为了验证神经网络在信用风险评估中应用的可行性及较传统方法的优越性,学者主要从以下两个方面展开研究:一是直接验证型,指通过实证研究,检验神经网络针对信用风险评估中的适用性。杨保安(2001)将神经网络用于贷款企业的财务风险评估,显示出神经网络是进行财务评估的一种比较好的方法,能为银行贷款授信、预警提供有效决策。二是通过将神经网络同传统信用评估方法进行对比,验证神经网络的优越性。王春峰(1999)将神经网络与判别分析法进行了对比,认为前者具有更高的预测精度和更强的鲁棒性。杨淑娥(2005)采用BP神经网络和主成分分析方法分别对上市公司财务危机预警进行建模,实证研究得到了神经网络的预测精度较主成分分析方法高的结论。胡海青(2012)建立支持向量机和BP神经网络分别对企业信用风险进行评估,结果表明在小样本下基于支持向量机的信用风险评估模型更具有有效性和优越性。周驷华(2015)构建了多层感知器神经网络进行信用风险评估,并将其与决策向量机、线性判别和逻辑回归等方法进行了比较,认为多层感知器神经网络更胜一筹。可以看出,在信用风险评估领域,神经网络较传统的判别分析、回归分析更有优势,但在小样本的情况下,神经网络略逊于支持向量机,主要是因为神经网络往往需要大量的训练数据来提高模型的准确性。
(二)改进优化型。在信用风险评估领域,应用较多的是经典的BP神经网络,但BP网络存在容易陷入局部最优、效率低下等问题,部分学者提出采用其他类型的神经网络,试图弥补这些不足。RBF网络是一种性能良好的前馈网络,具有全局逼近性质。方先明(2005)建立了基于RBF神经网络的信用风险预测模型,从理论上探寻了信用风险非线性智能控制的可行性。龙天炜等(2017)将RBF神经网络同Logistic回归进行对比,实证研究表明,在进行信用风险评估时,前者的预测结果准确性要优于后者,但后者的解释能力绝对占优。
近年来,深度学习在处理维度高、数据量大、结构多样的数据问题时展现出良好的性能,同时也避免了严重过拟合及梯度爆炸等缺陷,在各领域得到广泛应用。有研究者也尝试了深度学习在信用风险评估中的应用可能性。王重仁(2017)提出了一种基于卷积神经网络的客户违约风险预测模型,结果表明,卷积神经网络模型的客户违约风险预测性能要优于其他传统机器学习模型,同时卷积神经网络模型能够从数据中自动学习特征比人工设计特征节约了大量时间。熊志斌(2019)将深度信念网络(DBN)方法引入信用评估的实践中,构建了基于DBN方法的信用评估模型。
由于传统的神经网络存在解释性差、摒弃相关专业知识经验等问题,研究人员又将模糊理论引入到神经网络中,借助于模糊规则推理,增加神经网络的直观性、灵活性和全面性。吴冲(2004)最早提出将模糊理论和神经网络结合到一起进行信用风险评估,取得了较为满意的效果,能够在一定程度上解决神经网络完全黑箱的问题,可以由风险评估人员根据经验针对不同情况进行调节,说明模糊神经网络非常适合应用于信用风险的评估中。
为了提高分类的准确性及收敛速度,常采用启发式算法对分类器进行优化,如遗传算法、群体智能等技术。王宪全(2006)利用改进的遗传算法对BP神经网络进行优化,对上市公司信用风险进行计量,取得了较BP神经网络更好的效果。群体智能算法是受生物进化规律的启迪,模拟自然界中的昆虫、鸟群、兽群等群体行为,通过群体智慧进行协同搜索,从而在解空间寻找到最优解。吴斌(2017)提出了基于混合果蝇神经网络的个人信用风险评估模型。胡贤德(2017)提出一种基于改进离散型萤火虫(IDGSO)算法的BP神经网络集成学习算法的小微企业信用风险评估模型。
(三)组合型。组合信用评估方法是将2~3个基学习器通过运用组合加权均衡的运算规则进行组合,以提高单一模型性能,增强方法的适用性。
有学者认为将决策树和神经网络进行组合,用以增强神经网络的可解释性,同时改善模型的稳定性和精准度。赵静娴(2009)采用RBF神经网络对贷款企业财务指标进行裁减,选择出对数据分类最有效的一些属性建立决策树,对企业的信用风险进行评估。结果表明,模型能够显著提高预测精度,说明神经网络模型具有较好的特征抽取能力。杨胜刚(2013)则采用决策树方法筛选个人信用指标,再将筛选出的重要指标输入BP神经网络模型进行信用风险评估。
Logistic回归是二分类任务中最常用的机器学习算法之一,其优缺点刚好和神经网络模型互补,把他们组合起来成为必然的趋势。石庆焱(2005)构建了一种BP神经网络和Logistic回归的组合模型,以神经网络的输出结果和其他特征变量一起作为Logistic的输入变量,使用因子分析法解决多重共线性问题。结果表明,该组合模型预测精度比Logistic回归模型高、稳健性比神经网络模型强,且具有可解释性。仝凌云(2019)用Logistic回归识别出显著影响P2P网贷平台信用风险的因子,根据这些因子构建BP神经网络,为出借人选择平台提供了借鉴。
KMV模型是一种用来估计借款企业违约概率的方法。张婧婧(2009)将神经网络与KMV模型的优缺点进行了分析,提出了一种先用神经网络进行粗分类,再用KMV进行修正的思想。针对非上市公司无法确定市场价值的问题,曾玲玲(2017)提出了一种策略:采用BP神经网络学习上市公司的市场价值和公司财务指标之间的映射关系,收集非上市公司财务指标,然后采用学习好的映射关系估测非上市公司的市场价值,再运用KMV模型计算非上市公司的违约距离和违约率。
(四)集成型。集成学习由于可以集成多个基学习器且具有更高的适用性特征,得到越来越多的关注。在集成学习中,基学习器之间必须要有一定的差异,才能获得良好的分类效果,学者主要通过学习算法和学习数据两个方面来获得这种差异。
算法方面的差异,可以通过采用不同学习算法生成不同的基学习器来体现,本质上属于异质集成。根据集成方法的不同可以分为以下几类:第一类是基于平均法的集成分类器,该类方法通常用于回归,有算术平均法和加权平均法。姜明辉(2007)等人用RBF神经网络与Logistic回归进行预测,然后将得出的结果进行加权平均,对个人信用风险做出评估,结果表明,该集成模型在总体预测精度和第二类误判率上具有优势。第二类是基于投票法的多数票机制的集成分类器。向晖(2011)等把这种思想应用于个人信用评估,将多元判别分析、神经网络、支持向量机等七种模型的预测结果采用加权投票的方法确定最终的预测结果。第三类是基于Stacking法的分层模型集成框架。曹再辉等(2019)基于Stacking集成算法框架,构建了两层集成学习器用以评估个人信用。第四类是基于其他融合理论的集成分类器。郭英见(2009)结合BP神经网络、SVM分类的优势,同时利用DS证据理论易于处理不确定性问题的优点,建立了一个新的信息融合评估模型。王重仁(2019)提出了一种基于长短期记忆神经网络和卷积神经网络的融合深度神经网络个人信用风险评分方法。第五类是基于群决策思想的集成分类器。姜雪莹(2019)提出了基于群决策思想将神经网络、随机森林、梯度提升树集成的P2P借贷信用风险评估模型。
训练数据方面的差异,主要通过采用不同的抽样方法从训练数据中抽取不同的训练样本集来体现,通常都是基于相同的学习算法生成基学习器,属于同质集成。根据抽样规则的不同主要有Bagging方法和Boosting方法。基于Bagging方法的集成技术,也是基于多数投票确定最终的结果,但这种思想采用等概率、有放回的抽样规则来得到若干训练样本集,然后用这些不同的训练样本集训练出一系列基分类器,代表性的算法为随机森林。陈云(2014)使用PSO-BP神经网络作为成员分类器,然后使用Bagging策略进行建模,对国内外企业信用风险做出评估。基于Boosting思想的集成技术,类似于Bagging策略,但每次采样会对之前预测错误的样本增加抽样权重,代表性的算法是梯度提升树(GBDT)。李佳佳(2018)提出了一种基于BP-Adaboost模型对企业的信用风险进行评估。
三、简要评述
神经网络技术思想在信用评估领域的研究经历了多次突破性的优化改进。传统的神经网络虽然具有很多优异的特性,但已经很难满足现实社会对于信用评估的需求,针对传统神经网络的改进优化取得了较好的效果,但随着技术的进步,组合化、集成化思想的出现为提高信用评估的精准性和稳定性带来了新的可能。