商业银行信用风险主要影响因素来自内部还是外部?
——基于KMV及随机森林模型的实证研究
2022-04-24郭立仑周升起
郭立仑,周升起
(青岛大学经济学院, 山东青岛 266071)
一、引言
2017 年全国金融工作会议指出,金融是国家重要的核心竞争力,金融安全是国家安全的重要组成部分。金融工作三大任务之一就是防范和化解重大金融风险,守住不发生系统性风险底线。商业银行在我国金融体系中扮演重要角色,一旦商业银行出现重大风险,必将对金融体系乃至经济平稳有序运转产生重大冲击。而信用风险往往是引发商业银行出现经营危机并最终破产的导火索,历史上,美国伊利诺斯大陆银行、美国华盛顿互惠银行、美国美联银行均因此倒闭(郭立仑,2020 年)。做好商业银行信用风险管理对于维护金融稳定、统筹经济社会发展和国家安全关系至关重要。
2016 年以来,受国际政治环境变化和国内产业结构深度调整等因素影响,我国商业银行外部环境发生较大变化,主要表现为宏观经济增长乏力,GDP 增速持续放缓;一些产能相对落后的传统产业出现经营困难,相关风险从中小型企业向大型企业蔓延、从民营企业向国有企业蔓延;货币政策趋紧,M2 增速逐年下降;金融监管日益加强,要求商业银行摒弃金融空转模式,回归服务实体经济业务本源。在此背景下,商业银行业快速发展势头受到一定削弱,信用风险管控压力持续加大,一方面,部分存量高风险业务隐患开始暴露,对商业银行资产质量形成拖累;另一方面,由于实体经济新的增长点仍然不多,一些新开展的业务风险可能性提升。从整体看,银行业不良率不断上升,信用风险暴露现象较为普遍,整体信用风险承压加大。从个案看,一些公司治理能力相对较弱、高风险资产相对集中、风险管控水平相对较低的商业银行信用风险开始显现,如2019 年包商银行被监管部门接管并最终破产、锦州银行被动引入战略投资者、部分中小商业银行未按时披露年度报告等事件发生,从一个侧面反映了商业银行信用风险状况恶化。
为深入分析商业银行信用风险暴露原因,推动商业银行采取有效措施防范和化解信用风险,学者们持续关注商业银行信用风险影响因素。有观点认为,外部环境的改变导致了我国商业银行信用风险的爆发(谭燕芝和张运东,2009;汤婷婷和方兆本,2011;霍源源等,2016;丁浩,2018)。从现实情况看,不论是实体经济结构调整,还是货币供给增速趋缓,抑或是金融市场出现波动,这些外部条件必须通过商业银行内部机制才能对信用风险状况产生影响。因此,也有观点认为,业务结构和经营管理是影响商业银行信用风险的因素(张金清等,2012;郭卫东,2013;王秀丽等,2014;张天顶和张宇,2017;侯毅恒等,2018;周春喜和毛悦,2018;高蓓等,2019;王蕾等,2019a)。商业银行信用风险影响因素有哪些?外部环境是否是导致商业银行信用风险暴露的主要原因?内部机制在商业银行信用风险暴露过程中扮演怎样的角色?本文运用KMV 模型对商业银行信用风险进行量化,运用随机森林模型综合分析内外部因素对商业银行信用风险暴露影响,并对相关影响因素重要程度进行排序。研究发现,外部环境是商业银行信用风险的影响因素之一,但从影响因子数量和重要性排序看,外部环境并不是主要因素,内部的业务结构、经营管理因素对商业银行信用风险影响程度更大。
文本可能的贡献在于:一是研究方法较为新颖。将在衡量信用风险领域相对成熟的KMV 模型与数据挖掘领域相对精确的随机森林模型相结合,以KMV 模型计算的违约距离代表的信用风险状况作为被解释变量,通过随机森林模型迭代研究讨论商业银行信用风险的主要影响因素。二是影响因素考虑较为全面。在初始设定商业银行信用风险影响因素时,尽可能涵盖相对较全、影响较大的变量,主要包括外部环境、业务结构、经营管理等内外部层面,确保影响因素结论相对全面、客观。三是对策建议具有较强的系统性和可操作性。本文以单个银行机构为视角研究商业银行是否存在较大信用风险隐患,提出相应对策建议。建议商业银行立足外部经营和内部管理全局,综合施策提升信用风险管理水平和质效,为新常态下商业银行打赢资产质量攻坚战提供有益思路。
二、文献综述
(一) 商业银行信用风险度量
信用风险度量的方法主要分为两种:一是传统度量模型,主要包括5C 模型、Z 值评分模型、ZETA 模型等,这类模型主观性较强,评估的准确率相对较低;二是现代度量模型,主要包括Credit Metrics 模型、CreditRisk+模型、Credit Portfolio View 模型、KMV 模型等,这类模型实现了从定性分析向定量分析、从指标化向模型化的转变,评估的准确率相对较高(Altman 和Saunders,1997;Crouhy 等,2000;Alam 等,2010;Schwaab 等,2014)。曹道胜和何明升(2006)从模型建立的理论基础、模型类别、回收率、现金流折现因子四个维度对四种现代信用风险度量模型进行比较, 指出KMV 模型对财务指标仅依赖债务账面价值, 从而在一定程度上破解了我国普遍存在的会计信息失真的难题。Huang 和 Sheng(2010)选取了2006 年下半年至2008 年期间的工商银行、中国银行、建设银行作为研究对象,计算并比较了违约距离和违约率,发现信用风险主要是由于受到不良贷款率、贷存比以及非利息收入比的影响。凌江怀和刘燕媚(2013)以10 家上市商业银行作为样本,根据KMV 模型得到了违约距离和违约率的实证结果,并与标准普尔的权威评级机构进行对比,发现由KMV 模型得到的结论与外部评级机构得到的结论基本一致。李晟和张宇航(2016)以2010 年至2015 年间我国16 家上市商业银行作为样本,运用KMV 模型计算出每家商业银行的违约距离,并通过面板数据对影响违约距离的主要因素进行回归分析,结果表明,国有银行相对于非国有银行信用风险较低,同时商业银行的不良贷款率、贷存比以及资产规模对于商业银行的信用风险有显著影响。
(二) 商业银行信用风险影响因素
2008 年全球金融危机以来,随着商业银行信用风险持续暴露,国内外学者对该问题的研究不断深入,发现信用风险影响因素涉及宏观经济、货币政策、金融市场、自身业务结构、内部经营管理等多个领域。
一些学者关注宏观经济、货币政策、金融市场等方面对商业银行信用风险的影响:Schnabel 和Shin(2004)、Bernhardsen 等(2005)、Sorge 和Virolainen(2006)、谭燕芝和张运东(2009)、Dovern 等(2010)、汤婷婷和方兆本(2011)、Dell 等(2012)、Buch 等(2014)、Love 和Ariss(2014)、霍源源等(2016)通过实证分析发现,国内生产总值、失业率、货币供应量、物价指数等宏观经济变量显著影响商业银行信用风险。Sorge 和Virolainen(2006)、Wong 等(2008)、丁浩(2018)基于城商行经营数据,发现产业结构及变化趋势是商业银行信用风险重要影响因素。黎灵芝等(2014)、李军林和朱沛华(2017)通过实证分析得出,同业竞争具有传导效应,从而加剧了商业银行信用风险。Furfine(2003)、Repullo(2004)、Wu 等(2011)、张家臻和刘亚(2018)研究表明,除宏微观因素外,银行关联度等中观因素对商业银行信用风险亦有影响。
有的学者关注商业银行自身业务结构对信用风险的影响:Dullmann 和Masschelein(2007)、巴曙松和陈剑(2010)、黄秀秀和曹前进(2014)、王秀丽等(2014)、任秋潇和王一鸣(2016)、周春喜和毛悦(2018)研究发现,贷款集中度会影响银行信贷效率,进而影响信用风险。Hayden 等(2007)、Berger 等(2010)、张晓玫和毛亚琪(2014)、黄国妍(2015)、侯毅恒等(2018)发现城商行收入过度依赖存贷利差,是导致风险相对集中的原因之一。高蓓等(2019)发现同业业务对商业银行经营稳定性的影响由正向促进作用转变为负向阻碍作用。
更多的学者关注商业银行内部经营管理对信用风险的影响:张金清等(2012)以14 家商业银行2001−2009 年经营数据为样本,发现提高资产规模可以提升商业银行信用水平。郭卫东(2013)、张天顶和张宇(2017)对系统性风险进行回归分析时发现,商业银行不良率、杠杆率、资产收益率、市净率等决定其自身风险。Kwan(2002)在分析经营绩效时发现,银行违约状况受内部运营效率和管理科学化程度影响较大。Chen 和Wei (2013)研究发现,内部部门多样化能够降低银行信用风险。王蕾等(2019b)认为,内部控制质量较高的银行能够有效识别风险状况、抵补风险损失,因而可以降低银行整体信用风险。Hughes 等(1999)、Boss(2002)、Boubakri 等(2005)、Micco 和Panizza(2006)、Iannotta 等(2007)、Berger 等(2009)、Laeven 和Levine(2009)、Baeey 等(2011)、Brei 和Schclarek(2015)研究发现,具有良好股权结构、公司治理的商业银行能更好地防控信用风险,而祝继高等(2012)发现第一大股东的控股能力越强、独立董事作用发挥越弱,商业银行信用风险越高。
综上可知,当前KMV 模型在衡量国内经济主体信用风险方面已经相对成熟,但在衡量商业银行信用风险方面应用仍不广泛,且多是用于研究商业银行信贷客户的信用风险,从商业银行整体层面审视信用风险的探索还不够。同时,现有文献在研究商业银行信用风险影响因素时,实证检验往往基于回归分析、方差分析、因子分析等传统统计分析方法,而对于一些数据挖掘更为充分、判别结果更加精准的随机森林模型等前沿机器学习技术应用较少,在一定程度上减弱了信用风险影响因素的分析效果。进一步地,当前学者在研究商业银行信用风险影响因素时,往往着重从外部环境、业务结构、经营管理中一个或两个领域进行分析,导致影响因素的覆盖范围不够全面,完整的商业银行信用风险影响因素体系尚未构建。基于以上分析,本文将KMV 模型与随机森林模型相结合,深入分析商业银行信用风险的影响因素,即以上市商业银行作为研究对象,以公开市场数据为基础,运用KMV 模型量化商业银行信用风险,并在此基础上,以商业银行是否存在较大信用风险隐患为解释变量,以外部环境、业务结构、经营管理领域涉及的30 个指标作为初始解释变量,运用随机森林模型进行实证分析和迭代计算,对商业银行信用风险的内外部影响因素进行提炼,对影响因素的重要程度进行排序,从而为指导商业银行有效防范和化解信用风险提供理论依据和解决方案。
三、商业银行信用风险度量
(一) 运用KMV 模型量化信用风险
KMV 模型以MM 理论和Black-Scholes 公式为理论基础,通过估计商业银行资产价值及其波动率,进而计算商业银行发生违约的概率,以违约概率来衡量商业银行信用风险高低。具体而言,需要三个步骤:
第一,求解商业银行资产价值、资产价值波动率。KMV 模型认为,债权债务关系可被看成期权交易,就本文研究对象而言,向商业银行发放贷款相当于向商业银行卖出了一份以贷款的债务总额为执行价格、以商业银行的资产价值为标的的期权。在此框架下,商业银行的市值E、市值波动率σE、账面负债价值D、资产价值VA、资产价值波动率σA的关系可以表达为:
E=VAN(d1)−De−rTN(d2) (1)
对(1)式两边求导,再取期望,则函数形式表达为:
联立函数(1)和(2),就可以得到一个联立方程组,该方程组中市值E、市值波动率σE、账面负债价值D、无风险利率r和时间T均可通过公开市场数据计算得出,其中,市值波动率σE可以通过历史法计算得到,市值日波动率的计算公式为:
其中,Rt表示样本第t天对数收益率,T表示当年的交易天数,从而年化股价波动率为:
综上,联立函数(1)和(2)组成的方程组仅有两个未知变量,即资产价值VA、资产价值波动率σA,可以求解,但由于不是线性方程,需要进行迭代计算。
第二, 求解商业银行违约触发点。当商业银行违约时,其资产价值大都位于短期负债与全部负债之间的某一水平上,该水平就是违约触发点(DPT)。根据KMV 公司的统计结果,违约触发点DPT最可能等于短期负债加上长期负债的一半,即:
第三,求解商业银行违约距离(DD)。违约距离(DD)代表要让商业银行的预期资产价值等于违约触发点水平,预期资产价值应下降百分比相当于多少倍的资产价值波动率,即:
需要指出的是,我国尚未建立有效的违约数据库,因此无法得到违约距离DD和预期违约概率EDF之间的映射关系。但因为预期违约概率EDF为违约距离DD的单映射函数,可以用违约距离DD间接度量信用风险高低,即违约距离DD越高,商业银行信用风险越低,反之亦反。
(二) 样本和参数确定
1. 样本和度量区间
本文选取36 家在A 股上市的商业银行作为研究样本,选取2016 年、2017 年、2018 年、2019 年4 个连续整年作为度量区间,并以2016 年12 月31 日、2017 年12 月31 日、2018 年12 月31 日、2019 年12 月31 日为度量基准日,若上述36 家商业银行在某个实证区间内未在A 股上市,则不作为当年分析样本。商业银行相关数据均取自年度财务报告。
2. 模型参数确定
根据KMV 模型计算步骤可知,在计算商业银行违约距离DD时,需要根据实际情况确定相关参数计算口径和方法。
其一,时间T。由于度量区间为1 年,因此T=1。
其二,无风险利率r。为准确反映金融市场资金供求状况,将1 年期国债收益率日均值作为1 年期无风险利率r。
其三,市值E、市值波动率σE。首先,对于在A 股和H 股同时上市的商业银行,在计算市值E时,先分别计算A 股和H 股的市值E,然后加总;在计算市值波动率σE时先分别计算A 股和H 股的市值波动率,然后根据A 股和H 股的市值占比对各自的市值波动率进行加权平均。其次,对于A 股中有非流通股的商业银行,在计算市值E时,以每股净资产作为非流通股股价,并与非流通股股数相乘,作为非流动股市值;在计算市值波动率σE时,假定非流通股与流通股具有相同的波动率。
其四,短期负债STD、长期负债LTD。与非金融企业不同,商业银行无法从资产负债表中区分流动负债与非流动负债,因此无法直接得到短期负债STD、长期负债LTD。本文结合财务报告附注中流动性风险管理到期日分析部分,将到期日为即期、1 个月以内、1−3 个月、3 个月−1 年的负债作为短期负债STD,将到期日为1 年以上的负债作为长期负债LTD。
(三) 商业银行信用风险度量
运用Matlab 软件,通过迭代计算,得到样本银行度量基准日的违约距离(见表1)。表1 可知,一方面,不同的商业银行违约距离差别较大,最大的为2019 年的交通银行,违约距离为17.946,说明当年信用风险相对较低;最小的为2017 年的张家港农商行,违约距离为1.858,说明当年信用风险相对较高。另一方面,同一家商业银行违约距离波动幅度差别较大,波动最大的为交通银行,违约距离均方差为3.537,说明信用风险状况较为多变;波动最小的为宁波银行,违约距离均方差为0.208,说明信用风险状况较为稳定。
表1 2016−2019 年部分上市商业银行违约距离
(四) 信用风险度量结果检验
本文将KMV 模型计算的违约距离反映的信用风险状况与2016 年以来我国商业银行经营管理实际相比较,以此来检验信用风险度量结果的准确性。
其一,将不同年份的违约距离进行对比,可以得到银行业信用风险在时间维度的变化趋势。根据KMV 模型计算结果,商业银行2017 年的违约距离与2016 年较为接近,略有上升,2018 年违约距离较2017 年有明显下降,2019 年违约距离整体大幅上升,说明信用风险呈先升后降态势。由于违约距离对信用风险有1 年左右预判,相关计算结果与商业银行经营管理实际较为吻合。受外部环境恶化、宏观经济下行压力加大等因素影响,2019 年银行业风险隐患开始显现,如包商银行出现大额信用风险暴露并被监管部门接管。为有效缓解新冠肺炎持续蔓延等外部因素冲击,2020 年货币政策更为宽松,流动性保持合理充裕,金融市场融资成本降低,商业银行短期偿还债务压力得到一定缓解。
其二,将不同类型银行的违约距离均值进行对比,可以得到银行业信用风险类型维度变化特点。根据KMV 模型计算结果,国有商业银行、股份制商业银行、城市商业银行、农村商业银行的违约距离均值分别为10.118、7.862、7.448、3.833,呈逐级下降趋势,说明信用风险逐级上升。相关计算结果与商业银行经营管理实际较为吻合:与国有银行、股份制银行等全国性商业银行相比,城市商业银行、农村商业银行等区域性商业银行业务布局相对集中、抵御冲击能力较弱,内部管理规范程度不高、风险防范和化解水平较低,近年来个别区域性商业银行风险事件频发、外部信用评级下调现象较为普遍。
其三,将个别银行个别年份违约距离较高情况进行提炼,可以开展个案分析。根据KMV 模型计算结果,与区域性商业银行相比,股份制商业银行违约距离较高、信用风险水平相对较好,但个别股份制银行个别年份违约距离却远低于同类型商业银行均值,分别是2019 年的浦发银行(3.491)、2017−2019 年的招商银行(4.050、3.995、5.543)、2016 年和2018 年的中信银行(5.402、5.967),说明存在一定信用风险隐患。鉴于相关风险暴露、监管部门处罚存在一定时滞,相关计算结果与商业银行经营管理实际较为吻合。根据银保监会和人民银行公告信息,2018 年、2020 年浦发银行因违规发放贷款、隐瞒贷款风险被监管部门分别处以4.62 亿元、2100 万元罚款;2021 年,招商银行因理财资金投入违规领域被监管部门处以7170 万元罚款;2018 年至2021 年,中信银行因违规发放贷款、贷款资金被挪用等连续4 年被监管部门处于高额罚款,金额分别为2280 万元、2224 万元、2020 万元、2890 万元。
通过上述分析可知,KMV 模型计算得到的违约距离,与我国商业银行信用风险实际较为吻合,相关指标能够有效衡量并区分商业银行信用风险高低。
四、商业银行信用风险影响因素实证分析
(一) 随机森林模型构建
随机森林模型是一种将随机抽样与决策树相结合的方法,通过多轮随机抽取样本量和特征值,构建一组决策树集合,应用少数服从多数的原理作出判断,确保决策误差有效降低。同时,随机森林模型也是一种机器学习方法,在现有模型基础上开展迭代计算,可以进一步提升模型预测准确性。可见,随机森林模型适合分析影响因素有哪些、哪些影响因素更重要等问题。进一步地,要通过随机森林模型研究我国商业银行信用风险影响因素,需要确定模型的被解释变量和解释变量。
1. 确定模型的被解释变量
本文的目的是找到商业银行信用风险主要影响因素,因此模型的被解释变量为商业银行是否存在较高的信用风险隐患,即0−1 变量。上文已经通过KMV 模型计算得到了商业银行不同年份违约距离大小,并作为判断信用风险高低的主要依据,这里需要选取一个标准,即违约距离数值大于或等于多少时,商业银行不存在较大的信用风险隐患。那么,这个标准如何选取呢?根据上文论述可知,受业务布局相对集中、内部管理规范程度不高等因素影响,个别城市商业银行、农村商业银行信用风险隐患相对较高,根据两类商业银行违约距离均值可知,该标准应该位于3.833 和7.448 之间。进一步地,结合上文提到的近年来出现信用风险暴露事件的个别股份制商业银行违约距离,可以初步将该标准设定为5,即假定违约距离DD小于5 时,商业银行发生信用风险的可能性增大,认为存在较大的信用风险隐患,此时被解释变量为1;违约距离DD大于或等于5 时,商业银行发生信用风险的可能性降低,认为不存在较大的信用风险隐患,此时被解释变量为0。
2. 选取模型的初始解释变量
首先,在现有文献基础上,选取外部环境、业务结构、经营管理3 个维度作为商业银行信用风险影响因素的一级变量。其中,外部环境通过宏观经济、货币政策、金融监管、金融市场等4 个二级变量描述(汤婷婷和方兆本,2011;霍源源等,2016),业务结构通过收入结构、资产负债结构、存贷款结构等3 个二级变量描述(王秀丽等,2014;侯毅恒等,2018;周春喜和毛悦,2018;高蓓等,2019),经营管理通过资金运作、业务增长、风险管理等3 个二级变量描述(Kwan,2002;张金清等,2012;郭卫东,2013;李晟和张宇航,2016;张天顶和张宇,2017)。
其次,将外部环境二级变量进行进一步细化。用GDP 增速和社会融资余额增速分别反映经济增长情况、实体经济融入资金意愿,以描述整个宏观经济运行状况;用M2 增速、存款准备率描述货币政策变化和对商业银行影响,为体现个性化影响,这里的存款准备率采用各商业银行实际数值;用监管部门主要关注的指标,即信贷减值损失占比、拨备覆盖率、资本充足率和杠杆率分别反映在监管约束下,各商业银行风险贷款出清情况、信用风险抵补能力、信用损失承担能力、表内外资产扩张情况;用10 年期国债利率、人民币兑美元汇率、上证综指增幅分别反映债市、汇市、股市价格变动趋势,以描述整个金融市场运行状况。
再次,将业务结构二级变量进一步细化。用中间业务收入占比、非息收入占比反映商业银行非传统业务收入占比,以描述收入结构;用资产负债率和存贷比分别反映商业银行资产负债和存贷款整体结构;用前10 大客户贷款比例、同业负债占比、活期和储蓄存款占比分别反映商业银行贷款集中度、高流动性负债占比、低成本负债占比,以描述存款和贷款具体结构;
然后,将经营管理二级变量进行进一步细化。用净利润增幅、资产回报率、净利差、成本收入比分别反映商业银行利润增长情况、收入与资产增长关系、资金收益与成本关系、营运收益与成本关系,以描述资金运作效率;用资产、负债、贷款、存款增幅反映商业银行业务增长情况;用不良率、逾期贷款占比、关注类贷款占比反映商业银行各类风险隐患资产占比,以描述风险管理状况。
最后,根据上述过程,最终得到随机森林模型在外部环境、业务结构、经营管理3 个维度下30 个初始解释变量(见表2)。
表2 随机森林模型的解释变量
(二) 样本和参数确定
其一,训练集和测试集。根据经验,随机森林模型的训练集和样本集合比例一般为7∶3,本文将2016 年、2017 年、2018 年的77 条样本数据纳入训练集,将2019 年的36 条样本数据纳入测试集。
其二,随机抽样的次数ntree。随着随机选取轮数的增加,随机森林模型决策的出错概率即袋外误分率会收敛。本文假设初始随机抽样的次数很多,例如ntree=10000。
其三,随机抽样的特征值个数mtry。当mtry增加时,会提升每棵决策树的准确度,从而提升随机森林模型的准确度,但同时任意两颗决策树之间的相关度会提升,反过来会降低随机森林模型的准确度,因此随机抽样的特征值个数mtry的选取需要综合权衡,一般地,mtry 运用R 软件,根据上述训练集样本和参数构建初始随机森林模型。通过误差率走势图可以看出,当ntree=2000 时,模型误差率最低且稳定(见图1)。 图1 误分率走势图 此时,对每次选取的随机变量个数mtry分别代入[1,10]进行遍历试错计算可知,当mtry=6 时,误差率最小(10.39%),即此时模型最为精确(见表3)。 表3 初始最优参数组合袋外误分率 进一步地,利用varImpPlot 函数,可以呈现当前随机森林模型中解释变量的重要程度和排序(见图2)。 图2 初始指标重要性分布图 根据解释变量重要程度和排序,在数据库中去掉对模型影响最小的X09,对剩下的29 个解释变量再次采用随机森林模型,即根据袋外误分率确定ntree和mtry参数,生成新的随机森林模型。在新模型基础上,继续去掉对模型影响最小的解释变量,一直重复上述过程,实现模型迭代。可以发现,当解释变量递减至10 个、决策树个数为5000、每次选取变量为4 时,模型的误差率降到最低(见表4)。 表 4最终最优参数组合袋外误分率 因此,最终随机森林模型涵盖10 个解释变量,根据准确率平均递减指标,这10 个解释变量按重要性排序依次为:X10、X11、X23、X14、X21、X16、X22、X17、X29、X06(见图3),即中间业务收入占比、非息收入占比、成本收入比、前10 大客户贷款比例、资产回报率、活期存款占比、净利差、储蓄存款占比、逾期贷款占比、资本充足率。 图3 最终指标重要性分布图 最后,运用Predict 函数将上述最终确立的随机森林模型再应用于测试集,检验预测准确性。实证结果表明,基于KMV 和随机森林模型构建的信用风险影响因素体系预测准确率为88.89%,其中对于信用风险较低的商业银行预测准确率为93.33%,对信用风险较高的商业银行预测准确率为66.67%(见表5)。 表5 随机森林模型预测误分率 根据上述分析,可以得到以下结论: 其一,商业银行信用风险的影响因素主要包括中间业务收入占比、非息收入占比、成本收入比、前10 大客户贷款比例、资产回报率、活期存款占比、净利差、储蓄存款占比、逾期贷款占比、资本充足率等10 个变量,且重要程度依次降低,共同构成样本商业银行信用风险的主要影响因素。 其二,上述10 个变量分别涵盖了外部环境、业务结构、经营管理3 个维度,具体而言,中间业务收入占比、非息收入占比、前10 大客户贷款比例、活期存款占比、储蓄存款占比属于业务结构维度,成本收入比、资产回报率、净利差、逾期贷款占比属于经营管理维度,资本充足率属于外部环境维度,因此商业银行信用风险暴露是3 个维度因素共同作用的最终结果。 其三,外部环境虽然是影响商业银行信用风险的因素之一,但并不是主要因素,在10 个变量中,业务结构维度涉及变量最多(5 个)且排序靠前,可以认为是影响商业银行信用风险的第一因素;经营管理维度涉及变量较多(4 个)且排序较为靠前,可以认为是影响商业银行信用风险的第二因素,而外部环境维度仅涉及1 个变量且排序末位,可以认为是影响商业银行信用风险的第三因素。 本文根据商业银行风险暴露实际,假设违约距离DD小于5 的商业银行存在较大的信用风险隐患。为进一步检验模型的稳健性,现将该假设进行适当调整,即认为违约距离DD小于4 或者小于6 的商业银行存在较大信用风险隐患,将上述假设涉及的参数设为i,将i=4、i=6 并分别代入随机森林模型,重复上述影响因素模型构建和迭代过程,结果发现,当随机森林模型误分率降至较低水平时,模型的最终解释变量均含有中间业务收入占比、非息收入占比、成本收入比、前10 大客户贷款比例、活期存款占比、资产回报率、储蓄存款占比、净利差、资本充足率等指标,但重要性排序略有调整,说明上述指标确实是影响商业银行信用风险的主要因素(见表6),之前建立的随机森林模型稳健性较好。 表6 不同参数下商业银行信用风险主要影响因素 1. 异型性分析 在随机森林模型构建过程中,本文主要选取了4 个类型的商业银行,即国有商业银行、股份制商业银行、城市商业银行、农村商业银行。从经营范围看,前两者属于全国性商业银行,业务领域较为广泛;后两者属于区域性商业银行,业务领域相对较窄。对于区域性商业银行,还可以进一步细分为主要在北方经营和主要在南方经营2 个细类。由上文论述可知,整体而言,商业银行信用风险水平都会受到表6 中10 个具体指标的影响,那么对于不同类型的商业银行,相关影响指标的重要程度是否会发生细微变化? 首先,以全国性商业银行和区域性商业银行为样本,分别构建随机森林模型,通过迭代计算可知,对于全国性商业银行信用风险而言,排名前5 的影响因素分别是活期存款占比、资本充足率、资本回报率、储蓄存款占比、中间业务收入占比;对于区域性商业银行信用风险,排名前5 的影响因素分别是非息收入占比、储蓄存款占比、中间业务收入占比、成本收入比、净利差。从影响因素大类看,与区域性商业银行相比,全国性商业银行排名前5 的影响因素中涵盖外部环境,说明对于宏观经济和政策变动更加敏感,这与其经营布局相对广泛的特点相一致。 其次,以北方经营为主的区域性商业银行和以南方经营为主的区域性商业银行为样本,分别构建随机森林模型,通过迭代计算可知,对于北方经营为主的区域性商业银行信用风险而言,排名前5 的影响因素分别是成本收入比、非息收入占比、中间业务收入占比、逾期贷款占比、前10 大客户贷款比例;对于南方经营为主的区域性商业银行信用风险而言,排名前5 的影响因素分别是非息收入占比、储蓄存款占比、中间业务收入占比、成本收入比、净利差。从影响因素大类看,经营管理类因素对于北方经营为主的商业银行更加重要,这与北方产能相对单一,银行业务结构调整空间较小有关;而业务结构类因素对于南方经营为主的商业银行更加重要,这与南方经济相对活跃,银行可以通过业务结构调整规避风险有关。 2. 边际影响分析 为了深入阐释上述10 个影响因素如何作用于商业银行信用风险,本文通过绘制各类主要影响因素对信用风险的部分依赖图,进一步分析单个影响因素变化时被解释变量的变化趋势。 其一,中间业务收入占比、非息收入占比涉及非传统业务收入占比情况,该类收入较少依赖资产类业务,因而相关指标越高,资产类业务投向高风险领域就越低,从而产生信用风险的可能性越低。由部分依赖图可知,当中间业务收入占比大于30%或者非息收入占比大于45%时,商业银行存在较大信用风险可能性降低(见图4)。 图4 中间业务收入占比、非息收入占比部分依赖图 其二,成本收入比、资产回报率、净利差涉及资金运作水平,其中,成本收入比越低则成本管控能力越强,资产类业务投向高风险领域的必要性就越低,产生信用风险的可能性越低,由部分依赖图可知,当成本收入比低于20%时,商业银行存在较大信用风险可能性降低。资产回报率越高,或者净利差越高,等额资产盈利能力越强,资产投向高风险领域必要性越小,产生信用风险的可能性越低,由部分依赖图可知,当资产回报率高于1.2%或者净利差高于2.5%时,商业银行存在较大信用风险可能性降低(见图5)。 图5 成本收入比、资产回报率、净利差部分依赖图 其三,前10 大客户贷款比例、活期存款占比、储蓄存款占比涉及存贷款内部结构,其中,前10 大客户贷款比例反映了贷款集中度,贷款集中度越低,发生信用风险的可能性就越低,由部分依赖图可知,当前10 大客户贷款比例低于15%时,商业银行存在较大信用风险可能性降低;相关存款占比反映了吸纳低成本负债能力,活期存款和储蓄存款占比越高,资产类业务投向高风险领域的必要性就越低,从而产生信用风险的可能性越低。由部分依赖图可知,当活期存款占比大于60%或者储蓄存款占比大于30%时,商业银行存在较大信用风险可能性降低(见图6)。 图6 前10 大客户贷款比例、活期存款占比、储蓄存款占比部分依赖图 其四,逾期贷款占比涉及风险管理能力,逾期贷款占比越高,说明商业银行对于潜在风险防范和化解能力越弱,资产质量面临进一步下迁压力,产生信用风险的可能性越高。由部分依赖图可知,当逾期贷款低于0.5%时,商业银行存在较大信用风险可能性降低(见图7)。 图7 逾期贷款占比部分依赖图 其五,资本充足率涉及监管部门对商业银行资本充足率要求,资本充足率越高,说明商业银行对监管要求遵守越严格,资产质量出现下迁时,吸纳损失的能力越强,因而信用风险暴露的可能性越低。由部分依赖图可知,当资本充足率大于16%时,商业银行存在较大信用风险可能性降低(见图8)。 图8 资本充足率部分依赖图 近年来,我国商业银行信用风险开始显现。从整体趋势看,2018 年末商业银行违约距离普遍下降且降幅明显,整体信用风险有所积聚;从银行性质看,国有商业银行、股份制商业银行、城市商业银行、农村商业银行的违约距离呈现逐级下降态势,信用风险逐级上升;从具体案例看,个别股份制商业银行违约距离明显高于同类银行机构,相关银行信用风险积聚、遭到监管部门巨额处罚。 本文研究发现,外部环境是影响商业银行信用风险的因素之一,但并不是主要因素,业务结构、经营管理等因素对商业银行信用风险影响更大。从外部环境看,资本充足水平等金融监管因素,对商业银行信用风险产生影响,商业银行遵守监管要求、有效提升资产充足水平能够有效抵御未来信用风险冲击。从内部的业务结构和经营管理水平看,中间业务收入占比、非息收入占比等收入结构因素,大客户贷款占比、活期存款占比、储蓄存款占比等存贷款结构因素,成本管理水平、资产回报水平和资金盈利能力等经营效率因素,以及逾期贷款管理等风险管理因素都会对商业银行信用风险产生较大影响,那些业务结构较为合理、经营管理质效较高的商业银行爆发信用风险的可能性较低。 (1) 持续优化业务结构。商业银行必须逐步调整高度依赖资产负债业务的传统经营模式,提升在支付与结算、交易与汇兑、投资与融资、咨询与顾问等领域专业化水平,为客户提供更加多元化的金融产品和服务;必须逐步降低客户集中度,防止因外部环境变化导致个别大型客户资产质量出现问题,对商业银行整体造成重大冲击;必须降低资金来源成本,提升低成本资金吸纳和粘附能力。 (2) 有效提升经营管理水平。商业银行必须进一步提升成本精细化管理水平,优化成本资源配置;必须不断优化展业模式和经营方式,确保有充足的资金实力抵御可能发生的信用风险隐患;必须提升风险预判能力,及时捕捉未来可能发生的信用风险隐患,对于已经出现逾期等风险预警信号的贷款,要早预警、早识别、早化解。 (3) 积极应对外部环境变化。商业银行必须根据监管部门要求,持续提升资本充足水平,一方面,强化内源性融资,通过利润增长有效补充资本;另一方面,拓宽外源性融资渠道,通过发行永续债、资本债等方式合理提升资本充足水平,确保商业银行在遭遇不可预见风险冲击时能够及时、充分吸纳风险损失。(三) 风险影响因素实证分析
(四) 稳健性检验
(五) 异质性分析与边际影响分析
五、结论与建议
(一) 研究结论
(二) 对策建议