Fisher判别法在个人信用风险评估中的应用
2020-08-13唐煜崔海浪
唐煜 崔海浪
[摘 要]随着消费观念的逐渐改变,我国居民信用卡持卡率逐年攀升,但信用卡逾期问题却成为困扰大多数银行的一大问题。本文以客户过去两年是否为违约客户(Y)为因变量,以个人短期消费负债在总负债中的比率(X1)、年龄(X2)、30-59天逾期还款(X3)等8个指标为自变量构建判别函数,试图为个人信用风险评估指标体系的构建提供新的思路。
[关键词]Fisher判别法;个人信用风险;风险评;判别函数
随着消费观念的逐渐改变,我国居民的信用卡持卡率逐年攀升。根據中国人民银行所发布的《金融机构本外币信贷收支表》,2019年9月我国个人短期消费信贷规模已经达到95303.17亿元,信用卡的发卡量9.7亿张,达到了平均每人0.7张的水平,信用卡业务已然成为银行业的一大支柱型业务。但是,央行发布的数据表明,信用卡逾期半年未偿信贷总额高达880.98亿元,占个人短期信贷总额的0.93%,环比增长16.43%。由此可见,个人信用风险问题所产生的影响已经越来越大,应该引起我国商业银行业的重视。
1 国内外文献综述
信用风险评估是指商业银行运用评估技术对可能引起贷款风险的因素进行定性分析和定量计算,目的在于测度借款人的违约概率,从而为贷款决策提供依据[1]。学界对于商业银行信用风险评估问题的探索最早开始于二十世纪三十年代,但直到二十世纪六十年代后,信用风险评估问题才开始广泛引起学者关注。以Jung和Allen为代表的早期学者的研究主要基于经验总结。其中,以“5C”要素分析法、LAPP原则、财务比率分析法等方法为代表的早期研究成果,其研究逻辑都是基于挖掘逾期贷款人的共同特征来预测相似特征的贷款者逾期概率来开展的[2]。但因为当时的逾期特征的发掘都是基于研究者经验来开展的,所以后来的学者往往以主观性较强以及外部性较弱的问题对前人成果进行诟病[3]。八十年代后,随着统计学量化研究方法的逐渐成熟,为了克服特征挖掘的主观性和局限性,学者开始广泛采用统计分析方法进行定量研究,其中所涵盖的模型大都可以归为以下两类:信用评分模型和现代信用风险度量模型[4]。信用评分模型是建立于基于财务指标的信用评分模型,主要有线性比率模型、logit 模型、probity模型、判别分析模型等。现代信用风险度量模型是以违约概率、预期损失率为核心指标的度量模型,如Metrics模型、KMV 模型、Credit Risk+,Portfolio View 模型等。而后,学者们结合银行的海量数据,开始将大数据技术(如神经网络)引入个人信用风险评估的研究,如神经网络、支持向量机(SVM)等。为了进一步完善改领域的研究,本研究将提出一套新的测量体系,并采用Fisher判别分析法建立判别函数,为我国商业银行的个人信用风险问题的提供新的指标体系。
从指标层面来看,个人信用风险问题研究的量化指标体系仍然存在不小的分歧。Altman和Kao(1985)利用现金流/总负债、保留盈余/总资产、总负债/总资产、现金流/销售收入等财务指标建立了分类树,并以此对个人信用风险进行研究[1]。Lundy(1993)用k近邻判别法通过对申请者年龄、职业、婚姻状况、居住条件等回归分析对消费贷款申请者的信用评估[1]。王春峰、万海辉(1999)采用流动性、盈利性等二十余个财务数据进行SAS逐步回归后降维形成六个比率并以此建立组合预测模型对商业银行信用风险进行量化评估[5]。 FICO采用五维度评分指标:信用偿还历史、信用账户数,使用信用年限、正在使用的信用类型以及新开立的信用账户数对个人信用进行总分为300到850分的评分,根据信用得分确定客户的信用等级:AAA、AA、A、BBB、BB、B、C,以及放款数和放款时间[6]。张贵清(2005)选择来自某商业银行的《信贷管理系统》中的建模指标分别为销售毛利润率、总资产报酬率、资产负债率、利息保障倍数、流动比率等,通过多元判别分析法构建判别函数[7]。张雪丽(2011)基于Fisher判别分析认为个人信贷风险评价指标体系的构建需要遵循全面性、重要性、科学性、公正性、操作性原则并由此选出基本情况、偿债能力、稳定性以及与本行关系4类指标来建立判别函数并系统测量个人信用风险[8]。以上指标构建的出发点大致可以归为以下几类:财务指标类、人口统计类以及历史数据类。本文将延续利用历史数据变量构建指标体系的逻辑,并结合商业银行具体数据运用判别分析方法建立模型,为个人信用风险指标体系的构建提供新的思路、变量与架构。
2 样本及数据情况
本文数据来自某跨国商业银行,通过随机从银行数据库中截取过去两年客户信用卡信贷数据共300笔。共选取9个变量:客户过去两年是否为违约客户(Y)、个人短期消费负债在总负债中的比率(X1)、年龄(X2)、30-59天逾期还款(X3)、60-89天逾期还款(X4)、90天以上逾期还款(X5)、信用卡开卡数(X6)、除自己外的家庭成员数(X7)、贷款在家庭总资产中所占比率(X8)。
3 SPSS输出结果
3.1 分析个案处理摘要
通过“选择个案”的设置,我们按照训练样本与验证样本2:1的原则,选择出了接近66%的个案数197个成为训练样本,参与判别函数的构建。剩余34.3%的个案,共103个,成为验证样本,用于检验判别函数的准确性。
3.2 变量多重共线性检验
在对数决定因子表格中,逾期组与未逾期组的秩与变量数均为8,且对数行列式不为零。以上两点均说明变量间不存在多重共线性
3.3 模型系数
如上图所示,总的来讲,正确地对93.5%个选定的原始已分组个案进行分类,正确地对90.0%个未选定的原始已分组个案进行分类。但是,值得注意的是,判别函数的对逾期的预测准确率较低,而逾期准确率却是银行最为关心的数据。因此模型仍然存在改进之处。
4 结论
本研究通过截取某跨国商业银行的近两年的数据,并依据负债比率(X1)、年龄(X2)以及30-59天逾期还款次数(X3)等8个变量试图建立新的个人信用风险测量体系。通过Fisher判别分析的建模与验证,本文所建立的判别函数预测准确率达到90%以上。其中,负债比率(X1)、年龄(X2)以及30-59天逾期还款次数(X3)在判别函数中占据着相对重要的地位,因此应当引起银行贷款部门的重视。但本研究的不足之处在于,因数据获取受限导致数据样本较小,判别函数的准确性仍需要进一步的验证。
【参考文献】
[1] 柯孔林,周春喜.商业银行信用风险评估方法研究述评[J].商业经济与管理,2005(6).
[2] 陈传刚,高凌云.基于判别分析法的个人抵押贷款违约风险实证研究[J].山东行政学院学报,2014(8).
[3] 吕晓芳.基于因子分析的我国中小企业贷款信用风险评价研究[J].中国管理信息化,2013(11).
[4] 胡胜.距离判别方法在我国上市公司信用风险评估中的应用研究[J].开发研究,2011(3).
[5] 王春峰,万海晖,张维.组合预测在商业银行信用风险评估中的应用[J].管理工程学报,1999(1).
[6] 余炫朴,李志强,段梅.个人信用评分体系比较研究及其当代价值[J].江西师范大学学报(哲学社会科学版),2019(7).
[7] 张贵清,刘树林.我国商业银行信用风险评级实证分析[J].河北经贸大学学报,2005(7).
[8] 张雪丽,朱天星,于立新.基于判别分析的商业银行个人信用风险评价模型研究[J].工业技术经济,2011(10).