大数据视域下的中小微企业信贷风险评估[1]
2022-06-24燕晓磊李侠刘忠文田震
燕晓磊,李侠,刘忠文,田震
大数据视域下的中小微企业信贷风险评估[1]
燕晓磊,李侠,刘忠文,田震
(蚌埠工商学院 经济与金融学院,安徽 蚌埠 233010)
基于商业银行的视角对中小微企业的信用风险评级问题进行研究.采用数据挖掘方法构建了中小微企业信用评分的指标体系,运用熵权法改进的TOPSIS评价模型对123家中小微企业进行信用评价.为了扩大模型的适用范围,运用BP神经网络算法构建了评分优化模型,并对302家无信贷记录的企业进行信用评分,通过系统聚类方法将结果可视化展示.研究表明,企业的自身实力和盈利能力对企业信用的评价具有显著影响.TOPSIS模型的评分结果同商业银行给出的人工评定结果基本吻合,BP神经网络模型的最小均方误差为0.008 3,总拟合优度为0.82,能够较好地拟合样本数据,研究结果可以为银行制定中小微企业信贷决策提供参考.
中小微企业;信用评级;TOPSIS;BP神经网络
自进入21世纪以来,政府大力支持自主创新,中小微企业如雨后春笋般涌现出来,在国民经济运行中扮演着越来越重要的角色.2018年末,我国共有1 807万家中小微企业,占全部规模企业法人单位的99.8%,对GDP的贡献度占到60%,提供了23 300.4万个就业岗位,占全部企业比重的79.4%[1].可以说社会的发展离不开中小微企业,同时中小微企业的发展亦需要资金的支持.中小微企业的融资渠道众多,其中银行贷款是其最主要的融资渠道之一.但是在实际中,由于中小微企业的规模相对较小,也缺少抵押资产,银行更偏向于对信用评级较高的企业提供贷款.通常,银行会根据企业的规模、盈利水平、偿债能力、信誉情况等指标来衡量其信用水平,并以此为依据制定包含贷款金额、贷款利率、贷款期限的信贷方案.如何利用企业有限的交易数据正确地衡量企业的信用水平对于银行确定合理的信贷方案而言举足轻重,同时对优质中小微企业获得资金支持也具有重要的实际意义.
我国的信用评级研究自21世纪初开始萌芽,经历20多年的蓬勃发展形成了较为完善的研究体系.随着中小微企业在我国经济主体中占据的比重不断提升,中小微企业信用评级的研究也逐渐增多.同时,伴随我国信用评级业务不断拓展,及银行同大企业间“银企博弈”的加剧,中小微企业逐渐成为各大银行关注的目标客户.因此,针对中小微企业的信用评级研究成为信用评级领域的热点.
从收集到的研究文献可以看出,针对中小微企业的信用评级研究主要集中于信用评级能否解决银行与企业间信息不对称问题和企业信用评级的研究方法2个方面.
对于信用评级能否解决银行与企业间信息不对称问题,目前,学术界认为中小微企业信贷风险高,资产质量差,银行的放贷成本高,导致其对中小微企业的贷款积极性较低,其背后深层次的原因在于银行与企业间信息不对称影响了银行授信[2].由于信息不对称以及中小微企业不稳定的还款能力的影响,银行在授信时通常会设置贷款限额或实施信贷配给[3].因此,中小微企业信用评级研究的本质上是为了缓解银行与企业间信息不对称对中小微企业信贷市场的抑制效应.
随着统计分析方法、大数据与人工智能技术的迅速发展,企业信用评级经历了从主观的定性分析到客观的数据分析的发展过程.综合来看,企业信用评级的研究大致分为3个阶段,分别为经验主义分析阶段、统计分析阶段和大数据分析阶段[4-5].
经验主义分析阶段即依靠主观经验判断和企业以往的违约记录情况对企业的信用状况进行判断,主要包括著名的5C评估法、专家调查法和杜邦财务分析法等.此类方法多从主观评价角度对定性信息采用主观打分进行量化,需要评级人员具有较强的职业素养和判断能力,极易受到个人主观因素的干扰.
统计分析阶段即统计分析方法应用于企业信用评级的阶段.Altman[6]首次通过多元回归分析方法构建以制造业财务比率为基础的Z-score模型(Z值计分模型).1977年,Altman[7]等对Z值计分模型进行改进,提出了ZETATM模型,该模型从资产报酬率、收入稳定性、债务偿还能力、积累盈利、流动比率、资产规模、资本化率7个指标对贷款对象的偿还能力进行辨认.这2类著名的统计信用评分模型开创了统计分析方法应用于信用评级领域的先河,国内学者也在此基础上展开相关研究.邹昆仑[8]等基于Altman的Z值计分模型,利用Fisher判别法从财务视角构建了信用评级的判别函数,发现目前的信用评级有效性存在欠缺,对违约债券的甄别能力较弱;高盼[9]构建了DEA-TOPSIS模型,运用DEA方法筛选出相对有效企业,优化决策环境,接着通过TOPSIS方法对筛选后的有效企业进行排序,研究表明该方法有效缓解了TOPSIS方法逆序问题的影响,提高了信用评价模型的准确度.
虽然统计分析方法克服了主观经验判别的偶然性和不稳定性,但是由于统计分析方法对数据分布及模型假设的要求较为严格,应用的范围受到限制.随着数据量的爆炸式增长,该方法的弊端逐渐显露出来.
近年来,经济迅速发展,银行业务快速增长,客户信息数据爆炸式扩增,数据资源愈加繁复多样,机器学习、深度学习等人工智能分析方法因其在海量数据处理上的优势逐渐被学者引做信用评价方法.陈雄华[10]等运用BP神经网络算法对制造类和非制造类企业信用状况进行判别,研究发现模型能够较好地拟合样本特征,具有广泛的应用前景;董申[11]等以70家发电企业为样本,通过对比logistic回归、决策树、支持向量机、BP神经网络4种机器学习算法的评级展望准确率,并将评级机构的评级结果纳入对比范畴,最终选择BP神经网络构建信用评级展望模型;车辉[12]等运用主成分分析法筛选出寿险企业信用评价指标,应用遗传算法优化的BP神经网络模型对10家规模相异的寿险公司的信用等级进行评价,并将结果同专家评级结果相比对,发现该模型的评分偏离度较小,误判率较低,对于寿险企业信用体系建设具有一定的应用意义.
归根结底,中小微企业信用评级研究的目的主要是为了解决银行与企业间信息不对称导致银行业信贷业务发展受限及中小微企业融资困难的问题.随着客户信息数据的爆炸式增长,传统的定性分析方法早已无法满足信贷市场的需要,统计分析方法和大数据分析方法的应用极大地促进了对客户风险识别及信用评级的研究.
本文通过结合统计评价方法与神经网络算法对中小微企业进行信用评级,验证了熵权TOPSIS方法在信用评级领域的适用性,并通过BP神经网络算法对模型进行改进,进一步提高了模型的适用范围,为银行制定中小微企业信贷策略提供实质参考.
1 中小微企业信用评价指标体系的构建
1.1 数据来源
如今信息技术在银行业的应用已经十分成熟,我国各大商业银行已经构建了相对完备的银行数据系统,并广泛应用于银行经营管理的各个方面.本文数据来源于安徽省C农商行信贷客户2016—2020年的票据数据汇总,包括123家有信贷记录以及302家无信贷记录的中小微企业的相关数据.信誉评级为银行内部根据企业的实际情况人工评定,银行对信誉评级为D级的企业原则上不予放贷.
图1 企业信誉评级与守约记录关系
表1 企业信用评级量化
1.2 数据预处理及相关指标确定
1.2.1数据预处理根据企业信誉评级与守约记录(见图1),可以看出商业银行的信用风险评级同中小微企业是否违约存在一定的相关关系.信誉评级为A级的企业没有违约记录;信用评级为B,C级的企业中有违约记录的企业较少;而信用评级为D级的企业基本上都存在违约记录.因此,可以认为企业的信用风险等级从A至D依次增加.
为了便于对定性评级标准进行量化,对评级进行赋分.根据《企业信用评价评级标准》,4档企业信用评级百分制分数范围见表1,取评级得分的平均数乘以0.01的结果对信用等级进行量化,以便于同后续归一化的结果进行拟合比对.
1.2.2中小微企业信用评价指标选取企业信用评价指标体系繁复多样,不同学者基于各自的研究视角有着不同的选择.Gulsoy[13]等根据某银行中小企业信用评价流程,确定了12项评估标准,其中客观标准部分包括企业资金的流动性、盈利能力、活动结构等指标;李岳鑫[14]等在运用AHP法和DEA模型对中小微企业的信用水平进行评分时,主要从财务状况、信用状况、企业发展、创新能力4个维度出发,构建科创型中小微企业信用评价指标体系,其中财务状况主要包括企业的偿付能力、盈利能力和运营能力,信用状况主要包括贷款偿还能力、贷款交付能力和纳税能力;平萍[15]利用德尔菲法同C农商行现行的评价指标相结合,建立了多层次的中小微企业信用风险评价指标,其中包括反映企业硬信息的财务指标:偿债能力、盈利能力、营运能力和成长能力.目前,大量信用评级相关的文献普遍采用原本应用于大型上市企业信用评级模型的评价指标,并且指标体系的构建主要涵盖企业的静态财务指标,不能有效地反映企业的实际交易活动对企业信用评分的影响.本文的评价指标体系借鉴上述学者的研究方法并基于企业的实际交易数据挖掘确定,能够更全面地反映中小微企业的综合信息.
在尽量避免指标间相互解释的前提下,从企业自身实力、企业盈利能力、企业信誉、企业供应关系稳定性这4个角度构建C农商行中小微企业信用评价指标体系(见图2).企业自身实力主要包括企业销
图2 企业信用评价指标体系
年利润率和年利润增长率的计算公式分别为
违约记录是定性变量,可以通过设置0,1两个变量值来反映,即
进项额变异系数的计算公式为
2 中小微企业信用评分模型的建立
2.1 指标归类验证
由于所选取的三级指标数量大于5,同时为了验证指标选取的合理性,采用主成分分析法,运用SPSS26软件对指标进行归类验证.
表2 主成分及方差贡献率
主成分分析中,旋转成分载荷矩阵中各个指标变量在各主成分上的载荷是变量与各主成分的相关系数,某一变量在某公共因子上的载荷绝对值越大,则表示该变量同此主成分关系越密切.
运用方差最大法对成分矩阵进行正交旋转,得到旋转成分载荷矩阵(见表3).
表3 旋转成分载荷矩阵
由主成分分析可以认为文中确定的指标体系具有一定的合理性,因此,可以通过运用构建的指标体系进行中小微企业信用评分.
2.2 中小微企业信用评分模型的建立
样本中共计123个评价对象,9个评价指标.其中8个指标均为效益性指标,仅有进项额变异系数为成本型指标,本文首先对指标进行正向化处理.
成本型指标即极小型指标的正向化公式为
正向化后,所有指标数据构成的矩阵为
利用熵权法求解指标权重,令
通过使用MATLAB软件求解得到各个指标的权重,结果见表4.
表4 信用评价指标权重
由表4可以看出,企业自身实力所占的权重最大,为0.784 7.企业供应关系稳定性紧随其后,说明企业自身实力和企业供应关系稳定性对于中小微企业信用评分的影响较大.
记标准化矩阵为
通过使用MATLAB软件求解得到各企业信用的相对接近度(归一化评分),因篇幅限制仅展示前10家和后10家企业的评分结果(见表5).
表5 企业信用评分
将模型评分结果同C农商银行内部对123个企业的信用评级的量化数据进行对比(见图3).
图3 企业信用评分与银行评分曲线
由图3可以看出,模型评分结果同银行所给出的评级结果基本吻合,因此可以认为构建的TOPSIS模型所得出的量化评分适用于中小微企业的信贷风险评价.指标的选取依赖于原始交易数据的挖掘处理,能够客观反映企业的真实情况,从而克服原有中小微企业信用风险评价指标体系的主观性和过于偏向财务分析方面的不全面的缺点.同时,通过主成分分析模型验证了指标体系的合理性.在指标权重的求解上选取熵权法克服了主观赋权的偶然性,使评分模型能够客观地对中小微企业的信用水平做出量化评分,结果更具可靠性.
2.3 中小微企业信用评分优化模型的构建
由于302家无信贷记录的企业不包含违约记录数据,因此尝试在指标体系剔除违约记录这一指标,构建了新的无信贷记录企业的信用评分指标体系,并运用附有熵权的TOPSIS模型再次对123家有信贷记录的企业进行信用评分,得出的结果与银行给出的信用评级的量化结果的偏差程度变大,模型精度下降.因此,本文通过使用BP神经网络算法对模型进行优化,提高模型的预测精度,从而得出更为准确的302家无信贷记录企业的信用评分结果.
通过MATLAB 2018软件实现本文构建的信用评分优化模型.将123家有信贷记录企业的指标数据及评分数据的前75%作为训练集,后25%作为测试集导入BP神经网络模型.运行结果见图5.模型迭代到第7代时取得最小均方误差,为0.008 3,总拟合优度为0.82,说明模型收敛速度快,预测精度较高,能够高度拟合样本数据.
图5 神经网络模型输出结果
利用BP神经网络的评分结果,通过系统聚类方法划分302家无信贷记录企业的信誉评级,并将聚类结果(不包含信誉评级为D的企业)通过Python 3.8软件进行可视化展示(见图6).由图6可以看出,B,C等级的企业数量最多,这与中小微企业的规模和信贷市场的占有率较为契合.
图6 302家无信贷记录企业信用评级分布
3 结论与建议
本文综合考量了多层次变量对企业信用评价的影响,通过数据挖掘得到企业信用评价的指标,结合主成分分析方法验证了所构建的指标体系的合理性.使用熵权法确定评价指标体系的权重,结果显示企业的自身实力和盈利能力对企业信用的评价具有显著影响,银行在对企业放贷进行决策时应当重点考察这2个指标.紧接着运用TOPSIS方法对中小微企业的信用进行评分,其评分结果与银行内部评级结果基本吻合.在对302家无信贷记录企业的信誉评级中,采用BP神经网络算法对企业的信用评分进行预测,结果显示预测精度较高,拟合程度较好,可视化结果清晰明了,对于商业银行制定中小微企业的贷款策略具有实质意义.
通过分析可知,银行在制定中小微企业贷款策略上要综合考虑企业自身的实力和信用水平,同时要细化中小微企业信用评分体系,联合征信部门,对各个部门的内部信息进行整合,实现信息的共享.严控贷款准入门槛,确保借款企业具有相符合的贷款资质,以规避风险,保障银行最大的收益期望值.
[1] 中华人民共和国国家统计局.中小微企业成为推动经济发展的重要力量:第四次全国经济普查系列报告之十二[EB/OL].(2019-12-18)[2021-07-31].http://www.stats.gov.cn/tjsj/zxfb/201912/t20191218_1718313.html.
[2] 吴江,卢方元.信息不对称条件下中小企业贷款难的博弈分析[J].统计与决策,2005(21): 24-26.
[3] 于学花,栾谨崇.基于信贷配给理论的中小企业融资方略[J].企业经济,2005(9):144-146.
[4] 顾洲一.基于XGBoost模型的银行信贷高风险客户识别研究:以我国Y银行为例[J].上海立信会计金融学院学报,2020(1):17-28.
[5] 李海姣,黄健青.我国房地产上市公司信用评级研究:基于BP神经网络方法[J].上海立信会计金融学院学报,2020(2):15-26.
[6] Altman E I.Financial Ratios,Discriminant Analysis and the Prediction of Corporate Bankruptcy[J].The Journal of Finance,1968,23(4):589-609.
[7] Altman E I,Haldeman R G,Narayanan P.ZETATManalysis A new model to identify bankruptcy risk of corporations[J].Journal of Banking & Finance,1977(1):29-54.
[8] 邹昆仑,陆萍.基于Z模型对中国企业债信用评级的实证研究[J].宏观经济研究,2018(5):72-83,175.
[9] 高盼.DEA-TOPSIS模型在小微企业信用评价中的应用[J].征信,2021,39(5):71-76.
[10] 陈雄华,林成德,叶武.基于神经网络的企业信用等级评估[J].系统工程学报,2002(6):570-575.
[11] 董申,王倩.基于机器学习的信用评级展望研究:以发电企业为例[J].农村金融研究,2017(3):41-46.
[12] 车辉,赵子薇.基于遗传神经网络的寿险业信用评级优化研究[J].保险职业学院学报,2019,33(5):21-28.
[13] Gulsoy N,Kulluk S.A data mining application in credit scoring processes of small and medium enterprises commercial corporate customers[J].Wiley Interdisciplinary Reviews:Data Mining and Knowledge Discovery,2019,9(3):e1299.
[14] 李岳鑫,王有远,史永立.基于AHP和DEA的科创型中小企业信用评价研究[J].科技和产业,2020,20(7):109-113.
[15] 平萍.C农村商业银行小微企业信用风险评价研究[D].西安:西安石油大学,2020.
credit risk assessment of micro, small and medium-size enterprises from the perspective of big data
YAN Xiaolei,LI Xia,LIU Zhongwen,TIAN Zhen
(School of Economics and Finance,Bengbu College of Technology and Business,Bengbu 233010,China)
The credit risk ratingof micro,small and medium-size enterprises was researched based on the perspective of a commercial bank.Data mining method is used to construct the credit scoring index system of micro,small and medium-size enterprises,and TOPSIS evaluation model improved by entropy weight method is used to evaluate 123 micro,small and medium-size enterprises.In order to expand the application scope of the model,the BP neural network algorithm is used to build the scoring optimization model.Credit scoring is carried out on 302 enterprises without credit record,and the results are visualized by system clustering method.It can be concluded that the enterprise′s own strength and profitability have a significant impact on the evaluation of enterprise credit.The results of TOPSIS model are basically consistent with the manual evaluation results given by commercial banks.The minimum mean square error of BP neural network model is 0.008 3,and the total goodness of fit is 0.82,which can better fit the sample data.The substantive reference can be provided by the research results for banks to make credit decisions for micro, small and medium-size enterprises.
micro,small and medium-size enterprises;credit rating;TOPSIS;BP network
1007-9831(2022)05-0031-09
O29∶F832.4
A
10.3969/j.issn.1007-9831.2022.05.006
2021-11-03
安徽省大学生创新创业训练项目(202013611013)——基于大数据视角的中小微企业信贷风险评估与贷款策略研究:以安徽省C农商行为例
燕晓磊(1999-),男,安徽宿州人,在读本科生.E-mail:yphcdxl@163.com
李侠(1985-),女,安徽蚌埠人,讲师,硕士,从事统计学研究.E-mail:444507629@qq.com