基于大数据分析的银行对中小微企业信贷决策
2021-04-29刘自强谢佳英段兰兰周紫英
刘自强 谢佳英 段兰兰 周紫英
(湖南交通工程学院,湖南 衡阳 421001)
1 引言
本文以2020年大学生数学建模C题数据为背景,第一份样本是123家有信贷记录且信息较全的中小微企业的数据,第二份样本是302家缺失信誉评级、违约情况未知的企业数据,第三份是客户流失率与贷款利率的数据。
中小微企业作为国民经济的重要组成部分,在市场经济、扩大就业、创新产品、改善民生等方面有其不可比拟的作用。随着中小微企业与个体经营户企业的数量在中国经济开放式发展中日益增多,银行信贷业务能有效地建立中小微企业与银行的资金流动链,研究分析银行给予中小微企业的信贷策略也变得至关重要。银行根据中小微企业的经营状况、实力以及信誉评估预测其存在的信贷风险,通过分析信贷风险等因素提出更加科学、合理的信贷策略。这不仅有利于银行的利润最大化、风险最小化,还能在一定程度上使得资金能够被合理、科学化利用,从而实现银行与中小微企业之间的双赢。由于现阶段我国绝大部分中小微企业呈现密集分布且生命周期短暂的状况,2020年年初疫情暴发,多个行业的中小微企业受到极大冲击。因此需要通过Logistic回归分析,建立在不同情况下的线性规划模型,优化调整信贷政策[1]。
现用i=1,2,3,4分别表示信誉评级A,B,C,D。Z表示银行利息,Pi表示123家企业中信用评级为的企业的违约率,ρi表示123家企业中信用评级为i的企业的年利率,ni表示123家企业中信用评级为i的企业的数量,表示123家企业中评级为的企业的放贷额度,i=1,2,3,4。
2 企业违约模型评估及数据函数拟合
针对第一份数据样本的123家中小微企业数据进行数据预处理,提取有效的数据信息,以企业是否违约建立0-1规划模型[2],量化分析信贷风险。
违约率能有效量化信贷风险,信用评级为A的企业信贷风险较低,信用评级为D的企业信贷风险较高。对数据进行预处理,分析123家中小微企业的信贷记录得到如表1的数据信息。
利用数学软件(Matlab)对数据中的客户流失率Si与贷款利率进行函数拟合[3],得出拟合图1。
表1 123家企业信贷记录
图1 附件三中客户流失率与贷款利率函数拟合情况
根据拟合图得出下列函数表达式:
评级A:S1=f(ρ1)
评级B:S2=f(ρ2)
评级C:S3=(ρ3)
评级D:S4=f(ρ4)=0
3 有信贷记录企业的信贷策略
若银行固定信贷总额为6 000万,选取银行利息为因变量,违约率、年利率、数量、放贷额度结合客户流失率为自变量,建立线性规划模型如下:
目标函数:
约束条件:
利用数学软件(Matlab)编程分析计算得出信贷策略如下:评级为A的企业放贷总额为2 700万元,应给予的年利率为0.0 235;评级为B的企业放贷总额为2 287.6万元,应给予的年利率为0.0 422;评级为C的企业放贷总额为340万元,应给予的年利率为0.1 177;评级为D的企业不放贷。
综上,对于数据信息较全的企业,信贷风险越高,银行对其放贷期望值越低,放贷总额越少。银行在保证自身最大利润的情况下,将提高信贷风险较高企业需要给予的年利率。这类企业还会因还款能力不足、信息不对称以及担保不足等因素而导致信贷风险的提高。
4 无信贷记录企业的信贷策略
通过提取数据样本一的有效数据信息,建立123家数据信息较全企业与信誉评级关系的Logistic回归分析模型,预测附件中302家数据信息不全企业的信誉等级,建立0-1规划模型,进一步分析预测企业是否违约,提供合理可行的信贷策略。
4.1 基于Logistic模型的客户违约率
4.1.1 数据预处理
首先对数据样本一的进销发票数据进行信息提取,选取得到2017~2019年的相关企业信息。从信息中获取四个有效指标:企业流动资产、利润、销售收入、有效票据占有比。通过这四个指标建立多元Logistic回归模型[3-4],利用数学软件分析指标与企业信誉等级、是否违约的影响关系。
筛选出15家个人企业,利用剩下108家有限公司数据去求影响率。
表2 各信誉评级的年利率
表3 各企业类型的数量
得出108家企业流动资产总和、销售收入、利润、有效票据占有比,再对数据进行归一化处理,把数据用数学软件(SPSS)求解。
4.1.2 模型的建立求解
先分析信誉等级影响率,把信誉等级(A,B,C,D)作为因变量,自变量为企业流动资产(k1)、利润(k2)、销售收入(k3)、有效票据占有比(k4)。
通过多项Logistic回归分析,对照参数估计表,得出Logistic模型方程:
企业信贷等级影响概率(j=1,2,3):
同理,是否违约为因变量,增加信誉等级(k5)为自变量,再用这五个指标计算是否违约的影响率。
通过多项Logistic回归分析,对照参数估计表,得出Logistic模型方程:
企业违约影响概率(l=1,2):
4.2 信贷策略模型分析与求解
4.2.1 数据预处理
将预测出的302家企业的信贷记录进行数据整合处理,如表4,其中信用评级为D的企业信贷风险较高。
结合上文的拟合函数,选取银行利息为因变量,违约率、年利率、数量、放贷额度结合客户流失率为自变量,建立线性规划模型[5-6]如下:
目标函数:
约束条件:
4.2.2 模型的求解
利用数学软件编程分析计算得出的信贷策略如下:在固定信贷总额为一亿元时,评级为A的企业放贷总额为4 100万元,应给予的年利率为0.0 155;评级为B的企业放贷总额为3 900万元,应给予的年利率为0.0 872;评级为C的企业放贷总额为2 000万元,应给予的年利率为0.0 968;由于评级为D的企业信贷风险较高,所以不对其放贷。
表4 302家企业信贷记录
表5 信誉评级与年利率
综上,在数据样本二的302个企业中,当评级为B的企业和评级为A的企业的放贷期望值一样时,由于评级为B的企业信贷风险比A高,从银行利润和信贷风险考虑,银行的信贷策略也将适当提高对评级为B的企业需要给予的年利率。
5 突发因素的信贷策略
2020年初,疫情给我国银行业务发展、成本支出造成了比较大的影响。上述在对数据样本一、二分析的基础上,还应考虑应对疫情,对302家企业的信贷策略做出调整。首先提取302家企业中的106家企业在2020年的进销项发票信息,结合302家企业2019年的进销发票数据进行整合,得到一个新的数据样本信息,用多元Logistic回归分析模型预测出新冠疫情发生后302家企业的信贷记录,最后建立线性回归模型,分析得出新的信贷策略[7-8]。
基于上述模型,对2019年302家企业的发票随机剔除了60%的发票后的数据进行预测,整合分析得到2020年新冠疫情发生后302家企业的信贷记录,如表6。
结合上文的拟合函数,选取银行利息为因变量,违约率、年利率、数量、放贷额度结合客户流失率为自变量,建立线性规划模型如下:
目标函数:
约束条件:
利用数学软件编程分析计算得出信贷策略为:在固定信贷总额为一亿时,评级为A的企业放贷总额为1 900万元,应给予的年利率为0.051;评级为B的企业放贷总额为7 000万元,应给予的年利率为0.0 675;评级为C的企业放贷总额为1 100万元,应给予的年利率为0.1435;
由于评级为D的信贷风险较高,所以不对其企业放贷。
表6 2020年预测的302家企业信贷记录
表7 信誉评级与年利率
综上,为加强疫情防控和控制人口流动,我国的餐饮、旅游、酒店等人口密集型行业在资金受到影响的情况下,可能出现较大的信用风险,因此银行的信贷策略也有所调整。评级为D的企业因违约率极高,不发放贷款,所以突发因素对评级为D的企业基本无影响;评级A、B、C的企业可能在疫情期间信用风险提高,因此年利率也都将提高。
6 结语
本文针对多份数据样本,运用Logistic回归模型,对数据进行训练并预测,结果比较准确、可信度高。并构建线性规划模型,帮助银行在固定放贷额的基础上,充分考虑多个约束条件,使银行放贷风险尽可能的低,收益尽可能地高。
对于数据信息较齐全的中小微企业,银行能够更加精准预测评判该企业的信贷风险,对该企业放贷时信任度更高,相应的年利率也会较低,有利于缓解企业短期内资金链紧张问题。而缺失信誉评级和违约率未知的中小微企业,银行在预测评判信贷风险时,误差较大,不够科学和精准,因此放贷时更加谨慎,在此种情况下,银行放贷的年利率也需相应提高。银行在预测评判信贷风险时,不免出现满足放贷条件且急需资金渡过难关的企业,而银行却未对该企业放贷的情况,因此严谨、科学的信贷决策显得尤为重要。但面对瞬息万变的金融市场,还应该结合现实情况,采集大量且可靠的数据信息并进行总结归纳,以此来调整和优化信贷策略,从而达到长远发展。