基于多元线性回归的信贷决策研究
2021-05-08崔新苗
孙 全, 孙 渊, 崔新苗
(上海电机学院 机械学院, 上海201306)
小微企业信贷业务在商业银行信贷业务中的占比较大,因此对小微企业的信贷风险管理以及小微企业服务策略的研究就显得十分重要。目前,我国小微企业面对的主要挑战是:难融资、高成本、重赋税,这3点都是阻碍小微企业不断进步的关键因素,给小微企业带来了很多风险。为加速小微企业实体经济健康发展,国家已将小微企业支持上升到了很高的层面,同时还发布了很多会议精神以及支持小微企业不断发展的政策。小微企业在市场议价水平较低,发展空间却十分广阔。但是依然具有一些本质特征,如规模小、抵押物不足等。本文基于2020年全国大学生数学建模C题的数据建立了信贷策略模型,这个模型旨在解决对于不同情况的小微企业,银行给它们放贷额度,这对小微企业的发展至关重要[1]。
1 银行的信贷策略
在经济研究领域,中小微银行的信贷策略一直备受关注[2]。早期孙继华等[3]认为应定性定量剖析企业现金流量表,然后作出是否贷款的决策。龙海明等[4]提出信贷员要认真判断企业财务数据报表的真实性。刘平[5]对财务报表和企业财务管理活动之间的关系进行了研究,认为一般情况下企业财务报表能够较为真实地反映企业财务管理活动。杨晶等[6]从我国浙江省中小企业的信贷投放角度进行研究,认为我国商业银行对中小企业的评价水平和效率仍处于较低水平,尤其是财务分析方面没有形成一套完整、健全的评价体系。侯蕾[7]主要分析了商业银行风险类型、防控风险的措施和贷款投放策略。
赵腾[8]通过构建熵权法和TOPSIS法结合的熵权-TOPSIS模型,对商业银行的财务进行评价。郭驰[9]提出基于直觉模糊TOPSIS法的小额贷款公司中小企业小额贷款信用风险评价。王跃恒等[10]提出我国基于多元线性回归的商业银行信贷风险防范措施。诸如此类对单个方法的研究已经很深入[11],但运用优劣距离解法和多元线性回归分析结合的模型,更能优化信贷策略,对银行给中小微企业提供信贷决策具有重要的理论和现实意义。
2 基于熵值赋权的优劣距离解法和多元线性回归模型
2.1 基于熵值赋权的优劣距离解法
先统一原始数据矩阵指标类型得到正向化矩阵,这里的指标中只有违约率需要正向化处理,再对正向化的矩阵进行标准化处理以消除各指标量纲的影响,并找到有限方案中的最优方案和最劣方案,然后分别计算各评价对象与最优方案和最劣方案的相对接近程度,以此作为评价优劣的根据[12-13]。
对企业的好评率、进项平均金额、进项平均税额等8项指标的正向化矩阵进行标准化,记n个评价对象与m个评价指标构成的正向化矩阵如下:
式中:n=123为企业数量;m=8为影响指标数量。
其标准化的矩阵记为Z,Z中的每一个元素:
式中:i=1,2,…,n,表示i家不同的企业;j=1,2,…,m,表示j项不同的指标。
计算第j项指标下第i个样本所占的比重,并将其作为相对熵计算中用到的概率,计算概率矩阵P,其中每一个元素p ij的计算公式如下:
计算每个指标的信息熵和信息效用值,并归一化得到每个指标的熵权。对于第j个指标而言,其信息熵的计算公式为
定义信息效用值d j=1-e j,若信息效用值越大,其对应的信息就越多。将信息效用值进行归一化,求出每个指标的熵权为
求出8个影响因素的权重,计算得分并将它们归一化。
定义最大值为
定义最小值为
定义第i个评价对象与最大值的距离为
定义第i个评价对象与最小值的距离为
因此,可计算出第i个评价对象未归一化的得分为
综上,可计算出每个企业的综合得分,其中Si越大,D+i越小,即越接近最大值。
2.2 多元线性回归
从经济角度出发,对进项平均金额、进项平均税额、销项平均金额、销项平均税额做取对数的预处理。
设因变量y与一般变量x1,x2,…,x p的线性回归模型为
式中:β0,β1,…,βp为p+1个未知参数,称为回归系数;y为被解释变量;x1,x2,…,x p为p个可精确测量并可控制的一般变量,称为解释变量。当p=1时,式(12)为一元线性回归模型;当p=2时,式(12)为多元线性回归模型。ε为随机误差,与一元线性回归一样,对随机误差项常假定为
式中:E(ε)、var(ε)、σ分别为均值、方差和均方差。
然后,定义E(y)=β0+β1x1+β2x2+…+βpx p为理论上的回归方程[14-16]。
当有n组观察数据时,则式(12)可表示为
式(14)的矩阵形式可表示为:y=Aβ+ε。其中:
为了使参数估计简单易行,假定:x1,x2,…,x p为确定型变量,且要求rank(A)=p+1<n,即矩阵A中列满秩,列与列之间线性无关。同时,随机误差项具有零均值和等方差,即
式中:cov(εi,εj)为任意两个影响因素的随机误差。
多元线性回归方程未知参数β0,β1,…,βn 的估计与一元线性回归方程的参数估计原理一样,参数估计应使得残差平方和最小。对于式(15)矩阵形式表示的回归模型,如果参数估计量已经得到,则有那么所选择的估计量应使得估计值y^与观测值y之间的残差在所有样本点上达到最小,即使
取最小值。解决这个最优化问题,得到多元线性回归的参数估计:
然后用F检验和t检验分别检验回归方程的显著性和回归系数的显著性。
3 基于Matlab的求解过程
将2020年全国大学生数学建模C题的数据做正向化处理,每一个企业的好评率、违约率、进项平均金额、进项平均税额等部分数据如表1所示。
表1 123家有信贷记录企业的进项发票数据
将表1中的数据代入式(1)~式(11),与此对应的Matlab部分求解代码:
通过计算得到进项平均金额、销项平均金额、进项平均税额等8项影响因素的权重值,按从大到小的顺序绘制成统计表如图1所示。
图1 各项指标所占权重
由图1可知,进项平均税额所占权重最大为0.339 8,进项平均金额次之为0.283 0,违约率、好评率、销项有效发票率和进项有效发票率所占权重都很小,可忽略不记。用这个权重对各个企业进行综合打分,按从高到低的分数给这123家企业进行排名,将这123家企业分为3类,分别为前50%、50%~80%、80%~100%。企业代号为E1、E4、E12等14家企业为优质企业,代号为E39、E86、E26等39家企业为普通企业,代号为E2、E25、E27等70家企业为较差的企业。
与此同时,用stata软件中的regress命令对进项和销项的金额平均值、税额平均值等变量进行多元线性回归得到进项指标、回归系数、t检验统计量值等。具体如表2和表3所示。
表2 进项标准化回归系数表
表3 销项标准化回归系数表
由表2可见,税额平均值和有效发票率的回归显著程度系数都小于0.05,故回归是显著的,回归方程为
式中:t11为税额平均值;t12为有效发票率。
在其他因素不变的前提下,税额平均值每增加1%,金额平均值就平均变化0.775%;在其他因素不变的前提下,有效发票率每增加1%,金额平均值就平均变化-3.531%。
由表3可见,税额平均值回归显著程度系数小于0.05,故回归是显著的,但有效发票率的回归显著程度系数大于0.05,所以它的回归不显著,回归方程为
式中:t21为税额平均值。
在其他因素不变的前提下,税额平均值每增加1%,金额平均值就平均变化0.645%。故前面50%企业的信贷额度为1×0.775/(0.775+0.645)×100%=54.58%,即给前50%的企业信贷总金额为0.545 8亿元,后面的50%的企业总信贷额度为0.454 2亿元。那么具体的每家企业贷款额度,可用每一类的信贷总额度乘上每个企业最终的总得分来表示。
4 结 语
(1) 采用熵值赋权和优劣距离解结合的方法,分析了进项平均金额、销项平均金额、进项平均税额等8项影响因素的权重,并按照归一化处理得到最终得分进行排名。
(2) 对企业的信贷风险进行量化分析,给出银行在贷款总额固定时,对有信贷记录的企业以进项平均金额为自变量,税额平均值和有效发票率为因变量;对没有信贷记录的企业则以销项平均金额为自变量,税额平均值为因变量。
(3) 基于优劣解距离法和多元线性回归综合模型,两类企业获得的银行贷款按照正向影响因素前面的系数进行分配,即0.775∶0.645进行分配。第一类企业内部分配的策略是用银行贷给第一类企业的总金额乘以他们各自最终的得分系数,即为第一类企业每个企业最终得到的贷款;同理第二类企业内部分配策略亦是如此。这种模型简单易行,具有很强的可操作性。