APP下载

大数据时代不同行业的中小微企业的信贷决策探析

2021-07-17①赵璐②张妍③雷晓

消费电子 2021年5期
关键词:特征词特征值信贷

①赵璐 ②张妍 ③雷晓

一、数据预处理

由于不同行業间的企业信贷策略存在明显不同,因此本节将对123家企业的行业性质进行判别。首先采用TF-IDF算法提取行业特征词,并将文本值转化为向量。TF表示特征词出现的频率,IDF表示文本逆向频率。IDF的具体计算公式如下:

使TF与IDF相乘,即可得到词条重要程度:

TF-IDF=TF*IDF

基于所提取的行业特征词,将123家企业归为6类行业在此基础上进行K-means聚类分析,不断迭代求解,进而得出具体结果。6类行业分别是:制造业(30家)、建筑业(20家)、批发零售业(17家)、信息通讯业(12家)、服务业(29家)与其他行业(15家)。

二、基于SVM模型计算违约概率

(一)提取特征值

选取企业经济实力、企业信誉等级与上下游影响这三个因素作为衡量企业是否违约的主要因素,并结合数据对三方面因素进行量化处理。用营业收入额、收入增长率与利润增长率衡量企业经济实力,用与企业交易的企业个数与企业频数反映上下游影响力。为更加直观地表示该因素体系,作图如下:

图1 衡量企业是否违约的主要因素

(二)模型构造

利用5个不同的特征值(营业收入额、收入增长额、利润增长额、交易企业个数与交易企业频数),构建超平面,违约概率为每个点到超平面的距离,违约阈值为阈值点到超片面的距离。数据得到最好分离的目标方程和约束条件为:

将5个特征值与企业是否违约情况导入超片面中,即可计算违约概率与阈值。123家企业的违约概率具体为:

E1-E123=(0.11,0.23,…,0.56,0.59)

(三)结果分析

违约阈值为0.5。当违约概率大于0.5时说明企业风险等级较高;当违约概率小于0.5时说明企业风险等级较低。计算各行业中各类型企业的平均违约概率,得结果如下:

表1 不同行业、等级企业的平均违约概率

分析表1可知,微型企业中除服务业之外,其他行业的微型企业的平均违约概率都大于0.5,处于高风险状态;小型企业中低风险程度的行业为制造业与建筑业,其余行业中小型企业的平均违约概率都大于0.5,处于高风险状态;中型企业所有行业中企业平均违约概率都小于0.5,均处于低风险状态。

三、基于时间序列模型预测期望贷款额

已知所求违约概率代表企业的不同风险程度,将大于0.5的违约概率导入风险保守型信贷利率模型中,将小于0.5的违约概率导入风险喜好型信贷利率模型中,并在不同额度的基准利率范围内上下调整,即可得出信贷利率。具体123家企业信贷利率如下:

E1-E123=(13.95%,12.74%,…,10.46%,9.95%)

进一步对企业的信贷利率进行分析,计算各行业中各类型企业的平均信贷利率,得结果如下:

表2 2020年不同行业、等级的企业平均信贷利率

观察表2可知,无论企业等级为中型、小型或微型,信息通讯行业内企业的平均信贷利率均高于其他行业。这是由于信息通讯行业违约概率超过0.5,属于高风险企业,银行为降低信贷风险二提高信贷利率。

猜你喜欢

特征词特征值信贷
一类带强制位势的p-Laplace特征值问题
单圈图关联矩阵的特征值
聚焦Z世代信贷成瘾
基于改进TFIDF算法的邮件分类技术
产品评论文本中特征词提取及其关联模型构建与应用
基于商奇异值分解的一类二次特征值反问题
面向文本分类的特征词选取方法研究与改进
绿色信贷对雾霾治理的作用分析
关于两个M-矩阵Hadamard积的特征值的新估计
关于“方言特征词”理论的回顾及思考