APP下载

基于ENet-COX模型的中小企业信用风险评估研究

2022-08-26李淑锦吴王滢

关键词:信用风险变量评估

李淑锦,吴王滢

(杭州电子科技大学 经济学院,浙江 杭州 310018)

中小企业作为市场经济的重要组成,是我国经济高质量发展的驱动力之一,却一直存在融资环境不佳的问题,究其原因主要在于中小企业的信用风险问题。中小企业成立时间比较短,财务制度不规范,企业的抗风险能力比不上大型企业,导致中小企业很难拥有稳定的资金支持。因此找到影响企业信用风险的关键因素,准确评估中小企业的信用风险成为亟待解决的问题,这也是本文的研究目的和初衷。

一、文献回顾

关于中小企业信用风险评估指标的研究,学者们已经做了大量工作。霍源源等(2019)[1]研究结果表明,由流动资产比率、资产负债率及总资产增长率等财务变量建立的指标体系经过Probit模型验证评估结果精确度达到92.97%。吴敬茹(2016)[2]发现PE投入率、贷款收益率也能更好地完善中小企业的信用风险评估指标体系。除常规财务指标外,非财务指标也是重要的影响因素,如邓晓岚等(2006)[3]发现股权结构、公司治理、市场信息、审计意见等确实能够提高信用风险评估的预测精度。除了企业的微观因素,学者们还发现外部宏观因素影响企业的信用风险。匡海波等(2020)[4]研究得到基于外部环境因素的指标体系的判别精度高达90.53%。综上所述,在考虑宏观经济变量的影响从而建立一套更加完整、科学的评估指标体系会有效提高中小企业信用风险的预测效果。

关于信用风险评估方法的研究,早期则主要集中使用静态评估模型。Martin(1977)[5]引进Logistic回归模型研究企业的违约概率,实证结果表明Logistic回归模型的预测能力优于Z模型和ZETA模型。Sustersic等(2009)[6]用人工神经网络(Artificial Neural Network,ANN)模型并用k倍交叉验证和误差反向传播神经网络模型测试了预测精度,模型的精确度为79.30%。还有支持向量机(Chen和Li,2010)[7]等被应用于中小企业的信用风险评估。后期学者们立足于对静态评估模型进行优化,如邓爱民和王珂(2015)[8]将主成分分析和Logistic进行优势互补建立评估方法;朱宗元等(2018)[9]建立Lasso-Logistic模型进行风险评估。任歌(2013)[10]结合核心企业的资信状况等信息,采用LSSVM模型进行分类,最后与BP神经网络进行对比,发现LSSVM更为准确和稳定。

最近在中小企业的信用风险评估中引进了动态的评估方法,最重要的是COX模型。COX模型最初用于医学领域,Narain(1992)[11]第一次将COX模型运用到信用评估中。COX扩展模型可以处理时间依存变量,Stepanova和Thomas(2001)[12]指出COX模型可以通过将宏观经济变量作为时依变量纳入到模型中来提高评估预测精度。Bellotti和Crook(2009)[13]利用英国零售信用卡数据,使用COX模型同时将宏观经济变量纳入模型,发现预测性能超越Logistic回归模型。国内,陈星文和任佳伟(2017)[14]以创业板上市公司为研究对象,运用动态的COX模型,建立了创业板上市公司的财务危机预警模型,模型的预测精度超过90%。

由于中小企业信用风险的评估指标较多,指标间又存在相关性,因此在信用风险评估的研究中又引入了特征变量选择方法如Lasso、Ridge、Elastic net(以下简写为ENet)等来筛选指标。Elastic net是Lasso和Ridge的结合,由Zou和Hastie(2005)[15]提出,其拥有特征变量选择的能力。与Lasso和SRC-GS等方法相比,ENet增强了处理强相关性变量的能力,最近被应用于信用风险评估的指标选择的研究中,如李春红和韦新星(2015)[16]用数值实例验证了ENet运用于COX模型的可行性,并且表明ENet-COX模型在预测能力上优于传统的COX模型。

本文将引入宏观经济变量作为中小企业的信用风险评估指标,尝试使用动态的COX模型来预测中小企业的信用风险,并将使用ENet筛选有效评估指标。将ENet和COX模型结合首次应用于中小企业的信用风险评估,是本文的一大创新点。为了进一步说明ENet模型筛选评估指标的有效性,本文还分别使用Ridge、Lasso模型再结合COX模型评估相同样本的中小企业信用风险,结果表明ENet-COX模型更有效。

二、信用风险评估方法与有效评估指标选择方法

(一)弹性网络(Enet)——指标选择方法

Elastic net(ENet)是在Lasso的基础上,通过引入系数的二次惩罚而得到的一种由Lasso衍生出的更能有效处理高维小样本数据的方法,其主要特征是可以根据分析对象特点调节参数α,实现目标变量稀疏降维。具体的表达式为:

(1)

(1)式表明,α=1时,ENet就变成了Lasso估计;当α=0时,整个公式就变成了Ridge估计。Lasso可以实现特征变量的选择和稀疏的估计。Ridge估计能做到缩小回归系数,但无法做到剔除变量,在指标较多且指标之间相关性较强的情况下,ENet同时拥有Lasso和Ridge的优点。

添加二次惩罚项就可以得到COX模型的弹性网络估计值:

(2)

(3)

其中p为预测变量的个数。

(二)比例风险回归模型

COX模型称为比例风险回归模型,是Cox(1972)[17]提出的,包括COX PH模型和扩展的COX模型。COX PH模型属于生存分析半参数模型。危机函数h(t,X)表示企业在t时刻发生财务困境(在本文即被ST)的概率,其具体的表示形式为:

(4)

其中,h0(t)为基准风险函数,指的是所有信用风险指标为0时的违约风险。通过模型回归可以得到各指标的系数βi。若βi>0,该因素为危险因素;若βi<0,该因素为保护因素;若βi=0,该因素为无关因素。满足(4)式的危机函数的模型为COX PH模型。

如果需要考虑时间相关变量,模型不再满足成比例即PH假设,称为扩展的COX模型。危机函数的具体表示形式为:

(5)

其中Xj(t)为时间依存变量(指标)。

使用扩展的COX模型,既可以是静态变量和动态的时依变量的组合,也可以全是时依变量。本文将使用的全部都是时依变量的扩展的COX模型,即宏观变量和财务指标都是以Xj(t)的形式进入模型。

由于评估指标中存在冗余指标,本文使用ENet将中小企业的评估指标中的冗余变量进行剔除,来建立有效的风险评估指标体系,再利用扩展的COX模型对中小企业的信用风险进行动态评估,期望能够提高中小企业信用风险预测的精度。

三、中小企业信用风险评估指标体系

影响企业信用风险的因素很多,本文选取企业的内在因素即财务指标和宏观经济指标等外部因素来构建中小企业信用风险的评估指标体系。财务指标包括企业的偿债能力、盈利能力、营运能力、成长能力等指标,宏观经济指标包括CPI、M0、企业景气指数等。具体指标及各指标对企业信用风险的影响预期见表1。

企业的偿债能力能够非常直接地影响企业的生存状态,是决定企业能否长期生存下去的重要指标。短期偿债能力指标有流动比率、速动比率等,在合适的数值范围内,数值越大表示流动性越强,偿债能力越强,那么信用风险就越小;反映企业长期偿债能力的指标有资产负债率、产权比率等。这些指标的数值越大表示企业长期偿债能力越低,企业信用风险就越大。衡量负债占比的指标越高,表示资金压力就越大,不利于企业良好经营,企业违约的可能性加大。

企业的盈利能力是企业竞争力的体现,一个竞争力强的企业的盈利空间也就越大。代表企业盈利能力的指标有,总资产报酬率、营业利润率、成本费用利润率等,这些指标的分子都是企业的营收利润数据,所以当指标数值越大,表示利润越多,企业盈利能力越强,企业的信用风险越小。

营运能力是反映企业各项资产的周转情况的指标,充分反映企业的流动性。代表性的指标有应收账款周转率、存货周转率、流动资产周转率、总资产周转率等。指标的值越大,说明企业的营运能力强,流动性好,因此企业的信用风险低。

成长能力是对企业扩展经营能力的分析,用于考察企业通过逐年收益增加或通过其他融资方式获取资金扩大经营的能力。一般来说,总资产增长率高的企业发展状态优;留存收益资产比越大,表示企业的盈余公积和未分配利润越多,企业经营越好;每股净资产反映的是每股的资产现值,衡量企业的内在价值,数值越大,价值越大,企业违约的风险越低。但主营业务利润占比指标受产业的影响较大,权益乘数在企业不同的生长周期展现出不同的数值,因此与信用风险的关系未知。

M0、M1、M2代表着不同流动性的货币资产,这些变量的变化都会影响到投资者和企业的经济行为,从而影响中小企业生存的大环境。CPI作为通货膨胀代表性的指标,直接影响企业的借贷能力与还款能力,但对企业信用风险影响的方向还未可知。恩格尔系数、失业率都反映人民的生活质量,影响人们的投资能力,投资者的投资偏好会间接影响企业的融资。宏观经济景气指数、国房景气指数、消费者景气指数都是对于未来经济走势的预判,指数越大,表示给予未来的信心充足,有利于中小企业的成长,减小企业的违约风险。

表1 中小企业的信用评估指标体系

四、中小企业信用风险评估结果

本文的研究对象为中小企业。考虑到数据的可得性,剔除大型企业,选择上市企业中的中小型企业,数据来源CSMAR数据库。国内同类研究多以上市公司被ST作为判定企业发生财务失败的依据(梁琪,2009)[18]。财务失败是导致企业违约的直接因素,因此本文也将财务失败与否作为评判企业是否存在信用风险的标准。违约企业的生存时间是指企业开始上市到首次被ST的时间长度。数据时间选择为2004年6月—2020年6月,使用季度数据,删除2017年6月之后上市的公司,原因是这些公司上市时间过短,不具有研究价值。以172个企业,一共7 517组数据作为研究样本,1 ∶1划分违约企业和未违约企业。由于本文采用动态指标,所以将生存时间截止前的数据作为样本训练集,生存时间截止点的数据作为测试集。

(一)信用风险评估指标选择

本文采用ENet方法来对评估指标加以筛选,不仅可以减少模型的共线性问题,还可以提高预测速度和模型的收敛性。ENet的α是在0-1之间,使用R语言对数据进行训练,对α在区间[0,1]中以0.01的间隔进行划分,得到最优的α和λ,训练的部分结果如表2所示。

表2的结果中,综合比较RMSE(均方根误差),Rsquared,MAE(平均绝对误差)三个指标进行选择最优的α和λ,最后得到最优值为0.55,0.045 003 614 9。根据最优值得到的最终的评估指标为16个,具体见表4。

表2 ENet对参数α和λ的估计结果

为了进行对比分析,本文仅说明利用Lasso方法的筛选结果。采用R语言中的glmnet包,得到的优化结果如图1、图2和表3。

图1 Lasso选择结果系数图

图2 Lasso选择结果λ图

表3说明,Lasso具有剔除变量的能力。经过Lasso选择之后,选择最小λ,得到最后变量的数量为6个。

表3 Lasso对λ的估计结果

从表4可以看到,Lasso选择出具体的6个信用风险指标,ENet筛选之后留下16个指标,而Ridge无法剔除变量,但三种方法都可对指标给出正负估计,且所估计出的系数正负与本文预期基本一致。一级指标下相关性高的二级指标,以及预期关系为未知的二级指标,Lasso和ENet也都做到剔除处理,表明弹性网络同时具备Ridge和Lasso的优点。

表4 Ridge、Lasso和ENet变量筛选结果

(二)参数估计

本部分将利用扩展COX模型进行信用风险评估,将所有指标作为时依变量进入模型,以季度数据为单位。用R语言中的survival包,将中小企业从成立到违约期间的所有指标数据进行一一输入处理。为了对比评估结果的精度,使用的评估指标为经过Ridge、Lasso、ENet筛选后得到的指标。其中将剔除表4中Ridge估计得到的系数小于e-04的变量,因为这些变量对结果的影响作用很小。最终将Ridge留下的25个评估指标,Lasso选择后的6个评估指标和ENet选择之后的16个评估指标纳入COX模型。

将172个企业的数据输入模型后得到的参数估计结果如表5、表6、表7。

表5 Ridge建立的评估体系的COX评估系数估计

表6 Lasso建立的评估体系的COX 评估系数估计

表7 ENet建立的评估体系的COX 评估系数估计

为了进一步检验宏观经济变量对信用风险的影响,在ENet建立的中小企业信用风险的评估体系之中,将宏观经济变量(时间依存)加入模型,所得的评估指标的系数如表8。

表8 ENet建立的评估体系加宏观变量的COX评估系数估计

表5-8的参数估计中,系数为负的指标是保护指标,即指标越大信用风险越小。可以看出,在财务指标中,现金比率、营运资金比率越大,企业的短期偿债能力越强,短期抗风险能力越大,信用风险越低。留存收益资产比和每股经营活动产生的现金流量净额的数值越大,表示企业所剩的未分配利润和盈余公积越多,企业处于经营的上升趋势,每股产生的现金流量充足,企业就有能力进行产品创新的投入,从而扩大企业的规模,吸引更多优秀人才加入,提升企业的抗风险能力。总资产周转率越大表示企业的流动越快,企业活性强,风险小。每股净资产越大表示企业价值高,企业信用风险小,结果符合预期。

流动负债比率越大表示企业短期的资金压力越大,固定资产比率越高的资金的流动越慢,现金适合比率高的企业没有合理地使用流动负债来更好地运用,这些都能够使得企业的流动性能变差,信用风险增加,与预期一致。

宏观指标中,恩格尔系数越小,失业率越低,现金M0增长越快,表示生活条件富裕,人们投资欲望强烈,这个时候人们更偏好于大型企业,那么中小企业的生存压力提高,信用风险变大。由于本文企业景气指数是采用工业,表示企业家对工业的发展具有信心,而中小企业大多是零售业等,随着指数的增大,表示对中小企业产业信心不足,不利于企业发展。宏观经济景气指数是企业家对宏观经济和企业的经营状态结合的判断和消费者景气指数,是消费者对经济形势的主观感受,这两个指数的增大表示我们的经济走势是向上的,信心越来越强,更有利于中小企业的生存。综上所述,宏观经济指标得到的系数正负符合预期。

(三)模型准确率比较

利用测试集的172组数据分别用三种模型对其信用风险进行了评估,具体的评估结果见表9。

表9 中小企业信用风险的评估结果

由表9可以看出,对于第二类错误(将危机企业被判断为正常企业),ENet-COX模型第二类错误的概率为6.98%,特别是引入宏观经济指标后模型错误率又得到降低,犯第二类错误的概率仅为4.65%。对于第一类错误(将正常企业被判断为危机企业),Ridge-COX的错误率最低,Lasso-COX和ENet-COX稍微高一些。但总体的预测准确度上,ENet-COX模型的准确度最高,不考虑宏观因素影响时预测精度为86.63%,考虑宏观因素的影响后提高到87.21%。对于信用风险评估模型来说,第二类错误发生比第一类错误发生产生的错误成本会更大,所以ENet-COX在第二类错误上更有优势,表明这个模型有更好的实际应用价值。加入宏观经济变量后,更好地减少了第二类错误的发生,模型预测的准确度变得更高。

五、结论

本文采用动态的COX模型对中小企业的信用风险进行评估,结合ENet方法对评估指标进行筛选,利用中小企业的季度数据,引入宏观经济指标等时间依存变量来动态监测中小企业的信用风险的变化,得到的主要结论是:

第一,使用ENet方法能够筛选有效评估指标体系,该方法兼具Ridge和Lasso的优点。中小企业信用风险的影响因素较多,在风险评估之前进行指标选择,结果发现Ridge没有剔除变量的能力,Lasso能够很好地做到变量选择,而ENet能够兼具两者的优点,更好地处理变量共线性的问题,筛选出有效评估指标。

第二,ENet-COX模型的预测准确度高于Ridge-COX和Lasso-COX模型。实证结果表明,ENet-COX的模型精度为86.63%,高于Ridge-COX预测精度83.14%,高于Lasso-COX预测精度81.98%。加入宏观经济变量后,总体的预测准确度提高到87.21%。从第二类错误看,加入宏观经济变量的ENet-COX模型的评估结果为4.65%,错误率也大大降低。模型预测精度的提升,说明模型更具实用价值。

第三,ENet-COX模型可以对中小企业的信用风险进行动态跟踪,能够准确提供中小企业信用风险的变化。

本文的不足之处是,由于未上市中小企业数据不可获得性,只能选用上市企业中的中小型企业,研究对象存在一定程度的偏差。如果能够获取中小企业的信贷数据进行分析,结果将更加可信。

猜你喜欢

信用风险变量评估
两款输液泵的输血安全性评估
核电工程建设管理同行评估实践与思考
我国国有商业银行信用风险管理研究
基于模糊层次分析法的农户信用风险评级研究
基于模糊层次分析法的农户信用风险评级研究
评估社会组织评估:元评估理论的探索性应用
分离变量法:常见的通性通法
文化部公共图书馆评估组对广西壮族自治区图书馆开展评估定级工作
不可忽视变量的离散与连续
轻松把握变量之间的关系