APP下载

基于自适应LASSO变量选择的Logistic信用评分模型研究

2016-03-24罗昊韩瑞珠

2016年4期
关键词:东南大学信用权重

罗昊 韩瑞珠

作者简介:罗昊(1991-),男,汉,硕士研究生,东南大学经济管理学院系统工程研究所,研究方向:金融统计。

韩瑞珠(1959-),女,博士,教授,硕士生导师,东南大学经济管理学院系统工程研究所。

摘要:本文研究将变量的信息价值作为自适应LASSO变量选择中惩罚项的权重,对考虑了供应链融资相关变量的信用评分变量集合进行变量选择,建立logistic信用评分模型。通过ROC曲线和KS值等指标对比逐步回归和LASSO变量选择建立的模型,得到了基于自适应LASSO变量选择的Logistic信用评分模型具有更好的风险区分能力以及预测的准确性的结论。

关键词:自适应LASSO;信息价值;Logistic信用评分模型

信用评分模型是银行等金融机构根据客户的信用历史资料,建立计量模型来得到不同等级客户的信用分数,从而决定客户可以持有的金额权限,以保证还款等业务的安全性。随着现代社会经济的发展,个人和企业越来越多的参与到金融活动中,这对信用评分模型的发展提出了更高的要求。商业银行主要还是基于统计模型来划分客户的信用等级,对于企业客户,银行主要会从企业的各项财务指标来选取变量建立评分模型。目前在如何选择合适的变量来建模这个关键点上,普遍存在两方面的误区。一方面由于无法识别哪些是重要变量,哪些是无关变量,人们会倾向于选用尽可能多的自变量,这样做虽然避免了遗漏变量带来的模型偏差,可是过多的变量进入模型会导致相关性的变量同时进入模型带来的共线性问题,以及对模型的估计系数的大小和符号正负带来影响,而且无关变量的选入还会降低模型的精度,对理解变量之间的关系造成一定程度的干扰。另一方面是研究中常常忽视了变量选择和设定的问题,为了方便自己的研究和收集数据,从自己的主观判断选择研究变量,建立的模型缺乏有力的科学依据,这极大的减弱了该模型的说服力以及结论的可靠性。因此,为了确保模型设定的正确性,建立模型之前进行变量选择是必不可少的一项工作。

本文选择Logistic回归方程建立信用评分模型,采用自适应LASSO来进行建模的变量选择过程,其中考虑变量的信息价值作为自适应LASSO惩罚项权重,以期望通过自适应LASSO变量选择得到最优的Logistic信用评分模型。

三、小结

通过理论证明了基于信息价值IV作为自适应LASSO方法的惩罚权重来进行变量选择,建立的Logistic回归模型参数估计量具有Oracle性质。实证分析阶段,三种模型中自适应LASSO建立的Logistic信用评分模型对企业信用风险的识别正确率最高,相比较其他两个模型具有较大的优势,这也显示出了将信息价值作为变量权重加入自适应LASSO变量选择中来建立模型的优越性。本文的不足之处是没有考虑模型在不同环境、不同时点下是否仍能够保持良好的精确性,因而进一步研究将重点尝试建立动态信用评分模型来检验模型的稳健性。(作者单位:东南大学经济管理学院系统工程研究所)

参考文献:

[1]Akaike H.Inforlnation theory and an extension of the maxim um likelihood prineiple

[2]petrov BN,CsakiF,eds.Proeeedings of the Sceond International Sylllposium on Information Theory[C].BudaPest,1973:267-281.

[3]孙燕.随机效应Logit计量模型的自适应LASSO变量选择方法研究——基于Gauss-Hermite积分的EM算法[J].数量经济技术经济研究,2012,12:147-157.

[4]胡心瀚,叶五一,缪柏其.上市公司信用风险分析模型中的变量选择[J].数理统计与管理,2012,06:第1117-1124页.

[5]罗世炜.关于我国城市商业银行对中小企业信贷融资问题的研究[D].暨南大学,2012.

猜你喜欢

东南大学信用权重
《东南大学学报(医学版)》稿约
《东南大学学报(医学版)》稿约
《东南大学学报(医学版)》稿约
《东南大学学报(医学版)》稿约
为食品安全加把“信用锁”
权重常思“浮名轻”
信用收缩是否结束
为党督政勤履职 代民行权重担当
基于公约式权重的截短线性分组码盲识别方法
信用中国网