基于Logistic模型的校园贷违约风险因素分析
2016-12-26黄丽仇乐宁徐琬莹门明坤
黄丽?仇乐宁?徐琬莹?门明坤
摘要:违约风险是潜藏在校园贷发展过程中的重要风险,也是校园贷平台可持续发展的主要障碍。学生违约的根本原因还是由于其没有稳定的收入来源,无法保证还款的及时性,同时其他潜在因素也影响着学生的违约行为,例如学生的年级、贷款金额和贷款期限等。本文基于对大学生使用校园贷情况的问卷调查,统计整理调查数据,通过建立logistic模型来探究影响大学生违约的相关因素,从大学生角度分析其违约行为,并在最后给出相关建议。
关键词:校园贷款;违约风险;logistic模型
中图分类号:F832.4;F224;F724.6 文献识别码:A 文章编号:1001-828X(2016)08-000-03
继信用卡被银监会叫停,退出大学生市场后,随着互联网金融发展的不断延伸以及大学生日益增长的消费需求,校园贷转手接力信用卡,迅速进驻高校。除国家助学贷款和生源地贷款外,现今的校园网络贷款已在高校占据很大的市场额,而校园贷的模式也多种多样,主要分为P2P网贷、分期消费平台和电商平台开展的信贷服务,而当前这些平台的发展模式尚不完善,平台的风控系统还存在诸多漏洞,且大学生的信用意识又较为薄弱,因此在校园贷发展过程中,违约风险无疑是制约平台发展的重要因素,也是学生贷款时所面临的重要问题。
一、文献综述
针对学生贷款中越来越高的违约率,许多学者致力于研究学生的违约行为,希望探究出其影响因素以降低贷款过程中的信用风险。廖茂忠,沈红[1](2008)结合大量经验数据,发现学生贷款违约主要受七大因素影响,即学生的学业状况,毕业后的收入水平与就业状况,债务水平,就读院校特征,家庭特征,个人特征及学生贷款制度。沈华[2](2010)通过实证分析研究了四种主要贷款模式下学生的偿还影响因素,并针对相应的研究结果提出贷款发放和偿还的政策性意见。廖茂忠、沈红[3](2010)调研了贷款参与方的信息,论证了大学毕业生的收入状况、还款意愿和社会信用环境是影响贷款违约的重要因素,而收入状况则是最核心的因素。耿新[4](2012)基于对八所高校的调查,发现贷款偿还方式单一,学生诚信意识不强,银行对贷款追缴管理不到位等诸多因素影响了助学贷款的风险控制。叶菁菁[5](2015)等分析归纳了P2P网贷的信用评估指标、评估方法以及其未来的研究趋势,指出应将贷款人的网络行为引入其个人信用评估的过程中,对其进行信用评级。
当前研究信用风险的方法有很多,如判别分析、聚类分析、神经网络模型分析、多群组结构模型分析和logistic模型分析等,其中最常用的是logistic模型分析法。李萌[6](2005)建立Logit模型来分析商业银行信用,证明其具有很强的识别预测和推广能力,是分析商业银行信用风险的有效工具。孙清和汪祖杰[7](2006)通过构造Logit模型,证明了基于农村信用数据所建立的Logit模型能够判定农村信用社借款人的信用风险程度。庞素琳[8](2006)收集了106家上市公司的财务数据,建立了Logistic回归信用评价模型,运用SPSS软件对数据进行分析,发现该模型的判别准确率达到了99.06%。宋荣威[9](2007)利用行业内上市公司的历史数据,证明了Logit模型在评价一个企业的信用状况方面有很强的借鉴性。邓晓卫[10](2010)运用偏极大似然估计方法,以发生控制权转让的上市公司为样本,建立了面板Logit模型。严洁,陈超[11](2010)通过建立Logistic回归模型分析大学生使用信用卡违约的影响因素,发现违约概率与每月月均收入、拥有信用卡的时间、每月月均透支额和信用指数有关。胡胜,朱新荣[12](2011)检验了Logit模型在评估我国上市公司信用风险中的准确度,证实其在实际运用中将高信用风险企业误判为低信用风险企业的错误率达到30%左右。
研究信用风险的文献大多数是针对商业银行、企业财务、国家助学贷款等机构的分析,而对新兴的校园贷违约风险的研究不多,尤其是通过建立模型来进行具体分析的文献更是极少,以报道性文章为主。因此本文借鉴前人对信用风险的模型分析的经验,将logistic模型引入到对当前的校园贷违约风险的分析中,从大学生的角度探究影响违约行为的潜在因素,通过这些研究我们将会了解到哪些学生更容易违约,哪些因素会影响学生正常还款。
二、建立Logit模型
Logistic回归为概率型非线性回归模型,是研究分类变量Y与其影响因素之间关系的一种多变量分析方法。通常情况下,因变量为二分类变量,即Y只取0或1,也可以是多分类变量。该模型可用来预测某事件发生的概率,因此早期被广泛用于医学检测领域,检测对象是否患病,后来又扩展到研究企业和商业银行的信用风险,判断其经营状况好坏。
本文构建的logistic回归模型表述如下:(P是学生违约的概率)
其中:
经对数变换后:
P/(1-P)为优势比Odds,即事件发生与不发生的概率之比,P∈(0,1),其函数呈S型分布,且为递增函数,P衡量了各贷款个体i(i=1,2,…,n)的违约概率的大小,若P≈0,表明违约风险较小,若P≈1,表明违约风险较大。
Xk(k=1,2,…,m)为违约风险评定过程中的影响因素,即指标变量,βj (j=1,2,…,m)为需要估计的回归系数。
通过建立样本的联合密度函数的似然函数,利用极大似然法即可求解模型中的回归系数,由于可以直接用SPSS软件进行操作,具体求解步骤不再赘述。
三、实证分析
(一)样本数据采集及变量指标的选定
此次研究的样本数据来源于对全国各高校学生使用校园贷情况的调查问卷,调查对象包括各重本与非重本院校的本科生、研究生和博士,共发放问卷708份,调查对象中108人使用过校园贷,其中 17人违约,91人未违约。
根据调研结果,假设学生性别、年级、教育背景、在校成绩、贷款期限、贷款金额、每月可支配资金及家庭背景等因素可能影响其违约行为,将8个指标引入模型,利用SPSS21.0软件对108份样本数据进行分析,筛选出与自变量相关度较强的几个变量作为最终指标,再对Logistic模型进行回归分析,得出结论。首先将一些指标设置成虚拟变量:性别,男取0,女取1;年级,本科设为0,硕士和博士设为1;教育背景,重本设为0,非重本设为1;在校成绩,挂科为1,没挂为0;家庭背景,城市为1,农村为0。
(二) 实验结果分析
将样本数据输入SPSS21.0软件,检测各自变量对模型的贡献率,首先可通过各变量的Score值简单判断其在模型中的影响程度。如表1所示,其中家庭背景和每月可支配金额得分分别仅有0.006和0.011,远低于其他指标得分,且P值为0.939和0.916,远高于分割点0.05,同时性别的分值也较低,P值较大。再对这些指标进行单独检验,其显著性也无法通过检验,因此可初步判断在模型的作用不大,不适合引入模型中,只有贷款金额和贷款期限得分最高,其他变量相对来说比较适合引入模型中,故先剔出家庭背景、每月可支配金额和性别三项变量。(见表1)
1.变换指标后模型的估计结果
剔除显著性不强的的三个指标后,研究剩下的五个指标在模型中的作用,Logit模型如下:
X1是年级,本科设为0,硕士和研究生设为1;X2是教育背景,重本设为0,非重本设为1,X3是在校成绩,没挂为0,挂科为1;X4是贷款期限,X5是贷款金额。
仍使用之前的样本数据,运用SPSS软件估计模型,得到表2对模型的整体性检验结果:(见表2)
从回归模型的整体性检验来看, Hosmer 和 Lemeshow 检验的卡方值较小,小于显著性水平为0.05,自由度为7的临界值14.07(可通过计算获得),且P值为0.917,说明解释变量一起对违约情况产生显著性影响,即方程的总体显著性通过检验。Cox & Snell R Square和Nagelkerke R Square较高,所以模型的拟合效果也较好,对因变量违约风险具有较强的解释能力。
2.模型的参数估计结果分析
利用SPSS估计模型的参数,如表3所示,可得出回归函数为:
据表,对各变量的显著性检验可通过观察P值判断,X3、X4、X5均在1%的置信水平下显著成立,X1、X2虽然P值大于0.05,但也能以80%以上的概率保证估计的正确性,故也可以接受X1、X2的估计结果。X1的系数估计结果为负,表明随着年级的上升,违约风险越来越小,学生的偿债能力越来越强。X2、X3、X4及X5的系数估计结果均为正,表明随着学生院校级别的下降,违约风险逐渐升高。挂科的学生违约的概率高于没挂科的学生,贷款期限越长,贷款金额越大,则违约的风险也会相应的增加。
引入贷款学生相关指标数据并利用上述模型进行违约风险预测时,若得出的结果P<50%,则违约风险较低;若P>50%,则违约风险较大。
3.模型的预测能力检验
通过运行SPSS可以对模型的预测能力进行检验,如表4所示:
表4 Logit回归模型的分类预测
已观测 已预测
违约Y 百分比校正
0 1
步骤 1 违约Y 0 89 2 97.8
1 7 10 58.8
总计百分比 91.7
a. 切割值为 .500
表4给出了Logit模型对108个样本是否违约的分类情况,实证研究表明,Logit回归模型对大学生使用校园贷的违约情况的预测能力较强。第一类错误为2.2%,即将高违约风险学生误判为低违约风险学生的错误概率;第二类错误为41.2%,即将低违约风险学生误判为高违约风险学生的错误概率。这表示该模型对于低违约风险学生判别的准确率是58.8%,对于高违约风险学生判别的准确率则高达97.8%。同时,该模型的总体预测准确率为91.7%,可见模型的预测能力较强,在测度学生使用校园贷过程中的违约风险时具有一定的现实作用,可作一般情况下的推广。
四、结论及建议
(一)研究结论
本文通过构造Logit信用风险度量模型对108位使用过校园贷的大学生的相关信息数据利用SPSS软件进行分析,首先选取了八个与学生违约行为可能具有相关性的指标作为解释变量,通过显著性检验最后剔除显著性不强的三个指标,即家庭背景、性别和每月可支配金额,将剩下的五个指标代入Logit模型中分析,得到相关结论:
1.由SPSS软件分析结果可知,Logit模型的总体预测能力较强,可用于判定大学生在使用校园贷时的违约风险程度,为平台审核学生的借贷资格提供参考依据,加强平台内部的风险管理和防控,从而降低不良贷款率。
2.影响学生违约的因素很多,本文研究了其中具代表性的五个因素。学生的在校成绩在某些方面可能反映其信用状况,学习较好的学生可能更难接受违约对自己形象和声誉造成的影响,因此违约风险可能降低,而贷款金额过大,贷款期限过长,则会使违约风险增加,因为贷款过多增大了学生后期的还款压力,期限过长则会降低学生还款的积极性。其次是年级和教育背景,年级越低的学生,由于此前接触信用贷款的机会不多,信用意识薄弱,在还款中更易拖欠贷款。在调查中发现,三本和专科院校的学生违约的比例更大,一方面是由于其使用校园贷的人数更多,平台的审核较为松懈;另一方面,这些学生的日常开销更大,消费攀比之风盛行,因此提高了违约风险。
(二)建议
1.平台应完善内部风险防控系统,建立风险预警机制。可通过引入Logit信用风险度量模型判定学生的信用程度,在审核学生贷款资格时应充分了解学生的信息,并对其信息进行严格保密,审查其真实性和可靠性,并将一些信息数据化,代入风险测量模型中,用数据来分析学生的资信状况,从而减少判定过程中的主观性,降低违约率。
2.严格审核学生身份信息,对贷款对象进行筛选。一般来说,低年级的学生贷款金额不宜太高,因为他们的信用意识薄弱;对于挂科较多,在校成绩十份欠佳的学生,贷款审核中要更为谨慎,对其资信情况要有更全面的了解。其次,无论针对哪类学生,贷款期限都不宜太长,贷款金额也应控制在较低限度,以免学生负债过多,最后无力偿还。
3.违约带来的将是高额的违约金和加倍的利率,因此学生在贷款时一定要清楚自身的处境,对自身的信息进行一个预先审核,确保自己能及时还款的情况下再使用校园贷,且不到万不得已时不要轻易使用,目前许多校园贷还存在着诱导性和欺骗性,所以学生自己要仔细鉴别,同时养成良好的理财和消费习惯。
参考文献:
[1]廖茂忠,沈红.学生贷款违约的七大因素[J].高等工程教育研究,2008,5.
[2]沈华.不同学生贷款模式的偿还影响因素分析——基于多群组结构方程模型视角[C].2010年中国教育经济学学术年会论文集,2010,12.
[3]廖茂忠,沈红.国家助学贷款违约的影响因素的研究[J].教育科学,2010,10.
[4]耿新.国家助学贷款违约风险控制研究[J].现代教育科学,2012,1.
[5]叶菁菁,吴斌,董敏.P2P网贷个人信用评估[J].财经视线,2015 (31).
[6]李萌.Logit模型在商业银行信用风险评估中的应用研究[J].管理科学,2005,4.
[7]孙清,汪祖杰.Logit模型在小额农贷信用风险识别中的应用[J].南京审计学院学报,2006,8.
[8]庞素琳.Logistic回归模型在信用风险分析中的应用[J].数学的实践与认识,2006,9.
[9]宋荣威.贷款风险度量的Logit模型检验[J].电子科技大学学报,2007,5.
[10]邓晓卫.面板Logit模型在控制权转移影响因素分析中的应用[J].数学的实践与认识,2010,6.
[11]严洁,陈超.基于Logistic的大学生使用信用卡违约影响因素分析[J].学术研究,2010,8.
[12]胡胜,朱新荣.我国上市公司信用风险评估研究[J].中南财经政法大学学报,2011,9.