基于逻辑回归的P2P网贷信用风险评估研究
——以微贷网为例
2018-10-12李淑锦詹子涵
李淑锦,詹子涵
(杭州电子科技大学 经济学院,浙江 杭州 310018)
一、引言及文献综述
随着金融创新的不断深化,互联网金融在我国开始迅速发展,P2P网贷发展尤其迅猛。根据网贷之家的数据显示,2016年 P2P网贷平台的全年累计交易量20 636.26亿元,而到2017年,全年历史累计成交量迅速上升到28 048.49亿元,增幅35.92%。与此同时,各种问题及风险也相继而来,如融资成本偏高、借款者跑路、非法集资、各种违约现象等。据网贷之家数据显示,截止2017年12月,P2P网贷平台累计数量5 970个,其中累积问题平台数量高达4 039个,占67.65%。借款者违约是造成平台经营出现困难主要原因之一,因此完善P2P网贷平台上个人借款者的信用风险评估问题已成为当务之急。
国内外学者对借款者的信用风险的研究成果丰富,特别是引入了大量的信用风险评估模型。Ohlson(1980)[1]首次利用 Logistic回归来搭建信用分类模型,分类效果明显。Dinh和Kleimeier(2007)[2]的研究结果表明,Logistic模型是传统信用风险研究中预测精度最高的模型,具备很强的稳健性。国内,郑昱(2009)[3]应用 Probit模型对传统借贷中的个人信用风险进行评估。廖理等(2014)[4]利用Probit模型实证研究,指出非完全市场化利率部分地反映了借款人的违约风险,但是仍有相当高比例的违约风险并未能够被反应在利率中。周光伟(2009)[5],利用5C分析法评价个人信贷风险,指出评判结果会受到外界的因素和个人情感因素的影响而出现较大偏差。杨秀云等(2016)[6]使用KMV模型来评估上市企业的信用风险,会出现违约概率不符合实际,说明KMV模型识别其信用状况的能力一般。刘小丽(2011)[7]指出Credit Risk+适用于银行对零售客户的信用风险的度量,只需违约概率、违约损失率和风险暴露等风险因子,适合目前我国数据缺乏的现状。也有学者将信用风险评估模型应用于P2P网贷平台借款者的信用风险评估中,如李淑锦、吕靖强(2016)[8]采用 BP神经网络模型进行P2P网贷信用风险评估,提升了数字化技术在这方面的运用。
关于P2P网货平台借款者的信用风险问题,学者们集中于研究借款者违约概率及借款成功率的影响因素,如 Herzenstein等(2008)[9]研究美国P2P网贷平台prosper 2016年数据得出借款者特征会直接影响借款成功概率,且这些指标不同于传统金融机构评价指标。Lin(2013)[10]在研究社会网络对借款成功率的影响时发现,经专业认证、朋友较多并存在活跃的社交会对借款起到促进作用。Gonzalez等(2014)[11]通过学术实验得出年轻人的违约概率较高,且可获得的金额也相对较少。Emekter(2015)[12]指出在评估 P2P网贷违约风险中,信用等级的高低与违约概率的高低是成负相关的,等级越高的人发生违约的概率越低。此外还存在一些非认证信息,Herzenstein等(2011)[13]研究发现借款说明越为详细的借款者实际上违约概率会越高。郭弈(2011)提出了成功获得贷款的影响因素和与贷款成功率相关的一系列指标。张钰敏(2014)[14]使用拍拍贷数据进行实证研究,发现个人信息、担保信息、借款标的信息,对借款的成功率和借款利率均有显著性影响。
根据以上分析,结合微贷网的数据的特点,本文选择logistic回归模型对平台的个人借款者信用风险进行评估。首先建立适用于该平台的个人借款者的信用风险评估指标并对其量化,然后利用Logistic信用风险评估模型预测借款者的违约概率,从而准确评估借款者的信用风险。本文的创新点主要体现在信用风险的指标选择上,这不同于传统的个人借款者的信用风险评估指标,结合微贷网平台的特点,将传统借款人信息与平台特色有机结合,个性鲜明,指标独特。同时利用logistic回归模型来评估微贷网上个人借款者的信贷风险,更为合理地确定违约阈值,提升模型评估信用风险的准确率。
二、微贷网个人借款者信用风险的指标选择
传统商业银行在企业的信用风险评估指标的建立方面做了许多研究,部分学者也研究了个人信用风险评估指标,比较统一的结论为性别、学历、年龄、收入、职业、属地等指标对个人小额贷款还款能力的影响显著。廖理和张伟强(2017)[15]针对 P2P平台借款人信息价值的实证研究表明,凡是信息都是有价值的,无论借款人的个人特征、财务状况,还是社会关系都有助于评估借款人的信用。但微贷网这一P2P网贷平台特色明显,是中国首家专注于汽车抵押借贷服务的互联网金融P2P网贷平台,网站有自己的门店来审核借款者提供抵押的汽车信息。如果刻板套用传统信用风险指标,势必会引起对借款人还款能力的误断。
因此本文参考商业银行的指标体系,并结合网站特色初步选择5个个人信息指标(性别、年龄、婚姻状况、籍贯、身份证件)、5个抵押物信息指标(车辆型号、购买价格、抵押估价、行驶公里、车牌号)、5个安全审核指标(驾驶证、行驶证、汽车抵押合同、车辆保单、车辆登记证书)、3个平台借贷信息指标(历史还清期数、待还期数、历史逾期次数),共计18个具体指标作为微贷网个人借款者的信用风险评估指标体系。
指标初选平台可提取且符合一般性风险评估架构的指标,但存在一些冗余指标,还需要逐步筛选。身份证件是所有借款者都提供的,因此舍弃身份证件指标;籍贯指标半数以上借款者未写明,同样舍弃。对于抵押物信息,车辆型号与购买价格都是展现借款者的购买力,笔者从中选择了购买价格作为评估指标;车牌与信用风险相关性不强,舍去。对于安全审核指标,网站显示均已审核通过,且该列信息对于所有借款者几乎是相同的,故舍弃。最终保留8个信用风险评估指标,分别为3个个人信息指标(性别、年龄、婚姻状况)、2个抵押物信息指标(购买价格、行驶公里)、3个平台借贷信息指标(历史还清期数、待还期数、历史逾期次数)。
下面进行指标赋值。对于借款人的特征,赵旭等(2016)实证研究发现,男性逾期可能性高于女性,而且男性借款通过率为女性的60%,因此本文将男性赋值1,女性赋值0。年龄在20岁以下的借款人,一般是无收入或低收入人群;21~29岁的群体,处于事业发展期,收入相对低且发展较不稳定;55岁以上人群面临退休,退休补贴虽稳定但金额低;其余30~55岁人群经济状况最为优异,因此将 18~20 岁赋值为 2,21~29 岁、55 岁以上均为1,30~55岁为0。婚姻状况为已婚和未婚两种,已婚借款者具备收入双来源,将未婚人群赋值为1,已婚人群赋值为0。对于微贷网抵押物特征,车辆价格根据车辆定位不同而存在差异,家庭代步车市场定价为15万元以下,商务人士中高档用车定价约在15万~40万元左右,40万元以上属高档轿车行列,车辆购买价格越高违约概率越小,故依次分别赋值为2,1,0。车辆行驶公里数也能反映抵押物价值,公里数越大使用价值越低,非专用车辆一年的行程数是1.5万公里左右,因此笔者将4.5万公里以内车辆借款人赋值为2,4.5万公里~9万公里赋值为1,9万公里以上赋值为0。对于历史还清次数和待还清借款数若仅考虑次数显然不合理,会出现如借款三次守约两次的借款人信用度等于借款五十次守约仅两次的借款人的情况,故笔者将根据指标占借款总次数的百分比进行赋值。对于历史还清次数,根据在借款总次数中的占比进行赋值,还清概率在80%以上的赋值为0,60%~80%赋值为1,60%以下的赋值为2。对于待还清数做同样的处理,待还清率在20%以下的赋值为0,20%~40%的赋值为1,40%以上的赋值为0。历史逾期数则有所不同,次数比比率更能说明诚信度,从未违约说明信用度最高且意义不同,因此从未违约的借款人赋值为0,违约5次以下的赋值为1,5次及以上的赋值为2。
三、模型选择
专家评分法和特征分析法等传统信用风险分析法,方法虽简单易操作,但易受专家个人因素影响且运行成本也较高,不适用P2P网贷平台。判别分析法有较多的局限,需要满足比较严苛的条件;神经网络模型则实现的步骤较为复杂,Probit模型需满足正态分布条件。因此本文选用Logistic回归模型对微贷网的个人借款者的信用风险进行评估。
Logistic回归与多重线性回归同属于广义线性模型,但是两者的区别在于因变量不同:使用多重线性回归模型时,其因变量是连续的;使用Logistic回归模型时,它的因变量却是二分类的。
Logistic回归方程:
若式(1)中的 f(xi1,xi2,…,xip)为多元线性函数,则上述模型可写成:
在进行参数估计时,先做变换:
对于Logistic回归,取对数得到:
采用极大似然法来估计Logistic回归系数,利用式(3)计算 πi。
Logistic回归模型有很多优点,首先模型对于预测变量没有特定的要求,自变量不管是连续还是离散,亦或是虚拟变量,都不需要假设正态分布。其次是模型的线性形式,保证概率值在有意义的区间内取值。最后一点最为关键,因变量是一个二分类变量,这个变量只能选取0或1两个值,分别代表某个事件没有发生或是发生,适合于判别借款人是否违约。
四、数据来源与实证分析
(一)数据来源
本文通过爬虫程序从微贷网网站上获取已完成的借款散标数据共19 346笔,其中逾期的共有1 017笔,无数据缺失。由于原始数据中违约借款笔数远少于未违约笔数,样本间存在的高度数据不对称现象会影响预测精度。Weiss等(2003)[16]已研究证实模型时并不一定需要自然分布的数据,因此笔者选用“减少多数法”对样本数据进行平衡处理,最终抓取了2 570个有效样本,其中有1 017个逾期样本。关于样本的描述性统计分析如表1所示。
从表1看出,微贷网平台的借款者绝大多数为已婚男性,年龄跨度大,以35岁左右的成熟青年男性居多。在抵押车辆方面,车辆大多为家用代步车型,中位数为17万元,但受极端值影响平均数偏高,说明车辆价格跨度大。从平台借贷者的借贷历史信息反应出平台借款人都具有多次借款经历,仅少数为P2P网贷“新手”,说明了P2P借款方式在我国十分受借款者青睐。
表1 样本数据描述
(二)实证分析
本文将2 570个有效样本随机抽样分为训练样本和测试样本,其中训练样本包括2 318个样本,其中917逾期样本;252个样本作为测试样本来验证模型的训练效果,其中逾期样本是100个。使用Logistic模型进行信用风险评估,先进行主成分分析法对数据降维,数据预处理完成后利用训练样本进行Logistic回归,估计出模型中的β系数构建模型,然后将待检验的测试样本代入模型中计算违约概率,分析模型的准确率。
首先对数据进行预处理,此次实证的指标数据大且数据之间存在一定相关性,因子分析法能够更加高效便捷的分析问题,在保留数据绝大多数信息的情况下,消除数据间的相关性,使结果解释性更强。将性别(X1)、年龄(X2)、婚姻状况(X3)、购买金额(X4)、行驶公里(X5)、历史还清次数(X6)、待还次数(X7)、历史逾期期数(X8)作为输入变量,通过因子分析进行降维。运用SPSS软件进行KMO和Barlett检验,结果如表2所示。
表2 样本的KMO和Barlett检验
表2的结果表明,KMO度量为0.469,因经济学领域KMO度量标准低于其他科学领域,且检验P值在0.05的检验标准之下,可以进行主成分分析降维。
然后进行因子分析。提取特征值大于1的主成分,累计方差为70.01%,解释效果较好。分析得到以下4个主成分如表3所示。
表3 成分矩阵
由表3所示,主成分Y1中历史还清期数、待还次数系数较高,命名为信贷因子;Y2中婚姻状况、年龄权重、行驶公里数较高,因此命名为个人因子;Y3中性别、车辆购买价格,命名为社会因子,Y4中历史违约次数系数最为显著,命名为诚信因子。
最后,本文选取以上四个主成分因子Y1、Y2、Y3和Y4作为解释变量,借款者违约概率P作为被解释变量构建Logistic回归模型。P是虚拟的二分类变量,逾期违约的记为1,无违约的记为0。通过训练集的数据建立的Logistic回归模型如表4所示。
表4 Logistic回归模型
根据所得的数据可知,这四个主成分的P值都是在5%的置信水平下显著的,因此将以上主要成分代入Logistic回归模型得到的评估模型为:
Y1、Y3、Y4符号为正,Y2为负,其中 Y1为信贷因子,所反映的变量为历史还清期数、待还次数,说明借款者的历史借款情况正向影响着借款者本次借款是否会逾期,历史还清次数占比大、待还清次数占比小,违约率低。Y3为社会因子,反映的变量是性别和车辆购买价格,这两个指标与借款者本次是否违约同向变动,与之前的预期相符,车辆购置价格越高,违约率较低,同时女性的违约率低于男性。Y4为诚信因子,在八个自变量中历史违约次数的相关性特别显著,因此Y4基本就反应了借款者的历史违约情况,同时,Y4在四个变量中的系数也最大,也就说明历史违约次数在本次模型中是反映借款者是否违约的最强影响因素。Y2为社会因子,所反映的变量为年龄、婚姻状况、历史里程数,之所以取名为社会因子,是因为年龄和婚姻状况等能够反应借款人正处在何种人生阶段,说明其社会性质。其中历史里程数对Y2是反向影响,历史里程数越大,车辆的使用价值和变现价值越低,更有甚者所持有车辆里程数太高已经不存在实际的使用价值,存在利用车辆套现的可能,由此借款人的违约率也就越大。而年龄和婚姻状况对Y2的影响是正向的,与既定预期相反。已婚借款人违约率高于未婚借款者,成熟中青年的违约率高于青年和老年人。我们往往认为成年人和已婚人士有工作薪酬和家庭作为保障,同时他们也正处于人生中各方面压力较大的阶段,因此资金需求也更大,可能导致资金周转困难而产生违约行为,但与此同时也不排除借款者伪造信息的情况。
(三)预测结果
用剩余的230组测试样本对建立的模型(6)进行测试,部分结果未高度二分化。图1为预测样本预测值分布图,预测值为0的更加集中,1则较为散乱,说明正确识别出违约者更为困难。
图1 预测样本预测值分布图
笔者还注意到,数据回归所使用的SPSS 22在对训练样本进行Logistic回归时,软件默认阈值为0.5,即将回归结果小于0.5判断为不违约,大于0.5的判断为违约,这一阈值往往用于心理学、工科等议题研究判断,对于经济学问题显然是不适用的,且P2P网贷的信用风险判断也不同于传统金融,阈值还需进一步确定。
根据回归系数对训练样本进行计算,阈值在0.5时训练样本的回归结果与其实际情况相比较,判别准确率为85.98%;阈值为0.3时,86.41%。结果显示当阈值设定为0.375时,利用模型计算得出的结果与实际违约情况最为接近,因此选定0.375为测试样本的阈值。这也说明了P2P网贷的风险是远高于传统金融借贷的,对于平台和贷款人而言,减少第二类错误才能使得其投资者不受损失。故阈值低于0.5合理,并且能较好规避实际违约但模型判断错误的情况。
表5 实证的预测结果
基于以上分析,文章将测试样本的阈值设为0.375,得出的预测精度为90.43%,第二类错误仅为0.43%,结果十分令人满意。其中第二类型的错误表示有违约风险的不良借款人被识别为没有违约风险的优良借款人,显然对于平台和投资者而言,第二类错误发生产生的后果所带来的损害会远大于第一类错误,因此对第二类错误的准确率要求应更高,才能具备优质的违约风险识别能力。
综上所述,Logistic模型在微贷网平台个人借款者的信用风险评估中,评估结果令人满意,并且该模型回归得出的经济意义,与文献中相关文献所提及的结论一致,进一步的证明了本文选取的评估指标的合理。微贷网上的借款者信息中,性别、年龄、婚姻状况、购买价格、行驶公里、历史还清期数和待还期这8个指标成为了构建Logistic模型的重要指标,同时Logistic模型回归结果为微贷网平台的借款者信用风险评估提供了参考,减小了投资者的投资风险。
五、结论
本文在阅读大量个人借款者信用风险评估的文献以及对相关理论进行分析后,确定使用Logistic模型对微贷网的个人借款者信用风险进行评估,建立合适的评估指标,预测其违约概率。
从平台数据来看,P2P网贷市场存在十分严重的逆向选择现象。第四部分的数据不难发现,网贷平台借款者多数为已婚男性,且在2 570个样本中,逾期违约一次及以上的借款者占比约为20%,这也使得P2P网贷成为“高风险”的代名词。还有一个问题不难发现,自变量间的累积方差较小,这说明之间的关联性不强,也就是借款人违约的因素很多,独立性高,平台和投资者有一定的风险评估难度。追本溯源,是平台信息披露缺乏完整性,一方面市场没有强制的披露机制,另一方面,网站平台为了吸引投资者也将信息进行美化处理。
本文得到的结果显示,男性的违约率大于女性,车辆购置价格越高、车辆历史里程数小、历史还清次数占比大、待还次数占比小、历史违约次数少,对应的违约概率低,符合既定认知。而年龄、婚姻状况回归结果虽与认知相反,但都得到了合理的解释。从评估模型来看,Logistic模型在P2P网贷借款者信用风险评估中预测准确率高且操作方便,十分值得实务界运用。同时P2P网贷平台的风险高于传统金融借贷机构,使用Logistic模型判断时更要注意阈值的设定,规避由此引发的模型判断失误而导致的资金损失。