P2P贷款违约率模型实证研究
——基于人人贷数据
2018-01-11黄文彬缪晓云
黄文彬 缪晓云
(福州大学经济与管理学院, 福建福州 350116)
P2P贷款违约率模型实证研究
——基于人人贷数据
黄文彬 缪晓云
(福州大学经济与管理学院, 福建福州 350116)
P2P网络借贷的信用风险问题日益突出,违约率是量化信用风险的关键参数,因此有效测算违约率的方法和模型显得尤为重要。以人人贷的交易数据为样本,通过Logistic回归确定影响违约的关键因素并构建贷款违约率模型,运用Cox回归分析借款人何时违约并绘制贷款生存曲线,最后构建投资人关心的预期收益模型。实证结果表明, 借款金额、借款利率、还款期限与违约率呈正相关,与贷款生存时间呈负相关。学历、信用评级、信用额度、借款笔数、视频认证、微博认证、学历认证、房产认证、购车证明与违约率呈负相关,与贷款生存时间呈正相关。
二分类Logistic回归; 生存分析; 预期收益
一、引言
目前国内征信体系不完善,互联网信息不对称,导致P2P借贷市场发生违约风险的可能性比较大。而违约对每个P2P参与者都是代价不菲。一方面,违约对投资人和P2P平台会带来很大的损失,既增加了平台运营成本,同时投资人的投资回报也打折扣;另一方面,借款人也要为此付出代价,包括信用评级降低,未来贷款的机会减少等。可见,如何判别借款人的违约情况,关系到投资人的资金安全和投资收益,也直接影响到P2P企业的生存。因此本文关注P2P贷款违约率模型的实证研究。
关于P2P借贷市场的违约问题,国内外学者研究成果丰富:Lin指出信用等级较低的借款人违约风险高。[1]Kumar认为信用等级、借款金额、性别、种族等“硬信息”会决定借款人是否违约。[2]Freedman和Jin以Prosper的贷款为样本,研究发现借款金额、近期信用调查、循环信用使用率、贷款目的、收入、信用历史、FICO分数、信用评级等与违约显著相关。[3]在研究方法上,Serrano-Cinca等以Lending Club的贷款为样本,先用假设检验和生存分析法下的Cox回归确定了解释违约的因素,再用Logistic回归模型来预测贷款违约率。[4]Carmichael将Lending Club的数据作为面板数据使用,用Logistic回归构建违约率模型,并估计了投资收益。[5]Jin和Zhu用数据挖掘(DM)的方法来预测违约率。[6]Vedala和Kumar使用一个多重关系的贝叶斯分类方法来预测违约率。[7]由于我国P2P网贷起步较晚且对外公布的数据不够充分,在违约率方面的实证研究相对较少。而违约行为不限于P2P机构,在金融领域里违约是司空见惯的,其中商业银行的贷款违约较为突出。P2P借贷相当于传统银行的无担保个人信贷。本文不仅回顾了P2P借贷违约相关的文献,也借鉴了一些商业银行贷款违约相关的文献。于立勇比较了分析信用风险的数学工具如判别分析、Logistic 回归分析、主成分分析和神经网络,最终用Logistic 回归模型来研究违约率,定量衡量银行信用风险。[8]钱争鸣指出Probit模型、Logistic模型与生存分析模型等计量经济学模型是目前应用最广泛的违约概率计量方法。[9]武次冰等和白鹏飞等基于生存分析中的Cox比例危险法,对银行借款人未来各时点发生违约的概率进行预测和度量,从而把握借款人的可能违约分布。[10][[11]廖理等认为P2P借款人的一些基本公开信息对预测违约风险有一定帮助。[12]王会娟基于“人人贷”的数据,研究P2P平台的信用认证机制对借贷行为的影响,认为对借贷行为影响较大的是工作认证、收入认证、视频认证和车产、房产认证等认证指标。[13]曾江洪基于拍拍贷数据研究还款阶段借款人违约后还款的主要影响因素。[14]
通过国内外文献的回顾,本文发现由于国外的征信体系比较完善,其P2P平台所披露的借款人信息跟国内的有所差异。虽然这样,但归结起来无外乎这几个方面:借款人基本信息、信用历史信息、借款订单信息以及一些平台特有的信息,或是硬信息和软信息。而国内有关P2P违约率的研究较少,且缺乏全面系统深入的研究。至于研究违约的主要方法和模型,可以看出Logistic 回归作为构建违约率预测模型的方法最合适,另外通过生存分析法来分析违约分布也是一个不错的思路。
本文利用人人贷平台的真实交易数据深入挖掘中国P2P网贷市场的基本统计特征,以及统计特征与贷款违约率存在的相关性,建立贷款违约率评价指标体系。运用二分类Logistic回归,构建违约率预测模型,确定影响违约的关键因素。违约率模型只是判别借款人违约与否,而何时违约也是投资人关心的,所以进一步通过COX回归进行贷款生存分析,绘制贷款生存曲线,确定借款人违约时间。最后,着眼于投资人最关心的收益,基于前文研究结果,构建预期收益模型。
相比已有的研究,本文的创新之处主要体现在三个方面:第一,以定量的方式,全面深入系统地研究P2P贷款违约问题;第二,不仅研究贷款违约率,即判别借款人是否违约,还进一步研究违约率的分布,即借款人何时违约;第三,不但构建违约率预测模型,还构建预期收益模型。为投资人提供判断借款人的信用状况的深层次的分析手段和工具,有助于投资人衡量投资收益和风险,优化投资方案。
二、样本选择与数据描述
(一)研究样本
人人贷平台在行业口碑、用户数、交易量等方面均处于业内领先地位,因此本文以人人贷的真实交易数据为样本,具有代表性和示范意义。本文以信用认证标[15]为研究对象,抓取了人人贷网站2010年10月12日至2015年12月11日期间发布的所有有效借款订单数据,由于只有经历完还款期限才能判定该笔订单是否违约,因此正在还款中的订单予以剔除,共计18507个样本。为保证后续检验模型的预测能力及稳健性,本文将2015年以前的数据划为样本内数据共15222笔订单,2015年以后的数据划为样本外数据共3285笔订单。
本文对违约的定义是当借款人最终未能偿还借款,由平台垫付剩余出借本金,这时人人贷网站上显示该笔订单状态为“已垫付”,这样的订单视为“违约”。
(二)自变量选取与描述性分析
本文依据样本内数据建立违约率模型,接下来从借款订单、借款人信用信息、基本信息和认证信息四个方面,对样本内数据进行描述性分析。
借款订单信息。借款金额在3000—500000元,均值为28441.33元。借款期限可以为3、6、9、12、15、18、24、36个月,其中以12个月最多,占31%,均值为10个月。借款利率在3%—24.4%,均值为13.26%,几乎是银行贷款基准利率的3倍,这也正是P2P成为互联网理财“爆款”的原因之一。
借款人信用信息。主要包括信用评级、借款笔数和信用额度。信用评级从大到小依次为AA、A、B、C、D、E、HR。HR级借款人最多,占比52%。从均值来看,HR级的信用额度最少为48840.02元,AA级的最多为364499.87元。信用评级越高的借款笔数越多,AA级借款笔数是HR级的10倍。另外,结合借款订单信息,本文发现,对于相同的借款金额,信用评级低的往往需要支付更多的利息,且还款期限比较长;而对于不同的借款金额,信用评级高的能够借到的金额往往比信用评级低的来得多。具体的AA级的借款成本最小为11.38%,而HR级的借款利率均值为13.57%,要付出更多的利息代价。AA级的还款期限均值为7个月,HR级的均值为10个月。
借款人基本信息。借款用户年龄分布在30—40岁的最多,最小的为22岁,已婚为主,工作年限以1-3年和5年以上居多,学历主要集中在大专和本科。
借款人认证信息。根据人人贷规定,借款人在申请借款时,需提交认证资料交由平台审核,对于信用认证标,身份认证、信用报告认证、工作认证、收入认证为必要认证,认证通过后才能在平台上申请贷款,因此这四项不在本文的考量范围内。另外的可选认证包括:房产认证、购车证明、手机实名认证、微博认证、视频认证、学历认证等。其中,房产认证和购车证明反映的是借款人的资产状况,需提供相应产权证明。学历认证就是上传借款人的学籍验证。手机实名认证是为了方便贷后管理,平台能及时联络追踪到借款人。微博认证反映的是借款人的社交状况,提供微博账号进行认证。视频认证是上传个人视频。描述分析结果发现视频认证通过的人数最多,占比为42.59%;其次是房产认证和购车证明,分别占34.81%和34.40%;最少的是学历认证和微博认证。可见,在借款用户的心里,学历认证和微博认证较为不重要。
(三)违约率评价指标体系
通过对各影响因素与贷款违约率进行相关性检验,其中连续变量用t检验,离散变量用卡方检验,结果发现除年龄外,其余变量都与贷款违约率存在一定的关系,因此将它们纳入,从而构建一个相对全面的指标体系(见表1)。
表1 指标体系
三、实证结果
(一)贷款违约判定
在研究通过一系列连续型和类别型自变量来预测二值型因变量时,Logistic回归是一个非常有用的工具。通过回顾国内外文献,发现学者大多使用Logistic 回归作为构建违约率预测模型的方法。故本文选用二分类Logistic回归构建违约率模型。
1. 以二分类Logistic回归构建违约率模型
基于上述指标体系,通过二分类Logistic回归,结合AIC信息准则对变量逐步回归,本文剔除了婚姻、工作年限、手机实名认证这三个变量,认为它们对贷款违约率没什么影响,当然为了模型更加严谨,本文用方差膨胀因子检验模型是否存在多重共线性,结果表明模型不存在多重共线性。最佳违约率预测模型如下:
表2 最终变量的Logistic回归结果
注:***、**、*分别表示在0.01、0.05、0.1显著水平下显著。该说明以下表格通用。
根据表2所示的回归结果,总结各因素对违约率的影响大致如下:借款金额越多,当宏观经济波动或借款人收入减少时,违约的可能性越大;借款利率越高,借款成本越高,很可能违约;还款期限越长,增加了还款的不确定性,违约率越大;借款人的学历越高,受教育程度越高,更加重视信用,不太可能违约;借款人的信用评级越高,相应的违约率越小;借款人的信用额度、借款笔数越多,违约率越小;至于认证信息,视频认证、微博认证、房产认证、购车证明、学历认证,通过认证的相比未认证的,违约的可能性小。在逐步回归的过程中发现各因素对贷款违约率的影响按重要程度从大到小依次为信用评级、还款期限、学历、借款金额、视频认证、信用额度、借款利率、借款笔数、学历认证、购车证明、房产认证、微博认证。可见,人人贷的信用评级具有很大的参考价值,降低了借贷双方的信息不对称,同时易被借款人忽视的学历认证在实际交易中投资人还是比较看重的。
2. 预测能力检验
对投资人而言,用违约率预测模型对借款人进行信用评估,其判断准确度非常重要。因此接下来用样本外的数据来检验模型的预测能力。对于模型预测效果的检验,需要确定概率阈值来建立违约判别准则。本文采用先验选择法确定概率阈值,由于样本外违约订单占比为28.34%,故概率阈值为28.34%,当预测的违约率高于28.34%时判为违约借款人,否则为优良借款人。基于上述判别准则对模型预测能力进行检验,结果如表3。
表3 模型的判断准确度验证结果
由表3所示的检验结果看:预测借款人违约、且借款人确实违约的预测准确率为83.73%,预测借款人未违约、但借款人实际违约的预测错判率为12.99%,模型的总体正确率为86.30%。可见,本文所建立的违约率预测模型有着良好的预测能力,能作出较为正确的违约识别。为投资人开展投资行为前的借款人信用评估工作提供了有利依据,投资人可将其应用于投资决策和风险预测中,也有利于平台评定借款人的违约率,尽可能规避风险,强化风控管理。
3. 稳健性检验
稳健性检验的是实证结果是否随着参数设定的改变而改变,如果参数设定改变后模型的系数符号和显著性发生了变化,则说明模型不是稳健的。作为对上文实证结果的稳健性检验,本文首先从数据出发,考虑样本选择是否影响本文的结果,尤其是本文的模型是基于样本内数据构建的,那么将样本范围扩大到全部样本,前面的结果是否依然稳健?其次由于2012年以后,P2P网络借贷进入行业快速发展阶段,各平台P2P网络借贷业务蓬勃发展;同时2012年以后,人人贷借贷平台加强了对借款人风险的控制,如前文所述,开始对借款的利率范围进行了限定,并增强贷前管理,引入了订单预审机制。因此,考虑以2012年作为分界,引入虚拟变量D2012,将2012年以后的数据设定为1,2012年以前的数据设置为0,稳健性结果如表4所示,可以看出,将样本范围扩大至全部样本时,结果依然稳健。引入D2012变量的全样本数据的结果显示,D2012变量未能通过显著性检验,可见借款人的违约行为不受人人贷利率政策变化的影响。借款人不会因为人人贷引入订单预审机制,违约行为就减少,也不会因为借贷平台蓬勃发展后,违约行为就增多。总之,引入D2012变量的全样本,相较于之前的结果,变量系数符号和显著性水平都很稳定,说明本文构建的贷款违约率模型具有很好的稳健性。
表4 稳健性检验
注:模型一针对的是样本内的数据,模型二针对的是全部样本数据,模型三是引入虚拟变量D2012的全部样本数据。
(二)贷款生存分析
由于投资人的利息收入终止于借款人的违约时间,因此投资人除了关心借款人的信用评估结果,还关心借款订单自生成时间到发生违约的时间间隔,即订单的生存时间,或者说订单生存期。而Cox比例风险模型可以同时考虑多种相关因素对生存期的影响,既包含了参数信息,又包含了非参数信息,是一种多因素生存分析的方法;该模型可以分析带有删失数据(删失数据是指观察期结束而观测样本还没有发生感兴趣的特定时间,这样就会造成数据信息的缺失)的生存分析资料。这些优良性质使得该模型具有有效性和广泛的适用性,故接下来使用Cox回归对贷款进行生存分析。首先确定观察期,由于人人贷订单的还款期限以12个月最多,故观察期确定为12个月,选择样本内还款期限为12个月的订单进行Cox回归。
1. 贷款生存时间的Cox回归结果
Cox回归的自变量沿用违约率模型的自变量,其中由于只考虑还款期限为12个月的订单样本,因此原本纳入回归的还款期限变量变成了常数,应予以剔除。表5展示了12个月期限贷款样本的生存分析结果。表格显示了Cox回归系数、标准差、伴随概率p值、危险比。Cox回归是用危险度作为因变量,回归系数的正负直接反映出该变量对于生存风险的效应方向。RR用来解释在其他条件不变的情况下,该变量每增加一单位风险度改变多少倍。一般RR>1时,倍数越大,表示贷款生存时间越短,违约时间越早;RR<1时,则反之。
从Cox回归结果本文可以得到以下结论:从p值来看,在10%的显著性水平下所有变量均通过显著性检验,说明所有变量与贷款生存期的长短有关系。从回归系数来看,借款利率、借款金额的回归系数为正,是危险因素,因此借款利率或借款金额增加,贷款的生存时间越短,借款人在还款期限内较早违约;信用评级、学历、借款笔数和信用额度的回归系数为负,是保护因素,这些变量的增加会降低贷款的生存风险。借款人有进行学历、微博、房产、购车或视频认证的,比没进行认证的发生违约的时间晚或不违约。另外比较各回归系数的绝对值大小,可以看出各因素对贷款生存期长短的相对重要性,从大到小依次为信用评级、借款金额、学历认证、视频认证、微博认证、购车证明、学历、房产认证、信用额度、借款笔数、借款利率。最后对比几项认证的危险比,可以看出有利于生存时间的认证从大到小排序为学历认证、视频认证、微博认证、购车证明、房产认证。
表5 12个月期限贷款的Cox回归结果
2. 贷款生存曲线
通过上文的Cox回归,进一步绘制贷款生存曲线。图1为一年期贷款的生存曲线,呈单调递减,即订单生成时借款人违约率为0,而越临近还款日,其违约的可能性越大,因此对于P2P平台而言,临近还款日要尤其注意借款人的还款表现,及时做好催收提醒工作。
图1 一年期借款订单的生存曲线
另外本文发现,无论是预测违约率的Logistic回归结果还是预测违约时间的Cox回归结果,排在
首位的影响因素都是信用评级,因此本文绘制了不同信用评级的贷款在还款期内的生存曲线,如图2所示。显然AA级的贷款在还款期限内,生存率为100%,也就是AA级的借款人在还款期内不发生违约,相反HR级的生存率在还款期限内越来越小,最小达到77%左右,即违约率高达23%。
图2 一年期不同信用评级借款订单的生存曲线的比较
(三)预期收益模型构建
对投资人而言,投资给借款人所需金额,在投资期内每月获得本息收入,他们最关心的是投资收益。因此,很有必要构建预期收益模型。一般来说,一笔贷款,借款人要么按时还款,要么违约,要么提前还款。单独构建违约率模型是不足以估计投资收益的,还需构建提前还款率模型。
1. 提前还款率模型
实际交易中,借款人通常因个人因素(如资金的宽裕程度等)或因客观因素(如各P2P网络借贷平台贷款利率的差异等造成转其他平台贷款)而提前还款。本文分析的提前还款的定义,指的是在某一期提前偿还剩余全部借款本金,那么下一期该笔贷款将不复存在。人人贷平台实际交易中的提前还款也是如此。
为了保持整个研究的一致性和连贯性,沿用构建贷款违约率模型的样本数据、自变量和方法来构建提前还款率模型。其中,未提前还款赋值为0,提前还款赋值为1。表6是Logistic回归结果。
本文将每个借款人提供的各项信息代入模型中,计算借款人的提前还款概率。
表6 提前还款率模型的Logistic回归结果
根据回归结果,各因素对贷款提前还款率的影响如下:借款金额、学历、信用评级、信用额度、微博认证、学历认证等变量的系数与违约率模型的系数方向相反。即,借款金额越多,借款人资金需求大,往往不会提前还款;学历越高,理财观念越强,对比后续的利息支出和提前还款的罚金,往往选择提前还款;信用评级越高,还款意愿和能力越强,提前还款的概率越大;信用额度越多,资金周转速度快,提前还款的可能性大。其他变量,如借款利率、还款期限、借款笔数、房产认证、购车证明的回归系数方向与违约率回归结果相同。也就是说,借款利率越高,则要支付的利息成本越高,提前还款可以减少贷款成本;还款期限越长,筹集还款的时间越充裕,提前还款可能性越大;累计借款笔数越多,资金周转率越高,提前还款率越大。另外,个人视频对提前还款没有太大影响。
2. 预期收益模型
本文用最常用的复利方式来估计投资人的预期收益。投资人的预期收益是所有预期未来投资额的价值带来的收益,按月间断复利计算:
Returns=A(1+i)N=AR
其中,Returns为终值(这里要估计的预期投资收益),A为投资本金,i为月利率,N为投资期限(月),R为预期投资收益率。
出现提前还款时,人人贷要求借款人额外支付1%的违约金给投资者。发生违约时,人人贷保障投资者的本金部分。预期收益估计步骤如下:
步骤一:计算第1—第(N-1)月每个月的预期投资收益率为:
Rt=pt[pearly,t1.01(1+i)t+pdefault,t(1+i)t]
其中,t=1,2,…,N-1,表示第1个月、第2个月,…,第N-1个月;i为月利率。pdefault,t和pearly,t分别是贷款在第t个月的违约率和提前还款率,可以通过本文构建的贷款违约率模型和提前还款率模型得到。pt是第t个月该笔贷款是否还存在的概率pt=pt-1[1-(pearly,t-1+pdefault,t-1)],其中p1=1,因为t=1时,该笔贷款必然存在。p2=p1[1-(pearly,1+pdefault,1)]=1-pearly,1-pdefault,1,表示t=2时,该笔贷款订单仍存在的概率为前一期排除提前还款和违约的概率。依次迭代。
步骤二:计算最后一个月(即第N月)的预期投资收益率,由于最后一个月不存在提前还款pearly,N=0,所以第N月预期投资收益率为:
步骤三:计算投资的预期收益:
步骤四:计算投资回报率:
投资回报率也就是投资到期,投资人在投资的本金基础上,额外获得收益的比率。
3. 模型预测能力检验
为了检验所构建的预期收益模型的预测效果,基于模型,本文计算了全部样本每一笔贷款的预期投资回报率。另外按信用评级、年份和还款期限三个维度,分别比较预期投资回报率和实际投资回报率,如图3所示。
图3 按信用评级比较预期投资回报率和实际投资回报率
不同信用评级订单的预期值和实际值差异也是在0.01范围内。B、C和D评级的订单投资回报率最高,其次是E和HR评级的,而AA和A评级的订单投资回报率最低。因为,信用评级越高(AA和A)的借款人往往需要支付的利息成本越低,对投资者而言收到的利息收入越少,则投资回报率低;而信用评级越低的借款人需要支付的利息成本越高,但他们违约的可能性更大,意味着高收益和高风险并存。从中本文获得可供投资者做投资决策参考的建议:选择投资于B、C、D评级的借款人,这类借款人支付的利息成本居中,违约的风险也居中,综合来看投资回报率最高。
图4 按年份比较预期投资回报率和实际投资回报率
由于人人贷是2010年10月份成立的,2010年的订单数据只有89笔,占比仅0.48%,不具有比较意义,因此这里只选取2011年至2015年的样本进行实际平均投资回报率和预期投资回报率的比较(见图4)。总体上,预期值在实际值上下波动,差异控制在0.01范围。同时发现两者都在2012年达到最大值,可能是2012年是P2P爆发期,交易量骤增,加上2012年人人贷实施利率新规,从原来的不设定利率下限改为设定利率范围,相当于提高了利率下限,投资回报率也自然提高。而2015年下降幅度较大,可能是2015年各大P2P平台涌现,P2P市场份额被瓜分,各平台收益率总体下降,同时2015年国家加强了对P2P平台的监管力度,也使得投资回报率有所下降。
因为15个月、18个月、24个月和36个月的订单,占全部样本量的比重很小,分别为0.4%,2.2%,6.9%,1.8%,不具有比较意义,因此只选取3个月、6个月、9个月、12个月的订单进行实际平均投资回报率和预期平均投资回报率的比较。可以看出,预期收益模型对于3-12个月期限的订单有着很好的预测能力(见图5)。另外本文发现,还款期限越长,实际平均投资回报率越高,最高为0.07;反之则越低,最低为0.02。进而,本文可以得出供投资者参考的建议:对于激进的投资者可以选择还款期限较长的订单,但须忍受还款期限长所带来的借款人还款行为的不确定性;对于相对保守的投资者,可以选择还款期限较短的订单,投资回报率虽相对小,但资金回笼比较快。
图5 按还款期限比较预期投资回报率和实际投资回报率
通过以上三个维度比较预期平均投资回报率和实际平均投资回报率的结果,可以看出所构建的预期收益模型有良好的预测能力。
四、结论与建议
本文从多个角度,以多种方法分析了贷款违约问题:从研究借款人是否违约的违约率模型,再到何时违约的贷款生存分析,直至最后的估计预期收益,达到了本文研究的初衷。本文得出了一些结论,概括起来主要包括这四个方面:一是P2P借款人和借款订单的基本特征;二是影响违约行为和违约时间的关键因素;三是判别借款人提前还款与否的依据;四是估计预期收益的方法。
在实证研究的过程中,本文总结了一些有利于借款人获得贷款机会,有助于投资者优化投资方案,有益于P2P平台完善风险控制和管理的参考建议:对于借款人,要尤其重视自己的信用评级,信用评级越高,投资人往往更加青睐,同时不可忽视学历认证,在实际交易中投资人还是比较看重的,借款人应当积极提交学历认证的相关审核资料。对于投资人,在是否投资某一借款订单时,应当综合考虑借款人的借款金额、借款利率、还款期限、学历、信用评级、借款笔数、信用额度以及四项(学历、微博、视频、房产、车产)认证情况。风险偏好型的投资人,可以选择还款期限长的订单;而风险规避型的投资人则比较适合还款期限短的订单。另外投资者可以优先考虑信用评级为B、C、D的订单,投资回报率往往最高。对于平台风控,在临近还款日时要尤其注意借款人的还款表现,及时做好应对。
注释:
[1] Lin M.,Peer-to-peerlending:Anempiricalstudy,Americas Conference on Information Systems (AMCIS),2009.
[2] Kumar S.,Bankofone:Empiricalanalysisofpeer-to-peerfinancialmarketplaces, Americas Conference on Information Systems (AMCIS), 2007,p.305.
[3] Freedman S. M., Jin G. Z.,“Learning by Doing with Asymmetric Information: evidence from Prosper. com”,NberWorkingPapers, 2011 ,pp.203-212.
[4] Serrano-Cinca C., Gutiérrez-Nieto B., López-Palacios L.,“Determinants of Default in P2P Lending”,PlosOne,vol.10,no.10(2015).
[5] Carmichael D.,ModelingDefaultforPeer-to-PeerLoans,Available at SSRN 2529240, 2014.
[6] Jin Y., Zhu Y.,AData-DrivenApproachtoPredictDefaultRiskofLoanforOnlinePeer-to-Peer(P2P)Lending, 2015 Fifth International Conference on, IEEE, 2015,pp. 609-613.
[7] Vedala R., Kumar B. R.,AnapplicationofNaiveBayesclassificationforcreditscoringine-lendingplatform,2012 International Conference on, IEEE, 2012,pp. 81-84.
[8] 于立勇、詹捷辉:《基于Logistic回归分析的违约概率预测研究》,《财经研究》2004年第9期。
[9] 钱争鸣、李海波、于艳萍:《个人住房按揭贷款违约风险研究》,《经济研究》2010年增刊。
[10] 武次冰、易 宇、武锶芪:《贷款违约概率测算方法:违约比例模型》,《统计与决策》2010年第6期。
[11] 白鹏飞、段倩倩、李金林:《房信贷风险度量——基于生存分析方法》,《北京理工大学学报》(社会科学版)2012年第4期。
[12] 廖 理、李梦然、王正位:《聪明的投资人:非完全市场化利率与风险识别——来自P2P网络借贷的证据》,《经济研究》2014年第7期。
[13] 王会娟、廖 理:《中国P2P网络借贷平台信用认证机制研究——来自“人人贷”的经验证据》,《中国工业经济》2014年第4期。
[14] 曾江洪、李文瀚、陈玺慧:《P2P借款的损失能挽回吗?——基于拍拍贷的实证研究》,《科研管理》2016年第8期。
[15] 人人贷的借贷有三种标的:信用认证标、实地认证标和机构担保标,由于违约只分布在信用认证标,故本文以信用认证标为研究对象。
2017-04-21
福建省社科项目“P2P网络借贷中投资行为及其影响因素研究”(FJ2016B176)
黄文彬, 女, 福建闽清人, 福州大学经济与管理学院副教授,博士;
缪晓云, 女, 福建福安人, 福州大学经济与管理学院硕士研究生。
F830
A
1002-3321(2017)06-0051-08
黄艳林]