P2P网贷违约人是否具有区域性特征
2019-04-17吴楠
吴楠
摘 要 借助网络爬虫技术手段获取“人人贷”平台上借款人的各项信息,提取两个样本:分为全国随机样本和湖南省随机样本,构建二元Logit回归模型,分析其中对违约率有显著影响的变量.研究表明,负债收入比、借款期限、学历、房产、房贷、描述指数对违约行为有负向影响,而借款利率、车产、认证个数对借款者违约行为有正向影响.同时,通过对两个样本最终回归模型的比较,发现湖南省违约人特征与全国随机样本中体现的违约人特征基本一致,但其中较为特殊的是,在湖南拥有房产和车产不能作为网络借款人履约能力提升的标志.
关键词 P2P网络借贷平台;地域特点;违约人特征
中图分类号 F832.4文献标识码 A
Abstract This paper obtains the information of the borrowers on the "renrendai"net loan platform with the help of the web crawler technology, and extracts two samples: the random samples of the whole country and the random samples of Hunan province. A binary Logit regression model is built to analyze the variables which have significant influence on the default rate. The study shows that the debt-to-income ratio, the maturity of the loan, the educational background, the property, the mortgage and the description index have a negative impact on the default behavior, while the interest rate of the loan, owning cars and the number of certification have a positive impact on the default behavior of the borrowers.At the same time, through the comparison of the final regression model of two samples, it is found that the characteristics of the defaulters in Hunan province is basically consistent with the random samples of the whole country, but especially, the ownership of real estate and car can not help to improve the performance of network borrowers in Hunan.
Key words P2P net loan platform;regional characteristics;characteristics of defaulter
1 引 言
P2P网贷平台在短短十几年内从萌芽到兴盛至较稳定的发展获得了金融界内外足够的关注度.尤其在中国,从2013年至今,P2P平台由最高峰时期的六千多家,此间经历的起伏既是行业发展的全景图,也是新金融不断演进的一个侧面反映.针对P2P的研究在最近几年可谓多角度、多层次、全方位展开,课题组从2015年开始专门针对湖南省内的网贷平台进行研究,取得了一些成果,而随着研究的深入,和更多机构人员的参与,网贷违约人的特点开始逐渐进入课题组视野.
相较于正规金融的高门槛、严监管,P2P网贷平台因其审核简单,授信要求低成为许多被正规金融拒绝的借款人首选,因此网贷平台违约率偏高也是在意料之中.而平台投资人由于只能看到借款人发布的信息,缺乏其他手段判断对方的实际信用,很难规避因真实信息不对称带来的逆向选择和道德风险.而我国目前P2P行业内征信体系不完善,也不能接入正规金融的征信系统当中,加之整体征信环境尚待成熟,在这种缺乏完善违约风险管控技术的背景中,用技术手段对借款者表现特征进行分析进而判断违约概率是很有必要的.因此,课题组吸取了多个研究文献和研究团队的经验,结合湖南省实际,选取对违约率有可能有影响的借款信息要素,构建二元Logit回归模型,分析了其中有显著影响的违约人特征信息,并通过省域样本和全国样本的结果比照,得出湖南省网贷违约人区别于全国样本的特点,对区域内网贷使用人信用评价有一定的启示作用.
2 文献综述
国外学者对网贷违约人问题研究起步比较早,几乎伴随lending club和prosper两大P2P平台上线就开始关注这一群体特征.Kumar(2007)指出借款额度与借款者违约率正相关,而信用级别和认证信息与借款者违约率负相关[1].Herzenstein等(2011)以Prosper上的借款申请为样本,归纳了“可靠”、“成功”、“经济困难”、“宗教信仰”、“品德高尚”、“勤奋”等6个语言维度,发现信用级别低的借款人会倾向于用更多的描述性信息,而实际中确实描述性信息越多越容易借款成功,但结果确是违约率更高[2].Pope等(2011)通过对违约人年龄分布发现35~60岁之间的人违约概率相比其他年龄段更低[3].Duarte 等 (2012)全面分析了容貌對 P2P 网络借贷交易的影响.通过对网贷平台上上传借款者照片的信息进行研究,他们发现从照片上看起来比较可靠的人具有更高的借款成功率.进一步发现,长相可靠的人信用评级比较高,违约的可能性也比较低[4].Nowak等(2015)等通过实证分析指出收入越高的人,违约概率也越低[5].
国内研究者对P2P平台的研究早期侧重在平台模式、平台风险以及投资人选择模式等角度,从2013年开始有较多学者开始关注网贷违约人特征.陈霄等(2013)在对 P2P 网络借贷参与者逾期行为理论分析的基础上,采用 Logit回归分析得出结果:借款方信用等级、个人收入、居住地区、生活状况、成功借款次数和按时还款次数对借款方逾期率具有显著的负向作用;受教育年限、逾期还款次数、借款利率、借款时间等对借款人逾期率具有显著的正向作用.缪莲英和陈金龙(2014)以推荐信任与小组关系、朋友关系作为社会资本的代理变量分析其对借款者违约风险的制约机制[6],以 Prosper 网络借贷平台的数据进行实证检验,研究发现在 P2P 网络借贷中,社会资本能够降低借款人违约风险.王会娟和廖理(2014)以53653个“人人贷”的网站数据,研究 P2P 网络借贷平台的信用认证机制对借贷行为的影响,结果表明,较高信用评级会提高借款成功率[7].文章也详细分析了认证指标和认证方式对 P2P 借贷行为的影响.他们指出,工作认证 、收入认证、视频认证和车产、房产认证等认证指标对 P2P 借贷行为的影响较为显著.不仅如此,实证结果表明“人人贷”的信用认证可以起到提示信用风险的作用,进而降低了借贷双方信息不对称程度.文章也指出评级指标过于单一,这使得其风险提示作用有限.廖理等(2014)运用 6453 个来源于人人贷的有效订单验证实了我国互联网金融存在地区偏好性歧视现象,即地区差异对订单成功率有影响,对违约率没有影响,并指出这是一种非理性的歧视[8].顾慧莹等(2015)对WDW车贷平台的数据做研究,找到了借款人违约的关键因素,指出软信息更能体现借款动机和偿还意愿,平台信用评级和违约率存在显著负相关[9].王重润等(2016)以“红岭创投”的交易数据中选取了借款人相关的9个特征因素,用Logit分析表明,借款利率、期限、用途、提前还款次数和逾期还款次数对借款者违约行为有显著正向影响,而借款金额、信用积分、户口所在地和正常还款次数对违约行为有显著负向影响[10].于军(2017)从语言信息含量和内容两个角度研究描述性信息和违约之间的关系,实证分析表明描述性信息信息量越大,借款人越不容易违约[11].
综合而言,国内外学者针对违约人行为展开了多层次的研究,涉及人际关系、借款人“硬”“软”信息呈现、地域歧视等.但针对某一区域违约人是否存在明显的区域特征还未有研究呈现.因此,课题组针对湖南省网贷违约人特征展开了进一步研究.
3 研究设计
3.1 数据来源和样本选取
“人人贷”平台成立于2010年,是较早一批平台中公信力及各项指标都保持平稳的典型平台,在网贷之家、网贷天眼等第三方评级网站中排名一直较为靠前(前10名内).因此,本文选取“人人贷”平台上的数据作为研究对象,应该能较好地反映网贷人群的真实特点.课题组利用网络爬虫这一技术手段爬取了2015年
选择2015年数据的原因为:确认为坏账的时间.因为网贷期限大部分分布在1个月到36个月之间.如选择2017年数据,则无坏账呈现. “人人贷”平台上的借款数据信息,建立了两个样本库,一个为全国随机样本(简称为Sample1),共有数据1326条,另一为湖南省随机样本(简称为Sample2),共有数据442条.将通过对两个样本的实证研究来验证违约人特征是否具有区域性特点.
3.2理论假设和变量选择
本課题的基本前提假设即:借款人的某些信息与借款违约行为是有概率联系的.理论上来看,借款人违约的影响因素应包括项目本身的基本要素,如借款目的、金额、利率、期限等,还有与借款人本身相关的各类因素,如借款人经济状况、信用状况等.Iyer等(2009)将借款人信息分为“硬”和“软”两类,“硬”信息指能够被客观证实的内容[12],如借款人身份信息、借款项目信息;而“软”信息则是指不能被直接证实的内容,如借款人对借款目的的文字描述等.Greiner&Wang(2010)则把借款人信息分为经济信息和社会信息,经济信息用以衡量借款人的还款能力,社会信息衡量借款人的借款能力并以借款人是否参与联合借款作为判断标准[13].本课题组除参考以上分类方式外,还借鉴了顾慧莹、王重润等研究者的信息分类方法,将获得的数据分为四类,分别是借款人自身特征信息、借款人经济信息、借款标的信息和平台信息.详细分类说明和假设为:
借款人的自身特征信息,包括性别、年龄、婚姻状况、教育水平.
此类信息能够反映借款人的社会分类属性和某些个体特点,较多文献都通过定性和定量分析倾向于认为女性比男性更可能按时偿还借款(Dinh & Kleimeier,2007;Roslan & Karim,2009)[14-15].课题组在此处假设:
H1 相较于女性借款人,男性借款人更倾向于违约.
一般认知中会认为年龄大的借款人会比年龄小的借款人更具有风险规避性,倾向于完成承诺,按时还款.Arminger等(1997)等通过实证分析也确认了这一点,即年轻借款人的不够成熟和缺乏耐心,更倾向于违约[16].所以课题组假设:
H2 借款人年龄和违约率负相关.
婚姻状况在我国文化认知中是一个人趋于稳定的象征,一般会认为已婚人士因为有家庭责任而更倾向于履约.但在Dinh&Kleimeier(2007)的研究中却发现已婚人群的还款性更低,解释为已婚借款人由于家庭负担,经济压力更大,因此更容易违约.课题组经过探讨,认为在我国婚姻仍旧是一个人走向成熟稳定的标志,婚姻中如两人都有工作则家庭整体偿债能力上升,而单身、离异或丧偶的借款人相较于核心家庭偿债能力会弱一些.故而课题组仍旧假设:
H3 处于婚姻状态中的借款人相较于不处于婚姻状态中的借款人(未婚、离异、丧偶)违约率更低,即已婚状态与网贷违约率负相关.
教育水平在学者的研究中都是与违约率负相关,即借款人所受教育年限越长,学历越高,借款违约率越低(廖理,2015).这也符合一般认知,课题组假设:
H4 高学历借款人违约风险较低,即学历和网贷违约率负相关.
借款人经济信息:债务收入比,有无房产,有无车产,有无房贷,有无车贷.
此类信息是衡量借款人偿债能力的重要指标,基本都是直接与偿还能力相关.其中最直接的就是债务收入比,Lin等(2013)认为经济强度最重要的指标就是债务收入比,比值越高,说明借款人偿债能力强[17].课题组经过对数据的考量,将债务收入比与Lin等的比法刚好做一个倒数处理,即Lin用的是年收入/借款金额,而本课题中用的是借款金额/月收入,这是由于平台提供原始数据的不同而做的相应处理,实际衡量结果的表征意义不会改变,只是正负相关解释刚好相反,且数据都变成了非小数,利于数据衡量的稳定性.
H5 借款人的债务收入比与网贷违约率正相关.
借款人的房屋产权对借款违约率也会产生影响,Greiner&Wang(2009)分析检验了有房产的借款人生活相对稳定,还款能力强.中国人的传统观念里也普遍认可,有恒产者有恒心.所以课题组假设:
H6 借款人是否拥有房屋与借款违约率负相关.
借款人拥有车产的衡量意义较少纳入国外学者的研究范畴中,因为在国外(特别是欧洲、美国)车只是作为一种代步交通工具,纳入个人财产考量意义不大.但课题组经过探讨认为,在国内车产目前仍旧可以作为一个财产衡量标志,是否拥有车辆在中国人的认知范畴内是一个家庭或者个人经济实力或社会劳动能力的体现
在这里主要是指某人或某个家庭是否需要一辆车来完成家庭收入的需要,如跑运输的,或业务活动量大的工作等..因此假设:
H7 拥有车产说明家庭经济实力较强或劳动能力强,所以与网贷违约率负相关.
在具体的个人经济信息中分类,拥有房产和车产偿债能力则被认可为更强,但从另一方面看,现代社会对金融工具的应用使得个人加杠杆情况增加,因此在个人在有房有车的情况下,可能还有房贷和车贷,房贷与车贷一般都是按月偿还,对个人收入稳定性要求比较高,自然会挤压借款人的资金空间,因此课题组假设:
H8 有房贷需要偿还与网贷违约率正相关.
H9 有车贷需要偿还与网贷违约率正相关.
借款标的信息:借款金额、利率、期限、用途.
借款标的信息是直接反映借款需求并影响投资者决策的最主要信息,其中借款金额因为方差较大,所以在变量选择时将其与收入结合,形成债务收入比,在借款人经济信息中已经纳含,故此处不再重复使用.大部分的研究中借款利率都被认为与违约率正相关(王重润,2016),因为借款利率高说明借款人必须用高利率来吸引投资者,一方面说明借款人质量低,同时也反映到借款人的融资成本高,偿还更加困难.故而课题组假设:
H10 借款利率越高,借款人质量越低,与网贷违约率正相关.
借款期限在平台上一般为1~36个月,王重润(2015)通过实证分析证明借款期限对违约行为有正向影响,符合一般认知,因为借款期限长,说明可能借款者的财务状况不确定更大,违约行为可能性也越大.故而假设:
H11 借款期限与网贷违约率正相关.
借款用途是不太好权衡的一个变量,课题组经过探讨认为个人消费的贷款违约率应该小于投资经营和短期周转,因为后两者属于生产经营范畴,面临的各类风险大,而消费贷款的还款来源一般是个人和家庭收入,相对稳定和可预期.因此假设:
H12 偏消费的借款类型与网贷违约率负相关.
平台信息:平台认证个数,描述指数.
平台信息主要反映P2P网贷平台作为信息中介对借款人信用的第三方测度.“人人贷”平台上有专属的平台信用打分,但因为是后向打分,即分数会根据借款人的行为调整,所以不取这一分数.而取用的是平台认证个数和描述指数.其中平台认证个数是借款人在发布借款信息前后愿意提交的各类个人信息认证,如身份证、电话、短信、头衔、工作地点等等,总数目多达24个,课题组认为认证的个数越多,该借款人的违约率越低.描述指数是人人贷平台根据借款人在平台上填写的各类信息以及借款說明等给出的一个平台打分.一般而言,描述指数越高的会靠前推荐给投资人,所以课题组倾向于认可描述指数越高,违约率越低.给出假设如下:
H13 平台认证个数与网贷违约率负相关.
H14 平台描述指数与网贷违约率负相关.
3.3 实证模型设计
4 实证分析
4.1 模型检验
4.1.1 模型整体性显著性检验
对模型整体显著性检验在Logit分析中有一步模型系数综合检验(Omnibus Tests of Model Coefficients),检验似然比(LR)统计量,可以测定模型是否整体显著.Sample1和Sample2输出结果见表2和表3.
可见Sig.值都小于0.05,可以拒绝原假设,而且在此检验中,两个样本的Sig.值都小于0.01,说明差异极显著,模型整体显著性较好.
4.1.2 变量显著性检验
本文设计模型中功有14个解释变量,数目较多,因此需要对更有解释力的变量进行筛选.二元Logit模型中有筛选方法可供选择,分为前进筛选法和后退筛选法.其中前进筛选法是将变量逐个引入模型进行筛选,后退筛选法则是先将所有解释变量放入模型,再逐个剔除不显著的变量.针对本文中的模型,更适合采用后退筛选法.Sample1和Sample2的检验结果见表4和表5.
经过二元Logit模型后向筛选,Sample1中剩余9个解释变量,Sample2中剩余4个解释变量.Sample2中剩余的解释变量全部包含与Sample1中,一方面说明全国随机样本解释力较强,另一方面也说明需要探寻为何有些变量在Sample2中被剔除的原因.为了更好的展示解释变量在Sample1和Sample2中的关系,用图1表示为:
4.2 实证结果分析
4.2.1 总体分析
从表4和表5中可以看出,Sample1和Sample2中最后的解释变量Sig.值都小于0.05,说明留下的变量都在5%的显著性水平上对模型有显著影响.由于Logit模型中的变量系数不能被解释为对因变量的边际影响,故系数大小没有特定的经济解释意义,但系数符号能充分说明自变量对因变量的正负相关关系.若解释变量系数为正,则表明解释变量对因变量有正向影响,则因变量取值为1的概率越大,在本模型中,即违约概率越大.哑变量的正负系数可参照哑变量设定时的解释意义分析,如房产这一哑变量,设定有为0,无为1,回归模型中系数为负值,与假设H6一致,接受原假设,即借款人是否拥有房屋与借款违约率负相关.课题组发现所有Sample1和Sample2共有的解释变量正负号一致,即相关性一致(见表6).
这里有三点值得说明,第一,两个样本的解释变量具有特征一致性,且符合包含逻辑,大样本包含小样本中所有解释变量特征.第二,说明全国随机样本的解释范畴更宽.第三,两个样本之间没有出现异常解释变量——即Sample2中出现Sample1中被剔除的变量,说明两个样本符合随机逻辑,模型对比拟合度比较好.
4.2.2 对Sample1的实证结果分析
经过二元Logit向后回归筛选6次,Sample1中共留下9个变量.变量列表和假设对比检验见表7.
被筛选出局的5个变量分别是性别(sex)、年龄(age)、婚姻状况(marriage)、车贷(carloan)、借款用途(borrow-type).其中前3个来自于借款人自身特征信息,剩下2个分别来自借款人经济信息和借款标的信息.也即言,大部分关于借款人自身身份特征的信息与是否违约相关度不大,更加重要的是借款人的经济信息和标的信息和平台信息.其中车贷信息被筛选掉比较容易理解,因为该指标在两个样本中取值为1的(即有车贷的)均占比不到10%,难有明确解释意义呈现.而借款用途被筛选掉与王重润(2016)研究结果不一致,课题组认为这可能与平台信息呈现方式不同有关.剩下的9个变量中,4个相关性符合原假设设定,5个不符合原假设,不符合假设的值得进一步研究.
债务收入比与违约率呈现负相关是非常值得注意的拒绝原假设实证结果.单独分析结果表面意义解读,即从收入角度看,偿还能力越小(借款金额/月收入),违约率越低.这不符合理解逻辑,同时与顾慧莹(2015)的研究结果不一致.课题组为了解释这个问题,对数据再次进行处理,将借款收入比还原为两个变量:借款金额和收入,再次纳入模型回归,结果见表8.
在变量还原分析中结果也都是与理论推测相反,一般认为借款金额越大,违约率越高,而实证分析说明,借款金额越大违约率越低.但结合平台授信分析就能推测出:这是因为能在平台上获取较大额度贷款的一般是作为企业投资经营需要,平台会自行进行尽责的线下调查;而较小额度的贷款一般是无抵押靠信用担保,违约风险也会高发.同时这一实证结果与王重润(2016)研究成果一致.另一个变量收入与违约率正相关,也不符合理论预测,一般会认为收入越高的人偿债能力也越强.于是课题组对收入这一变量做具体描述分析,结果见表9和图2.
从数据分布的偏度和丰度指标来看都在可接受范围内,但从直方图可以评估该分布不符合正态分布,呈现尖峰顶右偏状态.可以判断的是,变量数据的分布形态与平台数据呈现有关,因为“人人贷”平台在让借款人输入收入数据是给定数据范围,如收入是小于2000,2000~5000之间,5000~10000之间……,课题组对数据做了平均化处理,因此可以判断该数据在真实意义上不能很好反映借款者的真实收入水平.另外,数据呈现右偏状态也能够判断人们在借款时倾向于高报自己的真实收入,故而就比较好解释实证分析中的正相关状态了,即人们在为取得贷款时倾向于虚报收入,所以导致数据呈现上的收入越高和违约率也越高.
实证结果表明借款期限与网贷违约率负相关,拒绝原假设.课题组经过探讨认为,原假设忽略了期限是一個主观选择量,即在网贷平台和传统信用中介不同,是由借款者主动选择借款期限.理性借款人会合理分配自己的资金流,选择更长期限的借款人应该是合理规划了每个月的资金流,给出的理性借款时间.而更短的借款期限可能是用于短期周转,本身存在更高风险,或者借款人本身给出较短期限就是为了能快速拿到贷款,而没有合理规划自身资金流,更容易导致违约情况的发生.
房贷(mortgage)这一解释变量与网贷违约率负相关,即有房贷者更倾向于履约,和原理论假设不符.经过探讨课题组认为,其实将情景放于真实借款场景中就比较好理解了:首先,有房贷者说明其有购房能力,是经济实力的一方面体现;其次,有无房贷平台和投资者都不会去确认,但给出有房贷在身的借款者倾向于更加诚实,也就是说将实际不利于自身借款的信息公开给投资人,此类人群在履约方面也更加尽职.
车产(car)这一解释变量与网贷违约率正相关,同属于财产性质的物品,与房产出现了相反的结论,即有车产者更违约率上升,拒绝原假设的负相关设定.课题组深入挖掘原因时发现“网贷之家”对违约人数据分析后有同样的结论:“虽然车能一定程度上象征财力,但却对降低违约率没有帮助”
网贷之家《揭秘网贷圈老赖真实画像,有车产并不能降低违约率》2018-03-06,https://www.wdzj.com/hjzs/ptsj/20180306/588267-1.html.这一方面说明模型验证度较好,另一方面也可反映房产和车产在实际财产效应中的不同表现.
平台认证个数与网贷违约率正相关,不符合理论预期,拒绝原假设.通过仔细分析认证类型,课题组认为,本来平台认证信息应该对违约率相关性方向是一致的,但实际上选取的两种平台认证其认证方式并不一致.其中拒绝原假设的认证数目变量绝大部分是借款人主动给出,而描述指数则是平台根据借款人给出的信息,结合后台算法客观打出的一个分析分数.也即言,前者偏主观,后者偏客观.因此平台认证个数会与违约率正相关就好解释了:对于真正具有良好信用的借款人来说,他并不需要通过更多的认证来证明其信用;相反是急需贷款或本身信用有缺失的人群,才会主动通过更多认证来证明自己有还款能力.而且在认证设置上本研究只取了数目,但实际中不同类认证对于借款人信用衡量是权重不一的,如手机、短信、相片认证相对容易,而房产、职位、住所等认证则难度更大.
4.2.3 对Sample2的实证结果分析
Sample2的分析过程与Sample1一致,部分结果在前文总体分析中已经给出,此处不在赘述.对比两个样本,实际值得注意的是:有5个变量在Sample1中显著,但在Sample2的实证结果中被剔除了.为何会被剔除?这是值得研究的问题.
首先,课题组从数据分布角度入手研究,即产生变量剔除的原因是否因为Sample1和Sample2在某变量分布上有较大不一致性.其中是否拥有房产这一变量在频数分析中凸显出来,见图3和图4.观察数据可以发现在Sample1中house这一变量分布是符合假设的,即拥有房产者有更强的履约能力,而违约人中持有房产者占比偏少;但在Sample2中数据呈现的是违约人中持有房产者占比更多.从数据表现意义上来看,房产拥有在湖南样本中不能作为借款人的履约能力的经济实力证明.
在数据分布中,认证个数变量虽然不像房产变量出现了显著性差别,但也可以发现Sample1和Sample2的不同,见图5和图6.显然全国随机样本中的分布更符合一般逻辑,而湖南样本数据频数变化较大.课题组认为这可能与样本数量相关,如果能扩大Sample2中数据数量,应该能消除这一问题.
其次,课题组再次考察在Sample2历次回归筛选中被剔除的纳含在Sample1变量中,其中是否拥有车产(变量car)在第三次筛选中被剔除,变量house,mortgage,renzheng-num和degree分別在8,9,10和11次筛选中被剔除.也即言,较早剔除的变量只有car,而其他几个变量都是在最后几步筛选中剔除.另外值得关注的是,在Sample1中,解释变量car与违约率是一个正相关关系,见表7;而在Sample2中,虽然较早被剔除,但它在模型中呈现的关系是负相关,且Sig.值大于0.05,不能证明其显著性,见表10.也即言,在Sample1中得到显著性检验的变量car,在Sample2中无法通过显著性检验.同房产一样,车产在湖南样本中也无法作为履约能力提升的体现.
变量house和mortgage分别在第8步和第9步被筛选剔除,前文频数分析中已经解析了house被剔除原因,此处不再赘文.但容易理解的是,house变量被剔除后,mortgage变量自然会随之被剔除.因为两者存在包含关系,且一致性在实证分析拒绝假设8(H8)时也得到了验证.学历变量degree在最后一步被剔除,说明该变量虽然没有达到5%的显著性标准,但和其他已被剔除的变量相比,对因变量影响更大一些,课题组认为如果Sample2数据量可以扩大,学历这一解释变量有可能最后保留在模型中.
5 结论与建议
5.1 结 论
本文以“人人贷”上的借款人数据为研究对象,建立二元Logit模型,用两个样本研究了对借款人违约行为产生较显著影响的因素,其中全国随机样本实证结果显示,负债收入比、借款期限、学历、房产、房贷、描述指数对违约行为有负向影响,而借款利率、车产、认证个数对借款者违约行为有正向影响.Sample1中保留的9个解释变量,拒绝了5个原假设,这说明仅通过逻辑分析是无法说明解释变量对因变量的影响方向的,实证分析结果能更好地发掘人们对解释变量的认识深度.Sample2中保留了4个解释变量,保留的解释变量影响方向和Sample1一致,而剔除的5个变量中,其中3个(house、mortgage、car)有其地域特征原因,另外2个(renzheng-num和degree)应该与样本数量相关.此外,在Sample1中,对违约率影响特别明显的解释变量有利率、房产、车产,Sample2中对违约率影响显著的是利率,这从实证角度再次说明,利率与违约率的强正相关关系(本例中的实证结果显示,Sample1中,利率每提高1个点,违约概率上升6个点;Sample2中,利率每提高1个点,违约概率上升7个点.看表4和表5中Exp(B)值).
5.2 建 议
P2P网贷平台一方面的确为长期被正规金融所排斥的借款者提供了资金来源渠道,也为投资人提供了收益较高的资金贷放方式,另一方面由于当前平台建设还不够完善,面临较严重的信息不对称、逆向选择等问题,也集聚了大量违约风险.本课题组将研究重点指向湖南省的网贷违约人特征,是目前该领域研究中尚未涉及的范畴,通过对数据搜集、整理、分析,取得了一定突破.现就研究成果对湖南省在网贷领域信用评价体系建设建议如下:
第一,大方向上与全国普遍使用的信用评价要素保持一致即可.从实证结果可知,对湖南省网贷借款人有显著影响的因子并未超出全国样本的范围,两者一致性较强.不需要抽出某些特定要素作为湖南省内个人信用评价体系的特色来使用.
第二,湖南省地方特色个人信用评价体系中对财产的拥有(特指房产与车产)不需要赋予高权重.一般财产的拥有是个人经济实力的象征,但从实证分析可知,湖南样本中房产和车产的拥有都不能够作为其信用提升的佐证.这也是与全国随机样本的最大差异所在.但要注意的是,本研究不是说房产和车产作为财产证明不重要,而是指其重要程度及对信用的影响关系需要进一步考量.
参考文献
[1] KUMAR S. Bank of one:empirical analysis of peer-to-peer financial marketplaces[C]// Reaching New Heights. Americas Conference on Information Systems, Keystone, Colorado, USA, 2007:305.
[2] HERZENSTEIN M, SONENSHEIN S, DHOLAKIA U M.Tell me a good story and I may lend you money:the role of narratives in peer-to-peer lending decisions[J]. Journal of Marketing Research, 2011, 48(SPL):138.
[3] POPE D G, SYDNOR J R. Whats in a picture? Evidence of discrimination from Prosper.com[J]. Journal of Human Resources, 2011, 46(1):53-92.
[4] DUARTE J, SIEGEL S, YOUNG L. Trust and credit: the role of appearance in peer-to-peer lending[J]. Review of Financial Studies, 2012, 25(8):2455-2484.
[5] NOWAK A, ROSS A, YENCHA C. Small business borrowing and peer-to-peer lending: evidence from lending Club[J].Contemporary Economic Policy,2018,36(2):318-336.
[6] 繆莲英, 陈金龙. P2P 网络借贷中社会资本对借款者违约风险的影响——以 Prosper 为例[J]. 金融论坛, 2014,19(3): 9-15.
[7] 王会娟,廖理.中国P2P网络借贷平台信用认证机制研究——来自“人人贷”的经验证据[J].中国工业经济,2014(4):136-147.
[8] 廖理,李梦然,王正位.中国互联网金融的地域歧视研究[J].数量经济技术经济研究,2014,31(5):54-70.
[9] 顾慧莹,姚铮.P2P网络借贷平台中借款人违约风险影响因素研究——以WDW为例[J].上海经济研究,2015(11):37-46.
[10]王重润,孔兵.P2P网络借贷违约行为影响因素实证研究——以“红岭创投”为例[J].农村金融研究,2016(2):28-33.
[11]于军.描述性信息与违约行为的关系研究——基于P2P平台的分析[J].当代经济管理,2017,39(5):86-92.
[12]IYER R,KHWAJA A I, LUTTER, E F P,et al. Screening in new credit markets: Can individual lenders infer borrower creditworthiness in peer-to-peer lending? [R]. Combridge, MA:National Bureau of Economic Research,Working Paper 15242,2009.
[13]GREINER M E, WANG H. Building consumer-to-consumer trust in e-finance marketplaces[C]// Reaching New Heights. Americas Conference on Information Systems, Keystone, Colorado, USA, 2007:211.
[14]DINH T H T, KLEIMEIER S. Credit scoring for vietnams retail banking market: implementation and implications for transactional versus relationship lending[D].Financial Economics,Limburg Institute of Maastricht University,2006.
[15]ROSLAN A, KARIM M. Determinants of microcredit repayment in malaysia: the case of agrobank[J]. Pertanika Journal of Social Science & Humanities, 2009, 4(1):45-52.
[16]ARMINGER G, ENACHE D, BONNE T. Analyzing credit risk data: a comparison of logistic discrimination, classification tree analysis, and feedforward networks[J]. Social Science Electronic Publishing, 1997, 12(2):293-310.
[17]LIN M. PRABHALA N R, VISWANATHAN S. Judging borrowers by the company they keep:friendship networks and information asymmetry in online peer-to-peer lending[J].Management Science,2013,59(1):17-35.