婚姻状态与网络借贷中的信用识别
2017-07-03郭峰
郭峰
摘要:在P2P網络借贷模式中,不同的借款人个人特征信息具有不同的价值。利用中国P2P企业“人人贷”的数据,本文探讨了婚姻在网络借贷市场中的信用识别价值。实证结果表明,相对于未婚人士,已婚人士的借款成功率更高,同时贷款违约率也更低。同时,不同特征的人结婚,对于提高自己信用所起到的作用也是不相同的。具体而言,对于提高借贷信用而言,男性结婚不如女性结婚;高年龄借款者结婚强于年轻人结婚;高学历借款者结婚不如低学历借款者结婚。但对于借款违约率,不同特征借款者结婚的影响差异不大。
关键词:婚姻;信用识别;歧视;P2P网络借贷
文献标识码:A 文章编号:1002-2848-2017(03)-0040-08
一、引言
在经济学中,家庭被认为是最基本的决策单元。无论是日常消费,还是投资决策,已婚人士和单身人士,都会存在很大的区别。已经结婚有家庭的人士,相对于单身人士,往往会有更稳定的工作和生活,还会共享生活资源,共担生活成本,违约的机会成本也更高,因而已婚人士理应在借贷市场上有更高的守信重诺的声望。然而,与婚姻相对于人们的重要性极不相符的是,针对婚姻与借贷关系的深入探讨还是很少。已婚人士和未婚人士哪个更容易借到款?借款成功后,哪个违约率更低?由于数据缺失,使用传统银行借贷,很难对此进行研究。而P2P平台提供了包括婚姻状况变量在内的非常全面的借款者信息,为我们研究这一问题提供了很好的机会。
作为一种新型融资模式,P2P网络借贷(Peer toPeer Lending)迅速扩张。P2P网络借贷,是个体网络借贷的俗称,即个体和个体之间通过互联网平台实现的直接借贷。这种业务模式,起源于英国,兴盛于美国,但真正发扬光大,却是在中国。中国最早的P2P平台是2007年6月在上海成立的“拍拍贷”。经过几年的迅速扩张后,P2P行业也趋于降温,根据网贷之家的年报数据,截至2016年12月底,网贷行业正常运营平台数量为2448家,相比2015年底减少了985家。
尽管增长迅速,然而P2P信贷相对传统金融市场具有更大的信息不对称和交易风险。在这种网络借贷模式中,投资人有效判断借款人的信用水平,规避逆向选择和道德风险的唯一途径就是信息。为了保护投资者的利益,P2P平台均要求借款人提供能够证明其身份和信用能力的各种信息。然而,P2P网络平台的信息披露机制又使投资人无法全面了解借款人的信息。因此,信息不对称问题依然是这个新兴市场所面临的基本问题,这个问题甚至在很大程度上要比传统金融市场中的更严重。P2P网贷市场的长期发展,在很大程度上取决于市场参与者如何利用有效信息来减少这种信息不对称。
在本文,我们通过收集中国P2P平台“人人贷”(renrendai.corn)的相关样本,研究婚姻状态在P2P网络借贷中的信用识别价值,探究P2P网络借贷市场能否准确识别婚姻的信用信号的价值。具体而言,本文将从两个层面开展研究,一是对贷款成功率的影响,考察未婚人士和已婚人士,在获得贷款的难度上是否有系统差异;二是对贷款违约率的影响,通过对违约率的考察,可以进一步分析婚姻对借款成功率的影响和贷款违约率的影响是否一致。此外,在考察婚姻状况对借款成功率和违约率的单一影响外,我们在本文还特别考察了按性别、年龄、受教育程度和收入水平分组的婚姻状况对借款成功率和违约率的异质性影响,从而得到更丰富的结论。
之前,由于银行体系内部的相关数据比较难以获得,婚姻在借贷市场中具有的信用识别价值的研究,还比较少见,本文利用了P2P平台提供的相关数据,研究了婚姻在P2P网络借贷市场中的信用识别价值,这是本文的一个创新之处。此外,在现有的P2P网络借贷的研究文献中,往往主要考察借款人个人特征的影响,在某种程度上忽略了婚姻和家庭对人们投融资决策的重要影响。研究婚姻与借贷决策的关系,有助于深入理解基本婚姻家庭单位在其他复杂因素联合作用下,如何影响人们的行为选择。
本文剩余部分安排为:第二部分综述相关文献;第三部分介绍实证回归方法,以及本文所使用的数据;第四部分讨论相关实证结果;最后一部分总结全文。
二、文献综述
众所周知,婚姻是影响家庭资产配置和投融资决策的重要因素,婚姻可以给家庭金融决策者一种安全感,如Waite and Gallagher研究发现相对于未婚家庭,已婚家庭赚钱更多,财富积累也更多,Schmidt and Sevak则发现在美国,单身女性和已婚妇女在财富上存在着巨大差异。在更深入的研究中,Bertocchi等人利用意大利的数据发现,已婚女性比单身女性更多地参与风险投资,但已婚男性和单身男性对风险资产的参与没有明显差异,这一结论在中国的相关实证研究中也得到了印证。考虑到这些因素之后,我们自然可以预期,人们在考虑是否向借款人借出资金时,必然会考虑到借款人的婚姻状态,即借款人的婚姻状态具有了信用识别的价值。本文主要利用P2P网络借贷来考察婚姻的信用识别价值。
P2P网络借贷行业在全球范围内方兴未艾,相应的学术研究也蓬勃发展,P2P平台披露的各类信息,为相关研究创造了条件。如何识别借款人的风险,是P2P平台运营的重要环节。各国学者从多个角度深入分析了P2P平台上能够识别借款人风险的各类因素,得到了丰富的结论。例如,Freedmanand Jin,以及Lin等人的研究指出借款人的基本信息是投资者对其还款可能性进行评估的主要参照因素,借款人的信用等级越低,其借款成功率越低,借款成功之后的违约率也越高。Iyer等人则发现借款人的财务状况对其借款成功率也有显著影响。Puro等人则发现信用得分、总负债偿还比率、当前拖欠记录等因素都会影响到借款成功率。王会娟和廖理基于中国P2P平台“人人贷”的相关数据,也发现借款人信用高低是影响P2P平台稳健运行的关键,借款人的信用评级越高,交易越容易成功,且借款成本越低。endprint
借款人的相关人口学特征如何影响P2P平台上的借款成功率和违约率也得到了很多文献的关注。Herzenstein等人利用美国P2P平台Prosper上的数据,发现非裔借款者相比其他种族借款者确实不容易借到钱。Pope and Sydnor基于Prosper利率拍卖机制的数据,则发现非裔美国人借贷成功的概率比与其信用评级相似的白人更低的同时,贷款利率也比白人更高。此外,Pope and Sydnor的研究还发现与35-60岁的群体相比,35岁以下的借款人具有更高的借款成功率,60岁以上的借款成功率则更低,换言之,网络借贷中存在年龄歧视的问题。Duarte等人发现长相更可信的人在P2P平台上借钱更容易融资成功,而且这些人也确实违约率较低。这一点,在Ravina的研究中也有类似的发现,他发现长相漂亮的借款人更容易以更低的利率借到款项。在性别歧视的相关研究中,Chen等人发现在中国P2P网络借贷市场上,存在显著的女性性别歧视,然而,Barasinska and Sehafer基于德国P2P平台Smava的相关数据得到的结论并不支持性别歧视的观点。廖理等的一项研究还发现高学历借款者如约还款概率更高,高等教育年限增强了借款人的自我约束能力,但是投资者却并未青睐高学历借款人。
三、研究设计
(一)实证模型
本文研究主旨在于考察婚姻状况在P2P网络借贷平台上是否具有信用识别的价值。换个角度来说,其实也可以认为是考察在网络借贷上是否存在歧视现象。为此,我们首先可以考察结婚与否,在P2P平台上借款的成功率是否存在差异,并进一步考察婚姻状态对P2P借款违约率的影响。由于因变量借款是否成功和借款是否违约,都是虚拟变量,因此我们使用的是Probit回归模型。估计模型如下:
P(success=1|x)=G(邓)
或者
P(default=1|x)=G(Xβ)
其中,G(·)表示標准累积正态分布函数,success和default分别表示是否借款成功和借款是否违约,X为下文所述的自变量向量,β为待估计系数向量。考虑到可能存在异方差的问题,我们将估计稳健性的回归结果。此外,为了度量自变量对因变量影响的大小,我们还将计算Probit模型估计得到边际效应,即就上述方程对xi求偏导数:
(二)数据选取
本文搜集了中国代表性的P2P平台“人人贷”网站(WWW.renrendai.corn)上的所有借贷数据。人人贷成立于2010年5月,当年10月正式上线。我们采用爬虫软件从人人贷网站抓取了该网站自2010年10月12日上线至2015年8月7日间所有借款标的信息。人人贷网站的投标种类分为四种:信用认证标、实地认证标、机构担保标以及智能理财标。由于实地认证标、机构担保标和智能理财标的担保方式和信息披露方式与我们要考察的目标存在较大的差异,并且在我们的样本期间违约率基本为零,因此本文主要对信用认证标进行深入研究,剔除了其他三类订单样本。我们的样本中剔除了一些异常值,也剔除了少量婚姻状况不明的样本。本文所用数据最终包含498259个投标记录,其中流标474213个,在成功借款的投标中,8988个贷款仍然在还款中,12742个贷款已结清,350个贷款逾期,1966个坏账。
(三)主要变量说明
1.被解释变量。P2P平台上独特的数据样本可以让我们从不同的角度分析P2P借贷的结果:是否成功借款(Success),以及贷款是否违约(default)。是否成功借款反映的是投资者对于借款人该笔借款的认可程度,是投资者观点的体现。贷款是否违约反映的是借款人最终行为结果,是借款人信用风险的真实揭露。将借款结果分为两个层面探讨的好处之一是可以将两个层面的研究结果相互对比,进而得到投资者认知与借款人真实风险的差异。具体而言,相关变量构造说明如下:
成功借款(success):哑变量,如果标的状态为还款中、已结清、逾期、坏账,则哑变量成功借款取值为l;如果标的状态显示为借款失败,则哑变量借款成功取值为0。根据描述性统计可知,在本文样本中,所有订单中大约有4.6%的订单筹款成功。
借款违约(default):哑变量,若订单违约则取值为1,否则为0。由于正在还款的订单无法考察其最终的违约情况,因此不计算在内。当一个订单完成筹款后,如果未能按时还款超过约定时间30天后,人人贷网站将这种行为认定为严重逾期,网站对于该订单的状态会显示为“逾期”;另有一些订单逾期时间超过90天,人人贷网站将按照对投资者“本金保障”的约定,垫付本金,这时网站对于该订单的状态会显示为“已垫付”。本文将这两种状态下的订单都视作违约订单。在本文样本中,人人贷网站上,订单违约比率约为15.4%。这一贷款违约率高于一些其他基于人人贷进行相关研究的文献,说明随着时间的演进,P2P借贷中积累的违约风险逐步上升。
2.核心解释变量。借款人的婚姻状况(mar)是本文要考察的核心解释变量,也为哑变量:已婚设为1,未婚设为0。在原始数据中,婚姻状况被分为四种类型:单身、已婚、离异及丧偶。基于我们的研究目的,在本文中我们将其简化为两大类:第一类为已婚,标记为1,本文全样本中,已婚借款人比例占到42.8%;第二类为未婚,包括单身、离异或丧偶,标记为0,在全样本中,未婚借款人比例占到57.2%。而在借款成功的子样本中,已婚比例则为64.7%,远高于全样本;在订单违约样本中,已婚比例为61.7%,也高于全样本,但低于借款成功样本。
3.控制变量。本文控制变量主要包括两大类,既包括借款人信息,也包括借款标的信息。借款人信息包括:性别、年龄、收入情况、受教育程度、资产情况(住房和汽车)等;借款标的信息主要包括借款金额、借款期限等。具体而言,主要变量的变量说明为:
性别(male):我们设定一个性别哑变量,男性赋值为1,女性赋值为0,根据本文统计,所有借款人中男性借款者大约是86.2%。其中已婚借款者中,男性比例为85.3%,未婚借款者中,男性比例为86.8%。endprint