信贷市场中的学历价值及其区域异质性研究
2021-09-11池仁勇
刘 琼,池仁勇
(1.浙江工业大学 管理学院,浙江 杭州 310023;2.浙江工业大学 经济学院,浙江 杭州 310023;3.浙江工业大学 中国中小企业研究院,浙江 杭州 310023)
一、 引 言
学历作为标识人才类别的显性标签,一直被作为衡量人才综合素质的重要尺度。特别是在信贷领域,受信方的学历水平一直是授信方评估额度的核心要素[1-2]。但目前学历价值在信贷额度的映射大多基于常识和经验判断,其背后科学机理的长期缺位是部分高学历信贷坏账产生的重要原因[3]。因此,学历对信贷市场的影响机制正成为学界和业界广泛关注的热点问题之一。同时,由于中国不同地区经济发展不均衡、人才政策导向不同、资源禀赋存在地区差异等问题,不同地区信贷市场中的学历价值效应是否发挥作用?学历价值如何影响信贷市场?这种影响背后的内在作用机理与理论逻辑是什么?这些问题都有待进一步深入分析。
之前学者对学历价值的研究大多集中在求职、议价等劳动力市场回报[4],以及个人收入、幸福指数[5]等方面,较少从市场信贷视角分析学历价值的重要性及其影响效应。特别是由于银行系统中个人信息的保密性原则,无法为分析信贷市场中学历价值重要性和作用导向的实证研究提供有效数据支撑,客观上使得学历背景提高信贷市场中信用配给效率的作用路径研究遭遇了瓶颈。近年来,互联网技术的快速发展带动了网络信贷平台的崛起,信贷平台下大量包含学历信息在内的借款信息能够被有效识别,为信贷市场中学历价值研究提供绝好的“机会窗口”。已有研究利用网络信贷数据从不同角度分析学历在借贷市场中的价值体现,认为高学历背景的借款者能够获得投资者的青睐[3,6-7]。但是现有研究仍然存在不足,一方面较少有文献从整合视角将借贷成本、借贷成功率以及违约风险这三方面的价值表征纳入统一研究框架中,从而无法为学历价值在信贷市场中的作用研究提供一个整体画像;另一方面更为重要的是,现有研究并未就学历信息所展现的风险逻辑和价值逻辑进一步展开区域异质性分析。然而现实中,中国地缘辽阔、省份众多,各地区之间教育水平投入的差异、经济发展状况存在的差异性,往往会导致学历价值在信贷市场中的作用受到“扭曲”[8-9]。其一,不同地区资源禀赋存在差异性,东部发达地区无论是金融基础设施还是金融配套能力都远远超过西部欠发达地区,能够为高学历价值借款人提供更多融资额度;其二,人才政策的招致效应不同,发达地区的人才政策力度更大,高学历价值人才能够获得更多政策上的金融倾斜;其三,人才心理建设导向不同,发达地区的高学历人才市场竞争激烈、社会与家庭期望值高,在信贷市场具有更强烈的“价值诉求”;其四,人才集聚呈现规模效应,相对于西部欠发达地区,东部发达地区人才集聚效应显著,相同学历下个人价值总体上优于西部地区人才,在信贷市场上获得融资资源也会更多。因此,基于全国东、中、西部不同地区层面探讨学历价值对信贷市场影响的区域异质性具有很强的现实与理论意义。
基于此,本文将在教育回报与信贷配给等相关理论基础上,研究信贷市场中学历信息背后的低信用风险逻辑与价值主张逻辑对提高信贷配给效率的内在机理,并重点分析不同地区金融发展水平对学历价值的信贷效率提升效应的扭曲程度。此外,通过使用国内应用较为广泛的A网络信贷平台上的个人借贷数据对此作用机制进行实证分析,以期规避一直以来学历价值在信贷市场中重要性研究的“学而不术”问题。
本文可能的贡献主要在以下两个方面:一方面本文丰富了教育价值回报研究,特别是扩展了教育价值在信贷市场中的研究。以往对教育价值的实证研究多停留在教育对个人收入[10-13]、缓解歧视等方面[3,7],较少从信贷市场的角度去探究借款者教育价值的意义。本文借助网络信贷市场中大量借款者学历的微观信息,肯定了信贷市场中教育价值的存在。另一方面本文拓展了地区间教育价值异质性研究的相关层面[8-9]。地区间教育投入水平的差异会导致地区间教育回报率不同[14],但较少考虑到教育价值对地区金融发展水平的影响,本文从地区金融发展这一视角,为地区教育价值异质性的研究提供了一定的有益补充。
二、 影响机制与研究假设
教育的本质是培养并提升受教育者个人劳动技能、价值观、思想品德等综合素质[15],学历是受教育程度的主要标识,具有权威性、可观性、级差性等特征,因此过去经验研究广泛认为受信方学历的提升能够让其在信贷市场具有更多优势。
1.学历价值对借款成功率及成本的影响机制。一方面,受教育者学历价值越大,其违约信用风险越小,借款成功率越高。具体表现在:第一,受教育者的学历程度越高,其掌握的劳动技能知识也会随之增多[16],从而能够在就业市场中就任更高的职位,获得更多的劳动收入,进而具有更强的偿还能力,其违约的可能性也会较小。第二,良好的教育不仅能让受教育者具有追求更多资产回报的能力,更为重要的是在教育的熏陶下培养了良好的思想品德、正确的是非价值观以及信用操守等[17],因此具有高学历价值的借款者一般都会信守诺言,按时履约,违约风险较小。第三,学历价值高的借款者一般从事重要的工作岗位,可能具有广泛的社会影响力,会更加注重自身的声誉价值[18],而违约受到的声誉惩罚机制会让其更加积极完成履约义务[19]。第四,银行等金融机构资金借贷的信用配给大部分是基于市场主导逻辑展开[20],当借款人具有更低违约风险、更高偿还能力以及更低违约倾向时,其获得借款的成功率以及借款额度均会得到提升[21]。因此,高学历价值背后的低信用风险价值逻辑能够帮助借款人提高借款成功率。
另一方面,借款人学历价值越高,其议价能力越高,借款成本越低。具体表现在:第一,根据教育回报相关理论研究,借款人要想拥有更高学历水平,就需要在财力、脑力等方面付出更多[18],继而对未来的教育回报预期也就会越高,从而对降低借贷成本价值的诉求意愿也会更强。第二,高学历价值借款人具有更高的偿还能力,在借贷市场具有一定优势[22],因此在与银行等金融机构协商时拥有更强的议价能力,能够获得更低的借贷利率[23]。因此,高学历背后的价值主张逻辑使得借款人能够获得更低的借款成本。基于此,本文提出以下2个假设:
假设1a:借款者学历价值越高,借款成功率越高。
假设1b:借款者学历价值越高,违约风险越小,借款成本越小。
2.学历价值对信贷市场的地区异质性影响。中国省份较多、分布较广,各地区之间教育水平的投入以及经济发展状况等存在很大差异[24],地区发展的不均衡导致地区金融发展水平以及人才学历价值也出现了不对称现象[25]。这种不对称现象在一定程度上会扭曲学历价值在借贷市场中的促进作用,具体表现为:第一,基于“资本—技能互补”假说,发达地区的金融发展程度会提高教育回报率[9],也就意味着地区金融市场越发达,受信方能够获得更高的收入回报,因此,相同学历背景的受信方在金融市场发达地区具有更高的偿债能力,违约风险更低。第二,发达地区的资源禀赋更强,拥有更加完善的金融管理体系,受信方能够获得更为广泛的融资渠道[26],从而具有更为宽裕的资金操作空间来提升自身的资金借贷冗余,继而会提升其履约能力[27],在信贷市场上获得更多借贷资金的信用配给。第三,发达地区具有更强的人才集聚效应,人才竞争力度更大,通过“人才漏斗机制”使得人才进入门槛提高,因此相同学历背景的东部人才价值会优于西部地区,从而能够获得更好的信用评级和议价能力,使其能够拥有更多的借款优势。第四,发达地区政策引导力度更大,配套设施更丰富,能够为高学历借款人背书,这种积极的“信号效应”使其拥有超额信用配给,因此在借贷市场中可以更大程度上发挥其学历价值。第五,由于发达地区存在人才竞争效应以及经济压力的倒逼机制,一方面,相同学历背景的借款人在发达地区想要获得更高的职位来实现自身价值,从而在借贷市场中对自身价值“主动诉求”的意愿更加强烈。另一方面,在发达地区获得机会的难度大于欠发达地区,因此相同学历背景的借款人在东部地区所付出的劳动要远大于欠发达地区,致使借款人内心为了弥补这种付出差异,便会提高其心理预期,从而在信贷市场中“被动倒逼”地提高了其信用借贷需求,在发达地区供给充足的情况下,借款人能够获得更多融资。基于此,本文提出以下假设:
假设2:地区发达程度越高,信贷市场上学历价值越能发挥作用。
三、 研究设计
(一) 变量选择与数据来源
本文选取A网络借贷平台上发布的有效借款订单作为实证样本。由于该平台的借贷条件不受地区限制,客户分布涵盖了中国34个省级行政区域,而且对借款者不设门槛,只要通过实名认证均可申请贷款业务,因此其数据具有相对较高的代表性和随机性。此外,考虑到新疆、西藏、香港、台湾以及澳门地区的样本相对不足,为了确保实证结果的准确性,本文剔除了来自以上地区的数据以及一些信息不全的订单,最终共获得65534笔有效借款订单,能满足本研究的基本数据需求。其中各变量的构成与说明如下:
本文选择的主要被解释变量包括三个:该笔借款申请最终是否成功(success),借款成功后借款者是否如约还款(default)以及借款者设定的借款利率水平(rate)。核心的解释变量为借款者的学历水平(edu)。该平台上公布的信息除本文主要研究的学历状况以外,还有借款金额、借款期限以及受信方的收入状况、年龄、婚姻状况等信息,而这些信息都会对借贷者行为产生影响。出于实证模型的稳健性考虑,将这些相关变量作为控制变量放入实证模型。其中最主要的是受信方的收入状况,当控制了与借款者收入相关的变量后,借款者的学历则更多地表示为与借款者诚信相关的特征。具体变量定义与赋值处理详见表1。
表1 变量的定义及赋值处理
(二) 描述性统计分析
在建模分析前,本文先对数据进行初步的描述性统计分析。通过从平台上获得的65534笔有效借款订单数据(如表2),研究发现随着借款者学历的提高,其借款成功率不断增大,这说明授信方在选择借款订单时更青睐学历高的借款者。从违约率来看,随着借款者学历的提高,其违约率也随之降低,说明学历这一指标的确能够在一定程度上反映受信方的违约风险,学历越高的借款者违约风险越低。从借款利率来看,整体表现为学历越高、利率水平越低,说明放贷者在设定借款利率时会充分考虑到借款人的学历价值,从而设定一个较低水平的借款利率。表3为主要变量的描述性统计结果。
表2 样本数据的学历差异与借贷行为关系分析
表3 主要变量的描述性统计
(三) 实证模型
本文选择Logistics回归模型和OLS回归模型分别检验区域差异和学历因素对借款成功率、违约率和借款利率的影响。具体模型如下:
Pr(Success)i=β0+β1Edui+∑βControli+λi+Ii+ξi
(1)
Pr(Default)i=β0+β1Edui+∑βControli+λi+Ii+δi
(2)
Ratei=β0+β1Edui+∑βControli+λi+Ii+μi
(3)
其中,模型设计的变量含义以及赋值情况如表1描述,control表示的是一系列控制变量,β0表示截距项,ξ,δ和μ为误差项。由于个体在所属行业和地区层面可能存在很大的异质性,因此本文在模型中加入地区固定效应λi和行业固定效应Ii。
如果式(1)中系数β1显著为正,则说明学历越高的借款者更易获得借款。如果式(2)中系数β1显著为负,则说明学历能够很好地反映受信方的违约风险,学历越高的受信方其违约风险越低。如果式(3)中系数β1显著为负,则说明授信方在设定利率时会考虑借款人的学历价值,从而为学历越高的借款者设定一个较低水平的借款利率。
四、 实证结果
(一) 基准回归
本文先将获得的样本进行回归分析,主要研究借款人的学历差异是否会显著影响借款成功率、违约率以及借款利率。具体回归结果如表4所示。
表4第(1)、(2)列是对借款成功率的分析结果,当不加入控制变量时,学历(edu)的系数为0.45且显著为正,这说明本科学历对借款成功率的影响较为显著。进一步计算其边际效应,发现借款者学历每增加一个单位,借款成功率增加了56.36%。加入一系列控制变量之后,学历(edu)的系数降为0.12但依然显著为正,说明在考虑了借款者收入状况、婚姻情况等控制变量后,借款者学历每增加一个单位,借款成功率增加12.84%,即在其他条件相同的情况下,投资者更青睐拥有较高学历的借款者,高学历的借款者相比低学历借款者更易筹得借款,显示出授信方对借款者学历价值的“认可”。
表4第(5)、(6)列是对借款利率的分析结果,学历(edu)的系数显著为负,借款者学历每增加一个单位,借款利率降低88.16%(e^-0.1260)。说明放贷者在设定利率时会考虑到借款人的学历价值,表现为对学历价值的“认可”。综合表4(1)、(2)、(5)、(6)列数据可得,假设1a成立。
表4第(1)、(2)列和第(3)、(4)列有一个共同现象,加入控制变量后,学历系数的绝对值变小但检验均显著不为零,说明在模型中相较于收入,学历才是借款成功的重要因素。第(3)(4)列是对违约率的分析结果,尽管加入控制变量,学历(edu)的系数均显著为负,说明在很大程度上学历能够反映借款人的违约风险。与其他条件相比,学历越高的借款者,其违约的可能性越低,借款者学历每增加一个单位,借款违约率降低67.61%(e^-0.3914),假设1b成立。
表4 基准回归结果
(二) 学历价值的地区异质性分析
中国省份较多、分布较广,各地区之间经济发展状况及金融发展水平存在很大差异,因此学历价值对信贷市场的地区异质性影响分析就很有必要。基于此,本文整理出借款人工作所在地,并按照国家统计局划分标准,将数据分成东、中、西三组,从区域差异视角探究借款者学历价值的表现,具体实证结果如表5所示。
从第(1)、(2)、(3)这3列可以看出,贷款者对借款者学历认可程度呈现区域性差异。第(4)、(5)、(6)列是对借款者违约行为的分析结果,东部地区高学历的借款者相比西部地区高学历的借款者表现出更低的借款违约率。第(7)、(8)、(9)列是对借款人利率水平的分析结果显示,无论是在东、中部地区还是西部地区,学历的系数都显著为负,说明无论在哪个地区,在设定借款利率时,借贷双方都会考虑到借款人的学历价值。
综合以上分析可知,在我国信贷市场中借款者的学历能够发挥一定的价值,学历较高的借款者违约风险较低,且这一价值在东部地区体现得更为明显。此外,借贷双方都会考虑到学历的价值,从而设定一个较低水平的借款利率。而从授信方的角度来看,贷款者能够很好地捕捉到隐含借款者风险信息——“学历”这一指标,更倾向于向高学历借款者放贷,且对东部地区的高学历者更为青睐。(1)进一步为了证明两组之间的回归系数存在显著性差异,在分组回归的基础上,进行suest检验,验证了显著性差异的存在,后文的分组回归均进行了组间系数差异检验。
表5 分组回归结果
为更好地考察学历价值的地区异质性,本文进一步引入地区金融发展程度(finance)和借款人学历状况的交叉变量来探究学历价值地区差异的深层机制。其中,地区金融发展水平用地区金融机构年末存贷款余额占该地区GDP的比重表示。实证结果如表6所示。
第(7)、(8)、(9)列分别是东、中、西部地区借款利率的回归结果,交互项均显著为负,说明地区金融发展水平在借款者学历对借款利率的影响方面起到负向调节作用,但交互项的系数大小和显著性水平在区域之间并不存在明显的规律。
第(1)、(2)、(3)列分别是东、中、西部地区借款成功率的回归结果,交互项的回归系数均显著为正,说明地区金融发展水平在借款者学历对借款违约率的影响方面的确起到了正向调节作用;从边际效应和系数的显著性水平来看,该调节效果在东部地区更为明显,而中西部地区均有所降低,说明学历价值表现出区域的差异性是由于地区金融发展水平所导致的。
第(4)(5)(6)列分别是东、中、西部地区借款违约率的回归结果,交互项的回归系数均为负,且存在显著差异,东部地区的显著性水平最高,其次是中部地区,西部地区并不显著,说明在借款者学历对借款违约率影响的过程中,地区金融发展水平的负向调节作用存在地区差异。这一结果进一步证明了借款者学历价值呈现地区差异是由地区金融水平的不同所造成的。综上所述,假设2成立。
表6 金融差异的地区分组回归结果
(三) 内生性检验
本文因变量是否成功借款(success)和借款利率(rate)的观测样本均为65534,而因变量是否违约(default)的观测样本仅为15564,大量观测样本缺失可能导致该模型由于样本选择偏差而存在内生性问题。借鉴Yu等的研究方法,本文将采用Heckman二阶段模型来缓解潜在的内生性问题[28]。同时,借鉴Chrisman和Patel等研究,本文将分别选择以下三个工具变量:(1)个体i所在省份中披露是否违约的人数占比(report ratio1);(2)个体i所在城市中披露是否违约的人数占比(report ratio2);(3)个体i所在行业中披露是否违约的人数占比(report ratio3)[29]。选择上述三个工具变量主要有两点原因:一方面,个体i的同省份、同城市、同行业相似者披露是否违约这一数据的比例越高,就越容易产生同群效应,能够促进个体i也倾向于披露是否违约数据;另一方面,同省份、同城市、同行业相似者披露是否违约数据的占比并不会对个体i是否违约产生显著影响,因此上述变量符合工具变量的基本要求。
表7列示了本文Heckman二阶段模型处理内生性问题的检验结果。其中,模型(1)和模型(2)为本文利用个体i所在省份中披露是否违约的人数占比(report ratio1)为工具变量的内生性检验模型。结果显示:工具变量回归系数显著为正(coef.=1.998,p<0.01),表明同省份内其他个体披露因变量否成功借款的比率越高,个体i也更倾向于披露这一变量。同时,本文将通过模型(1)估计获得的尼米尔斯比率(Inverse mills ratio1)放入到模型(2)中作为控制变量,自变量学历(edu)的回归系数依旧显著为负(coef.=-0.742,p<0.01),表明在控制内生性问题后,学历对个体违约的负向作用依旧显著。
模型(3)和模型(4)为本文利用个体i所在城市中披露是否违约的人数占比(report ratio2)为工具变量的内生性检验模型。结果显示:工具变量回归系数显著为正(coef.=2.209,p<0.01),表明同城市内其他个体披露因变量否成功借款的比率越高,个体i也更倾向于披露这一变量。同时,本文将通过模型(3)估计获得的尼米尔斯比率(Inverse mills ratio2)放入到模型(4)中作为控制变量,自变量学历(edu)的回归系数依旧显著为负(coef.=-0.648,p<0.01),表明在控制内生性问题后,学历对个体违约的负向作用依旧显著。
模型(5)和模型(6)为本文利用个体i所在行业中披露是否违约的人数占比(report ratio3)为工具变量的内生性检验模型。结果显示:工具变量回归系数显著为正(coef.=2.016,p<0.01),表明同行业内其他个体披露因变量是否成功借款的比率越高,个体i也更倾向于披露这一变量。同时,本文将通过模型(5)估计获得的尼米尔斯比率(Inverse mills ratio3)放入到模型(6)中作为控制变量,自变量学历(edu)的回归系数依旧显著为负(coef.=-0.769,p<0.01),表明在控制内生性问题后,学历对个体违约的负向作用依旧显著。
表7 内生性检验
(四) 倾向匹配得分回归结果和分析
为了避免样本的“自选择”而引起的“选择性偏差”,本文进一步采用倾向匹配得分法(PSM)进行分析。由于PSM需要确定实验组和对照组,所以本文将东部地区设定为实验组,中西部地区设定为对照组,采用1:1无放回近邻匹配原则为对照组中每一个借款订单在实验组中寻找到一个与之匹配的另一借款订单。(2)用psestimate法对协变量的一阶形式进行筛选,确定匹配变量edu、income、wage、work、car-loan、 house、 marriage、 level、wamount、car、time、house-loan、rate。最后,基于匹配后的样本重新进行实证分析。
在实证分析前,先对匹配的平衡性假设进行检验,如表8所示,匹配后偏差均小于5%,对照组和实验组之间不存在显著性差异,表明匹配的效果较好,满足匹配的平衡性假设。图1是匹配前后实验组和对照组的分布密度函数图,从图中可以看出匹配后实验组和对照组之间的分布密度几乎一致,同样说明两组样本不存在显著性差异。
在满足平衡性假设的前提下,对匹配后的样本重新进行分组回归。就借款利率水平而言,无论是在东部还是中西部地区,学历的系数都显著为负,该结果和上文表5的分析结果表现一致。表9是匹配后学历价值的地区异质性结果,可以看出东部地区高学历的借款者相比中西部地区高学历的借款者表现出更低更显著的借款违约率,学历的低风险价值在东部地区表现得更为显著。表10是匹配后加入地区金融发展水平和借款者学历交互项的回归结果,回归结果与上文表6的分析结果一致,说明借款者学历价值呈现地区的差异化的确是因为地区金融水平的不同导致的。
图1 匹配前后密度函数图
表9 PSM分组回归结果
表10 PSM金融差异的地区分组回归结果
(五) 稳健性检验
为了避免伪回归,进行以下稳健性检验。首先,替换金融发展水平这一变量。表10的回归结果中地区金融发展水平采用的是金融机构年末存贷款余额占GDP的比重,在这里本文用樊纲构造的地区金融市场化指数来替代并重新进行回归,结果如表11所示,可以看出,当替换解释变量之后原结论依旧成立。其次,替换学历变量,采用学历的哑变量(3)本科及其以上取值为1,本科以下取值为0。代替之前的有序变量,对东部和中西部地区进行分组回归,结果如表12所示,该分析结果与上文保持一致。第三,用地区(east)和借款者学历(edu)的交互项代替分组回归,结果也依然不变(如表13)。
表11 稳健性检验1——替换金融发展水平
表12 稳健性检验2——替换学历变量
表13 稳健性检验3——地区交互项代替分组回归
五、 结论与启示
公民受教育水平对经济社会活动影响的研究成果丰硕,为我们理解学历价值的特征提供了重要参考,但现有的研究较少从信贷视角来考察学历的价值。网络信贷市场的迅速发展,不仅积累了大量包含受信者学历信息的借贷数据,也为这一研究提供了很好的契机。基于此,本文运用A网络信贷平台公开数据,探究借款者学历价值的存在性及地区异质性,得出如下结论与启示:
第一,在中国信贷市场中,借款者的受教育水平能够发挥其价值,表现为授信方能够很好地识别出借款者学历这一因素并表现出对高学历价值的“认可”。高学历借款者的借款成功率更高,并可获得较低借款利率。
第二,从地区异质性的角度来看,在东部地区,借款者的学历价值表现得更加显著,即高学历的借款者相比西部地区具有更低的借款违约率,且更易获得授信方的青睐。说明经济社会发展水平越高的地区,高学历借款者越有可能获得更高的教育回报率。
本文的研究结论对学历价值的存在性提供了有力支撑,证明了教育在信贷市场中的确发挥了其应有之义,且能够被授信方很好地识别和认可。教育一直是中国社会建设的重要组成部分,历年来在财政支出方面教育的投入巨大,但现有研究更多地还是关注教育对收入等层面的影响,较少地关注到信用这一层面,教育的目的不仅在于提高受教育者收入水平,其终极的目标在于对受教育者的道德约束以及诚信理念的提升。由于教育是一项较为复杂的系统工程,其最终效用不仅依赖于经费资源投入,而且与制度设计、人才环境、资源禀赋等因素也存在重要关系。此外,本文的结论也为信贷市场的风险防控提供了重要参考。借贷双方的信息不对称和识别困难是投资市场风险增加、资金错配的重要原因,如何在借款人的众多信息中识别出能够反映借款人真实违约风险的指标则对于贷款者而言具有重要意义。本文为贷款者对借款者学历价值评估提供了一定的借鉴思路。作为市场上容易观测的“学历”这一因素,可以帮助贷款者较为准确地识别出潜在的投资风险,合理地进行投资决策。