基于置信规则库系统P2P网络借贷市场投资者偏好测度
2018-10-10陈婷婷王应明
陈婷婷, 王应明
(福州大学 经济与管理学院,福建 福州 350116)
P2P网贷平台(Peer to Peer Lending或Person to Person Lending)为基于信用的借贷拍卖平台,主要是利用网络技术为借贷双方提供信息以及信贷服务。因暂时没有对该类金融中介出具专门的监管办法,P2P作为金融中介一直位于灰色监管地带,但平台无需抵押就可借贷的低门槛、债务人分布涣散的特点,导致平台风险问题一直颇受关注。我国作为P2P平台市场规模最大的国家,与此同时也面临着最严峻的行业风险问题。据统计,截至2016年4月,我国P2P行业累计问题平台数量为1598家,P2P行业淘汰率达到了39.7%。在这些问题平台中,跑路平台达到784家,占问题平台的49%。
银行贷款、资本市场债券以及P2P网贷都涉及三个主体,也即融资人、借贷人和金融中介,但这三种融资方式中投资人、借款人和服务中介之间的关系是不一样的。银行贷款中借贷双方是完全隔离的,资本市场中发行的债券等因有专门的监管承销、评级机构使得融资产品是一种标准化的债权债务关系。而P2P网贷平台仅作为服务中介,其主要是要求借贷人提供真实可信的个人信息,融资人可根据个人意愿选择相应的借贷人,风险仍由债权人承担,因此平台具有更广阔的选择空间。
本文基于P2P网贷平台中三方主体的相互作用,假设交易已完成的情况下,研究融资人偏好与平台标的设计之间的联系。
1 相关文献回顾
P2P网贷平台受到追捧的同时,其产生的风险也受到越来越多的关注,国内外学者也对此开始关注和分析,针对P2P网贷行业的研究可分为以下几个方面:
(1)分析P2P平台的商业模式及其对传统贷款行业的影响(Wang et al.,2009;Meyer et al.,2007;Galloway,2009)。P2P网贷市场通过互联网作为信息媒介,从而极大减少了借贷双方的信息不对称程度,并扩大了交易的范围,具有一定的包容性,且弥补了传统借贷市场的不足。
(2)Herrero-Lopez(2009)、Sonenshein(2010)、Zhan和Fang(2010)等从社会资本、互动程度、信用评分、声誉、隐私保护措施等方面研究了P2P网贷平台的效率。而平台标的大部分是通过像借贷人的信用值、工龄、借款用处确定其借款的利息值。例如借款人在Lending Club网站注册并填写FCIO得分、借贷值、用处、债务收入比、固定资产情况、借贷月份、居住地址等信息,平台在接收到相关申请后根据借贷人的个人信息情况评估其风险级别、借款利息以及手续费率等,从而完成一个融资标的的设计。
(3)Ryan(2007)、Larrimore(2011)、Lin(2013)等通过借贷人的视角,尝试分析借贷人的成功率受哪些决定性的因素影响。Puro等(2010)通过logistic回归表明贷款越低,则贷款成本也越低,且贷款成功率越高。李文佳(2011)根据实证分析结果表明,借贷人信用评分、借贷金额、利息以及期限等对借贷成功与否起到决定性作用。Leetal(2012)研究表明借款人和融资人互动越频繁,则会吸引更多的投资人,也即投资人有明显的“羊群效应”。
(4)Puro(2010)、Herzenstein等(2010)、Lee(2012)都从投资人的视角出发,研究融资人对债务人的信息了解程度与其是否投资之间的关系。由于网贷平台的特殊性,债务人和债权人之间信息严重不对称,债务人对自身情况显然更熟悉,故具有一定优势,而债权人只掌握了借贷人在平台上填写的资料,显然处于劣势。但是,融资人有选择借贷人的权利,其可结合借款人的公开信息以及自身的风险偏好选择予以借款的对象。P2P网贷平台需事先审核债务人填写资料的真实性,故融资人的劣势地位有所缓解。但若融资标的设计的不合理,即使融资标的的高利率对投资者具有吸引力,融资人在权衡高收益所要承担的风险后,其或许会更倾向于资金的安全性,个人投资者可能更倾向于低风险或适中风险的金融产品,这时,即使融资标的的借款利率很高,也会面临流标风险。故分析投资者偏好对平台产品的设计及提高融资成功率具有着重要指导意义。
也有学者考虑到融资人所面临的风险不仅仅来自借款人是否能够按时还本付息的问题,还来自于网贷平台的风险控制问题。一方面,针对借款人的风险,Hulme和Wright(2006)分析网贷平台的营运模式和信用认证机制与网贷平台的坏账率之间的关系。美国、英国和中国是网贷平台发展较快的国家,但是美国和英国具有完善的个人征信系统,故P2P平台仅需线上认证即可,且平台在保持较低坏账率的同时平稳运行。然而,中国面临的状况较为复杂,因其缺乏全面、完善的个人征信体系,网贷平台必须对借款人的信息真实性和风险控制机制严加把控,进而降低P2P平台和融资人所承担的风险。
另一方面,针对网贷平台自身的道德风险问题,主要的研究热点是对设计平台监管制度的讨论。对于美国和英国而言,因其完善的金融监管制度,美国和英国平台模式相对简单,传统的金融监管制度完善,故已有相应的平台的监管条例。然而,我国P2P平台数量多且模式多样化,现阶段仍属监管的灰色地带。相应的监管条例的制定设计还在艰难的探索阶段。
通过文献回顾可知,现阶段针对网贷平台中融资人的风险研究较少,然而,融资人作为网贷平台运营的主体之一,其行为会对债务人、运营中介产生或高或低的影响。笔者认为,融资人的风险偏好、平台产品结构设计有着紧密联系,并且这些也会影响P2P网络借贷平台的运营风险,故监管条例的制定也需要考虑保证融资人、借款人和借款平台之间的良性互动。融资人的偏好、借款人、网贷平台相互作用,若平台未能够正确评估融资人的偏好设计出不具有吸引力的融资标的,增加了融资门槛,成功率下降,且更有甚者会增加平台的运营风险。反向而言,P2P平台有责任做好融资者的风险偏好评估工作,降低借贷双方的信息不对称程度。
本文就是基于这样的想法,构造了一个从投资人角度对融资标的各项属性进行评价的模型。因涉及的影响因素较多,如何对其中多个影响因素综合评估,得到其相对应的排序来确定融资人的偏好问题,属于多属性决策范畴。目前的研究方法主要包括层次分析法(AHP)[2]、模糊集[3]、D-S证据理论[4-5]和证据推理方法等。但是证据推理方法因其只能够对彼此独立的信息进行整合而具有很大的局限性。在实际应用中,信息与信息之间多为复杂的非线性关系,基于此,文献[12]提出了基于ER算法的置信规则库(belief rule-based,BRB)系统,因其处理复杂信息的优越性,此后很多学者开始将研究焦点转向BRB系统的优化及应用等,在很多领域如项目组合、临床诊断、产品优化涉及等都有重要的作用。在此,笔者利用发放调查问卷的方式得到融资人的偏好数据,建立相应的置信规则库,从数据中挖掘规则,构建融资标的的评价模型,计算不同融资标的的综合得分并排序,从而测度融资人偏好,为产品的设计提供重要的参考信息。通过平台融资产品产品结构对不同偏好的投资者的吸引力程度,提取融资产品中影响融资成功率的决定性因素。
2 置信规则库系统(BRB)
2.1 系统模型
图1 指标模型
根据图1,多属性决策是会涉及到多层指标。也即A1,A2,…,Ak这k指标构成了A这个总体,而对于第i个指标Ai,其由mi个下层指标Ai1,Ai2,…,Aimi构成。这是因为Ai有时不能直接得到,需根据其下层属性Ai1,Ai2,…,Aimi计算得到,Ai和Ai1,Ai2,…,Aimi是非线性关系,可用规则表达。
2.2 规 则
一般地,知识库R=〈U,A,D,F〉。其中,U={Ui,i=1,2,…,T}为前驱属性集;A={Ai,A2,…,Ar},Ai={Aij,j=1,2,…,Ji=|Ai|}为Ui的值D={Dn,n=1,2,…,N}为结果属性集;F为逻辑函数。定义规则Rk:
也即,规则:if投资进度影响程度为“中等”∧互动程度影响程度为“中等”,then羊群行为影响程度为{(高,0.21),(中,0.66),(低,0.13)}。这也就是说,若前驱属性投资进度和互动程度影响程度都为“中”,那么后驱属性羊群行为的影响程度为“中”的信度是0.66,为“低”的信度是0.13,为“高”的信度是0.21。
规则权重代表规则的重要性,而属性在这条规则中的重要程度由属性权重表示。若问题是明确的,可通过专家或决策者的领域经验知识确定规则。在本文中,规则通过Weka软件进行挖掘。
2.3 关联规则
置信规则库主要在于通过搭建相应的规则库系统,表示属性之间的因果关系。文献[13-17]主要是根据专家的领域经验知识得到相应的规则库。但是,第一,因专家的有限理性知识,当系统规模很大且更复杂时主观定出规则便不再适用;第二,这是在有专家知识可供参考的情况下,但有些行业可能并没有可提供决策支持的专家。因此,通过关联规则挖掘规则,从而构建规则库是很有必要的。
在此,我们假设项集I={I1,I2,…,Im},D为事务T的集合,并且每个事务T是项的集合,从而T⊆I,若A表示一个项集,则当且仅当A⊆T时表明事务包含A。
关联规则可用A⟹B这样的关系阐述,也就是说ifAthenB的形式,在这里A表示规则前件,B表示规则后件,A⊂I,B⊂I,A∩B=∅。在事务集D中,若A⟹B成立,支持度为s,s表示D包含A∪B概率,也可表示为s(A⟹B)=P(A∪B)。
若A⟹B成立,置信度为c,这里c表示D中包含A的同时包含B概率,也可表示为c(A⟹B)=P(B|A)。
2.4 规则推理
φ积(a,b)=ab,φ和(a,b)=a+b-ab。
本文规则的逻辑关系均为概率积,故我们选择加权乘法聚集函数计算αk:
(1)
从而第k个规则的权重为:
(2)
其中,θk为规则的权重。
由此,运用ER算法对规则进行推理:
mj,k=ωkβj,k,j=1,2,…,N
(3)
(4)
(5)
(6)
进行聚合,有
(7)
(8)
(9)
(10)
(11)
(12)
在此,属性结果的第j个值表示为Dj;具有置信度βj;未知信度用βD表示。基于效用函数,利用IDS软件求解得出方案的最终得分为:
(13)
3 基于BRB系统的投资者偏好测度
3.1 投资者偏好测度指标体系构建
在P2P网络借贷市场,平台要想长期经营,或是借款人希望成功借款,必须及时了解市场行情,了解市场需求,关注投资者偏好。了解投资者偏好的前提是明确投资者决定投资与否时关注的因素,即对融资标的和借款人的评价指标。
网络借贷平台的模式呈现多样化的态势,标的的设计也各具特色,而投资者决定是否投资多是通过对平台提供的信息感官评审。但投资者在进行投资时难以对产品结构的所有因素进行综合权衡,况且属性的重要程度有高低之分。除此之外,因素之间是复杂非线性关系。例如,投资者的偏好与融资标的的利率,不一定是利率越高投资者越喜欢,因此可以用规则表示这种复杂非线性关联关系,本文运用置信规则库系统测度网络借贷市场的投资者偏好。
为避免模型过于复杂,根据已有文献以及专家访谈,选择对投资人偏好影响较大的因素建立模型,如图2所示。
图2 投资者偏好测度BRB系统
此模型包括5个BRB子系统:参与度和互动程度决定羊群行为;信用评级、债务收入比、是否自有房产、年龄、婚姻状况决定借款者个人情况;借款金额、借款期限、还款方式、还款利率、自我陈述决定借款信息;是否有朋友投标和背书决定社会资本;历史流标次数、历史借款成功次数、历史借款失败次数决定历史信息。
3.2 数据收集
本文主要是研究网络借贷市场投资者受融资标的吸引因素,考虑数据的难获得性,故而采用发放调查问卷进行数据收集。
3.2.1 问卷设计 通过参考相关文献和专家访谈,设计每一个属性的评价等级。为避免产生过多的规则,将属性信用评级定五个评价等级,剩下的属性均为三个评价等级。
融资人对于羊群行为的评估体现在融资标的融资进度和借款人的互动程度,投资者可以直观地感受到良好、一般还是差。借款人信用评级分为五个等级:AAA、AA、A、BBB、BB,将偏好分为非常愿意、愿意、一般、不愿意和非常不愿意。
为获取足够的数据,对基于置信规则库系统P2P网络借贷市场投资者偏好的测度模型进行应用,本文结合问卷调查法和网络调查法,对有过在P2P网络借贷平台的进行投资的投资者进行问卷调查,通过QQ、微信等网络通讯工具,发动有过投资经历的同学、朋友配合调查,共收取270余份数据。
3.2.2 数据预处理 构建置信规则库关键在于从数据中挖掘规则,针对融资者偏好进行测度,多为定性属性,很难从平台获取客观数据,故本文采用网络调查和线下调查相结合的方法,共收集数据270余份,经过数据处理,将有漏填或填写前后矛盾的问卷去除,最终得到有效数据141份进行试验。
3.3 P2P网络借贷市场投资者偏好测度实例
用SPSS分析出结果如下:
当按照“特征值大于1”和“累积覆盖超过80%”的原则时,选择前3个主成分符合要求。
personal situation(借款人情况)
borrowing terms(借款信息)
3.3.2 各子系统规则库构建 截取羊群行为属性中部分数据为例,见表2(投资进度:low影响程度小,medium影响程度一般,high影响程度大;互动程度:low影响程度小,medium影响程度一般,high影响程度大;羊群行为:low影响程度小,medium影响程度一般,high影响程度大)。
将数据导入Weka中,运用关联规则,结果如下:
Best rules found:
1.schedule=medium interaction=medium 32⟹herd degree=medium 21 conf:(0.66)
2.interaction=medium 60⟹herd degree=medium 38 conf:(0.63)
3.schedule=medium 56⟹herd degree=medium 34 conf:(0.61)
4.schedule=low 48⟹herd degree=medium 27 conf:(0.56)
……
在运算结果里选取后件为结果属性herd degree的蕴含式,如结果2:
schedule=medium interaction=medium 32⟹herd degree=medium 21 conf:(0.66)
此结果的意义是:数据库中有32个事务同时包含schedule=medium interaction=medium,在这样的事务中同时包含herd degree=medium的有21个,那么支持度s=32/141=0.23,置信度c=0.66。统计包含schedule=medium interaction=medium余下的事务,同时包含herd degree=high的有7个,包含interaction degree=low的有4个,则此蕴含式schedule=medium interaction=medium 32⟹herd degree=high 7 conf:(0.21);schedule=medium interaction=medium 32⟹herd degree=low 4 conf:(0.13)。通过梳理整合,置信度c也就是规则结果的置信度βjk用规则表示为:
if schedule=medium interaction=mediumthen
herd degree={(low,0.13),(medium,0.66),(high,0.21)}。
另规则权重等同于支持度s,θ=s。由此可得规则:
If投资进度“中”、借款人与投资者互动程度“中”then羊群行为影响程度为{(影响大,0.21),(一般,0.66),(影响小,0.13)},此规则权重为0.66。
同理可得羊群行为的规则库,见表3所列。
以层次T1为例,对于子系统羊群行为,输入
schedule:(high,0.47),(medium,0.42),(low,0.11)
interaction:(high,0.6),(medium,0.27),(low,0.13)
(4)计算激活权重ωk。由(1)式αkk=1,2,…,9,再由(2)式计算ωkk=1,2,…,9。
(5)规则整合。将βjk、ωk的值代入(3)~(12)式,因工作量过于庞大,本文利用MATLAB计算。运算得T1的herd degree结果为:(high,0.26),(medium,0.6197),(low,0.123)。
同理计算borrowing terms系统的结果为:(high,0.7029),(medium,0.2687),(low,0.0284)。
(6)计算得分。取线性效用函数,u1=0,u2=0.5,u3=1,代入(13)式计算各层次总得分,结果见表5所列。
3.4 结果对比与分析
从收集的数据中统计题项“总的来说,你觉得自己对以下每个影响因素进行的影响程度进行打分?T3.影响大,T2,一般,T1,影响小”。各子系统统计得分和排名情况见表6。
表3 羊群行为子系统规则库
表4 3种层次标的的2种属性值
表5 各子系统计算得分结果
表6 各子系统统计得分结果
表5为利用置信规则库系统计算得出的结果,表6是利用问卷统计的结果,对比表明利用置信规则库计算得到的结果和利用问卷统计得到的结果基本一致,表明问卷设计的合理性,同时在对比中也看出,2种方法对personal information和historical information的排名不同,主要是数据量较少的原因。此外表5问卷计算得分和表7利用人人贷数据计算得分对比结果排名一致,表明利用关联规则挖掘规则并构建规则库的可行性和合理性。
从结果来看,融资人最关心的是融资标的中诸如贷款额度、贷款利息、还款方式、贷款期限、自我陈述这些信息,故平台在设计标的时应要求借款人对这些信息表述详尽,而借款人情况及历史信息属性也会显著影响投资者做决策。相较于统计结果,本文通过关联规则理论运用Weka软件来挖掘规则,避免了专家打分法的主观性。此外,因投资者对融资标的偏好与其各属性值存在着非线性的因果关系,故运用置信规则库系统合理测度投资者偏好,这样的系统也可以为后续融资标的的设计提供决策。
表7 人人贷数据中各子系统计算结果
注:数据来自2010—2015年在人人贷注册申请借款者相关数据。
综上可得,利用置信规则库测度P2P网络借贷平台投资者偏好是合理有效的,故而可据此有针对性地进行产品研发设计。产品经理可考虑多个产品,将备选的多个产品输入模型计算得分和排名,可据此选择排名较高的产品方案,准确定位产品,为融资人提供合理且有吸引力的融资产品。
4 结 语
国内P2P网络信贷平台快速发展,作为具有普惠、包容特点的互联网融资方式,是传统金融体系有益的补充。但目前仍面临两大问题:第一、平台融资成功率仍然相对较低;第二、P2P网贷平台高额的融资成本严重阻碍了市场的健康发展。
本文通过构造了一个从投资人角度对融资标的进行评价的模型,通过构建相应的置信规则库,关注融资人偏好和融资标的的设计对三方主体的相互作用。若平台可根据融资人的偏好差异化地给予相应的融资建议,这将非常利于融资人认清适用于自己的投资方法,理性投资,降低投资风险。与此同时,若平台结合融资人的偏好模型进行融资产品的设计,则可实现融资效果最优化。平台可据此更好的匹配借贷主体,从而提升平台的运营效率。
投资者偏好对产品的研发设计、市场的准确定位、细分市场的及时抢占都有着不可忽视的影响,故而基于置信规则库系统的投资者偏好模型有着重要的应用价值。