基于用户行为数据的互联网征信可行性研究
2016-06-12张璇陈龙张李叶子
张璇 陈龙 张李叶子
摘 要:随着网络的发展,互联网征信的优势日益突出,而传统征信业务的不足也限制了借贷业务的发展,因此互联网征信也就更具有必要性。本文详细介绍分析了互联网征信的可行性,并结合XX的实际数据,对齐征信模型的构建可行性做出了评估,并根据评估结果提出了互联网征信业务的优势,也发现了其问题和不足,并提出了改进的方向和建议。
关键词:征信;XX;数据;互联网
传统征信业务虽然已经历了较长的发展时间,但随着技术的进步和时间的推移,其征信方式的弊端和缺陷也不断显现出来。而在互联网技术飞速发展的今天,互联网征信模式应运而生。互联网征信集合了大数据、云计算和人工智能等技术的优点,将很好的解决传统征信目前存在的弊端。例如互联网征信手收集的是用户在互联网上的行为数据,这些数据是动态和即时的,并且数据来源十分广泛,从而解决了评估指标单一和传统征信的覆盖率有限的问题。
然而,尽管互联网征信可以解决传统征信的诸多弊端,但互联网征信尚处于起步阶段,因此还存在许多亟待解决的问题。主要表现在如何充分利用已有的数据,合理建立自己的评估体系,以及这种综合性的评估方法是否能够更好的反映用户的信用情况。这对于我国互联网征信体系的发展和完善也将具有重要意义。
一、网络行为数据与个人应用的关系
(一)互联网用户行为
由于互联网产品的多样化,用户的行为也是多样化的。根据用户使用的功能,可以统计用户各互联网行为的市场规模。从下表中我们可以看到,大部分互联网应用的用户规模都是呈增长的趋势,网上支付、网上炒股或炒基金等金融相关业务更是具有较大幅度的增长。这说明互联网征信具有较大的可行性,也十分有必要进行互联网征信。
(二)网络行为对个人信用的反映
对于个人信用的定义,我们采用经济学中的定义,经济学中的信用是指授信方与受信方之间遵守契约的能力,当这种能力越高,意味着个人信用水平越强。而征信则是依法、合理的对用户行为等信息数据的收集、记录,并通过适当的模型,评估个人或企业的信用水平。
用户在互联网的使用过程中会留下许多可收集、记录的行为数据,并且这部分数据规模大、种类多,所以互联网征信的关键就在于建立合理的征信评估模型
二、信用5C分析法
西方银行在征信时,总结归纳出了5C模型,这也是在正西体系中较为经典的一个模型。即通过品质(Character)、能力 (Capacity)、资本 (Capital)、抵押(Collateral)和境条件(Con-dition)五个方面对用户进行全方面的信用评估。
(一)品质
是指用户履行偿债义务的可能性,品质直接决定了账款的回收速度和回收数额。是评估顾客信用品质的首要指标,也是信用评估最为重要的因素。
(二)能力
指用户的偿债能力,主要是用户流动资产以及负债的情况,其判断依据通常是客户的偿债记录等信息。
(三)资本
指用户的财务实力和财务状况,表明顾客可能偿还债务的背景,如负债比率、有形资产净值等财务指标。
(四)抵押
指用户无法或拒绝偿债时能被用做抵押的资产,这对于首次交易或信用状况有争议的用户至关重要。
(五)条件
指可能影响用户付款能力的经济环境,如用户在困难时期的付款历史等信息。
三、互联网征信评估模型
互联网的用户行为在品质、能力、资本、条件等四个维度方面具有丰富的数据,但无法提供经济抵押等数据。实际上,在现实的征信中,抵押物也是限制信贷业务发展的重要因素,很多人往往因为缺乏抵押物而无法进行信贷业务。但是互联网上的用户沟通交流更加密切,也就是具有更多的社交行为。而社交行为也可以反映出用户的个人品质,并且社交的成本也将影响用户偿债的可能性,因此我们可以引入新的维度“社交”替代“抵押维度”,构成新的征信模型。
四、 XX征信
作为互联网征信机构,XX征信依据用户各种互联网行为数据,运用大数据分析技术呈现用户的个人信用情况。因此其信用报告的准确性在根源上取决于其征信数据的准确性与全面性,因此我们在本章将研究XX的用户行为数据,即征信数据能否支持其信用评价体系进行准确的信用评估。
(一)用户行为数据分析
1、数据来源
互联网应用是用户互联网行为数据的载体,因此我们将通过XX的产品线来分析XX征信可用的用户数据来源。总体来看,XX可能获得用户网络行为数据的业务可分为其自有业务,以及其入股或兼并的其他业务。
(1)自有业务。XX自有业务十分多元化,包括社交和通信服务AA,WX;社交网络平台AA空间,XX微博;娱乐业务XX游戏,文学,动漫,音乐,视频;支付平台CFT,WX支付以及浏览器,AA邮箱等,这些均在市场中有极强竞争力,占据大量市场份额的业务是XX征信产品的主要数据来源。
(2)入股或兼并的其他业务。这些业务主要通过收购股权进入已获得市场地位的应用,或与其达成战略合作来实现。如YL,TC,JD等。
2、数据分类
根据CNNIC《第37次中国互联网络发展状况统计报告》对中国网民各类互联网应用的分类,将XX可用作个人征信数据的用户数据进行整理,同时统计其各类应用用户数/成交额/营收规模等指标市场份额,并将统计出的XX用户行为数据按照前文基于互联网的信用评价5C模型分类(市场份额小于1%的不计入统计):
可以看到XX产品线几乎覆盖5C模型中的所有维度,且在每个维度都能提供多种数据,在一定程度上能保证征信数据的全面性。
3、数据评价
为衡量这些数据在XX征信体系中的作用,可以从数据规模和数据多样性两个角度研究XX的用户行为数据。数据规模决定了数据的整体价值;数据的多样性决定了对用户信用评价的精确性,因此作出如下假设:
(1)每位用户在每个应用上产生的可用于征信的数据量相等且对信用评估同样重要;
为方便计算,将该值其简化为1数据/用户/应用,由此可得模型中每个维度的数据规模=∑该维度中某应用市场份额*该市场用户总数。
(2)每个应用上产生的数据都是结构化,可分析的;
4、数据规模评价
根据假设1,可得有统计数据的各行为用户规模如下:
通过对数据的描述,可以看出XX全面的战略布局,覆盖几乎各类主要应用市场的产品,与其他公司的深度合作都为其大数据征信提供了数据规模上的有力支持,使其无论从哪个维度上评价,都具有较高的数据整体价值,具体特征有:
(1)WX和AA为XX征信提供了大量用户数据,使其在即时通信和社交方面具有巨大的数据规模优势;
(2)XX新闻,视频,AA音乐的高覆盖率为多维度扩充数据规模提供了支持;
(3)品质维度涵盖数据种类多,数据规模显著大于其他维度;
(4)由于缺少网上银行,互联网理财等方面应用,且WX支付及CFT的用户渗透率高,使用率低,资本及条件维度数据规模相对较小。
5、数据多样性评价
根据假设2,对各维度数据多样性进行评价。假设5个维度中数据规模最大的维度中的数据是完善且充分的,即数据多样性最高为1。以其为基准,计算其他维度数据多样性系数。在上一部分的评价中,品质维度数据规模最大,故将其规模下的多样性系数作为1,由此可通过:
通过分析可以看到,资本与条件维度的多样性较其他维度差,为了提高整体评估的精确性,应扩充资本与条件维度的数据。
整体来看,XX征信的用户行为数据在各评价维度上均有明显的规模优势和多样性,不存在某一维度上数据十分匮乏影响信用评估的情况,其互联网征信体系从用户行为数据这一角度考虑,是完全可行的,其信用评估报告是准确,可信的。XX以AA和WX为基础,在此平台上发展新闻,视频,音乐及文学等均在市场中有很强的竞争力,再加上近年的资本运作,入股YL,SG,DZ,JD等,其全面的战略布局,几乎覆盖各类应用市场的产品线为其在各维度上进行准确,可信的信用评价提供了巨大的支持,这也是XX在拿到个人征信业务牌照之后,能迅速上线三大信用产品的原因。
(二)面临的问题和发展建议
虽然XX的网络征信有很多优势,但在研究中,我们也意识到了前人多次提到的数据孤岛,信息壁垒问题。当我们看到XX在即时通信领域的绝对优势时,也应当注意到,在传统征信中最为核心的金融领域数据上,明显处于劣势。拥有这些数据的少数几家占有支配地位的企业,由于竞争关系和自身需要,很难将这些数据共享或出售给XX。这些都会成为制约XX信用评估准确程度和未来发展的瓶颈。
因此,通过协商,谈判等确立各方都满意的利益激励机制,开展深度战略合作,才是共享涉及各企业核心竞争力的数据库的关键,AL2014年与7家银行合作开展的无抵押贷款计划也为打破线上线下信息壁垒提供了参考。XX入股JD的战略也体现出其对网络购物方面数据的重视,接下来再着重扩充涉及资本与条件维度中的金融,支付领域数据是提升XX征信产品准确性的关键。
(作者单位:北京邮电大学)
文章受北京邮电大学大学生创新研究基金资助
参考文献:
[1] 刘新海,丁伟. 大数据征信应用与启示——以美国互联网金融公司ZestFinance为例[J]. 清华金融评论,2014,No.1110:93-98.
[2] 邓舒仁. 关于互联网征信发展与监管的思考[J]. 征信,2015,v.33;No.19201:14-17.
[3] 梁春亚. 互联网金融背景下征信体系建设的国际经验及启示[J]. 征信,2015,v.33;No.19302:56-60.
[4] 耿得科,梁文娟. 大数据对传统资信评估的影响[J]. 征信,2015,v.33;No.19403:20-24.
[5] 互联网征信陷“数据孤岛”[J]. 金融科技时代,2015,No.23705:21.
[6] 方增平,叶文辉. 互联网金融背景下发展新型征信机构的思考[J]. 征信,2015,v.33;No.19605:37-40.
[7] 黄余送. 网络借贷与互联网征信[J]. 征信,2015,v.33;No.19605:14-19.
[8] 袁新峰. 关于当前互联网金融征信发展的思考[J]. 征信,2014,v.32;No.18001:39-42.
[9] 陈冬宇,李伟军,彭中礼,徐赟. 网络借贷引入第三方个人征信的必要性探讨[J]. 征信,2012,v.30;No.16201:41-44.
[10] 刘颖. 个人信用征信中隐私权保护研究[D].西南财经大学,2005.