“数据画像”的漫长之路
2015-03-30刘颖
刘颖
相比其他国家,我国的互联网发展给了民营机构得天独厚的环境,所以关于大数据,将它们作为征信业起步的重要力量,似乎顺理成章,又有点特立独行。
“画像”的数据组合
其实,关于大数据,互联网企业基本上都已经有所建树了,只不过,作为销售行为的一种工具,并不能摆在台面上炫耀而已。
我曾私下与一个做P2P的朋友聊天,他们也有自己的贷款业务,而且这些贷款往往针对消费行为,金额不大,客户群体也很繁杂,但是审核手续却极为方便。这一切的运营都基于大数据的分析结果。
他们之所以能获得消费类的数据,得益于最早他们为银行提供pos机和ATM机的服务,可以收集到每一张卡的消费习惯,而这第一手的原始资料足以支撑小额的消费类贷款比较主要的分析。之后,他们与一些有实体店面的企业进行合作,当顾客需要购买大金额的商品时,就可以提供小额的贷款服务。这样形成一种低成本却非常有效的模式。
网上消费的数据则更为精细。首先是在网上注册的个人信息,包括名字、身份证号、电子邮箱、电话号码、地址之类的。然后通过网上支付平台,除了收集支付类活动数据,其实还有相当一部分非支付类活动数据。从这类的网上商城上还可以获得消费者反馈、商户信用评分、商户售卖物品统计、争议和投诉。这就是更为庞大的数据体系,基本上可以描绘一个人的网上消费习惯了。
如果再加上社交行为,比如一个人的在线时长、登录行为、虚拟财产、即时通信、SNS、电商交易、虚拟消费、关系链、游戏行为、媒体行为和基础画像等数据,这就是一个较为完整的线上数据了。
所以这次央行邀请了八家民营机构参加征信活动,他们都是在各领域上称霸一方的巨头,涉及的业务非常全面,同时还有一定的联系,意图似乎就是为了打通独立数据间的通道。
你愿意被“画像”吗?
健全数据当然是好的,但是更多的担忧指向了数据安全。虽然出于安全考虑,2013年1月出台的《征信管理条例》,对个人信息的采集做了明确的限制:比如禁止征信机构采集个人的宗教信仰、基因、指纹、血型、疾病和病史信息;不得采集个人的收入、存款、有价证券、商业保险、不动产的信息和纳税数额信息。但是我们的生活有越来越多双眼睛看着,我们的很多小习惯都被一些机构记录着,一个完整的数据画像真的是我们每个人的意愿吗?
而且我们怎么知道这些机构是否安全呢?远的不说,2014年就有几起事件让大家难以忘怀。1月,支付宝前技术员工涉嫌将多达20G的用户数据非法贩卖给他人;2月17日,乌云漏洞报告平台又爆出淘宝存在重大安全漏洞;紧接着,携程网又遭遇“安全门”事件,大量用户银行卡信息泄露,弄得大家人心惶惶。
还有,哪些因素能客观地反应出我们的信用等级呢?很多媒体担忧,未来我们是不是需要谨小慎微,因为滴滴打车的爽约记录、骗取保费时伪造的个人信息、网店贩卖假货的差评、预定饭馆却“放鸽子”都有可能影响我们的信用数据。
据说,美国主要从事个人征信的FICO,它采集的数据也包括日常的购物出行、水电费、地铁逃票等因素。但是因为不同数据纬度间的逻辑关系,也很有可能产生冲突,最终可能导致结果失真。美国ZestFinance公司曾经使用了社交网络上的7万多个变量估算个人征信,得出了“填表喜欢全部用大写字母的人违约率更高”等诸多有趣结论,但最后的征信评估也仅55%左右的准确度。所以我国未来的征信标准到底是什么呢?
这些数据最终需要被买卖,才能形成市场,但是将客户的资料进行买卖,本身就容易产生不小的分歧。没有严谨的法律来挟制,必定弄得“天下大乱”。最注重人权的美国,针对征信行业有17部相关法律,所以它的个人征信已经发展的相当成熟,从贷款、信用卡到租车买房,甚至购买枪支都有所做用。这么看来,我们还有很长的一段要走。
不可或缺的“画像”
但是个人征信是未来金融行业中一个不可或缺的部分,尤其是在P2P蓬勃发展的今天。
目前,央行的征信系统覆盖的人群和信息完整性还非常低。一些学生群体、蓝领工人、个体户、农户、自由职业者等,因为数据较难采集,所以常常被信用体系忽略掉,但是他们并不是没有对金融业的需求。
同时现在我们的金融体系中又多了P2P和民营银行,一个准确的、得到公允的征信数据,不仅能降低这些机构的信贷成本,同时无形中也将其很多操作进行了规范,起码在风控方面,监管机构就有依据去规范越来越蓬勃的“非正规军”。
以后或许还有这样的场景。租房交易中,通过个人征信证明来进行相互的选择;求职时,也可以凭借信用报告获得单位的认可;甚至在相亲的过程中,相比身份证,一份漂亮的征信证明可能会起到更重要的作用。当然这些也只是一种遐想,但是往往一个新事物的诞生,都是从这些看似不切实际的遐想中开始的。endprint