APP下载

大数据于金融领域的思维与实践

2014-02-04雷涛

中国发展观察 2014年6期
关键词:客户金融用户

◎雷涛

大数据帮助金融企业提升IQ

目前大数据在互联网金融领域主要解决三个问题:(一)解决运营交易成本过高的问题。网银降低了20万个网点成本,而阿里主要是把信用和抵押进行置换。(二)提供流动性,解决资产与负债流动性不匹配的问题。P2P就是将存款进行转让,比如众筹。(三)拓展4000万中小微企业市场。互联网金融出现以后,把市场体量做大了,不只服务于现有客户,还可以把碎片化的需求和供给进行整合,进而细化渗透到中小企业市场。同时,我们还关注到了金融高端客户市场,即理财的运营市场。海外金融机构提到,对于每一位高端客户,与其接触的次数及准确接触的能力都是非常有限的。那么,怎样把理财内容和手段精准提供给每一位高端客户,这是大数据可以解决的问题之一。

大家都在谈互联网的优势,觉得互联网很美妙。但是要研究互联网,一定要面对互联网自身的问题,其中最具挑战的就是信息过载问题。在互联网上,信息以WebPage的形式呈现,等待人们去点击,那么互联网经济的主体必然是注意力经济。例如,2013年1月,财经金融类网站总访问次数381539万,访问时长9122万小时,即10413年。如何从这些过载的信息中获取被稀释了的数据价值?这是当前互联网经济面对的最具挑战的一个问题。

是不是互联网就是终极形态?我们给出了一个经济范畴的定义,即这样的模式怎么去挣钱。互联网早期最简单的业务形态是2B,即企业向客户出售产品或服务,以直接赚取金钱为目的。衡量指标就是产量等概念。第二个时代就是2C,即互联网经济下,企业尽可能多地发展用户,不以直接从用户处赚取金钱为目的,希望通过后向收费或者发掘用户终身价值等方式赚取利润。这个时代,像谷歌、Facebook等公司主要是经营用户,衡量指标是用户体量。

未来我们看到的将是2D的业务形态,也就是大数据经济。数据将是未来企业的重要资产。企业通过数据创造新的商业模式,或直接通过数据售卖以及利用数据提供增值服务获得巨大利润。在这一时代,海量用户和良好的数据资产将成为未来核心竞争力与收入的重要来源。这个数据未必是靠人的点击。比如,你可能与运营商没有任何交易往来,但是手机的传感器在持续记录你的位置信息,这个信息在不断地跟基站通讯,你的行为就已经被运营商捕捉了。所以2D更多的是以数据为驱动力的生意模式。这种生意模式可以把附加值扩展得很大。

以上是对互联网经济形态的分析。具体说,就是大数据更多的是帮助金融企业,包括传统银行获得金融IQ,即接触市场和用户的权利和能力。我们认为,传统银行的数据价值远大于互联网公司。其实,金融企业很多先下的数据沉睡在数据库里,而这些数据的价值远远大于阿里数据的价值。

金融企业如何拥抱大数据?

大数据可以帮助金融企业解决信息不对称,及营销、定价、风险和欺诈问题。从我们做过的案例中发现,主要体现在以下三个方面:

(一)市场营销。包括交叉销售、二次销售方面。体现在如何进行客户挽留、客户价值评估等。例如给保险公司做了全量的数据处理后,就可以实现很多财险和寿险的匹配。还包括客服投诉评估和产品投放评估等。

(二)信贷和风险。主要是信用分配、风险评估、实施授权、风险干预和欺诈识别等。

(三)预测与估价。包括周期行为分析、量化分析、流失分析、催收分析等。

实现路径的关键点,就是“去IOE”(替代IBM小型机、Oracle数据库、EMC存储)。完备数据是核心,处理一千倍以上数据规模,需要颠覆性的系统架构才能解决。我们为一家大型股份制银行做完备数据,帮助客户看到过去需要通过业务规则、银行家的经验形成的业务判断,现在通过机器学习的方式,发现了很多新规则。比如异常交易、欺诈等,很多都是通过数据本身的特性发现的。科技创新本身带来的深刻变革就发生在今天。现在太多银行用僵化的表结构、或用字段的方式去对客户、市场、业务规则做描述,而新的互联网的思路用一张表就处理完成。这种新的结构,完全依赖于云计算新的方式。

另外,金融业本身也在发生业务革新。银行属性从记账式的卖方更多转向风险、欺诈、定价的买方属性。而这些特点很多都是非线性的,需要大量的计算能力。业务驱动加之科技目标驱动,使得新的基础设施部署成为必然。

舍恩伯格的《大数据时代》有一个核心的概念——全量。大数据首先要数据全量在线。现在太多系统都是孤立的,银行的对公、对私,还有卡业务都是分开的,当把所有业务糅合在一起时,就会发现很多客观规律。有一个保险公司的案例,这家保险公司以前只能做抽样,对高端人群、某一个险种人群的调查,通过在两千个维度里抽取一些维度,比如收入,进行建模,建模之后进行试用,再考察结论。现在有了大规模的计算能力,就不进行干预,完全让机器自己去找规律,让机器学习出在两千个维度里到底什么是建模的规则,这完全是黑箱建模的思路。

黑箱建模让我们发现了很多以前不知道的规律。比如,实现机器学习以后,能发现反洗钱有1000多条在线规则。对于保险用户,在9000多万用户里有百分之零点几的用户年收入四万多,但是买了七万多的保险产品。那么相应的销售人员是以怎样的保险理财理念去推销产品的?有怎样的经验?这是需要发掘的。

在无假设条件下,通过机器学习能发现用户特征。这些工具、方式、方法,可以帮助金融客户非常清晰地了解以前未知的市场和用户。

现在大数据又扩展到另外一个范畴,自然语义内容、视觉内容、行为关系网络等复杂的关系。这些内容在以前的数据结构上很难处理,现在有了大规模的计算平台,大数据可以让系统用新的组织方式,如矩阵、向量进行处理。这个数据非常稀疏,但是有很大的社会属性和经济价值,它会通过评估关系的链条来描述出很多个体的社会属性,也就是个体的社会资本。现在供应链金融规模比较大,但是需要靠专业领域技巧去识别供应链。其实银行根据转账记录建立一个大的社交网络就可以传播这些链条,就可以把一些细碎的、小型供应链通过计算模式挖掘出来。

大数据的实践

要精确,还是要混杂?

一家保险公司,怎样评估它的产品?品牌是很模糊、很难量化的,我们用了十多亿条微博数据和论坛数据来画一条曲线,也就是在这个周期之内品牌的波动,就可以把品牌感知量化,把产品投放也量化。

要群体,还是要个体?

银行做数据业务做了10多年,实际上就是群体和个体的差异。互联网数据完全瞄向个体,数据结构也是精准于个体,而传统的数据面向经营指标、面向群体。宏观意义上来看,假如小明去了100次书店,以前要回答的问题是他第101次买不买书,即业绩和经营指标的问题;而现在我们关心的是他第101买什么书,需要将什么样的内容推荐给他。这不是一个概率问题,而是一个模糊的程度问题。量化这个程度,我们要基于个体描述,而不是基于群体的共性描述。

要决策,还是要工具?

很多人认为大数据是决策性的,笔者认为,大数据实际上更多的是一个自动化的匹配工具。我们为一家保险公司计算了9000万用户在每一个险种上的流失概率。当结论上升到领导的时候,这个决策必须是宏观的,周期很长,几个月后反馈回来可能就有偏差了。而大数据的动作是直接把数据下沉,9000万个用户的所有流失概率全部分给5万个保险代理人,每个人通过专门的程序就可以看到由他负责的客户到底在做什么样的动作。把权限和能力全部推到一线,而不是上升、汇总到总部做决策。所以大数据更多的是一个自动进行的过程,而不是分析决策的过程。

猜你喜欢

客户金融用户
为客户节省时间
陪客户喝酒后死亡是否算工伤
何方平:我与金融相伴25年
央企金融权力榜
民营金融权力榜
关注用户
关注用户
关注用户
做个不打扰客户的保镖
如何获取一亿海外用户