数据有保鲜期 快速动态分析最重要
2016-07-02
1852年在美国纽约成立的富国银行已有一百多年历史,不再是“拉着马车卖黄金”(富国银行的Logo为黄金马车)的年代,早已成为一家多元化的金融集团,业务范围包括商业贷款、住房抵押贷款、其他消费贷款、存款、财富管理/经纪业务等,在美洲拥有7000多万家客户,8643家网点。
虽然拥有众多的客户和网点,但美国富国银行企业模型风险部副总裁刘维政却告诉《中国信息化周报》记者:“我们每次看到数据都很担心这些客户会流失。过去银行在数据方面做的大多是传统的统计,不是动态的信息,而银行需要了解的是顾客行为的变化。”
不做数据集中 建数据联邦
刘维政受邀在“2016 Teradata大数据峰会”上做主题演讲,介绍了富国银行的大数据思路和实践。为了更好地服务客户,富国银行的大数据策略要和企业战略保持一致。富国银行的企业战略是“深化客户关系、吸引新客户,无论何时何地无缝服务客户,通过健全的风险管理始终如一地赢取客户的信赖”。而这样的战略要靠大数据来实现和推动,富国银行需要通过利用跨企业的数据获得深入的理解,预测需求,并打造极具吸引力的整合式客户体验。为此,富国银行制定出多个大数据战略目标主题,包括改善客户体验、减少上市时间、提升风险管理能力、解决复杂的业务问题、提高团队成员经验、适应竞争日益剧烈的环境、降低遵循监管要求的成本和提高收入增长等。
刘维政介绍,要实现上述目标,必须做一系列的组织架构调整和动作来实现支持。比如,要做数据战略咨询,制定企业数据、业务数据和计划数据发展战略;要规范数据管理,包括数据的环境管理、数据采集与集成、元数据管理、数据质量管理和主数据管理;要统一数据架构,包括业务架构设计、数据架构设计和数据架构支持;要进行商业智能分析,包括高级分析、商业智能与可视化和大数据分析;要做好数据管理,包括政策与标准管理、管理健康监测、组织与监督,培训、支持和通信;在解决方案咨询与交付方面要做终端用户培训、解决方案记录、评估管理、终端用户支持和数据解决方案支持;对于数据的计划管理,要做项目启动、规划与执行,程序与项目检测及控制,以及资产组合管理。
说起来容易做起来难。可想而知,对于业务和分支机构众多的富国银行来说要统一实现大数据的管理和分析是多么困难。他们遇到的首要问题就是数据分散在各处怎么办,要做数据的大集中吗?
“富国银行拥有 80 项不同的业务,以及人力资源、风险和财务等数据。将所有数据移到一个中央数据仓库将是一个极其复杂、无休无止而结果却令人失望的大工程。”刘维政介绍,“我们采取了变通的方式,保持每个部门的数据独立,没有做大集中,而是建立了数据联邦(DF),建立了EDA(企业数据分析部门),结果证明这种方法也很不错。”
的确,如果没有坚实的数据基础架构,数据便没有任何意义。富国银行让数据还是保留在各部门本地并管理,而数据联邦可以跨越各个系统进行对话,并了解哪些系统专门记录了哪些信息,然后采取适当的方式记录信息的传输。
数据团队要确保银行的风险数据有统一的数据定义(元数据),且可追溯至记录系统。这样,无论计算方式为何,数据的传输过程都会有清楚的记录。他们将最常用的数据整合成一个单一版本的数据。当监管机构或银行员工查询某个具体数字时,数据团队需确保他们只能从一个地方取得数据,从而避免他们从多处获得不同的答案。通过执行这些数据治理工作,银行能够更好地管理风险,并使用数据来解决问题,挖掘银行各项业务之间的机遇。
三个场景的应用实例
刘维政向记者举了三个例子来说明大数据带来的业务价值。
在个人金融业务领域,他举例说,有了大数据的支持,在财富管理方面,富国银行的员工保险保费可以根据每个人的情况进行定制化设计。“比如,他们针对我特别推出的策略是,如果我每天能坚持走5公里,每月就可以少交10美元的保费。我很愿意接受这样的方案,对于我来说是个不错的激励。对于公司业务来说,小额的保费收入减少换来的是医疗保费等大额支出的节省。”他介绍,未来富国银行可以根据更多的可穿戴设备、社交网络、生物科技、行车信息等数据信息的收集分析,制定特别有针对性的客户服务方案。
在企业金融方面,刘维政以针对中小企业的风险评估授信为例向记者展开介绍。“富国银行不只就这一家企业做评估,会通过收集数据做上下游企业的关联分析进行风险评估并授信。例如,在能源产业的油价下降时,不只会影响汽车加油或者电力企业,还会影响鞋的采购,因为石油降价、树胶降价会让鞋子的成本降低,一些零售企业对鞋子的采购量会增加。这种分析产业链上下游,从最上端原材料供应到最下游的产品消费之间的关联、弹性变化会有助于银行对企业风险进行更准确的评估,做到阴天备伞的效果。”他说
在银行的产品研发方面,大数据也有很大的应用价值。“银行就是要与客户建立信任关系,要评估客户投资风险的忍受程度方面,富国银行会借助虚拟技术,提供虚拟的理财专员为客户提供更别致的理财服务。虚拟理财专员可以规避真人理财专员的很多弊端,比如个人限制或者说不合规的语言等;而且还可以根据客户的偏好定制猛男、萌妹或者熟女型的专员。”
数据是有保鲜期的
“数据要抓紧时间用。数据对企业而言,可能是资产,也可能是负债。”在采访的过程中,刘维政反复强调,“数据是有保鲜期的,过期不用就作废了。做静态的统计,总数、平均数其实都没有太大的意义。”
刘维政建议银行要先把银行内部的数据用好,包括呼叫中心的录音数据、ATM数据、网站数据、电商数据等,不需要大规模地去买数据。对这些数据要及时做动态分析,深入理解客户行动,从而实现银行对客户的黏着度,而不是通过统计分类,区分客户对银行的忠诚度。
富国银行具体采用了哪些分析工具呢?负责管理银行模型验证的架构,监管一系列的量化分析的刘维政介绍,富国银行一直与Teradata天睿公司保持合作,并结合更多开源工具进行数据分析,比如他们正用开源高性能计算技术Spark与Teradata的大数据工具Teradata Aster结合利用,监管每一账户和每一个投资组合中的变化。
他特别喜欢Teradata Aster的一项功能—— NPath。使用 Teradata Aster 的NPath 功能可以快速了解事件顺序问题,例如:客户在使用或购买其产品之间经过了哪些步骤?客户在离开网站时所做的最后一步是什么?哪些步骤带来了购买决策?“我们现在能够一次性分析所有这些内容,以便了解客户行为,而这非常重要。”刘维政说。
富国银行的数据联邦要实现跨不同部门的数据访问,就多亏了Teradata 提供的一种叫QueryGrid的技术产品。QueryGrid是一种互操作技术,可以实现Teradata与其他数据库产品的互通操作。据记者了解,几年前,Teradata 开发了 Teradata SQL-H和 Teradata Aster SQL-H连接器,用于在 Hadoop 平台上的 Hadoop 分布式文件系统 (HDFS) 与 Teradata 或 Teradata Aster 系统之间移动数据。这些连接器的创新之处在于,通过将一个平台上的处理单元映射到另一个平台上进行平行数据移动,实现高达百倍的吞吐速率。Teradata 现在已经将这些较早的连接器合并到更广泛的 QueryGrid 连接器套件中。其实,QueryGrid早在2014年就已经推出,功能已经越来越完备,目前已经能实现对Oracle、SAS、MONGDB等数据库的无缝查询。据介绍,QueryGrid对SAS的一次查询可以从过去的48小时减少到5分钟。
这种效率让富国银行的数据分析人员每分钟可以提出更多问题并获得更多答案,从而实现更深入的探索,更好地研究业务问题。大数据也让富国银行实现了最优化的业务资产组合结构,在金融界保持领先的竞争力。