APP下载

结合银行业务特点开展数据治理工作

2012-12-31许文潘明道徐明圣王昭

银行家 2012年12期

近二十年来中国银行业发展的历程也是现代信息技术在银行业逐步渗透影响加深的过程。信息技术不但给银行带来新的业务,增添了运营渠道,且改变了银行的经营模式。此过程中银行拥有的越来越多的数据,有力地促进了银行业务发展,另一方面这些数据的质量普遍不高,导致银行信息变得不那么“可信”。为此国内银行纷纷将数据治理提升到战略层面,进行高规模的咨询并在决策层面亲自领导该工作,但由于只是针对数据的一般性而缺乏从银行特殊性,尤其是银行的数据是为业务服务这一根本立脚点考虑,导致执行力低下、数据治理效果并不明显。为此本文分析了银行业务系统、业务流中的数据特点,提出了与业务结合度较高的银行数据治理路径。

银行数据治理的整体实施情况

数据给现代银行工作主要带来三大方面的挑战。一是业务发展转型,经营理念向以客户为中心转变。这需要银行收集全面信息以进行领导和管理层面的综合决策及精细化管理、资产管理为核心向精准客户营销转变。二是竞争环境和流程日益复杂,必须强化自我约束。这方面需要按照巴塞尔协议清晰构筑风险资本,进行预测性财务管理工作,制订精准的绩效考核办法。三是上级监管越来越细致。作为国家命脉的银行业,包括人民银行、银监会、外管局等部门对其进行多口监管,管理者需要各银行准确报送大量数据同时还要求这些数据口径标准基本一致,以利于行业统计的方便性和及时性。

上述挑战给整个中国银行业带来了进行数据治理这样一个总的、战略性的要求,银行从业者对解决该问题的必要性也达成了共识。为此国内相当多的银行已经开展数据治理工作,在行内建立了包括管理层在内的数据治理委员会,对资金人员等资源大力投入,在行外积极寻找咨询专家和解决方案。然而只有极少数银行能通过上述工作使数据质量得到本质的提升,在多数银行我们依然会观察到如下现象:再次实施一个贯穿若干业务条线的项目时,仍然需要银行多部门联合再次开展一次大规模数据梳理和改动操作,这说明数据质量不佳的这个痼疾依然存在。

银行数据治理过程的考察

在此我们考察一下银行进行数据治理的一般过程,该过程包含以下几个不可或缺的主要步骤:(1)开展战略咨询。(2)建立包括高层在内的数据治理委员会,建立数据治理组织架构。(3)设定数据治理实施路线和目标、制订工作计划。(4)动员相关部门、按照计划开展具体数据治理工作。步骤(1)和(2)属于目标设定环节,步骤(3)和(4)属于执行环节。同时在开展工作中步骤(1)和(2)务虚性强一些,而步骤(3)和(4)倾向拿出具体落地实施物。如前所述数据问题是国内银行业面临的整体问题,上升到治理行的战略高度并不为过,步骤(1)和(2)是银行数据治理的两个充分条件,它们是推动力而不是绊脚石。总的看来大多数开展数据治理的银行都能在战略上加以重视,因此步骤(3)和(4)恰当与否决定了数据治理单位的执行力,成为决定数据治理效果的关键。

应该看到国内银行信息化水平迅速提高是近几年的事情,随之而来的数据质量问题也是突然出现的,而且是整体出现在银行业面前,因此国内银行落实设定数据治理实施路线和目标这一步骤时,往往引入外脑交给咨询公司。然而咨询公司同样没有成功的国内银行的经验可以借鉴,它们给银行开出的药方往往是借鉴信息化比较早的发达国家银行的经验,或者借鉴信息化程度最深的信息技术行业自身的数据治理经验。然而发达国家将信用机制作为社会规范的一个重要原则已经建立了上百年,在制度上约束人们在社会生活的各个方面内提供诚实有效的信息,从源头上解决了数据问题,因而发达国家银行数据接近其原貌,质量普遍较高。与发达国家不同,长时间来我国银行仅被当作渠道而且主要是企业金融往来的途径。对于社会自然人的信息,行政、公安等系统掌握的信息质量在某些方面要高于银行,这决定发达国家银行数据治理对我国银行业具有有限的参考意义。而且信息科技行业的特点是数据即业务,数据处理手段单纯,用以实施信息项目的数据往往同构性强、存在一个产品中,准确性、合规性、一致性、唯一性、及时性、完备性这些高度抽象的特性既可以作为衡量产品数据质量的标准又是信息产品实施的内在自我约束,但对于使用信息产品的功能处理的外来数据不存在上述约束。银行的数据源于业务的需求,是信息产品处理的对象之一,并且以一个系统众多、数据源分散、数据异构性强的集合的形式出现。因此信息科技行业那样单纯的数据治理方法以及质量衡量标准施加于银行业效果并不明显。

国内银行业数据治理的另一个症结是在执行过程中往往被实施部门扭曲为一项以实体代替实质、以主观代替客观的任务。由于步骤3中给出的数据治理实施路线往往脱离国内银行的客观条件,导致数据治理具体实施部门对于应该调动的资源和着手点没有头绪,索性使用懒汉原则——以建设一个系统为主线和数据治理完成标志。数据治理的最终效果本应由行内外进行客观的评估,但不恰当的方法和手段使得数据治理这项需要银行全体员工知道其职责并不折不扣地加以执行的战略协作退化为一个有形无实的系统实施任务。

结合业务进行数据治理

以上分析可以看出国内银行业数据治理工作难以取得满意效果的一个主因是缺乏结合国内银行业务的、具有可操作性的实施方案和方法进而使执行力大打折扣,尤其是脱离了银行数据是为业务服务这一根本出发点,脱离了业务是动态发展这一特点。

认识到上述问题后,在数据治理工作中,我们仔细研究了数据的载体,银行业务系统的构造和分类,分析了数据流与关键数据质量控制点的关系,厘清了数据生命周期各阶段流经的业务部门并据此规划了一个责任清晰的数据治理机制。

银行的主要信息系统

系统是银行数据的展现实体,系统建立的缘由及重要性与其服务的主要业务紧密相关,即使那些为全行服务的系统,例如报表,数据也被分成不同的模块赋予各种权限为不同的业务和部门所享有。按照对内职能银行所有业务部门可以分为前台、中台、后台三部分,银行的主要系统也可以这样划分。

图1是一个现代银行的主要信息科技系统构成图。前台部门和系统在银行业务中主要起到了交易渠道作用,一般包括运营部、电子银行部、国际业务部等,它们主要开展面向大众的现金类业务,注重账务的准确性,对应的系统有柜面、信用卡、电子银行、ATM等系统。中台部门和系统主要起到流程审批的作用,一般包括信贷部、投资部、小企业部等,它们不用直接与大众打交道,主要从事与信用相关的业务,必须谨慎评估每项业务的潜在风险,注重流程和专业人员参与控制,对应的主要系统有计划财务、信贷系统、个贷系统等。后台部门一般起到支撑作用,主要有综合管理、人力资源、法律合规等部门,这些部门要求系统主要对银行进行内部控制,不开展直接为银行产生利润的业务,它们对应的平台有档案管理、人力资源、法律合规等系统。

需要注意数据仅仅是存在于系统中,不应该犯将系统等同于数据的错误。系统建立后多数情况下是稳定的。但是数据不同,它受到业务的驱动在各个节点和系统中流动,同一个数据流经不同的节点和系统具有不同的重要性。例如客户的一笔存款业务,只要卡号和姓名准确就可以确保业务的进行,其他数据信息是次要的,但是如果产品推销关于客户联系方式的数据就成为必不可少的信息。所以业务不但赋予数据重要性,还赋予它流动性。

数据流向与数据治理关键节点

银行不可能单纯为了数据质量进行所有业务系统的重构,比较切合实际的做法是从数据流中找到最重要的环节作为数据质量控制的重点和工作着手点,将数据治理由点及面的推展开。图2是前、中、后台业务的数据流和重要节点的关系图。

图2(A)展示一个典型的来自前台业务的数据流,该数据流中有多个数据源和分发点以及一个汇集点,由数据源采集数据汇总到汇聚点处理后再分给分发点(使用点)使用。各个数据源相互之间地位是平等的,各分发点也是平等的。业务上会要求数据源和使用节点容易扩展,这就约束汇聚点达到相对稳定,如果扩展汇聚点必然会对前后两端的业务造成巨大的影响。大量数据汇集而且较稳定这个特点说明汇聚点是前台业务的关键点,在该点建立规则进行数据质量的控制是适宜的。

对于来自中台业务的数据流如图2(B)所示,该流中有多个数据源,多个中间审批节点和一个终审节点,各数据源之间的地位是平等的,中间审批节点之间是串联的。一个成功的业务从数据源来的数据必须逐级经过中间审批节点,也就是每个中间审批节点都是一个信息汇聚节点,但是业务上要求这类汇聚节点要容易扩展,终审节点在业务上具有最重要的意义,决定了业务进行与否。一个数据源就对应了一个流程,也就是图中数据源n的数据不会在审批点中进入到由数据源1形成的流程1中去。还需要注意的是在该流程中数据流是双向的,关于客户的数据从前向后流动,审批意见数据从后向前流动,这就存在数据在两个审批节点来回流动的可能:后向审批节点认为客户信息不准确加以退回,由数据源补充客户数据再次发出审批申请,如流程n所示。审批节点串联的安排顺序即暗含数据控制的内在要求,在一个审批节点被关注业务,数据如果含糊不清业务必然无法被审核通过,从而要求前级逐级回退从源头校正业务数据,因此处在最后位置的终审节点无疑是数据质量管理的管控重点,但这仅仅是狭义的业务只是包含了客户的信息。前文我们指出数据可能存在没有到终审节点在两个一般审批节点流动的可能,审批的业务信息每次都会回溯到第一个审批节点,同时所有的客户信息也会进入第一个审批节点,它含的数据量最大,所以第一个审批节点的数据质量控制同样也是重点。

图2(C)展示的是后台数据流程,它一般包括一个数据源、一个汇聚点和多个分发点。数据流向是单向从源流向分发点,各个分发点地位是平等的,数据源与各分发点相比明显有控制的意味。因此对后台系统的数据质量控制重点是数据源的控制。

按照数据生命周期划定治理职责

按照数据自身的生命周期,数据流中的各节点又可以归纳为产生环节、集成环节和使用环节,如图3所示。图中标示出数据质量问题的产生主要发生在数据产生环节,少量产生在集成环节,但是数据质量问题的发现恰恰相反。这是因为数据产生环节很少认为自己是错的,它占有的数据量相对而言比较少,缺乏进行校正所需的比较对象,而且数据产生环节的第一要务往往是确保业务的进行从而产生价值,它们一般对数据进行分析的需求也不强烈。而信息集成环节和信息使用环节价值的实现,主要是通过对数据分析后找到业务规律对工作进行改进及对竞争态势进行预判,而且这两个环节都有大量的数据用以进行分析校正,因此这两个环节能够大量的检测到数据治理问题。数据的集成环节一般是科技部门,处理数据是它们的专长和职责,经过分析校正后会使生产环节产生的数据问题有所减少,但是由于对业务理解的偏差,它们产生的数据问题仍较使用环节要高。使用环节进行数据分析应用往往会使用全部历史数据中的一部分,而数据集成环节往往会从这个历史周期考察数据,并且从其他方面印证数据,这导致数据集成环节发现问题的数量较使用环节发现的多。

根据这三个环节产生和发现数据质量问题的规律我们认为,在数据质量管理中数据集成环节对数据量拥有最多、考察面最广、统筹最全面,应该行使检查、报告、跟踪数据质量的控制职能;数据使用环节对于数据质量具有出于业务的最权威的判定,应行使定义评估数据质量的反馈职能;数据产生环节是最广大的客户原始数据的直接接触者也是从源头防范数据问题最有效的环节,应行使预防修正数据问题的执行职能。

仅仅是划分职责并不能确保数据治理工作的执行力。我们还知道不同环节的利益追求是不同的,在没有干预的状态下,银行数据产生环节就是关心业务的进行,预防及修正数据是一项靠责任心的工作。而信息集成环节和信息使用环节显然更倾向通过数据分析得到结果被认可,不愿为数据检测、考核工作而操劳,甚至将之视为与数据产生环节可能发生冲突需要回避的一件事。不同环节不同诉求使得数据治理工作脱节,必然削弱执行的效果。有必要使用一套办法使得所有环节将数据工作最大可能统一到一个中心上去。绩效考核就是这样一套较好的方法,考核数据产生环节给出的数据是否使分析效果得到明显提升,考核集成环节和使用环节是否检查监督实施到位。

结论

本文讨论了银行数据治理实施路线的问题,认为缺乏执行力是银行数据治理无法取得成功的一个重要原因。数据质量产生的根源是银行发展业务的需求,业务部门满意才能说数据质量治理达到了效果,同时业务部门也是产生数据问题的最大来源。仅有科技人员对数据质量负责,将无法保证数据质量管理规范的真正落地,仅有业务人员负责数据质量,将造成跨业务数据质量无法保证。针对上述难点一是需要建立企业层级的数据治理组织,在更高层次协调资源并使各部门认识工作重要性。二是结合业务推进数据的治理工作,以业务为数据工作的最根本出发点。三是在全行建立一种谁治理数据谁就应该有所受益的机制,客观推进数据治理工作。

(作者单位:大连银行)