大数据如何助力监管科技
2018-04-25吴晓光
吴晓光
伴随着金融科技(FinTech)的不断演进发展,监管科技(RegTech)的概念被一些国际组织和研究机构提出,并引起各方的广泛关注。在RegTech提出之初,包括英国金融行为监管局(FCA)、国际金融协会(IIF)在内的机构都认为它是FinTech 的子集,从近两年的研究情况看,RegTech的外延一直在不断扩展中,“运用新技术,促进达成监管要求”是当前被广泛认可的定义,不仅包括金融机构在提升自身合规和风控能力方面的尝试,还包括监管机构在提升监管能力、避免监管套利、提高合规审查效率等方面的探索。事实上,还有更广义范畴上的“RegTech”概念,即将RegTech的技术延伸到了政府管理、医疗健康、环保监测等非金融领域。
从国内外央行和金融监管当局对RegTech的研究和实践情况看,以大数据、区块链、云计算、人工智能等为代表的新技术所带来的影响,早已不仅仅局限于技术本身,还有监管的视角、理念和工作机制等方面更深层次的改变。
大数据为RegTech所带来的,不仅有更强大的计算和分析能力,还包括全新的思维模式。
从宏观审慎管理角度看。现代金融市场具有产品复杂、交易频率高、资金流动快等特点,金融风险跨机构、跨行业、跨市场传递已成常态,单个、局部风险有可能通过流动性、产品联结、资产负债表、资金价格等渠道引发跨市场风险联动,得以放大和扩散,演化成全局性、系统性风险。因此,监管部门所监测的数据来源应该是跨机构、跨行业、跨周期和跨市场的,而且需要有很强的准确性和时效性,以便全面地分析出经济和金融运行情况。在数据共享和融合的基础上,建立相应的模型和完善的预案体系,对系统性风险做出准确预判。2017年全国金融工作会议明确了“服务实体经济、防控金融风险、深化金融改革”三项重要任务,强调健全风险监测预警和早期干预机制,加强金融基础设施的统筹监管和互联互通,推进金融业综合统计和监管信息共享。新监管要求的落实,离不开大数据的支持。此外,运用大数据技术对主流媒体、搜索引擎、社交网络中的文本、日志等信息进行分析,监管部门可以判断出社会公众对某项金融新政颁布后、或在市场剧烈震动后的情绪波动情况,预测出当前及未来一段时间内市场走势,对潜在的风险进行预判和预防。
从微观审慎监管角度看。对于金融工作会议中重点提到的功能监管和行为监管而言,监管部门除了要掌握反映宏观经济运行情况的数据外,还要尽可能地掌握各类市场主体微观层面的数据,如交易活动的明细数据,以及分散在公安、工商、税务、海关等部门的数据等。将这些数据聚合,采用语义学、数据点建模等技术提炼出市场主体的行为特征,通过与由监管政策、规定和合规性要求所推导出的规则要求相比对,判断其是否符合监管要求。监管部门还可将监管规则以“数字化协议”的形式下发至金融机构,金融机构将经营过程产生的各类数据输入系统进行规则比对,从而实现自身的合规审计,对于新监管规定的落实具有基础性作用。除了传统的数据报送渠道外,监管部门还可以利用互联网上的非结构化数据,对被监管机构开展更多数据维度的采集,如行为、企业文化等方面的信息,建立有效的“画像”,满足不同的监管要求。
综合来看,大数据对RegTech的启示主要体现在三个方面: 一是系统性、全局性的视角。监管部门所监测的数据是跨机构、跨行业、跨周期和跨市场的,这与金融系统的复杂性、风险的传导性相契合。二是综合性、关联性的分析方法。大数据思维着眼于对各类金融市场运行规律、供需关系、风险规则的总结提炼, 而非简单的因果推导。三是决策的时效性。依托于大数据基础软件所提供的强大的存储和计算能力,以及应用基于大数据的人工智能和机器学习的数据分析理论,如决策树、支持向量机、神经网络等,可支持对多来源、多维度数据的快速分析,能最大程度地保障对风险的事前预防和事中控制,而不只局限于事后分析。
数据共享的问题。传统的金融统计、反洗钱、征信业务都是在特定制度框架下推动的,同时依托于配套的行业基础设施,为金融监管和金融服务提供了有力的支撑。随着FinTech创新的不断深入,监管部门所关注数据的深度和廣度有待于在原来的基础上进一步扩展,除了金融行业内数据、互联网上公开数据外,还涉及金融行业与公安、工商、海关、税务等其他部门和外部机构的数据共享问题,需要更高层面的顶层设计和统筹协调。
数据安全的问题。Hadoop、Spark等大数据基础软件在设计之初,大部分只考虑在可信的内部网络中使用,对用户身份识别、授权访问、密钥管理以及安全审计等方面考虑较少,虽然在持续改进的过程中,但整体的安全保障能力仍然较弱。在数据采集、流转、聚合和分析的过程中,如何保障数据的保密性、完整性和可用性(CIA),维护各方利益,是监管部门需要考虑的问题。密码学的进步为数据共享中的安全问题提供了可选的解决方案,除此之外,还需要建立配套的机制实现对数据使用权限的管理。数据的聚合程度越高,相应的密级越高,访问控制越严格。对密级高的数据,可考虑用机器操作,减少人工操作。
数据质量的问题。大数据推崇使用全量分析,而来源不同的各种信息聚合在一起会加大数据的混乱程度,一些错误数据也可能由于规避特定监管要求等因素而混进数据库。统计学者和计算机科学家指出,巨量数据集和细颗粒度的测量会导致“错误发现”的风险增加。事实上,应用大数据并不意味着放弃“小数据”,“小数据”中已有的经典数据模型和成熟的统计理论,在某些场景下分析效率更高,将大数据与“小数据”相结合,往往能达到更好的效果。因此,对于宏观审慎管理而言,应该严格把控数据来源的可信度与数据质量,对于最终的分析结果,需要运用“专家判断”的方式予以确认和矫正,对模式识别的风险信号做人工判定,减少因数据失真、模型算法失效而带来的风险,以保持决策的准确性与权威性。
做好大数据规划和顶层设计。F i n T e c h 创新发展驱动RegTech不断加速迭代,监管部门要准确把握市场动态,需要对来自被监管机构、其他部门以及互联网上海量的异构数据进行系统地规划、采集、组织和管理。如果数据以“孤岛”的形式散落在不同的机构或部门中,所采用的各类分析方法势必会受到数据维度和样本量的限制,难以有效发挥算法本身的作用。对于监管部门而言,要制定明确的大数据战略,建立一套权责清晰的治理机制,实现数据的高效综合利用。在实施层面,可参考国际标准化组织ISO38500、DAMA(国际数据管理委员会)、DGI(国际数据治理研究所)的研究成果,在数据标准、数据模型、元数据、数据生命周期、数据安全、数据架构、数据质量等方面建立与监管要求相适应的工作流程。
通过标准确保数据的统一性和完备性。从“三个统筹”的监管要求看,在监管层面制定全行业统一的标准和规制,使金融机构、金融控股公司对各类业务范围的界定、业务数据的报送口径形成统一的理解,有利于消除信息壁垒,推动数据共享和业务协同。对于与其他部委、外部单位之间共享的数据,也要遵照一定的标准规范,使各方对数据的含义、标识、用途等有统一的理解。在标准的基础上,还应建立配套的制度和机制来保证报送数据的质量,实现对数据各生命周期的管理。同时,根据监管要求和泄露后对社会影响程度的不同,对数据划分不同的敏感度等级,设置不同的安全防护策略。
夯实行业数据基础设施建设。世界银行经济学家Bo s s o n e (博索内)在研究中指出,金融基础设施的发展与一国经济发展、技术进步以及金融体制的变迁息息相关。在统一数据标准的基础上,汇集全行业、全口径、全生命周期的业务数据,以及多来源、多渠道的外部数据,开展行业数据基础设施建设,推进各类业务数据高效采集和融合利用,采取有效措施保障基础设施的安全稳定运行。在行业数据基础设施之上可建立不同的数据集市,服务于不同的监管需求,提升金融监管的灵活性与自适应性。
建立和完善金融行业数据保护法案。针对大数据带来的信息安全问题,美国、英国、欧盟和我国在内的很多国家和组织都制定了与大数据安全相关的法律法规和政策来推动大数据利用和安全保护。《网络安全法》是我国网络安全领域第一部基础性法律,是我国网络安全基本法,也是当前大数据安全防护领域最权威、最全面的上位法。在《网络安全法》的基础上,结合金融行业实际,研究完善个人信息保护、数据共享安全、跨境數据传输安全、大数据基础平台安全等领域的法律法规和标准规范,为各类基于大数据的创新应用提供依据,减少因无序竞争和利益博弈引入的新增技术风险和道德风险。
做好对大数据的产业支撑。作为FinTech和RegTech的“供给方”,大数据、云计算、区块链等新技术还在不断演进过程中,如缺乏必要的引导、约束和规范,任由其无序发展,则有可能出现“失控”的状态。对于监管部门而言,要稳步跟踪新技术和新产品的发展趋势,发现问题及时反馈至产业部门予以改进, 引导新技术更加安全地服务于FinTech和RegTech,为社会经济发展创造良好条件。从实际效果来看,只有将技术逻辑和业务逻辑相结合,才能实现更大的经济效益和社会效益。数据在不同的主体间流转、聚合和分析挖掘的整个过程中,可综合运用区块链、分布式数据库和数据脱敏等技术,确保数据流转过程可追溯,内容不可被篡改,且敏感得到有效保护。
(作者单位:中国人民银行金融信息中心)