APP下载

金融机构数字化转型软件定义存储加码数据治理

2020-03-12邱尚高

互联网经济 2020年2期
关键词:视图数据管理结构化

邱尚高

金融机构数字化转型中数据治理的困难与挑战

金融机构作为数字化转型的亲身实践者,在过去的实践中积累了较为丰富的数据治理经验。但是面对数据的海量增长,如何科学地管理和使用数据,“盘活”数据价值,使经济利益和社会效益最大化,依然面临着诸多困难与挑战。

困难一:缺乏统一数据视图,难以发现价值数据

由于历史原因,多数金融机构的数据资源散落在多个业务系统中,缺乏统一的数据视图,管理人员和业务人员无法及时感知数据分布情况,无法快速找到符合自己需求的数据,也无法发现有价值的数据并纳入数据资产。

困难二:数据孤岛普遍存在,跨业务共享效率低

金融机构将数据作为战略性资源,因数据共享机制不完善、各机构数据接口不统一等问题,导致数据难以互联互通,形成“数据烟囱”,不利于开放共享。

困难三:数据质量低下,业务决策根基不牢

数据质量是金融服务与创新的重要基础。由于缺乏完善的数据治理体系,金融机构在数据采集、存储、处理等环节存在不科学、不规范等问题,无法确保数据的完整性和准确性。

困难四:科技研发投入不足,数据场景融合不足

金融机构的数据规模十分庞大,从中挖掘高价值、关联性强的高质量数据,需要高效的信息技术支撑和可靠的基础设施保障。然而,部分机构科技研发投入相对不足,导致海量数据资源无法盘活,数据价值难以充分释放。

困难五:缺乏安全的数据环境,数据流程存在风险

倘若拥有庞大的数据资源,但缺乏安全的数据环境,同样危险重重。常见的安全风险包括数据泄露、数据滥用等,潜藏在数据的采集、存储、共享等各个流程中。

困难六:缺乏数据治理体系,数据“不善用、不尽用”

部分金融机构尚未建立起有效管理和应用数据的模式,对数据服务和应用缺乏合规性指导。由于法律法规尚不健全、数据治理体系还不完善、机构合规意识不足,数据“不善用”的问题突出,过度采集数据、违规使用数据、非法交易数据等问题屡见不鲜。

概括而言,一是数据组织形态和架构的问题,即如何将数据纳入统一视图、让数据跨业务共享;二是数据管理策略和安全的问题,即如何提高数据的质量、深化数据与应用的融合、保障数据环境的安全;三是数据价值发现的问题,即如何释放数据价值。

面对上述困难和挑战,金融机构如何解困破局、实现数据有序治理和高效利用,数据治理之“道”成为迫在眉睫的问题。

三大策略指引金融机构从数据管理到数据治理转型跨越

针对以上困难和挑战,金融机构如何制定数据治理策略、完善数据治理体系、做好数据资产管理和价值评估至关重要。所谓数据治理,就是处理数据的策略,即如何存储、访问、验证、保护和使用数据。数据治理必须涵盖数据的全生命周期,即从数据的获取、存储到管理、应用再到归档、删除的全流程。

按照数据生命周期的特点,可以将数据治理策略分为三个部分,即数据的获取和存储、数据的管理和安全、数据价值的释放。

策略一:数据的获取和存储

数据生命周期管理的起点,是数据的获取和存储,这也是数据治理最先面对的环节。若要解决统一视图、跨业务共享的问题,需要对数据资源制定标准、建立模型,并确定元数据和主数据的存储方式,可概括为数据标准管理、数据模型管理、元数据管理、主数据管理四个方面。

数据标准管理可确保大数据平台数据的完整性、有效性、一致性、规范性,推动数据共享开放。数据模型管理将所有数据纳入统一视图,便于数据整合。元数据管理实现关键信息的追踪、记录和快速检索。主数据管理实现跨系统使用一致的和共享的主数据,降低成本和复杂度。

策略二:数据的管理和安全

如何对数据进行管理、评估和共享呢?这便进入数据治理的第二阶段,即数据的管理和安全,该阶段的主要措施可概括为质量管理、安全管理、共享管理等三个方面。

质量管理帮助金融机构获得干净、结构清晰的数据,极大提升数据质量;安全管理确保数据资产在“存、管、用”等环节中的安全,做到“事前可管、事中可控、事后可查”;数据共享管理通过搭建统一共享平台,打通跨部门共享瓶颈,提高利用价值。

策略三:数据价值的释放

数据治理的最终目的是释放数据价值。数据价值管理是数据治理体系中的关键环节,是对数据内在价值的度量,主要从数据资产的分类、使用频次、使用对象、使用效果等方面计量。数据价值管理可以实现数据成本的有效控制,优化数据服务方式,提高数据应用价值。

以上各个环节之间环环相扣,只有紧密协同才能发挥更大作用。完善的数据治理体系帮助金融机构找准高质量数据、深挖高价值数据,最终实现数据资产效益最大化的目标,解决金融机构的数据治理之“困”。

软件定义存储助力数据治理体系建设

为构建数据治理体系,金融机构不仅要结合业务需求合理规划,更要依托信息技术疏理数据内容、安全存储数据、高效利用数据,存储系统必然是重要支撑。

现阶段,多数金融机构倾向于通过搭建数据湖(Data Lake)来存储包括结构化、半结构化、非结构化数据在内的数据资源,以供上层调用。这样一来,软件定义存储(Software Defined Storage,简称SDS)在金融机构数据治理体系中,无疑扮演着重要角色。那么,什么是软件定义存储?软件定义存储、数据湖、数据治理之间有何关系呢?

本质上,软件定义存储是提供存储功能和特性的软件,它将数据从硬件架构上解放出来,使用户专注于数据蕴含的价值。软件定义存储通过统一的虚拟管理平台,与前端应用、管理程序、物理空间进行交互,极大简化数据管理。数据湖是以自然格式存储的数据的系统,一般包括结构化数据、半结构化数据、非结构化数据和二进制数据等全部原始数据资源。简而言之,要实现数据存储和管理的优化,基于软件定义存储搭建统一数据湖无疑是极佳的选择。如图1所示,底层硬件设备提供物理存储空间,存储引擎统筹硬件资源搭建数据湖存储,数据湖用来存储所有的原始数据资源,数据湖引擎根据业务应用的需求灵活调用数据湖中的数据,用以跨業务检索或数据共享等,还可以通过 AI、大数据分析等应用挖掘数据价值。

猜你喜欢

视图数据管理结构化
《大数据管理》课程思政教学质量评价体系研究
顾丽英:小学数学结构化教学的实践探索
借助问题情境,让结构化教学真实发生
深度学习的单元结构化教学实践与思考
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
如何有效开展DCMM数据管理成熟度评估
数据挖掘在学生成绩数据管理中的应用研究
数据挖掘在学生成绩数据管理中的应用研究
Y—20重型运输机多视图
SA2型76毫米车载高炮多视图