数据交互在工程项目管理系统中的设计与应用
2021-11-15刘致彤丁克松
刘致彤,向 辉,丁克松,李 壮
(北京洛斯达科技发展有限公司,北京 100011)
0 引言
大量的信息数据是工程项目的基础,也是目前工程项目管理难以突破的瓶颈。由于各个单位信息系统相互独立,种类繁多而且没有统一化、系统化、规范化的数据管理,导致数据往往会被孤立,随着管理的项目越来越多,系统中数据量日益增长,数据的统一管理、交互工作也显得格外重要。
以往的数据对接中只是针对某个项目进行,依然没有解决数据孤岛的问题。而作为公司总部或者集团型企业总部,往往需要对各级单位的工程项目数据进行整合、汇总,形成以总部为核心的工程项目数据库或数据湖,为总部统筹决策、资源调配以及分析评价各方面服务。因此如何在现有资源条件下,更好地实现各单位的数据对接,以什么方式进行整合,是目前面临的问题。
1 数据交互现状
随着中国能源建设集团有限公司(以下简称“集团”)信息化发展,各信息系统产生大量数据沉淀,存在数据共享效率不高等问题,使过去为集团带来工作效率提升的、孤岛式的业务系统成为集团变革转型的阻力。数据交互成为打通各个业务系统、实现单位业务快速重组的内在需求,也成为集团制定数据政策、保障数据安全、促进数据在组织内无障碍共享、推进数据战略顺利实施的重要保障。
面对日益增加的数据量以及复杂的异构环境,如何更快、更方便地获取原有沉积在各种异构应用系统孤岛(silos)中的数据,以及通过梳理、分类、管理、整合成为有价值的数据资源,更有效地应用于实时分析报告、商业智能、大数据、智能AI 应用以及对外共享等,企业需要方便易用的、可自主管理和可自我服务的、可统一管理的、可扩展和可靠的、可快速部署于本地或云中的企业级数据复制同步和交互整合产品解决方案, 降低数据资源开发和使用的成本,避免陈旧传统技术产品解决方案所带来的困扰和问题。对于陈旧的基于ETL 的解决方案,我们常听到诸如“黑箱技术、易用性差、效率低、实时性差、本身又造成孤岛、缺乏集中统一管理”等许多来自用户的差评。
根据IDC 研究报告的统计,客户对于传统的数据交互、复制、ETL 解决方案在性能方面的满意度极低,满意的用户只占17%左右。基于20 多年前陈旧技术的ETL 解决方案面临着许多挑战,主要有以下几个方面:
1)日益增加的异构数据源环境,包括各种关系型数据库、结构化及非结构化数据,以及NoSql、NewSql 数据库和大数据平台的应用环境。
2)在企业私有云和混合云的计算环境下,传统产品的C/S 架构难以满足构建云与边的数据交互,以及在云中心的部署并支持远程多租户共享使用方式的要求。在一个现有的企业环境中,往往不同项目要购买多套ETL 产品,各自成为孤岛,难以实现元数据集中的统一管理、共享和任务的监控及运维,造成元数据目录管理与数据共享交互割裂的“二张皮”。
3)需要编写二次开发脚本语言或所谓的“模板”组件,产品的使用对象主要是面向技术开发者的,易用性差、时间周期长、成本高,难以满足业务部门对数据的快速需求;另一方面,越来越多的企业数据分析人员希望产品提供简单易用的功能,并实现“自我服务”模式和数据“端到端”的可视化管理。
4)传统的ETL 解决方案产品,往往采用批处理的数据釆集/抽取方式,实时性差,交互效率低。
因此如何高效、安全、简单易用、满足多方需求是目前我们首先要考虑的。
2 集团信息化现状
集团前期依托计划统计系统,初步实现了各类数据收集工作。在“十三五”期间,通过建设集团经营业务数据展示平台,初步实现了集团生产经营类数据的多维度展示与穿透查询分析;依托现有(或在建)的计划统计系统、国际业务系统、财务系统、电子采购平台、工程项目平台等业务系统,初步建立了数据指标体系;使用数据交换平台开展了各单位工程项目类数据与总部系统的对接;依托财务信息化建设开展了财务及其他业务主数据梳理工作,并进一步开展主数据管理平台建设工作。
在接下来的数据交互工作中,需要进一步加强数据源头管理,确定数据指标和标准,推动管理数据互联互通,实现实时动态采集;逐步拓展各类管理系统对各管理层级、业务领域、境内外的覆盖范围和应用深度,不断提高企业管理效率和水平。
一般来说,数据交互工作包含5 大关键要素:组织结构、岗位职责、数据交互标准、数据控制和使用、数据管理工具。根据信息化发展的现状,结合数据交互的要求,集团现阶段数据交互方面仍存在以下的不足:
1)数据多头管理:缺少专门对数据进行管理、监督和控制的组织。信息系统的建设和管理职能分散在各个业务部门,数据管理的职责分散,权责不明确。组织机构各部门关注数据的角度不同,缺少一个组织从全局的视角对数据进行管理,导致无法建立统一的数据管理规程、标准等,相应的数据管理监督措施无法得到落实。组织机构的数据考核体系也尚未建立,无法保障数据管理标准和规程的有效执行。
2)多系统独立建设:没有规范统一的数据标准和数据模型。各业务部门为应对迅速变化的市场和管理需求,逐步建立了各自的信息系统,各部门站在各自的立场生产、使用和管理数据,数据分散在不同的部门和信息系统中,缺乏统一的数据规划、可信的数据来源和数据标准,导致数据不规范、不一致、冗余、无法共享等问题出现,组织机构各部门对数据的理解难以应用一致的语言来描述,导致理解不一致。
3)尚未完成统一的主数据管理:核心系统间的主要信息并不是存储在一个独立的系统中,或者不是通过统一的业务管理流程在系统间维护。缺乏对主数据的管理,就无法保障主数据在整个业务范围内保持一致、完整和可控,导致业务数据的正确性无法得到保障。
4)缺乏统一的集团型数据质量管理流程体系:当前现状是数据质量管理主要由各组织部门分头进行;跨部门的数据质量沟通机制不完善;缺乏清晰的跨部门的数据质量管控规范与标准,数据分析随机性强,存在业务需求不清晰的现象,影响数据质量;数据的自动采集尚未全面实行,处理过程存在人为干预问题,很多部门存在数据质量管理人员不足、知识与经验不够、监管方式不全面等问题;缺乏完善的数据质量管控流程和系统支撑能力。
5)数据全生命周期管理不完善:目前集团数据的产生、使用、维护、备份到销毁的生命周期管理还不完善,不能确定过期和无效数据的识别条件,并且非结构化数据未纳入数据生命周期的管理范畴;对于数据的全生命周期状态的管理无信息化工具支撑。
3 平台建设目标
平台建设目标是满足工程项目管理系统的应用需要,各个异构信息系统通过ETL 工具向平台提交标准化格式数据,实现工程项目管理系统的统计分析与应用。
本文研究建设的数据共享交互平台是一款基于B/S 架构的、高性能的、简单易用的、支撑跨部门数据共享交互应用的多部门服务和管理平台,支持结构化数据、半结构化和非结构化数据的接入、传输交互、整合,具有可扩展性和支撑各种共享交互业务模式的能力,能快速有效地满足项目的核心业务需求,并在最短时间内上线运行而产生社会和经济效益。
平台的建设目标及创新主要体现在以下几个方面:
1)高效。底层采用最新的分布式服务容器先进技术及流处理技术,有效提高交互效率;实现任意部门节点间应用系统和数据的即时联通,支持数据端到端实时(秒级)可达和可视化监控管理。
2)安全。支持安全的数据交互、可靠传输;实现跨网络节点之间的多层次安全数据交互机制,保障数据访问安全。
3)简单易用。面向参与数据交互共享业务的平台中心和各业务部门,提供直观易用、B/S图形化的用户设计、任务配置和运行监控管理界面,通过页面“点击式”的数据源连接和交互任务配置,支持部门应用系统快速地接入平台和实现接入数据的有效管理。
4)满足多方管理需求。支持多种跨部门的共享交互应用服务模式;为交互各方提供接入、运行、运维等各个阶段的管理工作平台,满足数据交互各方的交互业务和运行监控的管理需求。
4 数据交互工具研究
在课题研究过程中,首先研究ETL 工具等最近技术,根据研究结果,选取合适的技术路线并进行开发测试。同时,结合工程项目存储与更新特点,在工程项目指标与工程项目数据成果基础上,构建工程项目数据自动化采集应用框架,框架包括自动化采集所需的方法、技术路线、应用工具和必要的应用试验。在数据交互工具研究过程中,主要对开源的ETL 工具进行了研究。
ETL 是数据交互管理中非常重要的一环,是承前启后的必要的一步。ETL 过程中的主要环节就是数据抽取、数据转换和加工、数据装载。为了实现这些功能,各个ETL 工具一般会进行一些功能上的扩充,例如工作流、调度引擎、规则引擎、脚本支持、统计信息等。目前主流ETL 工具有Informatica、Datastage、ODI,OWB、Beeload、Kettle、久其ETL 等。这些产品主要特点:均适用于将多个应用系统的大批量的、异构的数据进行整合,有强大的数据转换功能;高效适配多种类型的异构数据库、文件和应用系统; 快速构建复杂数据集中应用、无需编码。
在研究过程中,对以下两种ETL 工具进行了研究与对比。
4.1 Kettle
1)简介
Kettle 以元数据驱动的方式提供强大的抽取、转换和加载能力,本身提供了强大的图形界面设计器,可以大大缩短数据抽取项目的开发周期,并且容易维护,Kettle 设计界面友好,提供了工作设计模式,能满足各种场景的实现。
2)特点
Kettle 是一款国外开源的ETL 工具,纯java 编写,可以在Window、Linux、Unix 上运行,绿色无需安装,数据抽取高效稳定。
Kettle 这个ETL 工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。
Kettle 中有两种脚本文件,Transformation和Job,Transformation 完成针对数据的基础转换,Job 则完成整个工作流的控制。
3)总体架构
总体架构分为数据源层、核心层和UI 层。
操作系统:Windows; 数据库:db2; 开发语言:java。
5)优缺点
优点为支持多种数据源; 核心组件丰富;支持多任务并发,支持大数据的抽取转换处理,执行效率高; 成熟的异常处理流程; 可与java很好地结合。
缺点为Kettle 在异构数据库的处理能力比同构数据库的处理能力较慢,特别是跨服务之间就更慢了。
4.2 Informatica Powercenter
1)简介
Informatica PowerCenter 使用户能够方便地从异构的已有系统和数据源中抽取数据,用来建立、部署、管理企业的数据仓库,从而帮助企业做出快速、正确的决策。此产品为满足企业级要求而设计,可以提供企业部门的数据和电子商务数据源之间的集成,如XML、网站日志、关系型数据、主机和遗留系统等数据源。此平台性能可以满足企业分析最严格的要求。
2)特点
① 功能强大的数据整合引擎
大伙儿都同意交物业费,就是阿强不同意。阿强觉得自己家安上了高档防盗门,不要说小偷,就是一只苍蝇也难以飞进。由于他不肯出钱,请物业公司的事只得搁浅。
Informatica PowerCenter 拥有一个功能强大的数据整合引擎,所有的数据抽取转换、整合、装载的功能都是在内存中执行的,不需要开发者手工编写这些过程的代码。Informatica PowerCenter 数据整合引擎是元数据驱动的,通过知识库和引擎的配对管理,可以保证数据整合过程能够最优化执行,并且使数据仓库管理员比较容易对系统进行分析管理,从而适应日益增加的数据装载和用户群。
② 积极的元数据管理
Informatica PowerCenter 充分利用元数据来驱动数据整合过程。它提供了一个单一的元数据驱动的知识库,和数据整合引擎协同运作,并且可使关键的整合过程能被简单定义、修改、重用,从而提高开发生产力并缩短部署周期。活动元数据合并严格的文件,提供维护体系,允许冲突性分析,可以广泛跟其他企业应用程序以及系统整合。
③ 支持多数据源
通过辅助产品Informatica PowerConnect,Informatica PowerCenter 提供了对特殊数据源和格式的支持,包括SAP、Siebel、PeopleSoft、AS400 等。对于e-business 格式的数据,可以直接通过分析DTD 或XML 格式数据文件来实现。
④ 高性能的运行功能
将设计和运行环境的性能特性分离,提供了较好的灵活性,不需要重新编码,吞吐量可以通过服务器、并行引擎管理、最优化CPU 资源等方式,尽快处理任务。数据高效并行功能使用户具有自定义分区功能,提供了最优化的数据并行处理。Informatica PowerCenter 提供了一个非编码的图形化设计工具方便用户的调试使用。
⑤ 分布式体系结构
作为企业级核心数据整合引擎,Informatica PowerCenter 可以单独部署,也可以在分布式体系结构中部署。如果在分布式体系结构中部署,Informatica PowerCenter 要协调和管理多个基于主题的数据集市,而这些数据集市是在局域网或广域网内由Informatica PowerMart 或Informatica PowerCenter 引擎执行的。
⑥ 安全的数据整合
PowerCenter for Remote Data 是Informatica PowerCenter 一个分布式数据整合选项,提供了高性能、安全的、投资回报率高的方法,使用户可以跨广域网与合作伙伴、供应商以及其他远程数据源交换信息。
3)总体架构图
Informatica PowerCenter 总体架构图如图1所示。
图 1 Informatica PowerCenter总体框架图
4)应用环境
数据库:oracle; 操作系统:Linux。
5)优缺点
优点:在正确的时间提供正确的信息,满足业务部门的分析和运营数据集成需求,满足在全企业范围实现任务关键型部署的安全性和可扩展性要求,通过提高跨团队的工作效率和跨职能合作,降低IT 项目的开发和部署成本。
缺点:改动比较费时,特别是批量式的修改。
4.3 选型对比及结果
1)操作:Informatica 有四个开发管理组件,相对繁琐。 如果对Job 作了改变之后,想要撤销,返回到改变前是不可能的。相比Kettle 在测试调试的时候不太方便。
2)部署:Kettle 只需要JVM 环境,Informatica需要服务器和客户端安装。
3)数据处理的速度:大数据量下Informatica的处理速度是比较快的,比较稳定; Kettle 的处理速度相比之下稍慢。
4)服务:Informatica 有很好的商业化的技术支持,而Kettle 则没有。商业软件的售后服务上会比免费的开源软件好很多。
5)风险: Informatica 属于商业软件,而Kettle 是开源软件,所以风险是与成本成反比。
6)扩展:Kettle 的扩展性好,因为是开源代码,可以自己开发拓展它的功能,而Informatica 由于是商业软件,基本上没有。
7)Job 的监控:两者都有监控和日志工具。
8)网上的技术文档:相对来说,Informatica在遇到问题去网上找到解决方法的概率比较低,Kettle 则比较多。
本次设计主要是基于Web、流处理技术和微服务容器技术的数据交换软件。提供元数据目录、异构数据库复制、实时同步、交换整合、ELT/ETL 及跨网络远程通道传输服务等集成一体化的功能,可用于数据复制、数据同步、数据备份/恢复、数据迁移、数据归档卸载、ELT/ETL、数据汇聚整合、读写分离、数据分发、数据服务、大数据集成(MPP、Hadoop、Kafka)等应用场景,满足各种应用场景的统一使用和监控管理需求。
对比发现Kettle 优势在于可扩展性,可以很好地对它进行二次开发,而且不涉及商业化产品,避免后期使用过程中被供应商“卡脖子”的问题。集团选择开源的ETL 工具。Kettle 具有基于Java 的图形化界面,支持拖拽等方式的可视化设计,能方便使用者便捷地对从业务系统抽取到的数据进行传输、清洗和加载等。同时,ETL 屏蔽了应用系统中较为复杂的业务逻辑,为基于数据仓库的分析和应用提供了统一的数据接口。利用数据共享与交换平台,ETL 在不同的业务系统之间搭建了一座桥梁,实现数据、业务的互联互通。
5 系统总体功能设计
5.1 数据交互体系构建
平台的工作流程设计如图2 所示。
图 2 平台工作流程设计图
从图2 可以看出搭建的集团一级平台可以直接连接中心管理的应用系统,以及无缝衔接搭建的下级企业(二级)平台(通过远程数据通道服务方式),最终构成企业集团数据共享交互平台从集团到下级企业的分层级的共享交互体系。
5.2 数据交互平台功能
1)交互数据管理
平台各节点均提供交互数据源的元数据釆集和梳理标注等功能,形成本地数据目录。支持查询、查看实例数据、进行数据分析、标注中文语义等元数据操作,为数据整合交互提供必要的样例分析服务,并实现对交互数据结构的管理和定义。
2)数据通道服务管理
平台具有远程数据通道服务管理模块(通道服务器),支持通道主题连接用户的管理、通道主题配置、安全管理设置、数据授权等服务内容,以及数据通道的运行监控。其中,通道用户管理支持通道主题连接用户的创建、管理和删除,通道配置实现通道服务类型和通道消息处理方式的配置、连接用户的数据权限和交互数据结构标准的选用。
3)数据源连接管理
平台允许用户管理数据源连接驱动包,支持动态加载不同版本的JDBC 驱动及参数配置,以适应集成环境中同时具有不同版本的数据库以及分布式数据库和MPP 数据仓库[1]。支持对各种异构的关系型数据库、 二进制文件、Excel、CSV、TXT、JSON、XML 等数据文件以及Hadoop、Hive、HBase、Kafka、MongoDB、ElasticSearch 等大数据平台多类型数据源的连接。
4)资料管理模块任务管理
平台实现复制同步任务管理、交互整合任务管理、文件传输任务管理、数据文件入库任务管理以及任务调度管理,支持实时和定时的数据同步交互。
复制同步任务应包括全量和日志模式增量CDC 任务,支持Oracle、SQL Server、MySQL、PostgreSQL、Informix 等,支持按应用系统处理事务的时间次序交互数据,保证业务数据的完整性和一致性[2]。交互整合任务,支持触发器、标识位、时间戳、全量比对等增量模式,以及对物理表和视图的交互、多表整合。文件传输任务实现指定系统目录下及FTP、HDFS 文件服务器下文件的高效流传输交互。任务调度管理能够设置任务定时,并按设置的时间周期智能启动任务的执行。
复制同步任务和交互整合任务中提供两个重要的数据处理功能,即过滤和转换。过滤功能针对源数据库中的库表字段的值设定过滤条件,平台采用了先进的流式过滤技术,能够大大提升过滤的处理效率。图形化数据转换功能,允许用户自定义源与目标之间的数据转换关系,并自动进行转换处理[3],如包括重新命名目标Schema、目标表及字段、增删字段、改变数据类型和长度等;在源和目标为异构数据库时,缺省情况下,平台提供智能匹配技术,自动进行异构数据库类型的转换处理。支持DDL 复制和动态表数据的同步复制功能。
5)数据通道服务管理传输服务管理
平台支持数据压缩、WAN 多线程传输加速,实现跨网段的高速实时数据交互[4]。支持远程安全通道服务功能,有效分离源和目标数据库权限,实现跨网络节点之间的安全数据交互,能够与第三方数据通道如Kafka、MQ 服务对接。支持数据加/解密和数据远程传输的可靠性,支持断点续传和“传且传一次”的特性[5]。
6)实时监控和统计分析
平台实现接入节点数据源和全网的实时运行监控、运营统计分析、报警通知和成果展现。实时运行监控支持对主机、交互任务、通道主题的运行监控以及对交互数据流转的跟踪[6]。运维分析支持对设定时间段的任务运行情况、交互业务运行情况等提供多视角、多维度的统计分析,并以图表方式展现,作为科学分析交互应用及相关决策的有效辅助手段。报警通知实现对运行异常情况进行报警,对运行状况定时告知。成果展现面向领导提供交互数据动态展示、交互任务和业务运行展示以及交互业绩展示功能[7]。
7)平台管理
平台还设计包括平台用户管理、用户授权管理、机构管理、日志管理、参数配置等功能。其中,日志管理支持从不同角度提供相应的日志记录功能,从而可方便快捷地跟踪查询平台运行情况,包括登录日志、操作日志、任务日志等。参数配置支持平台运行、软件配置、数据字典等各类参数的设置。
6 平台实现与应用
6.1 平台实现方式
平台提供两种数据交换的技术实现方式,一是数据库对数据库的配置方式,适用于对交互的源和目标数据库有访问权限的场景,通常一个部门内部的应用系统之间的交换采用这种方式。二是数据通道服务方式,通过数据通道有效解耦交换的源和目标数据的访问权限,适用于对交互对方的数据库无直接访问权限的场景,通常跨部门(域)之间的数据交换采用这种方式。
6.2 平台架构
平台采用最新的基于Web、流处理和微服务的架构技术。整体架构由三个域组成:数据源、中心服务及交互目标。用户通过简单易用的Web 设计界面和控制台与中心服务后台交互。核心功能包括:数据源连接、元数据目录、数据样例查看、复制同步、交互整合、文件传输交互、结构化文件加载、Kafka 对接、任务管理、任务调度等功能模块。技术特点包括:异构数据库全量复制同步、非侵入式增量CDC 同步、数据虚拟化及大数据整合、多线程并行流式处理、优化的可扩展性和灵活性,以及方便易用的基于Web B/S 的任务配置和实时监控管理界面[8]。
从功能上,平台分为数据源连接管理模块、元数据管理模块、交换任务管理模块、数据服务管理模块、监控统计模块和平台系统管理模块等几大部分。
6.3 应用实例
采用上述方法建设的数据交互平台已经成功使用在工程项目管理PRP 系统、GRP 系统中。完成对工程类项目的项目立项、项目基本信息、计划经营、协同经营、合同管理、预算管理、采购管理、设计与技术、进度管理、安全管理、质量管理、环保管理、税务管理、资源管理、风险管理等19 大模块进行统一标准的共享平台建设。并与计划统计系统、3 家单位对接了原本独立的工程类项目信息数据总计30 余万条。
以下为工程项目管理系统中数据交互流程:
1)数据库连接配置
该功能显示平台中所有关系型数据库及其它类型的连接信息,用户可以对连接信息进行新建、编辑、删除等操作。
2)二进制文件连接配置
该功能显示平台中所有二进制文件存储的服务器连接信息,用户可以对连接信息进行新建、编辑、删除等操作。
3)数据同步任务配置
任务类型包括全量交换、增量捕获CDC 两部分。全量是对源库表到目标库表所有表数据的交换,等同一对一的复制。增量CDC 则是基于非侵入式的方式,通过对源数据库的日志数据的捕获、分析,当发现源表数据发生变动时,对目标库表进行实时同步更新操作。对于在线运行中的应用系统,在全量交换过程中可能持续有新的数据进入, 为了保证源和目标的数据一致性,则应选择全量+增量并行的任务方式。该方式任务启动时,增量同时启动开始捕获数据, 但此时并不加载于目标,而是等全量交换完成后再将增量数据加载,从而确保了源和目标数据的一致性。
4)数据过滤
数据过滤可实现按指定条件对源数据进行过滤,未满足条件的数据不予以交换。
5)任务运行
完成上述任务配置后,在对应任务中“设计”页面点击运行即可启动该任务。同时也可以进入“任务管理”对应模块中,如“复制同步模块”、“交换整合模块”等 ,批量启动编辑完成的任务。
6)任务监控
任务监控是在任务运行后自动实时展示的功能,可以查看到每条任务的执行状态,数据传输的具体条目,出现异常的任务或数据可以通过点击异常任务进行详情查看。并通过异常任务的日志提供修改思路,以及数据回补功能。
7)任务调度
交换任务的运行有两种启动方式,一是前述的通过用户点击“运行”按钮启动,第二则是通过任务调度功能设置交换任务自动启动的规则,如时间、频率等,任务将在满足规则时自动启动。
7 结论及展望
数据交互平台在数据对接中优势体现在以下几个方面:
1)平台采用国内首创基于Web、内存流处理和服务容器的技术架构,灵活性、可扩展性强,交互性能高。
2)直观易用的B/S 用户界面是区别于其他同类产品的重要特色,而且还屏蔽了数据交互复杂的操作过程,无需高级DBA 或技术人员提供咨询或编写不透明的定制脚本代码,通过“点击式”界面操作,就可实现数据交互复制/整合的应用场景,简单易用、可维护性是产品的显著特点。
3)支持连接用户名/密码、数据授权、数据加/解密、数据压缩,以及节点IP 过滤等全方位的数据交互安全功能,并提供可视化监控管理。
在信息化建设过程中,各职能部门通常采用不同的技术和体系结构来构建自身的信息系统,虽然为各自业务发展起到了很好的促进作用,但各信息系统数据独立存储形成一个个信息孤岛,使得各业务系统之间很难实现数据共享。如何在不改变原有系统的基础上实现跨平台数据访问也成为信息化建设道路上必须思考的一个问题。
集团于2021 年进行了数据交互平台的建设。该平台是整个数字化央企建设的重要组成部分,利用此平台对集团分布的数据进行集成化整合,同时将原来分散、利用率低的信息资源进行数据挖掘。通过数据交换平台的建立可以打破当前的“信息孤岛”现象,建立不同业务系统的数据共享平台,形成集团综合信息库。同时,通过统一的数据交换平台实现各业务系统之间数据交换的单一安全通道,在实现信息共享的基础上也确保了各自数据信息的安全。