中国政法大学搭建数据共享平台 破解数据孤岛难题
2018-08-10罗倩
文/罗倩
数据共享平台建设的最终目的是为了采集学校多年来积累的业务数据,通过清洗、转换等操作,使其变成有价值的数字资产,并在此基础上进行挖掘应用,从而服务师生以及学校的发展。
智慧校园为师生提供统一的平台以及一站式服务,成为目前高校信息化建设的重点。高校的信息化建设经历了三个阶段:基础设施初步建设阶段、信息化建设全面铺开阶段、信息化服务提升阶段。即高校的信息化建设从最初的投入硬件建设、网络建设,到后期的各个业务应用系统建设越来越多,师生需要记住的密码越来越多,注重提升服务质量的意识越来越强,高校的信息化发展到“一个平台+N个应用”的阶段。目前,大部分高校都处于第三阶段。
在学校信息化建设第二阶段期间,一些业务部门基于当时的业务需要分散建设了自己的业务系统,系统设计的标准和技术架构不统一,系统各自独立运转,大量的历史数据分散地积累下来,形成了信息孤岛。而且还有一些业务部门没有业务系统,数据更是分散单机存储,因此迫切需要数据共享平台来解决全校范围内的数据共享问题。
数据共享平台是以学校的数据标准和业务体系为基础建设,能提供数据管理、数据共享以及数据服务等功能。数据共享平台是智慧校园的核心组成部分,是整个系统数据传输的中枢。通过数据共享平台,可以很容易地实现数据共享而不影响原始业务系统。各业务系统数据库中的数据通过数据共享平台被抽取到数据中心库,数据中心库通过数据共享平台将指定的数据推送给数据需求部门,从而解决了数据的重复录入、数据标准不一致以及共享困难等问题,允许信息在学校各部门的业务系统之间流动,也为提供数据的综合查询、统计分析以及学校的业务流程的整理奠定了数据基础。
数据共享平台结构
数据共享平台的结构如图1所示,包括数据交换、数据存储以及数据服务三部分。
中国政法大学
数据交换层:这一层是整个数据共享平台的核心层,提供信息推送和信息的集成功能。数据交互层负责将从不同业务部门采集的数据存储在数据中心,并根据预先约定好的规则将数据推送给相关的数据需求部门。这个过程包含数据抽取、转换、清洗、装载。
存储层:参考学校的数据标准,可以合理地构建基础数据库和数据仓库。在这个过程中,应该强调区分国家标准、行业标准以及学校标准的差异,并提高数据的读写效率,以满足数据中心数据快速增长的需要。基础数据库需要严格按照已经正式发布的学校信息标准来建设,提供各业务数据的存储以及一些基础信息查询和分析的数据基础。数据仓库则是为了做更多数据挖掘而建设的数据库,一般以时间维度和主题对数据进行存储和集成。
服务层:在存储层的基础上,数据共享平台可以提供一些数据服务,包括一些学校基础业务数据的查询、数据统计、数据图标展示、数据导出等功能。
运行和管理规范:数据共享平台运行与管理规范贯通整个数据交换的应用过程,为平台正常运行提供保证。
图1 数据共享平台结构
平台功能
异构数据支持
由于业务系统前期是分散建设,其体系架构、采用的数据库类型不尽相同,要集成各个业务系统的数据,平台支持多种异构数据库,如主流的关系型数据库包括:Oracle、SQL Server等,非主流的关系型数据库如Pgsql、Mysql;格式化文件如txt、xml、xls等文件的集成;能够通过接口交互实现数据的存取,如Web Service。
数据集成配置
数据交换层将根据配置需求执行数据交换。数据交换配置包括:1.定义数据源、业务系统的数据库配置功能,包括业务系统、数据库、IP地址、端口号、数据库SID、用户名、密码等业务系统的信;2.目标库中创建表以接收业务中间库中的数据;3.配置数据流信息;4.执行数据集成接口;5.检测数据集成情况;6.设置数据自动同步周期。
数据转换和清洗
源业务系统的数据标准、数据中心库的数据标准和目标业务系统所需的数据内容可能存在差异。通过数据转换、清理和加载,数据交换中心完成了不同数据标准的相互映射和转换,实现了共享数据的跨应用交互。
数据共享的监控
能对元数据、代码标准、数据库、数据质量等进行健康检查;可以监控系统异常、数据集成异常、API调用异常、数据质量检测、数据备份;能对标准建设情况、业务系统集成情况、数据质量情况等进行查询跟踪;支持业务系统、主数据的外部关系跟踪,接口的映射转换关系的查询;支持问题的预警机制,以邮件方式通知管理人员,以保证问题即时通知和处理;可以对数据集成平台信息进行重新组织,以通俗易懂的展示方式,方便管理员和校领导查看。
数据质量管理
在基础数据库的基础上全面地对数据质量进行自动化检测,包括可对数据质量检测规则进行设置,包括检测规则、业务检测项、检测数据范围。设置方式简单、可视化、可配置;能够自动检测平台内的数据质量,并自动生成质量概况图表,供用户分析、排查数据质量问题。
保障因素
高校内部的各方积极因素,包括学校对信息化资金和政策的支持,学校领导的支持,所有校园师生用户、学校各级管理职能部门以及各类信息化专业技术队伍和人员的支持。
重视硬件基础设施架构的规划与设计,包括软件和硬件两方面,平台的建设必须采用先进的性能稳定的、安全可靠的软件和设备。
信息化建设积累的数据信息的质和量,积累的数据量越多,质越高,数据的利用价值越大,那么可供挖掘和提供的服务就越多,用途越广,会刺激平台得到更多的政策和人员支持,从而会开展得越顺利。
智慧校园数据共享平台的顺利建设人才很重要,需要培养有针对性的人才梯队,努力创造人才辈出、人尽其才的良好环境,为下一阶段的智慧校园建设培养人才。
遵守数据中心建设规范以及运行和管理规范,使得平台的建设和管理有章可循,是促进数据共享规范化、制度化,形成信息共享长效机制的保障。
数据共享平台建设的最终目的是为了采集学校多年来积累的业务数据,通过清洗、转换等操作,使其变成有价值的数字资产,并在此基础上进行挖掘应用,从而服务师生以及学校的发展。因此数据的质和量很关键,在数据共享平台建设完成的基础上,下一步工作就是不断扩大数据源范围,以及历史数据的积累,建立数据仓库,在此基础上挖掘有价值的应用和服务,如学业预警、领导决策分析等。