APP下载

数据整合技术在高校应用系统中的研究与实现

2014-10-21吴士杰

计算机光盘软件与应用 2014年24期
关键词:数据整合应用系统实现策略

摘 要:随着高校信息化建设的发展需求,高校中的应用系统与日俱增。然而,在信息化建设中,很多高校缺乏前期的规划设计,这样造成了高校现有的应用系统数据相互独立,信息资源分散、使用率较低。为了提高现有应用系统数据资源的使用效率,消除信息化建设中出现的“信息孤岛”问题,就需要对现有应用系统的数据进行整合。本文结合高校信息化建设的实际情况,分析了数据整合技术在高校应用系统中的必要性,深入分析了数据整合的多种模式,提出了数据整合的实现策略,为高校应用系统数据整合提供参考。

关键词:应用系统;数据整合;实现策略

中图分类号:TP393.18

经过多年的发展和累积,各高校的基础硬件环境已经有了大幅度的提升,各类应用系统投入使用,信息化建设取得了较好的成果。但是,某些关键性的问题依然有待研究和解决,例如,信息标准规范不够统一,导致现有的数据较为混乱,严重影响了学校数据资源的使用效率。为了充分利用学校现有的数据资源,提高现有应用系统数据资源的使用效率,数据资源的一体化整合成为高校信息化建设中的重点问题。

1 数据整合技术在高校中的必要性

1.1 应用系统与数据之间的分布

为了满足高校信息化建设的发展需求,高校陆续完成了多套应用系统的开发设计,各系统在使用的过程中聚集了许多基础数据。但由于这些基础数据在开发时间、开发厂商以及存储设备上的差异,使得数据管理极为不便,很多数据出现了重复性或不一致性的状况。这些现象导致各系统间的数据无法直接实行对比解析,严重影响了高校领导对决策性数据的查询和使用。

1.2 信息资源利用率较低

目前,高校信息化经过建设与积累,已形成了百兆与千兆相结合的网络主干结构,并具备一定冗余的小型机服务器作为应用服務器。然而,因为早期开发的系统环境比较分散,系统之间缺乏数据上的交换,很多信息资源无法实现共享,导致高校信息统一平台及各种信息管理系统缺少完整、实时的数据。

1.3 支持决策能力较低

由于不能使用统一的标准和规范来定义数据,因而无法提供统一的数据接口来共享通用数据源,这样就造成了不同的应用系统间的相互隔离,形成了“信息孤岛”。“信息孤岛”是高校信息化校园建设中亟待解决重要问题,所以,怎样消除“信息孤岛”,并将现有及未来即将建立的应用系统数据资源有效快捷整合,已成为目前高校信息化校园建设的至关重要的关键所在。

2 数据整合的模式

2.1 数据集中模式

为了满足各部门的应用需求,使应用数据的管理与维护工作更加便捷,必须要严格遵守高校制定的信息化建设标准,搭建全院共享的数据中心,用以存储各应用部门的数据信息。需要应用平台的统一设计,而应用子系统构建在统一的框架中。其优势在于各子系统间存在较高的耦合度,数据中心与子系统之间的无缝连接易于实现。但这样就造成开发周期相对较长,因为数据的交换是通过数据中心与各部门所有业务间进行,如此用户的需求不好准确把握,适应用户的灵活度较低。

2.2 共享数据中心

信息资源的整合建立在现有应用系统不变的条件下,抽取应用系统中具备共享价值的数据信息,进行共享数据中心的搭建工作。各部门还在原来的应用系统中进行数据的读写操作,只有在某些数据操作涉及到其他部门时,应用系统才会通过前期的部署工作录入共享数据,达到数据层的互联实现。

2.3 分布式资源整合

分布式资源整合的操作与共享数据中心类似,如果在本地操作数据,应用系统则只涉及本地数据访问;如果是与数据中心进行互联,那么则是涉及与其他部门的数据访问。然而,分布式资源整合的方式是搭建资源索引库,这种方式与搜索引擎极为相似,它是对各部门共享的数据进行收录,同时确定数据在网络中实际所处的方位,但原始数据仍然保存在各部门内部,这就是资源索引库与共享数据中心的区别所在。

3 数据整合的实现策略

3.1 数据交换模式

应用系统与数据中心的数据交换方式,一般有两种:

(1)与企业服务总线直接连通,从而进行应用系统数据库的访问。

(2)新建应用系统数据库中的数据交换中间表,经过企业服务总线的客户端,与共享数据中心数据库相关联的对象实现共享,并进行数据交换。

3.2 创建数据交换中间表

数据交换中间表是一种数据字段表,它是按照应用系统与共享数据中心的数据交换要求而建立的,字段中所对应的数据都来自共享数据中心,同时也来自所建立中间表的应用系统,它是应用系统与数据中心之间同步操作的桥梁和纽带,同步原理图如图1所示。

3.3 同构数据库的整合

同构数据库是指数据中心的数据库软件及版本与应用系统的数据库完全相同。但由于应用系统数据安全性和共享的系统数据的独立性方面的考虑,建议数据整合使用在应用系统中建立数据中间表的方式来完成。

3.4 异构数据库的整合

异构数据库是指共享数据中心与应用系统所使用的数据库软件厂商不同。对于异构数据库的数据整合,通常采用两种方法:一是需要建立数据中间表的方式,进行异构数据库系统与共享数据中心数据库间的数据交换。二是使用数据交换工具配置数据交换流程,抽取共享数据进行清洗、转换、存储共享等操作,实现同步并交换数据的过程。

4 数据整合的实际应用

4.1 连接异构数据库

如何与整合后的应用系统数据库进行连接,是搭建统一身份库之前需要解决的问题。在Identity Manager体系结构中,Metadirectory引擎模块起着关键性的作用,在不同数据系统之间如果想实现数据的共享,只要通过Metadirectory引擎模块提供的接口,Identity Manager驱动程序就会与中央身份库目录树(Identity Uault)进行信息的同步,最终实现数据的共享。Metadirectory 引擎如图2所示。

4.2 差异数据同步

针对大批量的数据同步,最关键的环节是如何将每次同步的数据量尽可能的降到最低,以实现带宽损耗量的降低,从而提高数据的同步效率。合理的解决这个问题的方法就是Identity Manager,Identity Manager Driver为了获取差异数据会定时进行数据库的扫描,若扫描结果为空,则不会执行同步操作。

4.3 单点登录系统

单点登录系统建立在统一身份库的基础之上,它主要是为了统一身份库中的用户身份,使其能够实现进行一次系统登录后就能访问平台中相互信任的应用系统的目的。同时,还能通过外网登录访问校园网资源,因此该系统必须建立在基于反向代理服务的基础上。

4.4 共享数据平台

建立好统一认证平台后,需要搭建共享数据平台,共享数据平台同样是应用系统的重要部分,在相当程度上奠定了之后的数据挖掘和大数据仓库工作的基础。共享数据平台的建设主要使用数据抽取技术,主要是从各应用系统中提取所需数据,使用预先制定好的规则转换所抽取到的数据,之后把转换后的数据按照计划增量或全部导入到其共享数据库或数据仓库中。数据整合的流程如图3所示。

5 结束语

在高校环境下的信息化发展中,整合应用系统不仅是一项十分繁杂的工作,也是一项必不或缺的重要环节。各个应用系统通过数据底层实现相互连通,达到实现数字化校园的真正意义,从而实现教学统一、教管统一的真正目的。进一步从人、财、物、管等四方面实现信息高标准,并对统一信息标准的支持,实现学校全局的多维度多视角的信息采集与分析过程,为学校的进一步发展提供综合而全面的信息资源大环境。

参考文献:

[1]陈敏,周江波,高晖.大型数据资源的整合共享与利用研究[D],电子政务,2013(03):44-50.

[2]郭丹,高校教育管理信息资源整合的研究[J],东北石油大学,2012.

[3]冯晓娟,校园信息建设中的数据整合[J],中国科教创新导刊,2012(17):6-11.

作者简介:吴士杰(1978—),男,天津人,讲师,主要研究计算机信息管理及网络技术。

作者单位:天津海运职业学院,天津 300350

猜你喜欢

数据整合应用系统实现策略
电能替代管控一体化的实现
企业云平台建设研究
论数学教学生活化的实现策略