APP下载

高校信息资源异构数据源整合的技术方案分析

2024-01-21刘雪芳

无线互联科技 2023年22期
关键词:中间件数据源异构

刘雪芳

(景德镇学院,江西 景德镇 333000)

0 引言

目前,大部分高校均配备了若干个数据库平台,并以此类平台为基准运行相应的教学应用系统。然而,这不可避免地会加剧教育资源建设的重复性问题。恰当地利用异构数据源整合技术不仅可以实现对使用率较低、分散度较高的数字资源的无缝整合,赋予其集成检索的能力,还可以构建一个全新的能够跨越数据库、平台和内容数字资源体系,从而在有效提高知识服务水平、改善知识服务质量的同时,使数字资源整体应用水平迈上新的台阶。

随着高校信息资源的需求量日趋增加,高校纷纷在信息化建设上投入许多物力、人力以及财力,实施高校信息化建设是大势所趋。现阶段,大量高校已完成了各类信息服务系统的构建,给高校提供现代化服务、开展现代化管理工作创造了便利条件。在高等教育信息化建设的初期,信息往往只服务于单一部门,缺乏统一标准以及系统规划。这种情况下,信息资源采集时常常会出现重复和浪费的问题。同时,各部门之间的信息管理能力和信息查询的开放程度也大相径庭,一些资源只能服务于少数人群,导致信息资源的利用效率不尽如人意。鉴于此,本文认为应合理地调整和整合高校的信息资源,以充分发挥其潜在价值。

1 异构数据源集成整合过程中存在的问题

1.1 异构性

高校在进行信息资源异构数据集成的过程中,一定会面临异构性问题,该问题的具体表现包括以下3个方面。(1)模式异构:在存储模式方面数据源存在差异;(2)系统异构:具体有基础操作系统异构、计算机体系结构的异构、DBMS本身的异构;(3)来源异构:由于数据获取渠道差异产生的异构,具体有外部数据与内部数据异构[1]。

1.2 完整性

本文讨论的完整性包含了约束完整性和数据完整性。整合异构数据源的出发点是为应用提供一致的访问支持。数据完整性是指全面提取所有数据,比较容易实现。数据完整性中的约束完整性可以充分体现数据之间的联系与数据间的逻辑关系。若能保障约束完整性,则能够有效提升效率,为数据处理创造便利条件,是顺利完成数据交换与数据发布的重要前提。

1.3 权限问题

权限问题有2种:(1)在异构数据源集成系统中,有许多数据存在,而大学环境中,存在多样化的群体,每个群体对系统的访问权限各不相同。因此,高校应合理管控系统访问权限,避免出现系统使用混乱的问题;(2)在进行异构数据源整合时,需要确保这个过程不会干扰各部门访问原始数据库的权限[2]。

1.4 性能

为了使得高校能够又快又准地对突发性事件做出判断,高校的异构数据源集成系统就必须具有优异的数据处理能力,且具备较强的对或许产生的数据源的适应能力。考虑到高校的运作成本,此系统还需满足投入少的要求。

1.5 附加约束

在集成系统内至少有2个数据源的情况下,数据源的数据间或许存在一些联系,将关联附加至集成结果内的过程就叫做附加约束。

1.6 集成性

集成性要求所有异构商务数据能够实现联结存储和有序集成,而不是仅仅被简单地放在一个数据库系统里。在经过集成处理之后,所有过去在高校中孤立的应用系统的数据仅需经由一个统一的检索入口即可实现对全部数据的访问。

1.7 集成内容限定

数据集成并不仅仅是在各数据源之间进行全面的数据融合,而是在进行集成处理的过程中需要紧密与高校的各种业务流程相结合。关于集成范围的定义,实际上是对集成内容的边界问题的界定。

1.8 语义冲突

语义冲突通常会使数据集成的结果出现重复,对数据的发布、处理和交换构成阻碍。因此,在数据集成时需重点解决语义冲突的规避问题。

2 目前主流的异构数据源整合技术方案

2.1 运用数据仓库技术对异构数据源进行整合

在具体实施时,需要在数据库内实施快照设置,以便在指定时间将其他数据源的数据复制到本地数据库,如此可以有效地弥补数据库访问接口技术整合方案在处理不同数据源问题时的不足。然而,该技术要求在规定时间进行复制,无法实现实时同步数据,不适用于对实时性有着高要求的应用。

2.2 运用数据库访问接口技术对异构数据源进行整合

Sun公司开发的JDBC技术和微软公司推出的ODBC技术,都是数据库访问接口技术的典型代表,可以在应用程序中实现对多种数据源的数据连接。这就要求用户对连接对应的数据库具有强大的辨识能力,若在进行设计时还牵扯到存储过程,那么程序员必须重点参考不同数据库的要求完成编写。该项技术的应用对程序员的能力与水平有着较高的要求。

2.3 运用中间件异构数据集成平台技术完成异构数据源整合

虽然采用前述的2种方案能够妥善处理好内部应用系统集成的问题,但是由于各种数据封装标准和组件模型架构之间存在差异,使得各组件模型间的集成变得更加困难。目前,在所有的异构数据源系统整合方案中,效果最为显著且使用最频繁的方案是利用中间件进行异构数据源整合这一方案。中间件异构数据集成平台可用于创建平台的工具有2种,其一为网格,其二为Web服务,借助在数据转换上XML的优势完成异构数据转换[3]。

作为新的Web应用程序中的一部分,Web Service具有自描述、自包含、模块化的特点,支持定位、发布、经由Web调用。同时,Web Service具有处理从基础请求到高级商务操作的广泛能力。经过一系列的配置步骤后,其他Web Service应用能够识别并使用已经部署的服务,同时能够兼容XML、HTTP等标准的网络协议。

可扩展标记语言中的标记指处在计算机可理解范围内的信息符号,以标记为导向,计算机与计算机之间能实现对各类文献等的处理[4]。对此类标记下定义,不仅仅能选用国际通用标记语言,如HTML等,还能使用XML等标记语言,此为语言的可扩展性。

3 解决高校信息资源异构数据源整合问题的有效路径

3.1 高校信息资源的特征

现阶段,高校对一站式的信息资源服务的要求较高,资源交换以及资源共享的需求量大。受历史因素的影响,我国大部分学校往往具备若干个教学应用系统,这些系统在数据结构方面往往存在差异,但却一般可以运行同一课程。同时,数据孤岛式的本地数据库管理系统无法满足资源互换和共享的要求。如今,高校教师和学生获取信息的方法以及习惯已经有了明显的转变,无需前往图书馆查阅资料即可在网络上得到自己想要的文献资料或者信息,且不受时间、地点的限制。因此,高校信息资源服务的目标应是:在不对现有数据库正常运作产生任何负面影响的同时,能显著提升对不同异构信息平台进行优化整合的效率。

3.2 高校信息资源异构数据源整合解决方案的实现

基于对高校信息资源异构数据源基本特点的思量,以中间件异构数据集成平台为媒介,对异构数据源进行整合这一方案具有较高的可行性。该方案通过提供Web服务的路径实现交互功能,只要依托相应的平台或者软件开发环境,Web应用客户端及其他应用程序客户端均能成功调用Web服务接口以获取自己想要的数据,以此达到透明式访问数据的目的。从实现上看,本文将列举教学应用系统、试题库应用系统、教务管理系统整合的案例,借助开放网格服务架构 (OGSA)打造中间件异构数据集成平台。

(1)各种系统,如试题应用系统,都需要利用异构数据资源和数据库进行建模,可以使用JAXP和JDOM来实现数据库数据和XML数据之间的转换[5]。考虑到数据库内有过多的表,因此需借助通用的ResultSet对象实现向XML文件的程序的转换。因此,只需要提供要生成的XML文件和查询结果集的路径,再完成属性名和元素名的指派工作,利用designOver( )函数对其对应的查询结果的集中字段进行调用。该解决方案的特征是:无需读固定的标签,仅仅需借助一个映射条件双向转换数据即可。

(2)开放网格服务架构(OGSA)是一种支持无缝衔接异构数据源、提供各类后台服务、为中间件异构数据集成平台的建设提供支持的架构,目前已得到了广泛应用。

(3)实施OGSA所设定的接口,整理所有中间件之间以及异构数据库与中间件异构数据集成平台之间的连接信息,构筑全面的数据共享网络。在数据共享网络内数据共享的程度与共享数据信息量的多少主要取决于数据共享网络内所有中间件权限的配置情况。在实践过程中,用户可使用该平台实现访问,通过网格服务的形式对外发布集成平台内的所有节点数据源。利用中间件异构数据集成平台对客户端请求进行研究分析的过程中,第一步要对客户端请求使用的数据库以及中间件进行剖析,若2个以上的中间件数据需匹配查询,那么首先要独立查询其中的单一中间件数据,然后提取结果数据,最后得到与另外的中间件数据相匹配的一个子查询。

(4)调用这一中间件的网格服务接口是各类教学应用系统收集所需数据的一种有效路径,从而达到无障碍式访问异构数据的目的。当用户将查询语句的请求提交至Web后,该平台会立即进入工作状态,系统探究此类查询语句,并将其转发至相应的中间件。查询结果将通过多个DataSet的形式展现,然后由异构数据集成平台进行再处理,最终生成一个最终版的DataSet。根据客户端的需求,平台将DataSet转化为一个结果XML文件,并传输至客户端。至此,查询过程全部完成。

4 结语

综上,异构数据源整合是一种可以使高等教育信息资源得到更充分的利用、能给用户访问提供更为便捷的环境的有效方式。一方面可以减少高校在物力、人力方面的投入,另一方面可以有效提升高校对特色资源的利用率。未来,高校信息资源异构数据源整合将和大量技术逐步融合在一起,如计算机协同工作技术等。

猜你喜欢

中间件数据源异构
试论同课异构之“同”与“异”
RFID中间件技术及其应用研究
基于VanConnect中间件的设计与开发
Web 大数据系统数据源选择*
基于不同网络数据源的期刊评价研究
异构醇醚在超浓缩洗衣液中的应用探索
overlay SDN实现异构兼容的关键技术
LTE异构网技术与组网研究
基于真值发现的冲突数据源质量评价算法
中间件在高速公路领域的应用