高校信息化集成数据环境建设方案探析
2014-04-02白荣妙
白荣妙
摘 要:本文浅析了集成数据环境的建设方案,探讨了数据环境分类理论,指出第三类和第四类数据环境是高档次的数据环境,提出了信息化校园数据层逻辑框架,指明第三类数据环境对应于数据共享层,第四类数据环境对应于数据仓库层。比较分析了基于企业服务总线ESB和中间件技术数据集成方案的适用情景,探讨了信息分类标准的内容和编制规则。
关键词:共享数据库设计;数据环境;数据集成方案;信息分类标准体系
1 共享数据库设计
1.1 总体目标
共享数据库是全域数据模型在物理数据库中的反映,它通过数据集成工具收集、处理、存储全校各类共享信息数据,并为全校各类应用系统提供信息共享访问服务,它的总体目标是要做到以下几点:
1.保证数据合理有效安全地存储;
2.落实“谁生产、谁维护”原则,保证所有数据都只有单一的维护来源;
3.反映学校管理主要的业务主题信息;
4.保证数据的规范性、一致性、完整性;
5.存储的数据能够反映学校当前的运行状况。
1.2 数据环境分类
美国管理与信息技术专家詹姆斯·马丁(James Martin)在《信息工程》和《总体数据规划方法论》中将计算机的数据环境分为四种类型,并认为清楚地了解它们之间的区别是很重要的,因为它们对不同的管理层次(包括高层管理)的作用是不同的[1]。
1.第一类数据环境:数据文件(Data Files)。这是一种数据组织技术简单、相对容易实现的数据环境,系统分析员和程序员根据应用的需要,用程序语言分散地设计实现各种数据文件;
2.第二类数据环境:应用数据库(Application Databases)。它使用了数据库管理系统,系统分析员和程序员没有在数据分析和组织上下功夫,而是为分散的应用设计各自的数据库,不能支持数据的共享;
3.第三类数据环境:主题数据库(Subject Databases)。它经过科学的规划与设计,其结构与使用它的处理过程是独立的,各种面向业务主题的数据,通过一些共享数据库被联系和体现出来,其建模需要花费很多时间,但其后的维护成本很低;
第四类数据环境:信息检索系统(Information Retrieval System)。这种数据环境的目的是保证信息检索和快速查询的需要,以支持高层管理和辅助决策,而不是大量的事务管理,又称为数据仓库,它是主题数据库的集成,是深加工的信息。
以数据文件或应用数据库为主体的数据环境,是低档次的数据环境,一个现代化管理水平较高的企事业单位,应该具有第三类和第四类数据环境,这是高档次的数据环境,能保证高效率、高质量地利用数据资源。
1.3 信息化校园数据层结构
信息化校园数据层结构可以看作是狭义集成数据环境所包含的内容,根据数据环境分类理论和整体校园数据规划方案,信息化校园的文件型数据源和应用数据库属于第一类和第二类数据环境,而共享数据中心、归档库和数据仓库属于第三类和第四类数据环境。根据数据应用的类型划分,信息化校园数据层整体结构从逻辑上可以分为三层:应用数据层、共享数据层和数据仓库层,如图1所示。
1.应用数据层包含第一类数据环境(文件型数据源)和第二类数据环境(应用系统数据库),无论是单独的数据文件还是应用系统的后台数据库,它们都属于局部数据存储,它们为共享数据层提供数据来源,同时又从共享数据层中获取自己所需的数据。
2.共享数据层也称为主题数据层,它是整体结构的核心层,它为应用数据层提供数据抽取、订阅的服务,又为数据仓库层提供数据的来源,起到承上启下的作用,共享库、标准库和归档库都属于该层,归档库的数据结构与共享库一致,只是其中存储的是已过时、不会发生变化的数据。
3.数据仓库层顾名思义其主要内容是数据仓库,前文已提到,数据仓库是为决策支持系统DSS服务的,DSS一般由数据仓库技术、OLAP和数据挖掘技术三部分组成,数据仓库的数据源是共享库和归档库,数据仓库也是通过ETL工具从来源库中抽取出用于查询、统计和分析的各种数据。
2 数据集成方案探析
当前主流的数据集成方案有两种,分别是基于SOA架构的数据集成方案和基于中间件技术的数据集成方案,SOA是一种面向服务的架构,它在信息化校园资源整合方面将发挥重要的作用,ESB则是实现SOA架构最核心的部件,也是信息化校园框架中基础服务平台重要的组成部分,中间件位于数据源和目标存储之间,它通过提供配套的工具实现从源端到目标端数据的抽取、转换、加载等工作。
2.1 SOA架构与企业服务总线ESB
SOA是一种设计理念,为应对复杂企业应用面临的柔性化、按需重构、异构系统集成和跨企业边界集成等严峻挑战提供了一种比较理想的解决方案[2]。SOA是一种应用程序体系结构,在这种体系结构中,所有功能都定义为独立的服务,这些服务带有定义良好的可调用接口,接口独立于实现服务的硬件平台、操作系统和编程语言,可以以定义好的顺序调用这些服务来形成业务流程,如图2所示[3]。ESB是SOA的基础设施,它是传统中间件技术与XML、Web服务等技术结合的产物,它是服务间的连接框架,其功能包括消息转换、消息机制、基于内容的路由和服务容器四个部分,它是一种松耦合架构,实现了服务和通信相分离,使应用系统具有更好的开放性和可扩展性。
2.2 中间件技术
中间件泛指能够屏蔽操作系统和网络协议差异,为异构系统之间提供通讯服务的软件。数据异构屏蔽可以由数据提供者处理,也可以由数据中间人在数据集成中间件中处理。根据数据异构屏蔽处理的位置不同,可将数据集成分为两种模式:分散式和集中式[4]。分散式中间件通过标准的访问接口提供数据的访问,它返回标准的实体描述信息,屏蔽数据在存储上的异构性,集中式模式需要数据提供者提供数据源的类型(如关系数据库类型)、连接信息(如IP、用户名、密码)和数据字典等信息,然后中间件通过这些信息访问数据源。
2.3 ESB与中间件方案比较
ESB松耦合的特性非常适合高校信息资源整合的需要,特别是业务流程的改造和整合,也有很多高校在进行数据资源整合时采用此方案,如上海交大、华南师大等,ESB除了能够为数据整合提供方案外,借助ESB基础设施平台,还可以实现全校的流程整合、应用整合等,ESB采用标准XML规范的消息格式,支持Web Service、JMS、JCA等标准,支持同步/异步消息机制,支持服务间的消息通信等诸多优点,但采用ESB架构有两个前提,首先需要得到各个应用厂商的支持,即厂商愿意配合学校的信息化工作,并有能力实现所需的接口服务,其次整体数据规划已涵盖各个信息系统间数据交换的需求,即要求各个信息系统提供的接口服务必须明确,分散式中间件技术对厂商也有类似的要求。
3 信息分类标准体系建立
3.1 学校信息标准化的重要性
高校信息化建设是一个复杂的系统工程,如何规范建设管理是一个重要的课题。建设环境体系是信息化校园的重要组成部分,它为集成数据环境的建设提供支撑和保障,建设环境体系包括管理规范和信息标准体系和信息安全与运维保障体系,具体展开可以包括信息化管理规范、信息标准规范、应用系统规范、基础设施规范等方面内容,信息标准规范是建设环境体系的基础部分,也是学校信息化建设优先重点建设的内容。
学校的数据表示需要按照一定的编码标准,以方便学校内部数据的流通和统计上报工作的开展,可以参考的标准有国家标准、行业标准、各省市标准等,学校应该根据自身实际情况引用参考标准制定供全校使用的信息标准,还需要建立学校内部定义的标准,如单位编码、专业编码等,老系统可以通过改造或对照表的方式实现与全校信息标准的一致,新系统在构建初期就引入全校信息标准相关内容,以实现与整体信息化校园的无缝对接。
3.2 标准代码集编制规则
1.涉及国家和教育部已颁发的标准时,可以按照相应的规范要求直接引用,对于找不到相关标准的代码,学校可以根据自己的实际情况制定标准;
2.对于正在使用的各类代码应逐一修订,并且需得到相关管理部门的认可;
3.编写制定基础性代码或编码规则,如单位编码、专业编码、学号等;
4.保证学校各部门与教育行政管理各部门之间畅通的信息交流。
参考文献
[1]高复先. 信息资源规划—信息化建设基础工程[M]. 北京: 清华大学出版社, 2002.
[2]张朝晖, 徐立臻, 董逸生 等. 一种基于SOA的企业集成平台[J]. 计算机工程, 2011, 37(5): 258-260.
[3]管红杰, 王珂, 江海峰 等. SOA架构的工作流管理系统的研究与应用[J]. 计算机工程与设计, 2011, 32(5): 1654-1657.
[4]裴玉玲, 庞佑兵 等. 基于中间件的异构数据集成系统设计[J]. 微电子学, 2010, (2): 260-264.