沈阳大学:信息资源整合快速实现数据共享
2014-02-05周强
文/周强
沈阳大学:信息资源整合快速实现数据共享
文/周强
沈阳大学数据中心信息资源整合平台尝试构造一个基于SOA架构的整合平台,对不同的业务系统进行有效地共享和集成,不仅可以适应业务频繁交互和重构的需求,而且可以根据实际需求的变化快捷方便地进行业务流程再造。
一个完整的数据中心集成了各种服务,包括基础设施服务、server Farm服务、存储服务、网络服务、安全服务、管理服务、核心应用服务等。在推进数字校园建设过程中,学校改造与升级了网络基础设施,建造了万兆校园网络。对于近年来逐步构建的各种管理信息系统,如教务管理系统、网络教学平台、人力资源管理系统、资产管理系统等,为消除这些应用系统增多带来的信息存储问题及数据难以保持一致的弊端,以及给用户账号管理带来的混乱,必须应用统一用户管理和门户系统将各应用系统进行集成,才能为数据中心建设打好基础。因新旧业务系统之间存在许多应用交叉,如何处理业务部门之间业务集成以及新旧系统业务衔接成为校园数字化建设的重要任务,通过新的技术实施完成校园内应用系统之间的数据交换,使业务系统间形成基于底层数据的互联,达到业务集成的目的,即数据整合。
共享数据中心
数据是高校工作中的宝贵资源,其范围、可用性、质量都直接影响着高校信息化工作的有效性。数据的组织结构总体上可划分成数据逻辑结构、数据存储结构、数据备份结构。数据逻辑结构、数据存储结构、数据备份结构均将数据中心数据作为一个独立整体进行考虑。数据逻辑结构与应用架构对应,实现了应用逻辑向数据逻辑的映射,描述了数据层系统如何规划对业务应用的数据服务。数据存储结构、数据备份结构与基础设施对应,描述了数据如何按照一定的规则,在物理介质中实现存储备份管理。
信息标准化是整个学校管理信息化建设的基础,是将来实现全校范围内和与外界进行教育信息资源交流与共享的必要条件。通过制定完备的管理信息标准并以之为规范指导我校信息系统建设,可以克服软件设计不规范、兼容性差的问题,因此所采用的信息标准必须和国家、教育部以及中国科学院的信息标准相兼容。
数据标准化的意义在于标准的数据定义及管理水平。现有业务系统数据在描述、定义、表示形式方面缺乏统一标准,是实现数据整合的主要障碍。建立数据中心后,将对数据中心中各业务数据建立统一规范,从数据元名称、属性、表示三个基本部分订立标准,实现数据中心数据元设计、采集的标准化,为数据共享、交换与整合奠定基础。
共享数据中心、统一身份认证、统一门户及信息服务平台构成了电子校务系统的三大支撑平台,是信息资源整合的核心框架。它为各应用系统的接入以及数据信息的整合提供服务,保证了电子校务系统的伸缩性,增强了系统的扩展能力。
共享数据中心是对各个应用系统数据资源进行整合的中心。提取的数据信息经过共享数据中心的分类、筛选等处理形成共享数据。共享数据通过权限控制可以提供不同层次和范围的共享。共享数据中心平台是各类信息服务的基础。同时,共享数据中心还负责历史数据的产生和存储,形成数据的积累,支持数据挖掘应用。
身份安全认证中心关键是集成
一般容易将应用理解为应用系统,因此应用集成阶段的数字校园建设主要是以应用系统为核心,而忽视了应用的另外一个含义“使用”,实际上建设数字校园是为了“使用”,只有用户“使用”得好,才能达到提高教育质量和效率的目的,数字校园才有效益。因此,如何让用户“使用”好,是数字校园必须重视的问题。统一认证就是提高用户体验的有效方式。
身份安全认证中心以统一用户管理和单点登录为基础,并充分考虑了系统的灵活性和数据惟一性,实现统一用户数据,并同步给其他应用系统,实现业务系统的单点登录。
校园网中的业务系统是在不同时期由不同单位开发的,所用开发语言也不同,都带有相对独立的认证系统。针对这种情况,如果校园网内采用统一身份认证,只能采用松耦合的权限管理方式,首先门户上定义用户在整个系统的粗权限(即访问某个系统的权限),而子系统中的权限由二次鉴权来实现,即由子系统来控制。这种方式既不改变已有业务系统的身份认证程序,加入新的系统也容易实现。
身份安全认证中心功能包括:统一用户管理和单点登录。统一用户管理通过Web方式进行基于数据库用户管理,包括部门、人员信息的浏览,部门、人员信息的管理。单点登录经过身份验证后,并获取该用户所能访问应用系统的列表,然后通过统一用户管理系统中的应用系统导航,实现各应用系统之间的单点登录。同时系统提供JAVA接口程序,包括:部门、用户数据访问的接口规范以及实现;身份验证的接口规范及实现;单点登录的接口规范;由统一用户管理系统向其他信息子系统进行数据同步的接口规范。
在建设身份安全认证中心过程中,集成现有系统和在建系统是至关重要的环节。保证统一用户管理系统和其他应用系统之间的部门和用户数据统一性和唯一性,所有在统一用户管理系统中挂接的应用系统中的部门和用户数据都要来源于统一用户管理系统。如果统一用户管理系统中的用户和部门数据变化,那么必须把变化的数据同步到所有子系统,使子系统对应的数据做相应的变化。
其中数据同步方式分为以下几种:
1.定时同步:认证中心可以纪录数据修改的日志信息,然后定时来与子系统进行数据同步,同步可以是子系统主动取认证中心的同步日志,也可以是认证中心把同步日志推给各个应用子系统;
2.实时同步:认证中心如果有人员和部门的变化,只要认证中心进行修改,然后认证中心自动就会把修改的数据同步到子系统中;
3.手动同步:响应用户即时同步要求,执行同步操作,手动将有关用户数据同步的子系统中。
数据同步范围分为以下几种:
1.按照地域同步,即指如果某个子系统只需要某个分局的数据,则可以按照不同的分局来进行数据同步;
2.按照部门同步,是指如果某个子系统只需要某个部门的数据,则可以按照部门来进行数据同步,例如统计类部门的人员数据。
3.按照地域和部门同步,即以上两种方式相结合,同步某一地区某一部门的数据。
做好数据质量保障
数据中心的数据加工存储层主要由数据仓库(DW)和数据清洗转换装载(ETL)组成。应首先建立采集中心库,将各个业务系统中的数据按照指标体系中的要求集中到中心数据库中,然后再进一步抽到分析主题库,为部门提供数据分析、领导决策提供高质量的数据来源,因此数据质量成为关键问题。
在高校数据中心的实际环境当中,存在许多数据质量问题:
1.相对于新的业务应用系统来说,老业务数据不完整,导致系统升级和移植后,数据质量不能达到新应用系统的要求;
2.对于历史数据的转换,基本依赖于系统上线时的数据转换,而不是将历史数据的转换和修正作为一个长期的过程,在今后的业务操作中逐步补入;
3.系统校验控制不严谨或BUG导致的数据错误;
4.管理员为保证业务的运行,在取得授权的情况下,直接修改数据库后台数据,由于对应用系统的熟悉程度的差异,导致出现数据不一致;
5.升级和移植过程中数据转换或迁移操作错误,导致的数据错误。
提高数据质量的方案主要有两种:
1.手工数据补入方式。合理的方案是提供数据补录功能,使分散的信息数据间建立起应有的联系。这种方式要通过软件编程进行,成本低且易实现。
2.在ETL过程当中采用“数据清洗”工具。可以用人工来手动整理数据库,也可以利用多种自动数据整理工具来完成,这些工具能够自动检验以及填补损失的数据、消除重复数据以及确定、匹配相关信息,许多工具如今还增加了实时功能,能够自动检查、整理数据流。这种方式功能强大,但投入成本也很大。
除了采取上述办法去提高数据质量外,要更主动地去防止数据错误,也就是应该在初始获取数据时就进行数据质量的控制,换句话说,除了手工补录和在ETL过程中采用“数据清洗”工具外,也可以在用户接触点加入一些输入规范校验功能。
基于统一数据标准的数据交换平台在信息资源整合中占据重要地位,负责接入各种服务资源,通过采用统一服务接口使得各种服务或应用与服务之间可以相互方便访问,以星形结构替代了原来各服务之间的点对点结构,优化系统连接架构,降低系统集成复杂度。数据交换平台由连通服务管理模块、可视化流程管理模块和服务库管理模块构成。在信息资源整合工程中起到业务协同的整合作用,以及全部服务资源和软件构件资源的注册和集中管理。
信息门户平台设计
信息门户是一个集成了各种网络资源的Web应用,提供给用户对这些Web资源的单一访问入口,同时只需要用户对于门户认证一次,而不需要对于每个应用模块都再次进行认证。
学校门户管理员可以对门户系统进行定制以符合组织、用户以及用户组的需求,可以定制门户的外观使之符合组织标准,定制页面内容以符合用户以及用户组的业务需求和自身特性。各种用户都可以进一步定制自己的门户视图。用户可以将Portlet添加到页面中,可以控制Portlet的颜色。通过将Portlet集中并提供给用户个性化定制的能力,提供给用户一种高效率高满意度的工作方式。
构建统一展现信息的门户平台。学校门户能够通过统一的访问入口,就可以快速导航到所需的信息,实现了功能集成、信息定制和个性化的需求。不同的用户可以定制不同的功能门户。学校门户允许教师员工和学生选择其用户体验,提供基于角色、上下文、操作、位置、偏好和团队协作需求的个性化应用程序。门户提供了复合应用程序或业务混合框架,以及构建灵活、基于SOA 解决方案所需的高级工具,它还为任何规模的组织提供了他们所需的极强的可伸缩性。
本项目研究实现的信息门户平台支持业内标准的门户技术框架。提供标准接口和部署应用组件,可与不同应用系统或资料源连接和整合。支持与内部B/S、C/ S架构的系统集成。学校门户系统是SOA环境的前端。它通过诸如 JSR 168 Portlet API、Web Services for Remote Portlets (WSRP) 等行业标准机制来为可能不同的组件、应用程序和系统提供统一的界面。
学校门户系统提供完整的门户服务,为学校提供连接服务、管理服务以及展现服务的环境。Portlet 是门户平台的核心。显示在门户网站页面上指定区域的Portlet,是一种特殊的可重复使用的Java Servlet,通过它能访问许多不同的应用程序、服务和 Web 内容。门户平台提供了大量基础Portlet,包括用于显示内容、转换 XML 以及访问搜索引擎和 Web 页面的portlet。还可使用某些第三方 Portlet和提供 API,Portlet 开发人员可以使用 API 创建定制 Portlet。
信息门户平台支持多种用户目录,比如轻量级目录访问协议 (LDAP) 存储库、数据库存储库、文件存储库。用户目录支持众多LDAP存储库,包括Tivoli Directory Server、Lotus Domino、Microsoft Active Directory等。门户还开放了公用的API,用户可以通过定制,支持所有的用户目录,包括Windows Domain以及用户数据库等。门户系统提供统一的浏览器入口来访问和管理门户。用户通过登录统一的入口管理门户,包括页面定制、人员管 理等等。
数据中心信息资源整合平台的建设基于“软件即服务”的思想,通过采用SOA和中间件技术,提出了一套完整的信息整合方案,在此基础上能迅速便捷地构建开放的、模块化的、可重用的软件组件,利用Web服务提供了基于可扩展标记语言标准接口的若干中间件,具有完好的封装性、松散的耦合性、协议规范的标准性、以及高度的可集成性等特点,能够很好地满足应用信息整合的需求。
沈阳大学数据中心信息资源整合平台尝试构造一个基于SOA架构的整合平台,并运用中间件技术作为实现这种架构的关键技术,对不同的业务系统进行有效地共享和集成,在最大限度重用现在系统资源的基础上构架一个整合平台,不仅可以适应业务频繁交互和重构的需求,而且可以根据实际需求的变化快捷方便地进行业务流程再造。此方案提高了工作效率,为使用者提供方便、高效、一体的环境和服务,也希望可以为高校信息化建设行业化、个性化及具有前瞻性的整体解决方案提供参考。
(作者单位为沈阳大学信息中心)