高校遗留系统信息整合研究
2009-03-10许鑫金莹
许 鑫 金 莹
摘 要:本文关注高校信息化建设中的遗留系统问题,首先研究了遗留系统的演进问题和演进方式,进而分析了遗留系统的信息整合方式以及其中数据集成涉及的几种模式,最后着重研究了高校遗留系统的信息整合问题,从问题表现、问题分解着手,对集成化信息资源管理和Web服务信息整合进行了探讨,提出并解决了一系列高校校园应用问题。
关键词:遗留系统 信息整合 高校信息化 数字化校园
中图分类号:TP274 文献标识码:A 文章编号:1673-8454(2009)01-0014-05
随着信息化推进的持续深入,遗留系统方面的问题变得越来越重要。何谓遗留系统?不同的学者、不同的组织从各自领域和具体角度出发给出了各自的定义。美国国防部从系统所体现的组织职能出发,将遗留系统定义为包含的各种组织职能都是存在的、可用的,但这些职能在技术层面上又是落后的一类系统;[1] Bennet从组织需求角度出发定义遗留系统是那些对组织很重要,但又不知道如何去对付的大型软件系统;[2] Brodie从商业需求的角度出发定义任何难以修改和演进以满足不断产生的新的商业需求的信息系统为遗留系统;[3] Sue Kelly从信息技术应用的角度出发认为遗留系统是那些组织中的信息技术(硬件、软件、应用和网络等)和蕴涵于这些技术的具体应用中的业务模型。[4] 众说纷纭,但归纳一下可得出定义中的共性,也就是遗留系统的一些基本特性:(1)遗留系统是可用的信息系统;(2)无论从技术还是从用户需求出发,遗留系统是落后的系统,必须通过自身的演进以适应组织和业务的变化;(3)遗留系统的演进是有难度的。
对照此定义,我们可以发现在高校信息化建设中,即我们的数字化校园e-Campus建设中存在着大量的遗留系统需要面对。这些遗留系统有些是纯软件系统,有些则是软硬件结合的信息系统,如图书馆的数字资源存储和检索系统;再如利用485专线搭建而成的后勤售饭系统,如何将其平稳地向校园一卡通系统过渡?是修改软件扩充功能还是推倒重来建设高起点系统?我们可以认为当高校校园软件系统难以修改和演化的时候就变成了遗留系统,只是包含在遗留系统中的数据、信息和知识构成了相当重要的资源,假设这些系统仍然能提供一定的业务价值,那么我们就必须对它们进行现代化改造或者想法替换,如何对待高校遗留系统?选择何种合适策略?怎么实施遗留系统的信息整合?这些正是本文将讨论和研究的问题。
一、如何对待遗留系统
1.遗留系统演进问题
遗留系统的演进是将现有系统进行系统化迁移的方式,它以更低的成本、更快的进度和较低的风险为基础,进而提高系统在运营、系统能力、功能、性能及可演进能力等方面的质量。学术界和工业界对于遗留系统的演进问题有着一些共识,认为其是一个结合了逆向工程、重构和正向工程的工程过程,目标是将现存信息系统重新构造为新的系统。
一般情况下我们可以通过逆向工程对遗留系统进行分析,获取现有系统被执行的应用、被使用的程序数据结构等关键信息,逆向工程可以分为抽取系统结构信息阶段、高层抽象阶段、系统结构表达阶段三个阶段。[5] 然后通过重构实现系统行为保持下的程序重组,这里的行为是指可观测的行为,即遗留系统在修改前后,针对任何合法输入,所产生的外部可观测行为应当是一致的。[6]最后通过正向工程来生成可替换旧软件系统的新系统及相关的详细文档,即把用户的需求转变成软件产品的过程。下文涉及的遗留系统信息整合也是在封装完成后,无论服务的整合、内容的整合,还是安全数据层的研究都是按照正向工程的方法来进行研究的。
2.遗留系统演进方式
对于不同的高校遗留业务系统可以归纳出不同的演进方式。
首先是维护。其是一个增量和迭代的过程,在维护阶段,遗留系统不会发生根本性的变化,其间对遗留系统所做的变动和调整,主要目的是为了修改运行中所出现的故障,以及对系统及其微小的功能增强,这些变化和调整只是对遗留系统的微调,不涉及结构性的调整和变化。其优点是维护能以较低的成本和较低的投入,完成对遗留系统的演进。其缺点也很明显:一是面对不断增长的师生服务需求和高校自身的发展变化,当高校需要采用新技术以满足这种需求时,仅仅维护是不能适应这种变化和发展的;二是虽然在短期内选择维护可以有效地控制成本,但是随着时间的推移,随着教育体制的进一步改革和高校业务流程的逐渐演进,遗留系统的维护成本逐渐增加,维护难度日益提高。
其次是现代化改造。遗留系统本身仍具有较高的使用价值,但是由于业务发展的需要,必须对遗留系统进行比维护规模大得多的系统变化,与维护相比其对遗留系统的变化和调整要复杂得多,这些变化和调整包括系统重构、系统功能增强、系统之间的整合、软件系统的改善。其优点包括:(1)完全替换大量的遗留系统,其代价和成本都是十分高昂且难以想象的,现代化改造不仅可以有效地降低遗留系统的演进成本,也能充分应用最新的IT技术,同时也可以有效地降低组织机构适应新系统的难度;(2)现代化改造能够有效地将遗留系统中大量应用、内容、蕴涵于这些应用与内容中的知识迁移到新系统,并通过现代化改造使遗留系统发挥更大的效用。缺点是同维护相比,现代化改造实施成本较高、技术难度较大;同替换相比,实施的复杂程度偏高。
再者就是替换。一般当遗留系统无法适应组织业务需要,且进行现代化改造已经不可能,对遗留系统的替换是组织面临的必然选择,既可以采用一次性彻底替换的方式,又可以采用增量替换的方式。优点很明显,对数字化校园建设中的遗留系统替换可以使得学校迅速拥有一套全新的校务运营系统,从而结束维护和现代化改造过程。缺点是:首先成本较高;还有就是储存在遗留系统中的大量应用、信息资源,及内含于遗留系统的知识在系统替代时需要考虑进行相应的迁移,但由于平台的差异和数据结构的差异,相应的资源迁移,尤其是知识的迁移,是采用替换策略时面临的非常困难的问题;同时因遗留系统拥有大量的操作人员和业务终端,替换实施过程中所面临的培训、部署等实施成本是造成替换策略高成本的重要原因。
二、遗留系统信息整合
1.遗留系统信息整合方式
遗留系统的信息整合从整体上表现为高校信息化业务应用视角的三个层次:
(1)基于数据交互与数据共享的信息整合——数据集成
数据集成是在数据库和数据源层次进行信息整合的重要方法,在此策略指导下又有多种特色解决方案,如全局模式、联邦模式、分布模式等。数据集成目标在于解决信息整合应用的数据流和数据一致性,从信息整合应用角度看,数据集成希望数据可以在应用系统、文件、数据库以及各类中间件之间流动,故数据集成的关键问题是实现对数据库、数据源、应用系统以及接口的集成。[7]
(2)面向过程的信息整合——工作流管理(应用集成)
过程集成技术主要包括过程建模、过程分析与优化、过程集成与运行三个方面的内容。[8] 过程建模是过程集成的重要基础;实施过程中更重要的是需要对现有的业务过程进行分析,并在此基础上对过程进行优化设计;在完成过程建模和过程重组后,下一个任务就是实现业务过程的集成与运行。这一模式在高校流程性应用系统的建设和集成中体现得尤为突出,与高校业务的流程固化及深层优化密不可分。[9]
(3)面向服务的信息整合——Web集成(门户集成)
随着因特网技术和应用的发展,面向Web服务的信息整合已经成为当前信息整合应用的主流。Web服务的基本特征包括完好的封装性、松散耦合、使用标准协议规范、高度可集成能力等。与前两个层次的信息整合相比,Web集成更具开放性,互联网上的各种开放架构可以极大方便我们对校园遗留系统的整合,其中的安全问题已在拙文《数字化校园中Web服务安全框架研究》中论述,本文不赘言。
2.信息整合中的数据模式
在高校信息化建设中,信息整合中的数据模式又经常被称为信息整合实施策略,以数字化校园建设中的数据平台建设为例,就可以发现其中模式的异同。不同的高校为了实现数据的统一、数据的共享、数据的交换建设,诸如:统一数据库、共享数据中心、校情数据仓库等不同名称的系统,以数据中心为例,各家高校的策略有着明显的区别,我们可以把“数据中心”这一中文名词对应于英文的“Data Center”、“Data Platform”、“Data Bus”三类建设实施模式,第一类是一种大集中式的数据中心,用统一的数据库代替各应用系统各不相同的后台数据库,唯一的数据源,数据的一致性和集中管理得到了充分体现;第二类是一种共享式的数据中心,其和各应用系统之间是一种松耦合的关系,平台只是从各个应用系统中提取可共享和需要共享的数据,单独存储和展现,实现平台与应用之间的数据上行和下行;最后一类是一种分布式的数据组织方式,各个应用系统独立存在,数据之间的交换通过数据总线或者点对点的数据接口实现。这几类方式并无优劣之分,只是学校如何选择适合自己实际情况的不同模式而已。
我们对遗留系统信息整合中的数据模式进行归纳,可以有如下几类主要整合方式。
(1)全局模式,通过将系统内部各数据库整合为单一模式,为用户提供一致、统一的数据访问界面,用户以使用本地数据库的方式调用系统的数据库,而不必考虑系统数据库的分布及异构特性。全局模式通过牺牲本地数据自治性的方式来解决不同数据库之间语义、结构和行为的冲突,全局方式的系统构建较为机械,系统扩展能力较差。
数字化校园建设中涉及的应用和数据信息庞大,各种数据既包括结构性良好的关系型数据库,又包括各类多媒体文件、文本文件等,全局模式在信息整合中无法保证其灵活性需求。全局模式为了信息整合的方便,必要时还需要对本地数据库的数据模式加以调整以减少信息整合的难度和复杂性,不过由此会影响到校园应用系统的严格性和规范性,值得商榷。
(2)数据仓库方式,这一方式下的信息整合是全局模式的延伸与扩充,基于数据仓库的信息整合方法是从涉及组织机构管理的各个异构数据源中抽取数据,按照集中、统一的视图要求,进行预处理、转换,以符合数据仓库的模式,并存储到数据仓库中,然后提供对这个数据仓库的访问机制,当原信息源的数据发生变化时,存储在数据仓库中的数据也要作相应的变动。[10]
数字化校园建设中的共享数据中心基础上的数据仓库和决策支持建设正是这一方式的应用,随着数据的积累,可以实现校情历史呈现和趋势发展、辅助学校战略决策等深层应用。其优点在于便于进行联机分析和数据挖掘,为高校进行全局范围的决策和趋势预测提供有效的支持,缺点是数据重复存储,实际事务处理能力有待改进。
(3)联邦模式,通过为每个本地数据库提供一个输出模式以供其它应用系统数据库共享。应用系统使用这些输出模式来定义一个输入模式,即表示能够本地访问的远程数据库信息的部分全局模式。使用联邦模式可以很容易地应对遗留系统的问题,实现新旧系统的“混搭”。
(4)基于中间件/封装器(Mediator/Wrapper)的信息整合方式则是通过一个“中间模式”(Mediated Schema),将数据和应用保存在局部数据源中,通过各种数据源的封装器,应用和数据被虚拟成中间模式,用户的查询与使用基于中间模式,而屏蔽了不同数据库的特点。这种方式适用于数据源数目多、各局部数据源的自治性很高且局部数据经常变化的遗留系统环境。
三、高校遗留系统信息整合
1.高校遗留系统信息整合问题表现
高校大量的遗留系统所表现出来的问题大多数是信息化建设中的通病,遗留系统信息整合问题主要表现在:
(1)遗留系统的“条块共存、纵强横弱”,学校中不同部处、不同院系各自独立运行的遗留系统自成一体,封闭运营,缺乏有效的互联互通,形成了“信息孤岛”,无法对服务资源和信息资源进行统一协调的管理,更无法建立有效的服务管理机制和内容管理机制。
(2)遗留系统的“信息孤岛”现象也导致不同机构组织之间无法通过统一的作业平台实现互操作和协同作业,主要体现在没有统一的公共平台协调管理的情况下无法实现服务数据的共享和交换,更无法实现不同系统的组合,以及跨部门和跨平台的服务。
(3)前述遗留系统在业务问题和平台问题的表现必然带来学校信息化建设中很难体现和提供一体化的服务。在今天高校体制改革、人才培养改革、社会需求对接等大背景下实现IT对于高校管理的支撑很有限,对于高校师生提供的服务也很有限。
具体到高校遗留系统信息整合问题的技术层面,又可以表现为对于前述方式、模式的灵活应用,以校园一卡通为例,一卡通平台应为各种具体的校园应用提供通用的卡应用接口,在一卡通系统中,第三方的接入有紧耦合、松耦合、不耦合等几种模式,这实际上是联邦模式方法下根据用户需要的不同策略,紧密耦合集成方法建立在数据库模式的集成上,通过定义模型来实现聚合;松散耦合集成方法则将集成的任务交给用户,通过提供一套工具使用户能完成集成工作。[11]
2.高校遗留系统信息整合问题分解
因篇幅问题,本节及后文将有选择性地结合高校信息化建设中的遗留系统信息整合实际操作进行逐层深入探讨。一个典型的高校遗留系统由应用、内容、网络、保障系统等几部分组成。与之对应,具体到信息整合工作的操作层面,首先要实现各类应用的整合,即通过封装将各类应用封装成系统可以识别的服务,以便系统统一管理;其次,实现对内容的集中管理,即实现集成化的信息资源管理,以便对各类校园信息实行统一和规范化管理;第三,必须建立安全的数据交换机制,以保障网络的安全数据交换;第四,为了保障系统的正常运营,必须建立统一的校园遗留信息系统信息整合的保障机制,包括数据标准与数据规范、管理体制、法律法规。
遗留系统的信息整合问题可分解为以下三个子问题:
(1)遗留系统的服务整合管理机制,这是遗留系统信息整合的基础,表现为用户如何实现遗留系统之间的业务协同和互操作?如何实现个性化的用户服务?如何实现灵活的服务组合和服务协同方式?可以说这首先是对高校业务的理解问题。
(2)遗留系统信息资源的集成化管理,这是遗留系统信息整合的实现路径。信息资源的开发、利用、共享是数字化校园建设过程中最重要的指标之一。
(3)遗留系统信息整合的应用支持与系统保障,既包括门户平台的集成和数据安全交换机制,前者是Web集成(Web服务信息整合)的具体体现,可以实现一站式服务,后者是系统间信息传递的安全支撑;又包括数据标准与数据规范、管理体制、法律法规等内容,分别从技术标准、组织标准、制度建设三个方面保障了遗留系统信息共享和业务协同的实现。
后文将对高校中的集成化信息资源管理和Web服务信息整合分别予以分析研究。
3.高校遗留系统的集成化信息资源管理
从逻辑上划分,我们自底向上把数字化校园遗留系统的集成化信息资源管理分为四个层次:数据层、标准层、作业层、表示层,在每个层次上面对不同对象,完成不同的工作,层次与层次之间按照一定的标准和规范实现共享和交互。
(1)数据层:存储遗留系统的各种原始信息资源,例如关系型数据、文件、图片、视频资料等,根据相关数据交换标准进行交换,不同的原始信息资源根据各类定义和需求,组合成为内容对象。
(2)标准层:按照相关数据标准(如教育部高等院校信息集)对数据层的原始信息资源进行标准化工作,产生标准化的、符合规范的内容对象,其是某一项信息资源的完整组合。
(3)作业层:标准化后的信息资源,按照一定程序产生适合数据发布的信息资源,即对内容对象进行加工,转换为内容组件,内容组件是集成化信息资源管理中的基本管理对象。
(4)表示层:根据用户的服务请求,通过不同的发布管道和发布方式,遗留系统的集成化信息资源管理产生的发布内容一般通过信息门户传递给用户。
在实际的校园信息资源集成管理中除了涉及数据交换标准、元数据规范、内容呈现标准规范以外,还需要考虑信息资源管理(数字资源整合)平台问题,可参见拙文《高校数字资源整合平台研究》。
4.高校遗留系统的Web服务信息整合
下面对eCampus遗留系统表示层的集成管理进行研究,基于Web服务的信息整合主要过程为:在线服务使用Web服务技术进行重新包装之后,将描述Web Services的WSDL文档载入开发环境,然后生成调用接口,并与代码集成。在运行时,Web Services的接口有可能改变。当接口改变后,Web Services调用失败,此时应用程序应该有能力再一次获取WSDL文档,重新生成调用接口,并与代码进行绑定。也就是说Web Services技术赋予了应用动态绑定的能力,而不像以前传统环境下仅仅具备静态绑定的能力。
数字化校园遗留系统得应用经过封装后成为Web服务,Web服务在服务整合中,屏蔽底层系统之间的差异,实现异构系统信息整合的基本要素。Web服务的描述从功能的角度可以有若干种,包括但不限于以下五种:(1)Web服务基于TCP/IP、HTTP、XML等规范定义,功能主要包括Web上链接文档的浏览、事务的自动调用、服务的动态发现和发布;(2)从组成框架及实现目标的角度出发,Web服务是一种网络操作,能够利用标准的Web协议及接口进行应用间的交互;(3)从语义的角度出发,Web服务是语义Web的一种应用;(4)从网格计算的角度,Web服务能用于Web上的资源发现、数据管理及网格计算平台上异构系统的协同设计;(5)从信息检索的角度,Web服务是指包含了分布策略和路由信息的电子文档之上进行分布式文档检索的信息服务。[12] 为何罗列这么多的Web服务描述呢?是因为这些描述可以从校园应用的不同角度来看待信息整合问题,在最近一段时间也有大量的面向服务架构(SOA)应用于高校的研究和论文出现,着眼于网络应用、教学资源建设、图书馆信息化建设,只不过这些服务现阶段都表现为Web服务。
四、结束语
中国教育和科研计算机网下一代互联网示范工程的开展,语义网络的发展,大规模科学计算的应用,高校改革的深入,这一系列的变化昭示着高校信息化正面临着越来越多的挑战,与此同时也有着越来越多的校园遗留系统问题需要我们去面对,需要我们深入地去探究其演进规律,实现信息整合。同时,我们的高校管理者和信息化建设者也意识到信息化带来的挑战和机遇。
如何保护校园遗留系统的已有投资?如何适应校园师生只关心服务内容不关心服务内部架构的现实?如何保证高校业务和校园服务满足个性化的请求?这些问题都可以在本文基础上进一步拓展研究,引入诸如面向服务架构(SOA)、语义网络(Semantic Web)等方面的理念进行分析和尝试解决。希望本文可以起到抛砖引玉的作用。
参考文献:
[1]P. Aiken, A. Muntz, and R. Richards, DoD Legacy Systems: Reverse Engineering Data Requirments[J]. Communic-ations of the ACM, Vol.37, No.5, pp.26-41, May 1994.
[2]K.H.Bennett. Legacy Systems: Coping With Success[J]. IEEE Software, January 1995, Vol 12, No.1:19-23
[3]M.L.Brodie, M.Stonebraker. Migrating Legacy System[M]. Morgan Kaufmann Publishers,1995
[4]Sue Kelly, Nicola Gibson, Christopher P.Holland, Ben Light. Focus Issue on Legacy Information Systems and Business Process Change: A Business Perspective of Legacy Information Systems[J]. Communications of the Association for Information Systems, Vol 2, Article 7, July 1999.
[5]Andre Postman, M.S. Applying relation partition algebra for reverse architecting[J]. Workshop on Software-Reenginneering, Bad Honnef, Germany, 1999.
[6]Garrido,A., and Johnson,R.. Challenges of Refactoring C Programs[J]. Proceedings of International Workshop Principles of Software Evolution, 2002.
[7]翟晓娟,黄克雷, 许鑫.从高校业务架构到高校数据架构的思考[J].中国教育信息化, 2007(7).
[8]范玉顺.企业集成系统技术[J].新技术新工艺, 2005(7).
[9]翟晓娟,黄克雷,许鑫.高校流程型应用系统的分析研究[J].中国教育信息化, 2007(1).
[10]张蒲生,苏运霖.基于政务数据仓库的数据集成及关键技术[J].计算机工程, 2003(9).
[11]许鑫,苏新宁,姚瑶.数字化校园一卡通平台研究[J].现代图书情报技术, 2005(7).
[12]岳昆,王晓玲,周傲英. Web服务核心支撑技术:研究综述[J].软件学报, 2004(3).