高职高专数字化校园数据共享的策略及实现*
2014-06-09张烈超刘开文武汉交通职业学院湖北武汉430065
张烈超 刘开文(武汉交通职业学院,湖北 武汉 430065)
高职高专数字化校园数据共享的策略及实现*
张烈超 刘开文
(武汉交通职业学院,湖北 武汉 430065)
分析当前高职高专院校信息化建设中数据共享普遍存在的问题及形成原因,提出构建以“统一数据标准、统一公共数据平台、统一身份认证及统一信息门户”为核心的数据共享集成信息平台思路及解决方案。笔者将该方案应用于武汉某高校,实现了该校各业务系统通过数据集成信息平台进行数据共享,取得较好的效果。
数据共享;数据标准;数据平台;系统集成;身份认证;信息门户
《教育部关于加快推进职业教育信息化发展的意见》(教职成〔2012〕5号)指出:加快教育信息化进程的战略部署,切实推进职业教育广泛、深入和有效应用信息技术,通过现代化手段,方便地实现高职院校的与信息处理活动相关的全部过程,从而达到提高教学、科研、管理等工作效率的目的。全面加强信息技术支撑职业教育改革发展的能力,以信息化促进职业教育现代化。
1 当前高职高专院校信息化建设中存在的问题
现代化高等职业教育需要坚实的信息化基础,如:多媒体教学资源环境的数字化、办公管理手段及教学科研环境的数字化改进等都与信息技术息息相关。然而,大多数高职院校在办学规模迅速扩张的同时,其信息化建设缺乏全局考虑及统一规划,数字化建设过程中的主要问题有:(1)不注重整体规划,各部门的数据来源各异;(2)不注重标准化的研究与应用[1],数据没有统一的标准,系统无法交互,造成许多信息孤岛;(3)缺少统一的组织管理。由于数据不能共享,造成各系统重复数据采集与存储,数据大量冗余,工作效率低。
2 数字化校园数据共享解决的思路
因高职高专信息化建设情形与普通本科院校有很大的区别,其信息化建设不能完全照搬普通本科高校。另外,各高职高专院校信息化建设情况各不相同,我们则讨论适用于绝大多数院校的以解决数据共享为核心的信息集成平台建设的策略及方法。
从信息化建设长远发展规划来看,构建一个以“统一数据标准、统一的公共数据平台、统一身份认证及统一信息门户”为核心解决方案的数据共享集成信息平台,消除信息孤岛的存在,实现教学、管理等各种资源的集成与共享[2],是当前高职院校信息化建设的关键及难点。
本文拟以武汉某高职院校(以下简称“某校”)数字化校园建设过程为案例,析论相关问题的解决途径与方法。
2.1 信息标准建设的思路
信息标准规范体系学校信息化建设重点之一,信息标准是指各应用系统在对数据进行采集、处理、交换、传输的过程中所遵循的统一规范,为全局数据系统提供类似数据字典的作用,实现信息交换与共享。信息标准规范体系的确立,是构建统一数据平台、实现信息交换及信息共享的基本条件,在此基础上,建立集成的管理信息系统,提供全面、准确、权威的数据,各应用系统通过数据共享平台实现数据同步与共享,从而消除信息孤岛[3],鉴于信息标准重要性原因,因此,学校可专班成立信息化建设领导小组,为信息标准及规范的最终确定作协调工作。
高职院校若在校内实现信息化并保证系统之间数据自由共享,必须建立适合本校的信息分类编码标准体系,信息标准的制定应该在遵循国家相关信息规范的基础上,同时兼顾各个标准之问的兼容性、一致性及信息标准的可扩展性,通过充分调研某校内各业务部门的业务、数据,由数字化领导小组组织相关职能部门制定符合学校自身实际的信息编码、确定逐步完善各项标准可持续发展方案,通过审议最终形成信息分类编码规格说明书,由此形成一套与国家标准、教育部标准等其他行业信息标准相兼容的信息化标准,即使信息标准具有普适性,在此基础上,各类应用系统数据按此信息标准进行产生、使用、交换,使数据真正共享。此外,由于信息化动态发展的缘故,信息标准也必须及时更新、不断充实。
2.2 统一身份认证建设思路
学校中各业务部门使用不同的应用系统,用户访问各系统需要不同的用户名及密码,且安全性很差。因此,统一身份认证是数字化校园建设中数据共享问题需着力解决的另一项重要建设指标,主要解决各应用系统访问用户名、密码、认证授权等问题。通过为用户提供统一的授权机制及方便、安全的密码认证方法,通过统一身份认证平台机制,被认证用户只需唯一的用户名及密码就可以使用校园网中被授权使用的所有业务系统。此外,建立统一身份认证平台机制,有助于解决数字化校园应用系统中用户多重身份所带来的管理相对混乱问题,有利于提高系统及网络安全性,还可有效避免系统分散建设过程中的重复建设问题,大大减少资金的投入。
身份管理平台设计时,需要解决好以下几方面的设计要点:(1)以数字化小级审核通过的信息标准为蓝本,设计适合本校实际的师生数据,并将其存于公共数据平台数据库中;(2)针对各业务系统,分别设计完整的认证集成方案,保证各业务系统与统一身份认证管理平台的无缝对接; (3)确保不同用户或系统的认证安全需求以及身份管理平台的高可靠性。
2.3 统一的公共数据平台建设思路
构建统一的公共数据平台是数字化校园建设的难点及关键,其建设的目标是建立一个跨分布式或异构式数据系统、跨业务部门的信息交换平台,整合异构数据资源,利用中间件软件进行数据转换,生成符合各异构业务系统的共享信息,实现业务系统之间无缝对接并互通互连,消除信息孤岛。构建公共平台的核心是如何将各异构系统进行整合,为高校信息综合应用系统提供统一、安全、便捷的信息服务,当数据积累至一定的程度之后,可针对某一业务,如根据新生地域来源、毕业生工作地域分布等历年数据为学校招生、就业等开展数据挖掘予以分析,为学校高层相关问题的决策提供数据依据。
通过分析当前成熟数据集成方案中的数据仓库及联邦数据库系统[4]的优缺点,并结合学校信息化建设的实际情况,笔者与同事在数字化建设规划过程中采用了将异构的各应用系统进行集成,并建立统一公共数据平台的方案。下面对该方案进行展开说明。
根据数据流向可分为:(1)数据抽取(即从各异构的应用系统抽共享取数据至集成中心库); (2)数据订阅(即由数据集成中心库下发至各业务应用系统)。
2.3.1 异构应用系统的集成及数据抽取
各种异构系统集成的根本目的是消除信息孤岛,实现数据共享。由于目前大多数高职院校现存业务应用系统运行状况良好,废除重建的时限可能很长,因此,解决数据共享的问题,系统集成是目前最常用的方法[5]。消除信息孤岛的办法一般有如下两种:(1)废除现有的异构系统,并按照相关信息标准规范予以重建;(2)通过系统集成的方法,将现有的异构系统加以整合。
经过调查,高职院校在数据集成方面主要面临以下问题:(1)各个业务系统是在不同时期,由不同的技术构建的,造成数据类型存在差异;(2)数据映射工作量比较大,为各业务系统处理关系映射时,对数据内容的理解必须精准;(3)数据质量比较差,代码、标准都没有统一定义,集成过程很容易出现问题;(4)数据集成的抽取方式要求比较高,并非所有数据库都能支持抽取;(5)数据非严格同步,即源端的数据变化及操作未必能够实时反应在目标数据端上;(6)数据加载策略的多样性造成集成相对困难;(7)数据同步周期的很复杂。
基于资金投入、业务需要等因素的综合考虑,各高校可根据业务系统实际应用状况采取如下的调整方案:对于适合本校实际需要且运行良好的业务系统,采用集成方案整合到数字化校园中;而对于不适合本校实际需要的系统,则可按照统一信息标准予以重建。
2.3.2 数据共享订阅思路
数据订阅是各业务系统从集成于数据中心的其他应用系统中获取共享数据的主要方法,其主要功能包括:(1)开放订阅用户并提供审核;(2)生成数据订阅脚本;(3)数据订阅的设置(如建触发器等);(4)数据订阅的方式:自动或者手动,其中,手动数据订阅方式由用户根据订阅脚本设置需要从中心数据库(如图1)中选择并提取订阅内容;自动订阅数据方式则需事先编写好订阅数据及时间等相关代码的脚本,而提取数据则由机器自动完成;(5)针对不同的应用系统,数据订阅采取不同的策略:对相同数据库的业务系统提供快照、跨库视图、文件下发等模式;而对异构的业务系统,则采用输入视图,文件下发两种订阅模式。
图1 数据中心与各应用系统数据共享(订阅)关系
2.4 统一信息门户
统一信息门户是数字化校园建设中解决数据共享的重要组成部分,为各类业务应用系统的提供统一的访问入口,利用Portal技术[6],可将分散于各业务系统中的应用及内容进行聚合,从而实现应用关联和信息共享。在信息门户中,用户可轻松地获取有关的知识信息和外部信息,能及时处理与之相关的事务。
通过搭建信息门户平台,重点解决以下几方面的问题:(1)为师生搭建高效、可靠的信息平台;(2)配置符合通用标准、可持续升级的系统框架;(3)用portal工具集成各种web应用,以集成界面的方法展示给最终用户;(4)为用户提供安全的凭证访问手段,从而实现对各业务系统单点登录的功能;(5)为用户提供个性化设置需求的自定义功能。
统一信息门户以网站界面形式将校内分散、独立的应用程序进行集成,整合OA、教务系统、校园一卡通等,每个业务系统为师生提供不同的信息服务,同时信息平台可为不同身份、不同权限的用户设置应用展现、内容及部门频道管理。
3 数字化校园数据共享的实现
3.1 信息标准建设的实现及应用
3.1.1 数据标准建设的内容
信息标准集的制定应在遵循国家、行业等相关信息规范的基础上,根据各院校自身的特点,制定管理信息标准,包括信息标准化的分类,定义标准化的数据源等。数据集应按相应标准统一编制,同一数据在各个系统中应保持唯一性,防止多次、多处重复输入系统。某校信息标准的建设内容包括:学生信息数据标准集、教职工信息数据标准集、科研数据信息标准集、资产数据信息标准集、图书数据信息标准集、教务数据信息标准集、学校通用信息数据标准集等。某校信息标准体系包括校级制定的公共标准和各个业务部门制定的专用标准两个部分,相关结构如图2所示:
图2 信息标准体系
3.1.2 根据信息标准规范编码信息
在确定信息标准的基础上,建设符合规范的身份信息是形成统一身份认证的前提条件,也是系统集成的基础。高质量的数据源是整合项目建设成功的关键[7]。根据信息标准的规范及各应系统的具体情况,建立全校教职工和学生的唯一身份编码,即教职工工号(以教职工来校年份及先后顺序编号)和学生编号,并以此作为统一身份认证中与之关联数据的唯一编码,同时,以国家标准代码库中的信息来规范化各应用系统数据字典的信息[8]。学生学号信息编码规则示例片段如表1所示:
表1 学生学号信息编码规则(Xi代表不同的数字编号)
3.1.3 在规范信息标准编码基础上开发应用系统
在确定信息标准的基础上,某校首先建设了代码标准信息库,并在此基础上开发了适合本校实际情况的招生系统,新生迎新系统及毕业生离校系统。3.2 统一身份认证的实现
根据实际需要,某校建设的身份管理平台实现了如下功能:(1)单点登录(singlesignon,SSO)服务; (2)身份数据安全存储管理;(3)用户账号数据同步服务。通过建立统一身份认证平台,将各业务系统(门户、教务、校园一卡通、OA等)的用户身份进行了整合,使得用户只需通过一次身份认证过程就可以访问具有相应权限的其它业务资源;通过身份管理机制实现了用户信息的自动同步处理等功能;此外,保证了各个平台的统一:如身份库与门户库的无缝对接,为整个网络平台提供了集中的管理及安全认证机制。
3.3 统一公共数据平台的实现
3.3.1 异构应用系统的集成及数据抽取
某校数据集成架构模型如图3所示,以数据集成中心库(数据集成平台内部的临的数据存储)为核心节点,对于要接入中心库的各业务系统的数据源进行调研、开放相关数据接口(API),确定要从应用系统抽取数据及其对应于数据集成中心库的表,再利用行业中成熟中间件软件工具完成复杂的抽取(Extract)、转换(Transform)、清洗(Cleansing)、加载(Load)工作。其中数据抽取是指根据数据来源进行信息收集,并从业务系统获取指定的共享数据;数据转换是把从业务系统中抽取的源数据经过清洗后转换成集成中心库可加载的格式数据。利用中间件软件工具可大大降低用户的集成难度、提高集成效率。
图3 数据集成架构
3.3.1.1 利用中间件软件从业务系统中抽取数据至数据集成中心
在确定了应用系统数据集成架构及相关中间件软件的基础上,调研及分析应用系统所需共享的数据源,取得访问应用系统数据库的权限或者开放相关数据接口(API)授权等之后,可利用中间件软件实现从业务系统抽取所需数据至集中心库。根据业务系统自身特点选择合适的抽取策略,对业务系统中变动不是很频繁的大批量数据导入集成中心库,如将教务处年度学生数据定时抽取至中心库的情况,可采取主动式抽取策略;而对于业务系统中少量需实时更新的数据则可采取被动式抽取策略。
3.3.2 数据共享订阅的实现
某校分别从人、财、物三方面进行整体规划,根据数据应用的需求,当前数据应用的主要任务是涉及人的这一数据流通进行建设。目前已经完成毕业生离校系统(学生数据初源为新生迎新系统)数据订阅,校园一卡通数据订阅等。
4 结语
本文首先分析了当前高职高专院校信息化建设中数据共享普遍存在的问题及形成原因,提出构建以“统一数据标准、统一公共数据平台、统一身份认证及统一信息门户”为核心的数据共享集成信息平台解决思路及方案,结合方案实现了某高校各业务系统通过数据集成信息平台进行数据共享,取得较好的效果。
[1][5]荆淑霞.高职高专院校建设数字化校园过程中应注意的问题[J].华北航天工业学院学报,2006,(16): 22-24.
[2][6][7][8]李鹏.高职院校数字化校园工程规划及相关技术研究[D].电子科技大学,2009.
[3][4]史鑫.面向数字化校园的共享数据库中心的设计[J].苏州大学学报(自然科学版),2006,(22):37-41.
10.3969/j.issn.1672-9846.2014.01.017
TP393.18
A
1672-9846(2014)01-0070-04
2013-12-16
张烈超(1973-),男,湖北武穴人,武汉交通职业学院实践教学中心实验师,主要从事数据挖掘、智能计算及其应用、计算机网络研究。
刘开文(1964-),男,湖北武汉人,武汉交通职业学院实践教学中心高级实验师,主要从事计算机网络研究。