APP下载

一种校园公共数据平台架构研究与实现

2016-11-03孙远辉刘晓娟

中国教育信息化 2016年1期
关键词:公共数据架构数据库

孙远辉,刘晓娟

(1.中国人民武装警察部队学院训练部,河北廊坊065000;2.廊坊东方职业技术学院城铁系,河北廊坊065000)

一种校园公共数据平台架构研究与实现

孙远辉1,刘晓娟2

(1.中国人民武装警察部队学院训练部,河北廊坊065000;2.廊坊东方职业技术学院城铁系,河北廊坊065000)

高校信息化发展至今,数据综合应用依然存在不足。结合建设实践,采用面向服务的体系结构思想,提出了一种新颖的校园公共数据平台架构,并描述了主要实现技术,为面向服务的校园数据综合应用系统设计与实现提供了一个新的参考模型。

面向服务的体系结构;公共数据平台;元数据

一、引言

伴随信息化的快速发展,高校信息资源逐渐丰富,各类人员对数据的综合应用需求日益提升,从简单的信息管理发展到整合的、个性化的、主动的信息服务。通过走访和调研一些高校的信息化建设情况,有些高校已建应用系统缺乏统一规划和统一数据标准,仅仅解决了局部的业务处理和信息共享,尚未在全校范围内实现跨部门、跨业务、跨应用的信息共享和集成,[1]不同业务系统之间存在着数据不一致、共享程度不高等诸多问题,信息“孤岛”[2]问题依然没有很好解决;整体数据资源未能得到充分挖掘和利用,信息应用的深度和广度不足,没有形成基于学校整体信息的综合查询视图和主题分析视图,难以发挥数据的综合效益和规模效益。

为进一步提升高校现有信息化建设水平,解决发展中存在的遗留问题,在汲取其他高校信息化建设经验的基础上,结合本校建设实践,采用面向服务的体系结构思想,提出了一种新颖的校园公共数据平台架构,它定位于整合学校各部门、各应用领域的数据共享需求,建立数据共享标准,以各类信息资源的集成和交换为基础,构建满足学校教学、科研、管理要求的开放性、协同化的综合信息服务环境,为学校各类人员提供基于统一全校信息视图的数据综合应用服务,实现了系统互联、资源共享,提高了应用效能,推进了学校信息化建设持续协调发展。

本文第2节提出了基于SOA的校园公共数据平台架构;第3节描述了主要的实现技术;第4节结合平台实际运行,给出了应用实例;最后进行了总结。

二、基于SOA的校园公共数据平台架构

1.面向服务结构的特点

面向服务的体系结构(Service Oriented Architecture, SOA)是一种充分利用Internet技术、满足企业对不断增长的业务运营模式需求的应用架构,该模式具有安全、灵活和无缝处理异构和异质的内外资源的能力,[3-4]作为分布式的软件架构模型,该模型中任何业务功能都被作为提供的一个服务使用,应用程序的不同功能(服务)通过这些服务之间定义的结构和合约联系,应用系统可以看做是一系列服务的集成。[5]

SOA的体系结构中,服务提供者将服务注册到服务代理目录上,当服务请求者需要调用服务时,首先在服务代理提供的目录查找服务信息,服务代理返回调用服务信息,服务请求者根据返回的信息调用服务提供者提供的服务,当服务请求者从服务代理得到所需服务的信息后,通讯在服务请求者和服务提供者之间进行,无需经过服务代理。

2.公共数据平台架构

与传统的集成方法相比,基于SOA的集成方法具有较多优势,即可重用、平台独立、基于标准、粗粒度、松耦合以及可适应业务需求变化等。此外,SOA架构本身具有很好的扩展性、灵活性和适应性,并容易实现应用之间的互操作与信息互通。[1]因此,采用SOA的思想来设计公共数据平台是一种很好的策略。公共数据平台的总体架构如图1所示:

公共数据平台总体架构是一个庞大而复杂的技术体系,为降低技术体系设计的复杂度,构造出结构清晰、适应性强的总体架构模型,依据分层分离原则,按信息化技术功能不同,抽象、归纳出基础设施层、信息资源层、应用支撑层、应用层、展现层以及相应的保障环境,保障环境包括标准规范体系、安全保障体系和运行维护体系。

图1 公共数据平台总体架构

(1)基础设施层

基础设施层是公共数据平台总体架构中最根本的软硬件支撑环境,平台架构中的资源、应用都建立在这些网络硬件、存储设备和系统软件之上,该层包括操作系统、应用中间件、数据库软件、备份软件、应用服务器、数据库服务器、网络平台以及存储备份平台。

(2)信息资源层

信息资源层集中存储、统一管理公共数据平台所有的数据资源,提供多种类型数据的访问,为公共数据平台提供资源支持和信息存储媒介。它包括全域数据库、主题数据库以及元数据库。全域数据库中的数据来源于各个业务系统,以信息共享为核心目标,构建集中统一的共享数据整合、存储和管理的平台;主题数据库是把来自全域数据库的信息资源,按照不同的维度进行组织,提供各职能域分析,支持各类主题应用,挖掘信息价值。通过信息资源层的规划与建设,全域数据库与主题数据库等一起构成了数据中心的整体数据架构,遵循相同的数据编码规则,执行统一的元数据管理及数据质量控制。元数据库在第3节重点介绍。

(3)应用支撑层

应用支撑层通过建立面向服务的体系结构,构建开放的、模块化的、可重用、可扩展的一系列共性技术平台。在总体架构中支撑上层应用,弱化信息资源层对应用层的制约和限制;减少上层应用在共性、基础需求上的投入,为上层应用之间的互联、互通、互操作奠定基础。应用支撑层依据共性技术体制、依托信息资源层的支持,提供了对应用层的技术支撑及统一技术标准规范。应用支撑层包括元数据库管理系统、数据访问服务系统、ETL服务管理系统以及报表管理系统。数据访问服务系统以全域数据库中的共享数据为核心,提供统一的信息整合,实现各业务系统间信息共享,以服务方式向各业务系统提供数据,并负责从各业务系统接收信息,更新全域数据库。ETL[6]服务管理系统是学校内部各类数据库之间的抽取、转换和加载过程的数据调度平台,实现全域数据库与各应用系统之间、全域数据库与主题数据库之间的数据抽取、转换与加载服务。

(4)应用层

应用层是公共数据平台业务应用与公共信息服务实现的核心,依据不同的业务特征、技术特性,公共数据平台基于JavaEE平台,采用B/S模式进行构建。应用层实现了基于主题数据库的各类上层应用,包括业务应用与公共信息服务两部分内容。其中,业务应用包括综合查询、主题分析和统计报表;在业务应用基础上,将综合查询、主题分析和报表统计提供的各类信息服务相互关联、匹配组合,形成面向管理者、教师、学生和校友的综合信息视图,构建公共数据平台的公共信息服务。

(5)展现层

展现层是公共数据平台与学校用户交互的主要桥梁,是总体架构中实现用户交互体验和信息展现的关键支撑,主要完成平台与用户之间的各种互动,是整个公共数据平台对外的窗口。通过提供界面交互框架以及多种类型的访问渠道,展现层实现了公共数据平台的对外服务、信息采集以及内部管理。展现层主要包括学校管理者、教师、学生、校友等五类应用桌面。

(6)保障环境

标准规范体系是支撑技术、管理等方面的标准和规范,除了贯彻国家、教育行业和学校的已有标准外,更多的是制定公共数据平台建设的数据标准、数据交换标准、技术规范、项目管理规范;安全保障体系涉及信息化建设各个层面,为整个平台提供鉴别、访问控制、防入侵、防攻击、防篡改、抗抵赖和数据机密性、完整性、可用性、可控性等安全服务,形成集防护、检测、响应、恢复于一体的安全保障体系,实现网络安全、系统安全、数据安全及应用安全,以满足整个平台各层次的安全需求;基于ITIL和ISO2000的运行维护理念,对平台进行全面而集中的管理,实现对学校各级部门的统一协调管理,提供高效率、高质量、低成本的IT服务。

三、主要技术

1.元数据库

元数据库实现对全域数据库和主题数据库所涉及的元数据的整体管理,使元数据管理趋于标准化、规范化和工具化,并提供通过网络对元数据进行查询检索的方法或途径,帮助用户了解数据,对数据是否满足数据综合应用需求作出正确的判断。元数据库建设主要包括中心元数据、主题元数据、交换元数据。中心元数据是元数据库的主要建设内容,它是一个以业务需求为导向、在学校信息化应用实践中持续改进和不断完善的过程。中心元数据的建设过程如图2所示:

图2 中心元数据的建设过程

在中心元数据建设时,要首先确定核心的编码规则模型,然后在编码规则模型的指导下,建立相应的指标库、统一分类编码库和基础分类库。

主题元数据包含主题数据和相关技术标准的信息,主要涵盖主题数据的信息属性、数据结构、流程控制等描述信息;交换元数据描述数据交换处理的一系列标准、数据交换处理过程、数据交换处理逻辑、执行角色等信息。

2.数据共享与交换

为了实现学校各业务系统间的互通互联,解决信息孤岛和信息流通问题,需要建立数据共享与交换机制。所有业务系统数据统称为数据源,公共数据库是所有共享数据及综合分析应用数据的资源池,所有业务系统的共享数据以及综合分析应用数据在这里汇聚、集成。公共数据库从数据源集成数据并保持更新同步,成为各个业务系统之间的数据共享与交换通道。公共数据库通过数据集成工具从数据源的各个业务系统数据库中抽取数据,并根据数据类型进行分类存储。数据集成过程可以定义为两种方式,数据访问服务集成和数据抽取集成。

数据访问服务集成方式主要通过数据访问服务系统、元数据库管理系统并结合数据访问服务定制功能,定制发布数据访问服务,各业务系统通过调用生成的数据访问服务客户端,实现数据的集成,它应用于实时性要求较高且有条件、有能力进行服务包装改造的业务应用。

数据抽取集成方式通过在各业务系统中建立触发器和中间表,根据交换数据的内容和获取的时限要求,采用ETL服务管理系统,制订数据抽取调度计划,完成共享数据的抽取,最后对抽取的数据进行清洗和转换,完成数据的集成,它应用于实时性要求不高或无条件、无能力进行服务包装改造的业务应用。数据访问服务接口方式可以用于实时或定时的场合,数据抽取方式只能用于定时的场合。

四、应用实例

数据综合服务是基于公共数据库之上构建的信息综合应用,通过构建学校数据综合分析应用环境,创建数据间的有机联系,针对学校的教学、科研、管理等公共信息进行综合分析、深度钻取,建立多角度的分析体系,增强学校管理的针对性,为学校综合管理提供决策支持。按照以上原则和目标,确定综合查询、主题分析、统计报表三个方向,以及在此之上建立公共信息服务。数据综合应用系统的功能结构如图3所示。

图3 数据综合应用系统的功能结构

现以主题分析为例,实现了某教学部系科研成果数量的统计功能,对成果类型、年度和论文等级3个维度进行了分析,维度在数据仓库中主要对指标进行过滤和为重新组织提供指导,可以将用户对实时的查询结果按照维度指标进行筛选,只允许与维度指标相关的数据返回给用户,由主题元数据实现维度维护的描述片段如图4所示。

图4 维度维护的描述片段

实现效果如图5所示,在每个指标上建立了扩展连接,钻取后可查看数据明细,对于主题分析的结果展现形式可以进行自定义,提供了二维、三维图形展现。

图5 科研成果数量统计

五、结束语

本文提出的基于SOA的校园公共数据平台,整合了学校各业务系统的数据共享需求,以建立数据统一标准为基础,实现了各系统间的信息交换和共享,构建了满足学校教学、科研、管理要求的开放性、协同化的综合信息服务环境,为学校各类人员提供了基于全校信息视图的数据综合应用服务,最终实现了互联互通、资源共享。公共数据平台已在学院成功部署并顺利运行,强力推动了学院信息化建设的可持续发展。以物联网理论为基础打造“教育云”,实现新型智慧校园,将是我们下一步工作目标。

[1]陆鑫,周明天.数字化校园统一应用支撑平台系统研究与设计[J].计算机应用研究,2007(12):279-281.

[2]陶祥亚,胡建华.高校信息资源建设中“孤岛现象”的研究[J].中国教育信息化,2007(9):49-51.

[3]Patrick F Carey,Bernard W Gleason.Solving the integration issue-service-oriented architecture[EB/OL]. http://www.zdnet.co.uk/tsearch/Service-Oriented+Architecture.htm,Feb.2006.

[4]赵会群,孙晶.一种SOA软件系统可信性评价方法研究[J].计算机学报,2010(11):2202-2210.

[5]汪清明.基于SOA的ERP系统体系结构的研究[J].计算机应用,2007(2):413-414.

[6]张宁,贾自艳,史忠植.数据仓库中ETL技术的研究[J].计算机工程与应用,2002(4):213-215.

(编辑:王天鹏)

TP39

A

1673-8454(2016)01-0071-04

猜你喜欢

公共数据架构数据库
基于FPGA的RNN硬件加速架构
公共数据授权运营机制探索
公共数据治理中的价值实现机制
公共数据归属政府的合理性及法律意义
功能架构在电子电气架构开发中的应用和实践
公共数据开放许可的规范建构
基于云服务的图书馆IT架构
WebGIS架构下的地理信息系统构建研究
数据库
数据库