基于云平台的省级教育考试机构数据中心建设初探——以江苏省教育考试院为例
2012-01-03马彪王继东
马彪 王继东
基于云平台的省级教育考试机构数据中心建设初探
——以江苏省教育考试院为例
马彪 王继东
教育考试信息化是提高教育考试管理工作效率、促进教育考试改革发展的重要手段。省级教育考试机构承担的考试项目众多、规模不等,各种信息系统并存,数据共享的要求较高。本文围绕这一问题提出用建立省级教育考试机构数据中心的办法来打破业务壁垒、重组业务模式,建立高可靠性、高可用性、高内聚、松耦合的应用基础平台。本文结合江苏省教育考试院的实际情况,探究了省级教育考试机构数据中心建设的必要性与可行性,提出了较为完整的建设方案。
教育考试;数据中心;云平台;建设方案
1 引言
江苏省教育考试院由原招办、考办、会考办三办合一,成立伊始,即非常重视教育考试的信息化工作,目前已经进入第二个信息化规划的实施阶段。省级教育考试机构的招考项目很多,种类复杂,有招生类考试、自学考试、非学历证书考试,且教育考试项目本身存在着阶段性强,业务项目之间耦合性较低的特点。目前江苏省教育考试院信息系统从招考项目上划分包括:普通高考信息系统、自学考试信息系统、证书类考试信息系统,各大系统中又包含若干子系统。从考试环节上分有:报名系统、考务管理系统、评卷系统、成绩处理系统、录取系统,相互交叉后,大大小小的系统几十个,缺乏统一的数据标准、统一的开发标准,系统间难以实现数据共享,为更高水平的教育考试事业发展造成了一定的阻碍。
在第二个信息化规划中,江苏省教育考试院明确将建立教育考试省级数据中心,逐步集成各类信息系统,以提高教育考试信息化的水平和效率。
2 基于云平台的数据中心总体架构
2.1 云平台概述
云平台是指在大量的分布式计算机上,而非本地计算机或远程服务器中,建立与互联网相似的数据资源池,使得用户能够将资源切换到需要的应用上,根据需求访问计算机和存储系统。
云平台的优势在于提供了看起来没有上限的可用计算资源,用户不需要提前考虑设备的需求量,免去了用户的前期投入,可以从一个规模较小的硬件资源起家,并根据自己的需要增加资源。云平台资源拥有很好的弹性,当资源需求下降时,传统方式部署的服务器资源就被闲置了,而通过云部署的资源则灵活很多。
云平台包含两方面内容,一是在网络上提供的为计算服务的应用,例如以前被称为SaaS(Software as a Service)的一类应用;二是提供这些服务的在数据中心的硬件和系统软件。
2.2 基于云平台的数据中心总体框架
根据江苏省教育考试院信息建设二期目标,按照打破业务壁垒,重组业务模式,建立高可靠性、高可用性、高内聚、松耦合的应用基础支撑平台的基本原则,数据中心建设包含两大层面任务:一是数据中心云平台建设,通过建立教育考试私有云,提供统一的数据管理、网络接入、系统安全,主要面向硬件系统以及中心数据库建设;二是应用系统建设,面向各项业务,专注系统功能的实现,并遵循统一的开发规范和接口要求。
数据中心整体系统架构如图1所示,从两大任务中可衍生扩展出六大建设内容,分别为云平台网络基础建设、云存储数据中心建设、数据标准建设、容灾备份、接入服务和资源调度和应用系统建设。其中,数据标准建设和容灾备份又是数据中心系统建设的基础和安全保障,贯穿于两大层面的各个部分。
图1 数据中心系统架构
3 云平台关键建设内容
数据中心建设是一个庞大的系统工程,涉及基础层、数据层和中间层等许多方面,而其中关键性的建设内容则是云平台网络基础建设、云存储数据中心建设、数据标准建设和容灾备份。
3.1 云平台网络基础建设
基于虚拟技术已在江苏省多项评卷中采用,且效果突出,在数据中心建设中进一步建立以System Center为中心的私有云管理平台,通过建立自服务管理模式降低管理人员的压力。在硬件层之上建立虚拟化的资源池,启用Hyper-V作为底层虚拟化的管理层,采用规模化的群集架构来降低成本、提高效率和管理能力,虚拟化后统一硬件底层结构,便于迁移和管理。
3.2 云存储数据中心建设
数据中心的建设核心问题在于如何解决不同系统之间的数据交互与共享,数据的交互存在两种模式,点对点的信息交互模式以及中心数据库的交互模式。前者结构简单,容易在原有系统上升级改造;一个节点错误不会影响其他节点。缺点在于:随着系统的增加,每个系统需要建立的接口越来越多;参与数据交互的双方必须同时在线;需购置多套数据库及中间件等软件,成本较大。后者所有应用系统均基于中心数据库,各系统分别根据各自权限从中心数据库中读取数据。其优点是:数据单一,接口简单,不会存在不一致性;各个系统相互独立,不需要为交互数据而实时在线;可集中对中心数据库做好容灾备份。缺点是:中心数据库须面对较大的吞吐量,其稳定性和性能要求较高。
江苏省教育考试院现存系统较多,相对割裂,要想以点对点的方式实现数据交互,工作量极大,且难以维护,故提出建设中心数据库的方案。
由图4可见,云存储数据中心平台包括三大模块组成:数据资源管理模块、数据处理模块、系统管理模块。这三个部分相互配合,完成对数据的收集、存储、处理、调用以及管理,及时获取各类教育考试评价与决策分析数据,并抽取数据为应用系统服务。
图2 点对点的信息交互模式
图3 中心数据库交互模式
图4 云存储数据中心层次结构
3.3 容灾备份建设
对于省级考试机构数据中心而言,数据源是一切业务系统的基础,万一数据丢失或不能访问,从而导致工作停顿,将给全省的教育考试工作带来极大损失。为将因灾难引发的数据损耗风险降低到最低,一旦发生灾难,可跨越不同磁盘系统,快速切换,实现系统同步,本数据中心考虑使用同步远程镜像技术进行容灾系统的建设。利用光纤连接数据中心和灾备中心,两中心可保证业务系统24×7小时不间断运行,实时同步数据,可在较短时间内将核心业务接管到异地的灾备中心直至主站点完全修复。
3.4 数据标准建设
目前江苏省考试院现有大小系统几十个,由于没有统一的数据标准和开发标准,各系统间不能进行数据交换、数据共享,形成一个个“信息孤岛”。为将这些“孤岛”式的应用系统集成起来,就需要制定出各个业务系统统一遵循的标准规范和格式数据,统一基础数据并进行管理。
数据标准的体系结构建设主要包含两大任务:管理信息标准的建设与数据交换标准,而管理信息标准分为数据元标准和代码标准。数据元(Data element)是通过标识、定义、表示以及允许值等一系列属性描述的数据单元,在特定的语义环境中被认为是不可再分的最小的数据单元。
数据元概念的构成是对象类与特征的结合。例如:考生这个“对象”可以有性别、年龄、成绩等多个“特性”,将它与其中的某一个特性结合组成“数据元概念”,如考生性别、考生成绩。数据元由数据元概念和表示两部分组成,如考生性别,性别={男,女},性别={男,女,未知},分别构成两个不同的数据元。数据元标准是数据标准的重要组成部分,通过对数据元名称、数据元定义、数据元类型、数据元长度、数据元值域、数据元表示与数据元表示方法一致,保证同一个数据元只有一个定义,一个编码,从而实现各应用系统间高效、准确的数据交换和数据共享。
管理信息标准中的代码标准具体来源包括:已经形成标准文件的各类规范,上级部门下发的各类文件,江苏省制定的各类招考文件、规章制度以及工作流程规范。
数据元标准和代码标准只解决了信息描述层面的标准,而没有对信息本身的存储格式、权限以及信息的描述方法等进行统一的标准化。为使数据平台内各信息系统能够进行数据交换和访问互通,需要制定统一的数据交换信息标准,包括数据描述标准、权限描述标准、信息采集标准、信息发布标准以及数据交换接口标准等。
4 应用系统建设
4.1 接入服务和资源调度
接入服务是各类主要应用系统实现的基础,各类应用系统使用接入服务访问云存储中的各类数据。根据江苏省教育考试院的实际需要本数据中心的接入服务大致包括以下几个方面:用户认证,权限管理,公用API接口与Web Service服务。
优秀的用户认证、权限管理机制可以提升数据中心数据的安全性,保证只有经过授权的人员才可以访问数据,并且可以为不同的人员设置不同的权限。这样不仅仅可以防止数据被非法修改,还可以从制度上避免舞弊等恶意行为的发生。
公用API接口是连接应用系统与数据中心的直接通道,丰富的公用API接口使应用系统更加准确方便的获得所需数据。适当的Web Service服务利于整个数据中心的维护与应用的开发。
4.2 主要应用系统及其功能
1)高招管理系统:面向普高、学测、对口单招、研究生考试等相关业务的管理子系统,处理高招业务的报名管理、计划管理、考务考籍管理、特殊考生管理、体检信息管理、成绩信息管理、志愿填报管理、录取信息管理,并通过数据中心的高招业务数据快照,形成高招业务的初步数据分析。
2)自考管理系统:面向自考的社会自考、助学专业、专接本等相关业务的管理子系统,处理自考业务的报名报考管理、计划管理、考务考籍管理、成绩信息管理、实践课程与论文管理、毕业生管理、教材管理,并通过数据中心的自考业务数据快照,形成自考业务的初步数据分析。
3)成招、专转本管理系统:面向成招、专转本的管理子系统,处理报名管理、计划管理、考务考籍管理、成绩信息管理、志愿填报管理、录取信息管理,并通过数据中心的成招、专转本数据快照,形成初步数据分析。
4)社考管理系统:面向各类非学历社会证书考试的管理子系统,处理报名管理、考务考籍管理、成绩管理、证书管理,并通过数据中心的社考数据快照,形成社考业务的初步数据分析。
5)中招管理系统:面向高中阶段入学的管理子系统,衔接高中阶段的报名信息、成绩信息、录取信息,并通过数据中心的中招数据快照,形成中招业务的初步数据分析。
6)标准化考场建设系统:包括视频及网络监控系统、应急指挥系统、考生身份验证系统、作弊防控系统、考试综合业务系统五大系统平台。
7)公众免费服务系统:面向公众、考生的免费服务子系统,建设涵盖成绩信息、录取信息、公示信息、证书信息等网络免费查询的门户网站,提供诸如在线访谈、博客、论坛等多种形式的各类招生考试资源、信息发布渠道,提供考生电话免费呼叫中心,提供办公大楼一站式窗口服务。
8)办公电子政务系统:面向教育考试系统的办公电子政务子系统,提供公文处理、通知收发、人力资源、综合档案、设备资产、课题成果等办公电子管理和方便不同业务群体之间的实时交流。
9)电子支付系统:面向报考费用、录取费用、增值服务费用的电子支付子系统,建立与银行的电子支付接口,实现所有收费项目的网上电子支付。
10)决策分析与评价系统:依托信息统计的科学决策要求,实现基于数据中心的考试评价体系,满足社会、学校、地区、个人对考试评价的迫切需求。
5 结束语
基于云平台的省级考试院数据中心的成功建设必将进一步推动江苏省教育考试信息化进程,提升工作效率并促进教育考试改革,更好地服务于考生、高校、社会。可以预料在其建设过程中可能存在各种困难和阻力,科学规划、分步实施,广泛调动各种资源是项目成功实施的保证。
[1]王宁,等.一种基于数据中心的政府信息资源整合系统架构设计[J].计算机应用研究,2005(9):67-71.
[2]李冬梅.统一数据标准实现业务协同[J].信息技术,2010(6):235-240.
[3]许鑫,苏新宁.高校共享数据中心平台的设计与实现[J].现代图书情报技术,2005(6):48-53.
[4]董欢.数据挖掘技术概述[J].信息产业,100.
[5]胡茂胜.基于数据中心模式的分布式异构空间数据无缝集成技术研究[D].武汉:中国地质大学(武汉),2009.
[6]张晓华,林红,吴娟.数据中心在高校综合信息系统中的作用探究——以华北电力大学(北京)校园网络规划为例[J].软件导刊,2010,9(8):69-70.
[7]张锦珠.数据中心平台的一种设计与实现技术探讨[J].信息安全与技术,2011(12):46-49.
[8]蒋菱,叶明亮.基于BP神经网络算法的数据挖掘方法研究[J].电脑编程技巧与维护,2011(18):44-45.
[9]陶安,王军武.利用虚拟磁带库技术实现异地数据容灾备份[J].软件导刊,2011(12):50-51.
[10]刘丽娜,于治楼,张化祥,等.一种云环境下基于Xen的分布式存储模式[J].信息技术与信息化,2011(6):18-20.
[11]王涛.基于数据仓库ETL技术的数据提取与数据转换研究[D].吉林大学.2011.
[12]戴浩.基于业务元数据的多维建模系统设计与实现[J].计算机工程与设计,2010,31(24):5248-5256.
[13]林莉,傅晓娟,陈丽丽.XML数据交换技术在高校信息化中的应用[J].信息技术与课程整合,2012,8(3):713-715.
[14]陈彩虹.国内外元数据标准宏观比较研究[J].河北科技图苑,2011,24(1):65-67.
Cloud-platform Based Cata Center for Provincial Education Examination Institution:Taking Jiangsu Provincial Education Examination Authority as an Example
MA Biao and WANG Jidong
Informationization is an important means of improving the education examination management efficiency,thus promoting the reform and development of educational testing.The provincial education examination institutions undertake numerous examinations on different scales,and the coexistence of various information systems poses a higher demand for data sharing.In this paper,it proposes to establish provincial education examination authority data center to break the barriers of business and restructure the business model,aiming to establish an application platform of great reliability,high availability,high cohesion and low coupling.By referring to the reality of Jiangsu Provincial Education Examination Authority,this article explores the necessity and feasibility of data center construction,proposing a more integrated construction program.
Education Examination;Data Center;Cloud Platform;Building Programs
G405
B
1005-8427(2012)08-0034-5
江苏省教育考试院
南京信息工程大学