基于云计算的高校数据中心建设研究
2022-11-08王宝龙
文/王宝龙
作为一种新兴的IT经营模式,云计算能够向用户提供动态服务、可伸缩虚拟化资源。因此,高校在数字化建设过程中,通过云计算技术对其信息基础设施进行改造,能够打造虚拟化、高灵活性、高效易管理的云数据中心。基于此,本文主要以云计算为基础,针对高校数据中心建设展开相关探讨分析。
一、高校数据中心建设现状分析
(一)建设现状
自20世纪90年代以来,高校的信息化经历了30年的历程,从以网络硬件建设为核心的网络化的高校到以系统构建为核心的数字高校,向着以智能服务为主导的智慧高校的方向发展。与此对应的是,高校的资料处理系统从以网络设备为主导,逐步转向计算、存储、网络设备;从网络数据的交流,逐步转向高校教学、科研和学工;各种数据存储、处理业务转变为数据存储、处理等业务,并伴随着数据存储服务的不断增多,高校数据中心容量逐渐增大。
(二)存在的问题
目前,各高校的数据处理系统均采用了虚拟技术进行各类设备的整合,但随着“互联网+”教学理念的推进,随着高校信息化建设的发展,许多问题暴露出来。一是,由于高校信息化水平提升,目前的教学条件已不能适应新形势;二是,IT系统的集中化导致了虚拟化的快速发展,对维护管理工作提出了严峻的要求,因此,提高企业运行的效能、降低企业职工的工作压力已成为当前亟待解决的问题;三是,多个虚拟平台相互分离,没有一个统一的管理系统用来实现系统的集中化。为了确保高校的信息系统能够与时俱进,确保高校中的计算能力不会产生“孤岛”现象,高校可以将现有的计算资源进行集成和扩展,利用云计算技术,实现对系统的高效集成。
二、云数据中心构建的关键技术
(一)虚拟化技术
虚拟化技术包括网络技术、硬件技术、内存技术、CPU和虚拟化应用系统等。
虚拟化是云计算的一项关键技术,它通过服务器、网络、内存等不同的实体资源,将抽象的数据转化为更直观的产品,从而为云计算应用提供更多的支持。虚拟化技术具有不受限于现有资源和环境的特点。
(二)编程模型
云计算需要确保大量用户同时并行,为了实现特定的目标或者任务,在复杂的基础上,可以迅速地响应并执行任务,从而增强用户的使用体验。MapReduce正是以这种思路为基础的一种基于云计算任务计划模式的编程模型。
(三)海量数据分布存储技术
云计算在满足海量用户需求的同时,也面临着海量数据,因此,在存储方式、存储安全性等方面,都要采取分布式的架构,以便在网络中某个节点发生故障时,、可以确保存储在不同位置的数据的安全性和可塑性。
(四)海量数据管理技术
例如,谷歌的数据管理技术和Hadoop开放源码的数据管理模块Hbase可以实现对数据进行分组读取和存储,从而大大提高了云计算的反应能力。
三、基于云计算技术的跨校区主备数据中心设计与实现
(一)高校数据中心的体系结构
结合信息化建设的目的和基本原理,基于云计算、数据中心等技术规范的数据中心服务架构随之诞生。该架构显示出基于云计算技术的高校数据中心的整体结构,在最下面的是一个资源,它包含了所有的实体设备,将服务器、网络装置及其他硬件视为一个整合的资源库,并以特定的规模进行运作。虚拟化层次是基于对资源库的需求进行选择,然后按照需要产生相应的虚拟机器。管理员要对用户、服务器、网络等进行统一管理,并能够选择性地进行资源打包,以确保虚拟机的高效性。应用服务层是以用户为中心的,可以为用户提供多种服务。运营商在应用服务层面上增加了多年积累的软件,使其能够共享企业的业务资源,并能快速地构建出所需的应用系统。
(二)高校数据中心的系统组成
高校数据中心主要包括基础设施、信息支持服务、应用服务;由运行管理系统和安全保密体系组成,保证了系统的安全性。该体系结构涉及实体资源和网络系统、存储系统、计算系统三部分,用以支持系统的运作:资源池是通过对服务器、网络、存储等基础资源的虚拟化,从而实现资源的灵活生成、调度和管理;网络支持用户获得信息服务,方便用户经过相应的认证接入网络系统,并为其提供运行支持、核心服务、共享服务和系统服务。高校数据中心的主要功能包括:即时信息传输,数据库访问,软件资源管理;流式业务、协作业务、资讯整合业务;等等。高校数据中心的经营分为软体与资讯两大范畴。在软体环境中,资讯服务的架构分为两类:树形与栅格形。其中,安全性主要是通过网络、主机、应用和数据层面来实现的,而加密技术主要利用通道和口令来完成信息的传输、处理和存储。
(三)高可用设计
1.硬件高可用设计
高校数据中心采用双路供电、交换机堆叠、分布式部署,以保证整个数据中心在发生硬件故障后不影响整体业务的正常运转。数据中心可以采取下列高可用的硬件方案。(1)每个伺服器均采用双电源,并可同时连接两路AC,以确保即使有一路电源被切断,也可保持工作状态。(2)访问开关和核心开关均为双层,每台服务器通过网卡进行交叉连接,以确保高可靠的数据传送。在启动两个交换机时,其中一台成为堆叠主机,另一台成为堆叠备机。高可用的备用程序在主设备和备用设备之间进行。(3)故障域指单个机房内开关或电力装置引起的最大故障的区域,一般是一台或一套机柜。数据中心应尽可能地将管理节点、核心交换机和磁盘阵列分布在不同的失效区域,以防止由于一个错误区域的异常而造成整个模块无法使用。(4)利用两个磁盘构造RAID1来安装基本操作系统。RAID1是RAID的最高安全保障,可以在两个硬盘上同时读写,并提供100%的数据冗余,确保一个硬盘在损坏后不会对整个系统造成任何影响。
2.管理节点高可用设计
管理节点的作用是控制、监控和调度整个平台的资源,作为用户在云端平台上的控制台,负责分发和回收资源。管理节点一旦发生故障,会导致管理服务无法正常运行,对运行管理、监控报警、用户访问等都将产生一定的影响;而作业的自动化也将会对平台或承租人的运营造成很大的影响。为了确保管理控制台的可用性,数据中心必须使用高可用技术。云计算平台提供了一个HA(HighA-vailability)的 双管理结点,具有初始化、配置、维护等功能。在此基础上,云计算平台对各个管理结点进行了单独的分配,从而解决了整个机箱降电平台的管理问题。
3.虚拟机高可用设计
云计算是一种集成多个服务器的系统,是一个具有共享资源的集群,可以实时监控整个集群内服务器和虚拟机的运行状况。当某个服务器出现故障时,云平台会继续进行检测,一旦确认该伺服器宕机,所有受到影响的虚拟机就会立刻重新启动资源池中的闲置伺服器,以确保服务的持续性。虚拟机高可用模式可以减少故障和IT服务的中断,而无须利用额外的硬件或整合其他软件,也可以避免由于单个操作系统或特定应用程序的错误交换而导致的高额费用和高复杂度。
四、系统实现
在存储资源上,数据中心使用了超融合的分布式存储技术,每个云服务器均配备4个SSD和若干HDD。两个SSD作为云计算平台,两个作为缓存。为防止系统出现单一故障,数据中心应使用RAID1模式,并使用磁盘镜像实现数据冗余。云计算服务器的数据是由分布式存储实现的,它使用了多个拷贝的方法来确保数据的安全性。另外,2个高校数据中心各有2个数据库服务器、本地2个SAN存储器,以实现局域双活体系结构,并利用同步工具对数据库数据进行实时传输,实现了高校内局部双重活化与实时同步。在网络资源方面,数据中心实现了主、备数据中心的即时通信;在2所高校的2个校区内,各配置2个核心交换机,采用2个较大的二次纤维网络相连通。数据中心采用管理网、存储网和服务网络,采用2台千兆和4台万兆开关,以防止单一故障;2个交换机独立运行。数据中心在制造系统中使用了两种不同的技术,即4个万兆口和2个1000兆口,使存储网、业务网和管理网完全分开。2所高校的数据中心在灾难备份方面,均配备了后备系统,并通过备份软件实现了对应用的实时备份;在备用中心的云计算系统中,采用备份系统来恢复资料,确保了系统的安全。
五、结语
利用先进的云计算技术,可以更新高校基础设施,从而打造虚拟化、灵活高效、便于管理的云数据中心。在此基础上,构建基于云计算的高校数据中心,可以为高校网络的建设提供巨大的技术支撑和发展空间。