基于云计算的高校数据中心设计与实现
2015-12-04翟永刚丁增鑫王青峰
翟永刚,丁增鑫,王青峰
(军事交通学院训练部 信息管理中心,天津300161)
当前军队院校信息化建设的应用发展,对于进一步增强网络基础平台服务保障教学的能力提出了新的需求。相对于传统的IT架构,“云计算”代表着未来网络服务模式的发展方向,她的独特优势在于高性价比、易于扩展、高可靠性、模块化、管理方便快捷,能够更好地满足军队院校信息网络建设需求,是未来军队院校信息网络应用服务模式一个较好的选择。但同时我们应该看到,军队院校的云计算应用建设,必须结合自身实际,准确把握自身需求,能够解决当前院校教育信息化发展建设过程中遇到的实际问题,使得云计算应用真正的“落地”,才能去实现更好的效益。
一、云计算数据中心建设的目的
解决现有数据中心在服务保障教学过程中遇到的实际问题,突破传统计算中心的瓶颈,是当前数据中心建设发展迫切的需求。传统的数据中心建设主要采用分散式架构,即各应用使用独立的服务器,Web、Mail、OA系统、数据备份等各个应用间相互独立。随着信息化建设规模的发展壮大,数据中心的业务系统、服务器、存储等设备越来越多,一些问题也开始显现,主要集中在四个方面:硬件资源效率低、总体拥有成本高;空间环境、能源消耗等运维管理成本高;业务部署流程环节多、上线周期长,灵活性差;业务连续性保障差、数据可靠性弱。
1.硬件资源效率问题低、总体拥有成本高
对我院数据中心主要服务器的使用效能评估的结果显示,大部分服务器的效能不高。以CPU使用率为例,选取具有代表性的学院门户网站、数字校园门户、学科专业网站等服务器进行评估,在工作时间每5分钟进行一次采样,数据连续采集5个工作日,对数据采集结果进行汇总分析,得出CPU资源消耗平均值为3.739%,平均CPU使用率最高位9.916%,最低仅为0.339%。结果如表1所示。
表1主要服务器CPU资源消耗统计表
由统计分析结果可知,在现有条件下,单个服务器的资源利用率较低,通常在10%以下,各应用系统烟囱式发展,未能实现资源有效利用。
2.空间环境、能源消耗等运维管理成本高
学院信息管理中心通过机房动环监控系统监测到,目前中心机房服务器、存储等80余台IT设备用电功率约为20千瓦,峰值接近26千瓦,日平均耗电约为480度。中心机房目前部署的大多是传统的2至4英寸的机架式服务器,整体散热量较大,夏季需3台30千瓦精密空调同时工作才能满足需要。加上UPS、新风系统以及人力资源消耗等,数据中心维护整体开销比较大。目前中心机房有各部、系托管设备35台,已经占到机房内全部设备的43%左右,而且托管设备规模有不断扩大趋势。随着设备数量的不断增加,对机房条件和运维人员都提出了更高的要求,节能、环保、易管理将是下一阶段数据中心建设发展必须关注的问题,传统的建设和运维模式必须做出改变。
3.业务部署流程环节多、上线周期长,灵活性差
传统数据中心建设模式,按照“应用隔离”的原则每增加一项应用就需要增加一台设备,业务应用上线周期长,这种做法逐渐不能适应院校当前快速增长的信息化应用需要。主要原因是,近几年,随着教育信息化应用的发展,出现了许多周期短、工作节奏比较紧凑的应用系统保障任务。例如,“2110工程”项目申报系统,我院承办的天津市国防生政治理论基础考试相关在线考试系统的部署保障,总后优秀军事训练数字媒体资源评选奖励活动等。经常是从任务下达,到系统部署完成运行只有数周、不到一个月准备时间。在现有模式下,须申请经费、按规定进行招标采购、系统部署安装调试,时间是非常紧张的。并且某些系统,如国防生政治理论基础考试系统,对于服务器的配置要求比较高,但系统使用时间只有2天,保障任务完成后,一年中的大部分时间都处于闲置状态。以现有数据中心环境,应对起来比较困难。
4.业务应用保障连续性差、数据可靠性弱
传统的数据中心备份方式,存在恢复时间长,失败风险高,不保护硬设备、数据损失时间太长等缺陷。根据有关机构调查,信息系统可能遭遇的各类灾难中,有47%是硬件级别的故障,例如:主板、RAID控制器、网卡、内置/外置存储等设施出现问题,还有高达53%的灾难成因是“软”错误,例如:数据误删除、黑客/病毒攻击、系统崩溃、打补丁造成不稳定等等。磁带备份、基于磁盘的备份、Cluster/HA等传统的数据保护机制对于上述灾难都只能提供有限的保护。相对于OA、MAIL等系统,网络教学应用的组织安排时间固定、时间长短有限制,课程安排对于业务应用的连续性、一旦发生故障的数据恢复时间有着一定要求。业务应用保障连续性差、数据可靠性弱在一定程度上限制着网络教学的全面发展,目前还主要应用于自学。为了促进网络教学应用的进一步发展,需要能够全面覆盖所有“软”错误和“硬”故障的资源使用、调度和备份机制。
解决上述四个问题是下一步学院云计算平台建设的首要任务,在此基础上,通过网络分发服务,实现了自助服务和资源的池化,能够做到资源灵活调度,更好地保障学院各项信息化建设不同的需要。
二、云计算平台建设方案设计
1.云计算平台物理资源建设
采用高端刀片服务器作为云计算平台的计算基础。刀片服务器计算密度更高、机房要求降低、功耗散热低、布线简单、可靠性较高、管理方便、扩展灵活,更加符合于虚拟化、云计算的管理服务理念。
考虑部分老旧服务器更新换代的需要,结合未来新应用的需要,对云计算平台的计算资源规模进行预测。以一般应用CPU主频2GHz、内存4GB标准计算,特殊应用CPU主频8GHz,内存64GB计算,并预留20%峰值爆发计算能力,预估今后五年计算能力需求翻一番。计划采用一组10片高性能刀片式服务器,作为云计算硬件计算平台的核心,单台刀片服务器配置为:2颗CPU,8核,每核心主频2.6GHz以上,内存256GB。每服务器配置双万兆网卡、双8GHBA卡。刀片机箱内所有部件均要求实现冗余,所有模块均可实现远程集中管理配置。预计建成后可支撑虚拟应用100个以上。
应用虚拟化技术,建设集中的存储系统。按照服务对象划分,存储资源划分为两部分:一部分主要是服务于业务应用系统的高速存储,这部分存储应能够满足部署操作系统、数据库等较高的性能要求,为所有刀片服务器共享,是实现冗余热备、负载均衡,虚拟机迁移的基础。以每刀片2TB计算,预估高速存储需求容量为20TB。另外一部分在虚拟化基础上,实现存储空间扩展,主要功能是提供面向业务应用和普通用户的资源存储服务。以每用户10GB实际可用网络存储空间,未来满足5000用户需求计算,预计需要存储空间50TB。预留30%冗余扩展,预计需建设集中存储容量约为100TB。为了与虚拟化软件配合,达到最佳应用效果,配置接口类型为8GFC接口的光纤存储阵列产品,组成标准的SAN集中存储架构。通过共享的SAN存储架构,可以最大化的实现云计算解决方案的优势,实现在线迁移正在运行的虚拟机、动态的资源管理、基于快照技术的备份等,为云计算平台提供优良的存储资源保障。
2.虚拟化及云服务软件资源建设
在基础架构部分,采用VMware VSphere 5实现虚拟化,并通过虚拟化对现有部分物理服务器实施整合。主要是通过vMotion功能实现在线地迁移正在运行的虚拟机、应用到不同的物理服务器;对整个数据中心的应用资源构建资源池分配,确保平台运行各应用尤其是核心应用的计算资源和IO资源得到有效的保障;通过DRS功能实现资源池的动态负载均衡、在线自动管理,以及数据中心基础架构的弹性扩展;DRSHA功能实现高可用环境;vStorage实现集中式虚拟机整合备份。
通过vCenter Server实现虚拟机集群环境的集中统一管理和监控。
通过云计算管理平台VMware vCloud Director,将基础架构作为服务提供给学院用户。云计算管理平台门户,提供统一界面对虚拟机进行分配、管理,实现互动式管理功能,供部门或分支机构自行登录创建、管理、配置、使用虚拟服务器及应用,监视虚拟数据中心资源使用状况。信息应用程序和网站建设单位管理人员,可以利用自助门户来访问自己的虚拟数据中心,自由组织自己需要的虚拟机和应用资源。授权部门可通过基于策略的资源调配和部署实现轻松访问。每一个用户单位都有各自独立的虚拟资源、独立的LDAP身份验证机制、特定的策略控制机制以及独有的目录。
信息管理中心通过云计算管理平台,可向云计算平台中虚拟机在非停机状态下进行热添加,包括虚拟机的虚拟CPU、虚拟内存、虚拟网卡、虚拟存储容量等,使虚拟服务器在线动态扩展而不会造成用户业务中断。并可通过云计算管理平台管理多个虚拟化数据中心,并可按性能、可靠性划分为高、中、低不同级别资源池进行管理,以适应不同级别应用服务器要求。
三、实际应用效果
通过实践检验,云计算平台,是当前学院网络数据中心建设与教学服务保障过程中遇到的若干问题一个切实有效的解决方案。结合老旧服务器的升级换代工作,在云计算平台的建设过程中,实现了现有应用系统的整合与优化。在性能提升的同时,提高设备的利用率,将多个应用的资源负载合并到一台服务器之上,减少设备数量规模的同时,大幅减少能源消耗,降低管理运维成本,在此基础上实现了云服务器的风险管理,增强了可靠性,可用性。
1.极大地改善数据中心的应用管理
我们对部分信息应用系统资源实施了数据迁移,调整部署到云计算平台,包括新版网络教学平台的各应用系统稳定的运行。云计算平台内,单台服务器的平均CPU使用比率提升到了23%左右,并且随着平台的应用的增加,应用范围的推广,这个比率还将进一步增加,远高于旧模式下3.7%的CPU平均使用率。硬件资源的效率得到了显著的提高。
采用虚拟化技术,实现了计算平台资源标准化和统一架构。通过建立资源池,对计算资源进行按需动态调配,以统一的管理手段,实现了应用部署、权限管理、升级维护、性能分析、诊断预警、数据备份/恢复、数据同步与容灾。使得整个数据中心运转维护专业,流程规范。实现了发生硬件故障时自动的数据迁移,以较小的代价保障网络教学应用持续稳定运行,不受单一硬件故障影响。
对于试运行结果进行分析,支撑同等规模的应用系统,采用现有云计算平台服务保障方式,比传统的数据中心运行模式维护成本降低50%以上、能耗降低40%以上、节省空间60%以上。
2.促进教育信息化水平提升,满足个性化的信息应用需求
通过信息管理中心云平台的建立,为教员、学员提供更好的信息化教学环境,增强服务教学、保障教学、辅助教学的能力,满足信息化教学日益增长的需要。
一是通过有针对性的设置,灵活的提供通过多种信息环境,更好的保障教学资源建设个性化的需要。实现用户在线自助按需申请虚拟服务器及存储空间,突破了在传统的网络服务平台下,由于资源、技术条件有限,只能是提供一个统一技术框架的平台,对于用户个性化的发展的限制。
二是有力于合理调配资源,提高硬件基础资源使用效率,突出精品信息资源建设,保障重点教学应用。云计算通过网络分发服务,实现了自助服务和资源的池化,以及服务器CPU、内存资源耗费状况实时监控,并且能够做到动态的资源调配。通过合理调配资源,可以提高硬件基础资源使用效率,突出精品,保障重点,突破了传统IT网络服务平台软硬件资源配置固定的限制。
三是易于扩展,缩短新应用系统部署投入使用时间,灵活应对各类突发保障任务,更加适应军队院校教育信息化建设快速发展,各类教学保障快节奏的需要。利用云计算服务平台,高效地保障了“天津市国防生政治理论基础考试”、“网络教学监控系统测试”等活动,实现了网络计算资源应急调度、系统快速部署以及资源的回收再利用,取得了令人满意的实践应用效果。
四、总结
基础设施云计算平台,较好地解决了当前我院数据中心遇到的主要问题,极大地改善数据中心的应用管理,是未来IT资源服务模式及应用的发展趋势,随着云计算技术的进一步发展和应用普及,必将极大地促进教育信息化水平的提升和发展。
[1]贺小华.云计算在教育中的应用——以Google协作平台为例[J].软件导刊(教育技术),2009(9):71-73.
[2]工业和信息化部电信研究院.云计算白皮书(2014)[EB/OL].工业和信息化部网站行业参考,http://www.niit.gov.cn/n11293472/n11293832/n15214847/16046507.html.
[3]余侃.云计算时代的数据中心建设与发展[J].信息通信,2011(6):100-102.
[4]邹艳,李鸿科.云计算及其在教育中的应用[J].软件导刊(教育技术),2009(8):71-72.
[5]徐立冰.腾云.云计算和大数据时代网络技术揭秘[M].北京:人民邮电出版社,2013.
[6]王春海.VMware虚拟化与云计算应用案例详解[M].北京:中国铁道出版社,2013.