一种虚拟化云管理平台的设计与实现
2017-05-30覃国孙
覃国孙
【摘 要】文章首先根据云管理平台的基本特点介绍了基于虚拟化的云管理平台的总体结构设计思路,然后以广西广播电视监测中心的监测监管云管理平台为例,介绍了云管理平台的功能架构及其实现,对企事业单位构建私有云管理平台具有一定的参考意义。
【关键词】云管理平台;虚拟化;高可用
【中图分类号】TP311.52 【文献标识码】A 【文章编号】1674-0688(2017)04-0030-03
0 前言
一个完整的云计算数据中心必然包含云管理平台,它也是云数据中心的核心部分。云管理平台的创建,一是为了提高资源的利用率,简化资源和服务的管理和维护,减少数据中心的运营成本;二是为了通过快速、简单和可扩展的方式创建和管理大型、复杂的IT基础设施(服务器、网络、应用、存储设备等)。本文旨在研究设计和实现一种既符合云管理平台的基本特点,又贴合实际工作应用需求的虚拟化云管理平台。
1 云管理平台总体结构设计
本文提出的云管理平台的技术思路主要从以下几个方面去研究和设计,其总体结构图如图1所示。
1.1 资源池化管理
通过对服务器和网络设备等硬件资源进行虚拟化处理,形成虚拟层面的资源池。该资源池可管理物理资源、虚拟资源、存储资源和网络资源。同时,可按需分配资源,为每一套应用系统提供基础的计算能力、存储能力及网络能力。
当资源池中的资源不够时,平台能快速地将新增加的物理资源直接池化,平台可自动识别新资源,在增加硬件资源的过程中不需要再做其他设定,由平台自动进行管理。虚拟服务器节点的增加由管理平台对虚拟服务器镜像进行复制即可实现业务服务器的增加,整个过程的资源分配由平台管理软件自动实现,减少了人工管理成本。
1.2 高可用管理
采用从虚拟机、应用程序和业务数据3个维度进行高可用管理的策略来保障部署在云上的业务的连续性。
1.2.1 虚拟机高可用
管理平台底层设计采用分布式文件系统,数据多备份,自动检测故障,自动恢复数据,可以保证虚拟机硬盘资源的安全性。CPU、内存和存储都化为虚拟资源被加入到资源池中,虚拟机可以在资源池中的任意物理机上启动,并配合虚拟机动态切换机制,保证虚拟机的高可用。通过侦听虚拟机的网络和服务提供的Heartbeat接口,在短时间内完成虚拟机状态的判断,并创建新虚拟机接替业务程序,切换时间视虚拟机的操作系统的不同而有所变化。
虚拟机镜像采用支持写时复制的qcow2镜像格式,以镜像模板加快照的方式创建和还原虚拟机。虚拟机中的业务应用进行升级更新时,可先在后台复制的一台虚拟机中进行应用升级,待该克隆虚拟机测试通过后快速替换运行原应用程序的虚拟机,采用这种虚拟机创建替换方法,使系统应用不发生中断,保证业务的连续性。
1.2.2 应用程序高可用
管理平台同时为虚拟机中的应用程序提供Heartbeat接口,实时监控应用程序的健康状态,一旦监控到当前应用程序与管理平台部署的心跳检测出现异常,管理平台在预设阈值时间内将自动关闭当前的虚拟机,启动备机,整个切换过程在极短的时间内完成,能够保证业务程序的高可用。
1.2.3 业务数据高可用
所有的虚拟机中都不保存业务数据,所有业务数据通过映射网络驱动器保存至分布式存储中,采用基于分布式存储的容灾设计,保证业务数据的高可用。
1.3 设备监控管理
管理平台通过接口实时采集基础设施硬件等物理资源的各种自身状态信息,并设计基于图像可视化的设备监控界面,实时展示服务器磁盘运行状态和网络设备端口连接状态等,并能实现对虚拟资源及各个业务系统的应用性能进行监控与管理,以便更全面、直观地掌握整个平台的使用状况并及时进行维护管理。
1.4 实时监测告警管理
通过在多个计算节点部署集群化的监视器,设计采用虚拟机主动向服务器发送心跳包的方式,避免了服务器主动发包方式会增加管理平台负担和依赖客户端程序稳定性的情况,建立管理平台与虚拟机之间心跳包自动检测机制,定时检测虚拟机状态,发现异常后立即自动连接短信发布模块向管理人员发送相应的故障信息,能及时了解并处理平台故障,保证云平台的稳定性和系统维护的高效性。
1.5 Web服务
云平台管理软件可对资源域中所有节点上的资源进行统一管理,并提供Web接口给管理员和用户,所有运维管理用户角色都通过网络查看云平台的实时运行状态及管理整个集群,并对权限内的资源进行访问和操作。
云平台管理软件相当于云操作系统,本文设计将此软件部署在高可用的虚拟机上,这样的好处在于这台虚拟机可以动态地生成于云平台中的任一节点服务器上,相较于固定节点安装方式更灵活可靠,并实现了管理软件的业务连续、高可用。此外,管理软件如果发生故障,只会影响云数据中心的管理功能,而不会影响整个数据中心的正常运转。
2 云管理平台主要功能设计
根据总体结构设计与技术思路,设计云管理平台的主要功能应包括云平台总览、资源管理、项目管理、告警管理、模板管理、系统管理等功能模块,其功能架构图如图2所示。
由于设计实现的功能众多,下面结合广西广播电视监测中心云管理平台实践,选取几个重要的功能进行介绍。
2.1 云平台总览
云平台总览是将数据中心内部的所有硬件信息的健康状况、资源的使用率、所在网络的位置等综合地展现出来,给管理用户展示更直观的管理界面。通过该界面可直观、动态地反映整个云平台的实时运行状态,包括CPU、内存、硬盘等池化资源的实时使用情況,各类物理服务器、交换机和存储设备的网络状态和设备健康状态,以及一些集群的概况和告警信息等。其中,动态的系统拓扑视图与机柜中实际的交换机和服务器盘位一一真实对应,具体到每个接口和每块磁盘的状态,管理平台每秒轮巡显示所有机柜中每台物理机和交换机的连接情况,以不同的颜色显示每个节点、链路的实时状况,并实时更新物理机的图标和连接线颜色,画面更加生动、直观,能更快速、全面地掌握整个云平台的资源状态,也能更好地定位故障点,提高系统维护的及时性。云平台总览实际效果图如图3所示。
2.2 资源管理
资源管理包括物理机管理及监控、虚拟机管理及监控、存储管理及监控等模块,其整合了数据中心内部的计算资源、存储资源、网络资源,并做到从上层的应用到底层硬件设备的实时监控,帮助管理员和用户检查应用和控制资源的动态分配。
2.2.1 虚拟机管理
虚拟机管理包括创建虚拟机、维护虚拟机、替换虚拟机、开关及删除虚拟机、远程登录虚拟机、分配和迁移虚拟机、制作虚拟机模版、虚拟机高可用管理等模块,这些也是管理平台日常使用最频繁的功能。这里介绍创建虚拟机和虚拟机高可用管理这2个比较具有本平台特点的功能。
2.2.1.1 创建虚拟机
创建虚拟机是管理平台时常使用的操作,为提高管理使用效率,本平台设计出的配置虚拟机界面几乎是“傻瓜化”的,只需简单填写数字和拉动进度条即可快速配置所需要的虚拟机,真正做到了像使用水电一样按需灵活分配,不用经过培训即可操作,大大提高了工作效率。
2.2.1.2 虚拟机高可用管理
中心管理员或者团队管理员都可以对其管理的虚拟机进行高可用操作。本平台根据实际应用需求设计提供了2种高可用的方式供用户选择,即还原式高可用和重启式高可用。
还原式高可用能够在虚拟机宕机时,按照最新的快照部署新的虚拟机,保证虚拟机的业务不间断;重启式高可用能够在虚拟机宕机、断网、物理机断连时,重启虚拟机,管理员可以通过实际登录虚拟机查看其可用情况,如果用户判定这台虚拟机在重启后可用,那么无需还原虚拟机,如果用户判定这台虚拟机不可用,那么可以手动还原虚拟机。
2种高可用方式的设置可以使管理员根据需要灵活管理虚拟机,以多种手段灵活保障虚拟机高可用。
2.2.2 告警管理
云管理平台使用告警信息进行实时短信发送的方式来进行监测预警。若告警持续1~3 min,那么平台进行第一次短信发送;若告警持续4~9 min,那么平台进行第二次短信发送;若告警持续10~30 min,那么平台进行第三次短信发送;若告警持续31~60 min,那么系统进行第四次短信发送。经过分类分级的短信设置,可以进一步提高管理平台响应处理和及时解决故障的能力。
3 结语
经过实践证明,本平台通过结合实际需求的设计应用,能使云数据中心的运维管理人员通过全面可视化的多元操作管理界面,只需简单操作,就能快速地对整个云数据中心的资源进行动态灵活的管理调度、按需分配及运维操作,实现了易操作、易管理维护的效果,同时通过多种技术手段保证了云数据中心具备高可用性、高安全性,这对其他企业和单位构建云管理平台有一定的参考价值。
参 考 文 献
[1]孙磊,沈苏彬.一种基于OpenStack的云管理平台[J].计算机技术与发展,2016(1):185-189.
[2]楊绍光,张云勇,等.基于OpenStack的云计算IaaS管理平台研究[J].互联网天地,2013(3).
[3]郑楚锋.虚拟数据中心云管理平台的设计与实现[D].广州:华南理工大学软件学院,2012.