云管平台在企业私有云平台建设中的实践应用
2021-06-24张海全林峰杨东陈涓
张海全 林峰 杨东 陈涓
为了解决南瑞集团阿里云、华为云、自研云及虚拟化软件、堡垒机等多种软硬件产品集成对接,通过建设南瑞云管平台提供异构云环境下的监控、管理和运维能力,实现对异构云的统一监控、统一管理及统一运维,用云管平台代替人手工操作,提升自动化程度,提高管理和运维的效率,提高资源使用效率,降低成本,降低安全风险。
一、引言
随着云计算技术的普及,“三分建设、七分运营”同样体现在云计算行业,南瑞集团IT建设经过多年的发展,从传统 IT 到虚拟化,正在进行从虚拟化到私有云以及多云共存的这一关键性转型与变革,随着虚机、容器以及云建设规模的快速增长,导致不同的云平台由于其管理的粒度、监控指标、运维管理规范均不相同,给混合云管理人员带来较大的挑战;内部私有云、虚拟化资源和外部云平台资源,从企业层面难以实现统一管控;随着业务的发展,传统的手工操作工作量变大、资源交付服务效率低将会严重阻碍业务的敏捷性。因此,集团有必要从统一监控、统一管理以及统一运维三个方面建设完善的云管理平台。
二、云管平台需求分析
南瑞集团信息化建设经过多年的发展,已演进到从虚拟化到私有云以及多云共存的关键阶段。随着云建设规模的快速增长,异构云平台之间对资源的管理粒度、监控指标、运维规范均不相同,难以实现统一管控,为运维管理工作带来较大的挑战。随着集团全球业务的发展,难以满足各类创新业务复杂多变的需求,传统的运维方式工作量大、服务效率低下。通过构建统一的云管理平台,整合集团内部多种私有云及虚拟化资源池,充分发挥计算、存储、网络、安全等基础设施云服务能力。
三、云管平台系统架构设计
本次云管的总体计框架可以用”一体两线五层”来总结,见图1。
一体:指本次方案是一个结合成熟商业软件,根据南瑞的需求进行定制开发,综合考虑云技术、资源全生命周期管理的一体化解决方案,方案本身采用自上而下的整体设计理念,各个功能模块基于整体框架的分解逐层展开设计,同时在实现过程各子系统也是紧密衔接,协同工作的解决方案。
两线:本次方案的实现涉及多个系统及功能组件,在纵向上必须打通两条主要通道,一条是自上而下的服务线,即从用户提交请求开始,经过全局资源的调度分配,直至在本地资源落地的完整过程;一条是自下而上管理线,包含本地资源的注册纳管,运行状态等信息收集汇聚,直到面向管理的呈现。
五层:本次方案架构分为五个层次:基础架构层,资源接入适配层,服务支撑层,功能模块层,统一门户层。
第一层:基础架构层
由VMware虚拟化平台、私有云以及容器云、桌面云组成,将服务器、存储、网络虚拟成异构的资源池,提供资源层面的交付服务。
第二层:资源接入适配层
负责与各个云平台的对接,计算、存储、网络的纳管。
混合IT接口层由云平台接入模块、和独立设备接入模块组成。
云平台接入模块由适配层和各个云平台插件组成,实现了同资源池的完全解耦。
第三层:服务支撑层
包含核心模块和管理模块。核心模块,为上层提供编排服务、任务执行服务、应用部署服務,支持上层门户为各类角色用户提供多云、混合云自动化的资源部署自动化、资源管理自动化、应用部署自动化、以及应用自动化运维服务。管理模块包含用户和多级租户管理,以及不同角色用户的访问权限控制。
编排引擎:横向支持跨主机、跨网络、跨云平台的编排,纵向支持涵盖资源和应用的编排,是自动化运维的基础。运营门户中的服务目录集群服务交付、自服务门户中的代码自动化部署、一键扩容、自动化伸缩均依赖于这个的编排引擎。
任务执行引擎:主要支持在多个被管操作系统批量执行脚本任务,并在执行过程和完毕后上报执行状态、日志和结果。在执行编排任务场景中,支持编排引擎的任务执行请求。
代码部署引擎:主要支持应用部署,支持以不同的策略,在多台虚拟机执行应用代码部署任务。在执行编排任务场景中,支持编排引擎的应用部署执行请求。
第四层:功能模块层
从整体上分为资源交付及运营模块、应用交付及运维模块和资源运维模块;
资源交付及运营模块:云管平台需要提供自服务门户及服务运营门户,实现IT资源的全生命周期管理,即从服务目录产品定义、申请、审批、资源自动化创建、网络设置、应用安装、资源续租、实例变更到最后释放。同时,云管平台需要提统一的计量,计费、成本分析、资源池容量分析,物理虚拟资源的资源使用分析、并能提供资源使用优化建议。并为IT管理员及用户提供各种维度的资源报表分析。
应用交付及运维 :云管平台需要帮助企业实现应用维度的环境管理,实现应用的持续集成和发布,同时提供应用自动化运维和监控告警能力。
服务对接:以模块的方式同企业现有的安全组件、办公及运维系统对接,包括备份、堡垒机、漏洞扫描等。
第五层:统一门户层
为各类角色用户和应用提供整合的用户接口,各类角色用户均可以通过这个整合门户登陆,选择进入要进入的门户;面向企业内部的用户以及云平台的管理员,为其提供IT资源分析门户,面向IT管理员提供服务运营门户,面向内部用户提供自服务门户和应用运维门户。同时可以为客户定制资源使用实时情况的大屏展示。
四、结语
通过云管平台,统一纳管异构的基础设施,提供统一的资源统计分析,成本分摊分析。同时,通过云管平台服务运营及自服务模块,标准化、服务化、自助化交付 IT资源,集成南瑞内部已有 OA 系统、App入口,保证 IT 资源服务化能力的落地。云管平台建设中,除了 IT 基础架构资源的快速敏捷使用和交付,业务部门可以对 IT 资源的全生命周期进行自助式服务之外,业务部门还可以通过云管平台不断提升应用交付的效率,提升应用 CI/CD 水平。