某通信运营公司混合云的建设思路研究
2016-05-30黄继华
黄继华
(中国电信股份有限公司 广西分公司,广西 南宁 530028)
【摘 要】随着云技术的发展,不少企业已经建设了各种云资源池。如何有效地整合和规划利用这些云池成为不少企业的难题。文章对某通信运营公司现有的云资源情况进行分析,提出了一套混合云建设思路,并对混合云的发展方向进行了展望,对运营模式的调整提出了自己的见解。
【关键词】混合云;云资源池;运营模式
【中图分类号】F270.7 【文献标识码】A 【文章编号】1674-0688(2016)03-0041-05
云计算技术已经成为人们日常生活中常见的事物,云资源池(简称云池)也已经成为运营商的IT基础设施。在运营商内部,由于种种原因而建设了多个云资源池,实现了资源的初步共享,同时也发现了以下问题:各云池独立建设缺乏统一的规划,对机房、电源、空调等基础设施的消耗很大;各云池之间相互割裂,无法做到资源的统一调配和共享;各云池之间缺少互备容灾的能力;维护单位分散等。这些问题也是很多企业遇到的共性问题,为此,业界提出了建设混合云的概念,即一个云资源池既承载企业内部的各项应用系统,同时也向外部用户提供资源。
2015年,中国电信公司广西分公司提出云池的建设目标:2015年区内建设一朵云,区内资源池统一分配和调度,多节点资源池实现跨节点部署和互备容灾能力;2016年试点跨省资源池实现统一调配及跨省的容灾备份/HA能力,基本建成完备的资源池自动化和安全能力体系,具备初步的混合云部署和大数据支持能力。
1 公司云资源池的现状及存在的问题
1.1 云资源池的现状
公司现有业务平台云资源池(简称业务云)、IT云资源池(简称IT云)和信产云资源池(简称信产云)3个云资源池。业务云负责为业务平台、OSS域的运维支撑系统、ICT系统、信产公司的部分系统和其他系统提供基础资源。IT云负责为MBO域的IT支撑系统提供基础资源。信产云负责为信产公司的部分系统提供基础资源,并进行了公有云的出租尝试。公司现有的云池覆盖范围示意图如图1所示。
1.2 各云池存在的问题
(1)云池机房的发热量大,受设备及供电条件的限制,机房等基础设施不能满足云池大规模部署的要求。
(2)各云之间分散部署,没有实现资源的集约。
(3)云池的安全体系还不完善,数据备份覆盖范围较小。
(4)云池缺乏统一监控、统一呈现、统一纳管的支撑系统。
2 混合云的形态
混合云是对现有各云池的融合,其融合层面可以根据云池的设备分为如下几种。
(1)管理层融合:在管理层实现融合,对资源进行统一纳管、统一呈现、统一分配。负责对资源池的各类资源(计算、存储、网络等)进行管理,并通过管理接口,与上层的统一资源管理平台对接,实现异构、跨节点资源的管理,统一管理安全(例如身份认证、鉴权、审计等)。
(2)网络层融合:统一网络出口,网络层设备统一融合。统一部署网络交换、汇聚、路由、安全防护、负载均衡等功能,统一网络安全(例如防火墙、IPS、访问控制、VPN等)。
(3)计算层融合:统一提供各类计算能力,包括X86虚拟服务器集群、小型机集群、X86物理服务器集群,以集群方式部署,集群内资源使用同一共享存储,实现统一调度,统一软件安全(例如防病毒、虚拟化软件漏洞、虚拟化HA等)。
(4)存储层融合:构建统一的存储资源池,为上层提供存储能力。提供各类存储能力,可包括FC-SAN、IP-SAN等共享存储、分布式对象存储、离线磁带存储等。各类存储通过FC网络、以太网、IP网络等与计算层的计算集群连接,统一数据安全(例如数据备份、加密、隔离、剩余数据擦除等)。
现网各个云池完成4个层面的融合才能形成真正的混合云,也能夠解决现网各个云池面临的问题。
3 引入混合云的优势
(1)推进资源的集约化建设,提升资源利用率,降低整体工程建设成本。近年来,IT云资源池和业务云资源池快速发展,而IT云资源池和业务云资源池各自为政,基础硬件设施规模快速增长,按照目前两大资源池建设模式,未来还需为2个资源池单独配置高可靠性资源冗余、容灾、备份设施,将造成资源的重复建设;保持2个资源池现状模式发展,也无法实现资源池的跨部门共享,资源池的整体利用率也会降低。推进业务云资源池和IT资源池的融合将有效地解决以上问题。
(2)推进管理的集约化建设,提高管理效率。对现有的IT资源池和业务云资源池进行融合,势必带来资源池的管理流程融合,通过流程改造、优化,提高运维管理效率。
(3)充分满足根据对资源的需求特性聚类部署的需求,降低运维管理的复杂度及加强资源管理的集约化程度,提高系统平台的整体安全性。由于是根据对资源的需求特性来进行聚类部署的,因此可以对业务云、IT云进行资源池统一部署,内部针对其差异点,可以进行逻辑划分逻辑节點。①降低运维管理复杂度及推进资源管理的集约化:不同的业务类型在管理上存在差异(维护管理制度、安全管理制度等),划分多节点能最大限度地继承现有先进的管理制度,人员职责分工明确,能降低运维管理的复杂度。但随着节点的增多,云资源的利用率将会降低,因此进行合理的资源节点划分,能在运维管理复杂度方面和资源集约化管理方面进行平衡。②提高云资源系统的整体安全性:在安全性层面,主要分为物理硬件设备安全及应用安全、网络安全,其中物理硬件设备安全主要有机房建设及管理、硬件采购质量管理,应用安全主要要求厂家严格控制软件质量。
4 公司混合云的建设思路
4.1 确定混合云的融合主体
混合云的建设不是要推倒现有的云池,而是应该依托现有的云池进行建设,这也就面临融合主题的选择。混合云主体只有通过资源池规模、机房条件、网络安全设施及规划、软件安全及规划、管理安全策略和运维能力等多个方面进行综合比较,才能确定融合的主题。
公司通过比较后,确定以业务云为融合主体建设混合云。
4.2 实现现网云池向混合云融合的步骤
(1)成立统一维护团队对混合云基础设施进行管理,负责物理设备及虚拟机的日常维护。原各系统维护单位负责操作系统、数据库、中间件及应用软件等的维护。
(2)新建系统和大数据系统考虑直接部署在混合云中。
(3)在混合云中结合IT系统、大数据系统的资源需求及特性,统一进行资源的规划和建设。
(4)除混合云外,其他云资源池不再进行扩容改造。个别数据库应用可适量扩容的X86物理服务器,并加快“去IOE”进程。
(5)具备迁移条件的原有IT系统随工程整体迁移至混合云中。
(6)基本形成全网一朵云。
5 公司混合云的发展目标
5.1 总体目标
把IT基础设施全面打造成综合的IT基础架构即服务,提供IaaS、DaaS(数据即服务)、PaaS、SaaS、STaaS(存储即服务)等多种服务。未来基础架构层面主要以横向扩展X86架构服务器为主,最大限度地支持基础架构“去IOE”,快速支撑业务创新。阶段发展规划如图2所示。
5.2 近3年的目标
2015—2017年的建设目标:基本上完成资源池综合服务的提供(如图3所示)。
根据业务需求,扩容资源池硬件处理能力;网络、计算、存储等主要资源基本实现池化,基本形成全网一朵云。采用存储虚拟化技术,完成存储的深度整合。在试点的基础上,推广SDN,简化、快速部署网络。网络和存储资源可与计算资源实现协同快速交付能力。
6 云池运营模式的调整
混合云的建设采用的都是比较成熟的技术,互联网BAT三巨头已经采用这种模式部署了自己的云池。对于运营商来说,最困难的是对现有运营模式的调整。
6.1 公司现有云池的运营模式
以公司业务云和IT云为例,网运部的业务平台室负责业务云、业务平台的维护工作,企信部负责IT云、IT信息化系统的维护工作(如图4所示)。
(1)业务云、业务平台的维护。目前,运营模式为垂直模式:每一个业务平台由各自的项目经理维护,包括应用软件、系统软件、底层硬件。
(2)IT云、IT系统的维护。目前,运营模式为横向模式。基础设施部负责全部基础设施的维护工作,应用部、计费部、数据部从数据库的数据、应用服务器、应用软件开始接管维护工作。
6.2 运营模式差异带来的问题
在实现混合云资源池的背景下,现有运营体系存在以下问题。
(1)网运部与企信部不一致的运营模式加大了混合云资源池统一运营的难度。
(2)传统的垂直运营模式不适用于云资源池的运营。
(3)网运部、企信部分别独立运营,与两者共享混合云资源池的基础设施不相适应。
6.3 运营模式的调整建议
运营模式由垂直运营模式改为横向运营模式,应用维护团队和基础设施资源维护团队分离,组建统一的云池维护团队,并将基础设施资源统一纳入云资源支撑系统与资源管理系统。应用维护团队负责具体应用的维护,并负责提出云资源基础设施需求。基础设施资源维护团队负责系统软件与底层硬件的维护,内设全局管理人员和专业维护人员,全局管理人员统筹资源的规劃、监控与分配(如图5所示)。
运营模式调整后的优势如下。
(1)专业团队维护可以显著提高维护水平,保障系统高效运营,同时同一类型的设备可以归并类聚,减轻工作人员的工作强度。
(2)减轻维护人员的工作压力,将更多的人力投入业务拓展、应用开发等能够创造直接经济效益的工作中去,节约人力成本开支。
(3)便于对维护人员进行更专业的技术培训,促进IT专业人员的培养。
7 如何高效地使用混合云
7.1 建立快速的资源评估体系
建立快速的资源评估体系,提高资源池运营效率,引导业务使用部门合理地使用资源,主要从建立多维度评估模型、全生命周期运营指导、模拟结算、系统性能优化调整等方面进行建设。
(1)建立多维度评估模型。从技术指标(虚拟机CPU、内存、硬盘监控指标、网络流量、存储读写等方面)、经济指标(资源成本、运营效率等)、业务发展运营状况等维度建立多维度的评估模型。依据评估模型,预测业务发展趋势和后续资源分配、维护策略(资源增减、运维等级升降级等)。系统可根据业务系统的重要性及运维等级,定义不同的后评估周期和后评估参数。
(2)全生命周期运营指导。以资源健康度、运营效率为核心,对资源生命周期(開通、使用、运维、回收等)涉及的每一个环节进行全面的运维指导。对运维人员:系统障碍预警、资源池配置参数优化。对业务部门:资源合理的部署规模,未来业务发展趋势。对使用者:资源配置优化(计算、存储、网络带宽等),补丁与系统升级指导。
(3)提供模拟结算与服务改进。通过模拟结算,提供业务资源成本信息,帮助客户合理地使用资源。
(4)提供业务系统优化调整能力。针对web服务器、应用服务器、数据库服务器的典型三层架构应用,通过分析web请求、应用服务器负载、数据库负载等监控数据,解决定位系统资源配置的瓶颈,提高系统的性能。
根据业务不同阶段或不同时期业务的繁忙和稳定性分析,为使用者提供报警阈值和监控项目自定义的服务,帮助使用者有针对性地完善与提高业务系统的性能。
7.2 提升运营能力,提高服务水平
(1)网络配置自动化。在提供计算、存储资源的同时,自动完成接入交换机、汇聚交换机、虚拟交换机、防火墙、负载均衡设备等资源的自动化配置。
(2)服务供给模板化、个性化、自动化。以服务目录的形式向客户提供虚拟机模板、网络模板、操作系统模板、安全模板、负载均衡模板等服务。在模板流程电子化的基础上,针对用户的个性化配置,提供用户申请、审批、施工的完整电子流程。
(3)资源服务多样化(预留、配额支持)。对不同的业务部门,提供资源配额,由业务部门在配额内自主支配,同时支持为特定业务提供资源预留。
(4)加强业务等级管理。根据业务特点,对业务分级,提供不同等级的服务保障(如确定哪些业务资源需要特别保证,以及制定业务的维护等级、重要性等级)。
(5)资源服务能力产品化。支持根据业务负载动态调整资源(动态增加资源,动态减少资源),支持以能力方式向外提供资源提供、回收、调度等服务。
参 考 文 献
[1]张为民.云计算深刻改变未来[M].北京:科学出版社,2009.
[2]胡光永.基于云计算的数据安全存储策略研究[J].计算机测量与控制,2011,19(10).
[3]陈天,樊勇兵,赖培源,等.混合云技术架构及应用研究[J].电信科学,2014(S2).
[责任编辑:钟声贤]