云计算给业务平台的发展与运维带来的机遇与挑战
2011-06-27谭志远宫云平陈喜洲
谭志远,宫云平,陈喜洲
(中国电信股份有限公司广东研究院 广州510630)
1 业务平台发展存在问题
随着各种新业务新产品的不断推出,现网承载各类业务的平台也越来越多,而且各业务平台大多都是独立建设,在目前业务平台下线退网机制(或业务生命周期管理机制)尚未完善的情况下,导致现网业务平台的数量越来越多,给维护管理带来诸多问题,主要表现在以下几个方面。
·无法实现资源共享:各业务平台独立建设,资源以业务为单位烟囱式地分配,造成资源的浪费,资源无法共享,也不能达到节能环保的目的。
·不利于集约化运营的推进:业务平台数量及种类繁多、增长快,机房位置分散,各业务平台涉及的硬件、操作系统、数据库、业务软件等类型众多,有限的人力资源疲于应对,无法做到精细维护。
·平台资源利用率低:业务平台峰值设计导致大部分时间平台资源利用率极低。
·维保成本昂贵:部分业务平台设备老化,厂家或IT系统支撑乏力,维保成本昂贵,部分业务平台入不敷出,成为服务、市场发展、安全的盲点和难点。
·平台部署速度慢,无法快速响应市场的需要:业务平台建设、扩容周期长,从明确业务需求、项目立项、建设方案确定、设备采购、到货及建设到联调上线等,历时短则半载长则1年(甚至更久)。
·业务平台扩容、升级往往需要中段业务,严重影响客户感知。
2 引入云计算的机遇及优势
通过分析现阶段业务平台运维存在的主要问题,结合云计算技术的特点,笔者发现云计算IaaS层面的虚拟化技术能很好地解决目前业务平台运维和发展过程中所面临的种种问题。随着云计算IaaS层面虚拟化技术越来越成熟,虚拟化技术的应用将给业务平台的发展和运维带来新的机遇。
结合上述原因,笔者认为在业务平台领域非常有必要引入云计算虚拟化技术。引入云计算后所带来的主要优势如下:
·通过资源池化实现资源共享,减少投资费用,降低成本支出,实现节能减排;
·云计算资源动态调整,按需配置,不同业务间可实现错峰填谷的效果,从而整体提高资源的利用率;
·云计算能促进业务平台网络结构的优化和整合,促进业务网络的集约化运营,促进中国电信打造聚合、高效、开放的横向业务网络目标架构;
·云计算的高扩展性,解决了业务平台建设(新建、扩容)周期长的问题,能满足前端部门快速响应市场变化的需要;
·虚拟资源模板化的自动部署功能,可以大大减少维护的人工成本和大量重复性的工作;
·高可靠的容错机制,提高平台整体容灾性能,可以实现扩容、升级不中断业务,大大提升客户感知。
3 云计算IaaS技术在业务平台领域应用前景
云计算3层架构的各个层面在国内外都有广泛的应用实例,例如,IaaS层有Amazon的EC2和S3,PaaS层有Google的 App Engine和 Salesforce的 force.com平台,SaaS层面有 Google的 Docs、Salesforce的 CRM和 ERP等,而这些成功案例主要是作为一种商务模式让人认识的,即有市场需求的驱动才产生这些云计算各个层面的应用。
在全国上下如火如荼地开展云计算的过程中,电信运营商在此背景下又该如何切入呢?个人认为,云计算作为一种商务模式,必须要有好的业务场景驱动,否则只会是一片浮云无法落地。在云计算的3层架构里面,PaaS和SaaS层面以个人认知来看,目前暂时没有一个好的切入点(缺乏具体的业务驱动),在这个领域笔者觉得可以尝试去做一些技术的探索,积累一些运营经验,但在没有明确的大规模商用预期下,不宜做大量的投入。在IaaS层,随着虚拟化技术越来越成熟,笔者觉得无论是作为一种商务模式推广给用户使用(如IDC领域),还是作为一种综合技术的应用,促进业务平台的发展,都将给我们带来不小的收获。
结合目前业务平台发展过程中存在的几个问题和云计算IaaS层面技术的优势,笔者认为目前云计算IaaS层面的技术可以在业务平台如下几个方面得到充分的应用。
3.1 基于云计算IaaS技术实现业务平台整合
云计算IaaS层面技术的引入为业务网络演进、资源整合提供了新的技术手段。基于云计算的虚拟化技术在整合资源、提高资源利用率、降低维护成本、增加业务平台的整体容灾性能等方面来看,的确能给现阶段业务平台的运营维护带来质的变化,因此可以基于云计算虚拟化技术把现网设备老化、资源利用率低、生命周期短、业务突发性高的且符合云化条件的各种业务平台迁移到云平台统一承接,实现业务平台的资源整合。
在基于云计算技术整合业务平台的过程中,可结合业务特征和云计算虚拟化技术的相关要求进行是否可云化评估,把适合迁移的业务平台,通过P2V(physical-tovirtual)模式或者新建模式(在虚拟机上重新部署业务平台运行环境)把业务平台迁移到云平台上。建议基于云计算技术实现业务平台整合的工作流程如图1所示。
3.2 基于虚拟桌面技术整合业务平台操作维护终端
由于现有业务平台都是独立建设,导致业务平台的操作维护终端缺乏统一的规划、管理,给现网业务平台的运维带来安全隐患(特别是安全接入方面)。通过虚拟桌面技术,把现有业务平台的操作维护终端(OMC、网管终端等)进行整合,实现统一接入、统一认证、统一管理,从而实现集中的安全管控。
虚拟桌面有 SBC(server-based computing)和 VDI(virtual desktop infrastructure)两种模式。根据这两种模式技术实现的特点和实际维护需要,可把各业务平台的OMC等通过SBC的方式发布供维护人员使用。同时可以基于VDI模式提供个人办公桌面(电信维护人员)、移动办公桌面(出差人员、企业管理人员)、代维人员桌面(外包、代维人员、厂家人员)等,即根据不同的用户个性化需要、安全管理要求提供不同的接入途径和认证方式并呈现不同的桌面效果,并通过安全审计等功能实现对接入的可管、可控、可追溯的安全管理要求。
3.3 基于虚拟化技术实现业务快速部署
传统业务平台建设从立项、审批、采购、调试到最终上线,周期长,往往短则2~3个月,长则一年半载,导致业务推出的时候往往已经错过了最佳的市场竞争或者发展机会。
而利用云计算虚拟化技术统一建设、部署业务平台的资源池,把资源与项目分离,可彻底解决这个弊端,如图2所示,通过对比虚拟化之前和虚拟化之后的业务平台建设流程,可以看出,通过云平台承接业务平台可以节省大量的重复的、繁琐的、不可控的中间环节。通过2010年中国电信集团组织的多个省的试点情况来看,虚拟化后新建业务平台快的2~3 h,慢的也能在1周内部署好新平台,能非常快速地响应市场的需要。
3.4 基于IaaS技术实现业务平台异地容灾备份
现有业务平台的异地容灾备份方案一般都是按照主节点的建设规模在异地重新部署一套环境,投资费用大且备份节点往往长时间闲置,造成资源的浪费,导致目前大部分业务平台都没有建设异地容灾备份节点,是业务平台最大的安全隐患。云计算资源池化后,可以在不同机房的两朵云之间,通过虚拟机备份(快照)等功能实现两朵云之间的虚拟机异地备份,在主节点发生异常无法恢复的情况下,可在备份节点重启虚拟机,同时配合相关网络参数的修改,使备份节点承接业务,达到异地备份容灾的目的。利用云的资源弹性的特点及虚拟机封装的特性,花最少的钱实现业务平台的异地容灾备份功能,从而整体提高业务平台的容灾能力。
4 引入云计算给运维工作带来的挑战
云计算作为时下最时髦的话题之一,全国上下各个领域趋之若鹜,唯恐不及,在这个“人云亦云”的氛围下,要真正认识到云计算究竟能带来什么,现阶段大规模应用存在哪些问题,理性地面对和应用云计算技术,而不至于“为云而云”。
结合业界动态和2010年中国电信在多省的现场试验情况来看,目前云计算引入后,在云平台的管理、云安全、云技术相关规范及标准化等方面,给今后大规模商用带来的挑战主要有如下几个方面。
4.1 维护管理方面的挑战
个人认为,目前云计算在技术上难度不大,最大的难度是管理上的问题,如管理上的问题不解决,就不只是简单的私有云的问题,可能云计算将会变成部门云、系统云。到时处处皆云,云计算的效果可想而知。
因本文重点探讨云计算给运维管理工作带来的挑战,宏观层面的管理问题不做重点叙述。在运维层面,通过云计算资源池承载业务平台后,业务平台的运维模式,从传统垂直维护模式(平台独立建设,独立维护)演变成横向模式(资源共享,团队维护),由此给运维工作带来新的挑战,主要表现在运维体系、维护手段、资源规划部署及管理能力等几个方面的挑战。
4.1.1 维护体系方面
业务平台由原来独立建设,分散维护,通过云平台实现资源整合后,云计算平台及其承载业务的集中运维管理,首先需要解决的是部门内各专业室、跨部门甚至是跨单位的条条框框管理的问题,部门利益、单位利益如何权衡,如何把目标聚焦于一点,这需要政策导向,同时通过相应的规章制度及流程来约束,需要跨专业室、跨部门、跨单位实现维护资源的整合,同时还必须理顺维护组织架构、明确维护职责及分工以及梳理相关维护流程等,这些都是不小的挑战。
4.1.2 维护手段方面
随着云平台规模的扩大,所承载的业务越来越多,运维的压力也势必越来越大,同时为了适度竞争的需要,可能引入多个厂商的虚拟化产品,由于目前异构云之间缺乏统一的管理平台和管理手段,同时云平台如何纳入现有的业务平台集中监控系统尚在摸索中,且各虚拟化厂家开放的接口不一,无法完全满足集中资源调度、集中监控的需要,因此现阶段如何丰富云平台维护手段方面是个比较大的挑战。
4.1.3 资源规划、部署及管理能力方面
云计算资源池化后,相对原来业务平台独立建设、独立维护,对资源规划、部署及维护管理能力的要求更高,平台集中后,一旦云平台发生故障其影响的范围更大更严重,而云平台资源的规划、部署的好坏将直接影响云计算平台高可靠性等功能的发挥,影响后续云平台维护的便捷性和系统的安全性。因此是否具备高级云资源规划、部署、运维管理人才是今后充分发挥云平台作用,确保云平台安全稳定运行的关键,是云平台运维管理工作的挑战之一。
4.2 标准规范方面的挑战
云计算标准化滞后于技术应用,能提供云计算产品的厂商少,厂商间的产品标准不一,不同厂商的产品缺乏互通性,造成较高的运营维护成本,也影响运营商产品的升级和更新换代,更不便于运营管理。目前云计算技术虽然达到企业级运行要求,但距离可运营级还有较大的差距。例如x86异构云间的互通、x86云和小型机云间的互通以及云管理平台等都缺乏行业内明确的规范体系,完全达到云的可运营级还任重道远。另外在在技术层面厂家开放程度不高,完全受制于虚拟化厂商,运营商本身话语权不足,需要加强开源等技术的开发,强化自身能力,这些都是今后实际运营需要面对的挑战。
4.3 云计算安全问题的挑战
云计算平台的安全问题,除了包含业务平台存在的传统意义上的安全问题(传统的安全范畴主要包括主机安全、网络安全、业务和数据的安全、运营管理安全等几个方面)以及业务平台的可靠性和可用性之外,还包括由于使用了虚拟化技术带来的安全问题,如虚拟化技术漏洞风险、资源共享后的剩余信息保护等;如果云计算作为一种商务模式提供给用户使用,那么站在用户角度可能还将考虑更多的安全问题,如运营商提供的网络是否安全、提供的存储是否安全、数据是否会泄密、是否会侵犯用户的知识产权及隐私、用户账号是否会被盗用等这些都需要运营商解决、向客户承诺的问题。甚至还需要国家出台相应的法规约束云计算服务提供的行为和技术,因此在云安全方面还存在法律风险问题。因此运营商建造一个能安全使用的云、可靠的云、可信的云、安全的云、负责任的云是个艰巨的挑战。
5 结束语
本文通过分析现阶段业务平台发展存在的主要问题,结合云计算的特点及优势说明运营商在业务平台领域引入云计算技术解决这些问题的契机,并列举了几种可能应用的场景。同时探讨随着云计算技术在运营商业务平台领域大规模的应用或者作为一种商务模式提供给用户使用的时候,云计算平台运维工作所面临的各种挑战,希望能通过这些分析和探讨使大家能对目前发展得如火如荼的云计算计划带来新的认识。
1 中国电信集团公司.基于云计算技术实现业务平台关停并转实施指导意见,2011