浅议云计算数据中心的管理与维护
2014-12-09张捷
张捷
摘 要:数据中心为信息服务提供运行平台,基于云计算的要求弹性、灵活快速扩展等特点,本文从合理规划、可伸缩性、定制化管理、流程化管理、自动化管理和安全性管理6个方面对云计算数据中心的管理与维护进行了探讨。
关键词:云计算;数据中心;管理;维护
数据是信息系统最重要的资产,事实上,构建信息系统的目标就是对数据的管理,保证数据安全、有效和可用。数据中心就是信息系统的中心,通过网络向企业或公众提供信息服务。信息系统为企业带来了业务流程的标准化和运营效率的提升,数据中心则为信息系统提供稳定、可靠的基础设施和运行环境,并保证可以方便地维护和管理信息系统。采用有效的数据备份和恢复策略能保证企业数据的安全,即使在灾难发生后,也能快速地恢复数据。数据中常常包含企业的商业机密,因此数据维护是数据中心维护工作的重中之重。
由于云计算的要求弹性、灵活快速扩展、降低运维成本、自动化资源监控、多租户环境等特性除基于ITIL的常规数据中心运维管理理念之外,还需要注意对以下云计算数据中心运维管理方面的内容加以重点分析和关注。
1 合理规划
数据中心的建设是一项系统工程,从规划到设计,从选址到建设,从计算机设备到制冷系统,从网络安全到灾难防备,无一不需要合理规划。一个数据中心通常可以运行三十年左右,要使得数据中心在这三十年的时间内始终保持经济的运行状态,有很多复杂的因素需要考虑。比如需要考虑各种设备的更新换代,计算机设备通常以五年为更换周期,制冷系统的寿命可达十年以上,更新时需要合理选择设备,使用过度超前的设备或迟迟不更新都不能达到最经济的效果。再比如需要考虑设备冗余量,设备冗余可以提升系统的可用性,保证个别设备出现故障时整个系统仍能正常运转。但是过多冗余会导致设备长期闲置、资源浪费,因此规划时需要具体分析,保证增加的冗余设备可以切实提高系统的可用性。因此,搭建数据中心需要合理规划各个环节,以保证数据中心在较为经济的状态下运营。同时,业务的动态性和不确定性会给数据中心的准确规划带来挑战。
2 具有可伸缩性
可伸缩性是指一个系统适应负载变化的能力,在负载变大的时候提高自身的能力以适应负载。例如,一个银行的营业厅额可以在等候办理业务人数较多的时候开启更多的服务窗口,而人少的时候仅开启一两个窗口。一个可伸缩的算法可以容易地适应大规模的问题,一个可伸缩的计算机系统可以很容易地通过增加硬件来提高吞吐量。
数据中心需要具备高可伸缩性的IT基础架构,可伸缩性可以从“伸”和“缩”两个角度理解。“伸”在信息服务上线运行或需要更多资源的时候及时、适量地给予资源分配,保证业务的正常运行不受影响。“缩”在信息服务下线或资源需求减少的时候适时回收资源,保证系统的资源高效利用,从而节省运营成本。
新一代数据中心对高可伸缩性的要求是及时、适量、细粒度、自动化和预动性。及时讲求的是快速反应,一旦发出指令后能在较短时间完成伸缩;适量需要分配给信息服务合适的资源;细粒度要求能以CPU、内存、磁盘为单位分配资源,而不是以物理服务器为单位;自动化是指可以在一个控制台上,通过简单的操作完成为信息服务增加资源或服务器等工作,不需要人工进行准备机器、连接电缆、安装软件等繁琐的工作;预动性是指能有效预测出信息服务负载的变化趋势,并在负载增加之前就做好准备,以防负载变化后资源不足,对业务造成影响。
3 定制化管理
灵活性、个性化是云服务的显著特点,用户对应用系统有着千差万别的个性化需求,云服务提供商在保证共性需求的基础上,需满足用户个性化定制需求,向用户提供灵活、个性化配置的云服务系统。云服务提供商要提供按需变化的服务,就要有反应敏捷的人、流程、工具来适应业务变化的需要。云服务下的运维需要更多的灵活性和可伸缩性,可以根据客户、合作伙伴的需要,快速调整资源、服务和基础设施。
4 流程化管理
流程是数据中心运维管理质量的保证。作为客户服务的物理载体,数据中心存在的目的就是保证服务可以按质、按量地提供。为确保最终提供给客户的服务是符合服务合同的要求,数据中心需要把现在的管理工作抽象成不同的管理流程,并把流程之间的关系、流程的角色、流程的触发点、流程的输入与输出等进行详细定义。通过这种流程的建立,一方面可以使数据中心的人员能够对工作有一个统一的认识,更重要的是通过这些服务工作的流程化使得整个服务提供过程可被监控、管理,形成真正意义上的“IT服务车间”。
通过合理规划和系统构建,落成后的数据中心需要为信息服务提供高效、可靠、稳定的运行环境和平台。因为信息服务的质量和成本是客户最关注的问题,信息服务管理自然成为数据中心的一项基本工作,其重要性不言而喻。信息服务管理的含义是以信息服务的形式为客户创造价值的一套组织能力,这种能力以流程的形式贯穿信息服务的整个生命周期。信息服务管理的核心是通过信息流程的标准化,帮助企业根据业务目标实现创新的、可视的、自动的、可控的信息服务,提高企业的运行效率和服务质量,为用户创造最大价值。
5 自动化管理
IT服务根据负载变化可以自动调整所需资源,以求在及时响应和节约成本上取得平衡:同时,计算能力规模越来越大,人工管理资源也越来越不实际。这些新特性对IT管理自动化能力提出了更高要求,企业往往希望在不失灵活性的前提下可以得到更高程度的自动化。
为此,云计算数据中心需要部署自动化管理平台,集中管理虚拟化和云计算平台、提供自定义规则定制功能的自动化解决方案,用户通过使用事件触发、数据监控触发等方式来自动化管理,节约人力同时提高响应速度。
6 安全性管理
由于提供服务的系统和数据被转移到用户可掌控的范围之外,云服务的数据安全、隐私保护已成为用户对云服务最为担忧的方面。云服务引发的安全问题除了包括传统网络与信息安全问题(如系统防护、数据加密、用户访问控制、Dos攻击等问题)外,还包括由集中服务模式所引发的安全问题以及云计算技术引入的安全问题,例如防虚机隔离、多租户数据隔离、残余数据擦除以及多SaaS应用统一身份认证等问题。
要解决云服务引发的安全问题,云服务提供商需要提升用户安全认知、强化服务运营管理和加强安全技术保障等。需加强用户对不同重要性数据迁移的认知,并在服务合同中强化用户自身的服务帐号保密意识,可以提升用户对安全的认知;在服务管理方面,严格设定关键系统的分级分权管理权限并辅之以相应规章制度,同时加强对合作供应商的资格审查与保密教育;加强安全技术保障,要充分利用网络安全、数据加密、身份认证等技术,消除用户对云服务使用的安全担忧,增强用户使用云服务的信心。
7 结束语
数据中心作为信息与信息系统的物理载体,目前主要用于与IT相关的主机、网络、存储等设备和资源的存放、管理。只有运维管理好一个数据中心,才能发挥数据中心的作用,使之能更好地为云计算提供强大的支持能力。通过有效实施云计算数据中心运维管理,降低人员工作量的同时提高运维人员工作效率,保障业务人员的工作效率,提高业务系统运行状况,进而提高企业整体管理效益,同时提高客户满意度,实现云计算数据中心的价值最大化。
[参考文献]
[1]肖小兵.云计算数据中心网络安全的实现原理探析[J].无线互联科技.2013(06).
[2]赵以爽,肖伟.IaaS云计算数据中心设计探讨[J].邮电设计技术.2012(07).
[3]赵吉志,李金,姚萃南.云计算数据中心及标准化发展[J].信息技术与标准化.2011(03).