虚拟化云平台助力广电网络降本增效
2018-03-27张景川席永杰
张景川,席永杰
(山东广电网络有限公司临沂分公司,临沂 276000)
1 引言
随着广电网络集团客户业务的快速发展、用户的增长,广电网络公司机房需要投入大量的服务器用于业务部署和支撑,如何在有限资金投资的前提下实现业务快速部署、集中管理,达到系统高可靠性和高可用性的目标?同时又满足降低网络维护成本、提高维护效率、节能减排的要求,是我们在网络管理工作中一个重点关注和努力的方向。在这里搭建先进的高性能虚拟化平台进行服务虚拟化成为首选方案。山东广电网络有限公司临沂分公司(以下简称“临沂分公司”)中心机房数据业务系统建设较早,现有设备运维管理的缺陷及弊端日益凸显,主要表现在如下:
(1)服务器数量多,维护成本居高不下。大部分应用分布在不同的物理服务器上,数十台服务器占据大量的机柜资源。且由于服务器建设周期不等,部分老旧服务器性能不足、硬件故障率较高。大量的部件维护和购置更换等在增加人员工作量的同时更增加了维护成本。
(2)耗电量及运营成本的增加。从维护成本支出上计算,每台服务器按中等负载约300W,在不考虑制冷设备耗电量的情况下,仅十台服务器每年就需要消耗接近3万度电。
(3)无备份运行安全性差。多数服务器目前基本上属于单主机环境运行,且没有集中的数据备份和管理,一旦业务系统出现故障无法实现快速的系统恢复和数据恢复,会造成业务长时间中断。同时集客业务的客户多是政府部门,现有硬件设施更是无法满足政府对业务实时性的要求和业务系统数据安全性的要求。
(4)新增业务成本高。集客业务需求逐渐丰富,新增业务系统时需购置服务器及机柜,设备购置调试周期较长,无法实现新业务系统的快速上线。
(5)监控管理技术落后、效率低下。既有内网设备管理方式仍多数采取将放置在机柜中的服务器逐个接入KVM,通过KVM接入显示器,通过显示器进行切换分别进入不同的服务器进行维护操作。业务系统逐渐增多,维护人员需要管理的系统也越来越多,这种轮询检查的方式越来越成为制约维护效率提升的瓶颈。
结合业务应用现状需求,临沂分公司运行维护部新搭建了一套高性能Vsphere虚拟化云平台,硬件方面使用多台高性能服务器组成计算集群并通过NAS挂载多个高性能和大容量存储。通过虚拟化技术,将分布在物理服务器上的硬件资源形成一体的CPU、内存和存储资源池,并按需分配给每一台正在运行的虚拟机。由此多个问题迎刃而解:
(1)实现资源整合。仅用5台服务器、两台集群交换机、两台存储仅一个机柜的空间即可虚拟化出一整套高性能平台,其中计算资源池达到275.4Ghz,内存资源池达到638GB,整合利旧现有的存储资源,使存储资源池达到了近50TB,由此完全了满足现网以及未来一段时间内各项目对服务器硬件资源的需求。
(2)实现节能降耗。利用P2V技术,将原本运行在物理服务器上的系统整体迁移到虚拟化平台中,不仅可提高原系统的性能,老旧的物理服务器在完成业务割接后,即可下电下架以节省能耗和机柜空间资源。由此不再需要购置各种型号备件,而配置较新的服务器则进行虚拟化后将其计算资源和内存资源利旧整合到资源池中。目前,我们已将智慧党建、蜂巢网管、大唐运维、PON网管、OTN网管、AAA计费认证、MSCP-DHCP服务器、DNS、办公OA、Unio统一网管、FTP服务器等十余种服务进行虚拟化,并下电了多台老旧的物理服务器。
(3)新业务可进行快速部署。当新业务需要上线调试时,可以根据业务应用需求分配资源大小,通过模板虚拟机的快速部署,进行测试和生产环境的快速搭建,不再需要购置新的物理服务器,缩短调试周期。例如最新的智慧党建项目,仅用1个小时即快速部署6台高性能虚拟机并将网络调试测通。
(4)平台高可靠性提高。整个虚拟化平台支持动态迁移(vMotion)以及动态资源调度(DRS),可以在不关机的状态下对硬件进行维护和升级,更可以实现集群内虚拟机在各个物理机的资源分配及负载均衡,从而保持了业务的高效性、可用性和持续性,多个高性能存储可对虚拟机的整机进行定时备份,使各个系统的RTO和RPO满足需求。
(5)整个平台使用一套监控系统,即可实时对运行在资源池中的所有虚拟机和物理机进行资源监控和调配,可以便捷地对故障虚拟机进行远程重启、扩容资源、查询告警等。
2 结束语
虚拟化云平台,在山东广电网络有限公司临沂分公司的集团客户业务和应用服务上逐渐实现了业务快速部署、集中管理、降本增效、提高系统可靠性的目标,极大地提高了运维效率与对外服务能力。