基于IaaS架构体系的OSS云平台规划研究
2013-02-28邹耀辉
李 纯,邹耀辉
(中国电信股份有限公司深圳分公司 深圳518048)
1 引言
云计算是一种通过网络以按需、易扩展的方式获得所需服务或IT基础资源的交付和使用模式,有SaaS、PaaS和IaaS三大服务模式。IaaS指消费者通过Internet从完善的计算机基础设施获得的服务,用户能够部署运行操作系统和应用程序等任意软件。云计算能促进通信网络技术应用系统升级换代,提供综合信息服务运营基础设施支撑能力。中国电信积极关注建立可运营、可管控的云平台,利用虚拟化技术将基础资源设施封装为用户可灵活使用的服务。中国电信股份有限公司深圳分公司(以下简称深圳电信)也积极投身于云平台的试验中,已成功搭建了一套本地IT虚拟平台,承载了OSS/OA、增值等多项专业应用。
深圳电信本地OSS包括交换、传输、数据、动力环境监控等专业网管、网络资源管理、开通服务保障、跨网专业网络监控四大类,涉及服务器约448台,除部分前置采集服务器外,大部分设备安装在枢纽7楼OSS机房。由于早期的IT技术和系统分立建设等因素,平台仍采用单一的物理服务器做业务组网单元,需要大量实体服务器。随着业务扩展,实体服务器数量逐年增加。目前枢纽7楼OSS机房的UPS电源、设备机柜出现满负荷状态,已无法满足OSS新业务对IT资源的需求。
2 搭建OSS云平台的优势
搭建基于IaaS架构体系下的OSS云平台能够有效地推动深圳电信业务变革的实现,打造深圳本地IT发展的新优势。其一,打破OSS平台“一台服务器、一个应用”的旧有模式,在每台物理机上运行多个虚拟机,提高IT资源和应用的效率和可用性;其二,通过整合服务器将共用的基础架构资源聚合到统一的资源池中,减少大量硬件、电力和散热等需求,从而大幅降低能耗;其三,节省服务器占用空间,有效改善机房机柜位置紧缺的状况;其四,节省硬件的成本投入,降低管理人工成本,提高经济效益;最后,用户无需关注底层基础设施,便能够自由控制、快速部署资源或获得服务,按需扩展和使用。该云平台将为深圳本地IT平台的发展注入一股强大的生命力。
3 OSS云平台探索
3.1 OSS架构及资源状况
3.1.1 架构实现
目前,OSS架构主要包括采集层、数据处理及业务层、数据分析统计层3个层面。采集层设备主要完成协议转换、业务设备运行、原始数据采集和转发的功能,通过不同类型的物理链路业务直接相连,设备主要布放在业务设备所在地机房,分布区域广,以专用采集设备为主,虚拟化难度较大;数据处理及业务层设备完成原始数据接收及预处理入库和业务访问接入,由PC服务器群组成,设备数量多,集中于枢纽7楼OSS机房,为主要的虚拟化对象;数据分析统计层设备完成数据统计分析和存储功能,主要采用小型机设备和HA架构,数量较少,虚拟化移植成本较大。非安装在枢纽7楼OSS机房的网管系统设备,受限于网络条件及系统架构,需要进行网络或系统架构的改造,虚拟化成本较高。
3.1.2 操作系统
OSS平台服务器的操作系统分为UNIX、Linux和Windows 3类,UNIX运行在IBM、HP、SUN等小型机上;Linux和Windows运行在x86服务器上。由于目前主流的虚拟系统几乎不支持UNIX操作系统小型机,因此本次云计算规划平台研究课题的主要对象为Linux及Windows两类操作系统的PC服务器。
3.1.3 云计算优化资源
根据目前OSS的现状及虚拟化条件,可做虚拟化的计算资源统计结果,可虚拟化的服务器为184台,可云计算优化资源的统计结果见表1。
表1 可云计算优化资源统计结果
3.1.4 资源
(1)计算资源需求
将上述可云计算优化资源中的可虚拟化服务器作为样本,采用调研表格获取数据形式,收集整理服务器的业务应用系统信息、服务器IP地址、操作系统、服务器型号品牌、CPU型号及个数、频率、CPU核数、CPU平均利用率、权重及CPU使用量(GHz)等信息,以两个月为采集周期,采集184台OSS服务器计算资源数据,统计CPU资源需求,得出资源需求分析结果,见表2。
①安全检查与巡查。每年进行两次以上水库工程安全大检查;每座水库至少落实1名巡查员,按水库大坝巡视检查有关规定进行巡查。
(2)内存资源需求
将上述可云计算优化资源中的可虚拟化服务器作为样本,采用调研表格获取数据形式,收集整理服务器的业务应用系统信息、服务器IP地址、操作系统、服务器型号品牌、内存大小、内存平均使用率及内存使用量等信息,以两个月为采集周期,采集184台OSS服务器内存数据,统计内存资源需求,得出分析结果,见表3。
表2 计算资源需求分析结果
表3 内存资源需求分析结果
(3)存储资源需求
将上述可云计算优化资源中的可虚拟化服务器作为样本,采用调研表格获取数据的形式,收集整理服务器的业务应用系统信息、服务器IP地址、操作系统、服务器型号品牌、磁盘空间实际使用率、系统容量大小、磁盘空间使用量等信息,以两个月为采集周期,采集184台OSS服务器磁盘容量数据,统计存储资源需求,得出分析结果,见表4。
表4 存储资源需求分析结果
3.2 OSS云平台规划
3.2.1 云平台基础设计思路
OSS作为电信业务的重要支撑保障及运维管理系统,必须满足业务可用性和连续性,同时满足移动互联网等业务的需要,因此规划整个云平台必须采取硬件设备全冗余配置及数据双备份,以满足业务可用性的需求和快速恢复能力,并进行多网段规划,支持DCN、互联网、DMZ等业务接入需求,综合灾备能力设计,满足四、五星级关键系统的业务连续性需求。
根据数据的生命周期、对I/O性能的要求、数据重要性以及数据海量特点等因素,统一存储架构应具备分级机制,对不同数据采用不同的存储方式和存储介质,充分提高存储空间的利用率和管理效率。磁盘根据其性能分为价格低、容量高的SATA盘及高性能、高可靠的FC盘,此外采用电子存储介质进行数据存储和读取技术的闪盘(SSD)已开始引入高中端存储,其I/O读取速度远高于传统磁盘。在存储结构中采用分级机制,对于被频繁访问和关键的数据,因其往往只占整个数据量的3%~5%,却带来超过50%的IOPS需求,应将其置于I/O性能最高的闪盘中;对于较重要的对I/O性能有较高要求的数据,将其置于FC硬盘中;把相对不活跃的海量数据置于SATA盘,以降低成本。
在OSS云平台上,存在大量重要性及对I/O性能要求不同的虚拟机。将虚拟机进行分类,有数据库的虚拟机为关键数据,放在高级存储中;一般应用系统的虚拟机为重要数据,放在中端存储中;而做采集机的虚拟机为一般数据,放在低端存储上。根据第3节OSS平台资源分析,存储资源需求为22 283.91 GB,约计需23 TB存储空间,考虑OSS的重要性,存储数据需做全备份冗余并预留40%的业务扩展空间,因此23 TB×(1+1)×1.4=64.4 TB,本次存储规划为64 TB的有效存储空间。
3.2.3 服务器资源设计
结合目前OSS的现状及虚拟化条件,根据上述可虚拟化184台服务器采集数据汇总得知,OSS总体资源需求为:所有虚拟机需要CPU资源使用量157.485 9 GHz,总内存大小333.408 1 GB,总磁盘空间22 283.91 GB。选取主机模型Dell R910,具备4颗目前主流32 nm的可虚拟化8核CPU芯片XEON E7-4830,主频型号为2.13 GHz,配置128 GB内存,得出以下服务器资源整合方案。使用Dell R910机架服务器整合184台OSS,其CPU完全兼容虚拟化技术。单台R910提供资源为CPU为68.16 GHz;内存为128 GB;为满足业务系统的正常运行,保证CPU使用率在60%以下,需要4台R910服务器提供计算资源,能够提供的最大CPU资源为272.64 GHz。同时为保证虚拟化平台的高可用性,需要增加4台R910服务器作为虚拟化集群服务器全冗余配置,提供虚拟化集群高可用性功能,即8台R910服务器共计CPU资源545.28 GHz,内存1 024 GB,满足需求。
3.2.4 灾备架构设计
虚拟平台利用HA技术对基础架构组件进行全面保护,可选择本地或异地灾备。利用HA技术对虚拟平台上的应用程序资源及组件进行灾备,以确保重要系统和业务的可用性、连续性及安全性。数据库及重要关键系统可部署在硬件资源性能较高的设备上,分配高可用性的技术及高性能的系统资源,如综合使用HA和快照技术;系统性能要求不高的系统和业务可分配低性能的资源;应用空闲的系统、业务及数据可将其归档至磁带系统。利用全备份和增量备份技术对不同级别的系统和业务进行高效的保护。通过使用在线介质备份方法对数据的某一时间点的状态进行快照和备份,当数据发生逻辑错误时可迅速进行恢复。通过使用集群技术有效防止服务器单点故障。
4 实践经验及改造成果
4.1 深圳电信IT虚拟平台实践案例
目前深圳电信IT网已成功部署了4套虚拟平台,分别承载增值业务、OSS/MSS应用、动力监控及综合告警系统等多专业应用,其架构如图1所示。其中,增值业务孵化平台虚拟化改造提供了一套快速部署的测试、开发、业务交付、系统数据迁移备份的基于IaaS架构的虚拟主机平台,其上承载了增值云平台网上营业厅活动专区、智能终端精确营销系统、VVGO、掌上清系统、呼叫平台接口5个关键应用;MSS虚拟平台承载了割接流程管理系统、深圳电信文档库、文件服务器等24个OA平台应用;OSS虚拟平台承载了远程控制堡垒机、防火墙监控服务器、防病毒服务器等15个平台应用;动力监控及综合告警系统采集机虚拟化改造构建了基于虚拟架构的数据中心基础平台,实现了57台采集机整合。深圳本地IT虚拟平台的4套平台作为“云计算”实验平台,已为深圳电信业务的云化发展、运营及技术支撑提供宝贵经验。
4.2 改造成果
深圳电信本地IT虚拟平台目前部署于14台实体主机设备上,年消耗电量为3.2×104kW,仅占用机房2列机柜空间,其上共运行了154台虚拟机。本地IT虚拟平台等效实体主机设备154台,虚拟化改造前需占用机房20列机柜空间,年消耗电量需多达3.64×105kW。通过虚拟化改造,有效改善了深圳电信本地机房机柜位置紧缺的状况,显著提高了机房空间利用率,共节省18列机柜空间。此外,由于减少了大量的硬件、电力和散热等需求,大幅降低能耗,每年本地IT网增值业务、OSS/MSS应用、动力监控及综合告警系统4套业务平台运行共节约电量3.32×105kW。
图1 深圳电信本地IT虚拟平台网络拓扑
5 预计改造效果评估
基于IaaS架构体系的OSS云平台规划改造后,降低了硬件成本、节省了机房空间、减少了电力成本、降低了制冷需求、降低了能耗、提高了IT资源利用率。参照深圳本地IT虚拟平台已有的实践案例,并根据对深圳电信OSS平台可虚拟化的184台服务器的各项资源评估:改造前年消耗电量约为4.35×105kW,占用机房约23列机柜位置,368 U的机架空间;预计通过规划改造,以Dell R910为实体主机模型,部署于8台实体主机设备上,年消耗电量为6.3×104kW,仅占用机房4列机柜位置,32 U的机架空间,具体信息对比见表5。
表5 OSS平台云规划改造前后消耗电量及机架空间信息对比
由表5可见,运行于实体主机的OSS平台的年消耗电量及机架空间资源均显著降低,能够大幅节约能耗,并直接改善深圳电信本地机房机柜位置紧缺的状况。
6 结束语
基于本地IT虚拟平台的实践经验,根据OSS平台当前状况的分析和改造效果评估,基于IaaS架构体系的OSS云平台规划将显著提高IT资源和应用效率。同时本文提出的规划将为未来深圳电信IT平台虚拟化改造、机房节省空间、能耗降低的评估提供有效的参考依据,且对解决本地IT机房资源紧缺状况及UPS电源和空调不足等问题具有建设性意义。
1 赵立威,方国伟.让云触手可及:微软云计算实践指南.北京:电子工业出版社,2010
2 许辉阳,李劼,罗霄翔.面向业务的云计算IaaS研究.移动通信,2011(9):20~25
3 邓孟城.基于云计算IaaS的IT基础架构建设方案探讨.科技风,2011(11):53~53
4 涂艳丽.云计算及在IT支撑系统中的应用.中国通信学会第六届学术年会论文集(上),2009