运用云架构进行水电企业新型信息化建设的实践与思考
2017-11-01邓湘勤
邓 湘 勤
(国电大渡河流域梯级电站集控中心,四川 成都 610041)
运用云架构进行水电企业新型信息化建设的实践与思考
邓 湘 勤
(国电大渡河流域梯级电站集控中心,四川 成都 610041)
云计算是当前信息化领域最前沿和热门的技术,经过近几年的发展,迅速成为当前进行信息化建设的核心支撑技术。面对日益增长的信息化建设以及IT设备的运维管理需求,如何利用云架构在利旧的基础上进行新型的信息化建设已成为当前信息化建设主要讨论的课题。结合云架构在国电大渡河公司进行云信息化建设的实践成果,诠释了如何应用云架构进行新型信息化建设的思考。
云计算;分布式架构;混合云存储;异构虚拟化
1 概 述
国电大渡河流域水电开发有限公司(以下简称“公司”)于2014年提出了建设智慧大渡河的战略,包括智慧工程、智慧电厂、智慧检修、智慧后勤等运行单元。作为智慧大渡河战略的承载平台,信息化建设首先要变得更加智慧。根据智慧大渡河战略规划,集控中心提出了应用云架构进行新型信息化建设的设计方案。该设计方案从计算资源集中化、存储资源混合化、容灾平台化、IT运维管理统一化四个方面对公司的计算资源、存储资源、数据容灾备份、资源利旧等需求进行了整体的规划设计。笔者结合项目建设实施规划和建设成果,阐述了运用云架构进行新型信息化建设的实践过程。
2 运用云架构进行新型信息化建设的必要性
2.1 传统数据中心物理资源管理提升空间有限
传统的数据中心采用烟囱式架构,庞大的应用体系采用静态部署的方式,业务应用采用点对点集成,由此而造成每个新业务的到来需要单独配置服务器,一方面增加了管理成本,另一方面也增加了管理难度(图1)。并且,随着公司业务的发展,数据中心作为支撑业务发展的信息化部门,在硬件资源利用率不完全的情况下,资源浪费率越来越高,由此而造成的成本增加以及能源的浪费也会越来越高。
2.2 传统数据中心运维管理面对难以克服的挑战一方面,随着现代企业信息化集成度和数字化改造程度越来越高,数据流的承载、响应、管理、存储以及备份的要求对传统的数据中心带来了极大的挑战,传统数据中心除面对高并发、高IO数据流量的新业务需求,迫使用户采购性能更高的设备之外,当单台硬件设备的性能无法满足新业务需求时,数据中心将无法有效支撑新业务的开展。
图1 传统数据中心框图
既使是面对旧有业务,随着发展,数据流的峰值也会越来越高,特别是办公自动化(OA)、财务管控、一体化平台等系统,在单台硬件设备无法支撑数据流峰值需求时,将会造成办公效率的明显下降。因此,如何在不增加采购成本的情况下,平滑的消除数据峰值瓶颈,也是对数据中心管理员的一个挑战。
另一方面,随着数据中心硬件设备的多样化,管理难度对数据中心管理员也提出了新的挑战。例如:不同厂家的服务器、存储设备、网络设备如何纳入统一管理?如何快速、有效地将问题定位以及巡回运维?目前尚无较完美的解决办法。
在面对不同应用需求时,如何快速响应,如何敏捷配置计算和存储资源,让业务系统快速上线以及资源的动态伸缩和回收等问题是运维管理需要提升的地方。
3 集中计算资源,建设统一的云计算平台
面对以上问题,在旧有VMware平台的基础上,公司采用云计算技术、分布式架构的解决方案,以FusionSphere为基础搭建了统一的云计算平台。国电大渡河公司云计算平台建设总体架构见图2。
图2 云计算平台总体架构图
数据中心云计算解决方案从逻辑上分为产品解决方案和专业服务解决方案,其中产品解决方案又分硬件部分和软件部分。硬件部分是指可以提供给数据中心基础层的机房建设、供电、散热方案到数据中心使用的服务器(刀片式&机架式)、存储、网络设备、安全设备等全套硬件产品。软件部分是以业界领先的云计算软件系统FusionSphere为主体构建的云平台及管理系统。公司云计算中心主要分为以下层次进行设计。
3.1 云计算基础架构层设计
基于服务器、存储、网络、安全等硬件设备,分别构建出虚拟计算资源池、虚拟存储资源池、虚拟网络资源池、虚拟安全资源池,实现了对各类资源的池化管理,由云计算软件按用户所需给虚拟机分配资源,释放后的虚拟资源被重新纳入资源池管理;同时,云计算软件基于资源池的统一管理,实现了虚拟资源基于用户策略的调度管理,提高了资源利用率,节能减排。该层对外提供开放的API接口,将虚拟基础架构层对资源的各种操作、能力开放出来,引入第三方厂家进行二次开发对接,构建面向公司内部用户提供云服务的私有云系统。该API接口兼容业界主流的AWS API(Amazon Web Service)。
3.2 云数据中心管理设计(图3)
图3 云数据中心设计图
云数据中心管理是云数据中心必不可少的功能,主要提供以下功能:
(1)资源统一管理:对云数据中心的虚拟资源、物理资源实施统一管理,包括资源的生命周期管理、资源分配等。
(2)云监控、告警:提供物理服务器、虚拟机、存储、交换机、物理集群等各个维度各种性能指标的监控功能;提供各种软、硬件设备不同级别的告警界面呈现、邮件转发、告警短信提示功能;各类物理资源、虚拟资源的拓扑呈现。
(3)开放API / SDK:对外提供开放API接口并提供SDK开发包,以方便用户或第三方进行二次开发,对系统进行进一步集成。
(4)VPC、VDC功能:为满足公司本部和多个分支机构之间对数据中心资源自主使用、自主管理的需求,VPC从网络上对不同分支机构的物理资源、虚拟资源进行隔离,以保证不同分支机构的资源在各自子网内访问;每个VDC可以被管理员划分为一定的物理资源或虚拟资源,VDC管理员管理该VDC下的资源,从资源管理、使用的角度进行隔离。
(5)应用弹性伸缩:系统按照管理员设置的应用资源使用变更策略,根据应用的负载轻重自动调整应用所需要的虚拟机数量,达到资源按需使用,弹性伸缩。
(6)异构资源池管理:云管理平台FusionManager不仅能管理FusionCompute构建的云计算资源池,而且可以管理VMware vSphere构建的云计算资源池,并且实现管理流程和操作的完全统一。
(7)基础设施管理:主要包括物理服务器、交换机、存储设备的接入、监控、告警,物理服务器的上、下电控制。
(8)虚拟负载均衡:用户可以在FusionManager上申请负载均衡器,将业务虚拟机关联到负载均衡器。根据用户设定的负载均衡策略,将业务请求均匀分发到与之关联的虚拟主机上,使得每个业务虚拟机的负载基本均衡,以保证业务运行的稳定性和可靠性。
(9)报表管理:支持将监控数据导出为报表,以便于用户进行进一步分析和管理。
(10)系统管理:包括用户管理、系统配置、定时器设置、设置密码规则等功能。
4 云存储,建立分布式统一存储资源池
分布式存储FusionStorage作为一种存储与计算高度融合的存储软件,达到了高性能、高可靠、高性价比,具有一致的、可预测的性能及可扩展性,具有高弹性和自愈能力,具有计算存储高度融合性能。FusionStorage采用分布式集群控制技术和分布式Hash数据路由技术,提供分布式存储功能特性。FusionStorage功能架构见图4。
图4 FusionStorage功能架构图
* 存储驱动层:通过SCSI驱动接口向操作系统、数据库提供卷设备。
* 存储服务层:提供各种存储高级特性,如快照、链接克隆、精简配置、分布式cache、容灾备份等。
* 存储引擎层:FusionStorage存储基本功能,包括管理状态控制、分布式数据路由、强一致性复制技术、集群故障自愈与并行数据重建子系统等。
* 存储管理平台:实现FusionStorage软件的安装部署、自动化配置、在线升级、告警、监控和日志等OM功能,同时向用户提供Portal界面。
5 统一运维管理,建立统一的云计算、云存储、云网络监控管理平台
该项目所有的硬件设备使用eSight管理软件进行统一管理,并接入ManageOne进行设备监控和业务监控。FusionSphere云计算解决方案中的云管理FusionManager能够在同一个系统中实现:硬件资源管理、逻辑拓扑监控、告警与事件管理、虚拟资源管理、系统配置、用户管理、操作日志查询等功能,并能实现与NTP服务器自动对时,支持自动化运维和自动化调度。
6 运用云架构进行新型信息化建设取得的成果及思考
运用云架构进行新型信息化建设。在公司本部建立了统一云计算数据中心,完成了分布式计算资源池和分布式存储资源池的建设,同时兼顾对集中式存储需求,建立了集中式存储资源池,创新地将集中式和分布式存储架构混合应用在信息化建设中。
通过本次建设,云计算中心实现了以下功能。
6.1 高性能和高可用的虚拟化服务
计算资源、存储资源的虚拟化达到了业务部署按需分配、快速上线、资源动态伸缩的要求。资源虚拟化整合后,极大地提高了设备资源利用率,通过统一的管理平台,可以直观地看到云计算平台的资源使用情况,便于管理和维护。
公司云计算平台采用分布式架构的云存储模式,能满足大数据多个服务器并行处理查询请求的要求,消除了网络和IO瓶颈,并且在云存储下包含SAN、NAS、分布式存储等多种存储资源池,可以适用于各种业务的不同需求。
6.2 统一的智能运维管理平台
云计算平台建设后,云计算中心管理员在面对不同厂家的物理设备时不再需要单独进行管理,可以通过统一的云计算管理平台对底层物理设备进行资源虚拟化管理,系统运行日志实时呈现。
云数据中心管理员不需要再面对冰冷的命令行和shell界面,所有配置均采用直观、简洁的web形式进行呈现,减轻了繁琐的操作。
云计算平台采用分布式架构,单节点故障不会影响到整个系统的稳定运行,并且云计算平台的故障告警模块与公司短信告警平台联动,当出现硬件故障后,会有短信和邮件自动发送给云计算中心管理员,以确保故障得到及时解决。
当业务部门申请新计算、存储资源时,通过云计算管理平台,可以将虚拟服务器快速发布,从接到资源申请到服务器发布运行的时间可以缩短至30 min以内。
通过进行上述改进,云计算平台极大地提高了管理员的工作效率,更好地推动了数据中心管理员向服务化转型。
6.3 高效的硬件设备资源利用率
云计算平台单台服务器最大可以承载117台虚拟机的稳定运行,极大地提高了物理资源的利用率,对比原来需要数十台物理服务器才能满足相同的使用需求,云计算平台能有效降低云数据中心资源的能耗。
6.4 平滑的硬件升级和资源扩充
一方面,云计算平台支持平滑的硬件升级。传统数据中心升级存储设备需要单独采购存储机头、磁盘阵列柜和光纤交换机,而在云计算平台下,只需采购服务器并配置足够的磁盘即可。从而极大地降低了采购成本。
另一方面,云计算平台的使用按需采购、动态分配的原则,便于管理员做出建设规划和集中采购,从而更好地保证了云计算中心能及时得到高性能的硬件设备和最新技术。
7 结 语
综上所述,云计算是大势所趋、顺应技术发展潮流,是对信息化建设的又一次革命,这次革命的主题是开放、扩展、分布式。在国内外,不管是新兴的互联网企业,还是信息化建设比较领先的企业,都在进行云架构下的信息化建设的实践和探索。运用云架构不是简单的云计算、云存储、云网络技术的应用,而是在云架构之上综合利用云计算技术、云存储技术、云网络技术、以往的信息化技术、自动化运维技术、统一管理技术,通过统筹融合、相互补充,实现企业信息化建设的智能化、高效化和易管理化。
[1] 计算机信息系统安全保护等级划分准则,GB/T 17859-1999[S].
[2] 信息安全技术 云计算服务安全能力要求,GB/T 31168-2014[S].
[3] 信息安全技术 云计算服务安全指南,GB/T 31167-2014[S].
TV51;TV7
B
1001-2184(2017)05-0075-04
2017-01-10
邓湘勤(1975-),女,四川遂宁人,工程师,从事企业信息化网络管理及运维工作.
(责任编辑李燕辉)