浅析油田虚拟化平台的建设与应用
2018-12-28陈国华李晓林严峻廖剑雄仇红燕
陈国华 李晓林 严峻 廖剑雄 仇红燕
[摘 要]本文主要探讨了虚拟化技术在塔里木油田的实际应用,通过阐述油田虚拟化平台建设过程中系统架构、网络架构、容灾保护的设计方法,以及在安全管理、运维监控、预警分析等方面采取的舉措,分析了虚拟化平台在提高资源利用率、管理效率、系统安全性、业务连续性和节能增效等方面取得的成效。
[关键词]服务器虚拟化;NBU备份;SRM容灾
doi:10.3969/j.issn.1673 - 0194.2018.20.020
[中图分类号]TE4;TP391.9 [文献标识码]A [文章编号]1673-0194(2018)20-00-02
0 引 言
随着油田信息化的快速发展和集团公司统建系统的推广应用,大量的应用系统上线部署,服务器、存储、网络等设备越来越多,架构越来越复杂,机房配电、制冷等配套设施负荷不堪重负,运维难度加剧。如何提高设备资源的使用率,降低能耗,减少软硬件故障对业务连续性和数据安全性的影响,简化架构设计,降低运维管理难度,减少应用部署迁移的工作量和时间周期,缩减机房设施及运维投入等成为了企业的迫切需求。虚拟化技术的推广应用有效解决了上述问题,通过对油田IT环境进行资源整合利用,与油田自主开发监控系统、运维系统有效结合,建成了具有油田特色的虚拟化平台架构。
1 虚拟化平台的应用概况
塔里木油田服务器虚拟化平台自投建至今,历经两次扩建和平台的拓展融合,已建成以30台PC服务器、3套存储及配套网络设备为基础,以虚拟化平台为核心,融合备份管理平台、容灾平台、运维监控平台的具有油田特色的虚拟化平台架构。目前,油田自建的应用系统95%以上是在虚拟化平台运行,实现了服务器虚拟化在油田的全面应用。
2 虚拟化平台的建设思路
随着X86系统的虚拟化技术不断成熟,越来越多的企业用户开始接受并大规模使用服务器虚拟化技术。为了提高服务器资源利用率、延长陈旧应用的生命周期、减少设备投入资金、降低机房能耗,油田决定引进虚拟化技术,本着标准化、高可用、高性能、开放接口、易扩展和绿色节能的建设理念,对油田的虚拟化应用技术进行了选型,并对架构进行了整体设计,分阶段实施。
油田虚拟化应用历经了3个阶段。①初步应用。通过VMware软件对现有的服务器、应用进行优化整合,完成搭建油田中心机房服务器虚拟化环境。②扩展建设。随着虚拟化技术应用得到各级用户的认可和新应用不断上线,前期投入的资源已不能满足业务增长需求,亟需对平台进行升级扩容和站点容灾。扩容建设采用双站点并行思路,满足将应用按等级、用途、功能进行分类管理的需求。③架构优化、系统融合。该阶段新建站点一个,并对站点的功能用途进行优化调整,同时融合了SRM容灾备份系统、统一监控系统和NBU备份系统,实现了站点级的容灾保护机制,建立了集性能分析、数据分析、预警、告警追踪和问题督办于一身的统一运维监控体系。
3 虚拟化技术路线
3.1 虚拟化系统架构
经过对国内外企业虚拟化案例的分析和研究,结合油田实际IT环境,设计了符合油田需求的虚拟化架构。服务器、存储、IP网络和SAN网络均使用冗余配置。管理层通过融合NBU备份、vCops监控、SRM容灾等系统,建立了具有塔里木油田特点的虚拟化管理平台,如图1所示。在应用层面,通过对业务应用系统的功能、资源、性能等进行需求分析,划分并分配到不同站点的资源池中,以保障资源得到合理利用。在物理层面,以30台PC服务器、3套存储以及相关配套的网络设备构建了3个不同功能的站点为业务系统提供资源保障,其中,A站点用于开发和测试环境,B站点、C站点用于生产环境,并在B站点、C站点间建立了站点级别SRM容灾机制。
3.2 虚拟化容灾及数据保护
随着油田信息化的不断深入,油田运营对信息系统的依赖程度越来越高,如何保障业务系统运行的持续性、高可用性,数据的安全性、有效性,容灾恢复的时效性、完整性,成为数据中心设计、建设和运行时需要重点考虑的因素。在虚拟化技术实践过程中,在业务层面,油田运用“vMotion在线迁移”“HA高可用”“DRS资源动态均衡”等技术手段保障应用高可用,利用SRM技术实现站点级的容灾保护。
3.3 网络架构设计
为保障网络的安全性、稳定性和高可用性,在网络设计规划部署时,建立了4套功能不同的网络用于管理、业务、容灾和心跳专用数据通道,部署分布式虚拟交换机,端口组启用“基于IP哈希路由”负载均衡,确保网络端口负载均衡和链路冗余需要。NBU备份采用Lan-Free模式,由传统的LAN网络备份方式转变为SAN网络数据传输,备份速度大幅提高且不会对LAN网络带宽造成争用。各业务网络物理隔离保障了网络的稳定性,解决了网络带宽争用的问题,增强了虚拟化环境网络的可用性和稳定性,对业务系统的正常运行提供了平稳、安全的网络基础环境,提升了各业务系统的用户体验。
3.4 系统安全技术措施
为了应对虚拟环境安全风险,除启用虚拟化平台系统自带的安全防控措施以及系统层面常规措施的基础上,在虚拟化环境安全防控上采取了下列措施加以保障。①访问控制。通过部署堡垒机对虚拟机、主机系统、管理系统等的访问加以控制,授权访问才能使用。②定制化部署。建立的十余套系统模板均完成了各项安全配置,堵塞了系统漏洞,提高了各业务系统的安全性和高可用性。③安全准入。在虚拟机上线前,部署安全准入客户端,对系统、配置、安全基线等检测,符合要求后方可开通网络接入权限。④补丁防护。定期推送操作系统、杀毒软件、防火墙补丁至客户端,及时修复操作系统存在的安全漏洞。
3.5 基于大数据分析主动预警
在虚拟化技术应用的过程中,要結合油田引进大数据分析系统(Splunk)对关键业务系统日志信息进行自动收集、整理和分析,及时发现存在的反常现象,减少故障检修、系统停机、事件调查的时间,不断提升IT服务水平和风险管理能力。
3.6 统一运维监控
为了解决资源及运维人员配置存在的浪费现象,有必要通过开发数据接口抽取vCops虚拟化监控系统、Vantage监控系统等运行及报警信息,集成到中心机房统一监控平台,实时在监控中心大屏上进行展示,并通过短信平台将告警信息实时发送到运维管理人员手机上。同时,机房值班管理人员要进行24小时不间断监控,并对问题进行跟踪督办,保证平台安全稳定运行。
4 虚拟化平台的应用成效
服务器虚拟化在油田中的推广应用整合了应用系统平台,优化了油田服务器资源配给,为油田中小机房整合奠定了提供了资源和技术保障,有利于顺利完成机房整合工作。在应用过程中,通过系统架构优化、平台系统融合等探索取得以下成效。
4.1 节约了管理和维护成本
虚拟化平台实现了虚拟化平台系统高可用性,为应用系统营造了良好的服务器应用环境,消除了单点故障隐患,减少了宕机事件,达到了站点级容灾保护,保障了应用服务的连续性。虚拟化平台通过采用DRS、VCops、VMotion、DVSwitch和HA等虚拟化技术,实现了软硬件资源的集中监控、统一管理、自动均衡、自动迁移、快速恢复和动态扩展,减少了业务系统停机时间,提高了工作效率,节约了管理和维护成本。
4.2 提高了服务器资源的利用率
虚拟化平台应用P2V技术在机房整合过程中完成了应用由物理环境向虚拟环境的迁移,延长了遗留应用的生命周期,同时大幅提升了服务器资源的利用率,硬件利用率由虚拟化整合前的不到10%提升到了60%以上。
4.3 保障了油田信息系统和数据的安全
虚拟化平台内置了安全基线配置、网络准入防控、强制安全客户端部署等基础安全,定制模板统一部署、业务专网物理隔离部署,结合授权访问操作、行为审计等措施保障了系统安全,在2017年“5.12”勒索病毒全面爆发时,平台运行平稳,保障了油田信息系统和数据的安全。
4.4 带来了显著的经济效益
虚拟化技术应用给油田带来了显著的经济效益。第一,虚拟化平台使用30台物理服务器承载虚拟机400余台,较传统模式单台物理服务器平均部署2个应用核算,至少节约服务器170台,按物理服务器15万元/台测算,仅服务器直接节约资金投入2 550万元。同时,物理服务器减少,机房能耗也得到了有效控制,以每台服务器平均650万元计算,年节约电费和空调制冷费用近120万元,经济效益显著。
5 结 语
塔里木油田在实施服务器虚拟化过程中,通过选用合理可靠的技术和系统架构,满足了当前油田信息化的发展需要,减少了维护服务器的时间与成本,降低了运维难度,提高了工作效率。在推广服务器虚拟化技术的过程中,针对系统的高可用、业务的持续性、数据的安全等需求,通过优化网络架构、构建数据互备系统、融合统一运维监控平台等举措,对资源进行优化动态配置,实现了资源效益最大化。