APP下载

地质综合研究云平台运维管理

2019-05-23于由美刘小斌江明张超环

中国管理信息化 2019年7期
关键词:私有云负载均衡运维管理

于由美 刘小斌 江明 张超环

[摘 要] 目前,云平台已应用在各行各业中,国外知名油气开发公司如斯伦贝谢、哈里伯顿等都建立了自己的云应用系统。基于VMware ESXI,搭建了某企业的私有云平台,通过前期的推广应用,达到了预期的效果。随着云平台的逐步应用,出现了云平台后台资源分配不均衡、研究成果备份策略差等实际问题。文章通过云平台计算资源负载均衡技术研究及井工区与地震工区备份方法,并结合企业自身应用的特点,提出了一种针对本企业私有云平台的运维管理办法。

[关键词] 私有云,负载均衡,oracle数据库备份,运维管理

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2019. 07. 067

[中图分类号] TP311 [文献标识码] A [文章编号] 1673 - 0194(2019)07- 0163- 03

0 前 言

随着国内各油田地质与开发生产数据库系统建设的日臻完善,各油田都在积极开展数据库深度应用,但其专业应用系统与底层数据库均非一体化,而是采用数据下载、格式转换、软件推送的模式开展研究工作,这一工作模式不但软硬件资源无法充分利用,而且数据一致性难以保障,研究成果与机器捆绑,共享难。目前,国外知名油气开发公司(如斯伦贝谢、哈里伯顿)基于统一的底层数据库,建立了自己的云应用系统,能够实现远程开展地震解释、地质建模等研究工作,研究人员不用关心软件及数据在哪个地方,随需即取。云平台构建完成之后,后期的运维管理是一项长期的工作,如何做好云的运维管理工作是每一个建设者必须考虑的问题。采用基于服务器集群的云平台后台部署模式,能够保证云平台计算节点运行的可靠性;采用基于浏览器的应用模式,能够保证用户得到很好的应用体验。但如何保证云平台能够平稳运行,如何保证研究成果的数据安全,是在云平台运维过程中面临的主要问题。

1 负载均衡

负载均衡(Load Balance,简称LB)是一种服务器或网络设备的集群技术。负载均衡将特定的业务分担给多个服务器或网络设备,从而提高了业务处理能力,保证了业务的高可用性。目前,比较常见的负载均衡算法有:

(1)轮询法:将请求按顺序轮流地分配到后端服务器上,它均衡地对待后端的每一台服务器,而不关心服务器实际的连接数和当前的系统负载。

(2)随机法:通过系统的随机算法,根据后端服务器的列表大小值来随机选取其中的一台服务器进行访问。由概率统计理论可以得知,随着客户端调用服务端的次数增多,其实际效果越来越接近于平均分配调用量到后端的每一台服务器,也就是轮询的结果。

(3)源地址哈希法:源地址哈希的思想是根据获取客户端的IP地址,通过哈希函数计算得到的一个数值,用该数值对服务器列表的大小进行取模运算,得到的结果便是客服端要访问服务器的序号。采用源地址哈希法进行负载均衡,同一IP地址的客户端,当后端服务器列表不变时,它每次都会映射到同一台后端服务器进行访问。

(4)加权轮询法:不同的后端服务器可能机器的配置和当前系统的负载并不相同,因此它们的抗压能力也不相同。给配置高、负载低的机器配置更高的权重,让其处理更多的请;而配置低、负载高的机器,给其分配较低的权重,降低其系统负载,加权轮询能很好地处理这一问题,并将请求顺序且按照权重分配到后端。

(5)加权随机法:与加权轮询法一样,加权随机法也根据后端机器的配置,系统的负载分配不同的权重。不同的是,它是按照权重随机请求后端服务器,而非顺序。

(6)最小连接数法:最小连接数算法比较灵活和智能,由于后端服务器的配置不尽相同,对于请求的处理有快有慢,它是根据后端服务器当前的连接情况,动态地选取其中当前积压连接数最少的一台服务器来处理当前的请求,尽可能地提高后端服务的利用效率,将负责合理地分流到每一台服务器。

2 Oracle数据库备份

各种因素可能会造成数据库中灾难性的数据丢失,为了保证数据库中数据的安全,必须采取必要的备份措施保证数据库中数据免遭破坏。所谓数据备份技术,就是让数据能以某种特定的格式加以保留,以便在系统遭受灾害时能重新加以利用的一个过程。其目的就是为了使数据能重新利用,换句话说,数据备份的核心是能使数据恢复,一个无法恢复的数据备份是毫无意义的[1]。数据库备份是十分简单,是在数据库处于无法使用状态时用于重建数据库的重要信息拷贝。

常见的Oracle数据库备份有三种方法:

(1)冷备份。冷备份是Oracle最简单的一种备份,执行冷备份前必须关闭数据库,然后使用操作系统实用工具或者第三方工具备份所有相关的数据库文件。

(2)热备份。热备份是当数据库正在运行时进行数据备份的过程,执行热备份的前提是数据库需运行在ARCHIVELOG模式,适用于7*24不间断运行的关键应用系统。

(3)Export导出数据库对象。冷备份和热备份都备份物理数据库文件,因而被称为物理备份。而export备份的是数据库对象,因此被称为逻辑备份。该方法通过Oracle实用工具Export利用SQL語句读出数据库数据,并在操作系统层将数据和定义存入二进制文件。导出对于还原一个意外删除的对象或还原这个对象的定义来说是很好的,因为脱机备份不能只还原一个对象,而联机备份还原一个对象必须得还原该对象存在的数据文件,相对于导出这种备份形式来说要烦琐很多,但是从导出中还原时,仅能得到导出文件中的内容,不能从中向前回滚,所以导出数据库这种备份方式只能作为联机备份和脱机备份的一种补充。

3 方案设计

地质综合研究云平台具备服务器资源、数据资源及软件资源统一管理、专业应用远端随需即取、跨平台等技术特色。该平台已在研究院、锦采、曙采等多家单位的勘探开发研究工作中得到了初步应用,结束了资料靠下载、成果靠拷贝的低效工作模式,提升了一体化协同研究的技术能力,效果显著。在推广过程中,针对负载均衡算法不完善,数据备份仅限于用户手工拷贝等问题,对勘探开发云平台进行了技术升级。

3.1 云平台计算资源负载均衡技术

通过分析前期云平台实际应用情况,将计算节点的连接数、CPU使用率、内存使用率、图卡使用率列为关键性能指标,并按影响程度打出分值,通过分值构建性能指标矩阵,计算服务器的KPI权重值,编写程序实现计算节点四个关键性能指标在矩阵中的轮询,使服务器按权值顺序接受来自平台用户的服务请求,实现应用的负载均衡。

不同的服务器可能机器配置和当前系统的负载并不相同,因此它们的抗压能力也不尽相同,给配置高、负载低的机器配置更高的权重,让其处理更多的请求,而低配置、高负载的机器,则给其分配较低的权重,降低其系统负载。经论证,使用加权轮询法,很好地处理这一问题,并将请求顺序按照权重分配到后端。

基于上述算法,将权重值细化,基于云平台服务器关键性能指标来构建矩阵,再通过层次分析算法计算出服务器的KPI权重值,运用加权轮值算法,使服务器按权值顺序接受来自平台用户的服务请求,实现应用的负载均衡。将云平台服务器的四项关键性能指标CPU、内存、显存、连接数组建矩阵,见表1。首先为四项关键性能指标按重要性打分,接着根据分值在矩阵中填写比值,根据检测的服务器相关信息套入矩阵,计算出服务器的KPI权重值,指导实现平台服务器的负载均衡技术,如图1所示。

3.2 井工区及地震工区备份方法

地震解释工作在地质研究过程中起着至关重要的作用,在建立等时地层对比格架方面,通过三维地震资料解释落实区域对比标志地震响应特征,以地震资料为约束建立等时地层对比格架降低地层对比可靠性;在精细构造解释方面,通过三维地震资料解释落实区块断层位置、产状、延伸长度、组合关系等特征及地层产状变化,井震结合实现区块构造精细解释;在落实有利储层分布方面,井震结合落实有利储层地震反射特征,通过反射特征精细追踪,落实有利储层分布范围,为井位部署及跟踪提供依据。地震解释成果以二进制文件存储与磁盘或储存于解释软件自带的数据库中,地震解释成果的备份,对于地震工区的恢复十分必要。

通过自定义功能脚本,实现云平台地震解释应用的井工区及地震工区重要数据文件定时自动增量备份及完整备份功能,提升用户研究成果的安全性。

在应用服务器层面设定定时任务,自动调用编写的备份脚本,完成云平台地震解释应用的层位文件备份、井工区数据备份,实现数据的定时备份功能,还可以根据输出的备份日志查看备份的文件是否成功完成,如图2所示。

crontab定时备份

30 2 * * 6 /software/backup/hts_bak.sh

0 1 * * 7 /software/backup/prj_bak.sh

通过实现上述定时自动备份功能,使云平台地震解释用户的研究成果和数据安全得到有效保障。

此外,还通过容灾备份系统,对后台成果数据进行TrueCopy备份。在灾难发生时,TrueCopy会对数据实施无缝保护,免除了一系列烦琐的手工磁盘恢复的过程[2]。

4 总 结

本文介绍了地质综合研究云平台后台资源的运维管理方法,并结合生产实际,综合运用自创的云平台计算资源负载均衡技术和井工区及地震工区备份方法,完善了云平台运行策略,通过项目推广实施,实现了云平台在油田公司12家單位地质研究部门的初步推广应用。今后还将继续完善勘探开发云平台的功能,不断丰富云平台应用,按需调整云平台节点的分配方案,满足云平台用户日常科研生产工作对云平台资源的需求,并结合实际生产需求,进一步提高地质研究工作的效率与质量,为辽河油田增储稳产、降本增效提供有力的技术支持。

主要参考文献

[1]刘艳.SAN环境下数据备份系统的设计与实现[D].重庆:重庆大学,2008.

[2]刘小斌.基于SAN存储的容灾备份系统[J].中国管理信息化,2015,18(13).

猜你喜欢

私有云负载均衡运维管理
异构环境下改进的LATE调度算法
企业创新私有云平台的搭建探究
高校私有云的架构和实施
虚拟网络建设思考与实现
在数据集中模式下电网企业级信息系统运维管理初探
多站点同步更新系统的设计
模糊理论在Ad hoc网络通信领域的应用