基于O racle EM的数据中心云服务监控与管理体系研究与实践
2017-01-04范江波
范江波
(西南财经大学信息与教育技术中心,四川 成都611130)
基于O racle EM的数据中心云服务监控与管理体系研究与实践
范江波
(西南财经大学信息与教育技术中心,四川 成都611130)
数据中心云服务的监控与管理技术的研究成为云计算相关领域内的重点。该环境下的监控平台具有其自身的特殊性,数量庞大的集群设备、动态增长的管理规模、多样化的监控对象、高可靠性的性能要求,这些应用需求都对数据中心监控系统的设计开发提出了严峻挑战。本文将以O racle EM为基础构建智慧校园云数据中心监控体系提出研究实践和探讨。
智慧校园;数据中心;云服务;自助服务;监控与管理
智慧校园的建设是教育信息化的重要组成部分,也是衡量教育现代化程度的重要标志,近年来智慧校园建设已经得到了人们的极大关注,同时随着云计算技术的快速发展,智慧校园各项应用对基础信息服务的依赖程度更加紧密,资源共享程度要求更高,数据中心作为云计算技术的基础设施,受到越来越多的重视,数据中心监控技术的研究也成为云计算相关领域内的重点。该环境下的监控平台具有其自身的特殊性,数量庞大的集群设备,动态增长的管理规模,多样化的监控对象,高可靠性的性能要求,这些应用需求都对数据中心监控系统的设计开发提出了严峻挑战。因而对数据中心的各类资源如何有效实时监控(服务器运行状态、异构数据库的健康以及各类应用服务的状态监控)成为云平台非常重要的工作。高效实时的云监控可以保障智慧校园数据中心各项服务的稳定,提高服务的可用性。保证监控的实时性和高效性。本文将以Oracle EM为基础构建智慧校园云数据中心监控体系提出研究实践和探讨。
一、云计算发展现状与数据中心的需求
1.云计算现状
云计算的本质到底是什么,目前还没有一个公认的权威的定义,各家公司和研究机构也都有着自己的认知。IBM公司认为,云计算就是“未来的服务器”,虚拟服务器将是最主要的卖点;AMAZON公司也有IBM着同相似的观点,他们认为云计算就是以通过互联网为媒介,租售虚拟服务器即基础架构;Google公司则更关注通过云端为终端用户提供在线文档编辑、个人资料存储等服务。
可见对于云计算的讨论和思考可以称得上百家争鸣。各家都从不同的角度发现了云计算应用的广阔前景。但是本质上讲,云就是用户可以随时访问和处理云端信息,便捷地使用在云端上大量资源的资源管理和分配模式。这己经在业界形成广泛共识。根据美国国家标准和技术研究院的研宄结果,全世界己经公认云计算具有三种服务模式:
(1)Ia aS基础架构即服务。用户可以定制和使用“基础硬件资源”,掌握“虚拟服务器”的操作系统和存储空间,部署定制化的应用程序和软件系统,而不需要关注云基础架构。在今天众多的案例中、是典型的商业实现。
(2)PaaS平台即服务。这种服务模式起源于搜索引擎系统采用的平台架构,用户享有完整的软件开发运行环境,可在此基础上开发和托管用户代码,发布和运行软件系统。这个过程中,用户无需完全掌控操作系统、硬件平台以及网络部署架构。
(3)Saa S软件即服务。在此服务模式中,用户完全不需要了解操作系统、硬件设备和基础网络架构,通过互联网即可直接操作和使用某项软件服务,最大限度、最方便地构建IT信息化平台。
2.云计算对数据中心现实需求
云计算本身的优势是显而易见的,云服务提供商通过在特定的地区建立超大规模的商业数据中心,综合运用虚拟化、分布式计算、网格计算等前沿计算机技术,集中部署大量的计算和存储资源,对外提供高性能、高可用的服务,实现相对低成本的信息系统管理、分配和计费。这种商业模式可以带来巨大的规模效应,强大的资源分配能力,高可伸缩性、高可靠性、高通用性、廉价的IT服务产品。基础设施是云计算最重要的物理载体,而基础设施最终是通过云数据中心数以万计的服务器、交换机以及配套设备实现的。然而数据中心业务数据迅速增长,应用系统正变得日益庞大与复杂,由此面临一系列运维管理方面的挑战:
(1)服务器、存储、网络设备、软件规模增长迅速,尤其随着Oracle数据库一体机的引入,对于软硬件及网络设备集中、统一、一致的IT运维管理成为必需;
(2)IT基础架构设备及技术的频繁升级和更新对人员的层次要求越来越高,也造成了人力成本上升并带来了管理风险;
(3)应用架构(包括关联性)越来越复杂,出现应用群的概念,多个应用之间协调完成复杂交易。从而,对交易的追踪与管理变得越来越困难;
(4)应用的复杂带来基础架构性能保障的风险,IT运维部门面临持续优化提高基础架构性能、保障业务高可用性的压力;
(5)新应用低下的测试效率和应用质量会将企业投资置于风险之中,保障应用质量对维持业务敏捷性、保证服务质量、降低总体成本与风险变得异常重要,成为IT部门的新命题;
(6)云数据中心是IT基础架构的发展方向,大多数IT组织开始在企业内部数据中心应用云计算,无论是更快地供应、按需访问、基于策略的灵活资源调度,还是按规则收费以保证商务结算和对环境的更好控制,IT部门都必须从被动式反应转型到主动和预防式管理上来。
面对以上挑战,通过使用Oracle基础架构运维管理技术软件和其在IT运维管理领域的丰富项目经验,结合现有的IT运维体系流程,建立一体化的运维管理框架,实行业务和技术管理创新,对于降低IT运维管理风险,提高业务用户的满意度,保障基础架构高可用性等方面有着紧迫和重要的战略意义。
由于我校在十二五期间进行了基于Oracle项目的人事系统和校园一体化建设,作为基础,结合OracleEM,使之成为我们建设和管理成为可能和高效的手段。
二、Oracle EM的特点与安装部署
1.O racle EM的特点
Oracle Enterprise Manager(Oracle企业管理器,简称OEM)是Oracle公司的集成企业信息技术管理产品线,它提供了业界唯一的完整、集成和企业的云管理解决方案。OEM通过利用内置的管理功能,为传统和云环境,实现前所未有的效率收益,同时大幅提高服务水平,创造价值。
OEM是通过一组Oracle程序,为管理分布式环境提供了管理服务。OEM包括了一组DBA工具,一个repository,以及一个图形化显示的控制台。OEM控制台与每一个服务器上的智能化代理(IntelligentAgent)相对应。
智能化代理能够监控系统的特定事件并且执行任务(作业)就像你在系统本地一样。事件和作业的结果会被送回控制台,这样可以在一个地方管理所有的系统。Oracle的Oracle Enterprise Manager Cloud Control 13c应用技术。Oracle的企业管理器在经历了多个版本的发展后,企业管理器的功能更加完善、稳定,支持更多的平台和版本,配置越来越健全,主流浏览器基本通过认证。在EM13c中,Oracle提供了更加完善的一体化云管理解决方案。可以预见,Oracle的企业管理器必然会在数据库管理和监控方面成为优先选择。该系统架构如图1所示。
图1 系统结构
2.O racle EM的部署
本文的建设是基于REDHAT AS6.4操作系统,采用双机备份的模式,数据库采用的Oracle12C12.1.0.2.0,EM为OracleEnterpriseManagerCloud Control13c Release 1(13.1.0.0)。具体安装部署可以参看Oracle官方的标准文档。部署完成后的结果如图2所示。
安装完成后对系统进行初始参数配置后即可开始正常服务,系统参数配置图如图3所示。
三、Oracle EM实时监控与管理
OEM涉及框架和基础设施,企业监控和事件管理功能、数据库管理、中间件管理、硬件和虚拟化管理、异构(非Oracle产品)管理、云管理、混合云管理、生命周期管理、配置管理、大数据设备管理、信息服务交互测试和查询、应用绩效管理,应用质量管理等功能服务。下面主要从如下几个主要功能应用做出介绍。
图2 安装部署结果图
图3 系统参数配置图
1.对数据库的云监控与管理
Oracle EM实现了无人值守式监控IT环境。通过一系列有关性能与健康指标监控IT关键组件,例如应用、应用服务器、数据库,以及他们所依赖的后台组件。另外OEM与ServerManagerMotif相比,有以下优点:
(1)从适用范围看:OEM可以同时监控管理多个系统上的多个数据库,因而特别适合分布式环境;而ServerManager只能监控管理一个数据库。
(2)从管理对象看:OEM可以监控管理节点,数据库和监听进程(listener),而ServerManager只能监控数据库。
(3)从适用版本看:OEM可以同时监控管理Oracle7.x 和8.x,而从8版开始,ServerManager已不存在。
OEM数据库工具组是一组使DBA能够通过GUI界面管理Oracle数据库的工具。包括以下工具:
DataManager(数据管理器):这工具使你能够象加载数据一样执行数据的export/import。
SchemaManager:这工具使你能够在数据库中管理对象。可以用于创建,修改,和删除tables,indexes,views, snapshots,sequences等。
SecurityManager(安全性管理器):这工具使你能够管理用户、角色、权限及profiles。
StorageManager(存储管理器):这工具允许你创建和修改表空间、数据文件和回滚段。
InstanceManager(实例管理器):这工具允许你关闭、启动实例并且存储和管理数据库参数。
SQL*Worksheet:这工具使你能够运行或创造SQL脚本并且存储在硬盘上。你能使用这工具重现最后执行的语句;同时,检查显示到屏幕上的执行结果。
BackupManager(备份管理器):这工具允许你管理备份和恢复为Oracle7和Oracle8数据库。在Oracle7此工具支持EnterpriseBackupUtility(EBU),在Oracle8此工具支持恢复管理器RecoveryManager。
SoftwareManager(软件管理器):这允许你将远程软件安装到支持这一特性的远程服务器。
监控数据集中存放在存储库中,管理员可以利用丰富的图表诊断故障并分析趋势。一旦检测到告警,将发送各种通知给管理员以快速解决问题。
缺省地,EM提供以下能力:
1)符合Oralce最佳实践的监控指标与阀值设置,包括客户化指标;同时支持监控模版。
2)基线设置与更正行动。
3)监控所有IT基础(Oracle的或非Oracle的),包括应用与服务。
4)实时访问各种性能图表。
5)收集、保存、汇总各种指标数据。这使得你可以执行战略性分析,例如趋势分析与报表。
6)对检测到的紧急事件提供各种通知能力。
2.意外事件处理机制
Oracle EM利用集中式直观的“意外事件管理器”简化故障管理复杂性。EM将所有通过指标阀值等触发的事件称之为“事件”。EM的事件类型包括:目标可用性、基于指标阀值的告警、作业状态的变化、合规性冲突、高可用检测、服务等级告警等等。
在此基础上,将有意义的“事件”或重大的“事件”整合为“意外事件”或“故障”。一般地,管理员只需要专注于“意外事件”,而避免陷入大量无意义的“事件”中,从而大幅降低工作复杂度与工作量。意外事件管理器使你可以查找、查看、管理、并解决故障,同时提供了指导解决方案,加速问题处理。意外事件管理器:意外事件的触发条件由规则/规则集控制。规则定义了什么情况下、什么时候、向谁发送通知。规则集则是规则的集合,可以为一组目标(例如主机、数据库、组等)采取合适的行动以自动化事件的流程处理。Oracle EM具有整套的意外事件处理机制,可以跟踪它的完整生命周期:
1)分派异常事件的所有者;
2)跟踪异常事件处理状态;
3)设置异常事件优先级;
4)设置异常事件的升级;
5)提供定制的汇总视图;
6)提供注释;
7)提供压缩和解压能力;
8)提供手动清除异常事件能力;
9)提供创建ticket能力。
四、OracleEM云资源管理监控
OracleEM云服务如图4所示
图4 OracleEM云服务图
云的概念中有两条重要的标准:按需获得服务;自助服务。在云服务里最终服务的都是我们的最终用户。OracleEM13c最显著的好处就是可以让标准的数据库平台部署和中间件平台部署,从管理员驱动的形式向最终用户驱动的形式转变。OracleEM13c可以让我们完成以下工作。
(1)池化资源;
(2)标准化和自动化部署流程;
(3)发布模板和服务目录;
(4)设置基于角色的访问控制和授权;
(5)设置限制过度消费资源的配额;
(6)建立升级、降级和回收的策略;
(7)建立测量手段,使按资源消耗收费成为可能;
(8)通过BI进行报表分析和数据挖掘。
配置好云端的参数和路径如图5所示。
图5 配置好云端的参数和路径
每个云服务资源均按如图6所示的进行配置,即可提供给用户进行自助服务。
图6 云服务资源配置
五、结束语
从目前来看,智慧校园的建设管理对教育信息化的发展具有相当重要的作用,要根据学校的总体发展,统筹规划、逐步实施、通力合作,使智慧校园的建设日趋完善。
通过对云服务管理和监控平台的建设,初步达到了高可用性原则、由于该系统承担着对整个系统的统一管理和监控,一旦出现系统崩溃造成数据丢失或者暂停服务,都会给学校带来不可估量的损失,因此,在建设该云管理和监控平台的同时,一定要考虑管理和监控系统本身的高可用性原则、一体化管理原则和易用性和管理原则,监控系统一定要支持双机备份能力,当主管理机器出现故障,备份机器能及时接管,确保云资源数据不被丢失,同时也不会造成暂停服务的状况。所有的管理和监控在统一的监控平台上进行管理和监控,操作人员在该平台,可以直观地管理被管理目标,集中监控各管理单元的各项指标,系统应能提供统一视图,让操作人员可以从上而下,到相应的管理单元进行细化管理。同时通过统一视图,可以直观展现各个管理单元之间的逻辑关系,便于管理者有序地对各管理单元进行管理。监控管理平台管理终端要求采用中文图示化管理界面,最好能提供多国语言支持,可以提供满足需求的不同时间尺度的分析图表,并能够提供各个角色的访问权限管理,为不同角色的操作人员提供不同的管理视图。
通过上述对数据中心资源的云服务监控与主动管理的摸索与实践,为高校智慧校园的建设和管理打下坚实的基础。
[1]饶冰,裴征峰,高文博.O racle云管理平台企业管理器12c实战指南[M].北京:清华大学出版社,2013.
[2][OL].https://docs.oracle.com/cd/E63000_01/.
[3][OL].http://www.oracle.com/technetwork/indexes/ downloads/index.htm l#em
(编辑:杨馥红)
TP315
:B
:1673-8454(2016)15-0063-04