APP下载

数据库智能巡检系统在企业信息化建设中的实践应用

2020-11-20李欣刘颖卢永刚董明杰

中国信息化 2020年10期
关键词:分部国网语句

李欣 刘颖 卢永刚 董明杰

“数据管理一直是任何关键任务IT计划成功的关键。”—Gartner

作为IT业务的核心模塊,数据库的重要性毋庸置疑,数据库的稳定运行直接关系到应用系统的可用、稳定、高效性。因此,企业必须建立数据库监控体系,7x24实时监控数据库的运行状态,在数据库即将出现问题或已经出现问题时,通过立即触发事件来及时预警,使运维人员能够及时予以处理,确保数据库稳定、高效的正常运行。

一、国家电网公司西北分部现状

在国家电网分部信息化建设大力推进下,国网西北分部信息化建设步伐大大加快,目前已经建成十几个重要业务系统,数据覆盖了国网西北分部生产,经营,战略,财务、运营等各方面的信息,几乎所有的经营活动所依赖的信息普遍采用数据库进行管理和存储,这些数据库的安全稳定运行是保障整个国网西北分部信息业务系统正常运行的基本条件。因此,数据库的维护工作成为了保障业务稳定运行的重点内容。

目前国网西北分部数据库诊断及调优工作,仍采用DBA手工分析管理的方式进行,问题的诊断与优化完全依赖于DBA的经验,虽然能够解决部分数据库性能问题,但过分依赖人员经验。不同DBA对于数据库的诊断与调优结果不同,同时由于数据库隐患排查手段不全,对于已经暴露的数据库问题能够进行故障诊断与优化,但对于一些隐藏的问题无法发现,对于数据库的隐患全面排查工作难以开展,导致了数据库内部仍然存在性能及功能隐患。

二、数据库智能巡检的实践

(一)建设目标

优化数据库系统运维管理水平,实现数据库的全面自动化监控、故障诊断预测、深层次故障分析、数据库状态统计报告、数据库变更管理以及性能瓶颈分析以及优化建议管理,开展数据库故障诊断和优化工具项目建设,使数据库管理模式从原有的分散式的完全依赖DBA水平的管理方式转变为集中的、统一、高效的管理模式,并建立数据库的统一管理规范。

(二)需求调研

为满足数据库满足国网西北分部内部多数据库统一集中管理、故障诊断和优化的实际需要,数据库智能巡检系统需要满足以下要求:

1.故障诊断预测功能

能够监控数据库配置变化等信息,可以提前发现性能瓶颈,及时通知管理人员,在告警到来之前就着手解决故障,防止故障蔓延、恶化,影响最终用户。

2.深层次故障分析

通过7x24的实时收集数据,可以对任意时间段的故障问题进行语句级的深层次分析,相应使用资源的数据库、程序、操作系统用户、客户端、数据库用户、上下文信息和命令类别等详细的信息。

3.统计报告

可以随时根据需要生成DBA所需要的负荷统计报告、活动报告、健康检查报告以及与特定时间性能状况与性能基线比较的报告。

4.变更追踪/瓶颈分析/优化建议

可以追踪变更数据,实现对数据库全面的健康检查,并按问题的优先级提供解决建议。

(三) 系统实现

1.系统架构

从系统功能可以将系统分为三层架构:

(1)采集服务

实现被监控数据库的运行数据采集;

(2)应用服务

实现采集、分析任务的调度,完成对采集信息的实时分析,实现预警和告警,并提供对外访问的接口与服务;

(3)数据存储

用于存储采集到的被监控数据库的运行信息;

系统的架构具体如图1所示。

2.功能结构实现

根据数据库智能巡检的需求,结合国网西北分部现有环境,采用目前成熟的远程数据获取技术,实现数据库的全面监控与分析等功能。

(1)数据库监控

以动态仪表图进一步展现单个数据库实例的性能,覆盖数据库实例各个组件与各种资源、活动的重要性能指标,依照组件、资源与活动结构布局清晰,实时指标数值和历史曲线相结合。

(2)数据库瓶颈分析

通过多维工作负载分析、锁定和等待分析、变更跟踪、I/O分析、执行计划分析等功能,对SQL语句的性能消耗数据、执行频率、是否存在锁阻塞等方面进行深入的额分析和诊断,查找造成问题的根源SQL语句。

(3)数据库SQL语句自动优化

运用人工智能技术,穷尽所有的可能的SQL改写方法和数据库的优化提示,输出语意等价、语法正确的SQL语句列表;分析SQL语句的语法和SQL语句中表和表之间的关系,给出最适合的备选索引建议。

(4)空间问题探测

自动监控数据库表空间和数据文件的配置和使用情况,针对使用百分比过高的表空间或者无法自动扩展的数据文件进行报警。

(5)容量规划模块

监控数据库所有参数,并对参数的修改状态进行追踪显示。

(6)变更追踪

自动追踪操作系统和数据库的各种变更,并分析结合与之相关联的性能状态变化。

(7)告警监控

支持告警规则设置功能,提供包括报警条件、报警阈值、报警严重级别、报警提示信息、报警生效、实效时间段、报警动作的定制功能。

3.实施环境

本次数据库智能巡检系统建设主要部署数据库响应分析模块、数据库结构分析和事务分析模块以及集中管理展示平台,实施环境如表1所示:

猜你喜欢

分部国网语句
国网今年投资27亿元 新建7.8万个充电桩
宁夏实现国网能源区块链
国网电动汽车推出充电桩开放项目
多步辗转积分列表表达
中国世界遗产分部图
分部积分公式的解题技巧
关于分部积分的几点说明
基本算法语句
我喜欢
作文语句实录