APP下载

大数据SAP HANA系统的智能巡检的设计与实现

2022-03-23张磊倪巍巍周莹

网络安全技术与应用 2022年2期
关键词:基础架构集群运维

◆张磊 倪巍巍 周莹

大数据SAP HANA系统的智能巡检的设计与实现

◆张磊 倪巍巍 周莹

(兖州煤业股份有限公司信息化中心 山东 273500)

国内大型能源企业为适应产业飞速发展的需要,全力推进大数据SAP HANA系统解决方案,其基础架构中所包含的大数据HANA一体机及SAP应用服务器就有上百台之多,这势必会给数据中心基础架构运维带来挑战,为提高SAP HANA系统的基础架构运维的效率,设计开发针对大数据SAP HANA系统的智能巡检系统。大数据智能巡检系统的运用给大数据SAP HANA系统基础运维提供便捷,其智能化分析体系大大提升了系统运维的效率,为大型能源企业各业务系统建设提供有力保障,为企业信息化建设提供坚实的后盾。

SAP HANA;智能巡检;脚本;分析;预警

1 背景

随着我国经济的飞速发展,大型能源企业业务规模不断扩大,传统业务系统已经无法承担业务规模的要求,为在大数据、人工智能的新形势下,使企业具有更强大的核心竞争力,集团公司推进大数据ERP系统全覆盖项目,采用最新SAP HAHA系统解决方案,实现ERP核心业务系统,大数据ERP系统包含S4 HANA、BW、Fiori、BO、HANA Enterprise等多个核心模块,覆盖整个集团公司人力、财务、物资、生产、销售、风险等各方面业务,组建统一核心业务体系。

大数据ERP系统项目硬件资源规模非常大,是行业中规模最大的系统基础架构,项目包括十几台HANA一体机作为各业务模块数据库、最新十几台刀箱组成云计算虚拟化平台、最新的核心存储和对象存储等设备。为保证如此规模的基础架构系统正常运行,作为基础架构运维重中之重,因此需要标准化、智能化的系统运维管理体系来支撑。

传统的系统运维需要系统管理员使用登录工具,逐台登录各操作系统,手动敲入命令来检查各项指标(CPU、内存、磁盘日志、系统日志等)。工作重复性强,且效率低,运维人力成本较高。当然,还可以通过IT运维平台,一般需要第三方软件,安装较多插件,费用较高,安装部署和维护比较复杂。

大数据ERP系统规模大,包括虚拟服务器、网络安全设备等,数量超过200多台,SAP系统自带的运维平台满足不了各种设备的监控需要。为解决上述问题,提高工作效率、降低运维人力成本,开发大数据智能巡检系统。把运维管理员从单调、重复的工作中解脱出来,把更多的精力投入到分析巡检数据和问题处理中。通过大数据分析和数据挖掘技术使系统运维变得更加高效、更加智能化,为集团公司大数据核心业务系统提供更优质的服务。

2 总体设计描述

图1 系统总体架构图

面向“大数据ERP全覆盖”项目运维的大数据智能巡检系统是一个综合性的系统监控平台,通过最快的、最高效的数据获取方法,将大数据ERP各个服务器等设备的数据统一获取到大数据智能巡检平台,再将推送至智能巡检平台的数据进行大数据分析,运维管理员可通过登录系统统一对“大数据ERP全覆盖”项目进行快速、高效的巡检。大数据智能巡检系统包括各系统数据采集、数据存储、数据智能分析。数据采集方式采用多种数据采集模式,可以通过远程服务器进行数据抽取,也可以通过各客户端进行数据获取推送。采用MYSQL数据库存取数据,在数据存取时对数据进行清洗,然后再存入数据库。数据智能分析包括数据量化指标分析、数据集群与数据系统监控、数据监控预警分析等模块。系统总体架构图如图1所示。

3 基于多样脚本的数据采集

大数据智能巡检系统采用多种方式灵活地获取各设备监控数据。大数据SAP HANA系统巡检指标包括磁盘使用率、内存使用、upload值等基本参数,也包括HA集群、HANA SR、HANA数据库状态等数据。基于多样化脚本的数据采集设计获取数据速度快、效率高,基本不占用系统资源,具有部署简单可靠、可扩展性好等优势。

数据采集脚本包括系统基本参数、监测命令队列、系统数据组装及数据推送。系统基本参数是获取系统IP、主机名等参数;监测命令队列包括需要收集的所有指标的命令;数据组装是将监测命令逐条执行,将执行结果快速记录并进行清洗和数据组装;数据推送是将组装好的数据进行加密,通过web服务推送到智能巡检平台。

数据采集触发是通过系统定时任务触发,可灵活配置触发时间。也可以运用定时执行程序对系统变化参数进行触发报警机制,做到实时系统参数监控。

4 数据收集Web服务

大数据智能巡检系统数据收集服务为数据收集Web服务,该Web服务采用多线程优化技术,保证Web服务的数据传输速率最快,并且更加准确。数据收集Web服务包括数据收集服务接口、清洗校验、数据存储等。

将数据采集脚本获取的数据进行加密通过巡检系统Web服务接口推送给巡检平台,数据包括监控名称、监控编码、监控类型、监控数据、监控时间等信息。数据收集服务接口可以接受上千台服务器同时推送或者获取数据。

数据清洗校验。数据清洗工作是数据分析的重要一环,数据清洗的结果直接影响数据分析的质量。大数据智能巡检系统将推送的监控数据进行转码解密校验后,确认数据准确后,将数据按照名称、类别等存入数据库。

监控数据存储,既要保证数据存取在数据库中冗余最少,也要保证数据库数据查询高效。大数据智能巡检系统采用最佳的数据存取架构保证数据存储。

5 数据分析与预警

数据分析与预警作为大数据智能巡检系统核心模块,为运维人员提供重要数据,数据运维人员可以根据该数据综合判断设备健康状况,制定相应设备的运维方案,使设备状况更加良好,保证业务系统正常运行。数据智能分析包括数据量化指标分析、数据集群与数据库系统监控、数据监控预警分析等模块。

数据量化指标分析。磁盘利用率、内存使用率、Load Average系统负载指标。磁盘空间获取命令df-h,内存获取free-h,uptime可以获取系统运行时间、当前用户数及系统负载Load Average。

数据集群与数据库系统监控。数据库集群包括HANA数据的HA集群和HANA数据库的SR数据同步及异步复制集群。HA集群负责向集群数据库主数据库服务器提供数据库服务,SR负责数据库从节点数据实时同步及数据异步同步。

数据监控预警分析。大数据智能巡检系统连接集团内短信平台,可将告警信息以短信形式发送至系统负责人手机。从数据库读取每条数据信息,截取关键数值,然后与阈值比较。如果数值高于阈值,则系统弹出预警信息,并发送短信给系统负责人。短信内容将明确告知负责人,哪个系统的哪个数值高于阈值,及时通知系统负责人处理。系统指标历史曲线图如图2所示。

图2 系统指标历史曲线图

6 总结

大数据智能巡检系统利用大数据技术构建信息化监控分析平台,实现大数据SAP HANA系统巡检的标准化、自动化、智能化,提升了企业巡检管理工作的科技化水平。大数据SAP HANA智能巡检系统,改变了传统巡检方式,解决了传统巡检人员巡检不到位,隐患上报不及时,数据统计不完整等巡检难题。大数据智能巡检系统规范了系统运维体系,提高了系统巡检效率,节省了大量的人工成本。当监控设备出现异常时,大数据智能巡检系统立即自动通过短信等提示运维人员进行处理。系统能够实时掌握设备状态并进行阈值判断预警,防患于未然。各系统巡检数据永久保留,通过数据积累并建立设备的整个运行生命周期。

大数据智能巡检系统不但能搜集到大数据SAP HANA数据,也可以获取各硬件设备数据,可以扩充到整个数据中心设备巡检,建立整个数据中心系统运维体系,为集团公司各应用系统建设提供稳固的基础架构,为集团公司信息化建设提供坚实的后盾。

[1]邢博文.基于Fiori的IT运维管理系统的设计与实现[J].能源科技,2020,18(11):92-96.

[2]李勇.数据中心运维方案研究与应用[J].长江信息通信,2021,34(04):208-210.

[3]冯韶华.利用内存计算和云化技术优化企业ERP系统[J].甘肃科技,2021,37(09):21-25.

[4]刘平.基于SAP S/4 HANA的火电智慧燃料系统架构设计[J].能源科技,2020,18(09):86-89.

[5]陈庆.浅谈数据中心设备及机房的智能化运维管理[J].中国金融电脑,2018(03):58-61.

猜你喜欢

基础架构集群运维
高速公路智能运维平台
自由流收费下的联网收费结算中心基础架构设计
海上小型无人机集群的反制装备需求与应对之策研究
运维技术研发决策中ITSS运维成熟度模型应用初探
智慧高速+互联网环境下信息化基础架构浅析
我国云IT基础架构投资保持高速增长
IDC发布云计算IT基础架构Q4跟踪报告
培育世界级汽车产业集群
一种无人机集群发射回收装置的控制系统设计
勤快又呆萌的集群机器人