服务器综合管理系统的建设
2009-07-24王立平何荣
王立平 何 荣
富阳市供电局经过多年的信息化建设,已有多个信息系统在使用,所采用的服务器和信息系统日益复杂。由于对现有的系统缺乏有效的管理手段,对计算机资源分布和性能分布缺乏有效的监控手段,对系统故障和效率下降缺乏预警、分析工具。因此,需要建设一套服务器综合管理系统来提高基础设施的可靠性、利用率和安全性等,减少混合网络管理环境下的运营成本。同时,系统还能为信息化的长期发展规划提供必要的依据,在建设基础设施的同时,提供规划和实现信息协调和资源管理,实现高效的系统管理,从而获得可靠的信息支持。
一、管理系统功能需求
实现所辖的主机设备、服务器的监控管理;
实现告警信息的定制、获取、处理和统计功能;
实现对信息网上所有服务器设备的性能数据的采集和统计功能;
根据监测到的性能原始数据,对信息系统运行状况,运行趋势等进行分析;
提供灵活的报表定制功能,针对需求定制开发报表。
二、管理系统的设计与建设
富阳市供电局已经部署了北塔的IT综合管理系统的网管模块,为了保证管理平台的统一,通过在北塔IT综合管理系统中,增加主机、数据库管理等功能模块,实现了服务器综合管理。
1.系统部署
(1)主机设备管理使用SNMP协议,开放只读权限,并使用不同的字符串。在服务端进行设置,实现服务器拓扑图。
(2)对每个数据库服务器建立管理用户,开放最小权限,仅能查询对应的视图与表,以免管理用户权限过大。在服务器端将每个数据库服务添加到应用服务中进行管理。
(3)通过对服务告警类进行定义,可以对所有设备的CPU、内存、应用服务、数据库重要参数等信息定义阀值,设置规则,在系统中进行告警。
(4)通过报表设置,定义如设备负载、告警事件、服务报表等,按类别在不同的时间段生成报表,可生成EXCEL或HTML格式,便于分析总结。
2.系统实现的主要功能
(1)进程状态分析
服务器进程控制对整个服务器的运行至关重要,会影响到其操作系统的正常运行和关键服务的正常运行,所以实时掌握服务器的所有进程运行情况是很有必要的。
管理系统每分钟从服务器上获取最新的进程运行数据,提供各进程的运行趋势分析图,包括进程的CPU占用趋势图、物理内存利用率趋势图等,方便管理人员查看各进程一段时间以来的运行情况。
(2)文件系统分析
文件系统分析主要提供服务器上各文件系统的空间大小和使用情况(已用空间、剩余空间、利用率)以及文件系统的名称、类型等基本信息。
管理人员可以指定系统的刷新间隔,以一定的频率自动从服务器上读取文件系统信息和参数,便于服务器文件系统的状态监视和处理。
(3)CPU/内存利用率分析
管理系统收集服务器的CPU/内存利用率的性能状态,并与预设的CPU/内存利用率阈值进行比较和处理,以便及时处理系统的资源分配出现的不正常,避免可能遭到病毒攻击或可能的有非法服务在活动。
(4)硬盘性能分析
管理系统可以收集磁盘性能I/O状态信息。帮助用户分析磁盘读取的繁忙程度,由于磁盘I/O信息是影响系统性能的常见因素,进而得到对优化整个系统性能的参考指标。
(5)服务器日志查询、分析
管理系统可以采用syslog、WMI、telnet、ssh的方式来读取所监控服务器的日志,并可按分钟、小时、日等方式对日志进行查询与分析。
(6)数据库管理
信息系统的运行离不开数据库,通过管理系统,将数据库加入管理中,可以实现oracle数据库的会话、表空间、SGA、PGA等参数以及其他各类型数据库各项参数的监控。
三、系统建设和应用的几点思考
1.服务器管理系统实施前,均是通过手工方式对各台设备进行管理,需要对每台设备进行查看,出现问题时,并不能第一时间发现,而且记录的数据有限,每台设备的硬件资源使用情况不能做到一目了然,对设备运行分析没有准确的数据支撑。通过服务器管理系统的实施,管理人员不需要每台设备进行巡视,就能获取设备与系统的实时运行情况。
2.对网络设备、主机、应用系统在内的跨厂家、跨平台的统一管理;网络产品管理、服务器管理、应用服务管理等进行监控;提供了较快速的故障告警信息、被监视设备的故障日志等信息;能对这些系统提供的数据进行整理和分析,为系统运维以及信息基础设施方面的规划提供有力帮助。
3.信息系统是不断发展的,网点的数量也在不断增加。因此,在系统管理的范围上将最终提供涵盖从系统基础设施到业务系统的全面的管理功能。这就需要所设计的系统具有从横向(管理系统向多个业务系统扩展)和纵向(管理功能的增加)两个方面的可扩展能力。
(作者单位:浙江省富阳市供电局)