APP下载

Zabbix在复杂信息化环境中的应用

2016-05-14王磊刘晗董珊

科技创新导报 2016年7期
关键词:运维管理分布式

王磊 刘晗 董珊

DOI:10.16660/j.cnki.1674-098X.2016.07.008

3.山东省青岛市城阳区夏庄街道办事处 山东青岛 266109)

摘 要:长期以来,如山东大学齐鲁医院这般复杂环境下的IT运维管理一直是个难题。为此,使用Ubuntu与Zabbix搭建了分布式运维管理系统。通过该系统,系统管理员能够实时获取各类被监控对象的相关数据,掌握网络、信息系统运行状况,及时发现并解决问题,大大提高了IT运维效率,提高了各类信息系统运行的稳定性和可靠性。

关键词:Zabbix Ubuntu 运维管理 分布式

中图分类号:TP319 文献标识码:A 文章编号:1674-098X(2016)03(a)-0008-02

山东大学齐鲁医院信息化建设,历经近30年,已经建成囊括多个院区的大型综合信息系统,包括各类子系统数十个,工作站几千台。庞大的设备数量和复杂的信息系统结构,使得保障信息系统运行的稳定和可靠成为一大难题。传统的人工、手动的系统管理及监控早已不适应现有的IT环境,高效可靠的运维管理系统[1]成为系统管理员必然的选择。一款出色的运维管理系统可以给系统管理员提供方便、高效的管理方式,系统管理员可以通过它实时获取各类被监控对象的相关数据,掌握网络、信息系统运行状况,及时发现并解决问题。

该文依托山东大学齐鲁医院IT环境,利用Ubuntu[2]与Zabbix[3]搭建了一套企业级的分布式[4]运维管理系统。该系统实现了对山东大学齐鲁医院网络设备及部分信息系统的实时监控,使系统管理员能够随时掌握网络设备、信息系统的运行状况,提高了医院网络和信息系统的稳定性和可靠性。通过建立这样一套运维管理系统,解决了山东大学齐鲁医院系统运维中的重要难题,有效地推进了医院信息化建设。

1 系统搭建

1.1 服务器系统安装

服务器系统使用了Ubuntu 14.04LTS Server版,这是一个长效的服务器版本,官方提供高达5年的长期技术支持。使用安装光盘将Ubuntu安装到服务器中,在安装临近结束时,系统提示进行软件选择,用户可以根据自己的需求自主选择安装哪些软件包。因Zabbix的需要,需要选择安装LAMP server软件包。安装完成后重启系统,输入用户名密码后即可进入系统。

1.2 Zabbix简介

Zabbix是由Alexei Vladishev所开发的,是一种提供分布式系统监控以及网络管理服务的企业级开源[5]解决方案。Zabbix能监视各种网络及系统参数,保证信息系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位并解决存在的各种问题。单机模式下Zabbix由两部分构成,Zabbix server与可选组件Zabbix agent。

Zabbix server可以通过SNMP,Zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在Linux,Solaris,HP-UX,AIX,Free BSD,Open BSD,OS X等平台上。Zabbix agent需要安装在被监视的目标服务器上,它主要完成对硬件信息或与操作系统有关的内存,CPU等信息的收集。Zabbix agent可以运行在Linux,Solaris,HP-UX,AIX,Free BSD,Open BSD,OS X,Tru64/OSF1, Windows NT4.0,Windows(2000/2003/XP/Vista)等系统之上。

2 Zabbix系统的使用

2.1 基本功能

系统主菜单有5项,分别是“Monitoring、Inventory、Reports、Configuration和Administration”。“Monitoring”项用来查看系统的各种状态;“Inventory”可查看录入系统中的主机;“Reports”汇总了系统的各项状态;“Configuration”中可进行主机添加、监控等最常用操作;“Administration”中可以对整个平台进行管理。

2.2 特色功能

2.2.1 自动发现

由于医院网络中的设备数量巨大,若是每个待监测的设备都需要手工添加,无疑是网络管理员的噩梦,所幸Zabbix提供了自动发现功能,可以自动发现并添加主机。

进入Configuration>>Discovery,点击右上角“Create discovery rule”按钮,输入自动发现的IP范围,新建Checks,选择Check类型,比如:ICMP ping、SNMP等,保存退出。进入Configuration>>Actions,在右上角“Event source”处选择“Discovery”,再点击“Create action”按钮,在界面中输入Action名称,进入“Conditions”子菜单,下拉列表中选择“Discovery check”,然后选择刚才建好的“discovery rule”,点击“add”,之后进入“Operations”子菜单,配置自动发现后的动作:选择“New”,下拉菜单中选择“Operation type”为“add to host group”,最后选择“add”,此时选择保存即可。

进行以上一系列操作之后,系统就可以自动发现主机并将其添加进指定的主机组,这样就极大地方便了系统管理员的使用。

2.2.2 告警依赖及分时段告警

Zabbix系统具备强大的告警功能,其中告警依赖及分时段告警非常实用。可以在每个告警项目添加依赖关系,若此情况存在,才进行告警。

由于医院工作的特点,多数工作站都是定时开关机的,Zabbix支持持续检测这些工作站的状态,但是只进行分时段告警:进入Configuration>>Actions>>Conditions,在“New condition”处添加动作条件,选择Time Period,设置工作时段即可。

设置告警依赖及分时段告警,大大减少了无效告警数量,提高了告警的准确率,保证了系统的有效性和可用性。

2.2.3 IT服务监控

Zabbix支持以服务为目标的监控,可以允许我们从某项IT服务的宏观视角来监控系统运行。进入Configuration>>IT services新建某项服务,将所关心的所有环节加入整个服务中去,任何一个环节发生问题影响到整个服务都会引发告警。

3 分布式部署

Zabbix使用server + proxy的方式实现分布式部署。Proxy即代理服务器[6],它是一种可以从监控设备收集监测数据并发送到Zabbix服务器的进程,它可被视为Zabbix服务器的扩展,它所收集到的数据被暂时存放在proxy上,之后统一转发给它所属的服务器。部署并在代理上收集数据,将降低Zabbix服务器本身对cpu资源和磁盘I/O的消耗。

为保证安全性,医院建立了物理隔离的内外网,可以将Zabbix服务器部署在内网中,在外网部署一台proxy进行数据采集,通过网络技术禁止该proxy与外网的通信,proxy与服务器通过网闸进行通信;在内网中,以主要楼宇为单位,分别部署一台proxy。在Administration>>DM中,建立所用的proxy,并将待监控的主机分配给各个proxy,完整的分布式系统结构如图1所示。

4 结语

在山东大学校齐鲁医院这样复杂的信息化环境下,如何进行高效率的运行维护,是保障信息系统稳定可靠的一大难题。该文基于Ubuntu操作系统和开源的Zabbix运维管理系统,搭建了企业级的分布式运维管理系统。该系统实现了对山东大学齐鲁医院网络设备及部分信息系统的实时监控,取缔了人工的、手动的监控方式,提高了运维管理效率,取得了较好的效果,有力地支撑了医院信息化建设。

参考文献

[1] 万天翼.基于ITIL的运维管理系统的设计[J].数字技术与应用,2010(7):117-119.

[2] Hudson A,Hudson P,陈钢,等.深入解析Ubuntu操作系统[M].北京:清华大学出版社,2008.

[3] 吴兆松.Zabbix企业级分布式监控系统[M].北京:电子工业出版社,2014.

[4] George Coulouris,Jean DollimoreTim Kindberg,Gordon Blair.分布式系统:概念与设计[M].北京:机械工业出版社,2013.

[5] 史蒂文.开源的成功之路[M].北京:外语教学与研究出版社,2007.

[6] Baidu.代理服务器[EB/OL].[2016-5-13]http://baike.baidu.com/view/751.htm.

猜你喜欢

运维管理分布式
基于预处理MUSIC算法的分布式阵列DOA估计
电能计量中用电信息采集的实践研究
西门子 分布式I/O Simatic ET 200AL
家庭分布式储能的发展前景