天铁计算机网络的实时监控管理
2019-01-18刘泽辉天津天铁冶金集团技术中心河北涉县056404
刘泽辉(天津天铁冶金集团技术中心,河北涉县056404)
0 引言
天津铁厂自1998年就将计算机网络系统应用到生产经营业务中,取得了较好的应用效果,如销售系统、生产管理系统、质量系统、计量系统、原料系统、燃料系统、财务系统、设材系统和设备管理系统等。配备有相关设备交换机200余台、服务器60台、小型机6台、光缆线路210公里。计算机机房配电总功率达210×107W。要保证企业生产经营正常进行,首先要确保计算机房的配电、网络、数据库的安全稳定运行,保证24 h不间断运行。
针对以上问题,从三方面着手建立了一套统一、完整、有效的配电、网络、数据库实时监控管理系统。
1 监控系统软硬件配置
(1)电流互感器65套,分别监测40个机柜的电流,各房间15个分线箱电流,5个零线电流,5个地线电流,电压互感器2套分别监测变压器输出电压和UPS输出电压。
(2)组态王编程256点开发软件,一套用于编制配电数据的实时显示和历史存储,自主开发网络管理软件一套,实时显示各交换机的运行状态及流量统计,并通过软件设置实现网络广播风暴的报警、抑制、隔离功能。
(3)配置数据库监控软件一套,通过数据策略设置和数据库监控软件的配置,对服务器数据库关键运行参数实现实时监测、报警。
2 方案设计
2.1 配电监控的方案设计
安装电压、电流互感器采集配电系统中主路电压、分支电流、N线和PE线电流,安装接口采集卡采集UPS的配电运行数据,通过PLC编程上传至上位机数据库连接至太网;编制软件,对数据库中的数据进行统计分析并实现历史曲线查询并在以太网进行发布。解决只能依靠实时监控UPS数据信息来推断配电系统存在的隐患和问题,无法了解之前的历史记录,从而不能随时发现配电系统存在的隐患并进一步制订整改措施的问题。
2.2 网络监控设计
把每个交换机的IP地址、交换机每个端口连接设备的IP地址及MAC地址录入数据库,通过开发软件实现每台设备的在线监测和历史曲线查询,通过配置网络流量带宽控制实现网络广播风暴抑制、阻断功能避免大面积网络瘫痪,通过防火墙技术、和以太网的物理地址绑定功能,杜绝IP地址的私接盗用,配置ARP阻断功能,阻挡恶意攻击,自动禁止企业内部网与互联网相连,杜绝计算机病毒的感染泛滥。有效杜绝公司生产经营数据的安全可靠。
2.3 服务器、数据库监控设计
采用软件实现对小型机、服务器、应用程序、数据库运行的监控,通过对系统运行占用小型机和服务器CPU、内存的在线分析应用程序的代码编写、数据库设计规范是否合理,网络吞吐状况,进程统计信息,系统响应时间是否正常等。有选择性地聚焦到应用程序和数据库问题发生点,系统化地定义业务服务、IT服务和基础架构等之间的关键联接,从而进行程序代码和数据库设计的优化和完善,帮助IT极大地减少应用的MTTR,解决只靠增加或扩充硬件配置来解决软件、数据库的繁冗和不规范带来的计算机业务系统运行速度慢、运行效率低的问题。增强了专家级性能建议能力,性能极限能力,下钻能力,跟踪能力,对不合理的设计及时提出建议,超出系统承载极限及时报警,直接定位系统问题的根源和瓶颈,再针对性地采取相应措施进行改进。具体内容包括J2EE应用管理,MQ管理,Siebele-BusinessApplications管理,OracleeBusinessSuite管理,Webserver、应用服务器(Tuxedo)和数据库服务器管理。
3 应用情况
(1)自项目投运以来,通过对零线电流过大分析实现了配电负载均衡分配,通过对异常电流数据分析,发现故障隐患设备并及时修复,通过对地线电流的异常分析发现消防队用电影响,采用独立变压器隔离消除了影响,发现了零地混接现象和部位进行了整改。通过电网异常电压的报警,及时切换备用电路,消除了异常停电的影响,实现了各种情况下24小时不间断供电。
(2)通过网络监控及时定位网络故障,大大缩短了故障处理时间,有效阻断了企业网络与互联网的连接,通过端口自我保护功能的应用,避免了网络广播风暴的发生,有效解决了以前多次因网络广播风暴造成的全网瘫痪。计算机预防病毒能力大大提高,不会像互联网中计算机,总是因为病毒感染造成系统崩溃或数据丢失。网络信息软件编制实现了所有网络地址信息的查询,为今后的网络系统升级扩容、设备隐患排查提供了详尽依据。网络系统稳定性、数据安全准确性得到了可靠的保证。
(3)监控软件实现了对数据库整体性能监控分析管理,收集的数据更加简洁、及时,为发现性能瓶颈提供了快速诊断和解决功能,有效实现了可用性的管理目标。查找出计算机业务系统软件中繁冗代码和数据库设计缺陷,并组织技术人员进行了优化,如销售系统、设材系统,大大提高了系统运行速度,节约了大量不必要的采购资金,有效解决了不断增加的硬件环境复杂程度和维护难度。