APP下载

企业信息系统自动化运维工具的应用

2016-10-21郭晓宏

电子技术与软件工程 2016年5期
关键词:自动化运维

摘 要 简要介绍了海洋石油富岛有限公司自动化运维工具点检系统的主要功能,详细分析了点检系统的技术路线及架构,针对不同的应用系统提出了相应的点检数据获取方法。

【关键词】自动化 运维 点检

1 引言

目前海洋石油富岛有限公司已有生产管理系统、SAP、OA等多套生产与办公系统,目前主要的巡检工作依靠日常的人工点检处理,人工点检费时费力,也无法做到高频度的点检,因而时有系统故障影响业务开展情况的发生

随着信息化在工厂的不断深入,我们发现信息化运维的技术手段远远落后于信息化的发展速度,新形势下信息系统的运维管理越发苍白无力。每增加一个应用系统就需要相应配套服务器和一系列软件,系统蔓延的趋势越来越明显,从而导致运维工作不可控,运维保障难度增大、人员效率低。另一方面,人工巡检的频度和覆盖率有限,造成很多情况下系统出现问题后才被动响应。因而,如何将事后管理变成事前处理,将被动运维转换为主动运维成为一个突出的问题。

通过点检系统的实施,借助新技术的运用,降低人为巡检的工作量,提升运维的效率,降低投资和人力;通过实现系统巡检的自动化处理,以足够的广度和深度去采集充足的信息,逐步实现主动运维的目标。

2 点检系统概述

运维点检模块由服务器端程序、配置客户端、点检客户端三部分构成,服务器端主要为客户端提供数据服务,调度各点检客户端的运转,通过短信接口、电子邮件接口提供报警通知,通过SM系统接口写入运维处理单。

配置客户端由系统管理员和高级用户使用,根据用户授权可以实现对整个点检系统进行配置和监控。点检监控功能可以统一浏览各系统点检的情况,可以查看各点检客户端当前点检项等信息;点检计划管理各点检对象的点检频度和时间。点检单查询可以对以往点检记录进行查询分析;点检对象配置和点检项配置对系统点检的处理进行基础配置,包括点检的条件,各种数据来源,判断条件公式等;用户管理对本系统用户进行配置及授权;接口查询功能可以查询服务器端各接口的运行情况;日志查询可以查询系统的运行情况及后台的处理日志。

点检客户端是实现点检的应用程序,可以分布在多个机器上运行。点检客户端分为远程点检和本地点检处理两部分,分布可以在远程对系统进行点检及在服务器本地对系统进行点检处理。

3 技术路线及架构(如图1)

运维点检模块服务器上部署数据库服务及点检模块服务器端应用程序,处理与短信、邮件、SM系统等的接口、与点检客户端的远程通信等逻辑。

各客户端与点检服务器之间通过WCF进行通讯,可跨网段穿越防火墙实现通讯访问。

应用程序的点检重点在于如何获取需要点检的数据及根据这些数据进行逻辑判断。目前海洋石油富岛有限公司的信息系统较多,界面种类也繁多,对点检模块是一个考验,针对不同的应用系统提出了相应的点检数据获取方法:

3.1 直接数据

直接数据判断指可以从系统里面获取直接的数据进行判断得出点检结论的方式,这种方式得出的点检结论理论上是最准确的,但是这种方式避开了用户界面等环节,点检结果对于最终用户的使用可能存在差异,比较适合于无界面或C/S等界面出错几率较低的系统。点检模块支持SQL Server、Oracle、PHD、WebService等多种数据源直接获取应用系统数据。

3.2 HTML解析

HTML解析的方式适合大部分B/S架构的应用系统,通过HTML解析,点检模块实现模拟用户登录,录入、点击、查询等操作,并对最终结果进行解析,获取其中的有用数据,从而实现对点检结果的判断。HTML解析方式受HTML格式数据的影响较大,不适合对用户可自行进行超文本编辑的内容进行判断,同时对于页面中ActiveX、Flash的数据无法进行获取和判断,但是这种方式最接近用户的操作体验,得出点检结果也更为全面。

3.3 图像处理

图像处理的方式是对应用程序进行截屏,然后对图像进行处理,通过像素颜色判断和OCR光学字符识别获取点检数据,从而实现对点检结果的判断。图形处理方式可以避免HTML格式数据对点检判断的影响,同时可以处理ActiveX、Flash、附件文档、C/S客户端等界面形式,配置也更为直观简便,但是由于识别区域必须固定,不适合界面动态变化较大的系统,同时由于受到光学识别精度的限制,点检结果可能会受到影响。

点检模块对每个点检项的判断采用公式进行判断,可以对多个条件进行与或等逻辑处理,最终得出结果是一个布尔值,即判断结论是正常還是异常,对于异常的点检项触发异常报警通知相关人员进行人工确认和处理。

4 结束语

目前,该点检系统已在海洋石油富岛有限公司运行近半年,总体运行情况良好,能根据不同业务场景制定不同巡检频率,同时提高巡检覆盖范围,及时发现系统问题,将被动运维转换为主动运维,计划后续推广到其它系统。但点检系统解决问题的方式可以减少损失,但无法避免损失,以及如何在发现问题的同时进行问题诊断是后续需进一步考虑的问题。

参考文献

[1]闫龙川,刘军.企业信息系统自动化运维工具研究与应用[J].供用电,2015(08).35-38.

作者简介

郭晓宏(1980-),男,湖北省当阳市人。现为海洋石油富岛有限公司工程师,从事生产信息系统管理工作。

作者单位

海洋石油富岛有限公司 海南省东方市 572600

猜你喜欢

自动化运维
大型国有企业环保设施第三方运维的探索与实践
运维技术研发决策中ITSS运维成熟度模型应用初探
谈电力运维安全隐患排查治理
AGV小车在白酒行业自动化立体仓库中的应用
配电室无人职守集控站在京博石化的运用
配电线路运行资料管理自动化的探讨
基于ITIL的运维管理创新实践浅析