基于GIS的数字视频监控运维管理平台的实现
2015-07-18潘美莲
潘美莲
摘要:提出研发基于GIS的数字视频监控的运维管理平台,此平台应用SNMP协议到系统设备及软件进行信息采集和管控,应用CORBA和Web Service支撑架构、流程和软硬件接口的方法进行研究设计。同时,以被管理对象、监控采集分析、集中监控展现、运维服务管理为基础构建架构,来配置统一资源配置库(RDB&CMDB)、集成扩展接口模块,从而实现了平台基础资源的可视化监控、IT资源配置管理、统一事件管理、第三方系统接入管理和运维服务流程管理的功能,并最后能在GIS上分层展现。
关键词:SNMP;CORBA;Web Service;GIS;运维管理平台
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2015)12-0039-03
Implementation Based on GIS Operation and Maintenance of Digital Video Surveillance Management Platform
PAM Mei-lian
(Guangzhou Institute of Technology, Guangzhou 510075, China)
Abstract: Proposed development of GIS-based digital video surveillance operation and maintenance management platform that use SNMP protocol to the system equipment and software for information collection and control, application methods CORBA and Web Service support structure, processes, and conduct research and design of hardware and software interfaces. Meanwhile, the managed object, monitoring acquisition and analysis, centralized monitoring show, operation and maintenance service management is based on building infrastructure to configure the Uniform Resource Configuration Database (RDB & CMDB), integrated expansion interface module, enabling visual monitoring platform of basic resources, IT resource configuration management, unified event management, access to third-party systems management and operation and maintenance service process management functions, and finally able to show on the layered GIS.
Key word: SNMP;CORBA;Web Service;GIS;platform of operation management
近年来,高清数字视频社会治安监控系统发展,系统涉及庞大的图像采集、图像传输、图像存储、图像显示以及图像应用系统建成后需要强大运维管理平台来支撑运行维护。
1 关键技术
SNMP(Simple Network Management Protocol)网络管理协议,它包括了监视网络状态、修改网络设备的配置和接收网络事件等。
CORBA(Common Object Request Broker Architecture)公共对象请求代理体系结构,是为了解决分布式处理环境中软件系统和硬件系统的互相连接的方案。
Web Service是构建应用程序的普遍模型,为了给应用程序提供服务与数据的应用组件,通过网络协议和规定数据格式访问Web Service并内部执行得到结果。
2 平台架构
基于GIS的视频监控运维管理平台按照逻辑层次划分为以下几个模块:被管理对象、集中监控展现、监控采集分析、运维服务管理和集成扩展接口等关键模块。
被管理对象,它主要包括主机、网络设备、业务数据、系统、监控设备、安全设备、机房环境等。
集中监控展现,它是系统的呈现,它是运维管理平台的人机交互接口,可以提供直观的集中监控呈现、快速地发现并分析各类数据运行的隐患,提供PORTAL统一展现视图,同时也包括业务拓扑视图、网络拓扑视图、机房拓扑视图等。管理平台通过全面的展现手段和通知手段,使运维人员快速并全面掌控系统运行的状况,从而保障系统的稳定运行。通过Portal门户来组合不同的视图,从而为不同的角色提供完整的运维管理监控界面。
监控采集分析,它的任务是完成被管对象的数据采集、数据分析及数据的归并管理功能,监控系统采集基础环境、服务器、网络设备、安全设备、存储、视频业务、等性能和告警信息。统一事件分析引擎是平台的处理核心,利用事件规则库可以进行事件的关联分析和过滤压缩,从而可以大幅度地压缩告警数量,并且能定位真正故障原因,给事件处理提供策略,最终达到完成告警和自动化处理。
运维服务管理,它是实现IT基础架构库的标准流程模块,主要包括流程管理能力,如问题管理、事件管理、变更管理等,提供日常作业计划、知识管理能力、绩效考核能力、巡检管理能力等。
3 平台功能
3.1 基于GIS的统一展现
采用基于GIS地理信息系统的空间可视化管理,运维资源信息都通过GIS展示和操作。将资源分成多个GIS地图图层:机房图层、光缆图层、传输设备图层、前端摄像头图层等。GIS采用地图层叠加标注图层来展现各种资源,操作用户可以选择展示资源类型。资源与地图关联,可以查看资源的周围地理信息,也可以通过地理位置查询资源。运维时,通过地理信息定位故障点,快速生成工单,并为修护提供各种可用资源信息,协助运维解决问题。
3.2 基础资源的可视化监控
运维管理系统是集前端设备、主机、网络、安全设备、存储设备、应用系统、数据库、中间件、机房环境有等系统功能于一体的平台级运维系统,系统以GIS平台为基础平台,提供统一的用户界面,可视化的管理手段,准确反映前端系统、IT系统、网络系统的逻辑拓扑图和物理拓扑图,拓扑以GIS为基础平台进行展示,对于系统运行时的异常表现可以进行预前警告,从而为解决故障和系统性能优化提供分析的依据。
网络运维监控:对拓扑、故障、性能、配置和流量进行管理。自动、准确监视并报告网络的实时的运行情况;提供网络性能和运行状态的多层次分析与数据统计。
网络流量监控:通过接收网络设备发送的数据进行分析,保存并且展示当前网络流量组成和流量分布状态的网络流量分析系统。
业务应用系统监控:它可以对网络中的服务器、数据库、网络设备、安全产品,中间件、公共应用、存储备份系统、IT环境系统进行监控。
安全设备监控:对硬件监控通过SNMP协议采集设备基本信息,状态信息,性能信息和告警信息。对于软件系统,运维管理平台采用WebService接口采集基本信息,状态信息,性能信息和告警信息。
机房动力环境监控:采用全网嵌入式IP化的监控模式,实时监测机房环境的各项指标,遇到机房停电、电源故障、空调运行异常、环境温度过高、空调停机和漏水等紧急意外情况,它能够及时记录、查询和自动快速报警。可以在计算机屏幕上看到监控点的图形,掌握监控点的信息,提高机房的可靠运行能力,提高机房的日常维护效率。
视频质量分析:在运维平台监控前端视频运行状况的基础上,对视频图像出现的雪花、滚屏、模糊、画面的冻结、视频信号丢失增益失衡、等常见摄像头故障、、视频质量下降、视频信号干扰可以进行准确的分析、快速的判断和报警。平台会按照诊断预案自动对摄像头进行检测,并能记录所有的检测结果。视频质量诊断系统与运维系统之间通过服务接口(WebService)交互,视频质量诊断系统分析出某一路视频质量出问题后,将该路视频的告警情况,通过接口反馈到运维系统,运维系统接收到告警后,一方面触发后续的运维流程,另一方面,运维系统中的基于地理信息系统(GIS)的空间可视化运维模块也能感知到,并显示相应告警。
3.3 统一事件管理
事件流程是运维管理的核心流程,事件是内部各种信息的汇合中心,可以让管理人员对各个业务系统的实时事件信息进行综合管理,依据管理的需要进行信息过滤、事件关联分析和处理,将汇总的信息分发给负责的管理员,并提供实时的事件监控界面。实现统一告警系统、自动压缩事件能力、短暂态相关性分析、事件自动关联能力、合理的权限设定、方便的查询和展示方式、事件的自动通知、专家知识建议和处理事件风暴的能力。
3.4 第三方系统接入管理
针对第三方系统进行集成来增强系统监测能力和管理能力, IT运维管理系统提供的数据采集层提供了采集协议扩展接口和告警收集接口两方面的集成,具有和其他第三方系统底层采集集成的能力,数据采集集成采用SNMP转发获取对象的采集数据和对接嵌入导入。
3.5 运维服务流程管理
值班服务台管理:服务台是建立运维人员与用户之间的单一方向的联系点,统一受理用户的咨询、服务请求、故障报修、意见投诉等情况,并通过底层监控系统主动预警平台故障,通过突发事件管理流程来及时处理,及时跟踪和通报处理进展情况,借助知识库和以往事件的解决方案,解决绝大部分的常规事件。
故障管理:在最短的时间内解决事件和恢复IT服务运作,提高事件解决和故障恢复速度,尽量避免或减少事件对客户造成影响,解决用户的突发事件。
问题管理:问题管理就是要找到故障的根本原因、设计解决方案、排除隐患,寻根究底,彻底解决IT隐患根源,其目的是保持IT环境的稳定。
变更管理:它主要是实现变更管理流程的管理功能的模块。通常完成一个变更生命周期的管理,包括事件的申请、变更的审批、变更的计划和测试、变更的实施、变更的回顾和变更的关闭等等,为ITSM变更流程建设提供牢靠的技术支撑。
巡检管理:对生产系统的日常运行维护工作进行管理,规范日常作业计划、规范日常作业内容、规范维护人员的维护行为、为人员考核提供基础数据。
组织机构管理:组织机构是特定结构、分工协作的团队,也是业务分工、权限控制的基础。组织机构以职责、权限的形式定义内部成员、组织各个部门的作用与任务。
流程管理,它具备事件管理、变更管理、问题管理、巡检管理、组织机构管理、运维考核管理、日常运作管理、知识库以及自助服务等等功能,将人员、技术和流程结合起来,将监控、管理和考核结合起来,从而提升整体的运维管理能力。
知识库管理:统一知识库贯穿于平台的各个层次,包含采集、分析、运维知识库等,同时也包括信息内容、专家技能、标准规范、考核指标等内容。通过知识库的建设可以降低对个人依赖,实现运行知识库的有效共享和高效平台管理能力。
日常运作管理:对维护规程和管理办法中周期性或非周期性的维护作业计划等任务的集成,使得运维人员能够准确高效的完成作业计划的制定、审核、管理、执行与监控、查询统计以及设备维护管理等内容。
运行发布平台:对监控的所有资源的运行情况、资源性能、故障信息、当前和历史运行情况,进行查询并生成各种报表,按照日报、月报的形式集中统一的展现。
4 结束语
本文在社会治安数字视频监控系统建设的背景下,提出了一种基于GIS系统的运维管理平台的解决方案,解决对大数字平台各类资源的管理,系统运行维护的调度、考核和汇报,通过SNMP、CORBA和Web Service几项关键应用技术,搭建合理的平台架构,实现系统需求功能并在GIS地图上展现的运维管理平台。
参考文献:
[1] 纪文成. 智能化网络运维管理平台的研究与实现[J]. 信息与电脑: 理论版, 2011(7): 26-30.
[2] 沈志强. 智能网络运维监控系统[J]. 网络安全技术与应用, 2013(11): 40-47.