通信运维监测分析系统的探究
2018-07-10叶水勇聂立莎王菊红王文林宋浩杰
张 弛,叶水勇,叶 云,聂立莎,王菊红,王文林,宋浩杰
(国网黄山供电公司,安徽 黄山 245000)
0 引言
随着特高压骨干网络的建设、智能电网的发展以及“两个替代”战略的实施,电力通信技术在电网生产与发展中的支撑作用显得愈发重要[1]。面对新形势,推进通信资源优化配置能力、提升业务管理和保障能力、加快智能通信运维监测分析服务系统建设显得尤为重要。而原有的通信运维监测系统的数据来源和管理对象,却分散在各个地市公司,原有分层分级的建设模式使得各地市公司存在着设备品牌集约化程度低、采购建设成本高、网络建设水平参差不齐等问题。省、地之间通信运维监测系统的建设、管理各自独立,厂家品牌集约化水平较低,给省公司集中管理带来给通信管理系统的接入与管理带来很大困难。
为贯彻国网信通部通信运维数据管理及各项指示,切实提高网省公司整体通信管理运维水平,需要将通信运维数据管理深化分解到各个地市公司,形成省公司、地市公司两级运维数据管理,在体现全省通信管理运维整体水平的同时,能够深入到每个地市进行具体分析和横向对比,在省内形成运维数据的逐级计算与展示。系统的设计目标是能够将省公司整体运维数据分解为地市运维数据进行填报计算和展示,能够对省内各地市运维数据进行分析,需要提供地市向省公司提出运维数据反馈的途径,能够对全省地市历史运维数据进行回溯查询[2-3]。通过安徽公司通信管理系统运维监测分析服务系统建设,及时了解本单位运维数据的当前数值以及存在问题,并进行高级监测分析,从而更好地按照国网信通部的统一部署完成各项工作。
1 系统总体架构设计
1.1 软件架构的设计
通信管理系统软件总体架构设计模式分为4层,系统软件架构如图1所示。
图1 系统软件架构图
1.1.1 基础层
系统的基础层通常是采用成熟的Weblogic/Tomcat中间件进行软件部署,数据库通常是采用高可靠性的商用关系型Oracle数据库,系统通常在Linux、Unix、Windows下运行。
1.1.2 标准层
系统通常采用J2EE框架进行部署,通过利用MVC 模式在 Flex、Hibernate、Struts、Spring 等框架之间的互相调用,完成系统整体技术框架的构建。
1.1.3 功能层
系统功能层包括任务调度服务、文件传输服务、数据计算服务、数据采集服务、数据总线服务、数据分析服务、数据标准化服务、工作流服务、报表服务、图形服务、网站服务、权限服务、自监视服务等[4]。
1.1.4 访问层
系统主要通过Web浏览器访问,提供各类 Web应用,同时部分功能采用应用客户端的方式访问。
1.2 技术架构的设计
系统是采用面向服务的架构进行部署,其中服务端是采用Java技术进行部署,客户端是采用基于JavaScript/HTML/Flex 等 B /S 技术进行展示[5-6]。 系统将基于公司系统的一体化平台进行构建,并与外部系统实现横向集成。系统由管理应用层、平台层、数据采集和网络控制层组成,其技术架构如图2所示。
1)数据采集和网络控制层:主要由智能控制系统、数据采集系统及各种下层系统(如动力环境监控、设备网管、其他数据采集系统)等组成[7-8]。其中动力环境监控是由视频监控、机房环境监控、门禁监控及电源监视系统组成;设备网管是由传输网管、数据网管、光缆监测、交换网管等组成;其他数据采集系统是由电话测试、配线架监控等组成。
2)平台层:主要由系统管理、报表管理、数据存储、数据建模、数据互联、流程引擎、安全管理、图形引擎、服务总线等模块组成,该基础软件平台通过提供常用的管理工具使上层应用软件功能的开发变得越来越简单。
3)管理应用层:主要由运行管理、资源管理、实时监视三部分组成,实现通信专业各类业务系统的应用功能模块可以集中呈现。
4)分层架构各层间的对外接口主要由横向接口、纵向接口、北向接口、数据采集单元接口组成。
2 系统平台实现功能
权限管理:基础平台提供不同层面、不同粒度的安全控制手段,以满足业务多样化的权限控制要求。
业务流程:平台可动态定义业务过程并控制其运行的业务流程,以满足运行管理类工单的应用需求。
系统自管理:基础平台提供对系统资源的监视功能,实现对系统内各类主机运行状态、后台服务、数据库、网络通道等的统一监视、管理。同时平台提供基于浏览器的、面向管理员的系统全局管理和监视界面。
报表管理:平台提供可动态定义、多种展现方式的报表系统,以满足企业日常报表生成需求。
数据加工引擎:负责加工处理系统的实时、历史数据,对网管系统中的各类数据进行统计分析加工。通过解析公式化的加工规则,实现基于公式解析的数据加工服务。将各类数据的分析和加工形象化和可配置化管理。
告警分析引擎:负责对输入告警流进行高效的模型匹配、规则计算、状态及计数计算等分析加工,生成系统标准化告警结果集合,在实时数据库中维护告警结果数据断面,并提供外部接口实时输出告警结果和实时资源告警状态信息。
消息总线:消息总线主要包括消息总线安全接入、消息总线访问组件、消息总线配置、消息总线监控等功能。基于消息总线,系统间可以松耦合集成。消息总线提供标准协议支持,包括JMS1.1/1.2。
3 关键技术
3.1 基于HTTP协议的远程过程调用
传统远程过程调用的方式有RMI、WebService两种方式,RMI方式存在无法穿透防火墙以及无法利用 F5部署负载均衡策略的缺陷,WebService服务的远程过程调用因为需要解析、验证大量的 XML报文而存在性能瓶颈。TMS(Transportation Manage ment System)系统通过基于HTTP协议的轻量级远程过程调用,采用传输Java对象序列化的二进制编码的方式,充分利用了Java远程对象动态代理技术,既保证了数据传输的性能,又能保证通讯不会因为网络设备端口限制而受到干扰。在实际的应用过程中,TMS系统将远程调用服务绑定在成熟而稳定的轻量级Web容器Jetty中,客户端通过HTTP协议从Web服务器上获取远程过程调用的结果。考虑到在系统中远程过程调用的频率较高,为避免网络连接的频繁创建而浪费系统资源,HTTP远程过程调用客户端程序中内置了线程池来保持网络连接,充分利用网络资源进行高效数据通信[9-10]。
3.2 基于JMX技术的系统外部监测
通过JMX技术开发,实现TMS系统各服务的状态监视功能。监测服务包括了网站服务、实时数据库、告警接收、业务分析处理服务;监测关键指标包括CPU使用率、内存使用率、活动线程数、业务服务活动状态。保证了业务应用在异常状态下早发现、早维护,提高了TMS系统作为生产系统的高可用性与高维护性。
4 实施方案
4.1 系统架构的部署实施
系统采用总部、省两级的部署模式,在总部、省、地市三级进行应用部署的物理架构。跨省、跨区的通信网管理系统集中部署在国网信通公司及各区域分部,骨干通信网管理系统则集中部署在省公司内部,地市公司人员则通过远程终端来使用省级部署的通信网管理系统。系统的架构部署如图3所示。
图3 系统架构部署图
各层级系统之间采用标准数据互联接口进行互联[11]。考虑到集中部署的高可靠性要求,通信网管系统架构采用双机双网方式配置。系统内硬件配置按网段划分为数据交互、数据存储、应用服务、人机交互4类。数据交互使用高性能独立采集服务器,保证数据采集的高效与可靠。系统数据采用基于SAN(Storage Area Network)架构存储模式,根据不同业务的应用特性配置到相对应的应用服务器群内进行统一的数据存储。而对个人的工作站则采取统一的安全区配置,这样既可以节省硬件的投资,又可以实现系统界面的统一,从而使系统的资源实现最大化共享。各级系统和设备网管服务器部署时必须配备必要的机房环境,以满足电力二次安全和等级保护的规定。
设备网管的部署应兼顾运行、维护的方便和便于集中管理。由于历史的原因目前设备网管的部署比较乱,各单位应按照《设备网管技术规范》的要求重新部署,骨干网应尽量实现总部(分部)、省公司两级集中,部分网络比较发达的地区也可以在地(市)集中,所有设备网管都必须安排通道接入各层级的数据采集系统。
4.2 安全架构部署实施
系统的安全架构部署如图4所示,各层级的通信管理系统依据安全要求部署于生产控制大区和信息管理大区[12]。通信设备网管系统和与其相关的数据采集系统在生产控制大区进行部署,通信管理系统的其他部分在信息管理大区进行部署;上、下级通信系统之间的互联,与同层级其他系统(SG-OSS、DVS等)之间的互联在信息管理大区进行部署,上、下级之间的通信系统通过部署硬件防火墙来实现网路的逻辑隔离。在生产控制大区与信息管理大区之间通过部署电力系统专用的横向、单向网路安全隔离装置进行安全隔离,隔离的安全级别应接近或达到物理隔离级别。
图4 安全架构部署图
5 结束语
系统2016年9月试运行以来,已多次针对TMS系统告警实时监视、业务数据、工单流程、资源数据等存在问题提供了预告警及解决方案,通过及时系统地了解本省各项数据现状,摸清了各项数据的具体细节与存在问题,对本省历史数据进行回溯查询。为TMS系统建设提供了有力的技术支撑,确保系统的先进性、可靠性、实用性。