基于电力通信传输网大数据的温度监测系统研究
2016-04-11王彦波王云烨
贺 琛,王彦波,王云烨
(国网浙江省电力公司信息通信分公司,杭州 310007)
基于电力通信传输网大数据的温度监测系统研究
贺 琛,王彦波,王云烨
(国网浙江省电力公司信息通信分公司,杭州 310007)
介绍了大数据的定义及特点,分析了传统温度监测技术的不足之处,开发了基于电力通信传输网大数据的机房温度监测系统,阐述了该系统4个功能模块的实现方法和条件。该系统的对温度变化反应更加灵敏,能提前发现温度异常现象,降低通信机房安全事故等级,提高系统安全性。
大数据;电力通信传输网;温度监测
1 背景分析
2010年,全球数据量跨入了ZB时代,据IDC(中国互联网数据中心)预测,到2020年全球将拥有35ZB的数据量,海量数据将实时影响着人们的工作、生活,甚至是国家经济和社会发展。大数据具有数据量巨大、数据类型多样、流动速度快和价值密度低的特点,大数据技术为人们分析问题和解决问题提供了新的思路和方法,对其研究渐渐成为热点。
对电力行业而言,随着坚强智能电网的建设及“三集五大”管理体系的决策部署,对数据的管理、共享及互操作提出了更高的要求。面对正在形成的大数据环境,需要不断挖掘业务数据处理的潜在需求,探索适用于电力数据的理论和方法,使电力通信系统运维的外延向数据运维的范畴进一步拓展,以更好地适应数据量的迅速增长、数据类型的多样化和数据时效性的不断提高。
机房里部署着国家电网通信业务的主要基础设施,机房里设备温度过高会引起通信工作异常,传输误码率上升,严重时甚至导致通道中断。现有的机房温度监控主要依靠动力环境监控系统,但不同厂家的动力环境监控系统,其接口开放程度参差不齐、监管主体不统一。因此可以通过设置通信机房动力环境温度检测门限的方法进行报警,这就要考虑到监测点与通信设备距离远近对温度误差大小的影响,若门限设置太高达不到检测效果,若门限设置太低容易造成误告警,温度告警的准确率较难控制。
2 大数据的概念及特点
大数据也称巨量数据或海量数据,麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合。
大数据具有5个主要特点(即5V特征):
(1)Volume(大量)。数据规模从TB级别跃升到PB级别,1 PB=1 024 TB=1 048 576 GB,数据量的大小决定了所考虑数据的价值和潜在信息。
(2)Variety(多样性)。数据的种类和来源多样化,包括结构化、非结构化、语音、文本、视频等各种类型。
(3)Velocity(高速)。指获得数据的速度快,对数据处理的及时性要求高,能实现秒级的简单查询以及小时级的复杂分析。
(4)Value(价值)。数据的价值密度较低,在海量数据中,真正有用的可能只是很小一部分,因此数据的质量也是价值的关键。
(5)Variability(可变性)。由于实时数据时刻在发生变化,受影响的因素也多种多样,这就妨碍了处理和有效管理数据的过程。
由电力通信传输设备组成的电力通信传输网(简称通信传输网)具有覆盖面广、大带宽、标准化、数量和种类多、功能多样的特点,因此,在电力行业中得到广泛应用。通信传输网承担着包括电网调度生产业务和公司管理业务在内的几乎所有业务信息的通信传输重任,作为信息传递的神经网络,覆盖了各级调度生产办公大楼、各电压等级的变电站、营业厅、供电营业所等场所。以浙江电网的传输网为例,目前SDH(同步数字体系)光传输网元就有5 000多台,算上OTN(光传送网)、波分、PTN(分组传送网)等将更多。
本文从通信传输网的海量数据中提取设备温度参数,通过大数据的分析方法,对温度异常情况进行分析,尽早发现异常情况,实现对设备的监视和机房温度的预警功能。
3 机房温度监测系统应用现状
3.1 基于温度直采系统的温度监测系统
利用机房或机柜上安装的温度采集传感器和单片机[1],或者由微机和工控机[2]直接测量温度,通过专用网络收集采集数据并上传至服务器,开发专用的温度监测软件,实现温度的监测。这种方式采集到的机房或者机柜温度与设备实际的温度相差较大;另外,由于前端硬件品牌众多,协议标准化不够,开发和运维的成本高。
3.2 基于动力环境系统的温度监测系统
利用环境动力监测系统,通过智能环境采集接口模块实现对机房温度、湿度、烟雾、水浸、非法入侵等环境量的采集及处理,将现场环境数据及时传输到控制中心,并为故障分析记录可靠的数据[3]。这种方法存在温度偏差大、数据可挖掘性弱、协议接口开发复杂等问题。
3.3 基于通信传输网大数据的温度监测系统
通过靠近通信传输设备自带的集成测温模块,从专业通信网管的海量数据中提取出温度参量,经过温度数据采集、模型归一化、数据分析以及功能呈现等部分,实现对历史数据的分析和预警。这种方法直接采集设备板卡温度,采集温度偏差较小;记录历史数据,结合算法分析温度变化趋势;利用传输网络已有的DCC(数据通信通道),采用统一的标准化协议。
基于通信传输网的大数据温度监测系统,结合了大数据的处理方式,采用大数据算法,具有数据可挖掘性强、成本低、推广性较好等特点,是本文探讨的重点。
4 基于通信传输网大数据的温度监测系统
基于通信传输网大数据的温度监测系统包括数据采集、模型归一化、数据分析以及功能呈现4大模块,其软件架构见图1,可以实现从通信网管的海量数据中提取出温度参量。
图1 基于通信传输网的大数据分析软件架构
4.1 数据采集模块
网管省地县一体化为实现基础数据的全面采集提供了技术支撑,具体体现在以下4个方面:
(1)各品牌各技术体制的通信传输网,如MSTP(多业务传送平台)、SDH等,可以通过各网关网元和DCN(数据通信网络),实现分散在各地县的网元的接入和控制,能够从网络获取需要的采集信息。
(2)省级网管中心已经实现了各传输品牌网管服务器的集中安装和配置。
(3)各传输品牌网管服务器实现了数据库的部署。
(4)网管中心安装了专门的采集服务器及采集软件,各品牌通信传输网管服务器按照CORBA(通用对象请求代理体系结构)接口的开发和对接,采集服务器获取5 000多台设备的海量温度数据。
具体的系统拓扑架构如图2所示。一体化系统示意图如图3所示。
图2 温度监测系统的网络架构
4.2 元数据模型管理模块
该模块主要完成指标管理及指标自定义。通过数据归一化处理,针对不同厂家建立统一的模型库,为数据库处理及上层报表呈现提供服务。针对不同厂家提供的海量网管信息,提取出有用的时间和温度等信息,并实现数据模型的归一。
采集服务器不仅实现了海量数据的采集,而且多种模型的归一整理和统一数据库的建立,还实现了大数据的统一备份。
4.3 数据分析模块
(1)分析流程的设计。根据实际情况,通过软件设定采样的频率和起止时间,实现定期采样。
(2)采用大数据分析的ARMA模型进行模拟,针对每台设备的前期海量温度数据预处理检验,建立预测模型。
(3)预设规则库。设置机房正常温度(如15~ 25℃),同时考虑到季节偏差量加入偏差因子。如夏季温度较高,适当提高温度补偿因子,提高阈值;冬季总体温度较低,适当降低温度补偿因子,降低阈值。同时,温度补偿因子采用温度反馈调整,根据前后10 d的温度,动态缓慢调整阈值参数,具有一定的连续性。
(4)规则属性设置。当测试的结果连续几天偏离正常阈值,而且有进一步加大的趋势,虽然还没有达到设备告警门限,但需要引起足够的重视,此时就需要筛选出网元,并对网元进行重点关注和分析。通过调取多维数据进行比对,如果发现所有的设备均呈现出相同的温度变化趋势,说明机房的温度出现了问题,那么整个机房的空调、散热系统可能出现了问题,进而可能威胁到机房内其他的设备或者系统,某些对温度变化敏感的服务器可能会先出现告警或者宕机现象。
4.4 综合展现模块
图3 通信传输网一体化系统示意
(1)报表自定义功能。
具有各类分析图文报表的定义、生成、发布、查看功能,实现网络报表的综合化与自动化。能够生成网络运行质量周报、综合分析月报等网络业务报告(支持Word、Excel、PowerPoint格式)。通过多维分析,基于统一数据模型的灵活查看分析,使数据分析人员从多种可能的观察角度进行快速、一致和交互性存取,来获得对信息的深入理解。支持对比分析、分布分析、同比分析、环比分析、趋势分析、象限分析等多种分析模式。
(2)即席结果查询。可以针对网元、品牌系统、机房和地区进行统计分析,并以表格和图形的形式输出(如图4)。
(3)自定义模板。根据用户需求,提取有用的数据,针对温度排名前10、温度升高前10、某品牌设备运行情况等问题进行定制模板的开发。
5 系统实施效果分析
相比于传统的监控和处理方式,基于通信传输网大数据的温度监测系统,对温度变化反应更加灵敏,能提前发现温度异常现象,可以降低变电站、通信机房事故的等级,提高系统安全性。
2015年通过部署基于通信传输网大数据的温度监测系统,实现了全省2 000多个网元的温度采集监控,发现6次温度异常情况,在温度上升到告警温度阶段及时发现异常,并将故障控制在萌芽状态(见图5)。如2015年7月29日14:00,温度监测系统发现双龙变通信传输设备CM_S_193运行温度45℃,温度上升11℃;14:26省检修公司回复确认双龙变机房温度过高,1台空调故障,派人紧急处理;14:34金华公司汇报确认双龙变通信机房有3台空调,其中1台故障,另外2台跳闸未运行,重新启动空调后机房温度逐步恢复正常。
通过基于通信传输网大数据的温度监测系统的开发,实现了全网传输设备网元海量温度参数的收集,通过数据模型化和统一化,利用大数据算法实现温度的预测分析和判断,生成温度实时变化和预测曲线。该系统的开发克服了动力环境品牌众多、接口开放程度参差不齐、监管主体不统一的弊端。相比于动力环境监测等温度采集手段,基于设备板卡温度的测量方法,具有数据更准确、更全面,可进行多维分析,覆盖面更广泛的特点。该系统对温度变化反应更灵敏,能提前发现温度异常现象,降低通信机房安全事故的等级,提高系统安全性。
图4 系统综合展示界面
图5 应用大数据前后温度监测系统的对比
[1]赵陌.一个新型通信机房温度监测系统的设计与实现.山东通信技术[J].2007,27(4):8-14.
[2]盛淼岸.通信机房远程检测监控系统的研究与设计[D].重庆:重庆大学出版社,2002.
[3]雷鸣.广电机房环境动力监测系统简介[J].中国有线电视,2011(11):1317-1318.
(本文编辑:方明霞)
Research on Temperature Monitoring System Based on Big Data of Power Communication Transmission System
HE Chen,WANG Yanbo,WANG Yunye
(State Grid Zhejiang Information&Telecommunication Company Branch,Hangzhou 310007,China)
The definition and characteristics of"big data"are analyzed,and disadvantages of traditional temperature monitoring technology are introduced.A server room temperature monitoring system is developed based on big data of communication transmission system.The implementation and condition of the four function modules of the system are expounded.The system can sensitively respond to temperature changes and can detect temperature abnormality in advance so as to reduce safety risk level of server room and improve system safety.
big data;power communication transmission system;temperature monitoring
TM769
:B
:1007-1881(2016)07-0065-04
2016-04-15
贺 琛 (1983),男,工程师,从事电力通信网络优化、检修工作。