开展数据挖掘,提升动力环境监控效能
2014-05-10施建荣
施建荣,何 霞
(1.中国移动江苏公司南通分公司,江苏 南通226007;2.中国移动江苏公司,江苏 南京210020)
1 概 述
随着2013年12月5日4G牌照的发放,中国移动通信已正式跨进4G时代,GSM(2G)、TD(3G)、TD-LTE(4G)、WLAN四网协同运营已促使通信网的网络监控管理系统(简称网管网)具备了大数据特质,而动力环境监控系统直接服务于这个庞大通信网。
大数据泛指巨量的数据集,因可从中挖掘出有价值的信息而受到重视。麦肯锡公司的报告指出数据是一种生产资料,大数据是下一个创新、竞争、生产力提高的前沿。在开发利用大数据背景下,挖掘动环监控数据、用好动环监控平台既是动环监控的机遇,也是不可回避的新挑战。
动力环境监控系统是采用数据采集技术,计算机技术和网络技术,实现对动力电源供电设备的运行情况及机房环境状况进行监控的平台。其中数据的及时性和准确性是数据采集的前提,这也是对监控系统最基本的功能要求。而目前的运行维护工作往往只强调及时性,而忽视了准确性。随着4G时代的到来,网络设备成倍增加,产生的数据也越来越多,如何保证并提高海量数据的准确性越来越引起人们的重视。此外很多重要的基础数据,如网络运行数据、告警、基站节点的电压、电流、温度,通信机房节能减排数据等,基本上都是从“动环”系统获取,如果这些数据的真实性、准确性都得不到保证,那么设备运行的数据监测与数据分析也就失去了意义。准确获取原始数据的重要性可见一斑。
2 研究现状与问题分析
动力环境监控系统针对各种通讯局站的电源设备特点和工作环境,对局站内的通信电源、蓄电池、UPS、发电机、智能空调等智能、非智能设备以及温湿度、烟雾、水浸、门禁等环境实现“五遥”功能:遥测、遥信、遥控、遥调、遥视。这些功能的实现都与数据采集密切相关。
真实可靠和实时的数据是维护工作的灵魂,管理工作的基础,是维护人员进行预防性维护和系统安全决策必不可少的依据。
当前运营商后端系统的数据主要有故障告警数据、实时运行数据等,本文选取动力环境监控中较重要,问题也比较明显的两种数据(告警数据和智能电表数据)来进行研究、分析。
告警数据主要包含以下几方面:(1)设备故障告警,如:电源模块告警。(2)环境异常告警,如:水浸告警、高温告警。(3)电源供电情况告警,如:停电、低压告警等。动力环境监控系统根据告警信息,派专业维护队伍到现场处理,并依据实时数据对基站动力设备进行远程开关和运行参数设置调整。可见,如果告警数据出现错误,维护工作将失去正确的方向。
2.1 告警数据未能反映真实情况
以图1中如皋基站告警量最大的“电池单体{0}电压低告警”为例,一天的低压告警就达到73次。
实际情况,在对这些电压低的电池进行现场核查工作后表明,很多其实不是电池本身的问题,而是电池监控采集线或者连接辅件含紧固件接触不良(压接不紧或者接触氧化)等问题,导致监控采集的数据缺乏准确性。
图1 如皋分公司基站告警量排名统计表
图2中,电池单体电压告警数量相比较其他告警,数量非常大,仅低压告警就高达1 123次,有的基站中电池告警占到总告警的56%。而这些数据是不是真实信息的反映?通过对现状的梳理、分析,结果发现这些告警信息只会将维护工作带入歧途。因此,告警关联的准确性急需改善。
图2 按设备种类标准告警统计表
2.2 智能电表数据不准确的问题
智能电表数据常常不准确。通过日常数据分析,有的数据偏大,有的数据偏小,有的电表甚至没有数据。结合现场排查,发现智能电表数据不准确带来数据采集准确性不够是基站维护工作中的常见问题。
图3 分公司全网智能电表数据匹配统计占比
从图3可以看出,匹配不成功率高达54%,经现场核查发现一般存在以下几个问题:
a.各相电压、电流采集线缆对应关系错位。
b.PT或者CT设置错误。
c.电流采集线进出反向。
动环监测系统中智能电表监测系统常出现的状况:
(1)监测中断,无数据
监控中断的情况如图4所示。
图4 智能电表检测中断
(2)数据不合理,无告警
图5所示为数据不合理却无告警的情况。
图5 三相电流明显不平衡,A相电流为0
下面以南通分公司各个基站和节点的三相电流为例:以下数据为对照动环整理所得,由于数据太多,取几组典型数据加以分析,如表1所示。
表1 各站点三相电流监测记录表
表1为南通市2181个站点中,列举的具有典型意义的站点数据。
表2为南通移动分公司各站点智能电表故障比(三相电流监测)汇总表。
表2 各站点智能电表故障比(三相电流监测)汇总表
表2中的电表故障包括:
(1)监测中断,没有任何数据值。
(2)监测未中断,但数据值缺失,读数为0。
(3)无法正确显示设备工作状态。
(4)设备数值非实时数据,严重滞后。
对于明显不合理的数据,比如三相电流数据均有,而且偏差均在合理范围之内,但是都是很小的数据,明显和实际情况不符合的,因所设计三相电流平衡算法并未考虑此种情况,故表2中并未纳入统计,具体算法会在下文中阐述。
表2中,全市的电表故障率平均达到了13.76%,个别故障率比较高的县市达到了20%,如果统计进不合理的数值较小的节点,故障率将会进一步增大,较高的电表故障率将直接导致采集到的数据准确性大大降低,其结果就是坐在动环监控系统前的工作人员不能做出及时、准确、有效的判断,给动环维护工作埋下了隐患。通过分析,我们开展了为期3个月的基站动环监控可用率专项整治活动,通过整治,可用率稳定在98%以上。
3 结论与解决措施
通过对上述情况和数据进行分析,可以清楚的得出,动环告警量大,数据准确性不高,除了真正因为被监控设备工作状态以及数据异常外,很多情况是由于诸如设备安装不到位、网络传输故障、器件的维护与校对工作不及时,监测仪器质量问题等原因造成的。
数据的真实性离不开系统的稳定性,系统的稳定性又离不开工程前期的安装质量与日常维护工作,实时的数据采集如果没有稳定的传输支持,维护部门的各项预防决策也就无从下达,原始数据准确性的缺失将导致维护人员搞不清设备运行的真实情况,进而做出错位的决策方案。针对以上原因分析,提出以下几点解决措施:
3.1 器件选择把关要严
互感器的精度与质量参差不齐,容易导致一些基站,节点现场电表计量不准,使用效果不理想。针对有的监控平台不能在同一时刻采集到所有的测试数据,这就要求仪表具有冻结存储一定时间的数据的功能。
要严把器件质量关,从公司利益出发购买稳定可靠,符合技术要求,又符合部门需求的产品。对供应商的产品、服务进行评审,参照评审结果选择供应商。
3.2 施工监察要到位
通信机房的配电设计总是按照最大用电量并留足余量来进行开关大小配置的。而在建设时,现场人员会对照开关容量来选配电表的互感器,容易出现配置容量过大,从而导致互感器精度下降。互感器安装过程中,某些互感器的负载能力比较弱,互感器与仪表间引线过长、线径较细、线阻过大等都会影响数据的准确性。
施工过程中要规范施工,加强对施工人员的培训,树立“示范站”进行推广。提高器件的集成化程度,减少现在按照环节。
此外,针对后续发展情况,施工设计时要有一定的前瞻性,为将来可能增加的设备留足空间与通讯口。
3.3 通讯及接口稳定性要保证,维护要及时到位
很多传感器的工作环境非常恶劣,会发生偏差、精度退化甚至完全失效等故障,而且传感器都在低端、数量巨大、维护周期又长、需要投入大量的人力物力,为此要增加专业的维护人员,提高维护人员的素质,加强分析和管控的能力。
中国移动江苏公司在网络一体化维护解决模式上进行了试点、研究,并稳步推进,促进了代维工作的提升,提高了网络满意度。
3.4 提高数据处理与分析能力
“世界的本质是数据”。动环系统的数据量巨大,以江苏移动为例,目前已运行基站达2万多个,监控点在20万以上,每天原始告警量10万条以上,模拟量的存储,数据库的读写记录在200万条以上,而且随着各类动力及环境设备的陆续接入,数据量成倍增加。
4G组网时代,面对巨大的数据,可以采取“故障数据优先上传,运行数据定时上传,实时数据应答查询上传”的方针。同时提出合理的数据处理算法,加强数据的分析能力,提高数据敏感度,有效区分有效数据与无效数据。
通过大量的动环数据分析,可以得出一些对工作具有指导性的结论。我们在处理一些小型汽油发动机的故障中,统计发现小型发电机组压控电路损坏的情况占了较大比率。通过小油机故障发生时间再对应到所保障站点的交流负荷分析,发现因基站负载严重不平衡导致小型发电机组压控电路损坏的几率增大。我们就通过特定的数据筛选,将三相严重不平衡的基站列出,通知代维人员进行整改。
下面以南通市2181个站点三相电流的数据分析为例说明。
三相电流的理想状况是三者数值相差不大,保持在合理偏差范围之内,而实际电表监检测到的数据确实各种情况都有,那么运用合理的算法,有效的区分出三相电流是否平衡,进而指导动力维护工作就具有相当大的意义。
设检测到的三相电流分别为IA,IB,IC,三者平均值为IP,出一个具体的简单区分算法:
If MAX≥30% 三相电流不平衡;
Else三相电流平衡;举例如下:
分析:MAX=9%,区分效果显著,三相数据差距不大,在合理范围之内即为平衡。
分析整个南通市2181组三相电流数据,发现通过此算法可以有效判别三相电流是否平衡,表3为南通移动各站点三相电流不平衡比汇总表。
表3 南通移动各站点三相电流不平衡比汇总表
通过表3可以发现,各站点统计下来整体的三相电流不平衡比还是比较大的,具体到各个县(市),海门的三相电流不平衡比最高,达到了62.5%,如皋的情况最好48.45%,这些数据也从一个角度客观反应了各县(市)维护工作的好坏,得到了动环监控系统工程师的佐证:如皋的维护工作做得确实比较好。对于数据较差的县(市),以后维护工作就需要相应的加强。通过下发整改工单,布置专项治理工作,调整基站整流模块实现各相相对平衡。一个阶段后再通过动环监控系统数据分析对比,跟踪整改进展,通过督办等落实考评,实现闭环管理。
4 结束语
动力和传输组成的基础网是整个通信运营网络的根基,维护质量是企业发展的重要保障。随着大数据时代的到来,动力配套系统的维护作为一项点多面广且长期的基础性维护工作,更离不开动环监控系统所提供的海量数据来支撑、指导。切实提高动环监控数据的准确率,做好数据分析与数据挖掘工作对提升维护工作具有十分重要的意义。