通信机房标准化建设思考
2014-04-14孙晨阳
孙晨阳
摘 要:本文结合长江南京通信管理局的通信机房标准化建设工作,主要介绍机房设备和机线整理、运维管理系统建设和远程运维系统建设等内容,为日后通信机房标准化建设提供参考。
关键词:机房 标准化 运维管理
目前,国内多数机房的建设与运维管理比较落后,系统性、可用性、可扩展性不足,虽然维护的是高新技术的通信和计算机设备,但管理思想、管理理念并没有跟随技术的发展而发展,严重影响了机房运维功能的发挥。为推进长江海事通信信息机房标准化建设,进一步规范机房运维管理,加强机房软件建设,改善机房硬件环境,不断提升运维管理水平和通信保障、信息化服务能力,南京通信管理局于2011年1月份开始实施机房标准化建设活动。下面将主要介绍南京局机房标准化建设工作的思考、机房标准化建设的主要内容。
机房标准化建设工作的思考
针对机房运维涉及的机房安全管理、设备运行、综合布线、机房环境等方面可能存在的问题,我们认为,机房标准化建设工作,首先应该按照标准化机房规范要求,认真抓好机房硬件环境方面的整改和设备台帐方面的管理,探索用新技术,提升标准化机房建设实施方案的可行性和合理性,实现改造后运维效率的优化;其次,是运用信息化技术,搭建系统的信息化管理平台,并通过相关工作活动,摸索出适合南京通信管理局特点的综合机房运行维护管理标准和平台,通过对新技术新业务的运用,提高通信运维的综合监管能力。
结合南京通信管理局目前的实际情况,我们重点计划解决以下几个方面的问题:
一是由于近几年通信业务的迅猛发展,南京通信管理局通信机房中设备数量急剧增加,设备排列混杂;机柜高低、颜色差异;电缆布放不规范,各类通信线缆不能分离,相互影响,造成线路日常维护困难,易导致人为障碍等隐患。
二是设备分类、标签缺乏统一规范,设备资料管理混乱,设备上下连接关系、来龙去脉查找困难,不便于设备维护时快速定位。
三是通信业务各类管理制度、操作程序繁、多、杂,查找困难。
四是各设备的随机资料、性能指标、参考说明书、设备维护台帐等设备资料管理混乱,系统性较差,技术人员多数是凭平时的经验积累、凭工作能力(对各种设备熟练掌握)进行维护和故障的判断。
五是通信运维值班的管理,多数仍采取填写纸质台帐,无法对通信数据的管理、统计、业务情况进行适时记录和保存,对业务信息的查询、调用都难以做到快捷、方便、准确,统计分析费时费力。
六是一些通信业务流程涉及多部门,由于部门间各自工作习惯、特点,通常会在执行一段时间后而执行走样。同时纸质工作流程单也存在遗失或涂改,容易造成责任、任务、时间等不清晰的弊端,影响通信服务质量以及通信业务的痕迹化和时效管理。
七是随着通信业务的发展,通信设备的多样化。通信外围站点的接入增多,通信管辖距离往往远离中心机房、管理困难,要求我们能够远程进行设备维护和管理,以提高工作效率,降低通信运维成本。
基于以上的情况,南京局从2011年开始,就着手进行相关工作的研究,落实机房标准化线缆整治、资料整理、管理平台搭建的框架构想,并尝试相关业务、技术的整合。
标准化机房建设的主要内容
南京通信管理局的标准化机房建设分为硬件和软件两个部分,硬件部分主要是对机房设备和机线进行规范整理,达到美观实用;软件方面主要是开发南京局运维管理系统。
1、机房设备和机线整理
南京局对于机房设备和机线整理,主要采取了以下方法:
1.1 机房机柜和设备整治
对机柜进行编号。根据机房机柜摆放布局,将机柜进行分区编号。分成A\B\C\D四个区,每个区的机柜从1开始编号。划分A区和C区为直流设备区,B区和D区为交流设备区,进行交直流设备的分区管理。
1.2 光纤尾纤整理
架设专用的尾纤槽,更换现有尾纤,要求进入同一机柜的尾纤长度统一,尽量减少多余尾纤长度。尾纤进入光配后,将同一机柜或同一方向的尾纤进行分组绑扎,并用软套管保护。机柜内多余的尾纤绕圈绑扎、整齐放置,使得光配整齐、有序。
1.3 网线整理
在走线架上和网络机柜内部使用叠压式网线固线器,使得网线布放美观有序。
增加网线总配线柜,每个机柜安装内部网线配线架,内部网线配线架通过后排网线与总配线柜相连。不同机柜之间设备的网线连接首先接入该机柜内部配线架,再从总配线架上跳向不同机柜。
在接口比较多的网络设备前安装理线器,在理线器内进行横向走线,从理线器的上方出线与网络设备相连。
所有布放的网线和制作的设备内部跳线颜色一致,每根线的水晶头处加塑料保护套,使得每个接头看上去整齐统一。
每根跳线量好所需长度后现场制作,不留多余的长度,这样即便于网线的捆扎,也显得美观。
做好规划,总配线柜和其他每个机柜的配线架都预留一定数量的接口,便于今后新上设备的使用。
1.4 电源线整理
电源电缆按照交、直流电源电缆分开布放、电源电缆和信号线缆分离的原则进行布放和整理。电源线在走线架上走线时布线整齐,避免交叉。机柜内部设备电源线就近与空气开关或接线板相接,走线力争横平竖直。
1.5设备和线缆标签管理
为了便于设备和线缆管理,我们制定了《南京局机柜、设备和线缆标签管理规范》,对设备机柜进行统一分类编号,对机柜标签、设备标签和线缆标签制定了统一的格式,以适应下一步信息化管理的需求。
机柜标签注明该机柜所处的分区和编号,设备标签标注设备编号、名称、型号及维护人,线缆标签上注明线缆的起点和终点,并标注线缆承载的业务。所有标签统一采用标签打印机进行打印,标签纸颜色、大小一致。
2、南京局运维管理系统建设
南京局运维管理系统是针对南京局机房运维值班实际情况进行自主研发的管理平台,其中包含了规章制度、电子手册、值班动态、电子工单、统计分析、机房信息、环境和设备监控、远程运维系统等功能模块。
规章制度模块是将涉及到机房管理相关规章制度进行总结和分类,并提供添加和更新功能,以便在日后规章制度修订后能及时更新。电子维护手册是将通信维护手册以电子书的形式存储在服务器中,查询简单,管理方便。
值班动态模块是采用电子方式存储当班人员业务处理的所有原始记录,包括记录时间、记录人、详细业务处理过程,实现日志电子化和有痕管理,提高工作效率。
电子工单是将运维人员的业务办理、故障处理等流程实现网络处理,并可以采用自动生成短信的形式,将工单信息实时发送至业务人员的手机中,实现快速响应,减少故障处理时间。
统计分析是在值班日志的基础上,运用数据库强大的计算存储功能,对相应的数据进行统计和分析,得到月报表或者相应时间段的报表等。
机房信息模块主要通过信息化工具,将设备以图片或者其他友好的界面展示出来,并显示其详细信息。并通过设备端口信息的设置,将各个设备之间的电路链接起来,实现设备和登陆资料的直观显示。
机房环境和设备监控主要对机房环境和设备运行状态进行监控,主要包括四种监控方式:①通过传感器对各个机房温度、湿度、烟雾、配电的开关状态、漏水等环境数据进行采集。②对于已经掌握设备网管接口协议的设备,由监控主机直接通过设备网管接口进行信息解析,实现对设备的监控。③对于不知道设备网管接口协议的设备,通过在设备指示灯上位置安装光敏传感器,将指示灯的亮灭状态数据传送给监控主机,实现对设备的监控。④对重要的网络电路,通过监控主机对对端网络设备的IP地址进行定时扫描,以监控网络电路的畅通。
将监控数据汇聚到中心机房监控主机后进行数据处理,最终在运维管理系统页面上显示各个机房的环境和设备信息。在被监测对象报警时,还可通过短信形式向管理员发送报警信息,以及时进行相关处理。
远程运维系统是在通信设备于晚间、休息日发生故障,当班技术人员无能力及时修复故障设备,专业系统维护人员又不能在第一时间赶到设备故障现场情况下,利用互联网路由器支持的VPN(虚拟专用网络)功能,使不在现场的维护人员远程连接至单位的内部网络系统,从而登陆各通信和网络设备的网管系统,及时进行业务和故障处理,提高维护效率。
结束语
通过机房标准化建设,我们得到了以下的经验和体会:①机房的技术人员熟悉了业务,提高了技术水平,锻炼了运维队伍精益求精的工作作风。②规范了机柜、设备和线缆的规格和标准。③制定了《南京局机柜、设备和线缆标签管理规范》,并建立了设备和机线维护基础资料,使资料查询方便快捷。④结合有南京通信运维生产的个性化需求,也同时考虑了长江通信运维的普遍性规律,开发了南京局运维管理系统。该系统的建设,既提高了运维管理工作的效率,降低了运维成本,更加锻炼了我们的技术开发队伍。⑤运维管理系统采用有痕化的信息管理,提高了运维人员的工作自觉性和责任意识,填写台帐更加细致认真,业务处理的信息更加及时和真实。分管领导可以通过运维管理系统适时发现、掌握、分析业务情况,及时解决生产中存在的问题,为提高通信服务质量和通信业务管理水平提供了技术上的支撑和保障。⑥运维管理系统网络化的电子界面不但友好、易于操作,而且伴随有海量的业务数据输入、保存,为我们实时进行查询、分析、挖掘这些业务数据提供了技术支持,更为今后的通信业务发展提供了便利。
通过全面推进机房化,我们制定了机房运维标准,完善了运维工作机制,机房环境明显改善,基本实现“管理规范、标准统一、维护便捷、保障有力”的目标。下一步,我们将针对机房运维管理标准化进行研究,不断提升运维管理水平和通信信息服务能力。