医院网络综合布线故障排查及解决方法
2018-02-09秦新彬王晓奇翁飞龙
秦新彬,王晓奇,翁飞龙
(广东省普宁华侨医院信息中心,广东 普宁 515300)
1 医院网络运维概述
国内大多数网络一般按照组网结构和ip路由和交换的规划,采用由核心层、汇聚层和接入层组成的3层网络结构[1]。
其中核心层负责网络的高速交换,采用高带宽的核心交换机。汇聚层是核心层和网络接入层之间的桥梁中介。接入层的目的则是允许终端用户或设备连接到网络[2]。
医院网络综合布线系统是保障医院网络正常运行的重要基础[3],为保证医院网络综合布线系统的功能和发展需求,确实需要寻找和研究一套效率较高的网络综合布线常见故障排查及解决方法。
2 综合布线故障排查
据不完全统计,在日常网络维护中,医院网络综合布线的故障率约占故障总数的四分之三以上[4]。一旦医院网络出现故障的时候,如何快速准确分析原因,并及时解决,保障网络恢复正常使用呢?这里面既需要运维人员掌握扎实的网络基本理论知识,也更需要运维人员不断地积累经验。通过科学有效的排查方法,实现在尽可能短的时间内和影响最小的范围内恢复网络运行,综合布线故障的排查的确是需要运维人员有一套以网络综合布线系统与施工技术为扎实基础的操作流程和步骤。
2.1 排查步骤和操作流程
2.1.1 观察法
运维人员应该培养良好的运维习惯,无论问题难易繁简,都应该第一时间详细向用户询问故障发生前的操作行为,现场观察用户演示故障,特别要注意并逐项记录好现场的故障现象:包括故障的首次发生的时间、频率、故障的影响程度、是否有动过相关节点或网络[5]。
查看网络维护日志,特别是注意相关的变动设置的信息。通过相关的故障诊断专业硬件设备、网络诊断命令或者信息系统进行收集和获取故障信息[6]。例如,水晶头连接是否牢固;交换机端口状态是否正常,可通过查看交换机端口状态灯或者通过Show Interface命令;查看故障发生前后的时间段内网络监控记录和运行日志。通过观察法收集来的相关故障信息,一一罗列导致故障的各种可能的原因,然后逐项分析排查。
2.1.2 制定并实施解决方案
按照导致故障原因的可能性由大到小,罗列出相应的解决方案。先采用分段法确定在实际综合布线故障点并进行排除,观察网络状态,逐步实施解决对策[7],直到恢复正常,也可以应用结合法、替换法等方法进行,进一步提高故障排除的效率。
2.1.3 完整相关故障排查记录
故障排查过程的每一个更改参数的结果,都应该认真记录在册,搞清楚故障发生的原因的同时,如何避免类似的故障再发生也是运维人员需要认真思考的问题,因此每次拟定相应的对策的同时也应该完善并整理好网管运维日志,造册分类以方便查阅,也有利于运维团队积累相关的经验,避免同样的错误重复发生。
2.2 熟练运用故障诊断排查工具
运用于日常的网络运维综合布线故障排查诊断工具包括:硬件、软件故障排除诊断工具和诊断命令[8]。
2.2.1 硬件故障排除诊断工具
(1)数字万用表、网络测线仪及查线仪:数字万用表在日常运维工作中主要用于测量电气值,包括电流、电压和电阻。正是利用万用表这一特点,网管通常利用其测试故障线路是否存在短路或断路情况,查出双绞线一端接头的第几芯相对应的是另一端接头的第几芯。
网络测线仪是医院网络运维中最常用的,主要应用于测量网络双绞线的端到端是否通、短或开路。技术先进的的网络测线仪采用数字技术,可以针对双绞线电气特性,快速直观地指出故障的节点,直观显示出长度、串绕、短路、跨接、反接等情况方便地存储全部测试结果。
无线网络测试仪是专业性较强的运维工具,它的有点在于能帮助运维人员快速检索无线网络的信号,并评估当前检查的无线网络的相关性能指标[9],包括干扰检测、可用性、利用率、连接情况、有无恶意设备捕获等。
(2)光功率计、数字查线仪、光时域反射仪:在光纤系统中,光功率计的测量是最基本的,而光功率计的作用类似于上面提到的电子学中的万用表,是测量绝对光功率和相对损耗的仪器,是在光缆施工和维护的过程中实用性极高的工具。
数字查线仪,俗称查线仪,是一种可以将数字音频和模拟音频结合在一起的仪器。快速辅助网管确定双绞线在各种环境的准确位置,即使是面对各种繁杂的线路环境或者接入运行网络的故障线缆,都能快速查对。
光时域反射仪(英文名称:Optical Timedomain Reflectometer, OTDR)是通过对测量曲线的分析,了解光纤的均匀性、缺陷、断裂、接头耦合等若干性能的仪器,可用于测量光纤衰减、接头损耗、光纤故障点定位以及了解光纤沿长度的损耗分布情况等,是院内网管技术员维护及监测中必不可少的工具。
2.2.2 软件故障排除工具
SolarWinds、CiscoView等是相对常用的网络管理工具。利用这些工具的故障与性能管理,以简单易用的格式传递运维人员最迫切需要的关键信息,以帮助快速检测、诊断和解决网络问题。
2.2.3 常用的网络诊断命令
通过网络设备厂商提供的各种诊断命令,进行排除故障、检测性能[10]。
Show—&mdash-网络连接状态和IP信息。
Debug—&mdash-查看路由报文和帧信息。
Ping—&mdash-查看网络是否能够连通。
Tracer-oute—&mdash-查看与跟踪路由路径。
3 医院常见案例:网络综合布线系统故障排查及解决
3.1 光纤故障
因为在网络综合布线系统中,光纤一般是作为主干网的传输介质,因此,一旦光纤发生故障,其涉及的故障范围一般较广。其中光缆、跳线、尾纤中断、光纤接头、终端盒受污染等是较为常见的故障[11]。
3.1.1 常见故障之光缆遭到破坏
故障现象:现场观察核心交换机,会发现其对应的下联口和汇聚交换机上联口光纤模块指示灯不亮。医院网络某汇聚交换机所在区域所有用户都无法上网。
原因分析:按照相对规范的故障分析步骤如下:(1)检查并更换SFP光模块,如果问题不能解决,继续分析下一步骤。(2)检查并更换光纤跳线,如果问题依旧不能解决,继续分析下一步骤。(3)检查冗余的两芯光纤,如果网络故障依旧,则以此推断故障出现在核心交换机到汇聚交换机之间的光缆的可能性最大。
解决方案:通过参照故障光缆在铺设时的图纸等资料,实地用光时域反射仪测量故障线路并计算出测试端与故障点之间距离,确定故障的大致位置,巡查准确确认故障点并熔接光缆。
光缆线路设施的架设和维护要实行规范化的管理,对于架空光缆,最好埋设于地下或提高光缆架空高度,保证好直埋线路设施齐全。
3.1.2 常见故障之光纤跳线故障、终端盒故障
光纤跳线故障现象:由于机房改造,更换完某机柜后,出现一些接入层交换机陆陆续续都出现网络连接不稳或者丢包的情况。
原因分析:按照规范的故障分析步骤如下:(1)经诊断命令行反馈数据得知,发生故障的接入层交换机都存在丢包严重的情况,而这些接入层交换机都接入到同一汇聚层交换机,故继续分析下一步骤。(2)使用光功率计测试线路发现光功率偏低。推断故障可能为线路故障,故继续分析下一步骤。(3)巡查线路发现,由于施工过程中,机柜内的跳线束绑扎带过紧,造成跳线变形从而损伤光纤跳线,导致上述现象。重新更换光纤跳线,故障解决。
3.2 网线(双绞线)故障
网线(双绞线)是常见的接入层的传输介质。虽然其故障特点非常容易判断,以单点故障为主,但是导致此类故障的原因比较繁杂,常见的线路中断、电磁干扰、线序错乱、水晶头接触不良,网络模块触电不良等[12]。
3.2.1 网线(双绞线)故障之线路遭受物理破坏
故障现象:医院网络整体运行正常,某个客户端无法连网,经现场观察,虽然信息插座接上网线,但是依然提示网络电缆没有插好。
原因分析:按照规范的故障分析步骤如下:(1)利用网络测线仪检查并更换正常的双绞线跳线,如果故障依旧则继续分析下一步骤。(2)网络测线仪测量检查网络模块到楼层交换机的之间的线路,测线仪显示线路状态为开路,故障发生点应该在此。(3)检查并重新制作网络模块,发现1~2、3~6线对有一条芯显示开路。
解决方案:针对线芯开路的情况,解决方法有2个,应该按照实际情况进行分析并解决。
如果发生断点的地方距离线路两端近,能够比较轻易地找到断点处,可以将断路的的芯线切断,重新分别制作RJ45水晶头,再用网络对接模块直接连接。
假如发生断电的距离较远,考虑到更换单线的难度大并且成本高。在保证断开芯线不多于两对的情况下折中的办法是在两端将完好两对芯线线序优先调整为1-2-3-6,但是这样的解决方法会导致网络传输速率下降为100M,因此这个办法建议只用于网络故障排除解决时效性要求极高的情况。
3.2.2 网线(双绞线)故障之雷击
原因分析:众所周知,雷雨天气容易使得建筑顶层内的相关设备易受到雷击影响而损坏。一些医院早期由于规划不周全等原因的局限,院内的网络综合布线采用的或者是架空式的双绞线级联的布线方式,或者光纤收发器转换的布线方式。
特别是地势较高或者地处雷区的医院,在网络综合布线的设计前期,应该考虑机柜接地和建筑防雷,从而降低设备遭受雷击影响而带来造成收发器、路由器、交换机、网卡等设备损坏的损失。
解决方案:(1)如果建筑间是分开独立,建议将双绞线级联的布线方式直接改造为光纤级联以降低雷击影响。(2)对于用架空双绞线接入终端设备的布线方式,建议改造为金属管穿管并埋地铺设入室。针对个别埋地铺设有困难的情况,双绞线应布设在金属管道内,将光纤收发器代替更换为成光模块,如果考虑经济实用,可以直接将RJ45网络防雷器增设在双绞线(网络线)与收发器之间。
3.2.3 网线(双绞线)故障之电磁干扰
原因分析:随着医院业务发展,院内装修工程时,一些电工在综合布线过程中,遇到需要延长双绞线长度时,直接将两端对应的铜芯一一对应缠绕连接,而又没有进行焊接和外皮的密封处理,这种情况下当遇到附近有强电时就会产生电磁干扰,影响通讯质量。
经验教训:遇到这种情况,一定要按照规范施工,将预留接线处剪断并按标准重新制作网络模块。
3.3 无线网络
近年来,无线网络在医疗行业的场景应用越来越广泛,各种无线设备和产品更新换代。因此,无线网络的故障排除和解决方法越来越受院内信息网络运行人员的重视。医院在运用无线网络过程中常见的故障主要是有两个:信号连接不稳定、连接速度慢[13]。
原因分析:由于实际应用环境不同,造成信号连接不稳定的原因也是多种多样,但总体来说主要是由三方面造成的:无线干扰、参数设置和负荷过载。
(1)请将无线AP远离微波炉、冰箱、洗衣机、空调这样的大功率电器设备,如果附近有干扰源,每隔一段时间就会发出干扰信号,无线网络的信号其实很容易被干扰;(2)检查客户端电脑设备的无线网卡驱动是否正确;(3)加密无线网络,拒绝蹭网;(4)选择好信道,排除IP地址冲突问题;(5)排除负载过大,警惕网络病毒。
4 总结
医院网络是高度复杂而对专业技术要求程度高的信息化工程,而综合布线系统作为医院网络的重要组成部分,既是使用周期最长的基础设施之一,也是各业务应用系统稳定运行的基础[14]。
在信息系统的日常运行中,网络故障在所难免,而综合布线故障的发生一般都是故障事例中占比最高的,因此只依靠信息技术人员在日常运维过程建立健全一套科学有效的运维技术文档,不断的学习掌握网络综合布线系统的设计、维护与施工的技术,积累运维实践经验,才能提高解决故障的效率,使医院网络朝着完善的方向发展,也更好地支持医院信息化建设的需要[15]。