浅析eNodeB设备的硬件维护
2014-11-04陈晓芬
陈晓芬
通过对TD-LTE网络无线侧维护及研究,分析TD-LTE网络构成和基站硬件特点,讨论目前站点常见的各类故障产生原因,并对其进行分类和总结。将eNodeB常见硬件故障原因分为时钟类、天馈类和传输类故障,并说明现场处置经验,阐述不同类型故障的排查原则和定位思路,为eNodeB硬件故障排查提供了参考。
Based on the research on the wireless maintenance of TD-LTE network, the network composition and base station hardware characteristics of TD-LTE network are analyzed. Then the reasons for various common faults of the current site are discussed and concluded after classification. The common hardware faults of eNodeB are divided into clock class, antenna-feed class and transmission class. In addition, the experience of site disposal is expounded. At last, the troubleshooting principles and positioning ideas of faults with different types are illustrated, which provides a reference for eNodeB hardware troubleshooting.
TD-LTE eNodeB hardware maintenance fault handling
1 引言
随着2013年12月工信部颁发“LTE/第四代数字蜂窝移动通信业务(TD-LTE)”经营许可,中国移动在国内的试商用网络正式投入业务运营。商用设备的增加导致基站故障呈现爆发式增长,维护人员对新入网设备的不熟悉使得基站长时间退出服务,网络维护效率低下。本文结合日常维护经验,详细分析eNodeB(Evolved NodeB,演进型基站)常见的故障原因并进行分类总结,为无线网络硬件维护提供解决参考。
2 TD-LTE网络组成
TD-LTE是由我国主导开发并持有主要专利技术的第四代移动通信技术与标准[1]。它采用控制与承载分离的全IP扁平化架构,舍弃电路域及RNC(Radio Network Controller,无线网络控制器),将原有3G网络的5个协议状态简化成2个,并使用非对称频谱资源,灵活配置帧结构等特点,采用OFDM(Orthogonal Frequency Division Multiplexing,正交频分复用)、MIMO(Multiple Input Multiple Output,多输入多输出)等关键技术[2],使其具有延时低、频谱效率高、资源要求少、用户体验好等特点[3]。
TD-LTE逻辑网络由EPC(Evolved Packet Core,分组核心演进)和E-UTRAN(Evolved Universal Terrestrial Radio Access Network,演进的通用陆基无线接入网)两部分组成。其中,EPC为TD-LTE核心网,由MME(Mobility Management Entity,移动管理实体)、S-GW(Serving Gateway,服务网关)和P-GW(PDN Gateway,分组数据网关)组成[4],实现网络信令、本地网络用户数据处理和用户数据包与其他网络的交互;E-UTRAN为TD-LTE接入网,由eNodeB构成,实现IP头压缩、RRM(Radio Resource Management,无线资源管理)功能、寻呼信息和广播信息的调度传输及用户数据加密等功能[5]。
3 eNodeB硬件组成
目前,华为、大唐、中兴等国内主流TD-LTE设备厂家均采用分布式站点硬件配置,即将基带处理单元(BBU)与射频处理单元(RRU)分开。无线接入网络使用这类设备的优点在于网络布放灵活,实现快速分布式组网,并具有较好的冗余性,扩、减容等网络调整实现将更为简单。
BBU一般采用机框+板卡的形式,可根据网络需要配置硬件,一般由电源单元、交换控制和传输单元、基带处理和Ir接口单元、环境监控单元及风扇控制单元组成。交换控制和传输单元主要实现时钟信号的输入和分发、业务和信令的交换、控制面协议的处理、与S1/X2接口连接等功能;基带处理和Ir接口单元主要实现标准Ir接口、基带数据的汇聚和分发、物理层和MAC层算法等功能。
RRU则一般封装成一个整体,仅在外部预留光口、天馈线接口、电源接口,实现中频处理、降噪和滤波等功能。
4 eNodeB故障类型及处置方案
福建宁德从2013年TD-LTE测试网络建设至今,eNodeB时钟故障约占硬件故障总数的21%,天馈类故障占24%,传输类故障占36%,其余19%的硬件故障为硬件损坏等其他原因。因此,掌握eNodeB时钟、天馈和传输故障的处置是提高抢修效率、处理故障的关键。
由于设备集中度较高,在网络出现故障后,维护人员根据告警初步判断并携带相关设备硬件到现场进行逐件替换。这种粗犷式抢修方式经常会出现硬件携带过多、硬件到现场仍无法处置故障、无故障硬件被随意替换等问题,不仅效率低下,增加网络硬件维修费用支出,而且设备问题得不到反馈处理,不利于硬件设备的研发与改进。
在网络维护过程中,必须摒弃原有的维护模式,积极进行网络问题探究和反馈,促进产业的可持续发展。出现网络故障告警时,应遵循先底层后高层、先硬件后软件的处置原则,结合网管告警、设备告警灯及维护设备定位故障点,准确完成故障抢修任务,提高生产效率。endprint
4.1 时钟类故障处置方案
eNode时钟类故障主要是基站GPS系统出现问题。GPS系统由BBU侧接口板、GPS蘑菇头、浪涌保护器和跳线组成。网管侧监控到的系统告警一般为时钟不可用、GPS无法锁星、时钟参考源异常、系统时钟失锁等告警,严重时会引起基站退服。根据现场维护数据,60%的时钟类故障主要是由于建设施工时不注意防水和接头引起,经常会出现馈线头内有金属屑、馈线头未接紧、防水不符合规范引起接头进水等施工质量问题,从而导致GPS短路。此外,GPS天线被遮挡或雷击引起设备损坏也较为常见。
在处理时钟类故障时,应先观察现场环境,确认GPS天线布放位置是否符合规范,其净空90°内不能有遮挡物且安装在避雷针45°的覆盖范围内,初步判断各接头坚固及防水情况。完成现场检查后,使用网管系统或基站近端登陆设备,对该站点下发无时钟启动命令,若基站可以正常重启一般为BBU侧接口板故障,若无法重启则可以采用万用表进行系统故障点判断。在浪涌保护器处断开连接的馈线,靠机房侧检查电压值应在5V左右,靠近天馈侧检测电阻值应在几十千欧,若无法检测到正常数据则在对应侧进行同向分段排查定位故障点。根据故障定位情况,替换损坏设备或重新制作接头。
4.2 天馈类故障处置方案
eNode天馈类故障主要是基站天馈系统出现问题。天馈系统由天线、馈线、避雷器、RRU和跳线组成。网管侧监控到的系统告警一般为射频单元驻波、射频单元校准通道异常、射频单元通道异常、射频单元下行输出功率异常等告警,会影响基站信号发射功率出现小区降质,严重时将导致基站退服。宏基站1个以上逻辑通道出现故障、室分小区1个以上RRU出现通道告警时,系统就会上传告警信息。天馈类故障一般为设备通道损坏、馈线进水等原因引起。
处置天馈类故障使用基站端管理软件LMT可以迅速完成故障点定位。近端登陆基站后,设置校准周期并重新发起校准,若系统告警显示为8通道异常,则一般为校准线故障,在校准线正常的情况下系统会提示故障通道数量。将LMT中天线类型由智能天线改为非智能天线并重启基站,待重启完成后系统即可提示故障通道编号。此时将天线侧对应通道的馈线断开连接到衰减器并环回到RRU的CAL口上,再执行一次校准,若校准通过则为智能天线对应通道故障,若校准不通过则为RRU通道故障。
如果现场条件不允许,可以采用假负载或Site Master分段定位的应急方案,通过假负载分段堵截测试驻波或Site Master定位,判断馈线断裂或馈线头进水的具体位置,若分段测试正常,则一般为智能天线或RRU通道故障。
4.3 传输类故障处置方案
eNode传输类故障主要是网络传输异常导致。传输系统由BBU侧接口板、光模块、尾纤、RRU、法兰盘、光缆、PTN和交换机等设备组成。网管侧监控到的系统告警一般为SCTP链路建立失败、IR光模块收发异常、IR光接口性能恶化、BBU单板维护链路异常等告警,传输故障必定会引起基站退出服务。
定位传输类故障时,应根据网管告警类型明确传输异常段落进行底层硬件排查。如告警为RRU侧光口恶化,则重点查看RRU到BBU间的尾纤及光口;若告警为BBU链路异常,则使用ODTR确认传输线路情况,并排查BBU侧光口。ODTR和光功率计是物理层硬件排查必不可少的检测工具。ODTR用于测试光缆连接通性,可准确测试光缆纤芯衰耗情况、定位断点。光功率计用于测试光口收发光情况,当光口接收/发射功率大于-100dB时为正常值;光功率计测试收发光不正常的情况下可以先替换光模块再测试,若光功率正常站点却无法接入,一般是由于传输距离与光模块型号不匹配或鸳鸯线引起,尤其在RRU拉远站点最易出现这种情况。现场没有光功率计协助测试时可以使用替换法定位,即交换光模块,查看告警是否随着光模块的移动而变化,若光模块变化告警位置也变化,即为光模块故障。
硬件正常的情况基站仍无法接入,需要通过近端登陆基站查看接口参数配置,如端口号、端口类型、插槽号、工作模式等配置数据,并尝试ping S1接口的信令面和用户面、邻eNodeB和NEA,进行网络层连通性检查。网络层ping不通则一般为S1/X2链路故障、NEA和ENB断连故障,主要是由于LAN配置、IP地址、路由关系等配置不正确引起,需要由传输维护人员进行后台参数核查和调整。网络层可以ping通的情况下基站传输状态不是“SCTP链路建立状态为与对端建立成功”,则其传输层数据存在异常,需要由传输维护人员进行SCTP等传输参数调整。
5 总结
由于TD-LTE设备入网时间短,因此在设备稳定性等各项指标方面远不如2G设备。随着4G网络的大规模建设,期间必然会出现许多故障,而故障处置不能单纯依靠更换设备硬件来解决,需要正确判断故障类型,准确定位故障并有针对性地进行处理,才能在提高维护效率的同时保障网络运行质量,促进整个产业的健康发展。
参考文献:
[1] 杜滢. TD-LTE技术标准化最新进展及展望[J]. 电信网技术, 2012(11): 36-39.
[2] 王晓东,张炎炎,赵旭凇. TD-LTE关键技术与网络规划策略[J]. 电信工程技术与标准化, 2012(7): 1-5.
[3] 宋俊德. 发展4G要从认真总结3G开始[J]. 移动通信, 2012(21): 31.
[4] 沈嘉,索士强,全海洋,等. 3GPP长期演进(LTE)技术原理与系统设计[M]. 北京: 人民邮电出版社, 2008.
[5] 陈昌川,廖晓锋,赵川斌. TD-LTE无线接入网介绍[J]. 通信技术, 2009(3): 103-105.endprint