CDMA网优模块化的探讨
2011-06-07中国通信建设集团设计院有限公司二分公司
文|中国通信建设集团设计院有限公司二分公司 王 玲
1 CDMA网络模型
如图1所示,CDMA网优模型由动静两部分构成。静态部分由物理层、协议(参数)和用户组成。静态部分实际上是一个可以自己运行的网络系统,但是无法修正网络变化和网络缺陷带来的服务问题。动态部分由各种网优动作及其对网络的变动组成。动态部
图1 CDMA网优模型图
2 CDMA网优模块
如果把网络优化看作一个系统的话,那么这个系统是由各种客观存在组成的,包括时间、空间、事件、物理层、协议、参数、性能统计及工具等客观实体,以及把这些实体组织联系起来的对比法、排除法、综合法等网优分析方法。
2.1 实体模块
(1)时间
时间往往和事件捆绑在一起,主要是所有网优事件,即并行的和串行的网优事件在时间上的排列结构,包括网络软硬件的变动、各种对网络的操作、各种告警、各种指标的跳变、网络空口环境的变化、用户行为变化等在时间轴上的分布和相互关联。
时间模块的重要性在于各种事件之间往往在时间上横向或者纵向相关,清楚这一点就可以利用对比法和排除法迅速找到各种网络异常情况的原因或者问题的切入点。实际上这是最简单的也是最重要的一点,但是往往被忽略。
(2)空间
主要是指覆盖区内的地理环境、网络接入设备的地理分布、网络拓扑结构、空口信号质量和信号结构情况、用户数量分布等。
空间包含的内容中,地理环境、设备的地理分布、用户数量分布和网络拓扑将会影响信号结构和信号质量,而空口的信号质量是移动网络优化的核心,也是网优分析的起点和归宿。网优工作做得再多再复杂,从等效的观点来看无非就是做足够容量、足够质量的信号优化。
(3)物理层
对移动网络优化来说,有线部分相对成熟可靠得多,主要是做空口部分。所以物理层主要指网络设备空口物理层硬件,包括天线方位角、下倾角、挂高、天线型号、功率以及其他板件等。物理层是空间信号结构的直接决定因素,它的调整直接关系到Ec/Io的变化。
(4)事件
事件同时间。
(5)协议
和网优有关的协议可以分为静态协议和动态协议。静态协议主要指信道和信道结构、帧结构等;动态协议主要指接入、切换、登记、释放等行为的步骤和规范。
协议与参数及物理实体三个要素构成网络架构, 所以它对于通信网络至关重要。这不仅体现在系统设计上,也体现在网优的应用上。协议不仅是网络行为规范,同时也是网优分析中的重要参照点,是网络的系统设置和精细网优、问题查找的重要依据。协议的网优应用在于:可以认为凡是违反协议的都会出错。所以应用对比法,以协议为参照,考察问题点的协议和信令流程等,就可以找到问题的原因或者切入点。
(6)参数
主要指关系网络性能的各种参数,包括系统参数和非系统参数,即基本参数、登记参数、接入参数、功率控制参数、切换参数、各种信道参数以及和业务配置相关的参数。
参数是CDMA网优的重要元素,和协议一起构成网络的软架构。参数的作用体现在两个方面:一是正确的参数配置是系统正确运行的重要基础之一;二是优化的参数配置是网络性能得到较大或最大发挥的重要因素和手段之一。反过来说,参数引起的网优问题有两类:参数配置错误(不符合协议规定)引起的系统运行出错和参数设置不当导致网络性能得不到较好发挥。
参数的优化方法有多种(当然首先要保证参数设置正确,网络正常运行),一般按照先整体后局部的办法来做,即先优化系统参数,再做局部的参数优化。另有一种方法也较为可行,即等效Ec/Io法。这种方法是将现有网络和原始移动通信网络作对比,把所有参数的调整等效于Ec/Io的调节,甚至所有网优动作都等效于Ec/Io的优化。因为最初的网络较为简单,只要空口有足够信噪比的信道即可通信,后来发展的网络等效于在此基础上增加对信噪比的限制和调节。在已经商用的网络里,各种参数已经有了初始设置,以此为初始对照点,可以将参数按照提升还是降低两类来做优化。
(7)性能统计及工具性能统计
分为两种:主动和被动。主动是指DT/CQT等主动获取网络性能表现的行为;被动是指通过各种软件系统收集网络的性能统计数据以及用户投诉。工具是指各种测试分析和性能统计软件。
这部分是获取网络性能的唯一通道,是所有网优项目必不可少的环节。
2.2 虚体部分
CDMA网优模块的虚体部分是指为了完成某一网优项目,运用相应的实体模块进行分析的方法,一般有对比法、排除法和综合法三种。
(1)对比法
对比法是一种很高效的方法,因为它是以已知的正确存在作为参照物来做比较运算,实质上是一种简单的逻辑运算。对比不仅是将事物在时空上联系起来,而且是进行比较运算后得出一个差异,通过分析差异包含的信息得出有用的结论。因此说没有对比就没有判断,对比是逻辑思维的基础。对比法应用在网优的方方面面,比如:分析信令要以信令流程为参照,调整参数要以调整前后效果做对比选优,查找RSSI异常原因常常对调射频通路做比较,从而做出判断,实测指标与正常指标对比,实测性能指标空间结构与正常结构对比,更换正常部件后和原系统相对比,看故障是否消除来判断问题点。
(2)排除法
排除法是通过快速排除正常部分来判定问题范围,从而为后续的问题查找和排除提供便利的方法。排除法也是一种高效的网优分析方法,它基于这样的事实:通信网络中排除嫌疑要比肯定问题容易得多;这是由通信网络的网络特性和业务特性决定的。排除法是一种典型的反向思考问题的方法,它通过举证的办法将嫌疑一步一步地从较大范围缩小到尽量小的范围,再用综合法找到问题,符合先易后难的处理问题的原则。
(3)综合法
网优是由上述七大要素组成的复杂系统,其间联系错综复杂。对比法只是一对一的比较,不能做横向和纵向的联系分析;排除法能将问题原因圈定在一定的范围内,但是对问题区域内部的分析常常无法深入进行。所以说对比法和排除法只是网优分析的利器,但是只能用在局部分析当中,对于联系复杂的系统分析必须用到综合分析法,实践当中网优分析常常是“排除(对比)——综合”这样的顺序。
综合法着眼于系统的内部联系和作用,综合运用对比、排除、假设、联想、推演等方法进行分析并汇总各种结果,找到问题原因。网优往往不是一个定量的精确系统,在无法精确定位原因时,综合法也可以将各种分析路径、分析结果综合起来,找出共同的结论指向,从而基本上确定问题原因。
3 模块化网优流程
可以把CDMA网优抽象成为如图2所示的过程。
图2 CDMA网优过程图
CDMA网优本质上是很简单的,它以“挖掘网络潜力,提升网络质量”为核心,是一个“发现问题——解决问题——发现问题”的循环过程。但是实际的网优工作较为复杂,在网络发展的不同时期有不同的侧重点,所以实际的网优工作名目较多,一般按照网络发展的时间和优化的对象属性将网优分为新站工程优化、片区优化、系统优化、日常网优、专题网优、投诉问题处理等。这些优化项目均可按照图3所示的流程进行。
图3中没有列出对比、排除、综合模块,这是因为这些虚体模块贯穿在流程的每一个环节,所以没有表示出来。流程注解如下:
(1)网优问题的提出分两类:其中一类是投诉等直接获得问题的途径;另一类是性能统计模块里的测试和话统指标的途径。若是投诉则直接发现问题。
(2)除了投诉,剩下的发现问题的途径就是性能统计模块了。这里是指用DT&CQT和话统数据、性能数据等途径来分析,从而获得网优问题。该模块一般都能找出问题,至少可以按关键性能指标做TOPN排序,找出最差载扇处理。至于做怎样范围的分析,则要视具体的网优项目来定。新站优化需分析单站和周围基站指标,网格优化则要对基站簇进行分析等,分析的指标也视需要而定。分析采用的方法常常是对比法,即统计值和正常值的对比、不同时间点指标的对比、载频间指标对比、指标结构和正常状态的对比、区域上指标的对比等。
(3)此处进行判断,若是投诉和性能统计的途径都没有发现问题则流程结束,若是发现问题则转到时间模块分析。
(4)进入时间模块。
(5)判断网优事件的时间特性。时间模块里首先要明确该网优问题发生的时间点,任何网优问题都有出现的时间点,若有则进入环节(20)分析;实际上相当多的网优问题往往无法明确出现的时间点,若没有则进入环节(6)分析。
图3 模块化优化流程图
(6)问题没有时间特性,接下来要用性能统计模块分析来确定问题的区域范围。这时可以统计出涉及该问题的基站(载扇)的特性,即物理上、地理上和逻辑上这些基站(载扇)的共同属性。由此可以判断问题发生的范围,比如单个基站、某个寻呼区、BSC某块接口板、某个局向、某个BSC等。锁定问题涉及范围是快速准确定位问题原因的重要手段之一,是提高效率的必要条件。
(7)进入空间模块分析。
(8)空间模块首先要检查问题点的空口信号质量情况。此时需要用性能统计模块获得现场的信号质量情况。信号质量检查包括现场Ec/Io、TxPower等参数,这是一个重要的分析环节。
(9)若是空口信号质量良好,则转到环节(18)进 行分析,否则转到环节(10)分析。
(10)对于空口信号质量不好的情况要做干扰的排查。主要是检查频段内的上下行干扰,手段包括 RSSI历史分析、频谱仪扫描、测试数据指标分析等。
(11)若是没有干扰则进入环节(12)分析;若有干扰则排除干扰或者采取减小干扰的措施,此后如问题解决则结束流程。
(12)若是没有干扰出现则进入物理模块分析。主要是检查物理硬件的健康状况,检查物理硬件的参数(比如天线工参等)是否设置合理,检查各信道功率的设置情况。物理上的检查类似维护上常用到的一些逻辑方法,用到对比、排除、综合逻辑模块,比如典型的RSSI排查等。
(13)若问题仍未解决,转到环节(14)分析。
(14)参数模块首先检查和空口信号质量紧密相关的各种参数设置,包括信道设置参数、信道功率设置参数、搜索窗设置等。
(15)问题仍未解决则进入环节(16)分析。
(16)协议模块常常是分析的最后一个环节。这个环节首先要按照相关流程来回顾一下前面所有环节是否符合协议规定;其次可以通过DT&CQT取得数据来做信令分析,参照协议规范,找出不合理的地方,做出修改。
(17)若是问题仍未解决则从头开始再做分析,问题解决则结束流程。
(18)此处须对用户行为、用户终端情况、终端使用习惯等网络以外的因素做分析。是否单个用户问题, 用正常的测试机对比可知,测试机使用正常则可排除网络原因,再来查找用户或者终端原因。
(19)若是用户原因,此时一般不需要运用其他模块做详细分析,往往问题原因较为简单。若是测试机使用出现同样问题,则需从环节(14)起分析。若是群体用户行为原因,一般只会是话务增多的情况,环节(6) 可以判断这个情况。
(20)若有时间特性,则进行如下分析:尽量找到同样的时间点附近所发生的网优事件。假设所有的网优事件都有详细记录或者都是知道的,那么一定可以有一些事件和该问题相对应,由此就可以找到解决问题的切入点。但是实际上网优事件有的因为发生较为隐蔽而没被注意到,有的因为没有记录或没有沟通而被遗忘,所以不是每个网优问题都能找得到相应的事件。
若有网优事件和问题时间点对应,马上就可以找到问题的切入点,锁定问题产生原因。接下来可以综合运用各模块做分析,一般来说这个时候问题的解决就相对简单。若找不到事件和问题时间点对应,则按照环节继续查找。
(21)以后的流程来查找问题原因。最后需要说明的是各模块之间没有明确的界限,也并非每次都要用到所有模块,流程的顺序也不是一成不变的。只有充分了解各模块的特点,在一般化的流程之上根据实际灵活运用,网优的思路才能更清晰,效率才会得到提高。
4 应用实例
2010年8月3日接到反映称314国道阿克苏-柯坪路段经常掉话,应用模块分析法处理如下:
(1)时间模块
首先在维护台查询该区域基站相关告警,结果是没有告警。同时近几日没有什么网络操作,网络变动的原因排除,用户行为上也没有异常,该掉话的时间特性不明确。
(2)性能统计模块
在M2000上查询该区域各载扇的掉话统计信息,没有发现明显的时间特性,掉话率也不是明显异常,掉话原因也都是空口信号误帧过多。同时统计到各载扇RSSI、驻波比等性能参数正常,接下来对掉话点314国道阿克苏-柯坪路段做DT测试。
(3)空间模块分析
发现314国道阿克苏-柯坪全路段测试正常,空口信号质量良好,但是途中阿克苏阿音柯16大队与阿音柯18大队中总是出现掉话。掉话前几秒钟指标空间异常,即接收电平始终较好,但是总的Ec/Io急剧变差,直到掉话后重新锁定小区后Ec/Io才恢复正常。期间几部测试机都是同样现象,所以基本排除用户的原因。
(4)性能统计模块
分析DT数据发现掉话前几秒钟,终端一直占用阿音柯16大队-1扇区直至掉话,之后占用阿音柯18大队-2扇区恢复正常,这种情况表明出现了干扰。DT时频谱仪一直在扫描,没有发现干扰,之前的RSSI等检查也表明没有干扰。因为反向测试一切正常,前向测试也没有发现带外干扰,所以物理上出问题的可能性较小,暂时排除物理模块。
(5)参数、协议模块找不到带外干扰,在带内查找干扰
上述的测试现象很像是邻区漏配,于是检查阿音柯16大队-1扇区和阿音柯18大队-2扇区的邻区关系,已经互配。接下来取 DT信令分析,发现掉话前几秒钟终端取用阿音柯16大队-1扇区信号,随着终端逐渐远离阿音柯16大队,该站-1扇区信号逐渐减弱,而同时阿音柯18大队-2扇区信号Ec/Io逐渐占据主导,终端多次向基站发送PSMM消息请求切向阿音柯18大队-2扇区,但是奇怪的是对该请求基站始终没有响应, 于是总的Ec/Io越来越弱直至掉话。到此,问题原因确定阿音柯16大队-1扇区无法切换到阿音柯18大队-2扇区。检查切换请求期间空口信号质量没有问题,切换门限等参数设置没问题。
初步的参数检查没问题,但是问题的范围已经锁定,就是切换不成功;并且基本排除空口信号原因(M2000里的切换失败原因为“其他”,也表明非空口质量原因)。所以接下来就只有参照切换流程,将涉及到的配置、参数等认真核对,最后发现,两扇区分属不同BSC,在给阿音柯16大队-1扇区配置阿音柯18大队-2扇区的外部载频时,将后者所属BSC的IP地址配错了。改正之后测试恢复正常。
(6)后续处理
最后还需明确此类问题的范围,即要把有相同问题的载扇找出。把BSC间边界的所有载扇的外部BSC IP检查一遍,发现两个载扇有同样的问题,进行了及时的修改。
(7)小结
在网优的过程中,利用模块化得流程,思路清晰,可以快速找到问题的原因、关键点,迅速的解决问题,大大的提高了网络的运行质量,同时节省成本。