无线网络自动优化模型的知识获取

2010-09-26

电讯技术 2010年12期

(西安邮电学院通信与信息工程学院，西安710121)

1 引言

近年来，全球的移动通信网发展迅猛。2009年全球3G用户达到6.5亿，预计今年可以达到20亿。截至今年6月底，中国在网3G用户数达到2 520万，其中TD用户达1 046万。未来，全球的移动通信网将由多种技术构成一个无缝的移动通信基础设施。超3G移动通信网[1]的无线接入网络(RAN)由不同技术、高度复杂和异构的多种网络组成，其运行、维护和管理(OA&M)是一项艰巨的任务。同时，由于移动网络运营商之间的竞争愈演愈烈，RAN的运行将是他们必须面对的严峻挑战。自我管理系统，即自我配置、自我保护、自愈和自我优化，是应对高度竞争环境下这些网络所固有的高复杂性的有效解决方案。尽管文献[2-5]等对自愈(即自我诊断)进行了大量的研究，但对自我优化或自动优化方面的相关研究，现有文献资料几乎很少涉及。因此，本文在给出无线网络自动优化系统结构的基础上，提出一种通过对优化专家的知识获取，利用贝叶斯概率模型建立无线网络自动优化模型的方法和过程。

2 自动优化

2.1 概念

无线网络优化的重点，一是提升用户感知的网络性能指标，主要包括掉话、切换、覆盖、干扰等；二是提高网络资源的利用率，解决网络容量和网络资源的均衡问题。随着对网络深度优化要求的提高，目前所采用的基于路测和信令分析工具的主流优化方式已无法满足要求，基于OMC-R网络统计数据的自动网络优化技术应运而生。

无线网络自动优化包括3项工作：一是发现问题，二是分析问题，三是解决问题。

首先，对网络进行性能评估，找出关键性能指标(KPI)不满足优化目标指标要求的问题小区。问题小区是指一个小区的一个或多个KPI不满足指标要求，从而影响服务质量。不同运营商，不同技术网络，可能会使用不同的方法，或采用不同的KPI性能指标作为优化目标。对于运营商而言，最严重的问题莫过于小区经历了大量的掉话，因为掉话对用户服务具有极大的负面影响。因此，掉话率是评估小区质量的最好指标之一，可以用来识别问题小区。

其次，一旦确定了问题小区，就应对每个问题小区问题产生的原因进行分析。一个原因或故障是一个小区中存在的逻辑错误或物理缺陷，如参数配置错误、硬件故障等，从而导致KPI不满足指标要求。症状是一个KPI或告警，如干扰造成的切换数量，根据症状统计值可以找出问题的原因。分析问题是最复杂和最耗时的工作，目前主要是由优化专家们借助一些辅助工具手动完成的。

最后，根据问题的原因，制定并实施优化方案，解决问题小区存在的问题。优化的效果可以通过对优化后的网络性能进行重新评估来衡量。

自动优化的过程可概括为首先定义约束条件，然后构建模型，最后设计收敛算法。

2.2 自动优化系统

为了实现无线网络的自动优化，图1给出了自动优化系统的体系结构。

模型定义子系统负责构建系统所需的优化模型。建立优化模型既可依据优化专家的专业知识，亦可根据OMC-R提供的网络统计数据。模型参数可以采用两种方式来确定：一是专家提供(基于知识的模型)，二是来自训练数据(基于数据的模型)。目前，在移动通信网络中，缺少历史优化实例。在现有文献资料中，也缺少无线网络RAN优化的记录。因此，在大多数情况下，网络优化专家的知识和经验就成为建立优化模型唯一的信息来源。下一部分将提出一种获取知识的过程，根据优化专家无线网络优化的知识和经验建立概率模型。该过程的主要优点是，优化专家可以使用其专业语言传递其专业知识，无需了解概率模型，也可很容易地建立模型。

自动优化子系统，首先通过网络性能分析，找出基于KPI的问题小区，然后，利用优化模型进行推理，找出问题的原因。对于给定的KPI值，采用优化模型和贝叶斯规则，计算出问题可能原因的概率。输入是症状，即来自OMC-R的问题小区的KPI和告警；输出是问题小区问题的原因和一系列优化方案。优化方案按有效性排序(有效性=优化方案的可能性/优化方案的成本)，按顺序实施，直到问题解决。优化方案的实施可以是从一个远程终端修改配置参数，也可以是派遣人员到现场更换设备故障件，甚至可以是自动地执行软件相关的优化方案。一般来说，运营商更希望只提供优化方案，而把最后的决定权留给优化专家。最后，生成优化报告，包括原因、优化方案及其实施过程和结果。

图1 自动优化系统平台Fig.1 Automatic optimization system platform

自动优化子系统可独立于OMC-R工作，也可以集成或嵌入到OMC-R，以发挥其最大效能，从而实现自我优化。自我优化将提供对问题分析所需OMC-R统计数据的直接访问，以及运营商优化系统的直接进入，对多厂商网络和多技术网络更有利。因此，所有有关的自动优化的案例，可自动转到自我优化系统。如果自我优化系统找到了解决方案，就清除该案件，生成报告并存档；否则，可以将该案件转交专家做进一步分析。最后的分析结果可纳入专家系统的知识库。

3 概率模型

自动优化子系统包括优化模型和推理机制两部分，其中优化模型是如何确定问题原因的知识，模型的组成元素是原因和症状，推理机制是根据症状值分析问题原因的算法。

构建优化模型包括两个阶段。首先，确定定性模型，即对于给定的技术(GSM、CDMA、3G和多技术网络等)给出优化的症状和原因。原因可以模型化为具有两种状态的离散随机变量：{出现，不出现}。症状可以概括为KPI和告警两种类型，KPI本质上是连续的，可以模型化为连续或离散随机变量。离散化的KPI可能有任意多个离散状态，分别表示该KPI的连续范围内的一个子集，如{正常，高，很高}。告警也可以模型化为具有两种状态的离散随机变量：{无，有}。其次，确定定量模型，即模型的参数。在一个离散模型中，参数就是离散化KPI的阈值和概率。

一旦确定了定性和定量模型，就可以利用推理机制来计算每个可能原因的概率。对于给定症状值{S1,S2,…,SNS}，应用贝叶斯规则，得到原因Ci的概率如下：

(1)

式中，P(Ci)为原因Ci的先验概率，P(Sj|Ci)是给定原因症状的概率。

上式假设两个条件：原因不能同时发生；对于给定的原因，症状间相互独立。以上假设适用于无线网络RAN，即使不适用，这种模型已经被证明能提供很好的结果[6]。

假设一个实例为问题小区的症状值和问题的实际原因组成的集合，那么这样的实例既可用于训练系统，即计算模型的参数，亦可用于测试系统，即计算优化的准确率(在测试集合中实例正确分类的百分比)。

模型的参数是阈值和概率。一方面，阈值是连续症状离散化的区间，即tj,k是症状Sj的第k个阈值，分成状态sj,k和sj,k+1；另一方面，根据式(1)，概率如下：

(1)原因的先验概率：P(Ci),i=1,2,3,…,NC；

(2)给定原因症状的条件概率：P(Sj=sj,k|Ci),i=1,2,3,…,NC；j=1,2,3,…,NS，它是给定原因Ci在状态sj,k下症状Sj的概率。

4 知识获取

知识获取的过程就是根据优化专家的知识构建概率模型的过程，包括两个阶段：第一阶段，知识收集，即获得专家知识；第二阶段，构建模型，即根据先前获得的专家知识确定概率模型。

4.1 知识收集

知识收集的过程包括以下6个步骤。表1和表2分别汇总了优化专家应提供的定性信息和定量信息。

表1 定性信息Table 1 Qualitative information

表2 定量信息Table 2 Quantitative information

(1)问题分类

问题类型就是RAN可能遭受的各种问题，如“高掉话率”或“拥塞”。对每个问题类型，建立一种不同的模型。

(2)定义变量

应该有原因和症状数据库，优化专家可以从数据库中选择一个变量，或定义一个新变量，然后将其纳入到数据库。首先，优化专家指定问题类型的可能原因{C1,C2,…,CNC}，即无线网络中问题的原因，据此建立优化模型(如“高掉话率”)。建议包括一个叫做“其它原因”的原因，以涵盖在已定义原因中没有明确界定的问题的其它可能原因。其次，要求专家列举症状{S1,S2,…,SNS}，这可能有助于确定先前定义的原因。每个症状Si的状态si,j也应作出具体的规定。

(3)定义关系

(4)确定阈值

对于每个连续的症状Si，确定每个定义区间范围(即阈值)tj,k。

(5 )确定概率

(6)将症状映射到数据库(OMC-R)

将模型中症状映射到OMC-R中的数据，每个症状应该与OMC-R中的一个参数(KPI、计数器等)或一组参数相关联。

4.2 构建模型

根据式(1)，建立模型所需的概率为原因的先验概率P(Ci)和给定原因下症状的概率P(Sj|Ci)。因此，优化专家所提供的数据(表1和表2)应转化为式(1)所需的概率。优化专家所给出的概率PCi直接作为原因的概率P(Ci)。考虑到该模型假设原因是互斥的，所以原因的概率之和应为1。有两种方式处理该约束条件：一是由专家检查其给出的概率是否正确；二是允许给出的概率不符合约束条件，然后采用下列方法自动修正：

(1)如果概率之和大于1，那么就对每个概率进行归一化处理；

(2)如果概率之和小于1，那么就添加一个称为“其它”的原因CNC+1，表示专家未考虑到的问题的所有其它原因，其概率等于1减去原来原因的概率之和。

对于症状的概率P(Sj=sj,k|Ci)，Sj对于相关原因的条件概率已经由专家明确给出：

(2)

对于所有非相关原因，症状的条件概率都是相同的，即：

(3)

4.3 实证分析

知识获取所建立的优化概率模型，是一种基于知识的模型，需要经过灵敏度分析和实际网络使用来验证其有效性。

根据文献[8]中灵敏度分析显示，基于知识的模型对阈值的界定不准确尤其敏感。实验也证明，当训练实例数目有限或缺乏时，基于知识的模型是最好的选择。反之，当拥有一个大型的训练实例数据库时，基于数据的模型应该是首选。

由于缺乏且很难得到训练实例，所以在大多数情况下，基于知识的模型是3G和B3G无线网络RAN的唯一选择。建立基于知识的模型需要很长时间，特别是参数必须在实际网络中反复测试调整。对现行网络而言，可行的方法是先从基于知识的模型开始。每解决一个问题，就将相关的症状和实际原因保存到数据库，这样，训练实例数据库将会不断扩展，不久即可使用基于数据的模型。

5 结论

无论对于当前还是未来的移动通信无线网络(包括GSM、CDMA、WLAN、3G、B3G网络等)，实现自我优化是必由之路。本文从理论上研究了移动通信无线网络的自动优化，给出了无线网络RAN自动优化的系统体系结构，提出了一种从优化专家进行知识获取建立系统所需优化模型的方法和过程。理论分析表明该方法和过程的可行性，对于自我优化系统的实现具有一定的理论指导意义和实际应用价值。未来的进一步研究工作，一是选择一种现行网络验证优化概率模型的实际有效性，二是研究如何实现基于知识的优化模型和基于数据的优化模型在同一个自我优化系统的有机结合。

参考文献：

[1] Jamalipour A, Wada T, Yamazato T. A tutorial on multiple access technologies for beyond 3G mobile networks[J]. IEEE Communications Magazine, 2005, 43(2): 110-117.

[2] Barco R, Wille V, Díez V. System for automated diagnosis in cellular networks based on performance indicators[J]. European Transactions on Telecommunications, 2005, 16(5): 399-409.

[3] Wietgrefe H.Investigation and practical assessment of alarm correlation methods for the use in GSM access networks [C]//Proceedings of the IEEE/IFIP network operations and management symposium.Florence,Italy：IEEE,2002:391-403.

[4] Laiho J, Raivio K, Lehtimki P, et al. Advanced analysis methods for 3G cellular networks[J]. IEEE Transactions on Wireless Communication, 2005, 4(3): 930-942.

[6] Rish I.An Empirical Study of the Naive Bayes Classifier[R]//IJCAI-01 Workshop on Empirical Methods in Artificial Intelligence Technical Reports.[S.l.]:IJCAI-01 Workshop:2001:41-46.

[7] Renooij S, Witteman C. Talking probabilities: Communicating probabilistic information with words and numbers[J]. International Journal of Approximate Reasoning, 1999, 22(3): 169-194.

[8] Barco Raquel,Lázaro Pedro,Wille Volker,et al. Knowledge acquisition for diagnosis model in wireless networks[J]. Expert Systems with Applications, 2009, 36(3):4745-4752.