APP下载

基于大数据挖掘的移动通信网络故障诊断方法研究

2023-09-02李小聪

通信电源技术 2023年14期
关键词:网络故障异构无线网络

李小聪

(中国电信股份有限公司北京分公司,北京 100032)

0 引 言

目前,随着用户的需求越来越多样化,如何保证网络正常运转成为了一个重大的难题。网络故障诊断技术是一种能够实时监控网络和其相关节点的改变情况,观测链路之间是否正常运行,若发现问题则第一时间反馈给管理系统的技术[1-4]。该技术主要是保障网络服务的质量,及时提供故障预警信息。随着人工智能技术的兴起,研究者逐渐在网络故障诊断领域引入人工智能技术[5-9]。与传统的人工诊断方法相比,基于人工智能的网络故障诊断可以进一步提升故障诊断效率。

1 基于生成对抗网络的网络故障诊断方法

1.1 系统模型

以毫微微小区、微小区与宏小区覆盖的4G 网络场景为研究目标,其异构无线网络场景如图1 所示。该研究目标具有复杂的系统结构,因此难以有效管理网络。针对该研究目标探讨如何诊断网络故障,首先分析和关联衡量网络性能的关键性能指标(Key Performance Indicator,KPI)与常见的网络故障,这也是构建模型的必要前提工作。

图1 异构无线网络场景

1.2 生成对抗网络概述

生成对抗网络(Generative Adversarial Network,GAN)从提出至今受到了领域内许多研究者的欢迎。GAN 分别包括生成模型和判别模型2 种模型,即模型G和模型D。模型G和模型D之间会不停对弈,在对弈中模型各自的性能也会随之提高。基于模型D,模型G可以在无大量先验知识的情况下产生相近的数据。多层感知器定义的优化目标函数公式为

式中:E为数学期望;D(x)为真实输入x经过模型D的输出值;G(Z)为噪声输入Z经过模型G的输出值;pdata为输入x的分布;pz为输入Z的分布。

更新模型D参数时,希望D(x)的输出结果最优可以在1 附近或者等于1,即最大化logD(x)。对于基于噪声产生的数据G(Z)而言,希望D[G(Z)]的输出可以是0,即当模型D产生的数据足够逼真时,仍可以筛选出D[G(Z)]输出数据中的假数据,因此需要最大化log{1-D[G(Z)]},从而要求判别器输出结果最大化。

更新模型G的参数时,尽量保持pz=pdata,因此log{1-D[G(Z)]}的值越小越好,即最小化生成器的输出。

博弈过程中,基于真实数据,可以取样出x并将其作为模型D的输入数值。输入该数值后,模型D可以基于自身的逻辑框架生成一个在[0,1]内的数值,该数值越接近1 越好,从而可以判断模型D的输入数据是真实数据。之后,模型D和模型G会进行不停的训练。模型G的输入信号为服从特定分布规律的噪声,其可以基于真实数据进行学习直到可以产生相似的数据,然后将该数据输入模型D,模型D可以基于自身的逻辑判断框架生成一个[0,1]范围内的数值,且输出值越接近0 越好,表示模型可以判断数据为假数据。

1.3 基于生成对抗网络的网络故障诊断流程

基于GAN 的网络故障诊断模型如图2 所示。首先,基于异构无线网络收集和关联不同网络情况下的KPI 数据,收集来的数据需要先通过归一化处理,然后基于GAN 进行数据拟合,得到附有标记的模拟数据(不同网络状态下)。其次,分别处理由原始网络和GAN 模拟制造的2 种数据集,同时利用极限梯度提升算法(Extreme Gradient Boosting,XGBoost)降维数据,筛除冗余的数据,在诊断故障时选择输入参数的最优特征组合。最后,基于XGBoost 算法的训练可以得到最优模型。

图2 基于GAN 的网络故障诊断模型

1.4 数据处理

网络故障诊断模型必须具备可以识别多个故障的能力,因此需要确定不同网络状态对应的症状。将具有m个KPI 的输入向量(不同网络状态下)定义为S,S=[KPI1,KPI2,KPI3,…,KPIm];网络的状态定义为C=[FC1,FC2,FC3,…,FCn]。

被研究小区的KPI 可以组成小样本数据,作为异构无线网络的输入数据。如果在某一区间时段内,有网络故障FCi出现,那么相应的网络状态公式为

式中:KPImt表示第m个KPI处于t时刻的数值。

输入数据时,归一化特定的KPIi'以保证其具有相似的动态范围。基于每个最大KPI 进行归一化操作,其计算公式为

式中:KPIi'表示对第i个KPI进行归一化处理后得到的数据;max(KPIi')表示在已收集的数据中出现的最大的第i个KPI。式(3)表示排除[0,1]范围内的KPIi,对特定的KPIi范围进行转换。

网络状态经过归一化后变成

1.5 网络故障诊断模型

GAN 框架如图3 所示,需要具备2 个处于竞争状态的网络并同时优化目标。

图3 GAN 框架

第一个网络是基于均匀噪声或者给定高斯噪声来输出模拟输入数据的生成器模型G;第二个网络是判别模型D,其用0 或1 来标记判断样本,进而判断输入数据是生成的还是来自真实采集。经过迭代,该竞争网络模型可以更好地完成任务。生成模型G甚至可以产生出以假乱真的输入数据。优化的目标函数公式为

基于GAN 生成模型,仅仅需要一个噪声(有一定规律)、2 个网络(可逼近函数)和一些数据(实际数据),不会存在特别困难的计算问题。2个模型(判别器和生成器)彼此间互相博弈,判别器稳定时,可以由生成器获取不同的网络状态,输入数据的分布也趋向于实际数据分布'FCi,其计算公式为

此外,本研究利用了带梯度惩罚的Wasserstein GAN 算法(Wasserstein GAN with Gradient Penalty,WGANGP)[10]。

2 仿真结果

首先,进行仿真时,在数据处理阶段采用WGAN-GP 算法学习小样本数据,该数据具有特定规律性;其次,得到附有标记的大量虚拟数据,并基于得到的虚拟数据集与小样本数据,采用XGBoost 算法诊断网络故障,网络故障诊断正确率如图4 所示。由图4 可知,本研究提出的方法随着迭代次数增加最终可以达到0.9848 的正确率,一定限度上提高了网络故障诊断的正确率。

图4 网络故障诊断准确率

3 结 论

由于传统方法难以解决基于异构无线网络状态下大量获得附带标签的历史数据问题,受GAN 启发,提出一种新的异构无线网络故障诊断方法。首先基于WGAN-GP 算法,对从网络环境中收集得到的小样本进行学习,随后得到大量带标记的模拟数据,利用XGBoost 算法对数据进行网络故障诊断,最后进行仿真实验,证明该方法可以显著提高网络故障诊断的准确率。

猜你喜欢

网络故障异构无线网络
试论同课异构之“同”与“异”
滤波器对无线网络中干扰问题的作用探讨
VxWorks网络存储池分析在网络故障排查中的应用
基于信息流的RBC系统外部通信网络故障分析
异构醇醚在超浓缩洗衣液中的应用探索
无线网络的中间人攻击研究
overlay SDN实现异构兼容的关键技术
Wireshark协议解析在网络故障排查中的应用
LTE异构网技术与组网研究
TD-LTE无线网络高层建筑覆盖技术研究与应用