APP下载

一种基于随机映射的网络状态评估方法

2016-12-01赵晋明

电信科学 2016年8期
关键词:网络管理机器神经网络

赵晋明

(山西省太原市文通电子有限公司,山西 太原 030002)

一种基于随机映射的网络状态评估方法

赵晋明

(山西省太原市文通电子有限公司,山西 太原 030002)

近年来,机器学习技术在网络管理领域得到了广泛使用。然而由于通信网络日益复杂,网络中的非线性和不确定因素使得机器学习变得十分困难。为了提升机器学习的效果,提出了一种采用随机映射的人工神经网络方案,其特点是引入机器学习和网络拓扑的随机性,使得神经网络对学习目标具有更大的适应性,并实现更快、更精确的收敛。相关成果已经在中国移动通信集团山西有限公司(以下简称山西移动)的实际网络中得到了应用并取得较好的效果。

机器学习;随机映射;神经网络;网络管理

1 引言

随着网络规模的不断扩展,网络管理系统需要管理越来越多的网络设备。与此同时,由于网络环境日益复杂,对于网络状态的判断也更加困难,即使是拥有丰富经验的网络管理者也很难准确了解网络当前状态。由于当前网络规模十分巨大、相互交互十分复杂,网络状态与采集到的网络参数之间具有非常明显的非线性关系。在这种无法明确建立模型和机制的情况下,通过对大量网络中实际运行数据的分析,可以更充分地了解当前网络的状态,发掘网络系统的演化规律,从而实现更加有效的网络管理。

神经网络是一种可以有效处理上述复杂系统的数学工具,目前已经广泛应用于工业、经济和社会等复杂系统中。神经网络可以通过大量数据拟合分析挖掘出数据中潜在的有用知识,并自发构建成可以操作的模型。采用神经网络不仅可以为系统控制和分析提供支持,而且可以帮助人们更深入地理解和认识复杂系统。

神经网络的原理是通过相空间重构等方法将复杂的非线性关系转化为函数逼近问题,进而采用递归优化的方式进行求解[1,2]。当前相关工作主要集中于前馈型神经网络(feedforward neural network,FNN)的运用,例如径向基函数 神经网 络[3](radial basis function,RBF)和 支 持 向 量机[4](support vector machine,SVM)等。然而,这类神经网络对数据质量要求较高、自身收敛较慢[5,6],因此十分依赖数据分析人员的经验。这种缺陷使得传统前馈型神经网络难以得到运营商的大规模应用。

和机器学习不同,人类通常可以基于少量的数据,快速学会识别和理解复杂的系统。实验表明,人类可以使用少于机器学习1%的数据实现同样的学习效果。对于机器学习而言,“随机映射”在很大程度上可以帮助传统的神经网络实现人类学习的这一特性[7]。随机映射与神经网络的结合最早起源于20世纪90年代随机向量函数连接型[8](random vector functional-link,RVFL)神经网络的思想。这一思想的核心就是模仿人类在学习过程中所表现出的“直觉”,通过随机构造神经网络的感知层来提升学习效率。

目前,随机映射的研究方兴未艾,针对通信网络的特点,采用随机映射的机器学习可以更加有效地实现对网络的理解,并帮助网络管理人员更好地管理网络。目前,各大运营商都开始研究如何提升网络对业务的实时感知,网络服务体验的提升将带来更好的用户黏性,从而带来更多的利润。为此,提出了采用随机映射的方式更快地训练机器,并基于更少的数据实现对网络状态的准确判断。该方法已经在中国移动通信集团山西有限公司(以下简称山西移动)得到了示范应用并取得了一定的效果。本文的工作对于相关领域的研究和工程实践具有一定的借鉴和指导意义。

2 随机映射在网络状态评估中的作用

随着通信网络中网络管理技术的不断发展,网络中产生的大量信息和数据都得到了采集和存储,这些数据和信息呈现出“爆炸式”增长,并形成了海量的信息环境。然而,面对网络中的海量数据,网络管理人员往往只对于其中的一些具体目标感兴趣。因此,如何高效地从海量网络数据中提取出网络管理人员所关心的信息,并根据这些信息对网络状态做出准确的评估是一个亟待解决的问题。

传统的网络管理对于数据的处理更类似于“检索”,即通过关键字、属性或标注等方式在海量数据中检索信息,并将检索到的信息经过简单的处理和分析后向网络管理者呈现。这一技术的发展比较成熟,但是这一方法面临以下3个问题。

(1)结果不充分

网络中的数据实际包含着非常丰富的信息和意义,单单提取几个指标或者属性无法充分对网络的实际情况进行描述。

(2)主观判断带了的不确定性

不同的网络管理人员对于同样的数据和指标可能会做出不同的理解判断,这种主观倾向最终必定给网络状态的评估带来较大的不确定性。

(3)工作量巨大

面对网络中日益增长的海量数据,无论是机器还是人工都需要耗费大量的工作对其进行处理,这种系统实现方式会带来巨大的开销。

为了解决上述问题,利用随机映射与神经网络相结合的极端学习机器(extreme learning machine,ELM)改进了传统的数据检索和比对方法,使得网络管理系统在使用更少量数据的情况下,进行更为精确的评估。例如,人类只需要看到过床的一角,而不需要看到床的全貌,就可以识别出“床”。同理,网络管理系统也可以仅从少量的数据中得到对于网络状态的判断。随机映射可以看作这样一种提升机器学习能力的机制,使得机器可以建立如人类“直觉”一样的能力。

具体而言,“随机映射”通过对少量已知案例的学习,借助神经网络对于非线性关系良好的表征能力,实现对网络整体状态的泛化的检索和匹配,而不是简单对于某些具体指标和参数的匹配。这一方案的核心就是利用随机映射所带来的学习能力,实现人类从少量样本中学习和辨别复杂系统的能力。根据上述思想,构建了网络状态评估系统,如图1所示。该系统的功能由3部分组成,即网络特征提取、网络状态索引、相似性匹配。这种检索方法可以避免传统检索方法的局限性,使得网络管理者可以更好地对网络状态进行管理。

所构建的系统中,基于随机映射的极端学习机器可以很好地完成“网络状态索引”和“相似性匹配”这两项任务,而特征提取是一个单独的过程。对于计算机系统而言,由于输入数据的格式、数量、含义有巨大差别,为了便于处理就需要将输入数据首先转化为特征向量。特征向量的提取对于不同的数据各不相同,相关研究已经十分成熟,在此不再进行展开研究,第3节主要就随机映射在网络状态评估的应用进行阐述。

图1 网络状态评估的功能流程

3 基于随机映射的网络状态评估

为了对网络状态进行评估,就需要尽可能准确地描述出系统采集到的网络数据与实际网络状态之间的关系。在传统的网络管理系统中,时延、抖动、带宽等指标常常被认为是衡量网络状况最有效的指标。然而,随着网络规模的扩大和网络结构的日益复杂,现在已经不能简单凭借这些指标对网络状态做出评价。例如在无线接入网中,小区覆盖的信号强度(received signal strength,RSS)是评价网络质量的重要指标,但是在实际运营的网络中,一些信号强度较好的小区依然出现较多的掉线、语音不清或者回音等现象。

这种依靠网络参数对网络状态进行评估的方法,从数学角度来看是建立输入数据与网络状态之间的函数拟合。然而,传统的网管系统通常将网络数据与网络状态之间的关系简化为线性,这种方法对于结构简单的网络可以获得较好的拟合,然而随着网络规模的日益扩大、网络结构的日益复杂,当前的通信网络已经成为一个巨大的复杂动力学系统,需要引入更有效的数学模型对网络进行描述。

如上所述,神经网络作为对于非线性系统非常有效的描述方式,已经广泛应用于许多领域,在网络管理领域也得到了很多应用。然而传统的神经网络需要大量的样本进行训练,同时为了得到较好的学习效果,需要仔细调整网络结构和拓扑,避免网络训练陷入局部最优,这造成了神经网络的应用结果差强人意。

为了解决这一问题,利用随机映射结合极端学习的方式实现高效的神经网络学习,使得网络状态评估在更少的样本下可以得到有效的实现。采用的神经网络是最简单的三层神经网络,具有典型的三层结构:输入层、隐藏层和输出层,其结构如图2所示,数学表达式如下:

图2 本文所采用神经网络的结构

其中,O为神经网络输出值,xk∈Rd表示第k个输入向量,Win为连接输入层和隐藏层的权值矩阵,b=(b1,…,bn)表示隐藏层的偏置向量,w表示隐藏层和输出层之间的权值向量,g(·)为激活函数,取 Sigmoid 函数。

机器学习的目标是通过不断的迭代更新输出权值,每次迭代的变化量为:

网 络 的 隐 藏 层 输 出 矩 阵 ,t=[t1,t2,… ,tn]为 期 望 输 出 向 量 。的计算式为:

神经网络方法学习的核心就是通过对式(3)的不断迭代,找到最优的权值w,使得输出值与目标值之间的差值最小,这一过程就是对式(3)的求解。在实践中,对式(3)求解的方法有很多种,本文采用岭回归方法并对目标进行正则化,相应的解可表达如下:

其中,I为单位矩阵,C为正则化系数。在权值更新的过程中,为了实现更加有效的学习,引入随机映射的思想——对于每次训练的迭代,计算网络当前输出值与目标值的差值时,使用相似度函数而不是差值的绝对值来行度量。对于神经网络的输出集O和目标集T,相似度函数sim(O,T)的表达式为:

其中,Pr(O=T)表示输出集O和目标集T一致的概率。这样,相似度函数的引入使得可以更快达到神经网络学习结束的阈值,避免了对于目标的过度拟合造成的泛化能力下降,同时也减少了对于训练数据规模的要求。与此同时,为了避免神经网络结构对学习过程造成的影响,本文采用了动态可变化的网络结构。首先初始化最简单的网络结构,在学习过程中每次随机生成多个隐藏节点,并根据情况选择其中一个加入网络。新增节点的权值由式(6)给出:

其中,e(i)表示第 k个隐藏节点加入之前,第 i个样本对应的残差,g(Win(k),bk,xi)表示由第 i个样本激活得到的第k个隐藏节点的输出。上述过程实际是通过一个凸规划过程对神经网络的节点进行优化,力图获得最简单的结构模型。从而从神经网络的结构上保证训练所需的样本最少,学习过程的效率更高。

4 算法验证

为了对所提出的算法进行验证,采用山西移动的6 000组网络样本对网络的服务体验进行评估对比。样本的服务体验采用语音通话的MOS(mean opinion score)值来衡量,MOS值是最广泛使用的一种对语音质量评价的方法,对通话采用1~5分进行评分,当MOS值低于3分时,通话质量较差,反之则可以认为网络满足了基本的通话服务体验要求。

MOS值是一种主观评测方法,在实际的网络中,需要通过网络参数等指标对网络能提供的MOS值进行判断。对比采用传统神经网络方法和本文所提出方法对于学习MOS值评估的效果。采用的学习样本包括信号强度、掉线率、阻塞率、网络CPU利用率、无线资源利用率5个网络指标以及对应的MOS打分。显然,上述5个指标与MOS之间具有较强的非线性关系,可以通过对神经网络的训练进行较好的拟合。

采用神经网络学习的一个重大难点是需要足够的训练样本,并建立合理的神经网络结构。这一要求对于传统的神经网络学习是一个巨大的挑战,而采用随机映射的神经网络可以较好地解决上述问题。以采用不同数量的训练样本对比传统评估方法和本文所提出的评估方法,得到的结果如图3所示。

图3 本文所提算法与传统算法比较

可以看到,对于本案例,传统的神经网络学习随着训练样本的增加没有显著提升判断的正确率,一方面是由于传统的神经网络学习过于追求训练的拟合程度,使得网络早早陷入局部最优。另外,神经网络的结构能否有效地实现对问题的表征也决定了学习的效果。本文所提出的方案可以有效解决这一问题,从图3的结果可以看出,系统判断的准确性随着训练样本的增长实现了显著提升。虽然在样本较少时,由于算法的随机性造成了训练效果较差,但本方案极大地增强了系统的学习能力,使得系统可以用更少的样本实现快速学习。

目前,该方案已经在山西移动的网络中进行了试验应用,并取得了较好的效果。可以预见,人工智能的未来将为人类的生产生活带来巨大的改变,因此,相关工作的不断进行有着十分重要的理论与实际意义。

5 结束语

随着人工智能的发展,机器对于通信网络这种巨大的复杂系统的理解和管理都将显著超越人类。为了更好地管理网络,就需要人工智能更多地参与到网络管理的过程中,更多依靠机器学习而不是网络管理人员的经验来管理网络。基于这一背景,将随机映射的思想引入网络管理的机器学习中,使网络管理系统可以利用更少的数据实现更加“直观”的学习。相关研究的开展将为未来网络管理研究的提供重要的支撑。

[1]KARUNASINGHE D,LIONG S Y.Chaotic prediction with global model artificial neural network [J].Journal of Hydrology,2006,323(1):92-105.

[2]黎明,张化光.神经网络建模方法研究[J].自动化学报,2002,28(1):27-33.LI M,ZHANG H G.Research of neural network modelling method[J].Acta Automatica Sinica,2002,28(1):27-33.

[3]YU H,REINER P D,XIE T,et al.An incremental design of radial basis function network [J].IEEE Transactions on Neural Networks and Learning Systems,2014,25(10):1793-1083.

[4]MALL R,SUYKENS J A K.Very sparse LSSVM reductions for large-scale data [J].IEEE Transactions on Neural Networks and Learning Systems,2015,26(5):1086-1097.

[5]PEARLMUTTER B A.Gradientcalculationsfordynamic recurrent neural networks:a survey [J].IEEE Transactions on Neural Networks,1995,6(5):1212-1228.

[6]ATIYA A F,PARLOS A G.New resultsonrecurrent network training:unifying the algorithmsand accelerating convergence[J].IEEE Transactions on Neural Networks,2000,11(3):697-709.

[7]ARRIAGA R I,RUTTER D,CAKMAK M,et al.Visual categorization with random projection [J].Neural Computation,2015,27(10):2132-2143.

[8] PAO Y H,TAKEFVJI Y.Functional-link net computing [J].IEEE Computer Journal,1992,25(5):76-79.

A network status evaluation method based on random projection

ZHAO Jinming
Wentong Company Limited,Taiyuan 030002,China

In recent years,machine learning has been widely used in network management.However,the complexity of the communication network is increasing,nonlinear and uncertain factors in the network make the machine learning more difficult.In order to improve the effect of machine learning,a scheme of artificial nervous network based on random projection was proposed.The characteristic of such scheme was the introduction of randomness in machine learning and network topology,which took the learning process more adaptability,and achieve faster and more accurate convergence.

machine learning,random projection,neural network,network management

TN913.2

A

10.11959/j.issn.1000-0801.2016224

2016-07-05;

2016-08-04

赵晋明(1973-),男,山西省太原市文通电子有限公司研发主管,主要研究方向为网络管理系统的架构和关键算法,具有丰富的理论和工程经验,为中国移动通信集团等运营商解决了大量运维难题,并实现多项关键技术突破。

猜你喜欢

网络管理机器神经网络
机器狗
机器狗
数控机床DNC网络管理平台在智能制造中的应用
神经网络抑制无线通信干扰探究
基于OpenStack虚拟化网络管理平台的设计与实现
基于神经网络的中小学生情感分析
未来机器城
电动汽车充电服务网络管理初探
基于EOC通道的SHDSL网络管理技术
基于神经网络的拉矫机控制模型建立