APP下载

基于改进小波-Elman神经网络算法的蜂窝网流量预测

2017-03-02倪飞祥

电子设计工程 2017年3期
关键词:蜂窝小波基站

倪飞祥

(1.上海微系统与信息技术研究所 上海201210;2.中国科学院大学 北京100049)

基于改进小波-Elman神经网络算法的蜂窝网流量预测

倪飞祥1,2

(1.上海微系统与信息技术研究所 上海201210;2.中国科学院大学 北京100049)

对于在现代蜂窝网资源管理中,动态信道资源和能源效率控制技术的提升,很大程度依赖于早期精准的监测和对蜂窝基站流量的预测。分析基站流量数据,主要通过有效提取基站间隐含的时空信息进行流量预测。在本文中,我们通过对华北某大城市的实测数据,进行了基于时空关联性的分析,采用k-NN算法,获取蜂窝网基站间的时间相关性,选择合适的移动窗口大小,并结合了小波-Elman神经网络(ENN)算法来实现流量预测。最后,通过量化蜂窝网流量预测的准确度,并与先前存在的其他方法进行对比,得出了本文提出的方法有优越性。

流量预测;k-NN算法;Elman神经网络;小波变换分析

随着移动用户的快速增长,随之产生的数据流量也爆炸式地增长,据思科近期发布的关于全球移动数据流量预测的白皮书中,预计到2019年,全球移动数据流量的月度数值将会超过24.3 EB/月[1]。尽管目前移动数据流量只占了全球IP流量的一小部分,但其同期增长速度是全球IP无线流量的3倍。届时由智能手机所产生的移动数据总流量将占移动数据总流量的75%。爆炸式的数据流量增长方式给移动运营商对基站资源的有效分配,能源有效利用率的提高提出了巨大的挑战。因此,分析蜂窝网流量数据,并能有效预测未来流量数据对有限资源的优化及节能方面,显得尤为重要。

通过对流量数据的分析预测,主要为了帮助移动运营商预知未来几小时的拥堵情况,以及建立一个应用于提高网络容量的资源分配模型。此外,超过80%的能源被消耗在基站上[2]。因此,通过有效预测流量数据,关闭某些不需要的基站,对移动运营商来说,也是非常有利的。

在实测基站流量数据中,从每个基站搜集到的数据为离散的时间序列。对于时序数据的预测,目前存在很多中方法,如ARIMA(Auto-RegressiveIntegrated Moving Average)模型[3],MMPP(Markov Modulated Poisson Process)模型[4],以及线性预测模型[5]等。但由于用户的随机不规则行为活动,使得无线网络是非线性的以及基站的流量数据是非平稳的。因此,基于人工神经网络的预测方法已经广泛应用于时序数据的分析和预测。其中,因Elman网络是一个具有局部记忆单元和局部反馈连接的前向神经网络,因此,对于预测问题,对比传统预测方法以及 BP(Back Propagation)神经网络,它的性能更好[6]。结合小波变换分解对数据的预处理,能提取更稳定,更平滑以及更能量集中的信息,以此能有效提高数据的分析和预测性能[7]。在我们的论文中,主要在文献[7]的基础上,改进了基站流量数据的预处理过程,使用稀疏压缩感知的方法对缺失数据做了更高效的修补[8],用k-NN算法对训练样本大小做了更科学的调整。

1 小波-Elman神经网络算法原理

1.1 蜂窝网流量数据的特性

蜂窝网络的流量数据是一种与用户行为密切相关的数据,这也导致了采集到的流量数据的一些固有特征,以及具有明显的用户相关性。在时间维度上,首先,用户的行为一般都有明显的白天-黑夜模式的差异,白天时段的网络流量高,黑夜时段的网络流量低;其次,每个蜂窝网用户对于时间的管理和规划概念基本相同,比如,工作日由于大部分用户都处于工作状态,使用移动设备的时间较长,而周末大部分用户则处于休息状态,使用各种通信手段的概率明显降低。

在实际蜂窝网流量数据中,通常存在很大一部分数据的丢失,而很多基于历史流量数据的分析预测,都不允许有数据缺失或者丢失数据影响较大,因此对于流量数据的预处理对于最终预测性能的影响是至关重要的。

1.2 小波变换原理

离散小波变换(Discrete wavelet transform)在数字信号处理、石油勘探、地震预报、医学断层诊断、编码理论、量子物理及概率论等领域中都得到了广泛的应用[9]。函数ψ∈L2(R)被称为基本小波。

给定一个基波,通过对基本小波的尺度和平移,可得到:

如果函数f∈L2(R),则可用上述表示为

通过小波变换工具,将时序数据f用近似和细节系数cj,k表示。即可将f通过小波变换投影到不同的尺度[10-12],在一定的预测要求下,尺度选得太大并不能显著提高预测性能,反而会降低计算效率。具体分解方式如图1所示,首先将f分解成一个低频分量a1和一个高频分量d1,即分解为f=a1+d1。其次为了进一步分析f的细节特性,低频分量a1又可分解成a2和d2。因此,通过N级小波变换,可将f分解为f=d1+d2+d3+…+dN+aN。

在本文中,采用三级小波变换分解,以及用近似对称、光滑的紧支撑双正交小波Daubechies函数作为母小波。图1是一周内某基站流量数据及其小波分解系数。将原始信号分解成3个高频信号与一个低频信号。

图1 三级小波变换分解

1.3 Elman神经网络

Elman神经网络是一种典型的局部回归网络(Global feed for ward local recurrent)[13]。它的主要结构是前馈连接,包括输入层、隐含层、输出层,其连接权可以进行学习修正;反馈连接由一组“结构”单元构成,用来记忆前一时刻的输出值,其连接权值是固定的。图2为基本的Elman神经网络结构图。

图2 Elman神经网络基本结构

在本文中,由于蜂窝网流量本身的非线性特性,传统的神经网络无法准确预测其流量。而Elman神经网络是在传统网络基本结构的基础上,通过存储内部状态使其具备映射的动态特征功能,从而使系统具有适应时变特性的能力。

2 基于预测模型的算法实现

2.1 改进的相似基站算法

1)基站相似度

传统蜂窝网流量预测在对该网络的历史数据分析预测时,往往忽略了基站与基站之间的空间相关性,而流量的变化往往与用户行为事件的发生有关,比如基站a周边为某商业区,往往跟同为商业区的基站b变化趋势相似。因此,在对基站a的历史数据进行训练时,若把基站b的数据变化规律也学习进来,对最终的预测结果将有明显的提升。

在本文中,通过遍历计算与其他基站数据的相似度,从而找出相似度最佳的基站。比较两个序列的相似性常用算法有欧式距离与皮尔逊距离,两者间距离越小越相似。由于皮尔逊距离更能捕捉到两序列的变化趋势,因此本文采用的皮尔逊相关系数。计算公式如下所示:

其中,X,Y分别代表两个不同基站的数据,N为其长度。

2)加权相似

在实际生活中,存在各种突发事件的情况,而只找一个皮尔逊距离最小的基站往往无法反应出这种情形[14-15]。因此,在此基础上,我们又对其做了改进。

通过k-NN算法,找出与基站X最近似的k个基站,假设该k个基站分别为Y1,Y2,Y3,…Yk,相对应的k个相关系数分别为,将ρX,Yi通过ρX,Yi/∑ρX,Yi归一化后, 最终得到与基站X的加权相似基站Y为:

通过加权相似求得Y,对比没有加权的,构造出的样本对目标基站的预测更有针对性,也更加符合其变化趋势。

2.2 蜂窝流量预测方法

文中采用k-NN算法寻找最佳相似基站,并通过三级小波分解将信号f分解成4部分,通过移动窗口的方式构建训练样本与测试样本,最后将样本输入到Elman神经网络。其主要结构如图3所示。其中α3,d1,d2和d3为图1中由小波变换分解产生的序列,和为通过Elman小波变换输出的预测结果,并将其合成最终的时序数据。

图3 小波-Elman神经网络预测模型

3 仿真分析

3.1 仿真数据

文中以华北某大城市实际用户产生的移动基站流量数据做仿真,其中包含动态数据与静态数据,动态数据有基站等效流量话务量以及通话话务量,静态数据有每个基站的位置信息,天线高度以及网络类型等。选取时间为2012年6月1日至6月7日,采样间隔为1小时。在实际中,根据用户的作息规律,用户数据主要产生于早上6:00至晚上22:00,因此,在文中只对该时段内进行预测。

3.2 评价标准

为了定量评判最佳的预测方法,本文采用均方误差、标准平均绝对误差和平均百分比误差进行评价和比较。设X(i,j)为流量实测值,Xˆ(i,j)为流量预测值,n为测试点个数,则误差定义为:

均方误差

标准平均绝对误差

平均百分比误差

3.3 预测结果和误差分析

文中采用Matlab神经网络包进行仿真。为了使本文的方法达到最佳性能,对于Elman网络的参数进行了调优,最终参数如表1所示。

表1 Elman神经网络参数

基于改进小波-Elman神经网络算法预测的的蜂窝网流量相对误差如图4所示,将实测值和预测值相比较得到的逐点相对误差,详见表2。

图4 某基站预测流量的相对误差

从图4中,可以看出总体相对正负误差均在1.5%以下,处于可接受范围,其中早高峰与晚高峰时刻尤为准确,这也正符合实际需求。

为了与传统其他方法进行比较,采用同一批数据,分别用前向反馈神经网络(FNN)、带小波变换的前向反馈神经网络(FW)、Elman神经网络(ENN)以及线性预测做仿真。同时,为了体现出使用k-NN扩充样本的优越性,本文也对其做了比较。比较结果分别用均方误差(MSE)、标准平均绝对误差(NMAE)以及平均百分比误差(MAPE)评判。比较结果如表3所示。

表2 不同时刻对应的相对误差值

表3 不同方法的仿真结果比较

文中采用的预测模型在其它众多的基站中选取了最佳相似的作为预测对象的样本扩充,同时采用小波变换与Elman神经网络相结合的预测模型,使NMAE结果降至1.5%。

4 结 论

为了解决传统模型在蜂窝网流量预测中预测精度不够理想的问题,文中采用小波变换与Elman神经网络相结合的预测模型,并结合实际数据产生规律,提出了通过k-NN算法寻找最佳相似基站。仿真结果表明,文中使用的方法相比传统预测模型有更强的优势,具有较高的精准度,是一种有效的蜂窝网流量的预测方法。

[1]Index C V N.Global mobile data traffic forecastupdate,2010-2015[J].White Paper,February,2011.

[2] Fettweis G, Zimmermann E. ICT energy consumption-trends and challenges[C]//Proceedings of the 11th International Symposium on Wireless Personal Multimedia Communications,2008,2(4):6.

[3]Shu Y,Yu M,Liu J,et al.Wireless traffic modeling and prediction using seasonal ARIMA models[C]//Communications,2003.ICC'03.IEEE International Conference on.IEEE,2003(3):1675-1679.

[4]Sang A,Li S.A predictability analysis of network traffic[J].Computer networks,2002,39(4):329-345.

[5]Makhoul J.Linear prediction:A tutorial review[J]. Proceedings of the IEEE,1975,63(4):561-580.

[6]刘宁,陈昱颋,虞慧群,等.基于 Elman神经网络的交通流量预测方法 [J].华东理工大学学报:自然科学版,2011,37(2):204-209.

[7]Zang Y,Ni F,Feng Z,et al.Wavelet transform processing for cellular traffic prediction in machine learning networks[C]//Signal and Information Processing(ChinaSIP),2015 IEEE China Summit and International Conference on.IEEE,2015:458-462.

[8]Zhang Y,Roughan M,Willinger W,et al.Spatiotemporal compressive sensing and internet traffic matrices[C]//ACM SIGCOMM Computer Communication Review.ACM,2009,39(4):267-278.

[9]虞湘宾,董涛.一种离散小波变换的快速分解和重构算法[J].东南大学学报:自然科学版,2002,32(4):564-568.

[10]Percival D B,Walden A T.Wavelet methods for time series analysis [M].Cambridge university press,2006.

[11]Nguyen H T,Nabney I T.Combining the wavelet transform and forecasting models to predict gas forward prices[C]//Machine Learning and Applications,2008.ICMLA'08.Seventh International Conference on.IEEE,2008:311-317.

[12]Railean I,Stolojescu C,Moga S,et al.Wimax traffic forecasting based on neural networks in wavelet domain[C]//Research Challenges in Information Science(RCIS),2010 Fourth Interna-tional Conference on.IEEE,2010:443-452.

[13]Elman J L.Finding structure in time[J].Cognitive science,1990,14(2):179-211.

[14]罗辛,欧阳元新,熊璋,等.通过相似度支持度优化基于K近邻的协同过滤算法 [J].计算机学报, 2010,33(8):1437-1445.

[15]苏鹏,李玉忱,刘慧.一种新的加权k-最临近分类方法[J].计算机工程与应用,2004,39(35):183-185.

Cellular wireless traffic prediction based on improved wavelet-Elman neural network

NI Fei-xiang1,2
(1.Shanghai Institute of Microsystem and Information Technology,Shanghai 201210,China;2.University of Chinese Academy of Sciences,Beijing 100049,China)

In the wireless network system,theresource dynamic control and energy efficiency improvement allclosely depend on the early and precise prediction result of basestation traffic.The characteristic of network traffic volume overspace and time play an important role in traffic prediction.Inthis paper,we make the preprocessing based on both temporaland spatial view for the cellular traffic data generated by alarge population city of China.For each base station,combinethe most similar another one through using k-Nearest Neighbor,determine the most appropriatesliding window size,integrate the Elman Neural Network(ENN)and wavelet transform to achieve the traffic volume prediction.We present numerical results to illustrate the accuracy of wirelesstraffic volume prediction,and we test the performance of ourmethod to demonstrate improvement over some existing methods.

traffic volume analysis;k-NN;Elman neural network;wavelet transformanalysis

TN911.6

:A

:1674-6236(2017)03-0171-05

2016-02-25稿件编号:201602139

倪飞祥(1991—),男,浙江杭州人,硕士研究生。研究方向:通信中的大数据处理。

猜你喜欢

蜂窝小波基站
构造Daubechies小波的一些注记
蜂窝住宅
基于MATLAB的小波降噪研究
蓄热式炉用蜂窝体有了先进适用的标准
“蜂窝”住进轮胎里
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断
基于移动通信基站建设自动化探讨
可恶的“伪基站”
基于GSM基站ID的高速公路路径识别系统
小基站助力“提速降费”