一种用于卫星网络的业务预测方法*
2015-03-25张更新杨晗竹
魏 伍,张更新,吕 晶,杨晗竹
(解放军理工大学 通信工程学院,江苏 南京 210007)
一种用于卫星网络的业务预测方法*
魏 伍,张更新,吕 晶,杨晗竹
(解放军理工大学 通信工程学院,江苏 南京 210007)
针对卫星网络业务具有自相似的特点,介绍了一种基于集合经验模式分解的业务组合预测方法(EEMD)。该方法利用EEMD的分解特性,将具有自相似的网络流量分解成多个只具备短相关性的本征模态函数(IMF),这样便可使用传统的流量预测算法进行预测。文中使用人工神经网络与自回归滑动平均模型(ARMA)这两种方法进行预测。最后将多个本征模态函数(IMF)预测的结果相加作为原始信号的预测结果,实验证明此方法有更高的精度。为了迎合卫星实时性的需求,给出了硬件的框架,该框架采用DSP与FPGA相结合的构架实现连续数据的EEMD实时处理。
集合经验模式分解;本征模态函数;人工神经网络;ARMA
0 引 言
随着卫星技术的发展和日益增长的客户需求,卫星通信系统不仅承载低速的数据及话音(64kb/s以下)而且需要支持图像、声音、视频相结合的全新、高速率、交互式的宽带多媒体业务,在此也称为卫星宽带多媒体业务。面对有限的卫星带宽资源,如何对系统进行高效地管理,成为卫星通信系统研究领域的首要问题。
1994年,Leland发现网络流量数据呈现出的特性与以往电话网络流量数据具有非常大的差异,称之为自相似特性[1]。研究表明,自相似性不仅出现在因特网中,Ad hoc网络与卫星通信系统中都有此特性。自相似性包含了短程相关性与长程相关性。而传统的预测方法例如,泊松过程,自回归滑动平均模型(ARMA)[2],自回归积分滑动平均模型(ARIMA)[3]和卡尔曼滤波[4]等都是短程相关模型。因此,当这些模型被用于自相似性网络流量预测时,预测误差会较大。
针对网络流量的自相似性,近年来取得了显著的研究成果,一般分为四类:①基于时间序列的预测,如分数差分自回归求和滑动平均模型(FARIMA)[5],但基于时间序列的模型都是线性模型,所以在预测非线性、不确定性的业务流量时,模型性能变差,在每次计算时都要调整权值,因此计算量过大,预测结果有时要延迟几个时间段。②基于神经网络的预测(ANN)[6],主要有BP神经网络,RBF神经网络以及模糊神经网络等。其运用领域广泛,非线性函数拟合的效果较好。③基于混沌理论的预测,目前基于混沌理论的预测都只处于尝试阶段,并且对混沌现象的本质了解的还不够彻底。其计算过程还比较复杂,预测的可靠性和精度还无法保证。④组合预测,是指把不同的数据处理及预测方法结合起来,综合利用各自的优势,以合理的方式得出组合预测模型和最佳预测结果,从而达到提高预测精度和增加预测可靠性的效果。目前流量预测领域最主要的三类组合预测方法包括:基于神经网络的组合预测方法,基于小波理论的组合预测方法以及基于支持向量机理论的组合预测方法以及基于集合经验模式分解(EEMD)的组合预测方法。这些方法的关键在于将自相似流量数据转化为短相关数据,这样就可以用传统的方式进行预测了。
其中,EEMD的组合预测方法可以将自相似流量数据分解成若干路窄带本征模态函数(IMF),并验证了IMF是短相关的,从而减少了模型的复杂度,由于每路IMF特性有所不同,对此本文提出了一种结合ANN与ARMA的IMF预测方法。
1 基于集合经验模式的组合预测
1.1 互补集合经验模式分解(CEEMD)
(1)
(2)
(3)
接着对原始数据以及CEEMD处理得到的IMF1-3采用R/S进行分析。从图1,图2,图3中可知,原始数据的R/S图基本为一条直线,得到的斜率即为Hurst参数为0.83,说明原始信号确实具有自相似性(Hurst>0.5,说明序列有自相似性)。而IMF1的R/S图的数据点已经开始出现离散的情况,且Hurst值分别为0.42。IMF2-3的曲线已不是直线,所以虽然其Hurst值较大,其结果也不具有参考意义。从R/S图呈现的非直线特性及求得的Hurst值大小,可知这三路IMF中不具有明显的自相似特性。
图1 原始流量数据
图2 IMF1-9的数据
(a)Traffic Data
(b)IMF1
(c)IMF2
(d)IMF3
1.2 广义回归神经网络(GRNN)
广义回归神经网络(GRNN)在1991年由一个学者Donald F.Specht提出。GRNN是径向基函数(RBF)神经网络的一种,有着强大的非线性映射能力,适合处理多种非线性问题,并在拟合与学习能力方便强于RBFNN。与BP神经网络相比,GRNN不仅运算速度快,且在函数逼近能力和学习速度上均具有较强的优势,可更快地找到合适地预测网络,但spread因子的选取对GRNN预测地精度有较大影响,网络的训练过程实际上是优化平滑参数spread的过程。通过改变 spread,从而调整隐含层的传递函数,来获得最佳的回归 估计结果。如果 spread 取值不合适,GRNN 就无法达到预期的训练效果。为获得理想的 spread,使预测模 型具有良好的推广能力,采用果蝇优化算[7]法对 GRNN 模型中的平滑参数进行优化。由于果蝇算法[9]有局部最优的问题,这里进行了一些改进,步骤为:1)随机初始果蝇群体位置;2)附与果蝇个体利用嗅觉搜寻食物之随机方向与距离;3)由于无法得知食物位置,因此先估计与原点之距离(Dist),再计算味道浓度判定值(S),此值为距离之倒数;4)味道浓度判定值(S)代入味道浓度判定函数(或称为Fitness function)以求出该果蝇个体位置的味道浓度(Smelli);5)找出此果蝇群体的中味道浓度最高的果蝇(求极大值);6)保留最佳味道浓度值与x、y坐标,此时果蝇群体利用视觉往该位置飞去。为了增加种群的多样性,每只果蝇移动的范围不断扩大,使得移动出局部极值的概率增加;7)重复前6步。
1.3 自回归滑动平均模型(ARMA)
由于IMF3之后的各路IMF较为平缓,所以可以使用传统的IMF进行预测。而后的模型可以在分解时改变EEMD的分解规则,只分出3路,而后进行预测。
下面是ARMA(p, q)模型的数学形式,即:
(5)
目前ARMA模型作为一种经典的线性预测模型,其训练算法已较为成熟。
2 仿真实验分析
测试使用了上文所述的BC-pOct89中800点样本数据作为实验数据。具体实施时,首先通过CEEMD对所有800点数据进行分解。之后分别对IMF1采用GRNN模型,IMF2-IMF9采用ARMA模型进行建模,如图8所示。且利用分解结果中的前600点数据作为训练数据,后200点数据作为测试数据。之前由于数据过大,测试结果的评价采用如公式所示的误差度量形式:
(6)
图4 IMF1-GRNN预测
图5 IMF2-ARMA预测
图6 IMF3-ARMA预测
图7 GRNN-ARMA预测
IMFnMSEIMFnMSEIMF1(GRNN)3.71×10-3IMF1(ARMA)9.72×10-3IMF25.57×10-4IMF31.03×10-6IMF45.89×10-8IMF51.89×10-5IMF63.02×10-5IMF71.23×10-4IMF81.09×10-10IMF91.12×10-9IMF3-91.72×10-4——
表2 不同方法的预测结果(MSE)
从图5,图6,图7,表1,表2中,我们知道GRNN的精度高于ARMA。由总体的流量,ARMA与GRNN的仿真结果比单一的方法精度更高。为了迎合卫星实时性的需求,我们给出了硬件的框架见图8,该框架参考了Lee等人[10]提出了采用DSP与FPGA相结合的构架实现连续数据的EMD实时处理。Lee等人通过DSP构建了EMD专用处理器,实现对数据的高速处理。此外,利用FPGA实现管道和数据的传输控制,从而实现了数据的并行处理,提升了数据处理效率。具体的预测步骤是:首先通过EEMD对一段训练数据进行分析,从而分解得到的3路IMF训练相应的ANN和ARMA模型。之后基于该模型对下一时刻的流量数据进行预测。当下一时刻数据到来时,更新EEMD分解数据,并重复以上步骤。此外,预测过程中还将实时监测预测误差情况,并借鉴信号跟踪中跟踪丢失判断思想,采用当预测误差连续出现5次高于门限误差ethresh时,则认为流量状况发生明显变化,需要重新对预测模型进行训练。
图8 基于CEEMD流量预测的实时实现流程
3 结 语
文章对自相似流量预测进行了分析和研究。通过EEMD算法对原始数据进行分解,得到若干路IMF分量。经过理论证明,自相似流量经过EEMD分解后,各IMF分量呈现短相关性。由于分解后的IMF波动性依然较大,分别运用了GRNN与ARMA模型,并且在选取GRNN模型参数时运用了果蝇优化算,实验证明,单一的神经网络与ARMA模型精度低于组合算法。而在实时性方面也有理论性的支持,在接下来的研究中,需要进一步进行工程实践。
[1] Ilow J, Leung H. Self-Similar Texture Modeling using FARIMA Processes with Applications to Satellite Images [J]. IEEE Trans on Image Processing, pp.792-797,2001.
[2] BoxGEP, Jenkins G M, Reinsel G C. Time Series Analysis: Forecasting and Control. Upper Saddle River, [M] NJ: Prentice-Hall, 1994.
[3] YU Guo-qiang, ZHANG Chang-shui. Switching ARIMA Model based Forecasting for Traffic Flow [C]. Proc of ICASSP, 2004.
[4] Yantai S, J Zhi-gang, Z Lian-fang, Traffic Prediction using FARIMA Models[M]. Proc of ICC, 1999.
[5] Kolarov A, Atai A, Hui J. Application of Kalman Filter in High-Speed Networks[C]. Proc of Globecom,1994.
[6] 马容生.基于自适应神经网络的 P2P 流量检测研究[J]. 通信技术,2012, 45(06):113-120.
MA Rong-sheng. Study on P2P Stream Detection based on Auto-Adapted Neural Network[J], Communications Technology,Vol.45,No.06,2012, pp113-120.
[7] WU Zhao-hua and Norden E Huang. Ensemble Empirical Mode Decomposition: A Noise-Assisted Data Analysis Method[C]. Proceedings of the First International Conference on the Advance of Hilbert-Huang Transform and Its Applications, National Central University,Taiwan,2006.
[8] Yeh J R,Shieh J S and Huang N E. Complementary Ensemble Empirical Mode Decomposition: A Novel Noise Enhanced Data Analysis Method[J]. Advances in Adaptive Data Analysis, vol. 2, Issue 2, pp. 135-156, 2010.
[9] PAN Wen-tao. A New Fruit Fly Optimization Algorithm: Taking the Financial Distress Model as an Example. Knowledge-based Systems[C], (In Press), 2011, (SCI).
[10] Lee M, Shyu K, Lee P. Hardware Implementation of EMD using DSP and FPGA for Online Signal Processing [J]. IEEE Trans on Industrial Electronics, 2011, 58(6): 2473-2481.
Traffic Prediction Method for Satellite Network
WEI Wu,ZHANG Geng-xin,LV Jing,YANG Han-zhu
(College of Communication Engineering, PLA University of Science and Technology,Nanjing Jiangsu 210007, China)
For the self-similarity of satellite network traffic, a novel business portfolio prediction method based on EEMD (Ensemble Empirical Mode Decomposition) is proposed. This method uses the decomposition characteristic of EEMD to divide self-similar network traffic into multiple IMF (Intrinsic Mode Function) components merely with short dependence, so that traditional methods could be applied to the prediction. In the experiment, artificial neural networks and ARMA model are used to do the prediction. Finally,the summation of all IMFs perdition data is taken as the prediction result of original signal, and experiment verifies that this method could enjoy fairly high accuracy. In order to cater for real-time requirement of satellite network, the hardware framework is also proposed. This framework uses a combined architecture of DSP and FPGA to achieve EEMD real-time processing of continuous data.
EEMD; IMF; artificial neural networks; ARMA
10.3969/j.issn.1002-0802.2015.11.016
2015-06-09;
2015-09-12 Received date:2015-06-09;Revised date:2015-09-12
国家自然科学基金(No. 91338201)
Foundation Item:National Natural Science Foundation of China(No. 9133201)
TN927
A
1002-0802(2015)11-1285-05
魏 伍(1991—),男,硕士研究生,主要研究方向为卫星通信;
张更新(1967—),男,教授,主要研究方向为卫星通信,卫星导航,卫星测控;
吕 晶(1965—)男,教授,主要研究方向为卫星通信,卫星导航,卫星测控;
杨晗竹(1991—),女,硕士研究生,主要研究方向为卫星导航。