基于改进预测模型的云计算负载分类优化研究
2020-02-14武静丁星朱宏涛
武静 丁星 朱宏涛
摘 要: 针对当前大型云计算平台资源利用率相对较低的特点,提出一种改进后的负载分类模型,结合LR模型与ARIMA模型,以获得更优的云计算平台动态负载均衡。通过分析云计算负载的均衡流程,改进现有的负载分类模型;以LR模型与ARIMA模型作为分类选择,通过MATLAB2014R完成对云计算资源调度的优化模型实验。实验结果表明,改进模型明显优于现有模型,证明了该模型的有效性。
关键词: 云平台; 负载分类; 负载预测; LR模型; ARIMA模型
中图分类号:TP391.9 文献标识码:A 文章编号:1006-8228(2020)01-14-05
Abstract: In view of the current characteristics of low resource utilization of large cloud computing platforms which leads to waste, this paper proposed an improved load classification model, and combined with LR model and ARIMA mode to obtain better dynamic load balance. By analyzing the load balancing process of cloud computing, the existing load classification model was improved; using LR model and ARIMA model as the classification selection, MATLAB2014R was used to realize the cloud computing resource scheduling optimization model. The experimental results show that the improved model is obviously superior to the existing model, which proves the effectiveness of the model.
Key words: cloud platform; load classification; load prediction; LR model; ARIMA model
0 引言
云计算通过虚拟化技术,将大型数据中心的物理资源虚拟化成资源池,并将资源池中的资源以服务的形式租赁给用户,为用户托管云信息平台上的文件和应用程序提供服务[1]。近年来云计算技术迅速发展,云计算在现代的互联网科技中扮演着越来越重要的角色。由于云计算的分布式特性及弹性、高效的资源管理能力,云计算越来越受到应用信息领域的重视。其中如何实现计算资源的有效动态配置和共享使用成为当前云计算技术的主要研究课题[2]。云平台服务应用的增加使其负载数据呈现出明显的异构性和动态性,这使得各种应用的负载变化模式之间产生较大差别,单一预测模型已经不能很好地兼顾预测精确度与时间性能[3]。
1 相关理论
云计算是Kaur和Luthra[4]提出的一种基于internet的计算模型,在网络上以低成本高效共享计算资源或服务。云基础设施支持虚拟化文件共享,云用户通过虚拟化访问存储在服务器上的资源和文件。其中高效的资源调度和负载平衡是云平台实现高效共享的主要内容,目前已有研究工作主要针对云环境下的资源调度或负载均衡展开。
Assi [5]等人使用一种分解方法解决了云中的可伸缩流量管理(STM)问题,降低最大链路负载,保证网络用户之间的负载平衡;Dhinesh Babu L.D.[6]等人提供了一个使用蜜蜂行为的云环境中任务调度的视角,利用蜜蜂的行为来获得最佳的机器利用率。V. Priya[7]等人提出了基于模糊的多维资源调度和排队网络(F-MRSQN)方法,提高资源利用率并减少作业提交响应时间;史振华[8]针对云平台负载结合人工蜂群算法和SVM算法,提出IABC算法。
时间序列预测技术在云计算的负载均衡研究上也得到了大量的应用。Tofighy S[9]等提出了一种基于云资源使用历史的集成CPU负载预测模型,利用贝叶斯信息准则在每个时隙中选择最优的组成模型;Zhong W[10]等提出了一种基于加权小波支持向量机(WWSVM)的云负载预测模型,用于预测云数据中心的主机负荷序列;Amiri Maryam[11]等提出了一种基于序列模式的预测模型;江伟[12]等提出了一种基于自回归模型和Elman神经网络的预测模型,其使用ARMA模型来预测,再使用Elman神经网络对ARMA模型的误差进行预测,通过修正ARMA的输出值得到最终的预测值;刘春红[13]提出了一种基于任务时间尺度差异的负载分类模型。
2 负载分类模型
2.1 负载分类模型
在云平台负载预测系统中,用户的任务申请会经过接入控制进入负载均衡器,经过配置、监控、预测分类完成负载预测的过程。图1描述了云平台负载分类方法各组件间相互通信的工作过程。
该现有的负载分类模型较好实现了负载预测模型的分类,但该模型存在资源利用率低,资源浪费等缺陷。该模型中没有设置时间参数来平衡不同算法的时间性能,并且存在一个不合理的参数C,需要对这些不足进行改进。时间性能是评价一个算法是否优良的重要指标,对于现有的算法模型,提升它的时间性能有时是比较困难的。但对于负载分类模型,可以通过优化不同模型的分配方案,来达成对于模型时间性能的优化结果。現有的负载分类模型不能完好地比较出两种不同的负载模型在时间性能上的差距,因此可以考虑引入新的参数来平衡时间性能的影响。选取1000组实验数据,统计对于不同模型时间性能的测试结果,并计算不同模型预测时间的均值。设参数[uj]作为不同模型时间性能的权重,其数值取不同模型的统计的预测平均时长均值。将[uj]作为不同模型在负载变化率的权重,再通过L2范数防止数据的过拟合,能够提升分类模型的泛化能力,从而平衡预测的准确性和时间性能。参数C表示的是任务优先级对于模型选择的影响,其定义如下:
[Ai]的優先级为[pi],云平台的优先级区间为[a,b],[pi∈a,b]。[p*i]是[pi]的标准化值,[p*i=pi-ab-a]。[Ω]是高优先级任务的集合,[Ω_]是低优先级任务的集合。min1和min2分别是两个集合的负载平均变化率的值,[θ1]和[θ2]是阈值。表1从数据集中高优先级任务与低优先级任务各随机选取的500组数据,统计其高负载变化率于低负载变化率的占比。从表中可看出,任务优先级与负载变化率存在一定的关系,但将任务优先级作为负载分类的依据则会导致结果产生一定程度上的误差,从而影响结果的可靠性。
3 负载分类预测算法
负载分类模型对不同的作业匹配相应的预测模型以实现最优化目标,当添加新作业或者一个旧作业完成时,都需要重新确定[xij]的取值来分配预测模型算法。现有的LR模型的特点为模型较为简单,运行速度快,较为适合用于预测波动较小,负载变化率较低的数据,但当遇到负载波动较大的数据时则会产生较大的误差;SVM模型的目标是对特征空间划分最优超平面,最大化分类边际的思想是SVM方法的核心,当使用SVM模型算法训练较小的数据集时,会得出较为出色的结果,但SVM模型对于较大的数据训练集的效果并不佳,时间性能和预测准确度都会出现较大幅度的波动。本文研究的分类预测模型采用LR模型与ARIMA模型的组合,ARIMA模型的基本思想是将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。相比原模型采用的SVM模型,ARIMA的模型较为简单,在计算的时间维度上优于SVM模型,对于大型的数据集的处理具有更加稳定的效果,从而减少因为训练集变大而产生的误差。LR模型采用如下的表达形式:
[cε___t]的值越低,预测的总误差就越小,模型的预测就越准确。在预测周期内对数据集中应用负载分类模型的任务均匀的选择了20个时刻,预测20个时刻负载,并计算在这20个时刻时的累计误差,结果如图2所示。结合LR与ARIMA的优化模型预测累积误差最低,单一LR模型与ARIMA模型预测误差较高,结合LR与SVM的现有分类模型与结合LR与SVM的预测分类模型对比,优化后的模型的预测累计误差显著小于现有模型。由表2,与LR模型、ARIMA模型及现有分类模型相比,结合LR与ARIMA负载分类模型的平均误差减少了151.17%、73.76%、38.18%。对于大型的负载预测,单一预测模型比分类预测模型的累计误差大的多。本文提出的模型较大程度上优化了原有模型的性能。
5 结束语
本文重点研究解决了云计算环境下的负载预测问题,提供了一种改进后的负载预测分类模型。基于原有模型资源利用率较低,资源浪费等特点,添加了[u]参数作为两个不同的预测模型时间权重,移除了原模型中不合理的参数C产生的影响,并使用ARIMA模型替代原模型中的SVM模型。通过与原有模型对比,可知优化后的模型在相同的[λ]值时比原模型显著的减少了38.18%的实验误差,证明了优化后的模型的可靠性与可行性。优化模型能够有效地提升负载预测的准确度。在考虑预测误差与时间尺度的基础上,接下来可进一步考虑更多的针对实际运行中的云平台对负载预测产生影响的因素。
参考文献(References):
[1] Chang B R,Tsai H F,Chen C M.Evaluation of virtual machine performance and virtualized co-nsolidation ratio in cloud computing system[J].J-ournal of Information Hiding and Multimedia Si-gnal Processing, 2013.4(3):192-200
[2] Coutinho EF,Sousa FRD,Rego PAL,et al.Elasticity in cloud computing:a survey[J].ANNALS OF TELECOMMUNICATIONS-ANNALES DES TELECOMMUNICATIONS,2015.70(7-8):289-309
[3] Al-Dhuraibi,Y.,Paraiso F,Djarallah N,et al.Elasticity incloud coputing :state of the art and research challenges[J].IEEE Transctions on Services Coputing,2018.11(2):430-447
[4] Amandeep Kaur,Mr.Pawan Luthra.A review on load balancing in cloud environment,Internati-onal Journal of Computers & Technology,2018.17(1):7120-7125
[5] Chadi Assi,Sara Ayoubi,Samir Sebbah,Khaled S-haban,Towards scalabletraffic management in cl-oud data centers,IEEE Trans.Commun.2014.62(3):1033-1045
[6] L.D.Dhinesh Babu, P.Venkata Krishna,Hone-y bee behavior inspired loadbalancing of tasks in cloud computingenvironments,Appl.Soft Comp-ut.2013.13:2292-2303
[7] V. Priya,C.Sathiya Kumar,Ramani Kannan.Resour-ce scheduling algorithm with load balancing for c-loud service provisioning,Applied Soft Computing Journal,2019.76:416-424
[8] 史振华.云计算中基于IABC算法的负载预测的研究[J].计算机测量与控制,2018.26(9):195-199
[9] Tofighy,S,Rahmanian,AA,Ghobaei-Arani,M.An ens-emble CPU load prediction algorithm using a Ba-yesian information criterion and smooth filters in a cloud computing environment[J].Software Prac-tice&Experience,2018.48(12):2257-2277
[10] Zhong W,Zhuang Y,Sun J,et al.A load prediction model for cloud computing using PSO-based we-ighted wavelet support vector machine[J].Applied Intelligence,2018.48(11):4072-4083
[11] Amiri M,Mohammad-Khanli L,Mirandola R.An o-nline learning model based on episode mining f-or workload prediction in cloud[J].Future Generat-ion Computer Systems-The International Journal OF Escience,2018.87:93-101
[12] 陸兵.基于云计算的边防信息资源管理服务平台架构设计[J].计算机时代,2017.10:40-43
[13] 陈斌,甘茂林,李娟.一种基于负载均衡的云资源调度方法[J].计算机技术与发展,2017.27(6):51-55
[14] 田宏伟,解福,倪俊敏.云计算环境下基于粒子群算法的资源分配策略[J].计算机技术与发展,2011.21(12):22-25
[15] 任神河,郑寇全,关冬冬,惠军华.基于IFTS的云计算网络动态负载均衡方法[J].系统工程理论与实践,2019.39(5):1298-1307