基于SLA的云计算资源调度机制研究

2014-07-24鄂雪妮桂雁军

武汉理工大学学报（信息与管理工程版） 2014年2期

雷洁，鄂雪妮，桂雁军

(1.武汉理工大学经济学院，湖北武汉430070;2.福建新奇特车业服务有限公司上海分公司，上海201824)

1 研究背景

云计算资源调度指的是在特定的云环境中，根据云计算资源使用规则，在满足用户任务需求和QoS需求的情况下，对不同用户所使用的资源进行动态调整和分配的过程，并且通过这种调度，实现云计算资源的优化配置［1］。IaaS资源提供商拥有分布广泛的数据中心，其中包含种类多样的资源，面对实时动态变化的用户需求以及需要考虑的系统性能和成本等因素使云计算的资源调度问题非常复杂。

云服务提供商和用户通常需要通过协商谈判签订服务等级协议(SLA)来保证自身利益和服务质量［2］。在SLA中规定了服务的响应时间，数据的安全保障等QoS的内容以及计费付费模式等，可以说SLA是评判云服务的标准，也是各商业角色最关注的环节之一［3－4］。但是云计算大规模集群式的服务器模式、基础设施的异构性，以及服务类型的多样性，导致系统中资源状态变化频繁进而无法按时按量地提供服务，造成SLA违约。

基于SLA的调度技术是用以满足签署的SLA中指定的服务质量等级而支持资源提供商对资源进行重新配置资源，并且根据SLA的不同，基于SLA的调度必须根据其优先级来区分用户的重要度。文献［5］全面提出的云环境中面向SLA的资源管理包括用户驱动的服务管理、计算风险管理、自动化的资源管理，能进行面向SLA的资源分配、定义服务的基准和进行服务测量以及评价。文献［6］提出了一种最小化系统能耗并满足用户服务水平协议的启发式调度方法。而从IaaS提供商的角度，文献［7］就事物型负载和非交互型批量负载定义了负载模型、SLA模型和惩罚模型。在利用BF算法的工作量预测模型的基础上对两种负载争夺资源的情况下提出了任务准入控制和虚拟机调度策略。

从正在研究的系统来看，SLA@SOI是欧盟的一个联合项目［8］，主要研究在规范的SLA基础上如何管理面向服务的基础设施，设计出基于SLA的 SOI架构和服务管理架构［9］。FOSII［10］系统管理过程基于一个MAPE［11］的生命周期分别为监测、分析、计划和执行，能实现一个自动化的基于SLA的服务管理。该系统主要包括LAYSI框架和LoM2HiS框架［12］，前者实现SLA协议的协商建立与服务部署，后者实现对SLA指标的监测和映射。

在实际资源服务提供商方面，近年来也出现了若干通过SLA技术实现IaaS层QoS保证机制的商用云计算系统或平台，主要包括Amazon弹性EC2、GoGrid云平台和Rackspac云平台等。

综上所述，现有研究在通过虚拟机迁移实现负载均衡时往往以降低系统能耗或减小系统处理时间为目标，且现有的IaaS层的资源调度没有区别不同数据中心的使用成本，无法实现IaaS资源服务提供商在保证任务的QoS同时获得最大的收益。因此，研究基于SLA的云计算资源调度机制在理论和现实上具有重要的意义。

2 基于SLA的云计算资源调度框架设计

2.1 云计算资源调度框架

为解决面向动态的环境如何根据用户定制的SLA管理、分配和调度资源来保证资源服务的QoS，并实现IaaS资源提供商拥有的多数据中心任务调度及负载均衡等问题，提出了基于SLA管理的云计算资源调度框架，该框架包含4个主要部分，分别是任务调度模块、负载均衡模块、SLA管理模块和资源服务QoS模块。在SLA的管理下，能够在保证资源服务的QoS同时最大化IaaS资源提供商利益，可以在需要时触发负载均衡模块，优化数据中心性能，提高资源利用率。基于SLA管理的云计算资源调度框架如图1所示。

2.2 资源服务QoS模块

图1 基于SLA管理的云计算资源调度框架图

在传统Web服务的QoS特性以及网络服务的基础上，同时考虑IaaS层所提供资源服务的特点，设计了具有一定特性的QoS模型，该模型具有适合于云资源服务的QoS特性，这些特性具体包括以下6个方面:服务时间、服务代价、可靠性、可控性、易用性和安全性。

(1)服务时间，即响应时间、执行时间、运行时间和故障恢复时间。

(2)服务代价，即服务费用(按需运行、保留宗制、现货定价)。

(3)可靠性，即可用性、适合性、可扩展性、可预测性、易恢复性和成功率。

(4)可控性，即可调整性、可告知性、可分析性、目检性和文档水平。

(5)易用性，即易理解性、易操作性、易部署性和标准性。

(6)安全性，即数据隔离性、权限和冗余配置。

2.3 基于SLA的多云数据中心任务调度模块

在IaaS层的调度需要考虑的是，一个IaaS资源服务提供商设有许多个数据中心，虽然每个数据中心有能提供同样资源服务的虚拟机，但因为数据中心的位置、主机的资源可用性等客观因素会使不同数据中心资源提供的成本不同。不同的任务SLA规定的QoS指标不同，IaaS层调度既要考虑尽量满足任务的SLA，又要实时保证接收每一个任务获得的接收收益最大。笔者以此为基础提出了基于SLA的多云数据中心任务调度机制，通过建立一个全面的效益模型、一个有效的任务准入控制策略来指导任务调度机制，进而实现在SLA的约束下通过寻找最小成本的调度选择，使IaaS资源服务提供商获得最大的收益。

基于SLA的多云数据中心任务调度模块包括任务调度效益分析和准入控制模块。通过分析任务请求，匹配已有的SLA信息库，对该种任务的SLA进行定义与转换，根据任务的SLA进行任务调度的效益分析，通过准入控制器提供4种策略对任务请求的可能调度决策进行比较，对比资源提供商的要求决定是否接受任务并最终将任务调度到最优的数据中心虚拟机上。

在任务调度模块提出了两种获得收益最大的任务调度思想，结合准入控制分析策略，通过最大化虚拟机数量和重调度进行任务在线调度。涉及的任务在线调度策略主要分为两个部分，首先是任务的准入控制机制，分析通过3种准入控制策略预计最大接收收益是否大于期待的成本回报，如果大于则按照调度决策表执行调度，否则拒绝该任务，继续判断下一个任务执行调度。

如果资源提供商可以通过减小成本使得收益最大化，那么通过最大化利用已经开启虚拟机的效用可以最小化开启虚拟机数量。于是提出最小化虚拟机数量的最大收益任务调度策略的流程为:新任务到达时，首先依次对每个数据中心中开启的需求虚拟机执行等待策略，如果调度信息为拒绝操作，则执行新开虚拟机策略，直到所有的数据中心执行完毕，取调度列表中接收回报最大的执行调度，并返回该调度表。

对于紧急并且预算高的任务不仅只执行等待或开启新虚拟机策略，而是可以通过重调度，将其按条件插入前一等待任务前，这样可以利用最少的资源，以及最大的时间空闲，最大化地接受任务从而获得高收益。为此提出基于重调度的收益最大化任务调度策略的流程为:新任务到达时，首先依次对每个数据中心中开启的需求虚拟机进行插入策略，同时执行开启新虚拟机策略，计算各自最大的单位时间接收利润，直到所有的数据中心执行完毕，取调度列表中接收回报最大的执行调度，并返回该调度表。

2.4 基于SLA的云数据中心负载均衡模块

负载均衡模块主要包括资源监控、负载预测、负载评价、迁移分析和虚拟机迁移模块。资源监控模块在服务运行时既要监测服务的SLA指标是否实现，又要监测虚拟机资源和主机资源的实时运行情况并存入各自的信息库。

针对不同的系统、不同的应用需求，笔者提出了结合预测的资源负载均衡调度框架，实现在局部范围内，在特定条件下，达到最优的负载均衡。首先设计基于SLA的系统负载状态评价方法，对虚拟机层和物理机层建立不同负载评价标准;然后结合负载预测的方法，预先了解各主机负载变化趋势;最后进行基于SLA的虚拟机迁移效益分析，迁移对系统有益的虚拟机，实现虚拟机的均衡调度。该框架包括负载均衡器，负载评价，负载预测，迁移估计，执行虚拟机迁移5个步骤。在负载均衡调度触发时，负载评价通过收集各节点负载信息和基于类型划分的任务SLA信息对资源池中的虚拟机和物理机进行负载评价。与此同时，从需要进行负载均衡的热点主机列表中，根据主机负载预测得到候选均衡主机列表，再在候选均衡主机列表中取出热点虚拟机，得到候选虚拟机迁移列表，然后迁移估计模块对候选虚拟机迁移进行迁移效益分析，通过计算此刻虚拟机列表中各类虚拟机上任务违反SLA的违约金，以及迁移代价，有选择性地调度虚拟机，并按照收益从高到低得出优先级列表，根据优先级列表的顺序排列需要迁移的虚拟机到虚拟机迁移列表开始进行负载均衡。

服务平均响应时间是一段时间内所有请求的响应时间的平均值，可以用来衡量这段时间内请求响应时间的集中趋势，是SLA协议中经常用到的一种简单的性能观测和评估指标。模块中的SLA收益模型针对服务平均响应时间进行评估和计费，服务提供商只有满足服务平均响应时间这一性能指标才能获得应得的收益，否则将受到一定的惩罚。

云计算数据中心的物理主机负载经常处于动态变化中，当一台物理主机负载过大时，可以考虑增加主机来分担重载主机的负载。然而，在没有额外增加主机时，可以将重载主机运行的虚拟机迁移到其他主机，使整个数据中心主机的资源利用率得到均衡。

2.5 SLA管理模块

SLA管理模块是资源调度的基础，管理存在于整个服务生命周期的SLA，与任务调度和负载均衡模块交互，实现对用户服务质量的保证。

基于SLA管理的服务质量保证过程针对IaaS平台提供资源服务的过程和特点，通过使用SLA管理来实现。该过程包括SLA定义(模板)，SLA协商、SLA配置(转换执行)、SLA监测和SLA调整。除此之外SLA管理也与框架的其他功能模块进行交互，包括资源调度模块、资源监控模块，并生成质量评估报告。其过程如图2所示。

图2 基于SLA管理的服务质量保证过程

(1)SLA定义。SLA的定义是资源提供商设计SLA模板的过程，SLA模板包括了服务的内容和对服务质量的保证条款，描述了服务质量目标(SLO)的组合及水平的描述。服务提供者将SLA模板存入SLA信息库，用户可以查找到适合自己业务需求的SLA模板。

(2)SLA协商。用户有自己的QoS需求，资源提供商也有自己最大可能提供的服务保证。资源提供商和用户对资源服务的水平进行协商，将用户选择的SLA模板细化成某一服务的SLA包含具体的QoS特性及其指标，针对这一服务的SLA选择协商就是这个过程。同时，对服务质量等参数的约束以及违约的惩罚措施等也可以用SLA来描述。

(3)SLA转换执行。资源提供商根据协定的SLA的内容，把高层次用户级别的SLA变为低层次的资源管理级别的SLA。也就是说，把合约中规定的服务水平转换成服务的配置条件、服务运行过程中所使用的各种资源的要求，并对相关优先级进行设置。转换后的指标将作为资源管理和调度决策的依据，并为SLA监测提供监测标准。

(4)SLA监测。SLA监测负责在运行时监控SLA参数，主要包括一些功能特性、执行时间和响应时间等监测内容，然后比较与已协商的服务等级目标的一致性程度，并进行SLA违例记录以及SLA违例的预警，同时生成质量报告提供性能优化依据。

(5)SLA调整。当SLA违例情况经常发生时，SLA调整模块会通知用户增加资源数量。在某些SLA参数指标定义不合理导致双方利益不能满足的情况下，SLA调整模块会及时通知SLA定义模块修改SLA模板内容。

3 结论

在以商业动作为导向的云计算中，资源调度策略同时要考虑经济效益、资源利用和服务质量等各方面的因素。云服务提供商和用户通常需要通过协商谈判签订服务等级协议(SLA)来保证自身利益和服务质量。基于SLA的云计算资源调度机制面向资源服务提供商根据用户定制的SLA管理、分配和调度资源来保证用户在有限的预算内获得较高的服务质量的同时实现自己在SLA的约束下获得最大的收益。

［1］林伟伟，齐德昱.云计算资源调度研究综述［J］.计算机科学，2012，39(10):1 －6.

［2］PATEL P，RANABAHU A，SHETH A.Service level agreement in cloud computing［J］.Cloud Workshops at OOPSLA，2009，1(1):23 －29.

［3］王小鹏，张洪良，石启良.云计算环境下的服务等级协议管理［J］.电信快报:网络与通信，2012(5):19 －23.

［4］赵又霖，邓仲华，黎春兰.云服务等级协议的生命周期管理研究［J］.图书与情报，2013(1):51－57.

［5］RAJKUMAR B，SAURABH K G，RODRIGO N C.SLA－oriented resource provisioning for cloud computing:challenges，architecture，and solutions［C］∥2011 International Conference on Cloud and Service Computing.［S.l.］:［s.n.］，2011:1 －10.

［6］GOUDARZIH，GHASEMAZARM，PEDRAM M.SLA－based optimization of power and migration cost in cloud computing［C］∥Cluster，Cloud and Grid Computing(CCGrid)，2012 12th IEEE/ACM International Symposium.［S.l.］:［s.n.］，2012:172 －179.

［7］MICHAELM，IVONA B，VINCENTE，etal.Towards knowledgemanagement in self－ adaptable clouds［C］∥IEEE 2010 Fourth International Workshop of Software Engineering for Adaptive Service－Oriented Systems(SEASS ＇10)，in Conjunction with ICWS 2010 and SCC 2010.［S.l.］:［s.n.］，2010:103 －109.

［8］何剑虹，白晓颖，李润玲，等.基于SLA的面向服务的基础设施［J］.电讯技术，2011(9):100－105.

［9］MICHAELM，IVAN B，VINCENTE，etal.Revealing the MAPE loop for the autonomic management of cloud infrastructures［C］∥ Workshop on Management of Cloud Systems(MoCS 2011)，in Association with the IEEE Symposium on Computers and Communications(ISCC 2011).［S.l.］:［s.n.］，2011:121 －128.

［10］FOSII.Foundations of self－ go verning ICT infrastructures［EB/OL］.［2013 － 10 － 02］.http://www.infosys.tuwien.ac.at/linksites/FOSII/index.html.

［11］IVONA B，VINCENT E，MICHAELM，et al.LAYSI:a layered approach for SLA－violation propagation in self－manageable cloud infrastructures［C］∥The First IEEE InternationalWorkshop on Emerging Applications for Cloud Computing(CloudApp 2010)，in Conjunction with the 34th Annual IEEE International Computer Software and Applications Conference Seoul.［S.l.］:［s.n.］，2010:365 －370.

［12］VINCENT E，IVONA B，MICHAEL M，et al.Low levelmetrics to high level SLAs－LoM2HiS framework:bridging the gap between monitored metrics and SLA parameters in cloud environments［C］∥The 2010 High Performance Computing and Simulation Conference(HPCS 2010)，in Conjunction with The 6th International Wireless Communications and Mobile Computing Conference(IWCMC 2010).［S.l.］:［s.n.］，2010:48 －54.