云计算环境下虚拟机资源均衡调度方法研究*

2013-02-19李济汉李素粉张云勇房秉毅

电信科学 2013年4期

李济汉，李素粉，张云勇，房秉毅

（1.北京邮电大学北京100876；2.中国联通集团研究院北京100048）

1 引言

云计算环境下，一些大型企业纷纷由传统业务向云服务转型，组建企业云，形成云服务资源池。例如，亚马逊建立专门的数据中心，以云服务的形式向用户和开发者提供存储服务器、带宽和CPU资源等。云计算在企业的深度和广度应用，必将催生大量云服务。以电信行业为例，国内外电信运营企业纷纷开展云计算相关的研究和应用，逐渐形成基础设施即服务（infrastructure as a service，IaaS）、平台即服务（platform as a service，PaaS）和软件即服务（software as a service，SaaS）3个层次的服务资源池，服务资源将呈现规模化和商业化特点[1,2]。这种情况下，面对规模日益庞大的云服务资源池，有效的云服务资源调度方法对于提高服务资源的整体利用率具有重要意义。

当虚拟化成为云计算的主要支撑技术后，资源虚拟化对数据中心的资源复用、关联、动态管理等方面都提出了新的挑战。云计算数据中心虚拟机资源利用率问题已经成为学术界的研究热点之一。目前常用的云服务资源调度规则主要有轮转法、最小负载优化法和散列法等[3]。轮转法通常是预先设定好一个轮转周期（如物理服务器个数），依次将用户需求的虚拟机分配给不同的物理服务器，一个轮转周期结束后重新开始新一个轮转；最小负载优化法是每次分配虚拟机时，检查前一段时间内有物理服务器的负载情况，总是选择当前一段时间内负载最小的物理服务器分配虚拟机；散列法预先设置一个散列函数，用于将反映用户需求的虚拟机映射到相应的物理服务器上。

基于上述基本调度规则，相关学者对云计算数据中心的虚拟机调度问题进行了大量研究。参考文献[4]针对云环境下，数据中心虚拟化资源的一致共享和多租户应用异构性之间的矛盾所带来的，服务器内部多种资源间分配不均衡问题，研究并提出了基于多维协同聚合的虚拟机调度机制。参考文献[5]针对云计算中物理服务器间的负载不均衡问题，提出一种基于多属性层次分析的虚拟机部署与调度策略，该算法将虚拟机按照资源的需求特点进行分类，根据该虚拟机量化后的权向量以及服务器资源的使用记录，对各个服务器进行预测评价，以期选择最佳服务器进行部署。参考文献[6]针对传统虚拟机调度方法中，虚拟机申请时调用相应负载均衡算法将虚拟机调度到相应的物理服务器上，不能达到整体效益最优的问题，提出了一种实时满足运营商资源最高效益的动态调度方法。基于该方法，每次新加入用户时，新加入的用户资源和先前分配的资源一起重新在所有服务器上规划，进行全局虚拟机调度，迁移那些能给系统带来足够效益的虚拟机，完成全局最优的虚拟机部署。

由于服务资源在处理业务请求时需要消耗一定的时间，随着访问服务资源次数的增加，服务请求会产生排队现象，导致等待时间的产生。在实际的业务服务选择中，排队等待时间往往是云服务资源调度的一个关键决策因素。然而现有文献鲜有提及。因此，本文提出了一种服务运行状态和服务等待时间的调度方法，并设计具体的计算规则，提高服务资源的均衡利用率。

2 问题描述与符号定义

本文主要针对云计算环境下虚拟机资源的调度问题进行分析。虚拟机资源是云计算环境下的一类主要云服务资源，载体是物理服务器资源。基于如图1所示的网络架构，用户向云服务资源池提出服务请求，云服务资源池根据物理服务器和虚拟机的当前运行情况，依据一定的策略将合适的虚拟机分配给当前用户，在满足用户需求的同时，使得服务器资源的总体利用率最高。

为有效提高资源池中虚拟机的平均利用率，本文针对饱和与不饱和两种资源池运行状态，分别设计虚拟机资源调度策略。为便于描述虚拟机资源调度算法，给出表1所示符号定义。

3 资源调度实现算法

假设云服务资源池中有I个物理服务器PSi，i=1，2，3，…，I，I为正整数，每个物理服务器PSi上承载Ji个虚拟服务器Si,j（以下简称虚拟机）,i=1，2，3，…，I，j=1，2，3，…，Ji，Ji是正整数，每个虚拟机可同时并行运行pNi,j个任务,pNi,j>0，是正整数。

表1 基本符号定义

利用任务到达触发资源分配，当任务到达时，基于资源调度规则，选择一个虚拟机资源，执行该任务。本文提出的虚拟机资源调度步骤如下。

步骤1根据资源池中物理服务器的运行状态，判断云服务资源池的运行状态PoolStatus，具体方法如下。

（1）通过图1所示的云服务资源监控与调度服务器，对于每个物理服务器PSi，获取其承载的每个虚拟机Si，j上正在运行的任务数pni，j。

（2）计算物理服务器PSi的利用率PMRatei，i=1，2，3，…，I，计算规则如式（1）：

其中，分母表示物理服务器PSi可以并行运行的最大任务数，分子表示当前运行的任务数。PMRatei=1，表示物理服务器PSi处于饱和运行状态；PMRatei=0，表示物理服务器i上没有虚拟机在执行任务，本文假设这种状态下，物理服务器i处于未开启状态。

（3）判定云服务资源池的运行状态PoolStatus。对于所有物理服务器PSi，如果均有PMRatei=1，i=1，2，3，…，I，即所有可以执行当前任务的物理服务器都开启且处于饱和运行状态，则将云服务资源池的状态记为饱和状态，即PoolStatus=1，转步骤3；否则记为不饱和状态，即PoolStatus=0，转步骤2。

步骤2对于不饱和运行的云服务资源池，选择一个虚拟机资源执行当前任务，具体实现步骤如下。

（1）根据物理服务器PSi的利用率PMRatei，判断是否所有物理服务器均未开启，即当前时刻该资源池没有运行任何任务。判断方法为：对于i=1，2，3，…，I，均有物理服务器PSi的利用率PMRatei=0，则表明所有物理服务器均未开启，转步骤（2），否则，转步骤（3）。

（2）开启第一台物理服务器PS1，并将当前任务安排在虚拟机S1，1上运行。

（3）在开启的物理服务器中，根据步骤1中的（2）计算物理服务器利用率PMRatei，选择利用率最小的一台物理服务器，转步骤（4）。存在两种特殊情况：若同时存在多台物理服务器PSi的利用率相同且最小，则选择值较小的一台物理服务器，转步骤（4）；若利用率最小的物理服务器PSi的利用率PMRatei=1，也就是说所有已开启的物理服务器均饱和，则开启下一台物理服务器，并选择该物理服务器上的第一个虚拟机执行当前任务，转步骤4。

（4）在步骤（3）选定的物理服务器上，根据每个虚拟机Si，j上正在运行的任务数pni，j，选择pni，j最小的一台虚拟机执行当前任务，如果同时存在多个虚拟机的pni，j相同且最小，则选择j值较小的一个虚拟机执行当前任务。

步骤3对于饱和运行的云服务资源池，计算所有虚拟机资源的等待时间，选择等待时间最短的虚拟机执行当前任务；对于候选虚拟机资源Si，j，如果当前运行实例数pni，j等于最大并行实例数pNi，j，则新的任务请求需要排队等待。对于饱和运行状态的云服务资源池，每个虚拟机资源均处于饱和运行状态，虚拟机资源等待时间的计算方法如下。

（1）由调度服务器检测虚拟机资源Si，j的运行状态并自动获取相应参数值，包括虚拟机Si，j当前运行实例数pni，j、虚拟机Si，j上进度最快的任务的执行进度sti，j、当前虚拟机Si，j的任务排队数量queuei，j、虚拟机Si，j运行完一个任务所需要的时间ti，j。

（2）计算虚拟机Si，j资源等待时间wti，j，计算方法如式（2）所示：

（3）选择等待时间wti，j最短的虚拟机执行当前任务，若同时存在多个虚拟机的等待时间相同且最小，则选择i，j值较小的虚拟机资源。

步骤4结束。

4 算例分析

为了评测算法性能，采用现有的策略与本方法进行比较。最小负载优化法是目前常用的一种均衡调度方法，即每次分配虚拟机时，检查前一段时间内有物理服务器的负载情况，总是选择当前一段时间内负载最小的物理服务器分配虚拟机。本文所提的调度方法实质上是对最小负载优化方法的一种改进方法。本节通过算例分析，将本文所提的虚拟机资源均衡调度方法与最小负载优化法进行比较分析。

假设云服务资源池包含I个物理服务器节点，令I=20，不失一般性，假设I个物理服务器上的虚拟机数量相同且Ji=5，i=1,2,3,…,I。对于云服务资源池的初始状态，采用随机方法设置。根据第3节步骤3的（1），描述云服务资源池当前运行状态的参数包括：虚拟机Si，j当前运行实例数pni，j、虚拟机Si，j上进度最快的任务的执行进度sti，j以及当前虚拟机Si，j的任务排队数量queuei，j。若表示物理服务器PSi处于关闭或者待机状态。对于当前需求情况，设计4种不同的当前任务数，分别是TN=1、5、20、50。

计算指标分为两种：物理服务器的平均利用率μ和物理服务器的利用率偏差σ，前者计算方法如式（3）描述，反映物理资源的利用率情况；后者采用均方差的计算方法，如式（4）描述，计算结果反映一个数据集的离散程度，在这里用于描述各个物理服务器资源的均衡利用程度。

其中，分母I0表示处于关闭状态的物理服务器数量，即PMRatei=0时的物理服务器数量。

其中，Yi∈{0，1}，当PMRatei=0时，Yi=0，否则Yi=1。

分别采用最小负载优化法和本文所提的调度方法，针对4种不同的当前任务需求，分别对上述算例进行计算，两种计算指标计算结果分别如表2和图2、图3所示。

表2和图2、图3显示，对于不同的当前任务请求数量，的值均优于或不劣于，且的值均优于或不劣于。表明本文所提的调度方法优于一般的最小负载优化方法，且随着当前请求任务数的增多，优势愈加明显。本文所提调度方法实质上是对最小负载优化方法的一种改进。通过该算例分析，进一步验证本文所提的虚拟机资源调度方法相对一般的最小负载优化方法具有改进效果。