APP下载

适应于网格环境的资源管理器模型设计

2009-06-05鸿

新媒体研究 2009年9期
关键词:网格调度节点

郑 鸿

[摘要]设计一个网格资源管理器模型,并对其各组件的功能实现进行介绍。

[关键词]网格 GlobusToolkit4 资源管理器

中图分类号:TP3文献标识码:A文章编号:1671-7597(2009)0510015-01

一、引言

网格(Grid)是将分布在不同地理位置的计算资源,通过高速的互联网组成充分共享的资源集成,从而提供一种高性能计算、管理及服务的资源能力。网格技术是继Internet技术和Web技术之后的第三代互联网技术,它能够最大限度的实现网络资源共享和调度,给计算机用户带来最好的上网服务。网格是对互联网技术的又一大进步,是第三代互联网大浪潮。

由于各种资源、管理机制、用户和应用程序间存在大规模的异构性,使得网格的资源管理比分布式或集群计算环境下的资源管理更加复杂,因此建立适应于网格环境的资源管理系统模型,研究其特征及功能,为具体实现网格资源管理系统是很有必要的。

二、网格资源管理器模型

网格资源管理是网格的重要组件,本文设计的网格资源管理器的结构如图1所示。该资源管理器采用层次式的结构,为用户提供了资源发现、作业提交、作业管理和监控等功能。整个调度模型由作业收集器、信息采集器、作业调度器、作业管理器、调度记录器以及数据库组成。

三、网格资源管理器功能描述

1.作业收集器

作业收集器是整个全局调度器面向用户的接口。作业收集器负责收集用户提供的作业名称、位置,执行程序所需的参数,作业结果文件的名称与路径等信息。并存入作业信息数据库,为作业调度服务。

2.信息采集器

资源信息采集器主要是针对网格系统中的节点及节点信息进行查询。网格节点的信息由动态信息和静态信息组成。动态信息按照一个固定的时间间隔采样得到,比如CPU、内存的利用率、作业队列长度等。由于动态信息对网格资源调度起着重要的作用,因此需要保证动态信息的实时性。静态信息是不会随时间变化的信息,比如内存大小、硬件类型,操作系统等,这些信息在资源获取时一次采样得到。本文采用GlobusToolkit4中的信息服务组件MDS4实现了网格信息的收集和发布。

3.作业调度器

作业调度器负责具体资源的选择,由作业调度、容错机制和反馈机制组成。作业调度功能是把等待执行的作业从作业队列中取出,然后组成等待队列。然后根据调度策略选择合适的资源节点,生成调度结果。容错机制功能是当作业运行失败后,调度器要进行容错处理。当运行过程中监控到某个节点失效时,将该节点上的失败作业重调度到另一节点上,保障网格系统全局的负载平衡。如果在一个有效期内收不到某节点的状态信息,也认为该资源失效,把调度到该资源上的所有作业重新加入作业队列。反馈机制功能是对于执行完成的作业,根据反馈的执行时间信息,可以调整等待队列中类似作业的时间信息。同时,调度器还会把作业和作业分配时资源的信息记入数据库,为未来作业的调度提供依据。

4.作业管理器

作业管理器包括作业提交器和作业监控器两部分的功能。作业提交器的作用是对作业生成RSL文件,然后向具体的资源节点提交。同时提交器还要把调度信息记写入调度日志中,当作业完成后,提交器还负责结果的收集,无论作业成功或失败都提供在线结果信息。作业监控器的作用就是监听作业状态信息,以便能及时对失败的作业进行容错处理。网格作业的基本状态包括:Submitted,Pending,Running,Done,Failed。作业状态的转换情况是一旦提交作业,状态将显示为Pending,如果已经开始执行,则将作业从Pending表中删除,而在Running表中添加该作业,表示正在运行。如果该作业的当前状态为Done或Failed时,则将该作业Running表中删除,同时更新网格作业信息,将作业状态更新为相应的状态。

5.调度记录器

调度记录器的作用是用来记录调度结果,保障调度执行。包括调度标识、作业标识、资源标识、作业描述、作业状态、提交时间等方面。由于网格资源的动态性和不稳定性,会出现资源故障或退出的情况,如果通过资源监控发现某个资源节点失效,那么作业调度器将根据调度日志生成重新生成RSL请求,产生调度结果。

四、小结

网格资源管理系统目前绝大多数的研究仅仅是局限于理论或原型系统,建立一个适应于网格环境的资源管理系统模型,研究其特征及功能,为具体实现网格资源管理系统起到举足轻重的作用。本文设计的网格资源管理器已经应用到信息处理和计算网格中去,并取得了一定的效果。下一步工作是在资源描述、容错处理等方面进行研究,进一步优化和完善该资源管理器。

参考文献:

[1]田志民、赵剑、翟正利等,面向服务的网格资源管理模型研究[J].计算机应用研究,2006,04:25-27.

[2]李培峰、朱巧明、支丽艳,面向信息服务的网格资源管理器的设计[J].计算机工程,2008,03:49-51.

[3]金海、陈刚、赵美平,容错计算网格作业调度模型的研究[J].计算机研究与发展,2004,08:1382-1388.

[4]林琳、唐阔、胡亮、范溯,远程调用方法及其在Globus Toolkit4中的应用[J].吉林大学学报(信息科学版),2007,06:617-624

作者简介:

郑鸿,男,广东饶平人,广东工业大学2009级软件工程硕士班学员,研究方向:软件工程、网络技术。

猜你喜欢

网格调度节点
水资源平衡调度在农田水利工程中的应用
智能四向穿梭车系统的应用与调度对策研究
10kV配网调度运行故障及控制对策
基于移动汇聚节点和分簇的改进节能路由算法
CAE软件操作小百科(48)
追逐
基于点权的混合K-shell关键节点识别方法
增加网格 以退求进
浅谈基于P2P的网络教学系统节点信息收集算法