APP下载

网格技术体系结构研究与应用状况综述

2007-03-06谢玳英胡京华

中国教育技术装备 2007年2期
关键词:资源整合网格资源

谢玳英 胡京华

摘要介绍了当前网格技术发展状况与网格体系结构的框架组成,以及综述了网格技术当前应用状况,提出了介绍校园网络资源整合的方案。

关键词 网格,资源整合,WS-资源

中图分类号:TP393文件标识码:A 文章编号:1671-489X(2007)02-0063-04

Researching on Framework of Grid Technology and Application Statement //Xie Daiying , Hu Jinghua

Abstract In this paper, the author analysesthe grid technology development and framework form of system structure, also discusses the current situation and brings forward the scheme ofcampus resources integration.

key words grid; resource integration; WS-resource

Author's address Capital Normal University, Beijing 100037

1网格技术

网格技术是近年来兴起的一个信息技术研究领域,它是基于internet分布式计算技术长期发展的必然结果。网格技术的研究目标是改变当前互联网资源利用率极低的状况,将网络上的各种可利用资源有效整合起来,从而提供强大的计算、存储和信息服务功能。

2Web Service资源框架(WSRF)与Globus ToolKit网格开发工具

2.1 Web Service资源框架(WSRF)

要了解WSRF,首先得了解网格体系结构,所谓网格体系结构,就是关于如何建造网格的技术。它给出了网格的基本组成与功能,描述了网格各组成部分的关系以及它们集成的方法或方式,刻画了支持网格有效运转的机制。目前,网格体系结构发展经过了五层沙漏结构、OGSA体系结构(Open GridServices Architecture)两种体系。

2.1.1五层沙漏模型

五层沙漏结构最重要的思想是以"协议"为中心,十分强调服务与应用编程接口(API)和软件开发工具包(SDK)的重要性。在五层沙漏结构中,共享的概念不仅仅是交换文件,而是更强调对计算机、软件、数据以及其他资源的直接访问。五层沙漏模型自上而下分别为应用层、汇聚层、资源层、连接层和构造层。

2.1.2 OGSA体系结构

五层沙漏结构虽然简单,但人们在研究中发现,在许多情况下,复杂的服务或应用很难分解为标准而低级的基本协议,而且人们在解决问题时也不习惯于按照协议的方式来进行。鉴于五层沙漏结构的不足,Ian Foster等人结合Web服务技术提出了一种新的网格体系结构--开放网格服务体系结构。

开放网格服务体系结构的思想一切都抽象为服务,包括计算机、程序、数据和仪器设备等。这种观念有利于通过统一的标准接口来管理和使用网格。Web服务提供了一种基于服务的框架结构。但是,Web服务面对的一般都是永久性服务,而在网格应用环境中,大量的是临时性的短暂服务。考虑到网格环境的具体特点,OGSA在原来的Web服务概念的基础上,提出了“网格服务”(Grid Service)的概念,用于解决与临时服务发现、动态服务创建以及服务生命周期管理等问题。基于网格服务的概念,OGSA将整个网格看作是"网格服务"的集合,但是这个集合不是一成不变的,而是可以扩展的,这反映了网格的动态特性。

OGSA是一个抽象的东西,是一个框架。由它提出了一个基于OGSA发展的核心规范OGSI(Open Grid Services Infranstucture),它是对OGSA的主要方面具体化、规范化。OGSI规定了向网格发送处理请求时所使用的接口,相当于Web 服务中的WSDL,在网格计算相关标准中处于核心地位。OGSI规范通过扩展Web服务的问题。

2.1.3 Web服务资源框架WSRF

同五层沙漏结构一样,OGSI体系规范也有自己的不足,主要表现在如下方面:

1)由于OGSI单个规范中的内容太多,所有接口和操作都与服务数据有关,缺乏通用性,而且OGSI规范没有对资源和服务进行区分;

2)不能与现存的Web服务和XML工具很好地工作;

3)太多的面向对象,OGSI通过封装资源的状态,将具有状态的资源建模为Web服务,这种做法引起了"web服务没有状态和实例"的争议,同时某些Web服务的实现不能适应网格服务的动态创建和销毁;

4)网格服务的定义语言GWSDL不能作为可支持Web服务描述语言WSDL1.1的功能扩展。

要理解 WSRF ,还要必须理解 Web 服务,并以标准的形式给出一种状态。 Web 服务是一个软件组件,它可以支持机器到机器的交互,具有使用机器适用的格式(WSDL)描述的网络地址接口。服务交互是使用 SOAP 消息描述的,通常由使用传输层协议(例如 HTTP 或其他 Web 标准)的 XML 序列化组成。从表面上看,Web Service就是一个应用程序向外界暴露出一个能够通过Web进行调用的API。这就是说,你能够用编程的方法通过Web调用来实现某个功能的应用程序。从本质层次来讲,Web服务是放置于Web站点上的可重用构件。Web服务可以分散于互联网上的各个地方,通过相互调用来协同完成特定任务。因此,Web Service表现的优势如下:

1)通过防火墙进行通信。因为Web Service的通信协议SOAP是基于http的,现有的防火墙都为http开了通道;

2)应用程序的集成;

3)B2B的集成,实现了客户逻辑业务和企业业务的集成;

4)组件与数据重用。因为Web Service的实现模式决定了在客户端的表示层上必须实现界面操作的重用。除此之外,在业务数据层上也可以实现数据库的共享;

但是,随着网格计算理论的提出和成型,Web Service也存在自身的不足,Web service只能提供基于http的应用服务,不能提供诸如网格计算之类的服务,更不用说是多元化的个性服务需求;Web service面对的一般都是永久服务,而在网格应用环境中,大量的是临时性的短暂服务。另一方面,Web服务接口不能提供服务与使用服务的客户之间进行某些隐含的保持状态的交互。

因此,为了实现网格与Web服务的有效融合,2004年由IBM、Globus联盟和HP共同提出Web服务资源框架(WS-Resouce Framwork,WSRF)和Web服务通知规范。WSRF实现了网格与Web 服务的融合,它既可以充分利用已有的Web服务领域的各种成果,又吸纳了网格技术,可以支持网格的需求,为网格和Web领域的发展建立了一个共同的基础。WSRF是和OGSI同一个层次的东西,是吸收了Web Service最新成果后,对OGSI的重构和发展。

WSRF采用了与OGSA中的网格服务完全不同的定义:资源是有状态的,服务是无状态的,它把有状态的实体统称有状态资源,有状态资源就具有特定生命周期和一组状态数据,可被一个或多个 Web 服务访问。有状态资源是任何即使您不与之交互也存在的东西,比如文件、数据库,或者某个具体的实体。生命周期是指资源从创建到消除这段时间。状态数据用 XML 文档来描述,通过对 XML 文档操作来对有状态资源的状态进行设置。

WSRF使用了不同的结构来模型化有状态资源和相应的Web 服务,而OGSI则是采用同一种结构来模型化状态资源以作为一个Web服务进行表示。在这一点上,WSRF比OGSI更具有表达力,因为它允许Web服务和任何相关联的有状态资源之间可以形成多对多的映射,而OGSI只能形成一对一的映射关系。另外,在OGSI中能表达的模式在WSRF中也都可以表达。

2.2网格开发工具--Globus Toolkit

Gloubus Toolkit(简称GT)是由Globus联盟(The Globus Alliance)开发实现网格的一组工具。Globus目前的主要工作是建立支持网格计算的通用协议,开发支持网格计算的服务,实现支持网格计算环境的软件开发工具。

Globus系统的主要组成部分有:

1)网格安全基础设施(GSI),负责在广域网络下的安全认证和加密通信,提供单点登录功能、远地身份鉴别功能、数据传输加密功能等,提供了基于GSI协议的接口,是保证网格计算安全性的核心部分。

2) Globus资源分配管理(GRAM),负责远程应用的资源请求处理、远程任务调度处理、远程任务管理等工作,负责对资源描述语言信息的解析和处理工作,是网格计算环境中的任务执行中心。

3)元计算目录服务(MDS),主要完成对网格计算环境中信息的发现、注册、查询、修改等工作,提供对网格计算环境的一个真实、实时的动态反应,是网格计算环境中的信息服务中心。

4)全局二级存储服务(GASS),简化在Globus环境中应用程序对远程文件I/O的操作,使得使用UNIX和标准C语言I/O库的应用程序基本不用改动就可以在Globus环境中中兴,是一个支持网格计算环境远程I/O访问的中间件。

5)网格FTP服务,是一个高性能、安全、可靠的数据传输协议,并对高带宽的广域网络环境进行了优化,是网格计算环境中的数据传输工具。

6)Globus复制管理,将部分相关数据只能放置在距离科学应用程序最近的位置,使得科学应用程序可以快速的对数据进行访问。

当前,GT版本已经发展到了4.0版。

3 网格技术的应用状况

3.1国外发展现状

在世界范围内,网格计算正处于飞速发展时期。在美国由自然科学基金资助的PACI(Partnership for Advanced Computational Infrastructure)项目,包括两个重要的部分:NCSA(National Computational Science Alliance)和NPACI(National Partnership for advanced Computational Infrastructure)。这一项目通过将学术界、政府部门和工业界的力量结合起来,建立一个网格计算基础设施的伙伴联盟,来促进科学发现和工程研究的发展。美国的NASA(National Aeronautics and Space Administration)正在构造一个网格计算实验床,称为IPG(Information Power Grid)[16],它可以将NASA分布在各地的资源通过网络(包括无线通信手段)连接起来,解决NASA目前无法解决的科学与工程。

远程分布式计算与通信项目的目标是创建一个用于访问美国能源部三个武器实验室的具有可操作性的格网,以支持国防计划中远程计算和分布式计算这两个关键战略领域复杂的分析、设计、制造、认证功能。

地球系统格网(Earth System Grid II,ESG)项目由阿贡国家实验室(Argonne National Laboratory)等五个国家实验室的科学家联合承担。主要目标是解决从全球地球系统模型分析和发现知识所面临的巨大挑战,为下一代气候研究提供一个无缝的强大的虚拟协同环境。

此外,目前美国正在进行的格网计算研发项目还包括Globus、美国航空航天局(NASA)的信息动力格网(Information Power Grid,IPG)、美国国家技术格网(National Technology Grid)、虚拟实验室项目(Virtual Laboratory Project)、天体物理仿真合作实验室(Astrophysics Simulation Collaboratory,ASC)、国际虚拟数据格网实验室(International Virtual Data Grid Laboratory,iVDGL)等。

3.2国内发展现状

在国内,网格计算正处于快速发展时期,主要大事有:

1999~2001年,在教育部支持下,李三立院士带领清华大学网格研究组进行了先进计算基础设施ACI(Advanced Computational Infrastructure)的研究。ACI将分布于北京和上海的两台自主研制的超级计算机连接成为聚合计个计算型的网格应用系统,取得了一系列研究成果。计算所在国家高性能计算环境之后,推出了"服务网格(Service Grid)"概念,并把其网格研究统称为"织女星网格(Vega Grid)"。其目标是使同一个平台同时具备以下几种能力:大规模的数据处理能力、高性能计算能力、资源共享和提高资源利用率的能力。

2002年4月5日~6日,科技部召开了“网格战略研讨会”,确认将网格的研究和应用列为“863计划”的一个专项,随即成立了专项专家组,钱德沛教授担任专家组组长。863网格专项投资高达3亿元,主要任务是研制面向网格的万亿次级高性能计算机、具有数万亿次聚合计算能力的高性能计算环境;开发具有自主知识产权的网格软件;建设科学研究、经济建设、社会发展和国防建设急需的重要应用网格;制定若干与网格相关的国家标准,参与制定国际标准,使一批发明专利和软件获得受理和登记,形成自主知识产权。这次研讨会标志着由863支持的”中国国家网格“ (China National Grid,简称CNGrid)专项正式启动。CNGrid将在全国设立多个网格结点,己经放置在北京中科院计算机网络信息中心的联想深腾6800速度达到4万亿次,即将落户上海超级计算中心的曙光4000A速度将达10万亿次。

4 网格技术在教育行业中的应用

美国典型的大学网格项目主要包括威斯康星大学麦迪逊分校的Condor、弗杰尼亚大学的Legion、田纳西大学的可伸缩的校园内部研究格网(Scalable Intracampus Research Grid,SinRG)和宾夕法尼亚大学网格。Condor项目的目标是开发支持高吞吐量计算的分布式计算资源的收集机制和工作负荷管理系统;Legion可以把不同体系结构、不同操作系统和不同物理位置的计算机资源连接成为一个系统;SinRG则用于田纳西大学Knoxville校区内部的医学图像处理、交互式分子设计、高级机械设计等跨学科研究领域的校园高性能计算基础设施。年8月,设在爱丁堡大学的“英国国家e-科学中心”成立,该中心将协调英国全国以及国际网格技术工作,使上网的计算机能合力进行复杂的科学运算。

现在很多科研和教学都需要用到各个大学的资源,如果没有网格的话,势必很难实现。网格计划使这些资源可以随意地集成和共享。基于对网格计算重要性的认识,2003年4月,国家教育部启动了一项构建下一代国家教育领域分布式计算平台计划——中国教育网格计划(ChinaGrid),为各所大学的科研和教学服务。中国教育科研网格是迄今为止由政府推出的最宏大的网格工程,该项目由12所大学联合推出。国家教育部希望利用网格技术将网上的教育资源有效地聚合起来,实现网上教育资源的广泛共享,为中国高等院校(特别是部分研究型大学)的科学研究提供先进的计算手段。

中国教育网格将在未来连接中国的100所重点高校,据初步分析,教育网格的建设将分三期工程,教育网格建设的具体时间表如下:2003年完成15个节点(即15所高校),2004年完成35个节点,2005年完成50个节点,2010年完成100个节点。目前,第一期工程的规划已经做完,首批入选的12所院校已开始构建各自的高性能计算平台。教育部计划投资1.3亿元,首期2500万元,计算平台采用英特尔奔腾2处理器,建成后可以实现每秒15~20万亿次计算能力,成为全球性能最高的网格计算平台之一。

中国教育科研网格将大大简化学生与研究人员共享全国教育与计算资源的方式,应用领域包括从生命科学、图象处理到远程教育等众多领域,从而发挥国内高校优秀教育科研资源的共享,大大节省投资。

5 总结

作为下一代Internet的关键技术,网格技术可以消除信息孤岛和知识孤岛,实现信息资源的智能共享,是目前对资源共享问题的较好的解决方案。在网络环境下建立网格平台,实现校园网内资源整合,对学校的信息化、数字化起到积极的促进作用。网格技术作为一种新技术,也在不断成熟中,它在未来网络中的应用前景,值得继续研究。

猜你喜欢

资源整合网格资源
用全等三角形破解网格题
少先队活动与校外资源整合的实践与探索
基础教育资源展示
“五育并举”下家校社资源整合的价值意义
一样的资源,不一样的收获
海外并购中的人力资源整合之道
反射的椭圆随机偏微分方程的网格逼近
资源回收
智慧高速资源整合方式实践
重叠网格装配中的一种改进ADT搜索方法