网格技术综述
2010-08-15余科军
余科军
(四川教育学院计算机科学系,四川成都610041)
1.引言
随着应用环境越来越复杂多变,系统规模更大,异构系统更多,异地分布更广,通信环境更复杂,如何构建一个完善的网格系统就成为我们研究的主要课题。网格的研究源于美国联邦政府过去10多年来资助的高性能计算项目。这类研究使用的名词就是“网格”或“计算网格”。网格能够充分吸纳各种计算资源,并将它们转化成一种随处可得的、可靠的、标准的同时还是经济的计算能力[1]。这类研究的目标是将跨地域的多台高性能计算机、大型数据库、贵重科研设备、通信设备、可视化设备和各种传感器整合成一个巨大的超级计算机系统,支持科学计算和科学研究。
网格就是一个集成的计算与资源环境,或者说是一个计算资源池[2]。网格技术可以将足够的计算机资源分配给分布在世界各地的计算机,它通过并行处理来提高分配到每个网格计算节点的计算速度。
2.国内外网格技术的研究
网格(Grid)技术是近年来国际上信息技术领域的热门课题,因此目前许多组织开发了支持网格计算的系统。网格计算研究起步最早的国家是美国,美国多家研究机构开展了与网格相关的研究工作,制定了很多网格研究计划,如美国国家科学基金会资助的TeraGrid、美国国防部的“全球信息网格”(GIG)、美国政府资助的“大型物理实验网格”(GriPhyN)及美国能源部的ASCIGrid、国家技术网格(NTG)等计划。美国国家科学基金会TeraGrid计划是一个需要多年分段实施的,为开放式科学研究而建立和使用的世界上最大、最全面的分布式基础设施。
欧洲近年来启动了一系列网格开发计划,其中包括DataGrid、SIMDAT、NextGRID、AkoGriMo和CoreGRID等计划”。欧洲数据网格计划(DataGrid)涉及到欧盟的二十几个国家,其目的是开发一种能支持全球性分布科学探索的全新环境。SIMDAT是欧洲的一个大型网格研究计划。该计划的目标是利用数据中心的网格技术来开发解决工业复杂问题的方案。NextGRID是面向工商业领域建立的下一代网格服务结构。该计划针对的是广泛的应用领域:法律部门的数据挖掘;广播和娱乐;金融模型;数字媒体和供应链管理。CoreGRID计划的核心网格是一个研究网络,主要用于大规模分布式网格和对等技术的基础建设、软件基础设施和应用。
日本认为网格计算技术将极大地改变日本的产业结构,成为激活经济的原动力。日本主要在进行国家研究网格计划(NAREGI)和生物网格计划(BioGrid)的研究。NAREGI计划是日本文部科学省推出的“激活经济研究开发计划”,目标是使最高运算速度达到100TFLOPS。生物网格计划(BioGrid)是在2002年启动的一项为期五年的网格研究计划,主要由日本文部科学省资助。计划利用网格计算技术与超高速网络,将各大学生物工程研究机构所拥有的超级计算机、数据库、高性能观测设备等研究资源联合起来。
我国同世界其他各国政府一样,为大幅度提高我国的综合国力和国际竞争能力,对于网格的建设也十分关注,同时在网格计算方面做了大量基础性和前瞻性研究工作,并在863专项中提出了具体的目标,专项确立了“战略与系统综合研究”、“高性能计算机”、“网格结点”、“网格软件”和“应用网格”五个方面的课题。其主要任务是研制面向网格的每秒万亿次级高性能计算机和具有每秒数万亿次聚合计算能力的高性能计算环境;开发具有自主知识产权的网格软件;建设科学研究、经济建设、社会发展和国防建设急需的重要应用。目前,我国已开展了“中国国家网格”、“教育科研网格”、“织女星网格”和“先进计算基础设施北京、上海试点工程”等五大网格项目的研究。
从国内外对网格技术的研究来看,网格技术的特点主要表现为:(1)网格技术和多学科结合;(2)网格技术应用的领域非常广泛;(3)网格技术的全球化。网格技术正在为我们作出巨大贡献。
3.格技术的应用
网格计算技术是一个正在迅猛发展的学科。从生物领域的后基因组计划,到高能物理领域更深层次物质结构的研究,再到哈勃望远镜所获取的大量宇宙数据的处理,再到气象、地震预报预测这些重大科学领域的计算问题,促使科学家必须利用分布在世界各地的计算机资源,通过高速网络连接起来,共同完成计算问题。网格计算技术的应用正在改变着我们的教育、生产、制造、研究等。
(1)网格技术在教育领域的应用
利用网格技术可以将各个分布在各地实验室中的超级计算机连接起来,形成一个“强强联合”的超级信息处理中心。如利用网格技术将伊利诺州立大学超级计算中心、圣地亚哥大学超级计算中心、阿贡国家试验室和加州理工学院计算中心连接起来的由美国国家科学基金会建立的“分布式兆兆级网格(TeraGrid)”,就形成一个处理能力约为每秒13.5万亿次浮点操作,存储容量接近700兆兆字节的“巨无霸”计算中心,以供许多领域的研究机构使用。
网格技术为我们的学校教学资源提供了共享的新平台。尽管传统的网络教学系统或者基于网络的远程教学系统都强调共享,但这种共享还是处于相对较低的水平上,而且从教学资源上来看,形式多样,格式不统一,无法进行统一有效的协调和管理;硬件和操作系统还并存着各种异构系统,许多远程教育教学系统在不同的平台上运行;从实现的方式上来讲,大多是静态或动态的web页面,没有体现服务的概念。网格教学系统的核心是教学资源的共享和教学服务系统的建立,它通过为用户提供统一的服务接口,实现更高层次的共享。
(2)网格技术在生物科技领域的应用
网格技术能满足生物科技对数据的存储和管理等方面相当高的要求。生物数据由于包括物体本身、细胞、染色体、DNA、单个细胞的循环等各个方面的信息,所以非常复杂。这样,数据库的整合就成为关键问题。比如说,在研究水稻的蛋白结构时,可能会用到基因数据库、蛋白质数据库、基因表达数据库和蛋白质相互作用的数据库,在这种情况下,应用网格技术,能在较短时间内把需要的数据从不同的数据库中挑选出来综合在一起,省去了多次访问不同数据库的时间。
(3)网格技术在网络娱乐领域的应用
虚拟现实(Virtual Reality)技术是一种利用计算机图形技术人工合成的可以按照用户的输入而变化的模拟仿真环境,一个多维信息空间,一个用户可与计算机系统自然交互的三维人机界面。由于运行虚拟现实技术所需要的计算资源太过于庞大,目前虚拟现实技术只用于飞行员、宇航员等的训练工作,普通个人根本无法享受这一技术带来的娱乐体验。利用网格这种造价低廉而数据处理能力超强的计算模式,可以将虚拟现实技术运用于网络游戏中,让参与游戏的人可以真切地感受虚拟环境所带来的游戏快感。美国游戏基础设施提供商Butterfly.net公司目前使用的就是IBM的网格计算服务器。该服务器利用了网格技术自恢复特性,能够无缝隙地将所玩的游戏转到最近的可用服务器上,实现了用户资源的统一调动、统一保存,极大提高了游戏运行和服务的可扩充性。据Butterfly.net与IBM的评估,在同相同的预定收益中,利用网格技术布置的网格服务器产生的利润是传统集中式服务器的8倍。而对于个人用户来说,网格服务器则意味着更安全、更快捷的游戏体验。
(4)网格技术在其它领域的应用
网格技术可以整合和管理分散在各部门的信息化资源,实现各个政府部门之间数据的无缝交换,消除“信息孤岛”,打破电子政务资源共享的瓶颈;另一方面,网格技术的分布式工作模式,可以有效地实现在网络虚拟环境下的协同办公,提高政府的工作效率、增强为公众服务的能力。
网格技术为企业的信息处理提供了很大的平台。IBM推出一个网格计算力出租的计划。为帮助软件厂商开发新的应用程序,并测试现有的应用程序,IBM为这些软件厂商提供IBM网格运算服务器的免费存取权。拥有免费存取权的软件开发人员可以利用IBM网格服务器的强大运算资源,快速完成新开发的软件所必需的调试及模拟运算,从而缩短程序从开发到应用的周期,提高软件的开发速度。
网格技术的应用领域非常广泛,网络通信基础技术和应用技术科学研究、环境资源、制造业、服务业生物工程汽车制造、制药、太空研究和气象研究分子电子学和生物分子元件等,这些都将为我们的生活和工作带来巨大改变。
4.结束语
随着高性能计算应用需求的迅猛发展,在单一的计算机上或单一的计算机群系统上已不能解决一些超大规模应用问题,这就需要将地理上分布、系统异构的各种高性能计算机、数据服务器、大型检索存储系统和可视化、虚拟现实系统等,通过高速互连网络连接并集成起来,形成对用户相对透明的虚拟的高性能计算环境。
可以说网格是未来信息技术和产业发展的大趋势,它将极大地改变我们的生活和工作。未来的网格计算主要有三大发展趋势:即标准化、大型化和技术融合化。也就是说,网格计算将在行业应用的引导下,以标准化向更广域、多学科渗透,网格的一切对外功能都将以网格服务来体现,技术将进一步融合,且将逐渐从高性能计算走向商业应用,从前沿技术走向实用化、大众化。可以预见,今后网格计算技术仍将快速发展,从而开创计算科学的一个新纪元。
[1] 都志辉,陈渝,刘鹏.网格计算[M].北京:清华大学出版社.2002:3-5.
[2] 许文韬.网格技术综述.微型电脑应用[J].2002(18):62-64.
[3] 全球网格论坛.http://www.gridforum.org.