APP下载

国家气象网络计算资源管理和共享方案的应用

2013-09-29马艳军刘一谦

中低纬山地气象 2013年5期
关键词:计算资源高性能气象

吕 爽,马艳军 ,刘一谦

(四川省气象信息中心,四川 成都 610071)

1 引言

国家气象网络计算应用系统是采用网络计算技术与网络化远程应用技术,通过整合、集成气象部门内不同位置的10大高性能计算机系统,建成的面向区域、省气象部门以及国内相关行业提供共享服务的高性能计算资源软硬件平台和网络化应用环境。该系统聚合的总节点数有416个,采用了不同体系架构和操作系统平台,总计算能力高达26.34 TFLOPS,总存储能力 128.98TB[1]。为了将如此丰富的高性能计算资源和存储资源进行高效管理,使其充分利用,发挥最大的使用价值和共享效益,国家气象网络计算应用系统建设项目组设计了有效的计算资源管理和共享方案,并已技术实现,成功应用到国家级气象高性能计算机计算资源的业务管理和资源共享工作中。成都区域气象中心的SGI高性能计算机系统是国家气象网络计算应用系统中的一个分节点,与其他节点相比,在体系结构上存在较大差异、具有一定代表性的的异构节点,本文详细叙述了国家气象网络计算资源管理和共享方案在成都分节点的应用和实现过程。

2 国家气象网络计算资源管理和共享方案

2.1 国家气象网络计算资源管理方案

国家气象网络计算资源管理技术方案主要包括三方面(图1):

图1 气象网络计算应用系统计算资源管理技术方案

2.1.1 异构节点 气象网络计算应用系统计算资源管理范围不仅限于单个高性能计算机系统,而是将气象部门内不同架构的高性能计算机系统作为分节点纳入进来作为一个整体、使用全局统一的策略管理。

2.1.2 抽象量化模型 设计一个高性能计算资源抽象量化模型,屏蔽气象网络计算应用系统中各个节点之间的异构性,以统一的形式刻画高性能计算资源,以量化手段实现高性能计算机虚拟计算单元计算力GCUP(General Computing Unit Productivity),精确地记录和控制用户资源使用量。1个资源虚拟计算单元(GCU)相当于目前一般高性能计算机系统1个CPU小时的计算能力[2]。

2.1.3 计算资源管理系统 在GCUP量化模型设计思想基础上构建计算资源实时管理系统,该系统能够实时动态地跟踪、反映用户对高性能计算机资源的使用情况,并能及时实施资源使用控制策略。系统利用GOLD+PostgreSQL技术实现,GOLD是一个开源的资源分配管理器,由美国的太平洋西北国家实验室 PNNL 研发[3]。

2.2 国家气象网络计算资源共享方案

由于气象行业内多个中西部省份缺乏数值天气预报所必需的高性能计算机系统,无法建立适合本地中小尺度的预报模式系统来支持当地的预报业务。针对资源匮乏地区用户的实际需要,国家气象网络计算应用系统为异地远程网络用户提供计算资源,建立区域模式预报应用系统,通过资源共享平台的方式运行气象网络应用,经广域网提供气象应用产品,实现高性能计算资源的跨区域共享。

3 国家气象网络计算资源管理和共享方案在成都分节点的应用

3.1 成都分节点概况

国家气象网络计算应用系统成都分节点是SGI新一代Altix 4700高性能计算机系统,该系统配置96颗英特尔安腾双核处理器(192 Cores),主频1.6GHz,384GB全局内存,理论浮点峰值可达到1.228 8万亿次/秒。

3.2 计算资源管理方案应用

3.2.1 技术实现 将国家气象网络计算资源管理方案应用于成都分节点,对成都区域气象中心高性能计算机系统上的高性能计算资源进行管理,其管理架构如图2所示,具体实现过程如下所述。

图2 成都分节点计算资源管理架构

①作业日志文件获取。在SGI高性能计算机系统上设置资源预留程序prologue与资源记账程序epilogue,作业调度节点及计算节点均能直接调用这两个文件,作业通过pbspro作业调度系统被提交到计算节点上,作业运行之前和结束之后,分别调用prologue和epilogue程序,提取相关用户作业信息,存入指定的日志文件中。作业日志文件包含队列名、作业ID、用户名、处理器个数、作业执行时间等信息,AREM用户提交作业后生成的日志文件信息如下:express;29346.SGI4700;AREM;1;5104;"SGI4700/2exec_vnode";1;2010-01-14 07";SGI4700;"SERIAL"

②GOLD管理系统构建。用一台linux服务器作为GOLD管理服务器(bccdgridsvr),在该服务器上搭建基于GOLD的成都区域中心高性能计算资源实时管理系统,安装GOLD和Postgre数据库,开发计算资源管理程序,实现按部门、用户、机器等方面对资源使用情况进行实时查询和统计分析,并实现计算资源使用统计信息xml文件的准实时上传。

③计算资源预分配。根据GCUP模型的设计思想,对成都分节点SGI系统的计算资源进行量化统计,根据各个单位实际使用情况对计算资源以GCU为单位进行预分配,表1所示是SGI系统上2012年各个单位预分配和实际使用的计算资源情况。

表1 2012年计算资源预分配和使用情况

④用户信息与作业日志文件入库。根据计算资源记帐的要求,需要的基本数据结构包括用户信息、单位组织信息、机器信息,因此设计数据库来管理这些信息。在GOLD数据库中有用户和单位组织的相关信息,但不够全面,在查询时需要详细的用户和单位信息,因此在postgre数据库中新建一个数据库实例ui(userinfo),使用ui数据库作为计算资源记帐基本信息库。用户信息编辑成txt文件,作为gadduser命令的参数进行入库处理;作业日志文件通过程序每隔30 min从SGI系统上传送到bccdgridsvr服务器指定目录下,同时定时扫描目录启动计算资源记帐程序调用gcharge命令完成向GOLD数据库的作业日志文件入库记帐处理,每10 min刷新一次。

⑤资源统计信息xml文件的生成。利用计算管理程序对计算资源使用情况进行查询和统计,定时运行genmonxmlfile程序将统计结果转化为xml文件,经解析后供web页面显示。2011年9月SGI系统计算资源使用统计的xml文件(resstat_sc.xml)如下所示,包含时间、cpu利用率、资源使用量等信息。

3.2.2 应用效果分析及实例 成都区域气象中心自从将国家气象网络计算资源管理方案成功应用到SGI系统以来,取得了较好的应用效果,系统管理员能够从不同角度对成都区域气象中心高性能计算资源使用情况有全面的了解,能够对所掌握的计算资源进行合理的调度与分配,更好的保证了系统的负载均衡以及资源的充分利用,进一步为气象模式用户提供了一个模式运算的更高效的计算平台,使其更好的满足区域中心中尺度集合预报系统业务运行需求,同时也为管理部门提供了决策支持的有力依据。

通过成都区域中心高性能计算资源管理系统查询得到的关于2009年成都区域中心高性能计算机系统各个单位用户计算资源使用统计情况可以看出,2009年所有用户单位中,成都高原气象研究所(SWCB_gys)计算资源使用量最多,占总资源使用量的69.86%,其次为其他测试单位,占总资源使用量的19.59%;同时四川省气象台(SWCB_qxt)计算资源使用量占总资源使用量的10.05%。根据统计结果的指导,按资源使用比例合理的给各个单位预分配了2010年的计算资源,避免了出现资源不足、业务作业无法正常运行的现象。

3.3 国家气象网络计算资源共享方案应用实例

在国家气象网络计算资源共享方案设计思想基础上,扩展西南区域中心内重庆、云南异地用户作为成都分节点SGI系统的网络资源特色用户,基于资源共享平台为其提供计算资源,异地用户在MPLSVPN网络中通过FTP方式对WRF和MM5中尺度数值预报模式结果数据以及预报产品等资料进行定时接收和本地化应用研究,进一步丰富了异地用户所在地区的气象业务数值预报产品。

云南和重庆异地用户借助成都分节点的计算资源,实现大量的WRF和MM5模式数值模拟试验。针对其在本地的预报结果进行检验分析,初步评价模式性能。根据模式的性能设计试验方案,进行模式各种物理过程组合的优选,为WRF和MM5模式在本地业务化方案定制提供各种客观依据。

例如重庆异地用户利用在成都分节点资源共享平台运行的WRF模式结果模拟了2009年8月2-5日的渝西大暴雨天气过程(图3)。

图3 2009年8月2—5日的渝西大暴雨天气过程

4 结束语

通过利用国家气象网络计算资源管理和共享方案,成都区域气象中心的高性能计算资源管理水平和共享效益有了一定程度的提高,但是随着天气、气候模式预报精度的提高、物理过程的复杂化,以及集合预报样本的增加,导致模式计算规模越来越大,模式运算所需的计算资源和存储资源也将迅速增加,如何利用有限的资源为气象用户做到最优、最好的服务,是需要我们系统资源管理工作者认真思考的问题。

[1]宗翔,王彬.国家级气象高性能计算机管理与应用网络平台设计[J].应用气象学报,2006,17(5):629-634.

[2]王彬,宗翔,魏敏.一个精细粒度实时计算资源管理系统[J]. 应用气象学报,2008,19(4):507 -511.

[3]吕爽,马渝勇,刘一谦,等.基于Gold的气象中心网格平台资源管理系统构建及应用[J].计算机与现代化,2010,5:79-80.

猜你喜欢

计算资源高性能气象
气象树
《内蒙古气象》征稿简则
基于模糊规划理论的云计算资源调度研究
改进快速稀疏算法的云计算资源负载均衡
大国气象
基于Wi-Fi与Web的云计算资源调度算法研究
耦合分布式系统多任务动态调度算法
美丽的气象奇观
一款高性能BGO探测器的研发
高性能砼在桥梁中的应用