APP下载

“神”机“妙”算助飞航
——面向高新复杂装备的高性能计算系统建设纪实

2018-06-02北京机电工程研究所柳琼俊

国防科技工业 2018年5期
关键词:计算资源存储系统刀片

北京机电工程研究所 柳琼俊

走进北京机电工程研究所设计中心大楼一层大厅,“高性能计算中心”蓝底白字的标牌不禁令人眼前一亮,紧闭的红褐色大门昭示着其中些许的神秘。我作为信息化专业人员,见证了这里的高性能计算系统从无到有、量的提升、质的飞跃的历程。

从无到有的突破

计算机软硬件的升级换代,推动了专业技术的发展。反过来,专业技术更需要先进的软件与高性能的计算机支撑。PC机的普及,工作站的引入,单台高端服务器的应用,都已满足不了复杂装备研制任务对大内存、多CPU并行的需求,尤其是气动专业的矛盾最为突出,在计算上花费的时间太长而影响着整个产品研发周期。在国内军工行业尚未对高性能计算系统必要性形成共识的大环境下,论证建设高性能计算系统的进展并不顺利,持续了很长一段时间。2006年,终于建成了0.8万亿次计算能力的高性能计算系统,包括4台胖节点服务器、32台刀片服务器和4TB的存储系统。由于没有专用机房,“高贵”的机器只能屈居于一间简陋的办公用房,好在其计算能力得到了专业技术人员的认可,甚为欣慰。

计算能力进一步提升

0.8万亿次高性能计算系统投入使用后,立刻凸显出其价值,扩建的需求刚一提出即被方方面面认可。2007年,建成了2万亿次计算能力的高性能计算系统,包括4台胖节点服务器、128台刀片服务器和12TB的存储系统,被体面地放置在了宽敞的新建机房内,成为当时彰显能力的一道风景。

2009年,高新复杂装备工程全面启动,支撑关键技术和总体方案研究的CAD/CAE等计算任务急剧增加,导致计算资源异常紧张,再次扩建工作提到议事日程。受机房面积限制及经费的考虑,项目组在论证时小心地提出了扩建到12万亿次的方案,在院级审查时,领导当场拍板,直接扩建到机房能承受的最大能力24万亿次。在国防科工局、总装备部和集团相关方大力支持下,2009年3月紧急启动了系统扩建工作,项目组精心组织实施,快速完成方案设计、招投标、设备购置、系统集成调试等工作。2009年8月,扩建的高性能计算系统顺利上线运行,极大地缓解了计算资源不足的压力。24万亿次高性能计算系统,包括4台胖节点服务器、384台刀片服务器和24TB的存储系统,运行半年后就出现了排队现象,项目组同事不由地感慨、佩服上24万亿次决策的正确性。

上水平的飞跃

随着高新复杂装备工程的推进,对高性能计算资源的需求愈来愈多,院内研究所之间、型号任务之间、研究室之间有时为抢占CPU资源,需多方协调。在气动布局方面,需要开展大量的规律研究并获得全套气动数据,计算任务量大,任务提交后曾经出现过排队等待超过1个月的情况,严重影响了科研任务进度。日趋严重的高性能计算任务排队现象,使得200万亿次高性能计算系统建设迫在眉捷,很快得到了科工局、总装备部和财政部的支持。新购计算机主机及配套设备占地面积大,一时没有合适的地方,于是乎,位于设计中心大楼一层的研究室全体员工顾全大局,全部搬离。搬家那天,有些员工自嘲是“被机器赶走的”。

2011年6月1日,200万亿次高性能计算系统建成,包括8台胖节点服务器、1574台刀片服务器和240TB的存储系统,计算能力在国内排名位居第4位,国际排名位居第43位。新建的现代化机房功能强、性能高、安全可靠,让这些高科技的机器带上了时尚的元素,高性能计算中心按军工企业保密要求严格防护而颇显神秘。

计算能力持续提升

200万亿次高性能计算系统自投入使用以来,各军工企业也逐步认识到其必要性,纷纷前来学习交流并在国防科工局固定资产投资科目上积极申报高性能计算项目,得到了很好的支持。随着新装备研制的立项及研制周期的缩短,对高性能计算系统的使用越来越多,计算资源的使用率一直处于较高水平。2014年初,为解决计算作业排队多、时间长的问题,对计算调度策略进行了调整,将每个用户的并发CPU核数进行了调减,每个用户的并发作业数做了限制,从策略调整后的统计信息看,要从根本上缓解计算资源紧张的局面必须扩建。

根据各主要装备“十三五”期间的工作任务,高新复杂装备的技术发展研究、关键技术攻关等,通过分析测算,需扩建400万亿次高性能计算系统,与原有系统形成600万亿次能力。为避免新旧系统交叉使用性能“就低”的问题,扩建的计算网络与现有的计算网络相对独立,管理网络互联,存储扩容,升级资源调度系统、并行文件系统及集群监控管理系统等。扩建的400万亿次高性能计算系统于2017年11月投入使用,极大提高了高新复杂装备仿真计算能力,显著提高了研发效率与设计质量。

近年来,高性能计算硬件飞速发展,全球超级计算机排行榜,被国际计算机行业追逐着,我国在此领域的自主研发能力凸显。在峰值上,我们拥有的600万亿次高性能计算系统与国际先进水平存在很大的差距,但丝毫不影响其在高新复杂装备研制中所处的重要地位。它有一支专业的专职人员24小时轮岗值守,拥有各类计算分析软件资源,包括结构有限元类、流体力学类、电磁仿真类、流固耦合类及隐身分析类等软件。在未来的日子里,我们需要有更长远的眼光、更深邃的思考、更广阔的思维、更实干的精神和更创新的思路,建立起计算速度更快、应用软件更丰富、系统能力更强的高性能计算系统,为专业设计、仿真分析、大数据等提供高效的服务,助力飞航事业及军工行业蓬勃发展。

猜你喜欢

计算资源存储系统刀片
以铅酸电池为动力的骑乘式割草机刀片制动时间检测方法探析
分层式大数据存储系统缓存调度策略与性能优化
基于APKT150412-MM型号废旧刀片的研究实验及二次利用
浅谈信息产业新技术
主动容错云存储系统的信息自适应管理调度模型
天河超算存储系统在美创佳绩
面向4K/8K的到来 存储该怎么办?
一种作业调度和计算资源动态分配方法
基于云桌面的分布式堡垒研究
高校信息资源虚拟化技术的应用与实践