给“天河”当导师
2017-07-18张锐
■张锐
给“天河”当导师
■张锐
孟祥飞在检查天河计算系统节点运行。
“超级计算机是做什么的?说白了,就是‘算天算地算人,管吃管住管玩管行’。”在坐落于天津经济技术开发区的国家超级计算天津中心三楼会议室里,孟祥飞用一句简单生动的话解开了记者心中的疑惑。
算天,包括航空航天、气候气象等;算地,包括石油勘探、地震监测、海洋监测、环境变化等;算人,包括生命科学、脑科学、基因分析、生物医药研发设计等。超级计算机涉及人们吃穿住用行的方方面面,在支持国家高科技创新、支持区域产业发展中发挥着重要作用。
7年前,正是这个30多岁、瘦高个子的科学家,带领团队在这里完成了我国首台千万亿次超级计算机“天河一号”系统的部署安装调试工作,他也因此被誉为“天河一号”的导师。
“玩转”超级计算机
2009年成立的国家超级计算天津中心,为了承接“天河一号”系统而建。当时,刚刚博士毕业的孟祥飞在去北京某高校当物理教师和加入超算中心之间,坚定地选择了后者。
读博士时,孟祥飞学的是理论物理专业。“超算中心更需要我,在这里我能为国家科技创新发挥更大的作用。”在面临人生重要选择时,孟祥飞把对国家的责任看得很重。
加入刚刚成立的超算中心,他和团队成员从改造机房、安装电缆、机柜等“体力活”做起。要按照超级计算机的要求装好100多台机柜,不是一般的专业工人和程序员可以完成的,只能他们自己干。有时要在离地60厘米高的机柜下面接通信线路,他们躺在地上一干就是几个小时。
超算中心坚持“边建设边应用”的发展思路,“天河一号”系统运行之初就实行“7×24”小时的服务模式。因为人员紧张,孟祥飞主动带头,成为中心第一个承担系统运维和晚间值班的人员。当时正值夏季,他晚上待在还未装修的毛坯房里,只有几个简单的工位和偶尔闪烁的显示屏,实在累了困了,就在装服务器的大纸箱上躺一会儿,白天继续参加开发测试工作。
不到7个月,“天河一号”超级计算机系统便实现了稳定运行。而在国外,这通常需要12~18个月。
更令人惊喜的是,在2010年第36届世界超级计算机大会上,“天河一号”一举摘下了“世界最快”的桂冠。中国成为继美国、日本之后第三个获得这项桂冠的国家。
超算高手的挑战
当“天河一号”排名世界第一的消息传来,许多人为之欢呼,但也有人提出了质疑,他们认为“中国就是造了一台大型游戏机,只是为了排名第一,中看不中用”。
担任应用研发部部长的孟祥飞,感到了前所未有的巨大压力。“如果把超级计算中心比作一部智能手机,我们要做的,就是给它开发并安装各种实用、好玩的APP,使它更有用,功能更强大。”
挑战无处不在。“天河一号”集成了大量的自主核心技术,而这些技术与通用软件的兼容成了首要挑战。孟祥飞记得,当时有一个国际通用的药物研发软件,可以大大提升新药的研发进程,可他们却无法将其部署在“天河”平台上正常运行。
“这个软件有几十万行代码,我们底层的技术平台系统工具代码量更大。要找出问题究竟出在哪里,相当于在大海里捞针。”就是在那时的毛坯房里,经过近20个日夜、上千次的编译、调试、排查,他终于将一个不起眼的变量“捞”了出来,经过重新定义之后,成功解决了问题,为“天河一号”在这个领域的应用扫清了障碍。
如今,他们已将应用团队、企业规模拓展到1000多家,全面开拓了“天河一号”在生产、科研、学术、教育领域的应用能力和影响力。
成立7年来,超算中心支持了众多世界一流研究成果以及产业技术突破。2014年,“天河一号”荣获国家科技进步特等奖,真正做到了“中看又中用”。
人生在创新中“增值”
如今,超算中心每天在线的科研和产业运行任务超过1400项,是欧美一流的国家级超算中心的3倍。负载量已经趋近饱和,高峰时段甚至需要排队。
“这说明我国依托超级计算平台的创新需求在爆发性增长,也意味着我们在这方面的应用和支撑能力已经达到国际领先水平。”孟祥飞自豪地说。
正是凭借超算中心与中石油东方物探合作开发的高精度勘探地震数据处理软件,中石油在与欧美公司竞标某中东石油项目中,成为唯一完成高密度勘探处理项目的公司,一举夺标。
作为应用研发部部长,孟祥飞的工作总是充满探索和创新。他投身国际聚变能源开发ITER计划项目,开发国际首款大规模异构并行模拟软件,也使天津超算中心成为中国可控核聚变研究的重要支撑平台。作为技术骨干,他参与了“雾霾预警预报与评估系统”国家科技支撑计划项目,构建我国第一个高分辨率雾霾预报准业务化平台……
目前,超算中心正跟国防科大合作研制新一代超级计算机。开发不同行业的应用软件,把新一代超级计算机用好——孟祥飞谋划着下一个目标。