“超算”离企业有多远
2012-04-29赵艳秋
赵艳秋
牙膏、香皂、洗发水和纸尿裤与那些高速运转、需要大量空调降温的超级计算机有关系吗?Tom Lange是宝洁公司模拟与仿真研发部经理,34年间一直穿梭在二者之间。“消费者会发现,宝洁的产品相对来说都比较便宜,但是他们很难了解到,为了使这些产品保持较低价格,宝洁要采用很复杂的技术来进行开发和生产。如果你看到这些复杂的机器和每台机器上正在跳动的代码行数,你还以为我们在做飞机制造。”Tom Lange说。
洗发水和汽车模具
消费者在货架前徘徊,决定购买哪种洗发水时,价格往往起到很重要的作用。如果产品定价不当,或者不能给消费者带来预期的价值,他们通常都不会动心。所以,Tom Lange领导的模拟与仿真团队要做的第一个关键工作,就是挑选产品原材料并设计生产工艺。“最终敲定的原材料和制造工艺要使公司生产的产品,消费者能够承担得起。”他说。
选定原材料或者制造工艺,是一件极为复杂的事。一种洗发水,Tom Lange要从上百种材料中挑选七八种来搭配,用计算机模拟搭配后的产品长得什么样,在遇冷或遇热后是否还能从瓶中很容易地倒出来……这些计算已经超出了普通计算机的处理能力,通常需要128个甚至更多的CPU协同完成,被称为“超级计算”,简称“超算”。
十多年间,超级计算在美国企业的设计生产中已成为关键环节。福特汽车利用它来模拟汽车碰撞试验,摩托罗拉用它来设计不同形状的手机,这些手机掉到地上不易损坏。
如今,中国企业也开始将超算用到实际生产中,汽车行业的相关企业是其中最早的应用者之一。
陈惠滨,国内最大的汽车模具企业——天津汽车模具股份有限公司CAE部长,是这家企业的核心技术骨干,他的工作是利用计算机来设计仿真汽车模具。现在,汽车需要越来越精细的模具,一个两三米长的车身模具,每个关键面的公差都要控制在0.5毫米以下,这相当于几根头发丝的直径。这给模具设计制造带来相当的难度,冲压零件的精度合格率要求每提高几个百分点,设计的计算量就会成倍增长。陈惠滨10年前进入这个行业以来,汽车模具设计中的CAE模拟工作量已经至少增长了几十倍。
计算量的井喷,让陈惠滨顺理成章地成为国家超级计算天津中心的首批客户。利用超算中心为厂子分配了256个CPU,原来在厂内计算机上要计算一两天的模具模型,现在几小时就完成了;原来一次只能设计一种方案,现在可以同时设计多种方案,然后挑出最优化的结果。
除了效率提升,超算对于厂里的成本优化相当明显。不同汽车制造厂对模具的合格率要求从90%到100%不等。在没用超算之前,利用普通CAE(计算机辅助工程)设计结果做出的模具,合格率一般在60%~70%之间,这些模具要经过反复修改、再加工,才能达到客户要求。使用超算后,模具设计可以模拟得特别精细,合格率都在90%左右,修改、重复加工和调试工作大幅降低,成本也随之降低一半以上。
当然,让陈惠滨感到超算便利性的地方还有资料存储问题。因为大型制件如整体侧围每次精确CAE成型模拟的结构数据量都在10GB以上,以前公司内部没有足够大的存储空间,设计过程数据基本两三天就要清除一次。现在,公司内大量的模拟文件都可以保存在超算中心的存储平台上,要做进一步研发时就很方便。
使用者的“资格”
国内外企业都用超算,但国内找不到消费品企业的超算案例。在国外,生产纸尿裤的企业会利用超算计算液体如何流动,产品怎样设计才不淹孩子的屁股;生产薯片的企业会计算薯片从什么方向切,在运输中更不容易碎……但在国内,超算项目更多的是气象、石油、航天等这类大型工程。
国内企业很多时候发现国外同行的产品突然有了一个小拐角,但不知道为什么——是为了更结实,还是节省成本?这些细微之处的背后很可能有超算。正因为如此,大多数“普普通通的国内企业”在研发和成本控制方面并没有用超算的打算。
但在陈惠滨看来,超算并不只是大企业、大项目的权利。他在意大利拜访菲亚特的一个合作伙伴,发现在这个只有十几个人的小公司里,每位员工都在用强大的计算平台做工程仿真。陈惠滨感到,只要有计算需求,企业就完全可以用。
不过,现实中,中小企业用超算需要一定的“资格”。
第一个资格是数字化制造的普及。天津汽车模具在十年间积累了两样东西——如何根据不同的模具设计方案设定输入模型的参数;如何评判仿真结果,解决问题——这两样东西都是人和机器融合得到的经验,不是靠搭建软硬件平台和招收几个员工就能得到的。
第二是资金。从经济角度衡量,大多数中小企业还用不起超算。陈惠滨算了一本账,如果企业自己投资,每隔三四年,软硬件的升级费用就要上百万元,多数企业目前经受不起这样的频繁升级;按照超算中心目前对外的收费模式——每个CPU按小时计费,超算一般要用到上百个CPU,这也是“接受不了的”。
云来统筹
在顺利过渡到超算之后,现在陈惠滨会在晚上把作业和数据“丢”到超算中心,早上一上班就能看到各种设计结果。
这很像云计算,不管你在哪里,通过终端提交需求,再在终端上获得结果。那么,超算和云计算有什么关联?
胡松年,中科院北京基因组研究所研究员,他进行的水稻、微生物和人类基因组等研究项目需要的计算量极为庞大,2008年,他就使用了10万亿次/秒的超算平台,今年,他已开始用40万亿次/秒的超算平台了,存储容量也提升到1P以上。这样的计算量是普通机器计算上百年可能都完不成的任务。
云虽然是一种商业概念,但支撑它的底层技术,很多来自超算。同时,超算成为云调度统筹的一部分,就需要摘下神秘面纱,更为亲民。“即使是现在,企业要用超算,技术人员一般要在电脑上敲一堆字符命令,远程登陆,这跟消费者天天接触的云很不同。”浪潮集团高性能服务器产品部总经理刘军说,“不过,我们正让超算的专业化软件更易于使用,包括改变作业的提交方式、监控方式和数据输入输出方式。”
脆弱的应用软件环节
看上去,超算和人的互动将越来越美妙。不过,在很多时候,庞大的超算系统还很不给力。
电影《阿凡达2》要推迟上映了。大导演詹姆斯.卡梅隆承认,这个本来计划2014年底上映的大片,观众最早也要等到2016年才能看到。这是因为在续集中那些我们从未见过的神奇世界——潘多拉星球海洋——将完全在超算平台上用虚拟化的方式创造出来。可是相应的电影制作软件还在开发中,这次制作过程将是一个“非常艰苦的探索”。
即便是在超算已经发展了30多年的美国,为了把这些计算峰值达到几百万亿次/秒、几千万亿次/秒的庞大机器真正调动起来,应用软件的开发也不是件轻松的事。而没有好的软件,那些硬件设备将只是一堆既占地又耗能的“大型沉寂物”。
在中国,超算的应用环节更为脆弱,能够数得出的超算软件凤毛麟角。
赖能和,中国石油东方地球物理公司研究院处理中心的总工程师,国内最早一批涉足石油超算应用的行业人士。上世纪80年代,当中石油开始竞标国际石油勘探项目后,全球最大的石油勘探公司——西方地球物理公司就再也不把石油勘探软件卖给中国人了。为此,中国石油东方地球物理公司投入了巨大的人力和财力,开发出自主全国产的石油勘探处理解释一体化软件GeoEast。
不过,业内有个有意思的现象,仅仅是行业人士开发的应用软件,通常做不大——他们虽然了解自身需求,但对性能扩展优化并不在行。2011年,中石油东方地球物理公司和浪潮在委内瑞拉的合作显示出联手的力量。当时,中石油在号称“石油天堂”的委内瑞拉勘探石油,不过,他们只能在租用的几个宾馆房间内搭建一套原本庞大的超算系统。受限于环境,中石油只能在提高平台效率上打主意,把原先的“大超算”变成“小超算”。
中石油东方地球物理公司提供软件算法,浪潮将GPU加速技术引入,完成算法移植和优化。最终,机器规模缩减到原来的1/5,而中石油也在委内瑞拉规定的20天内完成了2000平方公里的全部石油勘探工作。
这个项目也给刘军很深的感触。在超算行业打拼15年来,刘军一直把美国ANSYS公司作为超算应用软件发展的目标和梦想。在过去42年间,这家位于宾夕法尼亚的企业一直没有停止积累的脚步,自主开发也好,兼并也罢,目前它在全球工程设计模拟仿真软件领域独霸一方。“中国要出现ANSYS,也要把时间尺度放长到二三十年。这不是大跃进方式做的事,需要我们沉下心在算法研究、并行优化、人才培育上做功课。”
目前浪潮有个几十个人的团队与行业人士合作开发石油勘探、数值气象预报、基因测序、金融风险分析、工程设计等应用软件。最近,浪潮还主办了中国首届大学生超级计算机竞赛。刘军说,通过大赛期间的锻炼,他希望学生们在学校期间就能建立一种思维方式——超算不能只比拼硬件,要强调应用,从应用的角度来配置系统。这样,当这批年轻学生走入各个行业,那个消费者看不见的超算,才能让我们的日常消费体验更加美好。