APP下载

解析新时代下的高性能计算

2015-08-06云中子

中国信息化周报 2015年28期
关键词:华大基因数据类型天河

云中子

超算TOP500是基于Linpack基准测试评定的全球500台最快的超算系统性能榜单,自1993年起每年7月、11月发布两次,是反应各国超算的发展状况和产业发展趋势的重要参考。

中国超算的发展速度赢得了世界的关注,国际超算权威专家、TOP500的发起人之一Hans Werner Meuer 博士用“big shocker”极具震撼力来形容中国超算的发展。

就在近日,国际TOP500组织在德国举行的2015年国际超级计算机大会上发布全球超级计算机500强最新榜单,中国“天河二号”以每秒33.86千万亿次的浮点运算速度第五次蝉联冠军。

谈到超级计算机,相信大家都太陌生,它能够提供超高的性能,其一般主要应用于科学计算、工程模拟、动漫渲染等领域,这些应用大多属于计算密集型的应用。而云计算则是在近两年随着互联网发展起来的新兴计算,其依靠着灵活的扩展能力主要应用于社交网络、企业IT建设和信息化等数据密集型、I/O密集型领域。

在橡树岭国家实验室有一个研究设施SNS(散裂中子源),它构建于2006年,曾引爆过世界上最强的材料中子束,帮助物理学家和化学家了解材料内部结构是如何形成的。

SNS产生了大量数据,它们需要被彻底分析。而科学家们相信,他们可以利用深度学习算法快速识别数据类型,并提升分析能力。识别数据类型是深度学习的专长。

但问题是,对于科学模拟来说,每次产生700TB数据似乎太正常不过了,不过这比美国国会图书馆所有信息加起来的量还要大。

应用方面,高性能计算机可称得上是行业应用的强力助手。中石油川庆钻探地球物理研究所计算所所长邓亚力在接受本站记者采访时表示:作为新一代的数据中心,在石油勘探应用方面最受关注的重点依然是性能。此次中石油部署的PMDC集装箱数据中心也表现优异。其采用了标准的20英尺集装箱,借助现代化物流可快速部署至全球任何地区。同时,采用高密度设计,使PMDC的占地面积很小,仅相当于同等性能数据中心占地面积的1/4。

据华大基因高性能计算研发主管王丙强博士介绍,GPU多流处理器架构以及超高的显存位宽和频率能够带来巨大的性能提升,在基因研究方面普遍可以带来10~20倍左右性能提升,如果说DNA上有一个点发生的基因突变,仅计算那一部分大概就可以提升70多倍。

原来在华大基因自己高性能计算平台上做,大概要好几年才能算完,后来转移到到天河一号A上去,用超级计算机加上NVIDIA Tesla GPU加速,只要5个多小时就能完成。

从应用来看,超算目前已经开始走向云计算等方面应用了。超算主要执行计算密集型的任务,CPU的利用率已经很高,因此虚拟化技术对于HPC的CPU利用率作用不大。

虚拟化对计算密集应用的影响很小,而I/O密集型应用的性能则会有一定下降。基于云计算理念来构建超级计算中心,除了满足传统的或现有的HPC用户需求外,更重要提创造并吸引众多新领域的用户。

猜你喜欢

华大基因数据类型天河
湖南省潇水涔天河水库扩建工程通过竣工验收
详谈Java中的基本数据类型与引用数据类型
如何理解数据结构中的抽象数据类型
华大基因收入疑云
一条天河走运来
昔日千亿市值半年跌去六成 华大基因“举报门”后又迎解禁潮
华大基因大股东是以“白菜价”减持吗
天河CBD:集聚创新,遇见城市未来
基于SeisBase模型的地震勘探成果数据管理系统设计
“天河二号”获全球超算五连冠等