APP下载

曙光:HPC应用变现

2016-12-20宋辰

计算机世界 2016年46期
关键词:曙光高性能运维

宋辰

从科研到落地,作为高性能计算(以下简称“HPC”)领域的佼佼者,中科曙光(以下简称“曙光”)如何完成“从硬件提供商向综合服务提供商转型”?

当下科技界最热门的不外乎就是大数据和人工智能,而这背后,实则是计算能力的比拼。这也就不难理解为何各国如此重视在HPC领域的投入。据IDC统计,2015年全球高性能计算的预算投入增长了11%,2016年还将有更大的增长,中国也持续保持15%以上的增速。

2015年,曙光提出了”数据中国"战略,5年内要在国内百个城市百个行业建成云计算数据中心,构建一个覆盖全国的数据平台,为用户提供基于数据的服务。曙光作为高性能计算行业的佼佼者,该如何支持数据中国战略的落地、完成“从硬件提供商向综合服务提供商转型”呢?

硬实力

“汽车业界的法拉利拉力赛、F1赛车,那种赛车不一定会出现在我们生活中,但它却是整个企业业界最先进性能和技术的代表。”曙光高性能产品事业部副总经理吉青在采访中对《计算机世界》报记者说,“HPC就相当于IT界的F1赛车,是IT界最先进技术的集中体现。”

她补充道,现在HPC已经慢慢渗透到了每个人的日常生活中。以刚刚过去的“双十一”为例,大量用户同时在线时,服务器需要负载短时间内的高并发,同时,不同的数据中心的数据资源要同步,“比如,1000双鞋的库存,你这边都卖了900双了,我那边显示还剩200双单,那就有很大的问题。其实这里面用到的很多都是高性能计算的技术。”

新一期中国高性能计算机TOP100排行榜单如期在“2016年全国高性能计算学术年会”(HPC China 2016)上发布。曙光以34%的市场份额再次占得榜首,这是它连续第八年蝉联中国高性能计算机TOP100市场份额第一。在TOP10榜单中,曙光占有4套系统,在TOP30榜单中曙光占有15套系统上榜。

据榜单显示,曙光、联想以34套系统并列第一;国产高性能计算三强企业合计占系统份额87%;总国产系统份额占比98%。在应用层面,大数据挖掘和深度学习成为应用热点,曙光相关领域系统TC6000和HC2000均榜上有名。

深入到产业和应用场景中去,高性能计算才能更快走出实验室。“近年来,曙光通过上下游合作伙伴将创新链与产业链结合,深入应用场景进行产品的优化和开发应用。”曙光公司高性能产品事业部总经理曹振南介绍说。

今年5月,曙光液冷高性能计算系统中标国家电网电力科学研究院,超过700节点的TC4600E-LP液冷刀片将在国家电网仿真中心超级计算系统上部署,迈出了液冷技术在国内商用化的第一步。

玩数据

“千人基因组计划”每月产生1万亿条碱基序列信息,我国30多个在轨民用航天平台每年有超过3PB遥感卫星数据,FAST射电望远镜的数据产出速度是6000亿条记录/年,大型强子对撞机实验每年产生15PB原始数据。

“科学研究正变成一个又一个的大数据问题。”曙光公司高性能产品事业部总工程师戴荣说,“未来,基于对科学大数据的处理和分析将成为发现新知识的基本特征。”

的确,大数据研究已经成为继理论、实验和计算模拟之后的第四种科学范式,在新型材料、生物基因、精准医学、地球科学、生态环境、卫星遥感、天文、空间地理、高能物理、现代农业等领域的科学发现将越来越依赖数据密集型计算来驱动。

科学大数据的海量、多源、异构、高维等特征,向传统HPC系统发起了全新的挑战。“多数科研项目的数据量非常巨大并快速变化,且往往是分布、异构的,传统的数据管理模式已不能满足需要;此外,对科学大数据的‘计算包括了从数据获取、管理到分析、可视化的全过程,传统的高性能计算亟需将服务向外延拓展。”戴荣解释说。

针对科学大数据的行业应用特征,曙光发布了“科学大数据引擎”。曙光公司认为,科学大数据引擎将实现计算存储分析一体化,充当连接数据源和业务应用的“黑匣子”,完成对数据的清洗转换、存储与管理、数据处理与挖掘、数据分析及可视化等工作。

据戴荣介绍,在科学大数据引擎的“黑匣子”里,部署着曙光全系列数据计算技术及服务产品,主要由5个引擎组件构成,分别是:针对海量非结构化数据的曙光ParaStor并行存储系统、曙光高性能计算平台、提升系统整体效能的曙光深度学习计算平台、曙光XData大数据处理平台以及能覆盖科学大数据中心全生命周期的曙光EasyOP运维管理平台。

超算中心届的“滴滴”

曙光希望通过EasyOP构建一个资源交易平台,而这不同于超算中心“卖计时”。吉青解释道,“HPC行业更高的价值是‘人。”她举例说,“比如某个超算中心出了问题需要专家维护,他在平台上发出需求,平台上的运维经验专家,可以像‘滴滴专车司机一样去接单;再比如一个有着20年经验的CAE专家,也可以将自己的经验和知识在平台上变现。”

EasyOP是曙光在今年4月正式上线的一款SaaS级、针对高性能计算集群的运维平台。通过EasyOP能够为HPC在线7×24小时的全生命周期的运维、调优服务,将各行各业的专家从HPC的运维和管理中解放出来。

采用EasyOP,HPC运维人员不仅可以随时了解HPC集群的运营情况和故障,还可通过网页或微信等在线咨询服务与线上专家进行一对一的交流。EasyOP还会将常见、有代表性的故障解决方案上传至知识库,以便于HPC运维人员积累。

另据吉青透露,曙光目前正在建立HPC界的维基百科,“主要的基础数据都已经上去了,只是等待一个时机上线。将来大家在曙光官网的首页就会看到。”

猜你喜欢

曙光高性能运维
曙光
运维技术研发决策中ITSS运维成熟度模型应用初探
杨曙光作品
曙光
风电运维困局
充电桩行业扭亏曙光初现?
杂乱无章的光伏运维 百亿市场如何成长
一款高性能BGO探测器的研发
高性能砼在桥梁中的应用
基于ITIL的运维管理创新实践浅析