APP下载

超算在海洋大数据和信息产业中的发展应用现状

2020-11-02张铭君冯海洲

电脑知识与技术 2020年25期
关键词:应用

张铭君 冯海洲

摘要:海洋信息产业呈现多维度、复杂、海量数据的发展态势,随着信息技术的不断增长,超算技术为海洋研究带来的强大的技术支撑,所以不断拓展基于超算的海洋大数据及信息产业产品应用,是推动海洋信息业快速发展的必经之路。本文通过对当前超算在海洋大数据及信息产业中的发展现状进行调研,分析了国内外超算技术、海洋大数据和信息产业研究及应用现状,以期能为海洋信息产业的决策和后续发展提供有价值的实践参考。

关键词:超算;海洋大数据;海洋信息;应用

中图分类号:TP393      文献标识码:A

文章编号:1009-3044(2020)25-0220-03

随着海洋观测、模拟手段的快速提升和数据科学的重大突破,海洋数据量急速攀升,海洋数据已然成为“大数据”的典范。当前海洋数据量已达到EB级,需要强大的数据智能处理分析能力,除此以外,数值模拟也是物理海洋、海洋生态、海洋地质等领域的重要研究手段,需要大规模高性能计算能力。而超级计算机的出现,成为支撑这些研究的核心要件。随着海洋数据量的不断增长,海洋研究必须依靠性能更加强大的巨型计算机进行处理模拟,不断拓展基于超算的面向个性化服务的海洋大数据系列产品,推动海洋信息业的快速发展。本文通过对当前超算在海洋大数据及信息产业中的发展现状进行调研,分析超算技术、海洋大数据和信息产业研究及应用现状,以期能为海洋信息产业的决策和后续发展提供有价值的实践参考。

1 超级计算

超级计算,即超级计算机(简称超算),又称高性能计算,由众多处理器组成的计算机,可以处理完成普通服务器或者计算机无法完成的超量计算任务[1],是计算机科学研究领域的重要前沿性分支。当前,超算作为“现代科学技术的大脑”,能算天,能算地,能算人等,已成为解决国家经济建设、社会发展、国防建设等领域重大挑战性问题的重要手段,也是世界各国争夺的一个战略制高点。

1.1 国外超算技术发展态势

美国一直都非常重视超算技术的发展,其在理论研究、系统研制、服务应用、人才智力、资金支持等方面都具有较大优势[2]。早在20世纪70年代初,美国就已经率先研制出了每秒运行1亿次的巨型计算机。在近期,第34届国际超级计算大会上,美国的“顶点”和的“山脊”分别获得最新一期的全球超级计算机TOP500榜单的第一和第二 [3]。近两年来,美国还宣布了三套百亿亿次超算(E级超算)计划,日本的超算技术也一直保持国际领先优势。日本重视超算系统对社会应用的贡献,致力于将高性能计算与不同研究领域进行结合,尤其是药物研制、医疗保健、自然灾害预防、能源环境保护、社会经济问题等,以促进科学研究推动社会进步。早在 2006年,日本研发了国产超级计算机“京(K)”,曾列全球超级计算机运算速度排行榜首位。在2014年6月日本宣布启动“post-K”E级计划,该项目用于国家高性能计算基础设施建设[2]。2019年8月日本又推出新一代超级计算机——基于ARM架构的“富岳”,其最高性能可超400P,目前选定了新药研发、地震海啸模拟和集中暴雨预测等9个领域的应用,期望“富岳”可以完成平均37倍以上的加速。

近年来欧洲各国也下定决心大力研发超算技术。2013 年,欧盟启动“Horizon 2020”计划,将在 2014-2020 年投入7亿欧元开展研究 “面向百亿亿次的高性能计算”。2017年欧盟委员会提出“European High Performance Computing Common Plan”,并在欧盟成员国中选定八个城市建设“世界级”超级计算机中心,其中三个超算中心的运行能力将达到每秒15亿亿次浮点,而其余地方的超算能力将达到每秒4000万亿次浮点,预计2020年下半年对外开放,届时欧洲各国的科研、工业以及各个公共部门都可以使用,将被应用在医疗健康、药物研发、生物技术和工程、材料设计、气候预测等方面。此外,欧洲各国也出台了若干个发展项目。例如,德国的“E级创新中心计划”;西班牙的百亿亿次“EU Mont-Blanc 计划”;法国公牛公司的“SEQUANA计划”等[2]。在2019年6月份最新一期的“全球超级计算机 500 强榜单”上,法国、英国和德国的超算上榜数量位列第四、第五和第六,其中,进入榜单的浮点运算速度均已突破每秒千万亿次,最低门槛是每秒1022 万亿次。

1.2 中国超算技术

中国的超算水平早已达国际一流,尤其是在技术应用领域,取得了优异的成绩。自2009年,国家超算天津中心成立,正式揭开了超算发展的大幕。截至目前,天津、济南、深圳、长沙、广州、无锡、郑州7家国家超算中心已相继建成并投入运营。其中,以“天河”“神威”“曙光”等为代表的中国超级计算机系统一直处于国际领先位置,在2019年6月,“全球超级计算机 500 强榜单”上,中国境内有 219台超算上榜,数量蝉联第一;联想集团、浪潮集团和中科曙光的超级计算机数量位列全球制造商的前三,分别为173、71和 63 台[3];在运行速度上,“神威·太湖之光”和“天河二号”分别位于第三、第四位。在应用推广方面,中国超算在2016 和2017年连续两次获得国际高性能计算机的最高奖——戈登贝尔奖,分别是“神威·太湖之光”的“全球大气非静力云分辨模拟”;“高分辨率海浪数值模拟”;“钛合金微结构演化相场模拟”,在这3项中已经有2项的性能达到了30-40 PFLOPS。

随着计算机性能的不断提升,百亿亿次(E级)超算逐渐进入大众的视线,其引领着超算技术进入下一个更快速的时代,是全球争抢的科技制高点,它将在解决人类共同面临的能源危机、污染和气候变化等重大问题上发挥巨大作用,是各国竞相争夺的热点和重点。目前,中国、美国、日本和欧盟均提出研制百亿亿次计算机计划。我国在《国家中长期科学和技术发展规划纲要(2006-2020年)》中,专门针对超算技术设立了重点专项计划,旨在攻关百亿亿次级计算核心技术难点。在国家“十三五”高性能计算专项课题中,规划了三个E级超算的原型机系统——神威E级原型机、“天河三号”E级原型機和曙光E级原型机系统。

2 海洋大数据和信息产业

2.1 海洋信息产业

海洋信息涉及众多领域的数据资源,例如海洋生物、海洋生态、气象、地理地质、生物化学等,还涵盖人工智能、网络信息、计算机技术、电子科学等方面内容,数据种类繁杂,属于综合性多学科交叉的新型研究领域[4]。在高速发展的信息时代,海洋信息产业已步入大数据时代。海洋信息含有巨量的海洋数据,而且,相比于其他一般领域的数据,海洋数据因为呈现出数据量大、分布广泛、种类繁杂、时效性高等方面的特点,所以一直保持着极高的独特性和处理难度[5]。随着空间信息技术、各类探测设备及计算模拟的发展, 致使约占地表总面积71%的海洋资源迅速积累,海洋科学研究进入密集型数据时代,全方位、连续、多源、立体的观测技术使得海洋信息数据存量早已达到EB级别,日增量也达到TB级别[6, 7],海洋数据早已成为大数据的典型。作为一种极具价值的資源,海洋大数据现已成为海洋信息产业发展的根基,其不仅是实现海洋强国、维护国家海洋权益、开发海洋资源、拉动海洋经济的保障,更是被多国列入国家整体发展战略之中。

2.2 海洋大数据

当前,海洋大数据的来源主要是海洋科考船、海洋浮标、海洋潜水器、海洋遥感、海洋观测网等海洋监测数据。截至2018年,全球超过 40 个国家拥有海洋科考船,总数量超过 500 艘;根据ARGO全球海洋观测网计划,全球海洋浮标数量已经达到1.6万个,预计到2025年,剖面浮标将达到4700个,观测范围将扩大到海面2000 m以下;目前,中国“蛟龙”号潜水器的下潜深度已达到7062m;预测到2030年,全球海洋遥感卫星将达到271颗[8]。海洋大数据的获取已经实现了多元立体化发展,但其重难点在于数据的分析,这其中主要涉及数据存储管理、数据挖掘和数据可视化表达等。目前,对中国而言,绝大部分数据还是用集中式的服务器存储,但是随着探测技术的进步,海洋数据量突飞猛进,这些服务器的存储能力有限,今后将难以满足在线存储资源的动态扩展以及离线数据的获取需求。而在海洋数据挖掘分析领域,由于海洋大数据的时空和地理特性,数据量庞大、多维度且关联复杂,对挖掘算法及其效率有极高的挑战。可视化是进一步认知海洋的有效途径,但是伴随着数据量的持续攀升,科研人员对于可视化呈现、分析技术、处理能效等方面的要求将越来越高,今后不仅需要实时反映数据的特征,保证数据的时效性,更要确保数据的实时更新和准确地绘制,在这一方面就对整个可视化处理系统提出了更高的承载和处理要求[8]。

2.3 中国海洋信息化建设及海洋大数据发展现状

海洋信息化建设是我国重要的发展战略之一。自“十三五”期间,中国便开始全面布局海洋信息化建设,要求加大力度攻关海洋信息领域核心技术,加强云计算、大数据等新一代信息技术在海洋领域的深度融合,着力打造信息透彻、超算互联互通、共享共建的现代化海洋信息化体系。近年来,中国还启动“智慧海洋”工程建设,要让信息变成知识来服务海洋,充分利用互联网、大数据、云计算等技术实现海洋信息的智能挖掘和应用,并明确以信息主导、体系建设“智慧海洋”是实现我国海洋强国战略的长远抓手[9]。

近年来,我国各级政府都在大力推进海洋电子政务工程,不仅建设并完善了各类海洋专题服务型网站和国家海洋局政府网站,还研发了多个海洋领域的业务系统,例如,海洋气候预报、海洋环保、海岛保护、海域使用等。站在海洋大数据发展的角度,我国在海洋数据探测获取、存储管理、分析处理等领域取得了一定的进步,但是还是落后于海洋地理信息技术和探测技术的快速发展。当前,海洋信息量正成快速增长的趋势,人们对海洋信息产品和服务要求也在不断增多和提高,传统简单的海洋信息化过程已经不能满足时代发展要求,尤其,又因为海洋数据高价值、多源、复杂、动态、敏感等特点,更增加了海洋信息化的难度,所以更加迫切需要创新高效的信息处理技术,以此发掘海洋数据更广泛的价值,带动信息产业的升级换代。在我国海洋信息化战略推进的过程中,面临的重大问题是顺应大数据时代的浪潮中,如何运用大数据思维和技术,针对海洋数据的特点,对海洋观测、数据储存、模拟分析等进行准确、及时、高效地分析和处理,挖掘更多海洋大数据应用服务,使海洋大数据资产价值最大化,充分发挥海洋信息产业对我国经济和国民生活的带动作用[10]。

3 超算技术在海洋大数据和信息产业中的应用情况

随着海洋监测技术的发展,以及海洋科学与数据科学等学科的深入交叉融合,海洋数据量和类型都在急速增长,据统计,到2030年,海洋数据量规模将从目前的约60PB增长至350PB以上,对海洋数据研究和信息产业的发展而言,这将是巨大的挑战。所以亟需与更先进和高效的技术工具结合。而超级计算机的出现,为全球科学家解决社会、环境及人类等重大关键问题提供了强有力的助力。同样,对于海洋领域,超算也成为人们认识海洋、探索海洋的利器。

3.1 海洋环境预报

气候气象领域一般含有大量的数据,是超级计算机应用的经典领域,尤其是全球气象预报和海洋动力学过程。巨型计算机技术应用在海洋动力过程与全球气象数值模拟计算中,对海洋环境进行的动态仿真,获取海洋环境综合信息,建立预测系统,掌握海洋环境变化,从而提升海洋环境预报的准确性和及时性。美国加利福尼亚大学用超级计算机模拟了厄尔尼诺现象;美国加州工学院地球与空间科学分部利用超级计算机对海洋环流模型程序进行了测试,运行效率是单处理器时250倍左右[11];中国海洋试点国家实验室、美国地球流体动力学实验室、美国大气科学研究中心、澳大利亚科学与工业研究机构、欧洲天气预报中心等多家世界顶级海洋研究单位共同合作利用超算技术模拟计算了未来500年全球海洋气象变化的过程,并将精度控制在了10公里以内;中国海洋试点实验室借助超算技术对中国海洋丝绸之路上的西太平洋─南海─印度洋区域进行了海洋气候预报,精度达到了世界领先的3公里,时间期限是未来15天。

3.2 古气候模拟

将古代气候观测资料数据用海洋气候模拟的方式展现出来,有助于了解古代气候变化、验证现代气候现象、以及预测未来海洋气候变化。但是气候模拟严重依赖于计算效率和计算资源,过去传统的模式受限于计算技术,通常只能做短期的古气候切片模拟,或者不同时候的耦合试验,无法对深海环流的缓慢变化进行研究模拟,更难以根据古气候资料预测和追踪未来海洋气候的变化。近年来,美国俄亥俄州立大学和美国大气科学研究中心等多家知名科研单位共同合作借助超算技术,在气候模式上引入多种同位素模块,模拟了过去两万一千年来全球同位素与气候的演变;德国的海洋研究学者也借助超算技术实施了一个古气候模拟试验,计划对近10万年来的整个地球系统冰期—间冰期大旋回进行长期持续的模拟;中国海洋试点国家实验室也与多所知名院校科研单位进行了合作研究,同樣借助超算技术,采用包含同位素模块的较高分辨率地球系统模式模拟两万五千年前的全球同位素与气候协同演变。

3.3 海洋药物

海洋是地球上最复杂、最庞大的生态系统,由于其特殊的地理环境,生活在海洋中的生物成为医疗领域的宝藏,为医药研究提供了大量的而独特的生物基因和化合物资源。其中,海洋生物占地球总生物的70%以上,但是由于海洋生物获取难、计算难、实验难,在药源生物中仅贡献1%。当前,随着超算技术的迅猛发展,其在生命科学的研究中逐渐体现出了显著的优势。尤其是在海洋医药领域,将超算技术与药物设计相结合,通过提取药物的分子结构,来计算是否能作用到人体上,从而助推新药的研发。截至2019年,海洋试点实验室已完成170多个成药靶点与全部已知35000余个海洋化合物的对接,准确率由国际上20%跃升到70%,基本建成基于智能超算与生物实测耦合的海洋药物发现体系,其中包括海洋天然产物三维结构数据库、智能超算海洋药物筛选技术。

3.4 海洋勘探

认识海底、开发海洋资源是人类一直以来的努力方向,这不仅能有效缓解陆地资源不足的困境,还能有极大地预防和减轻海洋地质灾害所带来的损失,从而保障人民安居乐业,社会经济可持续发展。海洋勘探包括对海洋地质学的研究和海底能源的探测,海洋地质学研究需要超高精度的模拟,需要跨越不同时空和空间以对地球运行机制进行模拟探索,之前受制于计算能力,地球动力学模拟存在不精细、时间冗长的问题;而海洋能源勘探离不开对海底复杂构造和复杂岩性的观察分析,这就需要对实测数据的高精度成像与反演[12],而之前受制于运算量和存储量的限制,很难实现对深海的精确勘探。超算技术的发展为这些领域带来了新的技术手段,将解决当前困境,极大提高勘探效率,加速海洋勘探的研究速度。

4 总结

通过分析超算和海洋信息产业的发展现状,发现超算有利于提高海洋预测精度,为气候预报、海洋药物研发、资源勘探等提供支撑。未来,是计算速度的时代, 也是海洋的时代。将超算与海洋联系打造智慧海洋,将很大程度改变未来世界发展的方向。未来的智慧海洋,必将为人类带来用之不竭的财富。但是基于目前现状,超算在海洋信息领域的应用还存在局限性,应用领域亟须进一步拓展,以更好地满足人类社会的发展。未来超算可以继续推广应用到工程装备、海洋智能计算、海洋渔业、海洋经济等领域,通过超算技术,推动海洋信息行业应用的发展。

参考文献:

[1] 本刊综合.超算:比你想的更接地气[J].发明与创新·大科技,2019(11):50-51.

[2] 历军.中国超算产业发展现状分析[J].中国科学院院刊,2019,34(6):617-624.

[3] 中国蝉联全球超算500强上榜数量第一[J]. 智能制造,2019(7):15.

[4] 王伟. 大数据时代海洋信息技术发展探讨[J]. 中国管理信息化,2020, 23(4):185-186.

[5] 张博. 大数据时代海洋信息技术发展探讨: 第三届海洋开发与管理学术年会[Z]. 中国安徽合肥: 20196.

[6] TolleKM,Tansley DSW,HeyAJG.Thefourthparadigm:data-intensivescientificdiscovery [point of view[J].Proceedings of the IEEE,2011,99(8):1334-1337.

[7] 刘帅,陈戈,刘颖洁,等.海洋大数据应用技术分析与趋势研究[J].中国海洋大学学报(自然科学版),2020,50(1):154-164.

[8] 钱程程,陈戈.海洋大数据科学发展现状与展望[J].中国科学院院刊,2018,33(8):884-891.

[9] 王志文.综合施策推进海洋信息经济发展[J].浙江经济,2018(15):62.

[10] 宋德瑞,曹可,张建丽,等.大数据视域下的海洋信息化建设构想[J].海洋开发与管理,2017,34(9):50-53,77.

[11] 夏江婷. 浅谈超级计算机及其发展[J].中国科技纵横,2017(24):24-25.

[12] 魏志强,杨照,黄磊,等. 海洋国家实验室对E级超算的需求分析与展望[J]. 中国计算机学会通讯, 2017,13(10):35-38.

【通联编辑:光文玲】

猜你喜欢

应用
多媒体技术在小学语文教学中的应用研究
微课的翻转课堂在英语教学中的应用研究