2016 年度中国科学院超级计算发展指数发布
2017-05-04中国科学院计算机网络信息中心顾蓓蓓
中国科学院计算机网络信息中心 顾蓓蓓
2017 年 11 月 9 日,在昆明举办的中国科学院计算机网络信息中心 2017 年用户大会暨技术交流大会上,中国科学院计算机网络信息中心信息化发展战略与评估中心发布了 2016 年度中国科学院超级计算发展指数 (CAS SCDI),该指数的评价指标数据基于自主开发的“CAS SCDI 数据收集系统”Web 在线收集,院超级计算环境用户群体中共计 157 个课题组提交了超级计算应用成果。
1 超级计算发展指数简要分析
(1) 2016 年度 CAS SCDI 编制说明
中国科学院超级计算发展指数 (CAS SCDI) 编制以超级计算生态环境合理量化综合评价为出发点,遵循科学性、目的性、导向性、代表性、可行性、公开性和通用性原则,从环境建设、环境使用、用户直接科研产出、支持用户科研项目、人才培养和收入六个维度构建了评价指标体系,共计 17 个三级评价指标、6 个分指数、1 个综合指数。此外,该报告第四次为分中心提供超级计算发展指数分析,并将该指数继续纳入分中心考核的量化指标,为分中心的发展提供了重要参考依据。
图1 中国科学院超级计算发展指数 (CAS SCDI) 走势 (2006-2016 年)Fig. 1 Trends of the CAS SCDI during 2006-2016
(2) 2016 年 CAS SCDI 编制结果及分析
中国科学院超级计算发展指数 2006-2016 年度走势如图 1 所示。
分析表明:
① 2016 年度,CAS SCDI 为 426.74 点,较 2015年度降低了 5.86%,2006-2016 年间平均增长率为35.76%。这表明,中国科学院超级计算过去几年间保持着强劲的发展态势,中国科学院超级计算环境的建成为中国科学院超级计算的发展注入了强大的动力,加强超级计算软环境建设仍然是中国科学院超级计算环境今后发展需要着重解决的一个问题。
②超级计算应用的发展会在一定程度上滞后于计算能力的提升,但计算能力升级的间隔周期过长,致使用户作业规模长期保持在一定的水平,甚至出现一定幅度的下降,这不利于超级计算应用的良性发展,也是阻碍超级计算发展的一个因素。
③加强超级计算人才培养是超级计算生态环境建设中的关键环节,能够直接推动用户直接科研产出和收入等层面的发展,能够为中国科学院超级计算良性发展提供持续推动力。
2006-2016 年度,中国科学院超级计算发展指数6 个分指数走势如图 2 所示。2016 年度,各分指数较2015年度的增长比例及对总指数的贡献如图 3 所示。
对 6 个分指数的编制结果的分析表明:
① 2016 年度,6 个分指数中,用户直接科研产出分指数和支持用户科研项目分指数较 2015 年度有所下降,降幅分别约为 17.76% 和 24.26 %;其余 4 个分指数较 2015 年度增幅较小。
② 2016 年度,用户直接科研产出分指数对总指数增长的贡献最高,达到 162.21%,由于 2016 年总指数是下降的,所以贡献最高的分指数是降幅最多的,分析主要原因:一是 2016 年度提交用户成果的人数减少,二是用户发表论文数减少导致;其次是环境建设、环境使用、支持用户科研项目、人才培养和收入分指数对总指数增长的贡献甚微,这主要是因为中国科学院超级计算环境的基础设施已基本老化,故障率越来越高,可用资源降低,这是中国科学院超级计算目前发展过程中所存在的薄弱环节,希望在“十三五”期间提升我院超级计算环境能力,更好的支撑服务我院的科学发展。
图2 中国科学院超级计算发展分指数走势 (2006-2016 年)Fig. 2 Trends of the sub-indices of the CAS SCDI during 2006-2016
(3) 分中心发展指数分析
2011-2016 年 9 个分中心的超级计算发展指数趋势如图 4 所示。数据表明,2016 年度合肥分中心、广州分中心和兰州分中心名列前三。整体来看,分中心发展是稳健向上发展的,同时由于绝大部分分中心设备也已超过五年,设备需要升级换代以保障持续长久的发展。
分中心指数对总指数的贡献率如图 5 所示。数据表明,分中心对我院超级计算发展指数起到了重要作用,2016 年度贡献率达到 42.18%。
图3 2016 年度各分指数较 2015 年度增长比例及对总指数增长的贡献Fig. 3 Contribution ratio of sub-indices to CAS SCDI growth (2016)
图4 分中心超级计算发展指数走势 (2011-2016 年)Fig. 4 Trends of the CAS SCDI of regional centers during 2011-2016
9 家分中心的分指数发展走势如图 6 所示。很明显,2016 年度大部分分中心的收入分指数有大幅提升,主要原因是对收入分指标征集范畴进行了规范和明确。
图5 分中心指数对总指数的贡献率 (2011-2016 年)Fig. 5 Contribution ratio of sub-indices to CAS SCDI (2011-2016)
2 超级计算环境使用简要分析
基于各中心管理员提交的超级计算环境相关数据,从系统使用率和计算规模两个维度对中国科学院超级计算环境 2016 年度使用情况进行统计分析。
(1) 中国科学院超级计算环境总中心和分中心系统整体使用率 (2016 年)
2016 年度中国科学院超级计算环境总中心和 9家分中心系统使用率情况如图 7 所示。统计数据显示,2016 年度,总中心和青岛、合肥、昆明分中心系统运行负载较高,系统使用率均超过了 50%,其中合肥分中心系统使用率最高,达到 69.21%。这主要在于这些超级计算中心拥有较大规模的用户群体,超级计算学科应用领域较为广泛,可以考虑进一步增强超级计算能力;沈阳分中心系统使用率偏低,可以从加强系统运维保障能力、拓展超级计算应用领域、培育超级计算典型示范应用等方面提高超级计算应用水平。
(2) 中国科学院超级计算环境总中心和分中心按计算规模统计的用户作业机时占比情况 (2016 年)
对于总中心按计算规模统计的用户作业机时占比,2010-2016 连续七年的对照情况如图 8 所示。2010-2015年总中心 64-127 CPU 核计算规模的作业机时占比连续六年保持最高,2016 年度 2~31 CPU核作业机时占比最高,达到 40.35%。主要原因在于 2016年 8 月“元”二期开始正式对外开放,大规模作业尚未全面启动,大规模的测试作业多运行于总中心系统之上,加之小规模作业仍然占比较大,尤其是其中公安部“全国十指指纹数据集中查重清洗”的项目安排,大量 24 核作业任务集中部署在总中心系统内,全年共计运行 7479342 个作业,占据 2-31 核的 49.55%。此外,由于受国内大型超算中心大规模计算作业能力逐年提升的影响,总中心“计算规模-用户作业机时占比”变化曲线仍将呈现出“尖峰-厚尾”不对称分布形态,曲线的峰值会逐渐右移且靠近曲线的左侧。这也表明,超级计算能力建设需要合理规划布局、分阶段扩容,才能够满足用户动态的应用需求,形成计算能力与学科领域应用协调、良性发展局面。
图6 中国科学院超级计算发展分指数走势 (2011-2016 年)Fig. 6 Trends of the sub-indices of the CAS SCDI during 2011-2016
图7 2016 年度总中心和 9 家分中心系统整体使用率Fig. 7 System Usage Rate of head center and nine regional centers (2016)
图8 总中心按计算规模统计的作业机时占比情况对照Fig. 8 Comparison of proportion of job walltime based on calculation scale in head center
图9为 2016 年度各分中心按计算规模统计的作业机时占比情况。分析发现,在分中心万亿次计算系统中,用户作业基本集中在 2~255 CPU 核的计算规模,9 家分中心该计算规模区间段的作业机时占比都接近或超过 70%,其中深圳、沈阳、武汉分中心在该计算规模区间段的作业机时占比超过 95%;9 家分中心中,兰州和青岛分中心 128 CPU 核以上计算规模的作业机时占比最高,超过 35%;青岛分中心 128 CPU核及以上计算规模的作业机时占比达到 65.54%;合肥分中心 1024 CPU 核及以上计算规模的作业机时占比为 2.96%。这表明,各分中心在大规模并行计算应用方面具有一定的潜力,在超级计算应用拓展方面具有更大的发展空间。
3 超级计算用户应用成果概览
基于超级计算用户已提交的2016年度超级计算应用成果数据,对用户科研项目、学术论文和专利情况进行统计分析。
图9 2016 年度分中心按计算规模统计的作业机时占比情况Fig. 9 Proportion of job walltime based on calculation scale in regional centers (2016)
图10 由计算支撑的用户科研项目经费来源情况Fig. 10 Research funding sources supported by calculation of users
(1) 计算支撑科研项目经费来源情况 (2016 年)
在中国科学院超级计算环境用户群体中,2016年度计算支撑科研项目共计 416 项,比 2015 年度项目数降低 4.14%。经费来源分布情况如图 10 所示,国家级项目占比超过 80%,其中国家自然科学基金项目最多(占总项目的 60%),这充分表明中国科学院超级计算环境为国家层面的科学研究项目的开展提供了强有力的计算支撑,对于国家科技创新有着无法替代的服务支撑能力。
(2) 超级计算用户发表论文检索情况 (2016 年)
超级计算用户 2016 年度已发表论文共 528 篇,检索情况如图 11 所示,其中被 SCI 和 EI 检索论文数达到 94%。和 2015 年度相比,2016 年度论文数量总数减少 30.52%,分析主要原因是“十三五”初期项目处于启动阶段,论文发表成果相对上一年数量有所减少。分析发现,中国科学院院超级计算环境提供的计算服务有力地促进了基础理论研究、科学发现和工程技术创新。
图11 超级计算用户已发表论文检索情况Fig. 11 Retrieval of published papers of Supercomputing users
图12 超级计算用户专利授权情况Fig. 12 Patent licensed by Supercomputing users
(3) 超级计算用户专利授权情况 (2016 年)
2016 年度超级计算用户专利授权共计 53 项,与2015 年度相比,专利数量增长 89.29%,类别分布情况如图 12 所示,由超级计算技术支撑所产出的专利集中在“发明”“国外专利”和“实用新型”三个类别,各类专利数量呈逐年上升趋势,进一步说明超级计算对于知识创新发挥了重要的促进作用。