APP下载

镍基高温合金材料数据集

2019-11-26尹海清徐斌姜雪张聪张瑞杰刘国权曲选辉

尹海清,徐斌,姜雪,张聪,张瑞杰,刘国权,曲选辉,2

1. 北京科技大学钢铁共性技术协同创新中心,北京 100083

2. 北京科技大学新材料技术研究院,北京 100083

数据库(集)基本信息简介

引 言

高温合金具有优异的高温强度、良好的抗氧化和抗热腐蚀性能、良好的疲劳性能和断裂韧性[1],是指在600℃以上的环境中能够应对复杂的应力环境,并且可以保持表面稳定性的合金,是飞机发动机、汽车发动机常用材料。高温合金分为铁基、镍基和钴基3类高温合金,其中由于镍具有FCC结构组织稳定,室温到高温不发生同素异性转变,500℃以下几乎不氧化,且合金化能力强,添加十余种元素无有害相的特点[2],因此是应用最为广泛的高温合金材料。镍基高温合金在 650~1000℃范围内具有较高的强度和良好的抗氧化、抗燃气腐蚀能力[3],广泛应用于航天发动机及航空发动机涡轮盘。高温合金优异的力学性能是航空发动机稳定运行的保证,是推动航空事业发展的重点环节,因此研究镍基高温合金力学性能对于我国航天航空事业的发展具有重要意义[4]。自1956年第一炉高温合金试炼成功,迄今为止,我国高温合金的研究、生产和应用已经历了多年的发展历程。回顾多年的历史,我国的高温合金从无到有,从仿制到自主创新,合金的耐温性能从低到高,先进工艺得到了应用,新型材料得以开发,生产工艺不断改进且产品质量不断提高,并建立和完善了我国的高温合金体系,使我国航空、航天工业生产和发展所需的高温合金材料立足于国内,也为其他工业部门的发展提供了需要的高温材料[5]。

然而,高温合金是国家重要军备资源,保密性极强,美国高温合金的生产企业主要有P&W、GE、Honeywell等,对高温合金数据的管理十分严格,公司内部数据库处于保密状态,因此高温合金数据的获取并不容易。高温合金数据方面,国外已有的涉及高温合金的数据库包括美国国家标准局材料性能数据库,此数据库部分关键数据收费;荷兰PETTER欧洲研究中心的高温材料数据库,数据开放且数据涉及范围为力学与热力学;日本金属研究所、日本金属学会建立的金属材料力学性能数据库与日本国家材料科学研究所建立的“材料数据平台”处于数据开放状态。欧美俄日等国家十分重视高温合金信息的保护,国外高温合金数据库依附于各个研究机构,并且有较高的保密性。国内高温合金数据库有材料科学数据共享网,材料基因工程专用数据库,但整体上高温合金数据库建设相对缓慢,对外公开的高温合金数据库较少,使得国家高温合金数据交流困难,一定程度制约高温合金发展。所以国内学者使用高温合金数据相对困难,资源获取相对困难。

因此,建立高温合金数据库对未来国家航空发展具有重要的意义。本数据集希望拓宽高温合金数据获取通道,加强领域人才数据交流,实现数据共享,推动高温合金研究发展,促进国家材料基因工程发展。

1 数据采集和处理方法

1.1 数据源

本数据集的数据来源包括四种途径:(1)领域内最具影响力的国际高温合金大会会议论文集(International Symposium on Superalloys);(2)《中国高温合金手册》[6];(3)镍基高温合金相图热力学计算数据;(4)国内外公开发表的优质期刊文章。其中国内外公开发表的高温合金相关文章的数据采集仍在不断进行中,数据集的数据量将不断扩大。

国际高温合金大会创立于1968年,每4年举行一次,是高温合金领域水平最高、影响力最大、历史最悠久的国际性学术大会。每次会议均在9月举行,由来自世界各地著名的科研院所与高校、发动机制造公司和高温合金生产公司等产学研用单位的代表们参加,被誉为高温合金界的“奥林匹克大会”[7]。国际高温合金大会论文研究范围包括铁基高温合金、镍基高温合金和钴基高温合金3类。而文章内容涉及铸造(定向结晶、单晶、多晶)高温合金工艺、变形高温合金工艺和粉末冶金高温合金工艺,并研究其蠕变性能、疲劳性能和腐蚀性能,还包括各元素对高温合金组织性能的影响等多个方面,其广泛的研究范围为数据的开拓应用提供保障。目前收录了1980年至2016年间的国际高温合金大会会议论文集的文章数据。《中国高温合金手册》是国内权威高温合金著作,高温合金实验数据可靠性强,是国内顶级的高温合金参数著作。相图计算以热力学计算为基础,通过添加元素计算高温合金相组成,实现提高强化相含量、减少有害相含量的目的,是设计高温合金的有效手段。以 Acta Materialia为代表的国际知名结构材料学术期刊收纳大量高温合金相关学术文章,同样包含大量高质量、实际应用意义强的高温合金数据,可进一步拓展高温合金研究。本数据集以高温合金手册、热力学计算和优质论文作为数据采集对象,将论文集中镍基高温合金的实验、计算类数据进行收集、整理,形成高温合金数据集。

1.2 数据内容规范

根据《材料科学数据统一描述规范的建立与应用》[8]对材料科学数据建立与描述方式的规范,以及《材料科学数据提交格式规范》对材料科学数据收集、整理、提交做出的统一格式要求[9],确定镍基高温合金数据内容(表1),最终获得镍基高温合金数据集。镍基高温合金数据分为通用信息、材料牌号、材料名称、化学成分、原材料信息、性能信息、实验条件、数据生产与审核8个大模块。每个大模块下又会有各自的小模块,细化镍基高温合金数据的描述,全面提取文章中的可用信息,保证数据的完整性。然后按照镍基高温合金数据模板内容在文章中寻找可用模板数据并记录。

表1 镍基高温合金数据内容

1.3 数据收集范围

本数据集中数据主要根据高温合金实际应用需求进行收集。高温合金的使用需求主要是力学性能满足航空发动机实际要求,因此数据范围主要包括拉伸强度、屈服强度、持久强度和蠕变强度等宏观力学性能,以及晶格错配度、相含量等影响宏观力学性能的微观组织特性。数据收集范围以《中国高温合金手册》中涉及的性能为依据,以实际应用为向导,进一步促进高温合金数据收集的发展。

1.4 数据采集与处理

文章中的数据分为3类。第1类是数字化数据,第2类是文本数据,第3类是图中数据。不同数据类型,其数据内容、数据所在位置和获取方法不同。表2列举了3种类型数据各自的数据内容范围,数据所在位置和数据获取方法。

表2 数据内容及其采集、处理方法

2 数据样本描述

2.1 数据样本

镍基高温合金数据模板通用信息、材料牌号、材料名称、化学成分、原材料信息、性能信息、实验条件、数据生产与审核8个大模块中,材料牌号、材料名称、化学成分、性能信息与实验条件5项是必填项,以此保证数据的完整性。

通用部分(图 1)包括创建时间、关键词、提交者、摘要信息、DOI、数据录入方式、模板名,展示数据的基本生产信息。

图1 镍基高温合金数据样本——通用部分

材料牌号、材料名称(图2)两部分是该高温合金的常用名称。

图2 镍基高温合金数据样本——材料牌号、材料名称

化学成分(图3)是将高温合金的所有添加组元进行记录,并且每一种化学成分对应着其百分含量。

图3 镍基高温合金数据样本——化学成分

原材料信息(图4)主要展示原材的特性,包括原材的某些性能特性及其生产过程。但是一般来说,文章中相关记录不多。

图4 镍基高温合金数据样本——原材料信息

性能信息(图5)中微观组织、性能类别、性能名称、性能值与单位一一对应,与性能相关附件关联的是文章中相关材料的微观组织图片与性能数据。

图5 镍基高温合金数据样本——性能信息

实验条件(图6)将文章中所描述的实验步骤全部记录下来,包括其制备过程与测试过程的工艺参数等,实现全流程数据的记录。

图6 镍基高温合金数据样本——实验条件

数据生产与审核(图7)需要提交人记录摘录人员及其审核数据人员信息,并且要求审核人员具有一定业内知识水平,保证数据合理性。

图7 镍基高温合金数据样本——数据生产与审核

其他信息(图8)是数据的来源方式,按照国标GB/T7714记录所摘录的文章。

图8 镍基高温合金数据样本——其他信息

2.2 数据存储

本数据集以网页形式进行展示,数据存储于服务器之中,响应大数据的时代要求并为后续数据补充添加打下基础。数据存储形式摆脱传统单机模式、共享困难的Excel表存储形式,以网页页面的形式展示数据以促进数据共享。同时,数据使用过程中可以实现Excel表形式的数据集调用,方便研究人员的数据使用。

未来,数据量增加至一定量时,会将数据集形成软件,实现更加合理方便的数据调用,促进国家高温合金的研究与发展。

2.3 数据DOI标识

数字对象唯一标识符(Digital Object Identifier,简称DOI)是由美国出版协会(The Association of America Publishers,简称 AAP)创建,由国际数字对象唯一标识符基金会(International DOI Foundation,简称IDF)负责运行的数字对象唯一标识符系统[10]。材料科学数据的 DOI编码格式为“DOI:10.institution/classification.project.date.type.sequence”。图9为DOI标识示例与内容描述。本数据集建立了材料数据的DOI标识,来自同一篇文章的数据拥有唯一的DOI标识,是数据集中对数据知识产权的描述,保证数据的知识产权不受侵害。

图9 数据DOI标识示例与内容描述

3 数据质量控制和评估

本数据从数据来源、数据审核人和数据误差率3个方面对数据质量进行控制和评价。

材料科学数据可以分为完全可靠、一般可靠和有待验证3类,其中完全可靠的数据指已公开发行的手册、标准、书籍等出版物的数据,一般可靠指的是公开发表的论文的数据。本数据集的数据来源是高温合金领域的公开出版的权威手册以及公开发表的论文,数据可靠程度高,最大程度上保证了本数据集的可靠性。

本数据集采用人工方法从手册或论文中获取数据。对于文中明确给出的数据内容,数字化数据进行完整摘录,所收集数据与原文数据一致。对于文章中图片给出的散点数据,采用人工抽选对照校验,随机抽取300条数据进行重新描点对照,获取数据误差率在3%以内。

数据审核者要求是高温合金领域的知名学者或具有足够知识水平能力保证数据正确性的人员,以此保证数据质量,本数据集的审核人是具有高温合金材料相关丰富知识和经验的老师。由于数据来源可靠,数据的审核主要针对数据化过程中可能出现的转化误差或操作误差。除此之外,对于审核过程中发现的少数不符合高温合金常规认知的可疑数据,进行了人工删除。

4 数据价值

由于国外高温合金数据库对数据保密程度高,国内学者使用数据非常困难。因此,本数据集收集高温合金数据并对外公开,旨在突破数据信息交流的壁垒,使数据为高温合金领域的研究学者和设计人员所共享,充分发挥数据的使用价值。

本数据集涵盖整个材料的过程信息,使数据使用人员能够清晰地理解材料每一个步骤的变化。数据量约1.3万条数据,为大数据分析提供数据基础。使用神经网络、支持向量机、回归分析及多元线性回归等多种方法进行数学分析,可以为采用数据挖掘方法研究高温合金奠定坚实的数据基础。同时,采用大数据技术进行研究,契合材料基因工程的思想,有助于推动国家材料基因工程的发展。

同时,本工作独创性地应用 DOI标识解决了材料数据的知识产权保护难题,对每一条数据和本数据集进行知识产权保护,明确数据的产出,使DOI成为推动数据共享的重要举措。