APP下载

基于卷积神经网络模型的Gd2O3/6061Al中子屏蔽材料的力学性能预测

2020-08-11王文先贾程鹏马颖峰徐文瑞

原子能科学技术 2020年8期
关键词:中子伸长率屏蔽

张 鹏,李 靖,王文先,贾程鹏,马颖峰,徐文瑞

(1.太原理工大学 物理与光电工程学院,山西 太原 030024;2.新型传感器与智能控制教育部重点实验室,山西 太原 030024;3.太原理工大学 材料科学与工程学院,山西 太原 030024)

随着世界能源危机的加剧,核能以其清洁、低资源消耗的优势,成为最具潜力的能源之一。然而,1个MW级的核电站通常每年会排放约25 t的乏燃料,乏燃料含有很强的中子,会对周围环境和人类造成严重的辐射污染。因此,中子吸收材料成为核、乏燃料和核废料储运过程中临界控制和安全防护的必要材料。由于核电站严苛的服役环境,对中子屏蔽材料的力学性能要求越来越高。若能建立一种有效的力学性能预测模型,将会大幅提高材料的设计及制备效率。卷积神经网络(CNN)是一种主要用于自然图像识别的神经网络[1],可自动提取图像的特征,如晶粒数目、晶粒大小、晶粒类型、孔洞数目、晶界等,这些特征与材料性能之间有着密切的联系。近年来,AlexNet、VGG、GoogLeNet、ResNet等CNN被相继提出,宋新宽等[2]利用CNN可通过多孔材料的显微照片快速、准确地计算其扩散系数,训练后的CNN对测试集的预测准确度达96.70%;曹卓等[3]通过CNN模型,使用从材料数据库中收集到的4 000多种材料数据,对材料的形成能进行预测,并得到较为准确的预测结果;Kondo等[4]通过VGG改进的神经网络模型,对陶瓷材料的微观组织进行识别,并准确预测出陶瓷材料的离子导电率。

本文选用Gd2O3/6061Al中子屏蔽材料,收集大量材料在变形过程中的EBSD微观形貌及对应的拉伸性能数据,将这些数据划分为训练集和验证集,用于训练改进的VGG CNN模型,建立微观形貌-力学性能之间的非线性关系CNN模型,并通过留一法交叉来验证测试CNN模型对材料测试集验证的准确性。

1 卷积神经网络模型

表1列出使用的CNN模型结构。CNN包括卷积层、池化层和非线性连接层3部分,卷积层接收1个输入图像并将其过滤到经过过滤的映射中。1个卷积层通常有几个过滤器,许多经过过滤的图像会通过后续的层生成相应的映射,这些过滤后的映射称为特征映射。卷积层中的过滤器不是在训练前预先定义的,而是通过训练数据来学习的。在训练阶段,为了减少预测损失,一些参数会被逐步修改,如标签间的均方误差(训练数据的属性)和预测值。池化层接收功能映射并将其调整为更小的映射,池化层应用最广泛,它主要接受域的最大值,这种粗粒化的操作为小的平移扰动提供了鲁棒性。

表1 CNN模型结构[5]Table 1 Structure of CNN model[5]

本文使用3×3的卷积层构建一类似于VGG模型[5]的CNN架构,目前的CNN架构较原VGG的最大区别是参数数量。在目前研究中,由于电子显微镜图像采集困难,不能即时进行数据扩充来准备数以亿计的训练数据。为避免使用显微镜图像进行CNN模型训练时发生过度拟合,需适当减少参数数量,因此建立的CNN模型中仅有74 061个参数,为原VGG模型的0.05%。

2 数据处理

中子屏蔽材料的微观结构(晶粒的大小、类型、数目等)与其特性(力学性能、中子吸收性能、抗辐照性能等)之间有着紧密关系,如图1所示,微观结构(输入)和性能(输出)分别用x和y表示,当给定输入x时能准确预测y。

图1 CNN模型示意图Fig.1 Schematic diagram of CNN model

采用放电等离子烧结法和热轧制方法制备4种不同轧制道次下的Gd2O3/6061Al中子屏蔽材料试样,采用扫描电子显微镜获取中子屏蔽材料的EBSD微观形貌(包含晶粒大小、晶粒取向、晶粒数目等特征),微观组织图像大小约为400×400像素。材料的微观组织与材料的宏观力学性能、热中子屏蔽性能等特征密切相关。本文使用的Gd2O3/6061Al中子屏蔽材料的晶粒取向是随机分布的,因此本文不涉及晶体取向信息。

a——形变量0%,拉伸强度100 MPa,伸长率7%;b——形变量40%,拉伸强度150 MPa,伸长率13%;c——形变量80%,拉伸强度240 MPa,伸长率16%图2 选用训练集中的输入图像Fig.2 Selection of input image of training set

使用裁剪的112×112输入图像数据来训练CNN模型,且使用留一法交叉验证来评估训练后的CNN泛化性能。首先,将3个Gd2O3/6061Al中子屏蔽材料样本中的微观组织图像进行裁剪(程序自动执行);然后,由裁剪后的数据集中划出20%作为测试数据,从剩余的数据集中整理出训练集和验证集。对每个图像所对应的材料样本,均采用万能拉伸试验机测试其拉伸性能。每个裁剪图像对应的局部拉伸性能随机匹配宏观拉伸性能,即所有裁剪的图像均被分配相同的标签y(测量的拉伸强度y1和伸长率y2),图2为选用训练集中的输入图像。除可训练参数的初始值外,相同的训练过程重复10次,其中初始参数使用的随机种子是不同的。采用最小批量为20的随机梯度下降法(SGD)和均值平方误差为目标函数对Adam(一种自适应SGD算法)算法进行优化。在SGD中,1小组训练样本(称为小批量)是从整个训练数据集中随机抽取的。然后使用小批量计算损失函数的梯度,即测量拉伸强度和伸长率与预测值之间的均方误差,利用梯度可更新CNN中的训练参数。通过使用小批量而不是整个训练样本集,可使参数更新表现出随机性,避免高代价的局部极小值。

通过将每个图像随机裁剪、翻转(水平和垂直)和旋转来增加数据集,裁剪以获得更小的图像有时会丢失关于宏观属性的信息。进行图像数据处理时应尽量选择代表性体积元素[6]。每个Gd2O3/6061Al中子屏蔽材料图像样本的训练集和验证集分别为100和50。

3 结果与讨论

3.1 性能预测

图3为CNN和使用核函数的岭回归模型(KRR)的留一法交叉验证结果。可看出,与KRR相比,CNN可从原始的特征图像中更准确地预测材料的力学性能。

a——CNN验证的拉伸强度;b——KRR验证的拉伸强度;c——CNN验证的伸长率;d——KRR验证的伸长率图3 CNN和KRR的留一法交叉验证结果 Fig.3 Leave-one-out cross-validation results obtained by CNN and KRR

为更详细地阐明通过CNN提取的特征,特别是CNN是否捕获统计信息,本文研究图像的裁剪尺寸与R2得分的依赖关系。图4为特征图尺寸与预测精度的关系,R2得分随图像尺寸的增大而增大,在特定尺寸约为3 mm时达到最大值。这表明,对于用于训练的大于3 mm的图像没有额外的统计信息,包含足够统计信息的最小容量称为RVE。3个Gd2O3/6061Al中子屏蔽材料样品中第1个峰值点的最大值与RVE一侧长度的一半重合,如图5所示,rpeak是所有空隙的RDFs中第1个峰值的最大值点。这意味着RVE的定义至少包含两个晶粒,证明CNN不仅捕捉到晶粒的存在,也捕捉到晶粒的一些统计信息,如晶粒的密度、取向等。

图4 特征图尺寸与预测精度的关系Fig.4 Relationship of image size and prediction accuracy

图5 RVE示意图Fig.5 Schematic diagram of RVE

3.2 结果可视化分析

国内外提出了多种CNN可视化方法[7],其中使用较广泛的是一种原始的可视化方法,此方法与CAM和Grade-CAM[8-9]相似。设g和gi分别为平均池化(GAP)层[10]的输出向量及其分量(表1)。在最后的卷积层后添加GAP层,所有随后的层均是完全连接的,则:

(1)

其中:y为CNN的输出值;W为全连接层的权重矩阵;ReLU( )=max(·,0)是修正线性单元。显然,y是gi的非线性函数,通过将y标记的图像传递给训练后的CNN来激活gi的算术平均值。行和列分别对应于gi的标签y和索引i,可发现gi的激活值随y的增加而近似单调地增加或减少,因此,将gi与y的关系可近似为:

y≈aibi+gi

(2)

对于每个i,若ai>0,gi可看作是大于y的一个特定特征;若ai<0,gi可看作是小于y的一个特定特征。

P={i|ai>0}

Q={i|ai<0}

(3)

(4)

(5)

(6)

特定类的特性概念与类激活映射[11]非常相似。另外,利用中间特征相对于输出的重要性趋势类似于梯度加权类激活映射[12]。由图4可看出,从力学性能较好的中子屏蔽材料中截取的一些图像的预测值低于从力学性能较差的材料中截取的图像,反之亦然。

图6 晶粒尺寸与体积分数的相关性分布Fig.6 Correlation distribution of grain size and volume fraction

本文假设从相同材料的微观组织图像中所裁剪出的图像均具有相同的拉伸强度和伸长率。事实上,不能期望裁剪图像的预测结果与给定的标签完全一致,所有的预测结果均应是随机的。大晶粒在拉伸强度较低的材料中更常见,相反,平坦的区域表明晶体缺陷较少,这被认为是一种具有高强度的Gd2O3/6061Al中子吸收材料。预测结果与实验结果一致,表明材料的力学性能随轧制道次的增加而提高[13]。此外,纹理边界并没有被CNN捕捉到作为重要的特征。这是因为材料在轧制过程中,不易变形的Gd2O3颗粒将基体晶粒细化为小晶粒,从而使晶粒数目增加。这意味着晶粒数目和晶粒大小之间具有很强的相关性(图6)。另一方面,代表1个晶粒需许多彼此距离很远的边缘特征。根据使用现有可视化方法的观察结果,可推断目前的CNN已捕获了合理的特征。

4 结论

本文利用原始的架构和数据扩充,通过CNN实现了结构-属性的连接。与传统的结构-性能连接方案相比,其主要优点是不需进行特征工程,这可避免研究人员的偏见结构与性质之间的联系。本文研究结果表明: 1) 使用多个显微图像,不需任何人工图像处理,CNN可得到良好的训练结果,其性能优于传统的测试方法;2) Gd2O3/6061Al中子屏蔽材料样品中第1个峰值点的最大值与RVE一侧长度的一半重合,这意味着RVE的定义至少包含两个晶粒,证明了CNN不仅捕捉到晶粒的存在,也捕捉到晶粒的一些统计信息;3) 材料在轧制过程中,不易变形的Gd2O3颗粒将基体晶粒细化成小晶粒,从而使晶粒数目增加,这意味着晶粒数目和晶粒大小之间具有很强的相关性。

猜你喜欢

中子伸长率屏蔽
VVER机组反应堆压力容器中子输运计算程序系统的验证
把生活调成“屏蔽模式”
朋友圈被屏蔽,十二星座怎么看
(70~100)MeV准单能中子参考辐射场设计
3D打印抗中子辐照钢研究取得新进展
油田注水用复合管受力性能研究
如何屏蔽
对建筑工程钢筋检测试验中几个主要环节的探讨
预应力钢绞线伸长值的计算与偏差控制
屏蔽