基于金字塔池化网络的质子交换膜燃料电池气体扩散层组分推理方法

2024-05-15王虎尹泽泉王雯婕黄笠舟方宁宁隋俊友张加乐张锐明隋邦傑

重庆大学学报 2024年1期

王虎尹泽泉王雯婕黄笠舟方宁宁隋俊友张加乐张锐明隋邦傑

摘要：針对质子交换膜燃料电池气体扩散层（gas diffusion layer composition，GDL）形貌划分与制备工艺改进问题，提出了一种基于金字塔池化网络（pyramid scene parsing network，PSPNet）与多层感知器（multi-layer perception，MLP）的气体扩散层组分识别与比例推理方法：首先将带标签的气体扩散层扫描电镜（scanning electron microscope，SEM）图片输入神经网络，得到特征图；得到的图像特征层进入金字塔池化模块后，获取SEM图像的深层和浅层特征；随后将深层和浅层特征图层融合输入全卷积网络（fully convolutional network，FCN）模块，得到预测图像；最后统计各个组分上的像素点比例，通过MLP完成组分比例推理。结果表明：所提方法组分识别像素准确率达81.24%；在5%偏差范围内，比例推理准确率为88.89%。该方法解决了气体扩散层多组分无法区分、比例无法获知的问题，可有效应用于气体扩散层的质检、数值重构以及制备工艺改进。

关键词：质子交换膜燃料电池；气体扩散层制备；扫描电镜；人工智能；金字塔池化网络；多层感知器

中图分类号：TK91 文献标志码：A 文章编号：1000-582X（2024）01-084-09

Inference method of proton exchange membrane fuel cell gas diffusion layer composition based on pyramid scene parsing network

WANG Hu1，2， YIN Zequan1，3， WANG Wenjie2， HUANG Lizhou3， FANG Ningning3，

SUI Junyou2， ZHANG Jiale4， ZHANG Ruiming5，6， SUI PangChieh1

（1. School of Automotive Engineering， Wuhan University of Technology， Wuhan 430070， P. R. China; 2. Nanjing Royali Intelligent Technology Co.，Ltd.， Nanjing 211106， P. R. China; 3. China Automotive Innovation Corporation， Nanjing 211100， P. R. China; 4. College of Aerospace Engineering， Nanjing University of Aeronautics and Astronautics， Nanjing 210016， P. R. China; 5. Guangdong Hydrogen Energy Institute of WHUT， Foshan， Guangdong 528200， P. R. China; 6. Foshan Xianhu Laboratory of the Advanced Energy Science and Technology Guangdong Laboratory， Foshan， Guangdong 528200， P. R. China）

Abstract： To rapidly determine the morphology of the gas diffusion layer for proton exchange membrane fuel cell （PEMFC） and improve its fabrication process， a method of gas diffusion layer （GDL） component identification and proportional reasoning based on a combination of pyramid scene parsing network （PSPNet） and multilayer perceptron （MLP） is proposed. First， labeled GDL scanning electron microscope （SEM） images are input into the neural network to obtain a feature extraction map. This map is used in the pyramid pooling module to extract both deep and shallow features of the SEM images. Subsequently， these feature layers are input into the fully convolutional network （FCN） module to produce a predicted image of the same size. Finally， the proportion of pixels for each component is calculated， and the inference of component proportion is achieved by using the MLP. The accuracy of the proposed method is 81.24%， with an accuracy of proportional reasoning reaching 88.89% within a 5% deviation range. The proposed method can be effectively used for gas diffusion layer quality detection， numerical reconstruction， and process improvement.

Keywords： proton exchange membrane fuel cell; gas diffusion layer preparation; scanning electron microscope; artificial intelligence; pyramid scene parsing network; multilayer perceptron

气体扩散层（gas diffusion layer，GDL）作为质子交换膜燃料电池最重要的零部件之一，主要负责传输反应气体[1]、导出电子[2]、排出反应生成的水[3-4]。GDL由碳纤维、粘接剂、疏水剂通过高温石墨化制备而成，各组分的比例及分布情况决定了气体扩散层的孔隙结构、连通性，从而影响导气、导电与传热等过程，并进一步影响整个膜电极乃至燃料电池的性能。因此，实现对气体扩散层微观结构中不同组分的精准识别具有重要意义。

碳纤维与粘接剂在石墨化后，转化为相同的碳元素，疏水剂附着其间，给商用碳纸的组分识别工作带来了巨大的挑战。针对气体扩散层组分划分问题，国内外学者展开了大量的研究工作。X射线计算机层析成像（X-ray computed tomography，XCT）是探究气体扩散层微观几何结构使用最广泛的方法之一。T?tzke等[5]利用XCT研究了Freudenberg H2315气体扩散层在压缩条件下的形态结构。Zenyuk等[6]利用XCT研究了气体扩散层的微观结构和输运性能。但是通过XCT方法获得的气体扩散层微观结构无法区分各个组分，难以获得组分比例。

扫描电镜（scanning electron microscope，SEM ）方法由于实验成本较低、成像清晰，近年来逐渐成为研究多孔介质微观结构的主流方法之一。许多学者根据SEM图进行气体扩散层数值重构，在计算域中面内方向随机添加纤维，逐层叠加，形成气体扩散层微观结构[7]，以此研究其各项性能。Simaafrookhteh等[8]雖然在重构中考虑了粘结剂的作用，但性能数值计算结果与实验结果仍存在差异，可能原因在于粘接剂和疏水剂的比例形态不合理。Zhu等[9]通过数值重构研究粘接剂和疏水剂的含量及形态对性能的影响，但是重构的依据为孔隙率，微结构组分并非真实分布。因此，对于一张商用碳纸，区分碳纸的纤维、粘接剂、疏水剂分布状况，对更准确地重构气体扩散层至关重要，可以为数值方法探究碳纸性能提供更准确的方法，也将为实验制备气体扩散层提供流程优化的量化指标。

随着计算机技术的飞速发展，计算机视觉逐渐形成了专业的学科领域，特别是将深度学习引入到图像处理领域后，可以赋予分割区域更准确的语义信息。笔者针对上述问题，提出了一种基于金字塔池化网络（pyramid scene parsing network，PSPNet ）[10]与多层感知器（multi-layer perception，MLP）[11]的气体扩散层组分识别与比例推理模型。该模型以SEM图片为输入，输出组分识别图以及生产过程中的组分比例分数，实现对气体扩散层的碳纤维、粘接剂、疏水剂和孔4部分的多尺度识别和比例推理，解决了以往无法探究主流气体扩散层组分分布与相应比例的难题，有助于气体扩散层制备流程优化和燃料电池数值计算研究。

1 方法

1.1 方法概述

文中提出的基于语义感知图神经网络的气体扩散层组分识别与比例推理方法的整体框架如图1所示，包括组分识别和比例推理2部分。组分识别功能由PSPNet实现，随后全连接层实现语义分割图导出，进行像素统计后进入比例推理回归模型中。比例推理功能通过MLP模型训练，根据像素点比例由输入的倍率确定调用的网络，实现组分质量比例值的回归。

在数据量较少、图像语义较简单的情况下，所训练的PSPNet可以较好地识别孔、碳纤维、粘结剂、疏水剂的空间分布，MLP网络模型具有良好的比例推理的效果。

1.2 气体扩散层组分识别方法

1.2.1 PSPNet及其结构特点

PSPNet在2017年首次被提出[10]，是通过改进全卷积网络[12]（fully convolutional network，FCN）而来的语义分割网络，其独特的金字塔池化模块可以结合多尺度特征提取出固定大小的特征向量。

PSPNet网络的主要结构如图2所示，其中CNN为卷积网络模块、POOL为池化作用、CONV为卷积作用、UPSAMPLE为上采样、CONCAT为通道数合并操作。整个网络分为3部分，分别是特征提取的ResNet[13]卷积模块、金字塔池化模块以及最后的FCN输出模块。该网络使用ResNet提取特征，金字塔池化进行深层浅层的特征提取，由FCN[12]输出相同尺寸的预测图像。

使用2种方式引入SEM图像全局信息：一种是在PSPNet网络中，使用卷积神经网络ResNet增加感受野，主要通过空洞卷积，得到气体扩散层SEM特征图；另一种应用金字塔池化模块，同时提取并融合图像深层和浅层的特征，以此来避免过多误分割的情况，方法的详细流程如下。

第1步：将图像输入网络后，经过裁剪等预处理，通过特征提取ResNet卷积模块提取图像特征，卷积深度为50层。

第2步：将得到的图像特征输入池化模块，以此捕捉SEM图像的深层和浅层特征信息，本研究中分别选用1、2、3、6作为网络的池化特征尺寸。

第3步：在池化后，将第2步获得的2层特征图层同时输入FCN模块，得到带有组分区域划分的SEM图像。

1.2.2 组分识别训练过程

气体扩散层SEM图组分识别方法如图3所示，分为模型训练与模型预测2个阶段。在模型训练阶段，裁剪气体扩散层SEM图像集，建立SEM图像数据集，利用PSPNet对所得数据集进行特征提取训练，得到预测概率图。选择交叉熵函数计算训练损失函数，同时选择Adam算法[14]，实现算法的反向迭代优化。采用mmsegmentation为训练平台，训练参数选择随机梯度下降法（stochastic gradient descent，SGD），设置学习率为0.01，动量为0.9，在所有数据输入完成600次迭代后模型最优。

在SEM图像预测阶段，将新的SEM图像输入已训练好的特征提取模型中，得到气体扩散层SEM图中的各组分标注。

1.3 气体扩散层比例推理方法

根据组分识别模块所得组分分割图片，统计各个组分上的像素点得到二维的组分比例，通过MLP完成从SEM图片二维组分比例组映射到三维的组分比例信息。

由于本研究中输入和输出的参数空间较小，采用层级过多的深度学习模型会产生过拟合的问题。因此，根据输入空间构建了图4所示的MLP：该结构包含3个中间层，分别由8个、16个和8个神经元构成，最终映射到输出层。

采用的MLP结构包括输入层、隐藏层和输出层，不同层之间是全连接的，即上一层的任何一个神经元与下一层的所有神经元都有连接。每一层的主要内容包括权重，偏差值和激活函数。激活函数起非线性映射的作用，目的是增强模型的学习能力，激活函数还可将神经元的输出幅度限制在一定范围内。本研究中使用的激活函是tanh，可使每一层的输出控制在（1，1）。其表述如图5所示。

图中，m为样本输入维度，（X0，X1，…，Xm）为输入向量，W为输入参数，Σ为求和函数，Ф为激活函数。

本次研究训练过程中使用的损失函数是均方误差。反向传播更新参数权重时使用Adam优化方法，学习率为104。

2 实验

2.1 燃料电池气体扩散层SEM图

气体扩散层在质子交换膜燃料电池中的位置如图6所示，其厚度为100～300 μm，位于双极板（BPP）与微孔层（MPL）之间。图中，CL为催化层，PEM为质子交换膜。

在气体扩散层数值研究中，100 μm×100 μm面积以上可以有效表征整张碳纸的特性，由于气体扩散层趋向于均匀的层级结构，故SEM图虽然只能表征表面形貌，但在一定程度上可以反映气体扩散层三维特征，从而与组分质量比例建立相互对应关系。图7是日本东丽Toray TGP-H-030疏水处理后，在500倍率下的SEM图，视野区域约为200 μm×150 μm，满足域的大小要求，图中仅对典型特征做了标注示意，并未标注所有特征。

除孔隙外，碳纤维在气体扩散层中的质量占比最高，粘接剂次之，疏水剂最少。图中直杆状物为碳纤维，将碳纤维搭接单次作为第一层，深层次的内容全部视为本层的孔隙（黄色区域）。粘接剂通常会出现在两根碳纤维搭接处，呈深色光滑状。疏水剂无法独立成型，通常附着在粘接剂和碳纤维上，呈白色絮状，其绝大部分存在于粘接剂表面。

从表面观察来看，面积占比从大到小依次分别是孔、碳纤维、粘接剂、疏水剂。以此看来，二维特征与三维特征并非简单对应，故需要训练神经网络计算推理相关权重。

2.2 数据集简介

本次研究中使用的碳纸为200 mm×200 mm的样品，厚度为0.1～0.3 mm。采购日本Toray 5类进口商用碳纸，进口商用碳纸相关成分比例未知。本研究中通过对不同面密度原纸进行热压、树脂填充、碳化、石墨化、疏水浸渍，生产CF730、CF745、CF760三大类碳纸，每大类共9种，每种均对应不同的碳纤维、粘接剂、疏水剂质量比例。

2.2.1 组分识别数据集

组分识别训练数据集为5类进口商用气体扩散层，为保证采样图片客观表征整张碳纸的结构特性，设置采样点如图8所示，每张碳纸取9个采样点，每个样本拍摄6个倍率的SEM图，得到270张图片的数据集，图片分辨率大小为2 048 × 1 536（宽× 高）。

考虑到标注的难度与特征提取的分辨率需求，选用500倍率进行算法训练，共45张SEM图，其中训练集35张、测试集5张、验证集5张。标注工具采用开源软件labelme，分别标注碳纤维、粘接剂、疏水剂，剩余区域在算法中定义为孔，标注图如图9所示。图中绿色为碳纤维，红色为粘接剂，黄色为疏水剂。

2.2.2 比例推理数据集

比例推理数据集由自制27类国产气体扩散层SEM图组成，其形貌与进口碳纸相同，且已知生产阶段的组分质量比例。同样地，每張碳纸取9个采样点，每个样本拍摄6个倍率的SEM图，得到SEM图1 458张，图片分辨率为2 048 × 1 536（宽× 高）。每个大类取用5种碳纸的图片和比例信息做训练，其余4种碳纸做测试，故训练集为810张，测试集为648张。其中每个倍率均训练模型，则单个神经网络训练集为135张，测试集为108张。

2.3 评估指标

2.3.1 组分识别评估指标

本模块中采用像素准确率（pixel accuracy，PA）作为评价指标，定义为预测类别正确的像素数占总像素数的比例，具体公式如下：

PA=（TP+TN）/（TP+TN+FP+FN）。（1）

式中：TP表示正类判定为正类；FP表示负类判定为正类；FN表示正类判定为负类；TN表示负类判定为负类。

2.3.2 比例推理评估指标

本模块根据实际的预测需要，定义气体扩散层比例推理专用评价指标，假设pre_binder、pre_fiber、pre_PTFE分别为深度学习模型预测出的粘接剂（binder）、碳纤维（fiber）以及疏水剂（PTFE）的预测值。std_binder、std_fiber、std_PTFE分别为深度学习模型预测出的粘接剂、碳纤维、疏水剂的上下限，由于操作流程的限制，在气体扩散层制备过程中，现阶段工艺条件对成品的质量比例只能控制在5%的上下误差之内，故设置上下限std_*均为5%。true_binder、true_fiber、true_PTFE分别为粘接剂、碳纤维和疏水剂的真实值，为定义评价指标，定义规则为：如果true_*在（pre_*-std_*， pre_*+std_*）范围内，则mask_*记为1，否则mask_*记为0，其中*代表粘接剂（binder）、碳纤维（fiber）和疏水剂（PTFE）。

基于此規则，单张SEM图的组分比例准确率如式（2）所示，多张测试图的总体准确率a则取平均值：

a=1/3 （mask_binder+mask_fiber+mask_ptfe）。（2）

3 结果与分析

3.1 组分识别结果

分别使用UNet、Segformer、PSPNet方法，对比验证了PSPNet在组分识别方面的适用性，经过模型训练，得出500倍率下组分识别的结果如表1所示。

在相同数据集的情况下，PSPNet被验证能够准确区分粘接剂与疏水剂，并且像素准确率最高，为81.24%，于是选择PSPNet作为组分识别方法的主网络进行训练，图10为部分组分识别结果。图中绿色部分为碳纤维，红色部分标注为粘接剂，黄色部分为疏水剂。在识别结果中，可以看出气体扩散层的首层结构均能被较好地识别出来，检测结果纹理清晰、边界轮廓明显。

3.2 比例推理结果

将MLP推理组分比例方法应用于500倍率图片，当std_*=5%时，模型推理准确度为88.89%；在std_*=3%时，准确度为72.22%。

图11展示了CF730、CF745、CF760三大类，共12种气体扩散层的组分比例真实值和预测值，每大类碳纸碳纤维占比递增。在偏差为5%工艺水平下，只有CF740-8号碳纸在误差区间外，证明了基于PSPNet和MLP推理的气体扩散层组分比例方法的准确性。

4 结论

1）采用基于PSPNet的气体扩散层组分识别方法实现了对SEM图中孔、碳纤维、粘接剂、疏水剂的区域划分。识别像素准确度达81.24%，比传统的肉眼观测方法更真实地反映了气体扩散层组分分布，与XCT观测方法相比，节约了大量的时间和成本。

2）基于MLP的气体扩散层比例推理方法，建立了二维信息到三维信息的映射，实现了对气体扩散层中主要组成部分的占比预测，在设置的5%误差限内，准确率达88.89%，解决了传统方法无法量化组分的问题，为气体扩散层制备工艺优化以及数值重构提供了精准化指导。

3）以上2种方法，均在少量数据集下就达到了良好的训练结果，在气体扩散层以及其他复合材料的观测、工艺和数值计算研究中均具有较强的适用性。

参考文献

［1］ Lee S J， Lee C Y， Yang K T， et al. The surface morphology effects of a metallic bipolar plate on the interfacial contact resistance of a proton exchange membrane fuel cell[J]. International Journal of Green Energy， 2013， 10（7）： 739-753.

［2］ Owejan J P， Trabold T A， Mench M M. Oxygen transport resistance correlated to liquid water saturation in the gas diffusion layer of PEM fuel cells[J]. International Journal of Heat and Mass Transfer， 2014， 71： 585-592.

［3］ Gostick J T， Fowler M W， Ioannidis M A， et al. Capillary pressure and hydrophilic porosity in gas diffusion layers for polymer electrolyte fuel cells[J]. Journal of Power Sources， 2006， 156（2）： 375-387.

［4］ Gostick J T， Ioannidis M A， Fowler M W， et al. On the role of the microporous layer in PEMFC operation[J]. Electrochemistry Communications， 2009， 11（3）： 576-579.

［5］ T?tzke C， Gaiselmann G， Osenberg M， et al. Three-dimensional study of compressed gas diffusion layers using synchrotron X-ray imaging[J]. Journal of Power Sources， 2014， 253： 123-131.

［6］ Zenyuk I V， Parkinson D Y， Connolly L G， et al. Gas-diffusion-layer structural properties under compression via X-ray tomography[J]. Journal of Power Sources， 2016， 328： 364-376.

［7］ He P， Chen L， Mu Y T， et al. Lattice Boltzmann method simulation of ice melting process in the gas diffusion layer of fuel cell[J]. International Journal of Heat and Mass Transfer， 2020， 149： 119121.

［8］ Simaafrookhteh S， Taherian R， Shakeri M. Stochastic microstructure reconstruction of a binder/carbon fiber/expanded graphite carbon fiber paper for PEMFCs applications： mass transport and conductivity properties[J]. Journal of the Electrochemical Society， 2019， 166（7）： F3287-F3299.

［9］ Zhu L J， Yang W F， Xiao L S， et al. Stochastically modeled gas diffusion layers： effects of binder and polytetrafluoroethylene on effective gas diffusivity[J]. Journal of the Electrochemical Society， 2021， 168（1）： 014514.

［10］ Zhao H S， Shi J P， Qi X J， et al. Pyramid scene parsing network[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition， July 21-26， 2017， Honolulu， HI， USA. IEEE， 2017： 6230-6239.

［11］ Bishop C M. Neural networks for pattern recognition[M]. Oxford： Oxford University Press， 1995.

［12］ Long J， Shelhamer E， Darrell T. Fully convolutional networks for semantic segmentation[C]//2015 IEEE Conference on Computer Vision and Pattern Recognition， June 7-12， 2015， Boston， MA， USA. IEEE， 2015： 3431-3440.

［13］ He K M， Zhang X Y， Ren S Q， et al. Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition， June 27-30， 2016， Las Vegas， NV， USA. IEEE， 2016： 770-778.

［14］ Kingma D P， Ba J L. Adam： a method for stochastic optimization[C/OL].3rd International Conference on Learning Representations， ICLR 2015， May 7-9， 2015， San Diego， CA， USA. Ithaca， NY： arXiv， 2015（2017-01-30）[2021-12-30]. https：//arxiv.org/pdf/1412.6980v9.pdf.

（編辑罗敏）