一种改进AlexNet模型气溶胶颗粒分类方法

2022-10-15马元婧郭锐锋

小型微型计算机系统 2022年10期

关键词：气溶胶质谱颗粒物

马元婧，郭锐锋，祖彪

1(中国科学院沈阳计算技术研究所，沈阳 110168)

2(中国科学院大学，北京 100049)

3(辽宁省生态环境监测中心，沈阳 110161)

E-mail：mayjing@sict.ac.cn

1 引言

大气气溶胶颗粒的成分十分复杂、来源多种多样，在大气迁移过程中，气溶胶颗粒会经历各种物理化学过程，这些物理化学过程将导致气溶胶颗粒大小，结构以及化学组成不断变化[1].由于大气气溶胶颗粒的成分特殊复杂以及不断变化的物理性质和化学性质，使得对大气气溶胶在气候、环境和健康效应等方面的量化工作非常困难，不易处理[2].因此，要对大气气溶胶颗粒的化学成分、粒径尺寸、存在形态、离子浓度、光学厚度、与气象因子的关系、溯源反演等方面进行大量的监测和研究工作.明确大气气溶胶颗粒的成分是减少气溶胶污染时间和解决环境污染问题的关键[3].

基于单颗粒气溶胶飞行时间质谱仪原理[2]，对监测所得的大气气溶胶颗粒以单个颗粒为单位进行采集信息的存储与整理分析，其中包括颗粒的监测时间，颗粒的粒径尺寸以及离子峰高度、离子峰面积等.将监测数据按照离子质荷比与其对应的峰面积或者峰高强度进行相应表征向量的转换，得到向量形式的颗粒信息，从而形成刻画颗粒信息的质谱图.即每一个颗粒的质谱信息被转化成含有2n维的数据向量，其中列数n代表质荷比m/z，对应的数值代表离子的峰面积或峰强度.数据向量的前n维是正离子信息，后n维是负离子信息，一般情况下，n=240.所以每个颗粒的信息是通过一个480维的数据向量来表示的，形成的气溶胶颗粒质谱图如图1所示，这也是识别气溶胶颗粒类别的依据.一次常规的大气气溶胶监测活动，单颗粒气溶胶飞行时间质谱仪至少要持续运行十几个小时，每秒大约会产生20个颗粒的正负离子质谱信息[4].所以，每次监测活动产生的气溶胶颗粒的物理化信息过于庞大，这也为监测之后的分析工作带来了极大的难度.

图1 单个颗粒质谱信息图Fig.1 Information map of single particle mass spectrometry

现有的气溶胶颗粒分类方法为特征离子法和颗粒物聚类方法.特征离子法是根据特征离子的质荷比及相对峰面积将某类具有一种或多种特征组分离子的颗粒物提取出来，作为限定标准提取成分颗粒，并定义为某种类别.但是特征离子法所面临的难题是颗粒物成分的提取方法缺乏统一的标准，并且应用较少.另外，由于特征离子类间的差异较小，使得研究对比难度高，存在混合类别的现象[5].颗粒物聚类方法则是利用各类算法根据颗粒物质谱图中离子峰的种类及强度实现颗粒物的自动聚类，再根据化学成分特征人为将类别相同的颗粒合并[6].所以聚类算法面对的问题是需要选择合适的警戒因子和学习效率等参数，既保证同一类别间各颗粒的差别较小，也使类别总数控制在一定范围以内，否则聚类的准确率和效果会大幅度下降.聚类算法最大的问题在于聚类之后的工作量非常巨大[3，7]，聚类分析会产生几百个甚至是上千个颗粒分组，如表1所示，分别展示了4次气溶胶颗粒监测活动的统计数据，随着监测时间的增加，聚类分析得到组数也增多.对每组中所有的颗粒求平均质谱图，依靠人工经验根据每张平均质谱图的图像特征再进行手动命名的工作.即使是有经验的分析人员，对一张平均质谱图手动命名的操作至少也需要5s的时间.

表1 Art-2a聚类分析结果Table 1 Results of Art-2a cluster analysis

针对目前大气气溶胶颗粒成分分析的现状，根据已有颗粒分类结果，对大气颗粒质谱图进行类别的标记，形成用于训练分类模型的数据集.选择经典的深度学习分类模型AlexNet训练气溶胶颗粒分类模型，初步完成对气溶胶颗粒成分的自动分类，应用深度学习的思想为气溶胶颗粒分类提供一种新方法[8].在此基础之上，本文将之前的工作继续延伸下去，详细的分析了沈阳地区气溶胶颗粒的具体组成，并对每种类别颗粒质谱图的特征进行研究，结合AlexNet模型每个卷积层可视化输出结果，对卷积层特征输出进行评估，对AlexNet模型进行改进优化，提出适用于沈阳本地污染特征的一种改进AlexNet模型的气溶胶颗粒自动分类方法，将气溶胶颗粒分类的准确率从78%提高到了95%，每张颗粒质谱图确定类别所需要的时间由5s下降到了1s，使得气溶胶颗粒的采集检测过程完全的实现自动化，摆脱了气溶胶颗粒分类对人工提取和特征选择的依赖，提高了大气环境监测的效率，极大的节约了人员成本.

2 大气气溶胶颗粒物成分及特征

根据环境保护部组织编制的《大气颗粒物来源解析技术指南》，将历史监测工作中所得的气溶胶颗粒按照沈阳地区的污染物特征划分为7种类型[9]：有机碳颗粒(OC)、元素碳颗粒(EC)、元素-有机碳混合颗粒(ECOC)、高分子有机碳颗粒(HOC)、重金属颗粒(HM)、矿物质颗粒(DUST)和富钾颗粒(K).每种类别的平均质谱图特征信息如图2所示.

图2 7种类别颗粒质谱信息特征Fig.2 Mass spectrum information characteristics of seven kinds of particles

元素-有机碳混合颗粒(ECOC)：元素-有机碳混合颗粒正负谱图中同时含有元素碳与有机碳的特征峰离子，而且质荷比范围主要集中在12～70之间.在图中质荷比为12的整数倍处，既可以看到明显的元素碳峰，也可以在其周围看到有机碳峰.

3 改进AlexNet网络模型

3.1 AlexNet

AlexNet是卷积神经网络在ImageNet图像分类上的经典模型，该网络是一个8层的卷积神经网络，由5个卷积层和3个全连接层、一个softmax损失层组成.因为该网络的结构深、参数多，所以和传统的卷积神经网络相比，可以得到更多的特征表达能力[10].

以图1为例，对基于AlexNet模型的气溶胶颗粒分类模型的各个卷积层进行可视化特征图输出，结果如图3所示.由于AlexNet网络在第1层卷积层中卷积核尺寸为11×11，卷积步长为4，过大的卷积核尺寸和步长使得AlexNet网络第1层与第2层的特征输出产生了很多混叠的情况.第3层与第4层的特征输出显示了较多相似的信息，主要原因可能与模型训练的数据集包含的信息量有关.相对于ImageNet数据集来说，气溶胶颗粒质谱图所包含的信息量较少，图像特征不是很复杂，所以应用较深层次的卷积神经网络来提取的图像信息，卷积运算过程中出现了冗余的现象.因此针对气溶胶质谱图的特征对AlexNet模型进行相应的改进优化.

图3 AlexNet模型特征图Fig.3 Feature map of AlexNet

3.2 改进AlexNet大气气溶胶颗粒物分类模型

经过大量的实验对比总结，对AlexNet网络进行如下更改和优化，以达到更好的分类效果.

本次报告显示,手术切除和注射碘酊治疗口腔粘液腺囊肿治愈率均达到95%以上,临床疗效确切,两种治疗方法没有显著性差异。10例复发病例(手术切除治疗4例,注射碘酊治疗6例),其原因可能是囊壁处理不彻底,部分囊壁残留导致囊肿复发。

1)重置图片分辨率.AlexNet网络对监测图像统一下采样至256×256的矩形图像，因为ImageNet数据集中图像的分辨率不固定.在256×256的矩形图像中，随机的截取227×227的矩形图像，作为卷积神经网络的输入数据[10].在测试过程中，测试网络以图像的4个角点和一个中心点为基准提取了227×227的矩形图像，再将图像进行水平翻转操作，共计10个矩形图像参与测试环节，对10个矩形图像通过softmax层进行预测结果取平均值.

通过观察分析颗粒质谱图(分辨率为256×256)的图像分布特征，发现在测试过程中，取图像右上和右下角两点截取边长为227的矩形图像时，会造成图像信息的丢失现象，从而影响了分类运算的结果，如图4所示.在元素碳C+(m/z=12)处的质谱峰信息，其位置处于227×227的矩形图像之外.所以，为了避免在测试过程中，造成图像质谱信息的丢失，采用统一调整图像的下采样分辨率.

图4 右上角与右下角矩形图像信息损失情况Fig.4 Information loss of rectangular image in upper right corner and lower right corner

3)精简网络结构.对AlexNet分类模型的改进过程中，采用小尺寸卷积核和短的卷积步长，这使得分类模型的卷积运算大量增加.考虑对AlexNet分类模型的网络层数进行精简，将卷积层数个数以及全连接层个数减小[12]，以防止过拟合的情况出现.同时，设置最后输出节点的个数为沈阳本地气溶胶颗粒污染物种类的个数，使得分类的结果更加精确的应用于大气气溶胶颗粒自动分类模型[13].

改进的AlexNet网络结构如图5所示，具体的训练参数设置如下：

图5 改进AlexNet网络模型结构Fig.5 Structure of improved AlexNet network model

设置236×236为图像下采样统一分辨率尺寸，改进AlexNet网络图像输入大小为227×227，第1层卷积层含有96个卷积核，卷积核尺寸为5×5，卷积步长为2，卷积运算后的数据大小为114×114×96，经过ReLU(Rectified Linear Unit)激活函数后，进入LRN局部响应归一化层(Local Response Normalization).最后经过最大池化层(Maxpool Layer)，卷积核尺寸2×2，卷积步长2，得到输入下一层的数据大小为57×57×96.

第2层与第3层卷积层只做了卷积运算和激活函数运算.第2层卷积层含有256个卷积核，卷积核尺寸5×5，卷积步长2，经过ReLU激活函数后，数据大小为29×29×256.第3层卷积层含有384个卷积核，卷积核尺寸3×3，卷积步长2，经过ReLU激活函数后，数据大小为15×15×384.

第4层卷积层和第1层经历了相同的运算过程，第4层卷积层含有256个卷积核，卷积核尺寸3×3，卷积步长1，卷积运算后的数据大小为15×15×256，经过ReLU激活函数后，进入LRN层. 最后经过最大池化层，卷积核大小为3×3，步长为2，得到下一层的数据大小为7×7×256.

第5层和第6层均为全连接层.第5层包含卷积核个数为4096，第6层数据输出节点为7，为大气颗粒物所划分的7个种类.

3.3 改进AlexNet卷积层特征

以单个颗粒质谱图为例(见图1)，对改进AlexNet模型的卷积特征图输出分析，如图6所示.通过与AlexNet模型的特征输出图3做对比，可以看出改进AlexNet模型的每层卷积特征输出信息没有出现过多信息堆叠的情况.第1层卷积操作学习到了目标的角点、边缘等基础信息，第2层卷积操作学习到了目标的纹理特征，第3层卷积操作学习到了特定类别间显著的差异性，第4层卷积操作学习目标更显著的特征并且获取到了位置变化的信息.

图6 改进AlexNet模型特征图Fig.6 Feature map of improved AlexNet

4 实验

4.1 实验环境

实验采用Ubuntu16.04操作系统下的Caffe开源框架及CUDA-GPU加速方案，显卡采用NVIDIA GeForce 1050Ti(4G显存)进行GPU加速，其他主要硬件为Inter(R) Core(TM) i5-7300HQ CPU@2.50GHz 四核处理器、8G内存、512G固态硬盘等.

4.2 实验数据

根据沈阳地区气溶胶颗粒组成的7种成分对数据集进行划分，对于每种分类选取1500张质谱图，共计1万余张.将整个数据集按照每个类别7∶2∶1的比例分别划分为训练集、测试集和验证集3个部分.经过若干次训练测试，将模型训练参数调整如下：设置训练模型的基础学习率为0.002，停止训练的最大迭代次数为5000次，权重衰减系数为0.0005，采用Step步进为学习策略和随机梯度下降SGD为神经网络参数化算法；神经网络进行测试时，每训练30次执行1次测试，按照每批次50张图像，分批次对图像进行处理.

4.3 实验结果

分别应用4种深度学习的分类算法AlexNet、AlexNet(增强)[12]、ZFNet[14]与本文提出的改进AlexNet模型对相同的数据集进行训练与测试，图7分别为4种深度学习分类算法在准确度(Accuracy)与损失函数(Loss)方面的表现情况，其中x轴表示测试的迭代次数.AlexNet(增强)为文献[12]中提出的增强AlexNet模型，ZFNet是对AlexNet模型优化改进的一种变形，也是继AlexNet之后出现的又一个经典的深度学习分类模型.

图7 4种分类模型预测准确度与损失函数Fig.7 Prediction accuracy and loss function of four classification models

从图7给出的测试结果可以看出，预测准确度仅存在于模型建立的测试阶段，而损失函数在模型训练和测试阶段都存在.在预测准确度方面，4个模型的表现都是可以接受的，测试开始阶段测试精度都迅速的达到了90%以上，在迭代次数达到1000次以后，除了ZFNet模型，其他的模型预测准确率都维持在95%上下，处于一个比较稳定的趋势.在损失函数方面，4个网络模型的损失函数在训练阶段相对平稳，总体趋势随着训练周期而减小，虽然AlexNet与AlexNet(增强)模型在训练达到3000次前后有较为明显的波动，但是不影响最终收敛的结果；在测试阶段，AlexNet和AlexNet(增强)模型表现不够理想，损失测试曲线随着训练周期的增加，震荡幅度反而较大，而ZFNet和本文提出的改进AlexNet模型则始终体现出了相对较稳定的趋势.通过分析预测准确度与损失函数曲线，可以看出改进AlexNet模型分类效果在总体评价上优于其他3个深度学习分类模型.

基于深度分类算法的气溶胶颗粒物成分分类模型训练完成后，应用验证集中的7类气溶胶颗粒物质谱图，分别对4个网络模型进行正确性验证，验证结果如表2所示.AlexNet模型和ZFNet模型对类别EC、HOC、OC和K这4个类别的分类准确率较高，但是在HM、ECOC和DUST这3个类别的分类情况很不理想.AlexNet(增强)在HM、EC、HOC、OC和ECOC这5种类别的分类准确率均在80%以上，属于可接受的范围，但是在DUST和K这两个类别的分类准确率上也不够理想.而改进AlexNet 模型在沈阳地区7种气溶胶颗粒分类的准确率均在91%以上，分类结果明显优于其他模型.

表2 深度学习分类模型准确率对比

通过对改进AlexNet模型分类错误的样本进行再分析，错误原因主要集中在以下3点：1)OC类别与ECOC类别特征峰形状类似，不易区分；2)DUST类别与EC类别在谱图上特征明显的部分有相似的趋势；3)部分质谱图中同时含有两种颗粒类别的特征信息，但是特征又都不明显，针对这样的质谱图应在训练数据集的建立过程中慎重考虑，否则会对分类结果造成不同的影响.

5 结论

本文通过分析大气气溶胶颗粒各个类别质谱图的特征，对AlexNet网络模型进行优化，进一步提升气溶胶颗粒成分的自动识别能力.实验结果表明，基于改进AlexNet模型的大气气溶胶颗粒物成分分析方法分类的准确率达到了95%，对于一些人为不易分辨的类别，深度学习的方法可以通过应用卷积神经网络运算提取更丰富的图像特征来完成.从实验结果可以看出，应用深度学习的颗粒物成分分类方法弥补了现有分类方法的不足.然而当监测区域发生变化时，可能会出现新的颗粒类别，面对颗粒类别发生变化的情况时，如何识别出新的类别，并更新分类模型是今后研究的重点.