仿生模式识别在影像学肺炎判别算法的改进

2020-05-16邹倩颖吴宝永王小芳

实验室研究与探索 2020年2期

邹倩颖，吴宝永，王小芳，2

（1.电子科技大学成都学院，云计算科学与技术系，成都611731；2.西华师范大学计算机学院，四川南充637002）

0 引言

自20世纪起，人工智能在许多行业实现了创新，不仅提高工作效率，还有准确率。就医疗领域而言，人工智能在临床诊断问题上实现了应用，但人工智能应用到医学影像学领域的起步较迟，其原因在于用于医学影像诊断的人工智能须依靠人主观建立数学模型［1］。文献［2］中提出了一种基于支持向量机与贝叶斯的算法，利用22个定量特征对肺炎进行判断，但是其在不同机器产生的图像效果不同，准确率不太稳定。文献［3］中提出了一种基于小波的3D-CT图像特征提取，但其对数据集要求过高。斯坦福大学在2017年设计了一个名为CheXNet，用于判断胸腔部分的14种疾病，包括肺炎，虽然其识别率高95%，但其并未对肺炎的种类进行细分［4］。

本文采用卷积神经网络（CNN）和仿生模式识别相结合的方法，首先使用卷积神经网络作为图像特征的提取器，使得机器无需人工进行特征提取，同时利用基于仿生模式识别的分类网络作为分类器，增加了分类的准确率。实验证明，本文所设计的方法平均准确率达90%，所设计方法不仅仅只是局限于肺炎判别，亦可迁移到其他图像识别领域。

1 关键技术

1.1 卷积神经网络

CNN［5］是一种深度神经网络，常用于对视觉图像进行分析。CNN是由生物过程所引导［6］，其神经元之间的连接模式类似于动物的视觉皮层中的组织。单个皮层神经元在被称为感受野的视野的受限区域中，对刺激作出反应。不同神经元的感受野部分互相叠加，使得它们覆盖整个视野。

CNN是由卷积层、池化层和全连接层交叉堆叠而成的前馈神经网络，其使用反向传播算法进行训练。在结构上，CNN有3个特性：局部连接、权重共享和子采样。得益于此，CNN有一定程度上的平移、缩放和旋转不变性。

CNN的典型架构通常使用多项逻辑回归进行分类［7-8］，然而，这种方式性能不理想。研究表明［9］，如果在CNN后面添加了一个表现良好的分类器（如支持向量机（SVM）），分类精度将在一定程度上得到提高。与单独使用CNN或SVM相比，由CNN和SVM结合的模型展现出了更高的准确率。

1.2 仿生模式识别

仿生模式识别（BPR）［10］更接近人类的认知功能，而BPR与传统的模式识别相比，显著的不同在于以“最优划分”为主要原则。BPR中，“认知”一类事物对于分析和“认知”由同一类的所有样本组成的无限点集的形状是必不可少的。文献［11］中也指出“拓扑空间的概念非常普遍，关于拓扑空间拓扑的科学是关于连续性的最一般的数学分支”BPR，只是分析点集拓扑中流形的方法，因此，BPR也称为拓扑模式识别（TPR）。自其被提出之后，已经用于人脸识别［12］等领域。

图1所示为二维平面中，BPR与传统模式识别方法所形成的样本子空间的对照示意图。图中圆形代表要识别的样本；正方形与三角形代表其他两类样本；折线为传统的BP网络模式识别划分的方式；大圆代表RBF网络模式识别划分的方式；椭圆所连成图形代表了仿生模式识别的划分。

图1 仿生模式识别与传统模式识别方法对照示意图

2 基于改进BPR的肺炎判别

2.1 算法思想及总体框架

本文设计的改进BPR的肺炎判别算法主要有两部分：① 利用改进的CNN模型对肺炎图像进行特征提取；② 添加基于BPR的分类网络进行训练，进而得到分类网络，具体过程如图2所示。

图2 改进的仿生模式识别过程图

具体步骤如下：

（1）数据预处理。将肺炎图像归一化为同样大小的实验图像，在本文实验中设置为（256×256）px。

（2）特征向量提取。肺炎图像按类别分好，分别存储；随后按照类别分别输入本文所设计的改进的CNN。

（3）分类网络训练。从CNN中特征向量作为高维空间中的点，按类别分别输入本文设计的基于BPR的分类网络进行训练。

2.2 基于CNN的图像特征提取

2.2.1 卷积层

卷积层中的X光片可与一个卷积核进行卷积，其结果经过激活函数后输出形成卷积层的特征图。卷积层形式为

式中：l代表层数；kij核函数表示权重参数；Mj代表输入特征图的集合；i表示第i层；j表示第j个输入的X光片；每个输出图有一个偏置值b；f（·）为激活函数。

2.2.2 池化层

池化层的输入源于上一个卷积层中X光片的卷积，主要起增强鲁棒性的作用，同时减少了参数的数量，也一定程度防止过拟合现象的发生。特征图经过池化层之后个数不会发生改变，但是特征图会变小。一般地，池化层公式表示为

式中：down（·）表示下采样函数（本文所构建的CNN中使用max（）函数，即最大池化）是下采样对应的“权重”。

2.2.3 全连接层

全连接层是用于连接前后层神经元的网络层，通常而言，全连接层位于2个一维的网络层之间。假设x∈Rm表示输入层向量，y∈R表示输出层向量，则在全连接层就有映射矩阵W∈Rm×n与偏置向量b∈Rn。其表达式为

2.2.4 网络结构

本文对LeNet-5模型进行改进，得出了一个特征提取的网络结构进行训练。训练数据时，所使用的训练数据按批随机选择，分批输入网络中进行训练。本文所设计的网络结构如图3所示。

图3 网络示意图

本文将各类样本中的每1张图像输入到网络中进行训练与特征提取，最终形成网络模型，网络的具体参数如表1所示。其中：R代表ReLU［13］（线性整流函数）函数；M代表最大池化操作；D代表Dropout。

表1 神经网络参数

2.3 基于BPR的分类网络

2.3.1 同源连续性

BPR旨在对特征空间中一类样本分布进行最佳覆盖。对于各类X光图像，BPR都将对其进行最佳覆盖。“高维空间复杂几何形体覆盖识别方法”为样本点的分布提供了先验知识，因此可以将分析特征空间训练样本点间的关系作为基点，研究特征空间中某类样本的分布状况，进而对其进行合理的覆盖，从而“认识”某类样本。多维空间仿生信息学认为：可用的信息都包含在训练集，在多维空间Rn中，设A类所有样本点形成的集合为A，任取两个样本X，Y∈A且X≠Y，对于任意的ε＞0，则一定存在集合B满足，

式中：ρ（XM，XM＋1）表示样本XM；XM＋1间的欧式距离。

但通常样本分布是不规则的，要形成的覆盖形状也是非常复杂的。因此用来形成覆盖的方法必须能够在特征空间中形成一个高维空间的连续复杂的几何形体来覆盖样本［12］。在本文构造的神经网络中，样本已经由X光片经由前文构建的卷积神经网络转换为了特征向量。

2.3.2 多权值向量神经元

对于训练集中的X光片所生成特征向量可以利用多权值向量神经元进行构造。多权值向量神经元在特定的计算函数φ下可以形成一个封闭的曲面，因此可以使用多权值向量神经元进行BPR的神经网络构造。

多权值向量神经元的通用表达式为

式中：w1，w2，…，wm为m 个权向量；X 为输入向量；φ为计算函数；f为非线性转移函数；θ为多权值神经元激活阈值。

设特征空间是n维实数空间Rn，即X∈Rn，向量函数方程：

此时，可视为由w1，w2，…，wm在特征空间Rn中构成的某种轨迹，该轨迹位于Rn中n-1维空间，若该轨迹为一个封闭的曲面，则就在Rn中形成了一个有限的覆盖区域。若改变神经元权值，则会得到具有不同形状的超曲面。故对于某类A，存在一个覆盖区域，该区域为该类所有样本共同覆盖。

在影像学肺炎判别中，可以采用超香肠神经元［12］，其表达式：

式中：θ（w1，w2）表示由n 维空间中两点w1、w2确定的有限一维线段；φ（w1，w2，X）表示在n维空间中X 到θ（w1，w2）的欧式距离。

判别函数

2.3.3 网络的构建

网络的构建具体步骤如下：

（1）设某类肺X光图片的所有构网样本点集合为A ＝｛a1，a2，…，aN｝，N 为该类样本点总数。

（2）建立本文第2节设计的基于卷积神经网络的图像特征提取网络。

（3）将集合A中所有样本输入步骤（2）所建立的卷积神经网络中，得到N个该类X光图片的1 024维特征向量，也就是得到了该类所有样本在1 024维空间中的分布情况。计算所有点两两之间的欧式距离，找出欧式距离最小的两个点，记为BA1、BA2。这两个点构成的第1个一维线段记作θA1。用一个超香肠神经元对这个线段进行覆盖，其覆盖范围，

式中：ρXθA1表示点X 到空间θA1的距离；PA1为所构造的几何形体。

（4）随后针对已经构造好的几何形体PA1，判断剩余各点是否被其覆盖。若在PA1覆盖范围内，则排除；而对于在PA1范围外的点，按步骤（3），找出离BA2最近的点，记作BA3，BA2与BA3此时便构成了第2个一维线段，记作θA2，同样地，也用一个超香肠神经元来覆盖此线段，其覆盖范围：

式中：ρXθA2表示点X 到空间θA2的距离；PA2为所构造的几何形体。

不断重复上述步骤，直至处理完所有样本点，此时共产生了m个超香肠神经元，则该类A的覆盖范围便是全部个神经元的覆盖范围

（5）对训练集中各类样本做以上操作，即可得到各类所对应的覆盖范围。

（1）因地制宜，逐渐形成“家和计划”本土服务特色模式。如沙坪坝区打造“家和故事”；黔江区探索“离婚分类分流服务”模式；长寿区针对服刑人员开展的困境家庭案例；綦江区以家庭理财教育助力脱贫致富；秀山县挖掘传统民族荤素作用等。

2.3.4 样本识别

对于某张X光片的样本识别过程如下：

对待识别样本点X到i类高维空间覆盖区中第j个神经元覆盖区域的距离进行计算，

则样本到第i类的覆盖区域的距离，

式中：m表示第i类的超香肠神经元总数；ρij表示待识别样本点X到第i类第j个超香肠神经元的欧式距离。当此样本到第i类的覆盖区域的距离≤0时，则表明此样本在此覆盖区域中；反之，则不在。若不落在任何一类的覆盖区域内，则表明此样本不在任何一类中。

3 实验结果与分析

本文实验所用数据集共有3种类型（正常、病毒型肺炎、细菌型肺炎），由原数据集重新划分，本文分别将其记为A组、B组和C组，各组训练集、验证集与测试集的比例均为8∶1∶1。

3.1 实验环境

软件环境：Debian 9.4。硬件环境：Intel（R）Xeon（R）CPU E5-2650 v3 ＠ 2.30 GHz，Tesla K80 NVIDIA Tesla K80，16 GB 内存，1TB 硬盘。

3.2 实验验证与对比分析

3.2.1 A 组对比实验

使用A组进行实验，结果如表2所示。

表2 A组改进仿生模式识别与SVM实验结果对比表

本次实验中，改进的BPR对于正常类与病毒型的识别准确率（下文简称识别率）相较于SVM算法低了1%，细菌型高了22%，整体均值高了10%。可见SVM

虽然在正常与病毒型的X光图像上识别率高于本文所设计的方法，但是明显在对于细菌性识别是其短板，但本文所提方案各类X光图像的识别率较为高，故就实用性而言，本文所提方案略胜一筹。

3.2.2 B 组对比实验

使用B组对比实验的结果如表3所示。

表3 B组改进仿生模式识别与SVM实验结果对比

在本组实验中，即数据量稍有增大时，改进的仿生模式识别对于正常类X光图像相较于支持向量机高了1%，病毒型基本无差，细菌型高了16%，整体均值高了6%。相较于A组实验，两种算法的对于各类X光片的识别效率均有浮动，其中支持向量机对于细菌型的精度上升尤为明显。两种算法其他类别精度下降的原因在于原始图像存在未去除噪声。

3.2.3 C 组对比实验

使用C组对比实验的结果如表4所示。

表4 C组改进仿生模式识别与SVM实验结果对比

本组实验，即训练数据较多时，改进的仿生模式识别对于正常类的识别率较支持向量机高了19%，病毒型高了5%，细菌型高了4%，平均高了10%。可见即使在数据量较大时，改进的仿生模式识别的平均表现水平依旧高于支持向量机，噪声对其影像也小于支持向量机。

总的说来，上述3组实验（A、B、C），使用了3组数量呈梯度上升的数据集，实验结果揭示了改进的仿生模式识别和支持向量机在数据从少到多的情况下，其对各类X光图像的识别情况。A组～B组对比实验改进的仿生模式识别的平均识别率，基本不变保持在92%，与此同时支持向量机的平均识别率由82%上升到了86%，上升了4%；B组～C组对比实验，改进的仿生模式识别的平均识别率随着样本训练样本数量的增加下降了4%，达到88%，支持向量机的平均识别率下降了8%达到78%。可见噪声对本文所提出构建的改进的仿生模式识别的影响小于其对传统模式识别的影像。在本文所采用的数据集上，对3种类别的影像判别优于传统的模式识别，在一定情况下改善了肺炎判别的性能。

4 结语

本文为了解决肺炎判别而提出了结合卷积神经网络和仿生模式识别的网络模型，通过卷积神经网络自动提取特征向量，并将其转化为高位空间中的点，利用仿生模式识别的分类网络进行分类，实验所得结果平均准确率达90%，在一定程度上解决了肺炎判别问题。本文所设计的技术并不局限于肺炎的判别，亦可用于疾病的检测和分类，例如肺结核、肺肿瘤以及骨骼肿瘤等。但是本文所提出的方法，在样本数量较大时算法复杂度增加，训练时间增长较为严重.针对这些问题，作者将进行更深入的研究。