基于卷积神经网络与特征选择的医疗图像误差预测算法

2021-05-06李晓峰刘刚卫晋王妍玮

湖南大学学报·自然科学版 2021年4期

李晓峰　刘刚　卫晋　王妍玮

摘要：針对传统医疗图像误差预测算法无法很好的选择图像特征，存在图像误差预测值与实际值拟合度低、预测耗时长等问题，提出基于卷积神经网络与特征选择的医疗图像误差预测算法. 首先，选取5种集成规则构建自适应多分类器，对医疗图像区域进行分类;其次，训练卷积神经网络，利用训练完成的神经网络提取不同类别医疗图像区域特征，以此为基础计算区域距离，寻找出相似度最小的区域，完成图像可疑区域定位;再次，融合多评价标准生成特征子集，从中搜索得到最优特征子集，完成可疑区域图像特征选择;最后，以选择得到的特征区域像素点作为训练样本，建立预测样本与训练样本之间的多元线性回归矩阵，实现误差预测. 实验结果表明，所提算法的集成规则适应度较高，分类性能好，区域距离计算准确率高达95%左右，特征选择的AUC值（Area Under Curve）高，且预测结果拟合度和预测耗时均优于传统算法.

关键词：卷积神经网络;集成规则;多评价标准;特征选择;多元线性回归矩阵;预测

中图分类号：TP391 文献标志码：A

Error Prediction Algorithm of Medical Image Based

on Convolution Neural Network and Feature Selection

LI Xiaofeng1，LIU Gang2，WEI Jin1，WANG Yanwei3

（1. School of Computer Science and Technology，Beijing Institute of Technology，Beijing 100081，China;

2. College of Computer Science and Technology，Harbin Engineering University，Harbin 150001，China;

3. Department of Mechanical Engineering，Purdue University，West lafayette，Indianan IN47906，US）

Abstract：In order to address the problem that traditional medical image error prediction algorithm can not select image features well，there are some problems such as low fitting degree of image error prediction value，low actual value and long prediction time，a medical image error prediction algorithm based on convolution neural network and feature selection was proposed. Firstly，five integrated rules were selected to construct adaptive multi-classifiers to classify medical image regions. Secondly，the training convolution neural network was used to extract different types of medical image area features by using the training neural network. Then，multiple evaluation criteria were combined to generate special features. The optimal feature subset was searched to complete the feature selection of suspicious region image. Finally，the multiple linear regression matrix between the prediction sample and the training sample was established to realize the error prediction by taking the pixel points of the feature region as the training sample. The experimental results show that the proposed algorithm has high fitness of integration rules and good classification performance，the accuracy of region distance calculation is about 95%，the AUC value of feature selection is high，and the fitting degree and prediction time of the prediction results are better than those of the traditional algorithm.

Key words：convolution neural network;integration rules;multiple evaluation criteria;feature selection;multiple linear regression matrix;prediction

医疗图像是记录患者诊断情况的重要依据，获取高质量的医疗图像对于医疗诊断具有重要的意义[1-2]. 目前医疗研究领域中，人们能够依据各类仪器、设备获取海量医疗图像信息，利用当前医学影像设备获取医疗图像时，比如CT图像，因为通常平面获取的图像分辨率大于空间层面的图像分辨率，所以CT图像在X轴和Y轴方向上的分辨率较大，Z轴方向的分辨率较小，由此则容易产生误差，若不对图像进行有效筛选而直接作为诊断依据，将会严重影响疾病的诊断情况，对于医疗领域的发展也会产生一定的阻碍作用[3-4]. 对于海量的医疗图像，如果能够准确地预测医疗图像误差，将误差预测技术实时应用于医疗诊断中，将会大大促进医疗领域的进步，帮助更多的患者精准诊疗. 目前对于医疗图像的误差处理存在一定的问题，缺乏高效的误差预测手段，因此寻找一种有效的医学图像误差预测方法具有重要的理论和实际价值[5-6].

随着近年来计算机技术的飞速发展，将深度学习应用于医疗图像处理中，已成为广受专家们关注的话题，侯梦薇等人[7]将知识图谱与深度学习相结合，在优质医疗资源稀缺但医疗需求增加的背景下，全面分析医疗知识图谱，对其中的关键技术进行研究综述，全面剖析了智能医疗现状与研究方向;赵越等人[8]将卷积神经网络应用到宫颈细胞分类中，首先初始化处理卷积神经网络，分批次输入宫颈细胞图像，然后采用Softmax函数建立损失函数，最后改进神经网络结构，通过参数优化选择损失函数的最小值，实现图像分类;刘凯等人[9]提出基于卷积神经网络的中文医疗弱监督关系抽取方法，该方法给予训练语料一定的关系标签，将弱关系语料转换为向量特征矩阵，将其输入卷积神经网络处理;Wang等人[10]通过细化图像制作适用于特定图像的卷积神经网络框架，构建加权损失函数，建立交互式图像分割模型;Zhou等人[11]提出了利用眼睛跟踪数据进行图像分类的方法，过程中主要利用图像特征选择技术实现分类;Nizami等人[12]在对图像质量分析中，同样也应用到了图像特征选择技术，获取了较好的成效.

针对卷积神经网络与医疗图像误差预测问题，国内众多学者早已做出了相关研究. 文献[13]提取了多个医疗影像数据特征集，基于支持向量机建立肿瘤预测模型，成为一种有效的计算机辅助诊疗医学工具，但该方法的数据分类效果差;文献[14]基于拓展设计、缓存优化等技术，提出一种面向边缘计算的卷积神经网络构建方法，并利用网络层间可复用的加速器核心完成对网络硬件的优化，该方法构建的神经网络可广泛应用于医疗等各领域，但该方法对数据区域距离计算的准确率不高;文献[15]简单处理了原始数据，将其输入卷积神经网络，充分利用了卷积神经网络的局部特征分析优势，获取数据特征项，但预测耗时长，准确率不高;文獻[16]以卷积神经网络特征提取器为研究对象，针对图像分类问题，将神经网络模型压缩问题转换为特征选取问题，实现对图像的深度分析，该方法的整体性能不佳，特征选择效果差，有待进一步提高.

国外学者也针对相关问题提出了许多观点，文献[17]针对图像处理问题，提出一种深度卷积神经网络方法，在训练阶段，利用梯度剪裁方法加快网络收敛速度，获取了较好的图像处理效果，但该方法对数据处理效果不佳，导致预测耗时长、准确率低;文献[18]将卷积神经网络应用于心脏CT血管造影中，该方法使用监督学习直接识别和量化图像，降低了图像处理复杂度，但利用该方法得到的预测值与实际值偏差较大，且计算时间长;文献[19]在医疗影像分析中，提出深度学习卷积神经网络和水平集相结合方法，利用16万个感兴趣区域和图像，训练深度学习卷积神经网络，以此来区分膀胱内外，取得了一定的成果，然而该方法的数据分类效果差，获取结果与实际值之间仍旧存在较大的偏差.

为有效解决上述方法存在的问题，本文基于卷积神经网络与特征选择，来预测医疗图像误差. 特征选择方法中，现有的两种方法为过滤型方法和封装型方法，其中过滤型方法基于数据的固有属性实现数据特征分类和评价，多数情况下获取的选择结果具有相似性. 封装型方法则是基于分类模型实现，从分类模型中选择出最优的特征子集完成特征选择，这种方法对数据集大小的敏感性较强，在不同数据集情况下表现的差异较大[20-21]. 上述两种特征选择方法都是基于单一标准进行特征选择，结果具有一定的偏差，为此，本文基于多评价标准融合构建特征选择方法，将不同评价标准下的特征选择结果集成，获取更为全面的特征选择结果. 在上述现有研究内容的基础上，本文将卷积神经网络和特征选择相结合，预测医疗图像误差，以期获取更高质量的医疗图像. 本文的主要研究工作：1）对医疗图像区域分类，为图像误差的准确预测提供了基础;2）基于多评价标准进行医疗图像特征选择，有效地改善了卷积神经网络特征提取结果不明确的问题;3）利用多元线性回归方法完成图像误差预测;4）设立集成规则适应度、区域距离计算准确率、特征选择的AUC值、预测值与实际值拟合度、不同数据样本下预测耗时等多个指标，通过实验验证所提算法性能，增强了实验结果的可靠性.

1 医疗图像区域自适应多分类器构建

在进行医疗图像误差预测前，本文首先对医疗图像区域分类，将图像细化为不同的区域，寻找出可疑区域，完成误差预测.

选取了5个经典的基分类器，分别为K最近邻分类器、数据引力分类器、径向基神经网络分类器、决策树分类器和支持向量机分类器[22]. 对每一个分类器训练后，都可能产生不一样的分类结果，因此，为提高对医疗图像区域的分类精度，本文构建了自适应多分类器，将不同分类器获取的分类结果综合起来，得出一个最终的分类结果. 多分类器训练理论推导过程如下：

初始化多分类器，从原始图像中获取图像区域，对该图像区域进行预处理. 通常医疗图像中容易存在异常数据点和孤立数据点，降低图像质量，本文采用距离法检测图像区域的异常数据点和孤立数据点，若存在，则保持数据库连接并关闭图像文件，剔除异常和孤立数据点，若不存在，则不关闭输出文件，继续下一步，直至获取多个分类器输出结果.

然后寻找一种有效的集成规则，依据集成规则合并分类结果. 目前存在的多种集成规则仅能表现多个分类器输出结果，并未将单个分类器的分类性能考虑进去，因此本文对每种分类器给予一定的分类权重，设计一种更为全面的集成规则. 假设医疗图像数据集为Di={d1，d2，d3，…，di}，包含m个类别，则类标签可表示为C={c1，c2，c3，…，cm}. 假设本文选取的基分类器中，第i个分类器的权重为Careai，其分类结果为Cj的概率为Pij，依据集成规则处理后，将第i个分类器最终獲取的概率结果分配给Cj. 本文使用的5种集成规则可表示为：

式中：e表示自然对数底数，Z表示图像分类属性特征值， Gain（Z）表示属性特征值Z的增益数值.

依据上述5种集成规则对不同分类器结果进行处理，则可获取综合分类结果，完成医疗图像区域自适应多分类器构建，为医疗图像区域选择最优集成方法，从而更好的实现分类.

上述多分类器训练流程如图1所示.

2 医疗图像误差预测算法

2.1 基于卷积神经网络的图像可疑区域定位

2.1.1 卷积神经网络训练

卷积神经网络是一种多层前馈神经网络，通过局部感受与采样对图像进行分类识别，因此卷积神经网络模型构建中，直接将原始图像数据输入，无需考虑图像的形状、类型等问题，无需对图像进行预处理[23-24]. 卷积神经网络主要由输入层、卷积层、激励层、池化层和全连接层、输出层等构成[25]. 其中，卷积层由多个特征图构成，经过上层特征与卷积核处理，可获取下层特征;激励层主要通过对数据的非线性处理，完成图像和数据空间的变换;池化层主要负责对图像进行压缩处理，避免卷积神经网络运行中产生过量的数据，从而导致数据过拟合;全连接层能够进行图像或者数据的模式分类[26-27].

本文先对神经网络进行训练，利用训练后的网络模型进行医疗图像特征提取. 卷积神经网络训练是一个反向传播过程，利用误差函数进行反向传播，对卷积神经网络参数进行调整，直至达到最大迭代次数为止. 误差函数计算公式为：

式中：n表示训练样本数量，k表示输出数量，wnk表示第n个训练样本相对应的第k个输出标签，snk表示第 n个训练样本相对应的第k个网络计算值.

利用误差函数完成网络反向传播，自适应调整网络参数，不断迭代这一过程，直至收敛为止，完成卷积神经网络训练（注：卷积神经网络不同层之间的大小存在差异，因此进行误差传递时，需要进行上采样，使前后两层尺寸一致）.

2.1.2 医疗图像区域相似度计算

本节利用训练后的卷积神经网络定位医疗图像可疑区域，为减少卷积神经网络的计算量，首先进行医疗图像特征提取分析，再进行医疗图像区域距离计算，寻找出相似度最小的区域，即可完成医疗图像可疑区域定位.

扫描尺度为A×B的目标区域医疗图像，选取其中大小为e×e的图像块U为研究对象，建立图像块U与实际医疗图像的数据集，形成映射关系，利用映射函数f（U）对图像块进行提取，获取目标研究对象在窗口范围内的M个特征[28-29]. 映射过程表达式为：

f（U）→MRN （8）

式中：RN表示实数向量.

映射得到的医疗图像维数为：

W = χ（e + 1） × （e + 1）（9）

式中： χ表示维度向量.

映射得到的医疗图像数据向量计算公式为：

y = Wf（U） × Vi（U）（10）

式中：Vi（U）表示第i个图像特征.

以此类推，对医疗图像的所有数据集进行卷积运算，可获取维度为MW的批量卷积，完成图像特征提取.

医疗图像特征提取结束后，在卷积神经网络的全连接层进行医疗图像区域相似度计算，根据医疗图像区域分类结果，随机选定某一固定区域作为参考区域，对其他区域进行编号，分别计算不同区域与参考区域之间的距离，参考区域定义为F，对象区域定义为Fi，区域距离可表示为：

式中：？准表示权重向量.

将第2节中分类得到的每个区域依次作为对象区域，按照公式（11）计算每个区域的区域距离，可得到多个结果，从中选取出距离最大的区域作为初始区域，计算初始区域与其邻近区域之间的距离，如果距离大于设定的阈值（本文阈值取值为3.0），则合并这些区域生成新的区域，不断重复这一过程，最终可定位得到相似度最小的区域，将其看作可疑区域.

2.2 基于多评价标准融合的可疑区域特征选择

利用卷积神经网络提取得到的医疗图像特征，一般会具有一定的冗余性等问题[30-31]，即特征选择不明确，易导致可疑区域定位结果产生误差，为此，本文创新性地提出一种特征选择方法，将其与卷积神经网络结合，弥补卷积神经网络存在的不足. 本文基于多评价标准融合方法进行可疑区域特征选择，具体过程如下：

首先选取卡方检验标准[32]、线性回归权重标准[33]、 AW-SVM （Absolute Weight of Support Vector Machine ）标准[34]等3种不同的评价标准，每一种评价标准对应一个特征序列，融合各序列生成最终的特征序列. 特征序列融合过程中，假设有i个特征选择标准，I为上限，j个特征，J为上限，依据特征选择标准，采用投票方式对每一个特征进行票数统计并打分[35-36]，依据得分高低对特征进行排序，得分最高的特征为J，其次为J-1，以此类推，每个特征的最终得分计算公式为：

式中：S表示每个特征的最终得分.

利用公式（12）计算得到的特征得分后，按高低顺序依次排列，得到特征排名，实现多评价标准特征融合.

将融合计算得到的特征组合为特征子集，表示为Z，为选择一个最佳的特征子集，需要对多个特征子集进行集成处理，再从中进行搜索，获取最优特征子集[37]，具体步骤如下：

1）依据特征融合结果生成特征子集，对其进行初始化处理，表示为Z0;

2）根据公式（12）计算原始特征子集Zj的重要程度，依次对特征子集中的元素进行排名;

3）选取排名最差的特征，将其删除，这时特征子集表示为Zj-1;

4）重复迭代上一步骤，直至特征子集中的元素数量降为最低;

5）输出最终选择得到的特征.

2.3 本文算法

在完成可疑区域特征选择的基础上，进行医疗图像误差预测. 将选择得到的特征区域作为目标区域，建立预测样本与训练样本之间的多元线性回归矩阵，实现医疗图像误差多元回归预测. 理论推导过程为：

将医疗图像可疑区域特征选择结果作为目标区域，随机选取目标区域内的3个特征像素点作为预测样本，以这3个像素为目标，依据同样的预测样本选取方式，获取每个与特征像素点相连接的3个像素点，共同作为训练样本.

假设fa，b代表预测目标像素，组成目标预测样本集合，Y = {y1，y2，y3，…，yn}， fa，b-1、 fa-1，b-1、 fa-1，b为与目标像素相连接的训练样本像素，组成训练样本集合X;建立目标预测样本与训练样本之间的多元线性回归矩阵，表示为：

fa，b-1fa-1，b-1fa-1，b= fa，b-2 fa-1，b-2 fa-1，bfa-1，b-2 fa-2，b-2 fa-1，b-1fa-1，b-1 fa-2，b-1 fa-2，bλ1λ2λ3+σ1σ2σ3 （13）

式中：λi代表不同的多元线性回归系数，σi代表不同的残差值，是回归计算中的随机扰动项的近似替代值.

其中λi的计算公式为：

λi = （XT X）-1 XT Y （14）

式中：T为转置符号.

5）将fa，b-1、 fa-1，b-1、 fa-1，b作为新的目标预测样本，则可以获取目标像素的预测值f′ a，b：

f′ a，b = S（λ1 fa，b-1 + λ2 fa-1，b-1 + λ3 fa-1，b）（15）

6）比较原始目标预测样本与新的样本预测值，则可获取医疗图像误差预测值，计算公式如下：

E1 = round（ fa，b - f′ a，b）（16）

7）由于在实际条件下，线性回归并不能很好地拟合误差预测点，导致预测结果容易出现一定的偏差，为此，引入局部线性加权方法进行分析，在待预测区域附近给予每个预测点一定的权重，这时回归系数构成的向量偏导数为：

式中：ψ为权重矩阵.

计算过程中，使用高斯核[38]赋予每个预测点一定的权重，高斯核对应的权重为：

高斯核中只有一个待确定的参数？谆，参数？谆的大小直接决定预测点的权重大小，由此可获取较为准确的误差预测值. 目前常用的高斯核参数？谆确定方法为交叉验证法，但该方法无法应对大规模的数据样本计算，因此本文采用核函数性质和几何距离来确定参数？谆，无需求解核函数，就能很好地解决大量数据样本下的计算.

综上所述，可完成医疗图像误差预测算法. 本文算法流程如图2所示.

3 实验结果与分析

3.1 实验环境和数据集

本实验操作中，实验平台为MATLAB R2015b，医疗图像卷积神经网络特征提取中，计算框架为MatConvNet，采用IPFS-Cluster管理工具與医院服务器相连接，进行医疗图像数据管理. 实验数据包括训练数据集和测试数据集，为最大程度保证有效提升特征表示能力，实验数据统一采用TCGA（The Cancer Genome Atlas）数据库中的乳腺癌图像数据集. 该数据库包含36种癌症数据，每种癌症都涉及多维的图谱信息. 为避免不同类别医疗图像数据对实验结果的干扰，本实验选取其中的乳腺癌图像数据集为测试集，每一图像特征对应一个时间戳记录. 测试图像种类50种，图像大小为512×512，特征选择迭代次数为5 000次，训练数据集和测试数据集分别为1 000万和3 000万.

3.2 评估指标

选取以下实验指标，对本文算法进行验证分析，具体如下：

1）乳腺癌图像可疑区域定位效果：给出真实的乳腺癌图像，利用不同算法进行图像可疑区域定位，与文献[10]、文献[11]、文献[12]进行对比.

2）集成规则适应度：自适应多分类器构建中，选择了5种集成规则实现医疗图像区域最优集成，对图像区域分类性能具有直接的影响作用. 为验证本文医疗图像分类结果精度，对集成规则适应度进行对比分析.

3）区域距离计算准确率：准确率这一指标能够清晰的反映算法的性能，以区域距离计算准确率为指标，对本文算法与文献[10]、文献[11]、文献[12]、文献[13]和文献[14]算法进行比较. 以正文中公式（10）的区域距离计算结果Ji为数据依据，使用J表示实际区域距离，获取区域距离计算准确率公式如下：

4）特征选择的AUC（Area Under Curve）值：ROC曲线为一种感受性曲线，用于选取最佳的数据值，ROC曲线下与坐标轴围成的面积称为AUC（Area Under Curve）值[39-40]. 本组实验在不同算法下，计算得出AUC值，AUC值的取值范围通常为[0.5，1]，数值越大，表示特征选择效果越好. AUC值计算公式如下：

式中：predpos表示特征选择的正样本数量，即选择得到的真实特征数量，predneg表示特征选择的负样本数量，即选择得到的特征为非真实特征的数量，分母positiveNum·negativeNum表示正负样本总数量.

5）预测值与实际值拟合度：为验证本文预测结果的可靠性，分析本文图像误差预测值与实际值的拟合度. 拟合度计算公式如下：

式中：p表示常数指数，取值大于0.

6）不同数据样本下预测耗时：在实际应用中，目标研究区域存在数据量不一情况，以预测耗时为指标，分别在大数据样本和小数据样本条件下，对本文算法与文献[13]、文献[14]、文献[15]、文献[16]、文献[17]算法进行比较. 此处，大数据样本是指本实验选取的全部测试数据集，包含数据集3 000万，小数据样本则是从中随机选取一半的数据集，数量为1 500万.

3.3 实验结果与讨论

3.3.1 乳腺癌图像可疑区域定位效果对比

以乳腺癌图像为研究对象，利用不同算法进行图像可疑区域定位，形成对比，结果如图3所示.

（e）文献[12]

根据图3分析利用计算机模拟得出可疑区域定

位准确率数值，用表1表示.

根据图3和表1可以明显看出，本文算法获取的图像可疑区域定位结果与原始图像基本一致，文献[10]、文献[11]、文献[12]算法虽然定位得到了可疑区域，但定位得到的区域过多，结果不够精准，准确率较低，且增加了后续图像误差预测计算复杂度. 由此可以直观的看出，本文算法具有良好的图像可疑区域定位效果，为图像误差预测奠定了良好的基础.

3.3.2 集成规则适应度对比

本文对医疗图像区域分类中，集成规则是重要因素，在不同测试数据采样方式下，对本文算法与文献[10]、文献[11]、文献[12]、文献[13]和文献[14]算法的集成规则适应度进行对比，结果如表2所示.

分析表2可知，测试数据采样方式的不同，对文献算法均会产生一定的影响，将采样方式由均匀采样变换为非均匀采样后，文献[10]、文献[11]、文献[12]、文献[13]和文献[14]算法的集成规则适应度均出现了降低，而本文算法的集成规则适应度仍旧为92%，不受采样方式影响，且本文算法的集成规则适应度最高，表明本文构建的自适应多分类器性能较好，能够很好地完成医疗图像区域分类. 主要是因为本文选取了5种分类器，对每种分类器给予一定的分类权重，构造出了一种更为全面的的集成规则，有效提高了集成规则的适应度.

3.3.3 区域距离计算准确率对比

本文算法与文献[10]、文献[11]、文献[12]、文献[13]和文献[14]算法的区域距离计算准确率對比结果如图4所示.

分析图4可以看出，随着数据量的增大，不同算法的区域距离计算准确率呈现不同的波动趋势，文献[11]算法的区域距离计算准确率始终处于下降趋势，文献[10]、文献[12]、文献[13]和文献[14]算法的准确率变化中，既有上升趋势，也会出现下降趋势，但这5种文献方法的最高区域距离计算准确率不超过60%，而本文算法的最低区域距离计算准确率为60%，且变化曲线始终呈现上升趋势，在数据量为3 000万个时，准确率高达95%左右. 根据上述数据分析可以看出，本文利用卷积神经网络能够很好地完成医疗图像区域距离计算，效果较好. 究其原因，是因为本文首先对卷积神经网络进行了训练，利用训练后的神经网络提取图像特征，以提取得到的特征为基础计算区域距离，由此增加了区域距离计算准确率，为可疑区域定位结果提供了保障.

3.3.4 特征选择的AUC值对比

利用本文算法与文献[10]、文献[11]、文献[12]、文献[13]算法、文献[14]算法，分别绘制特征选择的AUC值曲线，如图5所示.

根据图5得到的AUC值可知，在数据量为500万时，文献[10]算法的特征选择AUC值为0.56，文献[11]算法的特征选择AUC值为0.71，文献[12]算法为0.66，文献[13]算法为0.68，文献[14]算法为0.69，本文算法的特征选择AUC值为0.80，远高于其他文献方法. 在数据量为3 000万时，本文算法的特征选择AUC值最大，为0.84，其次为文献[11]和文献[14]算法，最高为0.83. 通过图5可以显著的看出，本文算法特征选择结果较好，主要是因为本文采用了多评价标准融合的方式，从多个特征子集中搜索得出最优特征子集，大大提高了算法的特征选择性能.

3.3.5 预测值与实际值拟合度对比

对本文算法获取的预测值与实际值的拟合度进行分析，将其与文献[10]、文献[11]和文献[12]算法对比，结果如图6所示.

根据图6显示结果可知，本文算法得到的预测值紧紧围绕实际值组成的直线，趋势一致，分布在实际值两侧，与实际值的拟合度较高，表明利用本文方法获取得到的误差预测值结果较为准确. 文献[10]算法得到的预测值虽然也分布在实际值直线两侧，但与实际值的距离较远. 文献[11]算法的预测值全部分布在实际值下侧，文献[12]算法的预测值全部分布在实际值上侧，且这两种算法的预测值与实际值直线相距较远，拟合度较低. 根据上述分析结果可知，本文预测算法具有一定的优势，主要是因为本文设置了预测样本与训练样本，构建了两个样本之间的多元线性回归矩阵，利用多元线性回归方法完成了医疗图像误差预测，预测结果准确率较高，拟合度较好. 3.3.6 不同数据样本下预测耗时对比

在大数据样本和小数据样本条件下，对比本文算法与文献[10]、文献[11]、文献[12]、文献[13]、文献[14]算法的预测耗时，结果如表3所示.

根据表3分析结果可知，在大数据样本条件下，文献[10]、文献[11]、文献[12]、文献[13]、文献[14]算法的预测耗时较多，在21～32 s之间，小数据样本条件下，这些文献算法的最高预测耗时为23 s，表明数据样本的分布情况会对文献算法产生直接的影响，增加计算耗时. 但本文算法基本不受数据样本条件的影响，在大数据样本条件下平均耗时为8 s，在小数据样本条件下平均耗时为7 s，远远低于文献算法. 究其原因，在于本文运用卷积神经网络和特征选择结合的方式进行误差预测，排除冗余数据造成的影响，大大降低了数据计算量，节约了预测耗时.

4 结论

从医疗图像中准确获取重要的信息，是有效完成计算机辅助疾病诊断的基础，但采集得到的医疗图像通常会存在一定的误差，因此，对医疗图像误差预测具有非常重要的研究价值. 但目前存在的误差预测方法存在不足，未能获取很好的预测效果，为此，本文提出基于卷积神经网络与特征选择的医疗图像误差预测算法，采用多元线性回归方法实现医疗图像误差预测. 为验证本文算法的性能，在多个测试指标以及多种数据条件下展开实验，结果表明，本文所提算法在区域分类、图像特征选择、预测结果拟合度以及预测耗时方面均优于传统算法，能够快速、准确的实现医疗图像误差预测.

然而，本研究结果仍旧有待进一步的补充与改善，面对日益复杂的医疗图像问题，在未来的研究工作中，需要结合医疗图像实际需求进行研究. 此外，本文对于卷积神经网络模型仅进行了简单的训练，分析深度不足，未能充分利用卷积神经网络的优势，下一步研究中，将不断改进卷积神经网络模型，使其无需借助其他方法的辅助，能够更加便捷的应用于医疗领域，获取更好的成果.

参考文献

[1] GEGENFURTNER A，KOK E，VAN G K，et al. The challenges of studying visual expertise in medical image diagnosis[J]. Medical Education，2017，51（1）：97—104.

[2] LIU M，ZHANG J，YAP P T，et al. View-aligned hypergraph learning for Alzheimer's disease diagnosis with incomplete multi-modality data[J]. Medical Image Analysis，2017，36（2）：123—134.

[3] LITJENS G，KOOI T，BEJNORDI B E，et al. A survey on deep learning in medical image analysis[J]. Medical Image Analysis，2017，42（9）：60—88.

[4] BRUIJNE M D. Machine learning approaches in medical image analysis：From detection to diagnosis[J]. Medical Image Analysis，2016，33（1）：94—97.

[5] HE T，LI X F. Image quality recognition technology based on deep learning[J]. Journal of Visual Communication and Image Representation，2019，65：1—10.

[6] CARLAK H F，GENCER N G，BESIKCI C. Theoretical assessment of electro-thermal imaging： A new technique for medical diagnosis[J]. Infrared Physics & Technology，2016，76：227—234.

[7] 侯夢薇，卫荣，陆亮，等. 知识图谱研究综述及其在医疗领域的应用[J]. 计算机研究与发展，2018，55（12）：2587—2599.

HOU M W，WEI R，LU L，et al. Review of knowledge map research and its application in medical field [J]. Computer Research and Development，2018，55 （12）：2587—2599. （In Chinese）

[8] 赵越，曾立波，吴琼水. 卷积神经网络的宫颈细胞图像分类[J]. 计算机辅助设计与图形学学报，2018，30（11）：2049—2054.

ZHAO Y，ZENG L B，WU Q S. Cervical cell image classification based on convolutional neural network [J]. Journal of Computer Aided Design and Graphics，2018，30 （11）：2049—2054. （In Chinese）

[9] 刘凯，符海东，邹玉薇，等. 基于卷积神经网络的中文医疗弱监督关系抽取[J]. 计算机科学，2017，44（10）：249—253.

LIU K，FU H D，ZOU Y W，et al. Extraction of Chinese medical weak supervision relationship based on convolutional neural network [J]. Computer Science，2017，44 （10）：249—253. （In Chinese）

[10] WANG G，LI W，ZULUAGA M A，et al. Interactive medical image segmentation using deep learning with image-specific fine tuning[J]. IEEE Transactions on Medical Imaging，2018，37（7）：1562—1573.

[11] ZHOU X，GAO X，WANG J，et al. Eye tracking data guided feature selection for image classification [J]. Pattern Recognition，2017， 63：56—70.

[12] NIZAMI I F，MAJID M，KHURSHID K. New feature selection algorithms for no-reference image quality assessment[J]. Applied Intelligence，2018，48（12）：3482—3501.

[13] 张利文，刘侠，汪俊，等. 基于定量影像组学的肺肿瘤良恶性预测方法[J]. 自动化学报，2017，43（12）：2109—2114.

ZHANG L W，LIU X，WANG J，et al. Prediction of benign and malignant lung tumors based on quantitative imaging[J]. Journal of Automation，2017，43（12）：2109—2114. （In Chinese）

[14] 盧冶，陈瑶，李涛，等. 面向边缘计算的嵌入式FPGA卷积神经网络构建方法[J]. 计算机研究与发展，2018，55（3）：551—562.

LU Y，CHEN Y，LI T，et al. Construction method of edge computing oriented embedded FPGA convolutional neural network[J]. Computer Research and Development，2018，55 （3）：551—562. （In Chinese）

[15] 王忠民，曹洪江，范琳. 一种基于卷积神经网络深度学习的人体行为识别方法[J]. 计算机科学，2016，43（S2）：56—58.

WANG Z M，CAO H J，FAN L. A human behavior recognition method based on convolutional neural network deep learning[J]. Computer Science，2016，43（S2）：56—58. （In Chinese）

[16] 邹月娴，余嘉胜，陈泽晗，等. 图像分类卷积神经网络的特征选择模型压缩方法[J]. 控制理论与应用，2017，34（6）：746—752.

ZOU Y X，YU J S，CHEN Z H，et al. Compression method of feature selection model for convolution neural network of image classification [J]. Control Theory and Application，2017，34 （6）：746—752. （In Chinese）

[17] ZHANG F，CAI N ，WU J ，et al. Image denoising method based on a deep convolution neural network[J]. IET Image Processing，2018，12（4）：485—493.

[18] WOLTERINK J M，LEINER T，VIERGEVER M A，et al. Automatic coronary calcium scoring in cardiac CT angiography using convolutional neural networks[C]//MICCAI 2015. Lecture Notes in Computer Science，Springer，Cham，2015，9349：589—596.

[19] CHA K H，HADJIISKI L，SAMALA R K，et al. Urinary bladder segmentation in CT urography using deep-learning convolutional neural network and level sets[J]. Medical Physics，2016，43（4）：1882—1896.

[20] 许行，张凯，王文剑. 一种小样本数据的特征选择方法[J]. 计算机研究与发展，2018，55（10）：2321—2330.

XU X，ZHANG K，WANG W J. A feature selection method for small sample data[J]. Computer Research and Development，2018，55 （10）：2321—2330. （In Chinese）

[21] ZHANG F，CHAN K P，BIGGIO B，et al. Adversarial feature selection against evasion attacks[J]. IEEE Transactions on Cybernetics，2016，46（3）：766—777.

[22] 劉丽倩，董东. 基于代价敏感集成分类器的长方法检测[J]. 计算机科学，2018，45（S2）：497—500.

LIU L Q，DONG D. Long method detection based on cost sensitive ensemble classifier[J]. Computer Science，2018，45（S2）：497—500. （In Chinese）

[23] RAGHAVENDRA U，FUJITA H，BHANDARY S V，et al. Deep convolution neural network for accurate diagnosis of glaucoma using digital fundus images[J]. Information Sciences，2018，441：41—49.

[24] CHEN T，LU S，FAN J. S-CNN： Subcategory-aware convolutional networks for object detection [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence，2018，40（10）：2522—2528.

[25] WEI C，ZHENG Z，QI Z，et al. Application of a parallel spectral-spatial convolution neural network in object-oriented remote sensing land use classification[J]. Remote Sensing Letters，2018，9（4）：334—342.

[26] JIAN L，SUJUAN H，XIAODAN S ，et al. Deblurring retinal optical coherence tomography via a convolutional neural network with anisotropic and double convolution layer[J]. Iet Computer Vision，2018，12（6）：900—907.

[27] XU Q，PAN G. SparseConnect： regularising CNNs on fully connected layers [J]. Electronics Letters，2017，53（18）：1246—1248.

[28] PONTABRY J，ROUSSEAU F，STUDHOLME C，et al. A discriminative feature selection approach for shape analysis： Application to fetal brain cortical folding [J]. Medical Image Analysis，2017，35：313—326.

[29] CHANDY D A，CHRISTINAL A H，THEODORE A J，et al. Neighbourhood search feature selection method for content-based mammogram retrieval [J]. Medical & Biological Engineering & Computing，2017，55（3）：493—505.

[30] IBRAGIMOV B，XING L. Segmentation of organs at risks in head and neck CT images using convolutional neural networks [J]. Medical Physics，2017，44（2）：547—557.

[31] ZHANG Z，JAISWAL P，RAI R. FeatureNet： Machining feature recognition based on 3D Convolution Neural Network [J]. Computer-Aided Design，2018，101：12—22.

[32] LU S，HEEMINK A，LIN H X，et al. Evaluation criteria on the design for assimilating remote sensing data using variational approaches[J]. Monthly Weather Review，2017，145（6）：2165—2175.

[33] SRISUWAN N，PHUKPATTARANONT P，LIMSAKUL C. Comparison of feature evaluation criteria for speech recognition based on electromyography [J]. Medical & Biological Engineering & Computing，2018，56（4）：1041—1051.

[34] 钟学燕，陈国青，孙磊磊，等. 基于多视角特征融合的移动信息服务模式挖掘[J]. 系统工程理论与实践，2018，38（7）：1853—1861.

ZHONG X Y，CHEN G Q，SUN L L，et al. Mining mobile information service patterns based on multi perspective feature fusion[J]. System Engineering Theory and Practice，2018，38（7）：1853—1861. （In Chinese）

[35] 李婉君，汪天富，倪东，等. 基于特征融合和判别式学习的胎盘成熟度自动分级[J].中国生物医学工程学报，2016，35（4）：411—418.

LI W J，WANG T F，NI D，et al. Placental maturity evaluation via feature fusion and discriminative learning [J]. Chinese Journal of Biomedical Engineering，2016，35（4）：411—418. （In Chinese）

[36] ZHAI A，WEN X，XU H，et al. Multi-Layer model based on multi-scale and multi-feature fusion for SAR images [J]. Remote Sensing，2017，9（11）：1085—1101.

[37] MA G，YANG X，ZHANG B，et al. Multi-feature fusion deep networks [J]. Neurocomputing，2016，218（19）：164—171.

[38] 张骈，侯进. 高斯核函数快速插值的头发实时仿真与渲染[J]. 计算机辅助设计与图形学学报，2017，29（2）：320—327.

ZHANG P，HOU J. Hair real-time simulation and rendering with fast interpolation of Gaussian kernel function [J]. Journal of Computer Aided Design and Graphics， 2017， 29（2）： 320—327. （In Chinese）

[39] ZAWISTOWSKI M，SUSSMAN J B，HOFER T P，et al. Corrected ROC analysis for misclassified binary outcomes [J]. Statistics in Medicine，2017，36（13）：2148—2160.

[40] CUNHA B A，CUNHA C B，LAM B，et al. Nitrofurantoin safety and effectiveness in treating acute uncomplicated cystitis （AUC） in hospitalized adults with renal insufficiency： antibiotic stewardship implications[J]. European Journal of Clinical Microbiology & Infectious Diseases，2017，36（2）：1213—1216.

收稿日期：2020-07-03

基金项目：国家自然科学基金资助项目（61803117），National Natural Science Foundation of China（61803117）;教育部科技发展中心产学研创新基金（2018A01002），Ministry of Education Science and Technology Development Center Fund（2018A01002）;国家科技部创新方法专项（2017IM010500），The Innovtion Method Project of Ministry of Science and Technology（2017IM010500）

作者简介：李晓峰（1978—），男，黑龙江哈尔滨人，北京理工大学教授，博士，CCF高级会员，IEEE会员

通信聯系人，E-mail：liugang@brbeu.edu.cn