基于卷积神经网络的白癜风智能检测研究
2019-09-09罗卫王学磊刘健陈杰徐劲朱琳
罗卫,王学磊,刘健,陈杰,徐劲,朱琳
1. 空军特色医学中心 皮肤科,北京 100142;2. 北京网医智捷科技有限公司,北京 100085;3. 北京科技大学,北京 100083
引言
人体最大的器官是皮肤,约占成年人体重总量的15%[1],身体的内部通过皮肤与外部环境隔开。因此,皮肤是身体的重要防线,可以防止真菌、细菌、病毒感染和过敏等,并对体温进行控制。许多皮肤病还会影响到人的外表以及身体健康,例如白癜风、痤疮、银屑病、湿疹、黑色素瘤等。在皮肤病的诊治过程中,皮肤病的早期识别是非常重要的。
在医学皮肤图像处理过程中,通常使用图像识别技术。传统的图像识别技术主要是通过分割边缘和特征提取来对图像进行识别,从而达到对皮肤图像所包含的疾病进行识别的目的。然而,图像分割和特征提取方法[2-5]高度依赖于图像分析所设定的阈值,这需要大量的专家经验作为基础。如果阈值设定不合理,其泛化能力较差,容易导致识别效果不能令人满意。卷积神经网络(Convolutional Neural Network,CNN)具有很强的特征提取和图像识别能力,在鉴别皮肤病方面具有重要意义。然而,当前缺少白癜风智能诊断和识别的研究。
白癜风是一种常见的色素性皮肤病。据不完全统计,世界上白癜风的发病率约为0.5%~2%[6-8],其特征在于局部或全面丧失色素沉着,并形成白斑。当白癜风还处于早期阶段时,由于白癜风病变部位的黑色素细胞的数量刚开始减少,通过治疗可获得比较显著的恢复效果,治疗费用也较低,因此白癜风的早期诊断非常重要。目前,尚没有相关医院通过计算机自动辅助诊断的方法进行白癜风的诊断,基本上都是依靠医生多年的经验进行诊断,所以白癜风智能诊断的意义重大。本文中,我们提出了一种基于CNN 的白癜风智能检测模型,该模型的检测成功率较高,有助于减少医生的工作难度,并使患者能够进行自我诊断及评价白癜风的复色情况。
1 基于CNN的白癜风检测
1.1 数据准备
本文所使用的数据来源于空军特色医学中心皮肤科白癜风专科,共包含四万张临床白癜风皮肤图片,为目前全球最大规模的白癜风专科图片库,其数据还在不断增加中。图片库中图片的分辨率为768×576,包括两类图片:正常皮肤图片和白癜风患者皮肤图片,如图1 所示。
图1 临床白癜风专科图片库内图片示例
1.2 数据预处理
在建立模型之前,我们需要对全部图片进行预处理[9-11],步骤如下:① 编写一个用于缩小图像尺寸的python 脚本文件,用于将数据集中的图像的分辨率降为224×224;② 针对训练集和测试集的数据,分别建立标注文件(此处的皮肤图像标注是空军特色医学中心皮肤科白癜风专科的医生根据皮肤图片的具体临床特征进行的);③ 分出数据集70%的图片用于训练模型,另外30%的图片用于模型检测。
1.3 CNN检测模型建立
CNN 通常由两部分组成:自动特征提取和全连接层,其中特征提取包括卷积层和池化层。在模型建立过程中,我们使用Keras-Framework[12]作为模型建立的框架,该框架具有多个预训练的模型,可以缩短开发时间。我们通常选择一些常用的CNN 模型,如Resnet50[13]、Vgg16[14]、Inception v2[15]等。经过初步实验,Resnet50 的性能最优,其多项指标优于其他模型,更适合白癜风疾病的识别。ResNet(Residual Neural Network)是由微软研究院的Kaiming He 等四名华人提出的,在ILSVRC2015 比赛中取得冠军,在top5 上的错误率仅为3.57%。Resnet50 模型有残余模块,可以使整个结构在相同的方向上收敛映射,并确保随着深度的增加最终错误率不会变得越来越高,因此我们将Resnet50 作为基线模型来使用。
为了提高识别白癜风的准确率,我们训练3 个不同的CNN,对三个模型输出的概率值取均值,并将该均值作为我们模型的判决输入,如图2 所示。具体的检测流程如下:① 导入RGB 图像,并将图片对应的标签变成one-hot 编码;② 对数据进行预处理,并使用三个不同的CNN(Resnet50、VGG16、Inception v2)进行训练;③ 取三个Resnet50 输出概率值的均值,将该均值送入判决系统进行判决;④ 均值大于0.5,系统认为该图像对应标签的值更接近1,并将其判定为白癜风阳性;⑤ 均值小于或等于0.5,系统认为该图像对应标签的值更接近于0,并将其判定为白癜风阴性。
图2 白癜风识别流程图
2 结果
根 据 准 确 度(Accuracy,Acc)、 精 确 度(Positive Predictive Value,PPV)、灵敏度(Sensitivity,Sen)、特异性(Specifi city,Spe)和ROC 曲线下面积(Area Under the ROC Curve,AUC)[16]评估分类的性能。白癜风阳性,在标注文件中是标签1;白癜风阴性,即正常皮肤,在标注文件中是标签0。采用真阳性(True Positive,TP)、真阴性(True Negative,TN)、假阳性(False Positive,FP)和假阴性(False Negative,FN)这些常见指标进行评价,其相应的定义如下。
Acc=(TP+TN)/(TP+TN+FP+FN)
PPV=TP/(TP+FP)
Spe=N/(TN+FP)Sen=TP/(TP+FN)
详细的指数分析如表1 所示。从表1 我们可以看到,在这三种不同的CNN 模型上的特异性都比较低,不超过80%,但对这三种模型的组合,其特异性能达到80.1%。混淆矩阵如图3 所示。
表1 白癜风识别结果
图3 CNN混合模型的混淆矩阵
白癜风是一种色素性疾病,病变区域在不同颜色空间转换下具有较高的对比度,融合方法可有效识别病变区域,降低误诊率。同时,准确度、精确度和灵敏度这三个指标分别提高到86.3%、91.2%和90.5%。总之,我们的方法简单有效,复杂度低,可以更好地应用于协助医生诊断,也可以为其他有色人种的诊断提供研究思路。
3 临床应用
基于以上理论模型,我们开发了应用于临床上白癜风患者的智能分析系统。通过该系统,可以让患者在完成白癜风首诊之后,自行分析治疗后的白癜风复色情况,可以精确地测量出白斑面积缩小和白斑复色灰度情况;同时,也可以将该分析结果传给主治医生,便于医生分析白癜风病情和确定下一步的治疗方案,从而有效提高白癜风患者治疗的连贯性和提高治愈率。具体的白癜风患者治疗后智能分析系统分析结果如图4 所示。
图4 白癜风患者治疗前后智能分析系统分析结果截图
4 结论
本文提出了一种基于CNN 模型融合的白癜风识别方法,与基于单个模型的图像识别方法相比,该方法更有效、更稳健。在不同模型的训练结果下,从白癜风病变区域学习到的特征都不太一样,因此三种模型具有一定的差异性,通过简单的融合方法,可以得到性能的显著提升。通过测试集对模型进行验证,其AUC、准确性和特异性均具有较大优势。我们下一步的工作主要是,通过模型改进和训练数据的增加,进一步提高算法的识别性能。总之,本论文的研究成果有助于医生对白癜风疾病的有效识别,从而减少医生工作难度,并能使患者进行自我诊断。