APP下载

基于深度学习网络的乳腺癌图片分类研究

2019-10-15程年俞晨宁静艳

软件导刊 2019年8期
关键词:迁移学习深度学习

程年 俞晨 宁静艳

摘 要:利用深度学习网络对组织病理图片进行分类,以减少病理学家工作量,达到利用计算机辅助治疗的效果。提出利用在两种预训练好的框架下提取的特征进行训练,并研究了多级分类,该成果有利于癌症后期治疗,更加方便临床医学应用;利用迁移学习能够减少训练时间,并解决数据集不足的问题;通过数据增强的方法,可有效提高分类准确度。

关键词:深度学习;乳腺癌病理图片;数据增强;迁移学习

DOI:10. 11907/rjdk. 182847 开放科学(资源服务)标识码(OSID):

中图分类号:TP301文献标识码:A 文章编号:1672-7800(2019)008-0026-03

Classification of Breast Couldcer Images Based on Deep Learning Network

CHENG Nian1,YU Cheng2,NING Jing-yang1

(1. School of Automated,Southeast University;2. Jiangsu couldcer Hospital,Southeast University,Nangjing 210096,China)

Abstract:The purpose was that the method of deep learning was used to classify histopathological images, reducing the heavy work of pathologists and achieving the effect of using computer-assisted medical care. The way that the training of features extracted under two pre-trained frameworks was proposed. At the same time, multiple classes were also studied. Classification could be beneficial to the later treatment of couldcer, which was more convenient for clinical medicine applications. The use of migration learning could preferentially reduce the training time and data set; and the data enhancement method could improve the classification accuracy.

Key Words:deep learning; breast couldcer histopathological image; data augmentation; transfer learning

作者簡介:程年(1993-),女,东南大学自动化学院硕士研究生,研究方向为模式识别与人工智能;俞晨(1980-),女,江苏省肿瘤医院副主任医师,研究方向为中西医结合治疗恶性肿瘤;宁静艳(1994-),女,东南大学自动化学院硕士研究生,研究方向为模式识别、图像处理。

0 引言

癌症是困扰人类的一大难题,而乳腺癌在女性中为死亡率仅次于肺癌的第二大癌症[1],约占各种肿瘤疾病的7%-10%,也有少数男性患者[2]。针对乳腺癌的诊断有多种方式,最初是使用临床筛查进行组织病理学分析,以精确监测肿瘤亚类型,或使用乳腺癌组织病理图片进行自动分类[3]。由于乳腺癌发病率不断提高,所以医学上对乳腺癌的诊断与治疗越来越关注,同时也是各大实验室的研究热点[4]。虽然传统乳腺癌诊断方法为临床检查,但病理学检查才是判断患者是否患有癌症,以及癌症为良性还是恶性最重要的标准,如图1所示[5]。

因此,病理学图片分析对癌症的准确诊断与后续治疗起着至关重要的作用。然而,组织病理学分析需要病理学家经过长期培训后才能完成,而且人工分析存在许多不确定性,不同病理学家的诊断也存在很大误差,因此将在很大程度上影响后期治疗。如何提升病理学图片分析的准确性,成为目前一个亟待解决的问题。

[体格检查][影像学检查][临床检查][初步诊断][金标准][是否为癌症][病理学检查][癌症性质]

图1 癌症诊断方式

将深度学习应用于数据分析领域已取得非常好的效果,因而受到了人们的广泛关注。深度学习由人工神经网络演变而来,但在人工神经网络基础上大量增加了神经元层数,因此在提取图片特征作用域时,能够提取到更高层次的特征[6]。将深度学习与病理学图片分析相结合,是数字医学界的一大创新,同时推动了医学发展[7]。2005年,Xu等[8]提出一种堆叠式稀疏自动编码器(Stacked Sparse Autoencoder,SSAE) 框架对乳腺癌组织病理图片进行自动细胞核监测,该方法监测效果优于其它9种细胞核监测方法;Bayramoglu等[9]对数据集BreaKHis进行训练,其采用基于放大倍数独立的深度学习分类方法,识别率达到 83%;韩泓泽与魏宾等[10]将Ronneberger等[11]提出的U-Net应用于乳腺癌细胞检测,首先利用U-Net卷积网络获取乳腺癌病理切片图像中的特征信息,然后将提取的不同层次特征信息通过4次上采样操作进行融合,输出与原图像具有相同分辨率的图像,并得到每个像素点被分类为癌细胞的概率,该方法对乳腺癌细胞的检测准确率超过99%;Deniz等[12]于2018年提出采用迁移学习方式对乳腺癌的组织病理学图片进行分类,并使用预训练好的AlexNet网络进行微调,证明了迁移学习比支持向量机(Support Vector Machines,SVM)[13]能够达到更好的效果。但医学图片是非常珍贵且稀缺的资源,因此很难得到深度学习网络所需的数据集。组织病理学图片不同于自然图片,其像素数量有的可达到上亿级别。本文研究的基于深度学习对乳腺图片的分类,通过迁移学习[14]与数据增强方式解决了数据稀少的问题。本文研究的数据集来自公开数据集Breast Couldcer Histopathological Image Classification(BreakHis)(网址:https://web.inf.ufpr.br/vri/databases/breast-couldcer-histopathological-database-breakhis/),同时利用在不同倍数下预先提取的特征进行训练,从而提高了分类准确率。

[9] BAYRAMOGLU N,KANNALA J,HEIKKIL? J.Deep learning for magnification independent breast cancer histopathology image classification[C]. International Conference on Pattern Recognition(ICPR),2016:2441-2446.

[10] 韩泓泽,魏宾,隋栋,等. 基于U-Net的乳腺癌病理切片中癌细胞检测方法[J]. 精准医学杂志,2018,33(6):471-473,477.

[11] RONNEBERGER O, FISCHER P, BROX T. U-Net: convolutional networks for biomedical image segmentation[C]. International Conference on Medical Image Computing & Computer-assisted Intervention, 2015.

[12] DENIZ E,ABDULKADIR ?,ZEHRA K,et al. Transfer learning based histopathologic image classification for breast cancer detection[J].  Health Information Science and Systems, 2018, 6(1):18.

[13] 刘铭,吴朝霞. 支持向量机理论与应用[J]. 科技视界,2018(23):68-69.

[14] PAN S J, YANG Q. A survey on transfer learning[J].  IEEE Transactions on Knowledge & Data Engineering,2010, 22(10):1345-1359.

[15] SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition[DB/OL]. https://arxiv.org/abs/1409.1556.

[16] SZEGEDY C, VANHOUCKE V, IOFFE S, et al. Rethinking the inception architecture for computer vision[C]. 2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2016:2818-2826.

[17] 田娟,李英祥,李彤巖. 激活函数在卷积神经网络中的对比研究[J]. 计算机系统应用,2018,27(7):43-49.

[18] 李琼,柏正尧,刘莹芳. 糖尿病性视网膜图像的深度学习分类方法[J]. 中国图象图形学报,2018,23(10):1594-1603.

[19] 刘鑫鹏,栾悉道,谢毓湘,等. 迁移学习研究和算法综述[J]. 长沙大学学报,2018,32(5):28-31,36.

[20] 高友文,周本君,胡晓飞. 基于数据增强的卷积神经网络图像识别研究[J]. 计算机技术与发展,2018,28(8):62-65.

(责任编辑:黄 健)

猜你喜欢

迁移学习深度学习
从认知角度探讨大学英语网络教学模式
奇异值分解与移移学习在电机故障诊断中的应用
有体验的学习才是有意义的学习
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
大数据环境下基于迁移学习的人体检测性能提升方法