基于卷积神经网络的脑出血分类识别算法研究
2024-05-17杨琳,安旭,菜涪全
摘 要:脑出血诊断主要依赖于影像学检查,针对传统人工阅片识别效率不高、受限于医师与设备技术,以及难以实现大规模诊断等问题,提出了一种基于卷积神经网络的脑出血识别和分类方法。采集了5 000份脑CT影像,对其进行去噪、归一化、裁剪等预处理,建立了脑CT影像的LeNet-5模型,进行特征提取并实现分类。结果表明,LeNet-5模型在测试集上的准确率达到了95.8%,能够提供更准确、更高效的诊断结果,可为临床诊断和治疗提供有力支持。
关键词:CT影像;卷积神经网络;脑出血;识别
中图分类号:TP183 文献标识码:A 文章编号:1674-0033(2024)02-0035-05
引用格式:杨琳,安旭,菜涪全.基于卷积神经网络的脑出血分类识别算法研究[J].商洛学院学报,2024,38(2):35-39.
A Study on Classification and Recognition
Algorithm for Cerebral Hemorrhage Based
on Convolutional Neural Network
YANG Lin, AN Xu, CAI Fu-quan
(College of Electronic Information and Electrical Engineering / Shangluo Artificial Intelligence Research Center, Shangluo University, Shangluo 726000, Shaanxi)
Abstract: The diagnosis of cerebral hemorrhage mainly relies on the imaging examination. The traditional manual way of the CT images analysis has many disadvantages, such as low identification efficiency, limited by doctors and equipment technology, and the difficult to achieve large-scale diagnosis. a new method of cerebral hemorrhage classification and recognition is proposed, based on convolutional neural network to overcome these difficulties. 5 000 sets of brain CT images were collected, and the brain CT images were denoised, normalized and trimmed, and the LeNet-5 model of brain CT images was established for feature extraction and classification. The results show that the accuracy of the LeNet-5 model of cerebral hemorrhage recognition reached 95.8% on the test set, and it can provide more accurate and efficient diagnostic results, which can provide excellent support for clinical diagnosis and treatment.
Key words: CT image; convolutional neural network; cerebral hemorrhage; recognition
脑出血是一种高风险疾病,可能由外伤、高血压等因素导致。脑出血诊断主要依赖于CT、核磁共振等影像学检查。传统的人工阅片方式存在识别效率不高、结果易受医师的技术水平影响,难以实现大规模诊断等问题[1]。近年来,人工智能技术的进步与发展,特别是深度学习技术在医学影像领域的应用,为脑出血的机器诊断提供了新方法。通过对大量影像数据的学习,算法可以自动提取出脑CT图像中的特征,从而实现对疾病的自动识别和分类[2-3]。这种方法具有速度快、准确率高、可重复性好等优点,对于提高脑出血的诊断效率和准确性具有重要意义。诸多研究者在该领域开展了一系列的研究,Anthony G. Chesebro[4]设计了微出血检测深度学习模型,Salita Angkurawaranon[5]验证了深度学习模型在颅内出血定位、分类方面的有效性,黄成健[6]探索了深度学习在脑CT图像分析中的应用,冀俊忠等[7]提出了一种基于多尺度超像素融合网络的脑CT图像分类方法,符帅[8]、郑自鹏[9]、王娴[10]、周正松[11]等研究了颅内出血的自动定位、特征提取、出血区域分割等问题,Tanweer Rashid[12]、Ali Arab[13]利用深度神经网络实现了脑出血体积的自动计算,冯玄[14],趙凯[15]基于深度学习技术研究了脑出血自动分类与扩大预测研究。这些研究表明,深度卷积网络对CT影像的分类,有一定效果,但仍存在训练时间较长、缺乏统一标准、计算资源限制等问题。本文在前人的研究基础上,提出一种基于卷积神经网络的脑出血识别方法,建立了LeNet-5模型,完成了脑CT影像的分类任务,对脑出血的早期诊断和治疗具有重要意义。
1 试验数据
1.1 CT影像
计算机断层扫描技术(CT,Computed Tomography) 是一种通过射线对人体进行断层扫描后,能清晰显示出人体各部位和组织断层结构的技术。CT影像学检查是脑部病变最重要的检查方式之一,可以明确显示出脑出血、脑梗塞等各类病变的位置、范围、程度,以及周围脑组织受压迫的情况等,各部位、各类型病变的CT值范围如表1所示,可为脑部疾病诊断提供重要依据。
表1 颅脑CT数值
1.2 数据集
本文所涉及的5 000份脑CT影像数据来自原商洛职业技术学院附属医院(2015—2019年),采集设备为GE Optima CT660型扫描仪,管电压为 120 kV,管电流为自动,层厚5 mm,层数16,图像尺寸为512 mm×512 mm。由放射科医师对病变区域进行手工语义分割标注,标签共有正常、出血两种类型。如图1所示,白色区域表示出血,被标记为1;其他灰色区域表示正常脑组织,标记为0。
1.3 数据预处理
在数据预处理阶段,主要进行去噪、归一化和图像裁剪。
1.3.1 去噪
在数据采集过程中,部分患者由于脑部受损,无法保持安静的头部姿势,一定程度的脑部晃动使得采集到的图像出现伪影,如图2所示。这些伪影会对图像的质量和分类结果产生严重影响,因此,需要对图像进行去噪处理。常见的去噪方法包括中值滤波、高斯滤波等,本文采用小波滤波法,能够有效地去除图像中的噪声,提高图像的质量。
1.3.2归一化
将脑CT图像的灰度值进行归一化操作,其过程如:
归一化后,图像的数据范围在0~1,可以消除不同批次扫描、不同医师操作的差异,使模型可以更加准确地识别病变区域。
1.3.3裁剪图像
CT图像四周包含大量的边角信息,这些信息对于脑出血识别分类这个目标任务来说是冗余的。因此,需要对图像进行裁剪处理。具体来说,首先通过边缘检测算法找到有效图像的边缘,然后将图像四周多余的部分裁剪掉,只保留人脑所在400 mm×300 mm区域部分。减少计算量的同时,提高模型的训练速度和准确性。
2 算法原理
2.1 卷积神经网络
本文利用卷积神经网络(CNN,Convolutional Neural Network)实现脑CT影像的识别分类。CNN是一种深度学习模型,模仿生物神经系统的部分工作原理,采用卷积运算的机制,以处理像素或特征映射,能够自动学习和提取图像的特征,适用于处理复杂的图像识别任务,其整体结构如图3所示,分为卷积层(Convolutional Layer)、非线性激活层(Relu Layer)、池化層(Pooling Layer)和全连接层(Fully Connected Layer)。每个卷积层会从输入数据中学习一组特征映射(Feature Map),这些特征映射能够捕捉到输入数据的局部特征。池化层则对卷积层的输出进行下采样(Subsampling),以减少数据的维度和参数的数量,同时保持重要的特征不变。全连接层则用于将前面层次学习到的特征进行整合,以完成最终的脑CT影像的分类任务。
2.2 LeNet-5模型
LeNet-5模型,由Yann LeCun等[16]提出,是一个7层的神经网络,包括3个卷积层(C1、C3、C5)、2个下采样层(S2、S4)、1个全连接层(F6)。本文的脑出血识别模型正是基于LeNet-5的网络结构设计而来,如图4所示。
LeNet-5共有7层,输出对应2个类别的得分。LeNet-5中的每一层结构如:
1)C1层为卷积层,采用5×5的卷积核,共6个。
2)S2层为池化层,采用2×2的采样窗口,使用平均汇聚。
3)C3层为卷积层,采用5×5的卷积核,共60个。
4)S4层为池化层,采用2×2的采样窗口。
5)C5层为卷积层,采用5×5的卷积核,共1 920个。
6)F6层为全连接层,有100个神经元。
7)最后一层是输出层,由2个径向基函数(Radial Basis Function,RBF)构成。
2.3 评价指标
模型在测试集上的评价指标采用分类任务中常用的准确率(Accuracy,A)、召回率(Recall,R)、精准率(Precision,P)及F1分数(F1 Score,F1)评分。相关评价指标的计算式为:
A=(2)
R=(3)
P=(4)
F1=(5)
其中,FN、TP、FP和TN分别是假阴性(False Negative)、真阳性(Ture Positive)、假阳性(False Positive)和真阴性(Ture Negative)。
3 试验与结果分析
3.1 试验环境
本文所使用的操作系统为Windows11,算法开发工具为Jupyter Notebook,深度学习框架为Tensorflow 2.3版本。硬件配置采用第12代Gen Intel(R)Core(TM)i7- 12700H CPU处理器,NVIDIA RTX3060 16G显卡。
3.2 模型参数设置
网络的迭代周期设置为400,batch size设置为80。学习率设定使用指数衰减法,初始学习率设置为0.001,一阶和二阶矩估计的指数衰减率分别为0.9和0.99,模糊因子为1.0×10-8,优化器使用adam。
3.3 数据集划分
本文的数据集共有5 000份脑CT图像。这些脑CT图像包括脑出血和非脑出血两种类别,每类2 500份。将这两种类别数据划分为训练集(80%)和测试集(20%)分别为4 000和1 000份。训练集用于训练LeNet-5模型,测试集用于评估模型的性能。
3.4 结果与分析
模型在测试集上的混淆矩阵如图5所示,其中,纵轴代表真实的标签,横轴代表预测出的类别。位于左侧的四个方格中的数字表示某种样本被预测为不同类别的数量,右侧的条状图用于度量混淆矩阵中方格的灰度值。主对角线方格中的值越大,说明正确分类的样本越多,方格颜色越接近白色。其他方格中的数值越接近于0越好,说明错误分类的样本越少,方格颜色越接近黑色。本模型测试集共有1 000份脑CT影像,其中500个标记为脑出血的样本中,共有487个识别正确,13个识别错误;500个未出血样本中,共有471个识别正确,29个识别错误。
试验结果表明,本文所建立的脑CT影像识别分类模型的准确率达到了95.8%,评价指标如图6所示,脑出血与未出血两种类型的召回率分别是97.4%和94.2%,精准率分别是94.38%和97.31%,F1分数分别是95.87%和95.73%,证明了其在脑出血分类识别任务上的有效性。
4 结论
本文提出了一种基于卷积神经网络的脑出血CT影像的分类识别算法模型,经验证,敏感性为97.4%,特异性为94.2%,总准确率达到95.8%。首先,建立了CT影像的预处理机制,通过滤波、归一化等方法有效地克服了伪影造成的误差。其次,所建立的模型在脑出血分类识别任务上具有较高的准确性,为脑出血的早期识别和诊断提供了一种新的有效手段,减小放射科医师工作量的同时,最大程度降低人工误差造成的影响,有助于提高医疗服务的效率和质量。最后,进一步探索和挖掘CT影像中所蕴含的丰富信息,可为疾病的早期诊断、治疗方案制定及预后评估提供强有力的支持。
参考文献:
[1] 张添辉,刘舒珊,曾锦梁,等.人工智能在放射科阅片教学中的应用现状及前景展望[J].继续医学教育,2023,37(10):153-156.
[2] 孙欣乐,崔勇,翟彤彤,等.移动医学影像的现状与未来[J].磁共振成像,2022,13(12):163-170.
[3] 吴绯红,赵煌旋,杨帆,等.医学影像+人工智能的发展、现状与未来[J].临床放射学杂志,2022,41(4):764-767.
[4] CHESEBRO A G, AMARANTE E, LAO P J, et al. Automated detection of cerebral microbleeds on T2*-weighted MRI[J].Scientific reports,2021,11(1):1-12.
[5] ANKURAWARANON S, SANORSIENG N, UNSRISONG K, et al. A comparison of performance between a deep learning model with residents for localization and classification of intracranial hemorrhage [J].Scientific Reports,2023,13(1):1-10.
[6] 黄成健.基于深度学习的超急性期大面积脑缺血CT影像分析[D].深圳:中国科学院大学(中国科学院深圳先进技术研究院),2022:3-5.
[7] 冀俊忠,张梦隆,宋晓,等.基于多尺度超像素融合网络的脑CT图像分类方法[J].中国科技论文,2022,17(11):1173-1180,1187.
[8] 符帅.面向脑出血诊断任务的多类CT重建算法性能分析及出血识别方法研究[D].广州:南方医科大学,2022:1-5.
[9] 郑自鹏.基于全卷积网络的脑CT图像出血区域的分割和定位[D].武汉:华中科技大學,2022:3-6.
[10] 王娴.基于深度学习和CT影像的颅内出血亚型分类及定位研究[D].重庆:重庆理工大学,2022:2-4.
[11] 周正松,陈旭淼,张皞宇,等.改进型Unet网络在脑CT图像出血区域识别与分割中的应用[J].四川大学学报(医学版),2022,53(1):114-120.
[12] RASHID T, ABDULKADIR A, NASRALLAH I M, et al. DEEPMIR: a deep neural network for differential detection of cerebral microbleeds and iron deposits in MRI[J].Scientific reports,2021,11(1):1-14.
[13] ARAB A, CHINDA B, MEDVEDEV G, et al. A fast and fully-automated deep-learning approach for accurate hemorrhage segmentation and volume quantification in non-contrast whole-head CT[J].Scientific Reports,2020,10(1):1-12.
[14] 冯玄.基于CT图像的脑出血检测方法研究[D].南京:南京邮电大学,2021:1-6.
[15] 赵凯.基于深度学习的脑出血自动分类与扩大预测研究[D].太原:太原理工大学,2021:3-4.
[16] LECUN Y, BOTTOU L.Gradient-based learning applied to document recognition [J].Proceedings of the IEEE, 1998,86(11):2278-2324.