基于SPECT全身骨扫描的YOLOv5x深度学习网络模型诊断良、恶性骨病灶
2024-01-05李宗霖连世东
李宗霖,赵 峥,连世东
(广西医科大学第二附属医院核医学科,广西 南宁 530000)
骨转移是恶性肿瘤晚期常见转移方式之一[1],尽早诊断并治疗骨转移可明显提高晚期肿瘤患者生存质量[2]。全身骨扫描是影像学诊断骨转移的首选方法[3],近年来应用逐渐增多[4], 其敏感度较高但特异度较低[5],需由经验丰富的医师结合病史、实验室检查及其他影像学资料进行综合评估。随着计算机相关算法的创新,人工智能(artificial intelligence, AI)在CT[6]及MRI[7]等医学影像学辅助诊断领域取得了较佳进展。研究[8]证明,以AI辅助诊断不仅可提高诊断效率,还能提升医师、特别是低年资医师的诊断敏感度及准确率,但目前用于全身骨扫描的AI辅助诊断模型较少。本研究基于SPECT骨扫描构建YOLOv5x深度学习网络模型,观察其用于诊断良、恶性骨病灶的价值。
1 资料与方法
1.1 研究对象 回顾性分析2018年9月—2019年9月广西医科大学第二附属医院699例接受SPECT骨扫描患者,男296例、女403例,年龄31~98岁、平均(64.2±10.4)岁;共5 182处骨病灶,恶性3 105处、良性2 077处。排除标准:①特殊原因所致SPECT异常浓聚,如尿液污染、肢体残缺及注射点严重漏药等;②超级骨显像;③原发性骨恶性肿瘤或多发性骨髓瘤;④2名核医学科主任医师判断病灶性质不统一,且不能通过病史、实验室检查及其他影像学检查确定。本研究通过院伦理委员会批准(YN2021-048-01)。
1.2 仪器与方法 采用GE Hawkeye4双探头SPECT/CT,配置低能高分辨准直器。于经肘静脉注射99Tcm-亚甲基二磷酸盐(methylene diphosphonate, MDP)740~925 MBq后2~4 h行SPECT全身骨扫描;参数:能峰140 keV,窗宽20%,矩阵256×1 024,采集速度10~20 cm/min,放大倍数1.0。以DICOM格式储存原始图像,于GE Xeleris3工作站进行预处理,将所有图像转为无损JPG格式,调节图像对比度、亮度,并进行归一化处理。
1.3 金标准 由2名核医学科主任医师根据SPECT骨扫描图像,结合病史、实验室检查、其他影像学检查、病理结果及随访资料评估骨良、恶性病灶,并采用LabelImg软件进行标记。判断恶性骨病灶:明确恶性肿瘤病史,骨扫描图像可见异常浓聚点,且CT/MRI/病理提示骨转移瘤或随访半年以上病灶有所进展;判断良性骨病灶:外伤、手术、炎症或退行性病变等引起的SPECT异常浓聚,且CT/MRI/X线亦提示为外伤、手术、炎症或退行性病变等,或随访半年以上病灶无进展/消失。
1.4 构建AI模型 按8∶1∶1将1 121幅骨扫描图像分为训练集(n=897)、验证集(n=112)或测试集(n=112),采用翻转、镜像及旋转方法将训练集及验证集数据扩增4倍(n=3 588、448)。见图1。采用YOLOv5x目标检测深度学习网络(图2)构建AI模型,根据网络深度及宽度由小到大将其分为S、M、L、X,其深度分别为0.33、0.67、1.00及1.33,宽度分别为0.50、0.75、1.00及1.25。利用“补0法”将训练集及验证集图像由256×1 024调整为网络推荐输入图片大小(640×640),将其输入网络进行训练;网络输出模块分别采用80×80、40×40、20×20矩阵评估骨扫描图像中不同部位(头颈、胸廓、脊柱、骨盆、四肢)骨病灶的良、恶性(图1)。采用Python 3.8.8语言编程,以Pytorch为深度学习框架,代码运行环境为Windows 10系统,应用NVIDIA-V100-32GB图形处理器、8核64 GB中央处理器;设置超参数:初始学习率为0.01,batch-size为16,epochs为500轮,Img-size为640×640,workers为8。
图1 构建YOLOv5x深度学习网络模型的流程图
图2 YOLOv5x深度学习网络结构 Focus结构是YOLOv5网络中的特殊下采样方法,可将高分辨率图片拆分为多个低分辨率图片后再行下采样,以减少图像信息丢失;分别在YOLOv5主干网络和提取特征网络中加入不同结构的跨阶段局部(cross stage partial, CSP)网络,以增强其学习能力
1.5 统计学分析 采用Python 3.8.8统计分析软件。以混淆矩阵计算模型预测骨扫描图像中良、恶性病灶的敏感度、特异度及准确率。绘制受试者工作特征(receiver operating characteristic, ROC)曲线,计算曲线下面积(area under the curve, AUC)。采用Kappa检验评估模型诊断结果与金标准的一致性,以Kappa>0.8为一致性好。P<0.05为差异有统计学意义。
2 结果
骨扫描YOLOv5x深度学习网络模型识别恶性骨病灶的敏感度为95.75%、特异度为87.87%、准确率为91.60%,识别良性骨病灶分别为91.62%、94.38%、93.14%;对不同部位骨病灶的敏感度、特异度及准确率均≥85.00%。见表1及图3。
表1 YOLOv5x深度学习网络模型识别不同部位骨病灶的效能(%)
图3 患者男,58岁,肺癌伴骨转移,骨扫描图像 红色示胸、腰椎及骨盆多发恶性骨转移灶,绿色示右膝关节退行性变;M代表转移灶,B代表良性病灶;数字代表置信度
模型识别骨病灶的AUC为0.98,识别恶性、良性骨病灶的AUC分别为0.97、0.98;见图4。模型诊断恶性及良性骨病灶结果与金标准的一致性均好(Kappa=0.83、0.86,P均<0.05)。
图4 YOLOv5x深度学习网络模型识别骨病灶的ROC曲线
3 讨论
计算机辅助诊断骨扫描图像中的病灶为核医学领域研究热点之一。在深度学习网络之前,已有研究采用自适应阈值[9]等传统图像处理或支持向量机[10]等机器学习方法构建辅助诊断模型,但计算时间较长、敏感度和特异度不高,未能广泛用于临床。
基于大样本数据利用计算机自动提取图像深层次抽象特征、采用深度学习网络构建模型,可为辅助诊断骨扫描图像中的病灶提供新的方向。PAPANDRIANOS等[11]采用图片分类深度学习网络构建的诊断前列腺癌骨转移的AI模型可判断骨扫描图像所示病灶的良、恶性,其准确率及敏感度分别为97.38%和95.80%,但不能在图中加以标记,导致诊断价值有限。CHENG等[12]采用YOLOv4深度学习网络构建分类诊断骨扫描图像中胸部骨转移灶的模型,在由205例前列腺癌组成的数据集中,该模型识别骨良、恶性病灶的准确率和敏感度分别为(90±4)%和(72±4)%。刘思敏等[13]采用深度残差卷积神经网络Res-Net34构建分类诊断骨转移瘤良、恶性的分割模型,其敏感度、特异度分别为92.59%、85.51%,该研究每例纳入经过工作站手动后处理的前、后位共4幅图像,或对模型普适性存在一定影响。PI等[14]与ZHAO等[8]均通过自行编写卷积神经网络构建模型识别全身骨扫描图像中的恶性骨病灶,其敏感度分别为93.20%、93.40%。本研究建立的深度学习模型可识别骨扫描图像中较多部位病灶,且针对胸部区域骨病灶的准确率(92.95%)及敏感度(98.44%)高于CHENG等[12]的结果,可能原因在于利用YOLOv5x网络可获得深度及宽度更大的特征图,所获模型识别恶性病灶的敏感度(95.75%)更高,且可识别良性骨病灶,从而更好地辅助医师诊断。
本研究所获模型诊断结果与根据金标准诊断结果的一致性好,即模型识别脊柱、胸廓、骨盆恶性病灶的敏感度较高;但其特异度相对较低,与上述3个部位骨转移率高而良性病灶较少有关;模型识别四肢良性骨病灶的敏感度较高、特异度较低,与四肢关节高发骨关节退行性变的特点相符;识别头颈部良、恶性骨病灶的敏感度及特异度均低于90.00%,可能与头颈部病灶数量较少有关。
综上,本研究基于SPECT全身骨扫描建立的YOLOv5x深度学习网络模型有助于诊断良、恶性骨病灶。本研究的主要不足:①为单中心回顾性研究;②未测试模型的普适性及鲁棒性;③所获模型不能用于评估恶性肿瘤患者骨转移程度及预测生存期。未来可与图像分割网络相结合开发性能更佳的预测模型。