人工智能在脊柱诊疗方面的应用进展

2022-11-21赵伟丽张恩龙刘珂王奇政陈永晔袁慧书郎宁

磁共振成像 2022年6期

赵伟丽，张恩龙，刘珂，王奇政，陈永晔，袁慧书，郎宁*

人工智能(artificial intelligence，AI)主要指机器学习(mechine learning，ML)，而深度学习(deep learning，DL)是ML的一种类型，主要包括支持向量机(support vector machines，SVM)、随机森林(random forest，RF)、人工神经网络(artificial neural network，ANN)等方法，通过建立DL模型可以达到对疾病进行自动定位和检测，并对病变进行评估，预测患者的预后[1]，在做到诊断准确率、敏感度及特异度与临床医生相当甚至超过的情况下，保证诊断的一致性和客观性，同时简化临床医生重复的工作。因此，AI以其简便快捷、可重复性高等特点，在全身各系统病变影像领域中的应用日趋广泛。本文通过分析国内外文献，总结当前AI在脊柱疾病应用领域方面的应用并进行综述。

1 脊柱良恶性骨折

椎体骨折(vertebral fractures，VFs)是患者下腰痛的重要病因之一，延迟诊断可导致截瘫甚至死亡，使预后恶化。胸腰椎X线平片(plain thoracolumbar radiography，PTLR)是评价VFs使用最广泛的方法，因此尽量减少PTLR上VFs的诊断误差在初级诊疗中十分重要。Murata等[2]采用300例VFs患者的PLTR图像建立深度卷积神经网络(deep convolutional neural network，DCNN)的图像识别算法以检测VFs，达到了准确率86.0%、敏感度84.7%，二者均不低于骨科医师。此研究虽达到诊断的目的，但是VFs的程度及其导致的不稳定性却未进行评估，在未来的研究中需不断探索PTLR作为一种骨折筛查的简便方法的更多临床应用价值。

VFs主要是因创伤和骨质疏松导致的良性骨折和肿瘤浸润所致的恶性病理性骨折，临床需要准确判别病因以确定治疗策略。Ulivieri等[3]建立用于识别双能X射线吸收仪的骨应变指数的骨质疏松症脆性骨折预测模型来表征易于进一步发生骨折的患者，此模型准确率、敏感度和特异度分别为79.36%、75%、83.72%。恶性肿瘤的特征在CT上可很好显示，但与良性疾病合并时却无法准确区分。Li等[4]应用ResNet 50的自动DL算法进行CT图像上良性和恶性骨折的鉴别，结果显示诊断敏感度、特异度和总体准确率分别为95%、80%、88%。但因需要限制混杂因素的影响，此研究中恶性骨折只纳入脊柱转移瘤作为代表，对于其他肿瘤导致的骨折缺乏适用性，未来的研究可以此研究为基础，扩展病例种类和数量，开发应用性更为广泛的AI模型。

经皮椎体成形术是VFs的重要治疗方式之一，Auloge等[5]使用融合了增强现实(augmented reality，AR)和AI 的新型导航工具在术中的经椎弓根入路阶段进行辅助导航，并将AR/AI引导方式(A 组)与标准透视引导方式(B 组)比较进行了前瞻性平行随机开放试验。结果显示A组10例患者全部成功识别椎骨/椎弓根并生成安全的术中轨迹，技术可行性达到了100%，并在保证了与B 组套管针放置的精度相似的情况下将患者的辐射剂量减少了50%。与标准透视相比，采用AI 辅助引导的方式更加准确、安全。但此研究的小样本量限制其临床普适性，同时对于手术并发症缺乏评估，需要在扩大样本量的基础上加强临床随访，验证技术的可行性。

2 脊柱退行性疾病

脊柱退行性疾病主要因脊椎的椎间盘(intervertebral disc，IVD)退行性改变及其继发病理改变累及周围组织结构而出现相应的临床表现，是导致中老年人生活质量下降的常见疾病[6]，通过采用AI 的方法可以帮助临床医生对不同的退行性脊柱疾病进行疾病诊断并做到精准治疗。

2.1 腰椎间盘突出

腰椎间盘突出症(lumbar disc herniation，LDH)通常是由于直接压迫椎管而造成的神经损伤所致，放射科医生需要对每个腰椎进行标记以进行病因诊断，此过程冗长、容易出错且重复性有限，因此自动检测和定位椎体在LDH 的诊疗中发挥重要作用。Zhou 等[7]应用卷积神经网络(convolutional neural network，CNN)并采用迁移学习的方法自动定位从L1到S1的腰椎，其优势在于不使用带标记的MR图像来训练图像，并且该研究的算法达到了最高98.6%的准确率。Li等[8]研究了一种基于全卷积网络(fully convolutional networks，FCN)的多模态3D MR 数据进行IVD 自动定位和分割的方法，此方法平均分割Dice 系数为91.2%，分割精度明显提高，同时，平均定位误差仅为0.62 mm，采用随机模态体素丢失的策略也提高了神经网络的识别能力。Gao 等[9]运用PPR (push-pull regularization)的策略提高CNN 模型的表现能力。结果显示，使用PPR的不同网络结构IVD的平均分类准确率提高了8%以上。这不仅为IVD 退变的自动分级提供了有效、准确的方法，也为其他疾病因具有相似性的特征而自动分级有困难的问题提供了一种解决方式。由此表明，由AI 算法支持的腰椎自动标记与分割有助于辅助医生进行重复性的基础工作，并且随着研究的不断发展，对于病变程度的评估也越来越精确。

经皮内窥镜腰椎间盘切除术(percutaneous endoscopic lumbar discectomy，PELD)是LDH 的主要治疗方法，而经皮内窥镜经椎间孔腰椎间盘切除术(percutaneous endoscopic transforaminal discectomy，PETD)具有出血少、切口短的优点，但因腰椎局部骨质构造(棘突、小关节、横突等)复杂，故手术难度较高。因此，Fan等[10]回顾性分析共31例腰骶CT数据，通过训练3D U-net实现L5/S1水平局部的骨质构造的自动分割，同时进行三维重建和椎间孔成形术模拟操作以判断PETD手术难度。结果显示，Kambin三角面积在DL-3D (deep learning-derived 3D)模型和GT-3D (ground truth-derived 3D)模型上相似(P=0.206)，且重测信度和观察者间测量值可靠性均较高。Harada等[11]通过使用Python的XGBoost分类器建立预测模型识别PELD术后腰椎间盘再突出风险的患者并发现BMI在内的一系列潜在危险因素，此模型代表预测概率与真实结果差异的Brier分数仅为0.21。通过将AI模型应用于LDH患者的手术，不仅可改善手术效果，而且可对术后并发症的危险因素提早干预，改善患者预后。

2.2 腰椎管狭窄症

腰椎管狭窄症(lumbar spinal stenosis，LSS)的诊断和评估主要依靠临床症状、电生理和影像学检查，腰椎MRI 因其可同时提供病因和严重程度的信息而成为LSS 最常使用的影像学方法，但是医生对于每个椎管结构狭窄程度的详细描述是耗时的，并且尚无一种标准化的分级体系对LSS进行描述。

Li 等[12]建立一个双分支多尺度CNN 模型——MANet 用于自动分割椎体、椎板和硬膜囊，上、下级分支分别进行特征提取和关键信息筛选，充分利用采用多尺度方式所提供的脊柱图像信息。结果显示，MANet模型的Dice相似系数达到92.52%，平均表面距离仅为2.71 mm，并且与人工标注结果较为符合。Won 等[13]以及Hallinan 等[14]均采用建立双组分DL 模型的方法，首先建立一个基于CNN 的检测器用于定位中央管、侧隐窝、椎间孔区域，其次采取一个基于CNN 的分类器用于预测所定位区域的狭窄分级。通过对比分析，双组分DL 模型预测能力与放射专家的分级结果相当，实现了椎管狭窄的自动检测和分级。以上研究表明，DL 方法有望成为临床医生诊断和评估LSS的有效辅助工具。

LSS 合并退行性腰椎滑脱患者的外科治疗有很大的实践差异，因为仅用减压治疗的患者中只有30%会出现延迟不稳定，所以很多患者进行手术减压以减轻神经压迫症状时不需进行腰椎融合。因此，Ghogawala 等[15]通过使用AI 的方法，从数据库选择大量真实临床数据建模以预测影响外科医生决策的因素，在数据量增加的同时保证提高准确率，给出一个可以在临床中实践的诊断建议方法，初步确定上述30%的患者在单纯椎板减压切除术后会出现延迟不稳定，选择最佳的患者进行腰椎器械融合，从而改善手术结果。

2.3 脊髓型颈椎病

脊髓型颈椎病(cervical spondylotic myelopathy，CSM)的病理主要为脊髓病变和神经束微结构损伤，精确检测此种病变的一种方法为扩散张量成像(diffusion tensor imaging，DTI)，但是临床医生利用DTI 诊断和评价CSM 在临床中是一个技术挑战。

Wang 等[16]将脊髓截面白质ROI 部分的背侧、外侧和腹侧分为5种体素数据集，使用SVM、支持张量机、贝叶斯算法对健康对照组和CSM 组进行分类，并比较DTI 扩散指数对CSM 的检测效率。结果显示，使用60 个体素数据的SVM 分类器的准确率、敏感度和特异度最高(分别为95.73%、93.41%、98.64%)，相较于传统上基于感兴趣区域平均值(准确率81.52%，敏感度54.33%，特异度92.43%)表现出更多特征，因此利用ML 技术可为CSM 的分类提供一个强有力的工具。手术减压被认为是CSM患者缓解脊髓压迫的最直接方法，准确的术后评价将指导外科医生选择最合适的治疗方案。Jin 等[17]通过综合分析包括压迫最严重的颈椎水平在内的全部颈椎水平的脊髓内部组织的信息，比较全脊髓和感兴趣区域的DTI 特征。结果显示基于感兴趣区域的所有颈椎层面比传统的基于全脊髓的压缩最严重的颈椎水平的DTI 特征更有效(准确率分别为89.7%±1.6%、66.2%±3.4%)，并且这些DTI 特征可以通过使用径向基函数SVM 的AI 框架成功地进行分析(准确率为89.7%±1.6%)。Khan 等[18]回顾性分析了757 例因CSM 而接受手术减压患者的数据，使用手术前和手术后1 年的改良日本骨科协会(modified Japanese Orthopedic Association，mJOA)评分评估功能状态，根据1 年后mJOA 是阴性(功能状态更差)或非阴性进行衡量。结果显示，多项式SVM为最佳ML算法，曲线下面积(area under the curve，AUC)为0.834。同时，最初的mJOA 评分、性别、CSM 病程以及是否存在合并症是CSM 术后1 年后功能是否恶化的重要预测因素。此外，Zhang 等[19]利用CSM 患者术前轴位T2*WI 影像提取放射组学特征并建立ML 模型预测CSM术后脊髓功能。研究显示，线性SVM预处理+SVM模型具有最佳性能(AUC为0.74±0.08)，且优于最佳传统放射学模型(AUC 为0.53±0.09)。这些研究表明，AI 方法对CSM 术后效果的预测是可行和有效的，并且能够与放射组学相结合处理其提取的特征并建立预测模型，确定相关预测因素。

3 脊柱肿瘤

脊柱肿瘤可分为良性、恶性的二分类以及良性、转移及原发恶性的三分类，每种分类方法对临床的意义不同。Chianca等[20]采用DL方法建立上述脊柱肿瘤二分类模型和三分类模型，结果显示，DCNN为最佳二分类模型且准确率达到90%以上，有望取代有创的经皮穿刺活检方法。但三分类模型结果较差，这也表明了肿瘤的异质性大的特点。与此同时，针对不同肿瘤患者治疗方式的差异也较大。这些肿瘤临床特点对AI 模型的建立和应用都提出了巨大的挑战。

3.1 脊柱原发性肿瘤

脊柱原发性肿瘤在脊柱肿瘤中少见，其中较为常见的肿瘤包括骨巨细胞瘤、脊索瘤和各种肉瘤。骨巨细胞瘤易复发，术前预测肿瘤的复发可能性有助于在积极切除肿瘤组织和术后保持良好生活质量之间选择最佳治疗。Wang 等[21]应用SVM选择基于从脊柱骨巨细胞瘤术前CT 提取的影像学特征，包括4个一阶直方图参数和6个纹理特征，以此构建高斯核分类模型，采用10倍交叉验证的受试者工作特征(receiver operating characteristic，ROC)曲线分析来区分复发和非复发病例。结果显示所有10 个特征的最终预测模型的AUC 为0.78，总体预测准确率为89%，表明此模型可有效地预测脊柱骨巨细胞瘤的早期复发。Karhade 等[22]在2018 年首次将AI 用于脊索瘤研究，他们开发了用于预测脊索瘤生存期的ML 模型，将确诊年龄、肿瘤大小、位置和浸润范围、手术范围作为预测变量，结果显示贝叶斯点机模型在识别(AUC=0.8)和校准(斜率=1.01)方面有最佳性能。Ryu 等[23]通过使用多模态算法训练和验证风险估计距离生产神经网络来预测脊柱—骨盆软骨肉瘤诊断后的生存率。结果显示，不同训练验证组和测试组之间的一致性指数和平均AUC均达到0.8以上。并且，研究者们将患者按照不同的估计生存概率分为5 个预后亚组，在围手术期识别这些亚组在预测患者存活率的同时也有利于治疗方式的选择。

3.2 脊柱转移瘤

脊柱转移瘤是脊柱最常见的恶性疾病，由于骨转移患者的中位生存期少于6 个月，所以骨转移成为大多数癌症患者的死亡原因，因此对脊柱转移瘤的准确诊断和治疗就显得尤为重要。

Wang等[24]通过使用Siamese深度神经网络方法对26例脊柱转移瘤患者进行分析，验证在MRI中自动检测脊柱转移瘤的可行性，结果显示通过该方法检测脊柱转移病灶的正确率达到100%。Liu等[25]建立RF预测模型用于预测甲状腺癌骨转移的高危患者，结果显示RF模型的预测能力优于传统的Logistic回归模型。不仅提高了甲状腺癌患者骨转移的诊出率，而且有助于替代成本高、特异度低且辐射量大的骨扫描检查方法。

但是脊柱转移瘤患者中大约30%表现为未知的原发性，若能准确预测转移瘤的起源，有助于确定最合适的成像方法来定位原发肿瘤，选择最合理的治疗方法。在所有表现为脊柱疼痛且原发癌部位不明的患者中，肺癌骨转移是最常见的。Lang等[26]应用动态增强MRI回顾性研究了61例之前没有肿瘤诊断史但后来证实有转移的患者(30例肺癌，31例非肺癌)，采用CNN来区分来源于肺癌和其他非肺来源肿瘤的脊柱转移瘤，结果表明使用整个DCE图像集的DCNN的诊断准确率可达到81%。TNM分期系统是一种基于病理解剖的预测工具，但是也有相当数量处于相同阶段的患者的预后明显不同。Huang等[27]纳入5973例骨转移的非小细胞肺癌患者，选择多种临床学参数并使用XGBoost算法、RF、SVM和Logistic算法生成预测模型，通过使用ROC曲线比较各种模式的性能。结果显示，与其他模型相比，XGBoost模型在训练集和验证集上显示出更好的可靠性和准确性(训练集、内部验证集和外部验证集的AUC 分别为0.792、0.786和0.764)，可用于预测非小细胞肺癌伴骨转移的一年死亡率。同时，XGBoost模型可以应用于医疗信息系统，作为一种实用的临床预测模型，帮助临床医生制订更佳的治疗方案。

手术和放射治疗是脊柱转移瘤的主要治疗方法[28]。脊柱转移瘤手术预后的影响因素多样。Massaad等[29]试用RF、最小绝对收缩和选择算法回归、梯度提升决策树三种DL 模型对转移性脊柱肿瘤脆弱指数(the metastatic spinal tumor frailty index)包含的预测因子进行建模以预测术后主要并发症、住院死亡率和住院时间，但每种模型的AUC 仅分别为0.62、0.53、0.54，且每种预测变量重要性分布不同，其原因可能与不同原发肿瘤类型有关。由此表明虽然DL 方法可对复杂临床数据进行分析以提高预测精度，但是模型的应用程度更需结合临床考虑。随着技术的进步，脊柱转移瘤的精准放射治疗并最大程度地保护周围正常组织成为临床医生的一大目标，而其基础则为脊柱结构准确的勾画。Arends 等[30]采用多尺度CNN 模型在CT 图像上进行胸腰椎椎体的分割和标记，Dice 相似系数、Hausdorff 值在内部和外部验证中分别为97%和95%、3.6 mm 和4.5 mm，达到比以往研究更高的准确率，有利于脊柱转移瘤放射治疗计划的精准制订，改善患者的预后。

4 脊柱畸形

脊柱畸形(spine deformity，SD)包括一系列复杂畸形的脊柱疾病，患者的临床表现和治疗方案的异质性显著。

一般Cobb 角＞10°被认为对脊柱侧凸的诊断具有临床意义，X 线片是其经济直观的影像学评估方法。但人工测量Cobb角十分耗时，因此可利用AI的方法提高脊柱侧凸的诊断效率。Wu 等[31]提出一种结合正位和侧位X 线片MVC-Net 的AI结构网络，此网络由一系列联合表示脊柱结构的X-模型、脊柱标志点估计器和Cobb 角估计器构成，通过对526 张X 线片进行实验，结果表明MVC-Net在正、侧位上的Cobb角的平均绝对误差均仅为4°，具有较高的鲁棒性和准确性。但因椎体退化的改变会导致脊柱标志点的变化，故此模型不适合于椎体边缘骨赘增生的老年患者。Pan 等[32]选取248 张肺癌筛查患者的胸部X 线片，采用两个Mask R-CNN 模型分别对脊柱和所有椎体进行检测和分割，根据模型的输出测量脊柱曲线的Cobb角，并与2 名经验丰富的放射科医生手工测量的结果进行比较，显示出较高的组内相关系数(0.854)和诊断敏感度(89.59%)，平均绝对差值也仅为3.32°，但此模型的诊断特异度较低(70.37%)。Ha 等[33]利用Resnet 101 模型生成自动检测胸腰椎椎体的包围盒，之后通过脊柱定位算法提取Cobb 角。结果显示，自动检测椎体的IoU得分为0.83、Dice相似系数为0.9，Cobb 角测量结果的平均绝对角度差为7.34°，达到了以较高准确度实现Cobb角自动化测量。

Durand等[34]通过一项多中心连续队列的回顾性分析以建立基于放射学和临床数据的AI 模型来区分需接受手术或非手术治疗的患者。此研究纳入1503例成年SD患者，接受手术治疗的患者被定义为在基线检查后1 年内接受手术的患者，按7∶3分开进行训练和测试，并纳入321个潜在的临床和放射学相关预测因素，训练不同AI模型并进行比较，结果显示SVM模型的性能良好，准确率为86%。此外，Ames 等[35]建立以AI 为基础的层次聚类识别数据模式，使用无监督的ML 方法将患者根据包括放射学在内影响手术的不同因素进行分组并选择合适的手术方式，构建一个为期两年的风险-收益网格来增强术前决策，使治疗模式在风险最低的情况下产生最佳改善，从而促进治疗优化。但是，手术组数量会随着患者样本量的增加和手术方式而有所不同，且分类方法和AI 模型都不是一成不变的。随着数据进一步积累和手术方式的变化，现有模型需与更加客观的标准进行比较以达到改进的目的。

5 总结与展望

脊柱疾病是由许多不同致病因素相互作用导致的最终结果，AI 能够通过ANN 建立各种分析多个具有不同临床意义的变量构成的非线性模型，辅助临床医生对脊柱疾病进行诊疗。但现有的AI 模型对疾病的复杂性、治疗方式的多样性的分析与医生相比尚有一定差距，诊断特异度不高，并且在基层医疗的实用性低。同时，高质量的数据和经过严格测试的DL 算法是脊柱影像研究中所必需的[36]。针对现有应用于脊柱疾病的AI 模型的构建大多是在回顾性研究基础上的问题，未来研究重点需放在通过更多的前瞻性临床试验以验证现有AI 模型的临床实用性，不断对模型进行改进。随着信息数据化和数字医疗的不断进步，在保证对病人和临床医疗软件的正确管理和应用的基础上，AI 也将使不同脊柱疾病的精准化和标准化的综合诊疗与分析得到改善。

作者利益冲突声明：全部作者均声明无利益冲突。