第107届北美放射学会年会亮点：人工智能

2022-11-21林洁琼黄燕琪梁长虹曾洪武

磁共振成像 2022年3期

林洁琼，黄燕琪，梁长虹*，曾洪武

作者单位：1.深圳市儿童医院放射科，深圳518038；2.汕头大学医学院，汕头515041；3.广东省人民医院放射科，广州510080

2021 年北美放射学会(Radiological Society of North America，RSNA)年会的主题是“Redefining Radiology (重新定义放射学)”，大会以线上和现场相结合方式举行。席卷全球的COVID-19疫情，加剧了放射科工作负荷沉重、人员储备缺乏、医疗资源不均等问题。人工智能(artificial intelligence，AI)不断迭代升级，应用更加广泛，逐渐为人们所接受，也在重新定义放射学时起着举足轻重的作用，促使放射医生重新思考自身价值。正如大会主席，来自美国俄亥俄州辛辛那提大学医学院的放射学教授Mary C. Mahoney 指出，新技术正在改进我们的工作流程，从而让我们更加专注于患者本身。

1 新技术与新算法

1.1 联邦学习

为确保人工智能方法的鲁棒性和通用性，AI 研究往往需要多中心、海量、高质量附带标注的图像数据。开放存取数据库是提供符合条件数据的关键，然而，在当前多中心协作模式下，各种因素(例如数据所有权和法律考虑)阻碍了对此类数据的访问[1]。为此，新的方法，联邦学习(federated learning，FL)应运而生，用于多中心共同训练AI 模型。FL 是数据私有多站点协作的一种新范式，可以看作是一种分布式机器学习框架。通过加密机制下的参数交换方式，AI 利用各参与站点的可用数据进行模型构建和优化(而并非在它们之间共享数据)[2]，在不违反数据隐私法规情况下，旨在破解“数据孤岛”难题，实现数据“共同富裕”的目标。

美国宾夕法尼亚大学生物医学影像计算与分析中心的Sarthak Pati 等采用联邦学习对23 个中心2200 例脑肿瘤的MRI 图像进行脑肿瘤边界的量化和检测。基于联邦学习多中心数据构建的共识模型与公开的BraTS 数据训练模型相比，前者对每个合作者验证数据的准确性提高了11.1%。在该模式中，参与站点间没有数据共享，最终的联邦肿瘤分割(federated tumor segmentation，FeTS)模型将公开供进一步研究和分析使用。FeTS可以利用地理位置不同合作者的数据来训练AI 模型，而无需共享数据，从而克服法律、所有权和技术方面的障碍。

慕尼黑工业大学的Shadi Albarqouni 等基于联邦学习对多个中心的CT 和MRI 数据进行多模态肝脏图像分割，对比FedNorm、FedAvg、FedAvgM、FedVC、FedBN 和SiloBN 等不同联邦学习算法，证实了FedNorm 训练准确肝脏分割模型的表现远远优于其他联邦学习算法，且该算法可以用于包括肝癌检测、肝脏年龄预测等临床评估。联邦学习允许融合在不同数据集上创建的AI 模型，能够在不移动数据或侵犯患者隐私的情况下，实现跨中心的数据分析。这种利用更大范围、更多样化数据集的方法使基于AI 的解决方案能够以前所未有的速度在全球推广。

1.2 跨中心迁移学习

迁移学习(transfer learning，TL)的概念于20 世纪90 年代在计算机领域被提出，即将训练好的模型参数迁移到新模型中，加快优化新模型的学习，旨在克服训练集与测试集数据分布不同情况下模型准确性不高的问题[3-4]。基于新冠疫情在全球快速蔓延和共享医疗数据难题，跨多中心迁移学习优化AI 模型具有重要意义。美国威斯康星大学麦迪逊分校医学物理系的Xin Tie 等使用公开的胸部X 线数据库，NIH、Henry Ford 卫生系统以及西班牙的BIMCV 库，构建区分COVID-19 高危病例与非COVID-19 患者的二元分类模型。研究者使用NIH 数据集进行预训练，Henry Ford 模型在内部测试集和外部测试集上的受试者工作特征曲线下面积(area under curve，AUC)较未经预训练的模型显著提高。在从Henry Ford 模型到西班牙模型的迁移学习中，使用Henry Ford 数据集进行预训练，使用西班牙数据集的不同训练数据集，AUC 从0.01 提高到0.03。该研究为使用多中心数开发AI模型提供了新思路。

1.3 AI辅助优化图像质量

在影像领域，AI辅助下新算法不断涌现，旨在减少图像噪声和伪影，提高空间分辨率，缩短扫描时间，改善图像质量。卷积神经网络(convolutional neural network，CNN)最早由LeCun等[5]在1989年提出，近年一跃成为医学图像处理领域的热点。作为一种多层前馈神经网络，每一层中包含大量可被学习的参数，能完成从输入到输出的复杂映射[6]。美国梅奥诊所的Scott Hsieh 等采用CNN 降低高分辨率光子计数探测CT(high-resolution photon-counting-detector CT，HRPCD-CT)肾结石图像噪声，分析结石成分。制造置入混合成分结石的人形水模，使用HRPCD-CT 进行高剂量(CT 剂量指数CTDIvol=30 mGy)扫描，生成噪声训练集训练CNN模型，应用于常规剂量(CTDIvol=7.5 mGy)结石图像。在能量集成探测双源CT(energy-integrating-detector CT，EID-CT)和HRPCD-CT 上以相同剂量进行扫描及结石成分分析，内部结石定量分析软件评估伪影。经CNN处理图像噪声减少了90%，基于AI的降噪和反卷积HRPCD-CT 在常规辐射剂量下能准确描述肾结石成分。

美国梅奥诊所Nathan Huber 团队采用CNN 对HRPCD-CT胸部图像进行降噪处理。每幅原始图像用滤波反投影(filtered back projection，FBP)和迭代重建(iterative reconstruction，IR)行0.2 mm薄层重建，减除FBP和IR重建，生成纯噪差分图像，高通滤波器去除低频解剖结构；对相邻红外图像取平均，模拟厚层(1.0 mm)获得相对低噪声信号参考图像；将叠加在红外信号参考图像上的纯噪数据输入CNN 模型，处理后的CNN应用于原始薄层和FBP重建图像，CNN框架降低了81%±2%的噪声，且保留细支气管结构。该技术可以在不牺牲空间分辨率的情况下减少噪声。

AI辅助量化图像质量也值得关注。麻省总医院和哈佛医学院附属布莱根妇女医院的Bernardo Bizzo 等采用机器学习模型检测和量化颅脑MRI 运动伪影，并在多中心间测试。利用四种人工神经网络构建XGBoost 集成模型，并比较放射医生和模型评估运动伪影严重程度的差异。模型可准确检测出多个中心的运动伪影及其严重程度，能够准确检测和量化不同MR扫描仪和序列的运动伪影，提示AI可以帮助技术员在出现运动伪影时自动重新获取特定MRI 序列，有助于阅片诊断时区分伪影和病灶。

加州大学洛杉矶分校的Suzie Bash等比较常规MRI序列和基于快速深度学习MRI序列采集的MRI图像，采用李克特五点量表对图像信噪比、清晰度、伪影、病灶显著性、图像对比度和灰白质对比进行评级。快速深度学习在以上成像特征的感知质量优于常规序列，且扫描时间减少60% (P均＜0.05)，两组数据定量数据具有良好一致性。因此，基于深度学习的MRI有望有效缩短扫描时间。

2 新概念：“影像-生理年龄”

年龄常作为疾病风险评估的风险因素之一，但通常“时间年龄”有时难以真实反映机体生理状态。研究表明，随年龄增长，通过DXA 测量得到的皮质骨矿物质密度减低，通过高分辨率外周定量CT (high-resolution peripheral quantitative computed tomography，HR-pQCT)计算得到的皮质孔隙度增加[7-8]，这提示从常规影像提取的数据能够侧面反映年龄带来的机体微观改变。本次RSNA 年会有研究提出基于影像数据的“影像-生理年龄”，旨在更精确反映机体病理生理状态，评估年龄相关风险。美国马萨诸塞州总医院的Vineet Kalathur Raghu 等利用全身双能CT 数据，基于双能X线吸收测量法(dual-energy X-ray absorptiometers，DXA)计算“影像-生理年龄(DXA 年龄) ”，采用深度学习建立集成CNN 模型，预测疾病发病率和死亡率。分析英国7582 例全身双能CT 数据，采用随访期间患者死亡年龄作为标签训练模型，利用外部生存模型估计存活者死亡年龄。高危组(DXA年龄超过实际年龄3 岁)个体全因死亡风险、心血管疾病风险、2 型糖尿病以及癌症风险均高于低危组(DXA年龄比实际年龄小3岁以上)。

哈佛医学院附属布莱根妇女医院Jakob Weiss 等对40 643 名无症状者147 497 例胸部X 线检查数据采用深度学习进行建模，估算胸片(chest X-ray radiograph，CXR)年龄以评估肺癌风险。将CXR-年龄添加到具有人口统计学(年龄、种族、吸烟、BMI)和临床危险因素(癌症分期、治疗)的多变量Cox模型中，显著改善了肺癌患者的生存预期准确性。基于深度学习提取影像数据信息，发现潜在生物标志物，可预测疾病及死亡风险，有助于早期筛查及干预。

3 影像AI应用场景

3.1 早期诊断

快速、准确识别病灶是急诊影像的首要需求。随着图像识别技术快速发展，大量带标签图像数据集的投入使用使AI早期、快速、准确识别危急征象成为可能。根据严重程度帮助放射医生对患者进行优先排序，有利于缩短急救黄金时间，降低医疗成本。然而，算法泛化能力的有限性，模型的可靠性和数据的安全性仍是亟待处理的问题[9-10]。

多中心、大样本的数据分析是提高模型泛化能力及稳定性的方法之一。韩国Suwon 大学医学院和首尔国立大学医学研究中心的Jin Wook Choi 等采用基于深度学习的自动检测(deep learning-based automatic detection，DLAD)算法分析296 例受试者的12 663 份颅脑CT 图像数据，检测该算法用于急性颅内出血(acute intracranial hemorrhage，AIH)的诊断效能。基于DLAD 的模型AUC 值显著高于非DLAD 模型[(AUC=0.970，95%CI=0.963～0.976) vs. (AUC=0.947，95%CI=0.938～0.955)，P＜0.0009]。非放射专业医师借助DLAD能明显提升诊断准确率[(AUC=0.951，95%CI=0.934～0.964)vs. (AUC=0.919，95%CI=0.899～0.936)，P=0.0009]，放射医师在DLAD 辅助下亦能提升诊断效能[(AUC=0.974，95%CI=0.961～0.983) vs. (AUC=0.946，95%CI=0.929～0.960)，P=0.0003]。杜克大学的Walter F Wiggins 团队采用基于颅脑MRI 的深度学习模型诊断自发性颅内低血压(spontaneous intracranial hypotension，SIH)，模型AUC 为0.980，研究结果提示AI有望辅助放射医师快速识别潜在SIH。

法国南法兰西岛医学影像中心的Nor-Eddine Regnard等回顾17个中心连续3个月因疑似四肢或骨盆骨折而拍摄的所有X线图像，比较放射专家和AI在骨折检出率的差异，结果显示AI 较人眼观察多检出235 处被漏诊骨折，骨折检出率增加26%。AI 在提高检出率方面表现良好。在准确性方面，洛马琳达大学医学中心的Justin Roy Camara 等采用基于CNN的深度学习算法识别CTA图像上的腹主动脉瘤，在VGG16基础模型上进行迁移学习，开发特异CNN 模型。根据数据集大小、动脉瘤大小、扩张程度、剖面、附壁血栓进行模型准确性和AUC分析。结果显示CNN 模型准确率与动脉瘤体积呈正相关，动脉瘤的附壁血栓会增加模型识别的假阴性，而外来置入装置没有降低模型的整体准确性，证实了特异性CNN 模型可以在CTA上准确识别腹主动脉瘤。

AI逐渐应用于肿瘤早期筛查，为诊断医生提供初筛结果。美国梅奥诊所的Garima Suman等采用CNN自动检测胰腺导管腺癌(pancreatic ductal adenocarcinoma，PDA)，训练集包括随机选择522 例PDA 病例和843 例对照CT 数据。测试集包括279例PDA和824例正常对照CT数据。比较放射医生和CNN模型诊断准确率，CNN 模型误诊率(18.5%)略低于放射医生(19.0%)，诊断效能相近。将AI 模型应用于PDA 诊断，可为放射医生提供预筛查图像，从而降低胰腺癌漏诊率。

算法的融合、更新有助于提高诊断准确性。剑桥大学生物医学研究中心的Sarah Hickman等评估两种AI算法在乳腺癌筛查中的应用效果，数据来自英国国家卫生服务(National Health Service,NHS)乳腺筛查中心。结果表明在现有算法上进一步整合有望提升AI算法在临床中的应用价值。

3.2 风险评估

AI 对于发现图像中可疑病变具有一定优势，可结合临床资料快速综合评估，提供风险预警。在外科手术中，术中失血风险评估具有重要意义。北京大学人民医院的Ping Yin等采用基于深度学习的神经网络和影像组学回顾性分析810 例盆腔和骶骨肿瘤患者CT 数据，提取1316 个组学特征，分别采用随机分组和时间节点分组构建影像组学诺模图(radiomics nomogram，RN)，另外构建基于深度学习的深度神经网络(deep neural networks，DNN)模型。寻找与手术大量失血潜在相关的危险因素：性别、年龄、肿瘤大小、肿瘤类型(软骨肉瘤、骨肉瘤、脊索瘤、巨细胞瘤、多发性骨髓瘤、神经鞘瘤、尤文氏肉瘤、转移瘤等)、肿瘤位置、新辅助化疗、手术方法、手术入路、手术医生、术前栓塞、主动脉球囊阻塞等。结果显示临床-DNN结合模型和临床-RN 结合模型优于单纯DNN 模型和RN 模型。临床-DNN 结合模型和临床-RN 结合模型可作为骨盆和骶骨肿瘤患者术前预测大量失血的有力工具，降低术前因失血量误判导致手术失败和血液制品浪费的风险。

疾病风险评估推进慢病管理精准化。罗格斯新泽西医学院的Hima Tallam 等使用全自动深度学习方法研究2 型糖尿病的CT 生物标志物，共纳入8992 例CT 图像，分析胰腺CT 值、体积、脂肪含量和分形维数等参数，并评估内脏脂肪和动脉粥样斑块等其他生物学标志物。使用Logistic 回归寻找糖尿病最佳的预测因子。结果显示：2 型糖尿病患者平均胰腺CT值较非糖尿病者低[(18.74±16.54) HU vs. (29.99±13.41)HU，P＜0.0001]，内脏脂肪体积较非糖尿病者高[(235.0±108.6) mL vs. (130.9±96.3) mL，P＜0.0001]；胰腺CT 衰减标准差、胰腺分形维数、内脏脂肪体积、腹主动脉斑块严重程度及BMI高于30是预测2型糖尿病的最佳指标。

Sidney Kimmel医学院的Simukayi Mutasa等将基于CNN的深度学习方法应用于髋关节X线骨密度诊断。提取4400例患者的定量和定性骨密度标签，定性标记正常骨密度、骨质减少和骨质疏松，定量标记髋关节、脊柱、股骨和尺桡骨的平均t评分。定性验证结果表明，CNN 分类准确率为86.16%，所选手术点综合敏感度为0.838，特异度为0.772。综合AUC 为0.809。该研究证明了当深度学习系统应用于四肢X 线片时，对于骨密度异常的诊断效能可与DXA相媲美。AI广泛应用对疾病风险的量化和早期预警起到重要作用。

3.3 预后预测

随着基因组学、代谢组学、影像组学高速发展，大数据时代下精准医疗对算力要求越来越高[11]，而AI 对大量高维数据的快速处理能力也引起人们的关注。AI 在辅助勾画靶区、提取图像特征、多种深度学习方法挖掘数据间联系、建立特异性模型等方面表现不凡，本次RSNA 年会基于深度学习的多模态影像模型联合基因靶点、分子分型共同研究为研究疾病病理生理机制提供了新思路。美国俄亥俄州辛辛那提图像研究中心的Zhiyuan Li等采用基于集成学习的定量MRI结构模型对极早产儿进行认知缺陷早期预测，模型整合了辛辛那提儿童医院197 例患儿的脑容量和皮层发育特征，包括厚度、沟深度、曲率、旋转指数和表面积等，模型预测的准确率为68.0%，敏感度为70.2%，特异度为67.3%。该方法的AUC为0.73，优于极端梯度增强分类器(AUC=0.62)和神经网络(AUC=0.61)。美国印第安纳大学的Jason Glenn Parker等联合多模态MRI和肿瘤组织样本的全基因外显子组测序结果，通过构建前馈密集网络模型，以识别胶质瘤的突变基因靶点(包括PTEN、IDH1、TP53、EGFR、PIK3R1、PIK3CA、NF1 和RB1)。模型的平均预测准确率为76.5%±15.0%，个体患者预测准确率从0.540 到0.997不等。该研究通过无创成像预测单核苷酸点突变，旨在解决实体瘤异质性影响治疗耐药和疾病复发的问题，提示基于深度学习的多模态精准分类已显示出指导个性化治疗方案的潜力。

对高危人群的预后评估是疾病管理的重要环节，利用AI有助于大规模筛查，早期干预。哈佛医学院附属布莱根妇女医院Jakob Weiss 等使用深度学习构建筛查模型，对肝脂肪变性患者肝脏CT 图像进行体积分割。患者被分为超重者(BMI≥25)和非超重者(BMI＜25)，研究肝脂肪变性与全因死亡率以及心血管死亡率之间的关系。在14 753名参与者中非超重者和超重者的肝密度中位数没有显著差异(33.2 HU vs.32.4 HU，P=0.63)。在非超重者人群中，肝脂肪变性与全因死亡率之间存在显著相关性(HR=2.48，95%CI=1.37～4.49，P=0.003)，而在非超重参与者中未见显著相关(HR=0.99，95%CI=0.76～1.29，P=0.93)。在非超重者和超重者中，肝脂肪变性和心血管死亡率之间没有显著相关性。基于深度学习的肝脂肪变性预测模型有助于早期识别高危个体，提示临床。

3.4 临床决策辅助

病变的精准分割和量化深刻影响临床决策。当前关注点在于探讨影像特征与肿瘤生物学特性之间的关系，以早期诊断癌症，在最佳时机针对特定个体予以最合适的治疗，并改进医学成像中的工作流程。韩国盆唐CHA 医疗中心的Ah Young Park 等探索乳腺癌RNA 测序谱与多参数MRI 特征之间的关联，包括肿瘤形态、异质性和血管生成，寻找与预后和治疗决策密切相关的影像学标记。使用乳腺成像报告和数据系统(breast imaging reporting and data system, BI-RADS)评估95 名浸润性乳腺癌女性的MRI 特征，纹理分析评估肿瘤异质性，增强动力学和灌注分析评估肿瘤血管生成。结果显示189 个基因与87 个MRI 特征相关(P＜0.05)。BI-RADS 中肿块的不规则形与HOXA5 和STC2 的高表达有关。肿块实质与SNORD46，SNORA38 和SNORA71B 的高表达相关。经提取纹理和灌注参数与乳腺癌的snoRNAs相关。研究证明了利用BI-RADS和定量变量对乳腺癌形态学、异质性和新生血管进行多参数MRI 分析，可以反映与治疗和预后相关的遗传学变化。MRI 衍生的影像组学具有评估肿瘤微环境预测预后和耐药的潜力，可为乳腺癌治疗提供更好的精准用药。

基于机器学习的肿瘤影像组学能够预测不同级别癌前病变，指导术中肿瘤切除。马萨诸塞州总医院的Dania Daye 等采用基于机器学习的放射组学模型预测胰腺导管内乳头状黏液肿瘤(intraductal papillary mucinous neoplasm，IPMN)的级别。109 例被分为低级别IPMN 组(伴有低或中度不典型增生，n=48)和高级别IPMN 组(高级别或侵袭性，n=61)，并收集临床生物学变量。所有肿瘤图像均在延迟期进行半自动容积分割，提取112个影像组学特征。患者被分为训练集(n=88)和测试集(n=22)。运用基于随机森林的机器学习进行特征提取。ROC 用于评价构建的机器学习模型性能。单因素回归显示4 个特征(2 个一阶特征和2 个形状特征)与中低级别不典型增生IPMN 独立相关(Wald 检验均P＜0.04)。基于随机森林的机器学习模型在低级别IPMN 预测方面表现良好(AUC 为0.83)，特异度为76%，敏感度为82%。证实了术前CT 定量肿瘤放射学特征可有效识别低级别IPMN 患者。低、中级别癌前病变可随访观察，高级别癌前病变则及时切除。

随时间推移进展是恶性肿瘤主要生物行为标志。法国Therapixel 创始人兼首席科学家Pierre Fillard 团队采用AI比较前后两次乳腺X线检查的差异以区分良恶性病变。在100%阳性预测值(PPV)时，AI 的参考敏感度为12.5% (95%CI：8.3%～17.6%)，AI 的时间敏感度为22.7% (95%CI：19.2%～27%)，增益敏感度为10.2% (95%CI：4.4%～15%)。研究证实基于时间的AI可以有效区分复杂良性病例与癌症病例。

3.5 自动化智能测量

在传统放射工作模式下，对病灶反复手动测量、半自动标注、肉眼比对往往浪费大量时间，严重降低放射医生工作效率，增加时间成本。智慧医疗时代背景下，肿瘤精准评估对临床疗效评价和方案调整具有重要价值。美国麻省理工学院的Jay Biren Patel 等采用自动深度学习方法对脑转移瘤进行全自动分割和纵向评估，根据神经肿瘤脑转移反应评估标准进行自动量化，在847 个数据集上自动分割转移灶。对比专业放射医生和预测模型的转移灶测量值，组内相关系数(intraclass correlation coefficient，ICC)为0.88。提示深度学习能加快对颅脑转移灶的准确测量，辅助量化临床治疗反应。

希伯来大学计算机科学与工程学院的Leo Joskowicz 等采用基于自动容量同步深度学习分类方法监测肝转移灶的变化，进行自动识别和综合量化，分析两次CT 增强图像病变体积变化，与标准独立检测方法进行比较。前后比较法比独立单次法的准确率明显提高：直径＞5 mm病灶准确率由5.5%上升为24.1%；直径＞10 mm的病灶准确率由2.2%上升为20.5%。研究结果提示，AI能提升肝转移瘤体积变化测量的准确性。

图像分割和基于分割的量化分析是目前心血管领域AI应用最广泛的环节，冠心病术后冠脉再狭窄风险评估是本次RSNA 年会心血管领域临床关注的重点。美国梅奥诊所的Emily Koons 等采用HRPCD-CT 扫描置入冠状动脉支架的患者，利用深度CNN 算法减少噪声、优化图像质量，测量冠状动脉支架内径，与优化前测量值比较。优化前图像：支架存在开花伪影，导致支架壁增厚，而管腔内径相应缩小，造成管腔内径被低估40%左右。基于CNN 构建的模型不仅提高空间分辨率，而且减少图像伪影。在不失真的情况下，CNN 将图像噪声降低了44% (差异＜0.6%)。采用CNN 去噪算法能准确评估冠状动脉是否存在再狭窄。

利用MRI 进行椎管狭窄评分时，放射医生之间测量常有差异，AI 自动量化分级有助于病情客观评价。韩国中央大学的JinHyeong Park 等采用基于三维深度学习对腰椎椎管狭窄(lumbar spinal stenosis，LSS)进行全自动分级，以减少人工测量误差。收集5426例患者的矢状位T1WI、T2WI和横断位T2WI 序列，定位每个脊柱运动功能单元(L1/2 至L5/S1)，并将LSS分为1级(无/轻度)、2级(中度)和3级(重度)。数据集以7∶1∶2 的比例被随机分成训练集、验证集和测试集，利用生成的模型识别L1/2 至L5/S1 椎间盘。结果显示模型诊断1、2、3级椎管狭窄的AUC分别为0.94、0.84、0.96，区分不同分级椎管狭窄的敏感性和特异性可接近专科医生。

基于AI 的图像自动标注测量，不仅减少测量误差，也有助于年轻医生的诊断。韩国首尔蔚山大学的Seung Min Ryu等利用级联CNN 在足部站立侧位上自动识别标志点，进行足部畸形(扁平足和弓足)诊断。随机选取1050 例足部X 检查数据作为训练集，150 例作为测试集。使用视觉几何组(visual geometry group)图像标注器，逐例识别出25 个解剖标志，以平均绝对距离(mean absolute distance)、足畸形角[包括距骨第一跖骨角(talo-first metatarsal angle)和跟骨倾斜角(calcaneal pitch angle)]作为模型预测指标的评价金标准。比较高年资专科医生与初级医生的标注结果，结果表明CNN 模型指导下初级医生标注表现更佳，AI 能够帮助年轻医生更好地识别解剖标志。

4 局限与挑战

4.1 数据“黑盒”

全球COVID-19疫情持续蔓延，利用AI分析肺部图像以检测COVID-19 肺炎的研究大量涌现，但也暴露出数据选择、使用及分析过程不透明、模型偏离实际等问题。来自名古屋大学医院放射科的Rintaro Ito 团队提出，增加人工智能研究检查核对表将有助于减少这些不足。

4.2 AI模型假阳性

苏格兰东北部乳腺筛查服务中心临床主任Gerald Lip博士强调AI 在正式投入使用前，需要评估其检测效能。虽然许多国家已开发乳腺癌筛查系统，但都存在不同程度的局限。高误报率将导致不必要的手术、医疗成本上升和患者焦虑的加剧。美国夏威夷大学癌症中心的Lambert Leong 等采用深度学习模型对25 096 例乳腺阴性X 线数据进行研究，并与包含临床危险因素(包括乳腺密度)的模型进行基准评分对比，构建的深度学习模型在癌症筛检方面表现欠佳。

4.3 AI管理：隐私与法律责任

AI 研究需要大量数据，而这些数据的管理以及如何避免患者隐私泄露也成为今年的议题。斯坦福大学的David B.Larson教授提出，为了更长远的公共利益，去除个人信息后的临床数据应当作为公开资源，传统意义上的“拥有”数据概念将被改变。纽约大学放射学系人工智能副主任Yvonne W.Lui 指出，为了降低患者隐私泄露的风险，医疗机构应通过与制造商合作，避免将可识别的数据置于DICOM 字段中，通过优化协议及更有效的去除个人信息手段，开发更安全的数据共享方式。

5 总结

随着AI逐渐融入影像，人们对AI的态度逐渐趋于理性，对数据涉及的伦理和隐私问题也愈发关注。全新放射工作模式下，放射医生不仅需要明白AI能够带来的价值，也需要了解其局限性。芝加哥大学放射学教授兼放射信息学副主席Paul J. Chang博士指出，AI的市场仍有待开发，医疗机构对AI要求越来越高。临床对放射学提出更多和更高的要求，期望融合多模数据进行综合诊断评估，并期待结果更加精准。笔者认为，随着技术持续革新，放射医生对AI 的要求不再满足于提高工作效率，实现图像测量的半自动化或全自动化，而是能在工作过程进一步完成训练和测试、智能迁移等复杂任务。

作者利益冲突声明：本文所有作者均无利益冲突。