培养医学生机器学习的实践素养

2021-07-19刘大路

基础医学与临床 2021年7期

刘大路，李静

(空军军医大学军事预防医学系辐射防护医学教研室特殊作业环境危害评估与防治教育部重点实验室，陕西西安710032)

随着人工智能(artificial intelligence，AI)的发展转向实用问题，AI迅速应用于医学实践[1]。近来机器学习(machine learning，ML)通过训练计算算法自动化辅助临床数据分析，发展为医学应用最广泛的AI架构。但是，ML只能识别标准化的数据集。而临床诊疗过程涉及繁杂医疗信息的分析，数据类型错综复杂。因此，在医学生实习或住院医师培训中加入ML的素养培养，可提高基础数据收集的标准化。通过对临床数据导入算法的成功案例的学习，使医学生能理解临床数据的标准化方法，通过算法辅助繁重的一线数据分析工作。

1 案例收集与结果分析

本文研究对象为：2010—2019年收录临床医学相关AI或机器学习应用的文献。文献检索词为：topic: (clinical medicine) and topic: (artificial intelligence) or topic: (clinical medicine) and topic: (machine learning). timespan: 2010—2019. 文献检索信息来自WOS、KJD、MEDLINE、RSCI、SCIELO等数据库。

图1A表明从2010至2019年基于ML/AI算法的临床应用的文献数量。该临床技术革新的报道被引次数逐年激增(图1B)，广泛影响公共管理、工学领域。相关文献信息的统计结果表明，ML对特定类型的医学问题的效能不同(图2)，架构的训练成功率与合适的标化临床数据以及数据样本规模相关。下文按特定任务说明ML实践的知识目标。

图1 2010—2019 年基于“人工智能或机器学习医疗”主题的研究文献发表数(A)和被引次数(B)

图2 2010—2019 年基于AI算法的临床医学研究主题词归类统计

1.1 辅助诊断类

放射影像数据标准化程度高，数据量大。为了诊断肺腺癌，通常需要影像医师对肺结节影像进行人工分级。卷积神经网络(convolutional neural networks, CNN)架构被报道可用于电子计算机断层扫描(computed tomography,CT)图像上实性、部分实性和非实性肺结节进行自动分类。研究所采用的临床数据来自公共云数据库 “lung image database consortium(LIDC)”的1 010名患者影像及病例资料，用以训练和测试CNN分类器和回归方案。该方法在应用三分类范式进行肺结节分级取得了90%以上的准确率[2]。

ML善于提高真实照片的分析效率。研究者应用“Googlenet” 辅助糖尿病视网膜病变的分期。通过分析不同视野的4张彩色眼底照片，将眼底摄影覆盖角度达到200°(临床常规检查为45°)。超宽角度照片分析提高了疾病分期准确度[3]。针对眼底照片的ML架构还成功应用于同时对多种视网膜疾病进行分类。研究者从公开视网膜图像数据库“retina structured analysis”收集了397张眼底照片数据，输入CNN架构进行对多分类任务的训练。输出预测事件包括正常、背景糖尿病视网膜病变、干性年龄相关性黄斑变性等7种视网膜疾病。训练后CNN自动分类结果与患者最终诊断吻合率达到70%[4]。

ML还可以增加新的疾病筛查方法。一项研究收集了527例肢端肥大症患者和596名健康人的面部照片，用于训练和验证自动分类架构，并对分类结果通过“诊断金标准”——激素抑制试验进行验证。研究者比较了多种常用的ML算法对人面部照片的训练效率，包括广义线性模型、K-近邻算法、支持向量机(support vector machine，SVM)算法、随机森林算法和CNN。ML架构筛出患者的平均灵敏度为 86%，平均特异性为96%[5]。面部照片以应用广泛和无创的特点，适合用于疾病的公众筛查。

1.2 治疗决策类

化学治疗药物替莫唑胺对多形性胶质母细胞瘤(glioblastoma，GBM)的疗效取决于MGMT基因启动子或增强子区域的甲基化状态。肿瘤影像数据库“the cancer imaging archive”收集GBM患者的脑磁共振功能成像(functional magnetic resonance imag-ing, fMRI)数据，而“the cancer genome atlas”数据库保存同一患者的活检基因组信息。研究者以两大数据库收集的样本为基础，训练双向卷积递归神经网络架构 (convolutional recurrent neural network, CRNN)预测患者GBM肿瘤细胞对化学药物治疗的反应性。CRNN学习患者三维fMRI图像中基因组学信息后，预测替莫唑胺化学药物治疗效果的准确度与会诊医师组相当[6]。放射基因组学对患者放射影像纹理建模，通过ML结合肿瘤异质性、基因测序分析，建立个体化影像资料和患者放疗敏感性的关系。提取其中高级特征可用于早期干预患者肿瘤细胞的放射治疗抵抗，或预测患者放射治疗后期并发症，实现精准放射治疗[7]。

为了ML能自动解决乳腺癌患者抗HER2靶向治疗疗效预测，基于SVM和随机森林模型的算法被建立用于对组织学标志物进行评分。研究者收集“Astrazeneca biobank”数据库中74张乳腺肿瘤活检的免疫组化图像作为ML的训练数据。通过提取描述细胞核颜色、细胞核纹理、细胞核形态、HER2膜染色强度和HER2膜染色阳性比例等18个特征，算法可以批量完成患者肿瘤组织HER2基因病理学分类[8]。而大型真实图像数据库Imagenet可为训练和验证提供足够的临床病例图像数据。研究者首先训练CNN架构执行病理图像最优分割任务，然后经独立的第2个CNN提取分割图像的高级特征，区分病理学图像上肉眼难于察觉的边界[9]，优于病理医师的分析。

1.3 传统中医学

为预测患者的消化疾病发生发展，中国传统医学对患者的舌头颜色、形状和质地进行了几千年的研究和分类。而研究者采用基于主成分分析(principal component analysis，PCA)卷积核的高约束高分散神经网络 (chdnet) 弱监督架构，从舌象照片中提取高级特征用于疾病分类。该架构通过对44例胃炎患者和40名健康人的舌象数据进行训练后，将 chdnet提取的高级特征输入SVM的分类器liblinear中，其对胃炎患者的分类的效率优于人工初筛[10]。

2 医学生机器学习(ML)的实践素养

最先进医学教育将医学生职业素养从胜任能力的角度划分为职业道德、职业技能、职业行为与作风和职业意识。中国协和医学院对长学制医学生提出具备信息素养是发展能力和潜力的基本条件[11]，这是引领未来医学生职业技能教育的重要组成。而ML实践将围绕以下方面提升医学生的职业胜任力。

2.1 理解临床数据的最小样本量

准确的最小样本量估算是提高训练成功率的重要环节，前者是临床数据收集整理和效率的保证。ML需要大量临床真实样本，以减少内部偏差。但是，规范的临床数据收集受到诸多医疗条件的限制，尤其是为获得完整的临床数据，部分确定性检查花费大或有创，如基因检测、组织活检等。因此，在临床ML实践教学活动中，教会学生准确估量训练样本量，确保数据集完整性同时最大程度减少对医疗秩序的干扰，是保证ML辅助诊疗成功的关键。

2.2 掌握机器学习(ML)样本量的计算方法

训练所需样本量分析需要采用个体化的方法。有效训练取决于ML架构的临床目的、已知的输入特征、训练数据中含有的噪声、已经提取的特征的偏倚以及模型的复杂性。对于应用最广泛的神经网络架构，通过推演Hoeffding不等式求“计算”特征数量下限，可以减小样本量需求。但该方法计算复杂。VC维(Vapnik-chervonenkis dimension)也是计算训练样本量的重要参数，前者是神经网络神经元数与神经连接数的乘积，而10倍VC维的样本量一般足以充分训练神经网络。但是由于特征的稀疏性，10倍VC维计算出的样本量很可能巨大。如果以上计算得出训练样本需要量过大，还需要将结果最小化。通过正则化(regularization)方法，即修改模型结构(局部感受野和权值共享)，减少了特征个数，可明显降低VC维。此外，数据增强范式(data augmentation)可以提高低样本量数据的训练效率。

2.3 应用临床公共数据库

如果缺乏足够的标准化病例数据来训练ML怎么办？在ML的医疗案例中，部分研究采用了通用数据库的临床资料和组织标本。这些数据网站建立有生物样本数据库，管理多中心的医学图像信息、人类基因组信息，以及病理标本库，可帮助招募足够的样本来增加训练和验证的数据。此外，电子病理数据库保存大量医师主观医疗记录也可用于ML，从文字分析建立临床逻辑思维[12]。医学生应该在实习或临床培训环节熟悉前文所述前沿数据库的发展，掌握基本数据库语言。在样本量不足时应该充分调用开放数据，提高架构学习的效率，这对增强医学生学习信心有重要帮助。

2.4 挖掘隐藏层特征

对ML架构的解读有利于医学生发现新的临床诊断思维。CNN隐藏层神经元往往输出的是训练数据的高级特征，这些特征是具有一定的生物学意义的量化信息。而提取的特征信息包括大量线性思维不易分析的成分。因此，通过中间层特征提取的解读，将有利于医学生发现以往未分析出的临床资料与疾病的权重量化关系，从而建立算法辅助的新临床思维。在人肿瘤组织芯片的学习案例中，研究者从ML的隐藏层提取了8个被赋予高权重的神经元[13]。因为不能用生物信息学进行回归和解释，因此在人工分析中这些多维度的高级特征提取很少见。而ML对部分神经元的高赋值，提示神经元标注的特征代谢通路对疾病的发生发展具有潜在的相关关系。尤其当医学生面对于临床罕见病时，其病例储备、分析思路、模式视角、方法应用有其特征，诊断思维难于训练。ML综合循证证据和遗传背景，建立科学逻辑特征，在教学实践中有助于儿童矮小症的罕见疾病诊断思维教学[14]。因此，经典诊断依据与ML系统结合成“专家系统”，可以辅助医学生临床思维的形成。