人工智能在肌少症诊断中的应用现状与前景
2022-02-04潘云菲胡梦杰赵费敏任菁菁
潘云菲 胡梦杰 赵费敏 任菁菁
据世界卫生组织保守估计,2010年全球范围内肌少症患者超过5 000万,预计2050年患病人数将高达5亿[1]。数据显示,≥65岁人群中有近1/3患肌少症,患病率为14%~33%;≥80岁人群患病率则高达50%~60%[2]。肌少症导致身体活动能力低下,生活质量降低[3]。循证医学证据显示,肌少症是老年人群跌倒、抑郁等疾病的重要危险因素[4-6],且被证实对各种疾病的预后都有影响,增加再入院率,延长住院时间,极大加重了个人及社会负担[3]。肌少症的诊断需包括肌肉质量、肌肉力量及躯体功能等多方面评估,传统诊断方法繁琐、耗时,分割效果受操作者差异限制,因此卫生服务效能和效率均较低[7]。近年来,人工智能(artifical intelligence,AI)在数据、算法、算力驱动下迅速发展,在医学影像学领域基本实现人体成分自动分割,诊断效能较好,故被用于构建肌少症AI诊断模型,以期简单、准确地诊断及管理肌少症。本文就近年来AI在肌少症诊断中的应用现状与前景作一综述。
1 肌少症概述
1.1 肌少症的定义及疾病影响 1989年Rosenberg等[8]首先提出了肌少症的概念,用以表示在正常增龄过程中肌肉(不含脂肪的骨骼肌肌肉组织)的丢失。此后随着概念逐渐扩展,肌少症又包含了肌肉力量和肌肉功能等方面的内容。2010年,欧洲老年人肌少症工作组(European Working Group on Sarcopenia in Older People,EWGSOP)将肌少症定义为与增龄相关的进行性骨骼肌量减少、伴有肌肉力量和(或)肌肉功能减退的综合征,并可能导致跌倒、残疾、生活质量下降等不良后果。研究表明肌少症影响多种疾病预后,其在慢性心力衰竭[9]、肿瘤性疾病(如胃癌[10]、直肠癌[11-13]、肺癌[14])预后中的预测价值也已被证实。
1.2 肌少症的发病机制 肌少症发病机制十分复杂,目前仍处于研究和探索阶段,一般认为与年龄、炎症、运动、蛋白摄入、激素、遗传等因素有关,免疫失调、神经病变、线粒体异常、脂质累积、胰岛素抵抗、运动神经元退化、骨骼肌蛋白合成与分解代谢失衡、细胞因子的动态调节失衡等都可能引发或加剧肌少症[15]。
1.3 肌少症的诊断 肌少症的诊断标准较多,EWGSOP、国际肌少症工作组(International Working Group on Sarcopenia,IWGS)、亚洲肌少症工作组(Asian Working Group for Sarcopenia,AWGS)先后提出了观点相仿的诊断标准,主要从肌量减少、肌力下降及躯体功能减退等3个方面展开评估。(1)肌肉质量/数量的评估:MRI和CT被认为是非侵入性评估的金标准,能够精准区分肌肉组织和脂肪组织,但存在设备成本高、缺乏便携性等问题,暂不作为临床常用评估手段。双能X射线吸收测定法(dual energy X-ray absorptiometry,DXA)较前两种方法在临床上使用更广泛,电离辐射小,测量较为简便,是目前最常用的方法之一。生物电阻抗测量分析(bioimpedance analysis,BIA)设备价格低,携带使用方便,是肌少症筛查的重要手段;但诊断易受机体含水量及其他因素的影响,评估结果有一定误差。(2)肌肉力量的评估:握力检测容易操作且与日常生活能力、住院时间的长短等有关[16],因此被推荐作为评估肌肉力量的最佳临床指标。(3)躯体功能评估:目前测量躯体功能方法较多,如步速测定、简易体能状况量表评估和起坐试验等,其中步速法更为实用。此外,EWGSOP及AWGS最新提出的共识推荐使用简易五项评分问卷或小腿围测量等方法对肌少症进行初步筛查,如筛查阳性再进行肌肉力量、躯体功能和肌肉质量/数量等。
1.4 肌少症的治疗 运动干预和营养干预是目前肌少症治疗的基石,两者结合能够获得较好效果,但仍需进一步研探最佳方案。现有药物治疗肌少症的证据仍不够充分,血流限制、神经肌肉电刺激、振动等其他治疗手段确切的临床益处仍不确定。总体来讲,目前肌少症治疗多采用运动联合营养干预。在常规临床实践中,早期筛查、早期诊断和早期干预肌少症及其危险因素对提高老年人生活质量、减少并发症、避免严重后果具有重要意义。
2 AI概述
2.1 AI应用领域 AI是基于计算机程序的智能实体,能够模拟人类进行学习、推理和自我校正,并根据环境认知最大限度地模拟人类智能[17],完成传统意义上的依赖人的智力才能完成的复杂工作,涵盖计算机科学、统计学、社会科学等学科,拥有较强的大数据存储和分析能力,涉及机器人、语言识别、图像识别、自然语言处理、机器学习和专家系统等多个领域[18]。近年来,AI在数据、算法、算力的驱动下迅速发展,医学领域应用AI有助于提高图像识别、遗传学和基因组学分析、智能诊疗、预测预后等方面的准确性;在辅助诊疗、减轻医生的数据分析压力方面,准确性可接近人类专家水平[19]。
2.2 机器学习(machine learning,ML)及其在医学领域的主要应用 ML是AI的主要亚类,其原理是通过算法进行数据集中学习并作出准确预测,通常不需明确的程序设定。ML的常用算法包括支持向量机、决策树、随机森林和神经网络等[20]。其中支持向量机、决策树等已被广泛应用于心肌梗死预测、病理识别及术式改进等方向[21]。深度学习(deep learning,DL)是基于神经网络的一种ML算法,采用多个非线性处理层对数据信息进行逐层提取,通过分析高维数据检测超出人类识别能力的细微变化并挖掘更深层次的特征,从而实现图像分割和分类预测。因DL可直接应用原始数据而避免信息丢失,且在数据规模较大、预测任务复杂时表现出更高的效率,因而成为当前研究热点[21-22]。近年来,作为DL代表算法之一的卷积神经网络在人体成分自动分割方面展现了良好的效能,如Roth等[23]利用卷积神经网络构建模型实现CT图像上胰腺的自动定位与分割;Yan等[24]利用DL识别局部解剖结构并对人体部位进行定位等。
3 肌少症AI诊断现况
人体成分的分析对诊断肌少症非常重要。对肌肉和脂肪组织进行分割,传统方法是由医师手工分割完成,效果较好但耗时较长,同时由于医师技能存在个体差异,结果往往较难复制[25]。半自动化的分割方法需要人工修正错误或进行复杂的手工制作[26],受限于人力资源和时间需求,通常不能应用于大型数据集。这也是CT、MRI检查在临床上广泛应用,但在临床实践中难以推广的原因,因缺乏自动化分割测量工具,实际分割工作依旧繁琐、耗时及昂贵,且易受操作者差异限制,卫生服务效能和效率并不高[7]。因此,基于AI的自动化分割成为目前大部分肌少症AI诊断模型构建的研究热点。
3.1 基于影像学 目前大部分研究将肌少症作为影像学标志物,使用DL,特别是卷积神经网络方法进行人体成分的自动分割,效果较为理想。大部分研究构建的肌少症诊断模型利用CT/MRI图像,在第3腰椎(L3)水平(因L3水平骨骼肌和脂肪组织对应于全身的组织,故被认为是人体成分分析的标准标志[27])进行人体成分自动分割,少部分研究则在第12胸椎(T12)、L4、L5-第1骶椎(S1)水平等进行人体成分自动分割,得到特定层面的骨骼肌横截面积(cm2),使用预定的回归方程,与身高的平方(m2)进行标准化处理,得到骨骼肌指数(cm2/m2),并用以估计全身组织质量,实现肌少症的诊断。研究发现,部分AI人体成分自动分割模型的Dice系数(Dice系数是DL图像分割标准之一,取值范围为0~1,越接近1说明构建的模型越好)高于0.95,诊断效能较高,应用前景可观,见表1。多项回顾性研究证实,使用这些模型可实现人体成分自动分割,从而实现肌少症的诊断,在评估肌少症/非肌少症对肿瘤患者(包括妇科恶性肿瘤[28-29],泌尿系统恶性肿瘤[30],消化系统恶性肿瘤[31]等)预后的影响也有不错表现。
表1 利用ML实现人体成分自动分割的文献报道
基于影像学人体成分自动分割的肌少症诊断模型还存在以下缺点:(1)因放射学量化特征相似,与骨骼肌临近或重叠的脏器可能被误认为骨骼肌组织,和脂肪组织放射学量化特征相似的体素可能会被误认为内脏脂肪组织,可见AI诊断模型的准确性还有待提高[7,43]。(2)单个层面的CT图像分析可能无法精确反映全身肌肉、脂肪组织量。(3)部分研究没有明确表明如何选择研究层面。(4)部分研究设定的相关参数可能并不适合所有人群,需要进一步结合种族、性别、疾病等特征进行参数设定。(5)AI算法极为复杂,无法清晰展现推理过程(“黑匣子”原理),系统输出结果的可解释性差。就目前的研究现状而言,基于影像学人体成分自动分割的肌少症诊断模型展现了较好的效能,今后可选择多模态多层面影像实现人体成分自动分割,并结合种族、性别等特征进行肌少症诊断模型构建,以提高模型的泛化能力和准确性。
3.2 基于非影像学等结构化信息 部分研究利用ML评估不同结构化信息的重要性,确定重要因素并建立模型,从而诊断及预测肌少症[44-48]。纳入的结构化信息包括年龄、体质量、身高、BMI、腰围、臀围、收缩压、舒张压以及平均红细胞血红蛋白量、HDL、平均红细胞体积、红细胞、TG、简易营养评估量表(mini nutritional assessment,MNA)、血钠、尿素氮、铁蛋白、维生素D、FPG等。亦有研究通过AI建立重要变量之间的相关性网络[45],为深入研究肌少症发生和发展的主要生物学机制提供了可能。
3.3 其他相关进展 近年来一些便携、可穿戴设备的逐步应用为肌少症的AI诊断提供了新思路。利用惯性传感器获得患者不同时相的步态参数信息,包括时空参数(左/右腿站立时相时间、左/右腿摆动时相时间、单/双腿站立时相时间、左/右腿站立时相百分比、左/右腿跨步时间等)以及相应的统计参数(最大/小值、最小值、标准差、均方根、峰度、偏度等),通过不同算法构建基于步态参数信息的AI诊断模型,准确度较高[49-50]。穿戴式表面肌电图探针可收集运动时来自腓肠肌外侧肌群及胫骨前肌的原始肌电图信号,使用ML提取并选择特征,使用不同算法构建肌少症AI诊断模型也可获得较高的准确度,其中朴素贝叶斯算法准确度相对较低,但也达到了0.828[51],支持向量机算法准确度较高,为0.967。
小部分学者将研究的焦点转向寻找早期诊断的生物标志物。Chung等[52]研究了来自多种族的肌少症患者(118例患者,17 339个基因)和健康人群转录组谱,选定27个基因作为模型输入特征变量,建立四层深层神经网络DSnet-v1,并将其应用于独立的测试数据。结果发现模型灵敏度为100%,特异度为94.12%,准确度为95.83%,平衡准确度为97.06%,接收机AUC为0.99,可用于实现肌少症的智能诊断。为了扩展患者数据,研究组同时开发了网络应用程序(http://sarcopeniaai.ml/),用户可有限制地访问DSnet-v1,获取转录组数据从而用以诊断肌少症。Kwak等[53]对46名正常受试组和50例肌少症患者的21个潜在生物标志物的血清学进行分析,结果发现正常组和肌少症组IL-6、骨连接素/基底膜蛋白40、巨噬细胞迁移抑制因子、胰岛素样生长因子1水平差异有统计学意义。虽然这4个生物标志物均不适合作为诊断肌少症的单一生物标志物,但将这些生物标志物联合使用合并成单一风险评分时,肌少症诊断准确率显著提高(AUC=0.763)。事实上,用以肌少症诊断的有效多重生物标志物仍在不断发现与丰富中,未来可进一步研究与肌少症相关的生物学途径,探索诊断肌少症的生物学标志物最佳组合。
4 肌少症AI诊断展望
目前大部分AI肌少症诊断模型构建的研究均为回顾性研究,纳入的数据存在发表偏倚,单中心研究居多,样本量较小,模型泛化能力较差,绝大部分研究纳入的人群背景与中国不同,缺乏大样本、前瞻性的适合中国人群背景的AI肌少症诊断模型。未来可通过前瞻性队列研究,深入探讨单个放射学特征是否可用于肌少症诊断或是否导致不同的临床结局等方面的研究。针对中国肌少症人群建立多模态数据库,以探讨适用于中国人群的肌少症AI诊断模型。
单个层面的CT图像自动分割分析可能无法精确反映全身肌肉、脂肪组织量,不一定适用于所有患者。今后可考虑将单个研究层面扩展为研究区域,实现研究区域内的人体成分自动分割,降低模型的不稳定性,从而更准确地反映整体的骨骼肌质量。若能进一步实现不同区域内/多层面的对等转换,利用临床获取度更高的CT图像(比如胸部CT平扫图像),则更有利于肌少症的早期筛查及早期诊断,在缺乏有效治疗手段的情况下,患者受益可能更高。
当前大部分研究均基于肌肉质量的影像学信息,忽略了肌肉力量和肌肉功能等结构化信息,但肌肉力量和肌肉功能是诊断肌少症及评估严重程度中不可缺少的依据。研究表明,“肌少症可能”(AWGS2019年共识标准)的简化评估对于肌少症的诊断准确性非常好,而“肌少症可能”的简化评估主要依据肌肉力量和肌肉功能等结构化数据,同时还包括小腿围、SARC-F量表评分等[54]。EWGSOP2也提出应同时运用影像学信息和非影像学信息发现和诊断肌少症[3],因此今后可考虑将基于肌肉质量等非结构化信息和筛查指标、基于肌肉力量和肌肉功能评估等结构化信息与生物学标志物相结合,并利用便携智能设备等先进仪器,构建肌少症AI诊断模型,在提高效能的同时扩大应用场景,从而实现不同场景下的快速诊断及筛查。
DL等算法自动提取数据特征,细节较难捕捉,系统输出结果多数不具可解释性,目前对于AI可解释性探索仍处于起步阶段,比如生成热力图以显示DL模型关注的区域[55],今后关于肌少症诊断模型的可解释性亦是研究的方向之一。
5 总结
随着人口老龄化程度加剧,肌少症发病率逐渐升高。肌少症与多种不良临床结局相关,治疗手段有限。相比传统诊断方法,DL,特别是卷积神经网络在实现人体成分自动分割方面有较好的效能,有利于实现基于影像学的肌少症AI诊断模型的构建,但未来关于肌少症的AI诊断仍面临优化挑战,需要进一步深入研究。