人工智能在慢性炎症性气道疾病中的研究进展
2022-11-28陆琳娟姚欣
陆琳娟,姚欣
(南京医科大学第一附属医院呼吸与危重症医学科,南京 210029)
慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)和支气管哮喘是两种最常见的慢性炎症性气道疾病,肺功能是其诊断和病情评估的主要工具[1-2],但因病情个体差异、肺功能检查禁忌证、仪器和培训未能普及等,仍有众多COPD及支气管哮喘患者未能得到早期诊断和准确的病情评估。已知COPD和支气管哮喘的漏诊会导致患者生活质量下降、门诊就诊次数、住院次数及长期死亡风险增加,对其误诊及病情评估的不准确则会导致治疗方案不合理、患者病情反复以及医疗费用增加等[3-5],而上述问题的解决将显著降低疾病带来的重大社会经济负担。
人工智能(artificial intelligence,AI)是模拟、延伸和扩张人类智能的理论、技术及应用的一门科学,其核心是机器学习。AI可以通过计算机语言分析大量数据,建立复杂、非线性的关系,弥补传统分析方法的不足,有助于提高疾病诊疗的准确性[6-7]。另外,AI还可以分析以往无法进行计算分析的数据类型,如图像和听觉数据,使得对疾病的诊断和评估更为全面[6-7]。近年来,已有较多研究将AI应用于COPD及支气管哮喘的诊断和病情评估。现就AI在COPD及支气管哮喘诊疗中的应用进行综述。
1 AI的概述
AI是计算机对人类智能的模拟。其可以通过计算机语言,将数据集分为训练集和验证集,在训练集中识别各数据的特点和相关性,以此构建模型得出结果并输出,在验证集中加以验证[6-7]。机器学习是AI的核心,主要包括监督式机器学习和无监督式机器学习[7]。在监督式机器学习中,模型输出的结果是被规定的,计算机通过算法寻找与结果相关的预测因子,构建函数模型。监督式机器学习主要用于诊断和预测模型的构建[7]。如根据胸部X线片的特征来诊断肺结节的良恶性[8]、建立心房颤动患者发生血栓栓塞的预测模型[9]等。目前,监督式机器学习算法主要包括神经网络模型、支持向量机、决策树、随机森林和贝叶斯分类器等[10]。每种算法均有其优缺点,应根据数据特征选择最佳的算法。无监督式机器学习不规定模型输出结果,计算机通过算法归类具有相似特点的数据[7]。无监督式机器学习模型主要用于数据探索,如应用于识别心肌病的新表型[11]。其主流算法有层次聚类分析法、K均值聚类等[12]。深度学习是机器学习发展的一个子集,它使用深度神经网络模型模拟人脑的操作,建立的模型往往具有多个参数和层数,在图像识别中具有重大优势[13-14]。如一个深度神经网络模型在接受超过37 000次颅内出血头部CT的训练后,对约9 500例病例进行了评估,使颅内出血的诊断时间缩短96%,准确度为84%[15]。
相较传统的统计学分析方法,AI的优势体现在:①可以在较短时间内识别大数据样本;②可以分析传统方法无法识别的非线性关系;③可以识别图像数据。以上优势使AI在疾病诊疗评估方面具有巨大潜力。
2 AI与COPD
2.1AI在COPD诊断中应用 调查数据显示,即使在发达国家,仍有部分医疗单位不具备肺功能检测仪器,缺乏相关医务人员的培训,这极大限制了COPD的诊断,导致众多COPD患者的漏诊误诊[3-5]。因此,开发新的诊断COPD的方法显得尤为重要,而AI在这方面显示出巨大潜能。有研究者提出了一种AI算法,该算法用1 500例门诊就诊患者的临床症状及肺功能测试结果进行训练,在前瞻性收集的50例患者的队列中进行了验证,目的是对门诊首诊患者是否患有COPD进行判断。结果表明,AI软件在肺功能判读及COPD诊断中的准确度达100%和82%,均高于人工判读肺功能及诊断COPD的准确度[16]。
此外,针对肺功能测试未能完全普及的情况,AI可以根据患者的临床症状设计调查问卷来建立COPD诊断模型,其诊断COPD的准确度高达97.5%[17]。同样,Lee等[18]基于入选患者的临床特征、基本信息创建列线图来预测第一秒用力呼气量占用力肺活量比值,最终形成的列线图诊断COPD的灵敏度和特异度分别为82.3%和68.6%。
AI在图像识别上的巨大潜能可用于有肺功能禁忌证COPD患者的诊断。近年两项研究分别以2 000多次的胸部CT图像及6 749次的胸部X线片图像为训练集,利用深度神经网络模型诊断COPD,得出的曲线下面积分别为0.89[19]和0.837[20]。
以上研究表明,AI利用计算机语言综合患者的症状、基本信息、影像学图像特征、肺功能测试等诊断COPD,可能较人工诊断更为准确和客观。同时能为无法进行肺功能检测的患者或单位提供诊断工具,减少COPD患者的漏诊和误诊。
2.2AI在COPD表型识别中应用 COPD是一种异质性疾病,具有不同的表型,对COPD表型的研究有利于指导精准治疗。AI可以根据COPD患者的基本信息、临床症状、影像学特征等进行训练,利用聚类分析、深度学习等机器学习方法识别不同的COPD表型,归纳不同表型的临床特征,指导临床医师对不同特征COPD患者进行个性化管理和治疗。如Yoon等[21]根据1 195例COPD 患者的基本信息及临床特征,使用聚类分析的方法确定了4种表型:哮喘-COPD重叠、轻度COPD、中度COPD和重度COPD。其中第1种表型患者具有最高的急性加重风险,而第4种表型患者的肺功能最差。Pikoula等[22]基于合并症和危险因素,使用聚类分析方法将30 961例COPD患者分为5种表型:焦虑和抑郁、严重的气流受限和虚弱、合并心血管疾病和糖尿病、肥胖/特应性表型及较少有合并症表型。其中第1种表型患者急性加重率最高,第3种表型患者急性加重时症状最重,第5种表型患者急性加重率最低。此外,Sandeep等[23]基于受试者的呼气-容量曲线,使用深度神经网络模型识别了COPD 4种胸部CT的表型(正常型、小气道炎症型、肺气肿型和混合型)。结果显示,深度神经网络模型在区分COPD小气道炎症型(曲线下面积为0.77)和肺气肿型(曲线下面积为0.81)上具有较高的准确率。
聚类分析和深度神经网络模型通过识别COPD患者的临床特征和影像学特点,探索不同的表型分类以指导个体化治疗和管理。但目前AI在COPD表型识别中的应用仍处于研究阶段,需要在不同的大型前瞻性队列中进行验证,今后应重点探究不同表型COPD患者的病理生理特征、临床特征及对治疗的反应,以探索出具有临床指导意义的表型。
2.3AI在COPD预后评估中应用 COPD患者胸部影像学特征与疾病严重程度密切相关。AI可以对COPD患者的胸部CT图像进行肺叶的分割及肺气肿的量化,以评估COPD的病情。现有研究结果显示,不同肺叶的肺气肿程度与COPD全球倡议规定的COPD分级有很强的相关性,其中左肺上叶肺气肿程度与疾病严重程度的相关系数最大(ρ=0.85,P<0.000 1),左肺下叶(ρ=0.72,P<0.000 1)和右肺中叶的相关系数最小(ρ=0.72,P<0.000 1)[24]。另一项研究也显示,基于AI的肺气肿量化与肺功能具有良好的相关性[25]。
以上研究揭示,使用机器学习量化胸部CT的肺气肿程度在无法或无条件进行肺功能测试的COPD患者中替代肺功能对COPD患者进行病情评估有一定的价值。然而目前尚无大规模前瞻性队列研究进行验证,且未来的研究也应将COPD患者图像识别的特征与更多的肺功能参数和临床特征相联系。
识别高急性加重风险及不良预后的COPD患者是管理COPD的重要环节。很多研究开始根据COPD患者不同的临床资料,利用不同的机器学习算法预测COPD的急性加重及不良预后,对临床医师识别频繁急性加重的COPD患者进行早期干预具有十分重要的意义。Wang等[26]基于COPD患者的临床资料比较了5种机器学习算法(随机森林、支持向量机、逻辑回归、K近邻和贝叶斯分类器)预测COPD急性加重的性能。结果显示,随机森林算法获得的预测模型性能最佳(灵敏度为0.80、特异度为0.83、阳性预测值为0.81、阴性预测值为0.85)。另有研究利用62例COPD患者的影像学参数(气道容积和气道阻力)建立机器学习模型,结果显示其预测COPD急性加重的阳性预测值为0.82[27]。BODE(body mass index,airflow obstruction,dyspnea,and exercise capacity index)包括体质比大小、气流受限严重程度、呼吸困难程度和运动能力强弱4个方面,是广泛使用的预测COPD病死率的评分系统。有研究对COPDGene(The Genetic Epidemiology of Chronic Obstructive Lung Disease)队列2 632例和ECLIPSE(The Evaluation of COPD Longitudinally to Identify Predictive Surrogate End-points)队列1 268例COPD患者的临床特征及影像学特征进行机器学习,建立LMP-COPD模型预测COPD的患者病死率,结果发现其预测COPD患者病死率的准确率高于BODE[28]。
可见,AI识别COPD患者不同的特征建立COPD急性加重预后模型准确率高,对临床具有重要指导意义。但不同的机器学习算法建立的模型预测性能不一。未来应进一步探索如何根据患者不同的特征,选择最为合适的机器学习模型。
3 AI与支气管哮喘
3.1AI在支气管哮喘诊断中应用 与COPD类似,AI可以结合患者的症状、血液学特征及遗传学特征等进行支气管哮喘的诊断,对于存在诊断困难的支气管哮喘患者具有重要意义。然而,不同机器学习算法所获得的模型诊断支气管哮喘的性能并不相同。如Tomita等[29]利用566例门诊就诊患者的症状-体征和客观测试(如肺功能测试和支气管激发试验)结果开发了支气管哮喘诊断的支持向量机模型和深度神经网络模型,结果显示其准确度分别为0.82 和0.98。说明与经典的支持向量机模型相比,深度神经网络模型诊断支气管哮喘的性能更高。另一项研究利用就诊患者的病例资料建立机器学习模型,比较了CatBoost、逻辑回归、贝叶斯分类器和支持向量机这4种机器学习模型识别儿童支气管哮喘的性能。结果表明,CatBoost模型的性能最佳[30]。
此外,利用MTS(Mahalanobis-Taguchi system)识别常规血液学标志物,建立机器学习模型来识别支气管哮喘患者同样具有良好的诊断性能。其中,血小板分布宽度、平均血小板体积、白细胞计数、嗜酸粒细胞计数和淋巴细胞比值在支气管哮喘诊断中表现良好[31]。
另有研究整合了机器学习的特征选择和分类模型两种方法,使用单核苷酸多态性量化个体中支气管哮喘的易感性[32],该模型诊断支气管哮喘的准确率和敏感性较高。由此可见,各种机器学习方法的整合非常适合研究高维单核苷酸多态性数据以进行支气管哮喘患者基因型-表型关联和表型预测。
以上研究表明,AI通过症状-体征、客观测试结果建立机器学习模型有助于对诊断困难的支气管哮喘患者进行识别。与COPD不同,AI诊断支气管哮喘的现有研究更侧重于不同诊断模型性能的比较及不同机器学习方法的结合。
3.2AI在支气管哮喘表型识别中应用 支气管哮喘的表型识别对哮喘的管理和个体化治疗十分重要。目前应用于支气管哮喘表型识别的AI算法主要有潜在类别分析和K均值聚类两种。有研究使用潜在类别分析方法成功识别了150例支气管哮喘运动员的两种支气管哮喘表型:特应性支气管哮喘表型和运动性支气管哮喘表型,并发现以上两种表型患者具有不同的临床特征和发病特点[33]。另有研究利用潜在类别分析结合基因组学信息和临床信息,识别了3 001例支气管哮喘患者的4种表型:非活动性/轻度非变应性哮喘(18%)、非活动性/轻度变应性哮喘 (37%)、活动性变应性哮喘(27%)和活动性成人非变应性哮喘(18%)[34]。该研究同时鉴定了15个与支气管哮喘表型相关的单核苷酸多态性,其中大部分与活动性变应性哮喘表型相关[34]。
另外,Wu等[35]使用K均值聚类方法分类支气管哮喘,识别不同哮喘患者对皮质类固醇的反应性。结果显示,在晚发型、肺功能差以及基线嗜酸粒细胞增多的支气管哮喘患者中观察到的皮质类固醇反应最大,而在具有严重气流受限和轻度嗜酸粒细胞炎症的年轻、肥胖女性患者中观察到的皮质类固醇反应最小。
可见,将不同的AI方法应用于支气管哮喘表型分类,可为哮喘患者的管理和个体化治疗提供重要参考价值,尤其是对于难治性支气管哮喘,同时减少不必要的皮质类固醇使用及相关并发症。但基于不同的临床特征及不同机器学习算法所得的支气管表型多样,如何选择合适的临床特征及最优的机器学习算法进行支气管哮喘表型识别,指导支气管哮喘患者个体化治疗需进一步探索。
3.3AI在支气管哮喘评估中应用 支气管哮喘急性发作对患者的生活质量有显著影响,对支气管哮喘患者急性发作的准确预测能为临床医师提供早期干预的空间,然而目前尚缺乏有效指标能准确识别支气管哮喘患者的急性发作风险。基于临床数据的神经网络模型在评估支气管哮喘急性发作方面显示出巨大的性能[36-37]。此外,改进的人工神经网络整合了包括气象和环境污染数据等变量,其预测支气管哮喘患者急性发作风险的总体准确度达81%[38]。
Fitzpatrick等[39]使用潜在类别分析预测学龄儿童的支气管哮喘恶化风险,该研究使用了来自2 593例轻度至中度支气管哮喘儿童的19个人口统计学、临床和实验室变量组成的数据集,分析确定过敏和肺功能是儿童支气管哮喘急性发作的主要预测因素。然而,该研究中的所有数据均来自单一医疗中心,缺乏多中心数据集的验证。
4 小 结
AI为诊断和评估COPD及支气管哮喘提供了一种新的技术方法,其优势在于能分析大量数据间复杂的非线性关系,识别图像数据类型,整合基因组学数据,提高疾病诊断和评估的准确性;另外,AI软件每次被调用时均以相同的方式工作,且不会受到经常强加给医师的临床环境和紧迫压力的影响。但AI技术应用于COPD及支气管哮喘仍处于研究阶段,尚存在很多问题:①机器学习算法多样,同一个数据集使用不同算法所得各个模型的性能并不相同。同样,不同数据集下同一种模型的性能也不相同。因此,为了得到性能最佳的模型,往往需调用多种不同算法进行比较,过程较为烦琐。②AI成功应用于COPD及支气管哮喘诊疗的关键是大样本数据库的建立,而目前研究多集中于单中心或小样本研究。③临床工作者对AI相关理论技术的缺乏大大限制了AI的实际应用。④目前有关AI在COPD及支气管哮喘中的研究多侧重于如何应用AI技术早期诊断疾病及准确预测病情发展,而关于其应用于COPD及支气管哮喘患者治疗药物选择及治疗效果评估的研究较少。因此,未来应建立COPD及支气管哮喘患者大样本数据库,开展医务人员对AI理论技术的学习,探索AI在COPD及支气管哮喘中更多的价值,以推动AI在慢性炎症性气道疾病诊疗相关临床决策中的辅助作用。