基于人工智能的儿童甲流和乙流辅助诊断模型研究

2021-12-07葛小玲尚于娟王传清静施胡子欣张晓波

复旦学报(医学版) 2021年6期

葛小玲尚于娟徐锦曾玫王传清李静施宇王一胡子欣徐虹张晓波

（1国家儿童医学中心/复旦大学附属儿科医院统计和数据管理中心，2临床检验中心，3感染传染科，4院内感染控制与防保办公室，7肾脏科，8呼吸科上海 201102；5万达信息股份有限公司数据中心上海 201112；6 复旦大学生命科学学院上海 200433）

流行性感冒（流感）是由甲、乙、丙等分型流感病毒导致的急性上呼吸道传染病，其中甲型和乙型病毒具有高度传染性，容易造成大范围甚至世界性的大流行[1］。流行病学研究显示，近年来儿童占全部流感确诊患者的比例＞60%[2］，＜2岁易发生严重并发症[3］，且临床症状并不典型，极易与普通感冒或急性呼吸道感染相混淆，早诊断、早治疗对降低儿童流感危害、控制疾病进程、防止并发症具有重要意义。流感早期诊断途径包括血常规、病毒核酸检测、病毒抗原检测等，通过鼻咽拭子检测及血常规检验是临床最快捷、常用的方法。多项研究显示，甲、乙流患者血常规数值差异明显[4］。

在大数据时代，通过医疗大数据+ 人工智能（artificial intelligence，AI）可应用于流感流行趋势预测、疾病转归、辅助诊断等多个方面[5-7］，所采用的研究数据包括但不局限于外源性天气数据、互联网搜索数据[5］、国家流感监测数据[8］和电子病历记录（electronic medical record，EMR）等。在疾病辅助诊断领域，结合大数据量级的EMR 记录和其他相关信息学习后，算法可在很短的时间内完成复杂的分析任务，并根据输入信息反馈出最佳的分类模式结果，辅助医师提高患者诊断的准确性和效率。Sauthier 等[9］通过机器学习算法、随机森林机器学习算法和Logistic 回归，预测了258 名小儿重症流感患者的长期急性低氧性呼吸衰竭，实现住院期间的早期确诊；广州妇儿医院利用2016年到2017年7月的136万例EMR 数据开发出用于儿科55 种疾病的AI诊断系统，其中在31万余例原发性呼吸系统疾病中诊断流感的正确率达94%[10］，但模型迁移性和临床应用价值仍待研究。现阶段鲜有将AI 技术专项用于儿童流感辅助诊断的研究。

本研究以2013年1月—2020年6月在上海单中心门诊就诊的数百万呼吸道感染性疾病患儿为研究对象，纳入基本特征信息（包括年龄和性别、鼻咽拭子及血常规检验数据），建立专项鉴别甲流、乙流感染阳性的AI 辅助诊断模型，协助开展传染病门诊诊前预诊。

资料和方法

数据来源考虑到医院门诊新旧信息系统更迭及过去门诊数据存在完整性不足的问题，本次分析从门诊HIS/EMR 系统选取2013年1月—2020年6月间就诊且具有血常规检验记录的呼吸道感染疾病门诊患儿为研究对象。

诊断标准以病原体胶乳检测（鼻咽拭子）结果作为甲流、乙流感染病例组纳入标准。甲流病例组：甲流阳性且乙流阴性；乙流病例组：乙流阳性且甲流阴性；对照组：病原体胶乳检测阴性或未做该项检测。

图1 研究对象纳入流程Fig 1 The inclusion process of research objects

统计学分析对计量资料，即连续性连续型变量资料，使用±s进行统计描述，两组样本间采用配对t检验确定差异；对计数资料，即结果表现为属性特征的资料使用频数分析，采用χ2检验确定差异，P＜0.05 为差异有统计学意义；使用Python 软件进行数据处理和统计分析。

模型构建本研究分别采用逻辑回归（Logistics regression，LR）模型和梯度提升决策树（gradient boosted decision tree，GBDT）模型两种机器学习算法针对甲流病例组、乙流病例组进行调参、训练和测试，构建辅助诊断模型。通过计算模型特征重要性，探索对疾病诊断具有重要价值的临床指标。

模型算法

LR 模型 LR 是一种在疾病预测研究中十分常用的广义线性回归分类模型，通过输入未知样本的特征属性，可计算出样本属于某一类别的概率[11］。

GBDT 模型 GBDT 是机器学习算法中对真实分布拟合得最好的算法之一，通过设定阈值，大于阈值为正例，反之为负例，适用于分类、回归问题，并能够筛选特征，是目前医学诊断研究中最常用的模型之一[12-13］，模型构建流程见图2。

图2 辅助诊断GBDT 模型构建流程图Fig 2 Flow chart of auxiliary diagnostic GBDT model construction

数据处理数据集成：不同时期数据库结构存在差异，采用门诊号＋日期模糊匹配。数据变换：将字符类型变量转换为模型可以识别的数值变量。缺失值处理：分别采用均值填充法和众数填充法来处理连续型变量和类别型变量缺失值。数据归一化处理：为消除不同指标之间的量纲影响，采用最大值-最小值标准化方法，将原始指标缩放到0-1 区间内，使各指标处于同一数量级。

特征选择基于门诊患者血常规检验指标实现对疾病的辅助诊断，选择检测率较高的血常规指标作为模型特征。

样本处理每一组模型病例组样本和对照组取样比例为1∶1。采用10 折交叉验证法，使用9 个子集的并集作为训练集，剩余1 个子集作为测试集，最终返回10 次测试结果的均值。

模型评价根据模型测试结果，采用精确率（查准率）、召回率（查全率）、F1 值、ROC 曲线、AUC值和模型概率预测箱型图多种指标评估模型效果，以衡量模型的泛化能力，并对比两种模型在分类性能上的差异。AUC 越接近1.0 真实性越高。

结果

一般情况2013年1月—2020年6月期间5503350例门诊常见呼吸道感染疾病患者中，做过血常规检验的共计3199113例，纳入为本研究对象。其中做过病原体胶乳检测（鼻咽拭子）的共303944例（9.5%），确诊为流感阳性共计63101例，单甲流感染阳性38094例（60.37%），单乙流感染阳性24792例（39.29%），甲乙流合并感染阳性215例（0.34%）。患儿年龄分布显示，甲流病例组和乙流病例组平均年龄分别为4.59岁和5.73岁，乙流患儿年龄相对较大；患儿性别分布显示，甲流病例组和乙流病例组男女性别比分别为1.22∶1 和1.19∶1，男童发病率高于女童。研究对象中未做过鼻咽拭子检测病例2895169例（90.5%），鼻咽拭子检测结果为阴性240843例，将两者合并作为对照组（3136012例）。

模型特征选择患儿性别、年龄和血常规检验完整率超过20% 的22 个指标（表1）作为模型训练特征值。鉴于已有研究发现的中性粒细胞/淋巴细胞比值在不同分型流感患者中具有明显差异[14-15］，将其一同纳入，共计25 个特征值。

表1 血常规各项指标检测情况Tab 1 The detection of various indexes in blood routine test

模型结果在模型构建前，对病例组及对照组间纳入的各类指标进行统计检验。除乙流病例组与对照组的嗜碱性粒细胞百分比之外，其他指标的差异均有统计学意义。甲流、乙流病例组的血小板、嗜酸性粒细胞百分比、淋巴细胞百分比、白细胞、C 反应蛋白、淋巴细胞绝对值、嗜酸性细胞计数显著低于对照组，单核细胞百分比、中性粒细胞百分比、中性粒细胞/淋巴细胞比值显著高于对照组（表2）。属性类特征中，病例组男童比例明显高于女童（表3）。

表2 甲流/乙流与对照组计量特征统计检验结果Tab 2 Statistical results of measurement data of Flu A/B and control group

表3 甲流/乙流与对照组属性特征统计检验结果Tab 3 Statistical results of attributive characteristics of Flu A/B and control group （n）

对于二分类的模型，当计算两组数据量一致时可达到较佳的分类效果，经数据处理，在模型构建时纳入甲流病例组及对照组各38094例，乙流病例组及对照组各24792例，分别进行甲流及乙流辅助诊断模型的训练和验证。

模型性能比较利用查准率、查全率和F1 值等多种指标评估模型效果（表4）。从ROC 曲线和模型概率箱型图（图3～4）可看出，两类算法均具有较好的性能，模型能够比较准确地从呼吸道感染性疾病患者人群中检测出甲流、乙流阳性，在实际应用场景中，模型可发挥辅助诊断的作用。相比于Logistics 模型，GBDT 模型的分类性能更好（AUC=0.894，0.895，0.902），在鉴别乙流与非乙流阳性时性能最佳（AUC=0.902），已接近医师诊断水平。

图3 Logistics 模型（左）及GBDT 模型（右）模型ROC 曲线图Fig 3 ROC curves of Logistics model（left）and GBDT model（right）

表4 模型结果Tab 4 The model results

模型特征重要性通过计算模型特征重要性得出区分阳性病例组及对照组的关键因素（图5）。甲流辅助诊断GBDT 模型前5 个特征为年龄、单核细胞百分比、白细胞、淋巴细胞绝对值和C 反应蛋白；乙流辅助诊断模型GBDT 模型前5 个特征为年龄、单核细胞百分比、嗜酸性细胞计数、白细胞和血小板。

图5 甲流、乙流GBDT 模型特征重要性排序Fig 5 Sequence of feature importance of GBDT model for Flu A and Flu B

讨论

流行性感冒具有季节性流行和周期性爆发的特点，儿童属高危人群，其发病率及感染率最高。本次分析结果显示，该单中心医院历年流感病例中，主要为甲型流感病例，乙流病例组患儿相对甲流病例组平均年龄更大。男性患儿约占比55%，发病率略高于女性，通过文献检索，证实与国内近年来多项调查结果基本一致[16-17］。本文采用两种模型进行流感病例的辅助诊断实验并比较模型结果，其中GBDT 模型在鉴别乙流与非乙流阳性时性能最佳，AUC 值高达0.902，已接近医师诊断水平。LR模型因其形式简单、可解释性好在前期得到广泛应用，但其在自动发现有效的特征并组合特征方面不及GBDT 模型。另外，相比于LR 模型，GBDT 模型利用患儿特征，通过对二分类问题的回答来得到阳性病例更符合临床医师的思维方式。

图4 Logistics 模型（左）及GBDT 模型（右）模型概率箱型图Fig 4 Model probability box diagram of Logistics model（left）and GBDT model（right）

经特征重要性计算，血小板、白细胞、C 反应蛋白、淋巴细胞绝对值、嗜酸性细胞计数、年龄、单核细胞百分比是本研究中可以判断患儿是否感染甲流或乙流的重要特征，与对照组存在较为显著的差异。这可能与不同病原体引起各类血细胞敏感反应不同，作为一种急性呼吸道传染疾病，流感起病急、传染性强，通过血常规可与一般细菌性感染进行区分。已有多项研究发现，白细胞计数、中性粒细胞百分比等指标在甲流及乙流患儿间比较差异均有统计学意义[2，18-19］，甲流患儿白细胞计数及中性粒细胞升高更明显[20］。此外，流感合并肺炎支原体感染患儿易发展为重症病例，本研究中乙流病例组肺炎支原体阳性率（21.18%）高于甲流组（16.93%），与国内已有研究一致[21］，提示我们在诊断之余须重点关注流感合并IgM 阳性、尤其是乙流患者后续转化为重症的可能性，其他呼吸道病原的临床检验由于检验率未达到本研究纳入标准而未被纳入。本文的研究还存在一定的不足之处和局限性，感染性疾病在儿科发病率极高，感染原因包括但不限于各类细菌、病毒、真菌、支原体、衣原体、寄生虫感染。此外，生理、药物治疗以及检测相关因素也可能导致检验结果异常[22］。本研究未对照实验室检查结果对非流感病例感染原因进行具体区分，有待进一步完善和改进。应用血常规检验进行流感（甲流/乙流）的辅助诊断具有一定的可行性，然而后续在尝试对两者进行鉴别区分时模型表现一般，单纯以这25 个特征来区分甲流和乙流人群仍具有一定难度，未来将结合甲、乙流患儿临床病历及住院数据进一步加强模型鉴别能力。

本文所研究的基于AI 的辅助诊断模型通过训练大量呼吸道感染性疾病患者血常规特征数据，在实际应用场景中能较为准确地从呼吸道感染性疾病患者人群中检测出“甲流感染阳性”及“乙流感染阳性”人群，且纳入数据结构简单，可在其他医疗中心部署应用，模型可迁移性高。该模型可帮助医师判断患者是否进行病原体胶乳鼻咽拭子检测，协助开展传染病诊前预检，缩短就诊流程，减少院内交叉感染。

通过结合甲流、乙流患儿临床病历及住院数据，可进一步优化模型诊断能力，为临床辅助诊断提供可靠的决策支持，并基于人机诊断结果对比开展随机对照试验，为模型诊断能力提供可循的依据。

作者贡献声明葛小玲论文构思、撰写和修订。尚于娟数据收集和保存，文献调研，论文撰写。徐锦，曾玫，王传清监督指导，数据解释。李静提供分析工具。施宇数据统计和建模。王一，胡子欣研究咨询，可行性分析。徐虹获取资助，研究设计，论文修订。张晓波研究设计，数据解释，论文修订。

利益冲突声明所有作者均声明不存在利益冲突。