基于标准数据集的川崎病临床辅助诊断模型评估研究
2022-10-01谢利剑周媛媛刘如楠徐志鹏丁国徽
刘 威 李 光 蒋 蓓 谢利剑 张 泓 周媛媛 刘如楠 徐志鹏 丁国徽 黄 敏
川崎病(Kawasaki disease,KD)是一种急性自身免疫性系统性血管炎性疾病,常累及冠状动脉,是儿童获得性心脏病致病的主要原因[1],及早发现并治疗KD患儿是临床一线医师的重要任务。目前,KD的临床诊治仍面临诸多难题:① KD的早期诊断缺乏特异性指标[2];②即使接受了大剂量静脉注射免疫球蛋白(intravenous immunoglobulin,IVIG)的免疫调节治疗,临床实践中冠状动脉损伤(coronary artery lesion,CAL)的发生率仍可达5%[3-5];③约15%的KD患儿存在IVIG治疗无应答,这部分患儿CAL的发生率显著增高,其临床诊治相对困难[6]。国内外已报道诸多基于KD临床特征、实验室检查,以及基因检测等指标的研究[7-15]。虽然KD研究模型众多,但尚缺乏简单、高效的临床诊断模型,且因缺乏“明确数据模型标准和患者队列化”的标准数据集,不同KD模型间的可比性有限。因此,建设KD专病标准数据集,评估KD临床辅助诊断模型,以协助KD的鉴别诊断、有效治疗、临床研究和健康管理,对提高该疾病的精确诊治,降低CAL的发生率和有效防治冠状动脉瘤具有重要意义。
在本研究中,本课题组创新性地定义了KD标准数据模型,依据该模型回顾性调查了上海市儿童医院诊治的998例KD患儿的相关资料,构建标准数据集,部署安全计算环境,通过应用本课题组前期建立的KD高危预测模型和IVIG治疗无应答预测模型[9,15],结合日本第6版KD诊断指南[16],对比Kobayashi预测模型[10],从而验证了一种基于标准数据集和隐私计算环境的全新的医学人工智能算法比较模式,以期助力未来医学人工智能在KD临床评估和监管中的应用。
1 对象与方法
1.1 研究对象 选取2017年1月—2021年12月在上海市儿童医院住院的初诊为KD的998例患儿资料,其中包括不完全KD。
1.1.1 纳入标准 参考KD诊断指南制订的纳入标准[16]:①符合5项或6项主要临床特征的患儿,可诊断为完全KD;②符合4项主要临床特征,经心脏超声(简称心超)检查提示CAL的患儿,可诊断为完全KD;③符合3项主要临床特征,经心超检查提示CAL的患儿,可诊断为不完全KD;④如果排除其他疾病,当符合3或4项主要临床特征,且心超检查提示冠状动脉扩张,但具有“其他显著临床特征”中的某些特征的患者,可诊断为不完全KD;⑤排除其他疾病,在仅有1或2项主要临床特征的情况下,也可考虑为不完全KD。主要临床特征:①发热;②双侧球结膜充血;③嘴唇和口腔变化(唇红、杨梅舌、口腔和咽部黏膜弥漫性充血);④皮疹(包括卡介苗接种部位发红);⑤四肢的变化(早期手掌、脚底变红水肿,恢复期指或趾端脱屑);⑥非化脓性颈部淋巴结肿大。其他显著临床特征:①病程早期肝脏转氨酶水平升高;②婴儿期尿常规检查结果显示白细胞计数增多;③恢复期血小板计数增多;④脑钠肽(BNP)或N末端B型脑钠肽前体(NT-proBNP)水平升高;⑤心超检查提示二尖瓣反流或心包积液;⑥胆囊增大(胆囊积水);⑦低蛋白血症或低钠血症。
1.1.2 排除标准 临床资料和实验室检查数据不全;入院前在其他医疗机构接受过IVIG治疗;住院期间没有接受IVIG治疗;在后期随访中能够明确排除KD诊断。
1.1.3 IVIG治疗无应答KD诊断标准 KD标准初始治疗结束后的36 h体温仍高于38 ℃,或用药后2周内(多发生于2~7 d)再次发热,并出现至少1项KD主要临床特征,排除其他可能导致发热的原因。
1.2 各预测模型评分[9-10,15]本课题组建立的KD高危预测模型评分(总分>9分为存在KD高危):CRP>8 mg/L为3分,白细胞计数>10×109/L为3分,年龄≤2岁为2分,发热天数≥3 d为2分,ESR>20 mm/h为2分,D-二聚体≥0.55 mg/L为2分,血清白蛋白<35 g/L为1分。本课题组建立的IVIG治疗无应答预测模型评分(总分<6为IVIG治疗无应答):CRP>10 mg/L为2分,中性粒细胞与淋巴细胞比值(NLR)>2.469为2分,AST>100 U/L为2分,血清白蛋白<35 g/L为2分,纤维蛋白原降解产物(FDP)>5 μg/mL为1分。Kobayashi预测模型评分(总分≥4为IVIG治疗无应答):血钠≤133 mmol/L为2分,AST≥100 U/L为2分,血中性粒细胞百分比≥0.8为2分,IVIG开始治疗时间≤4 d为2分,CRP≥100 mg/L为1分,月龄≤12个月为1分,血小板计数<300×109/L为1分。
1.3 观察指标 所有患儿在住院首日或次日(在接受IVIG治疗前)完善血常规、血生物化学、电解质、凝血功能、ESR等检查。比较KD高危预测模型在不同发热天数患儿中的诊断一致性,比较IVIG治疗无应答预测模型与Kobayashi预测模型的预测效率。
1.4 KD标准数据模型 KD标准数据模型由人口学信息、就诊记录、诊断信息、体格检查、一诉五史(主诉、现病史、既往史、个人史、家族史、预防接种史)、实验室检查、病理学检查、物理检查、治疗及疗效评估、随访10个模块构成。每个模块中定义了相关数据元、来源、数据等级等。
1.5 隐私计算环境 隐私计算环境采用上海国际人类表型组研究院人类表型组科研协同云平台开发的基础环境。在本研究中,KD标准数据模型体系架构见图1。确保数据和算法安全的技术框架采用安全计算沙箱架构,见图2。用户分为外部用户和内部用户,外部用户不可访问私域(本地云)。 数据使用主要分为两部分,第一部分为在院内使用,即私域内进行(包括脱敏检查、质控抽检、保密上传)。 外部用户不能直接使用数据,院内数据需经脱敏检查、质控抽检、保密上传处理后,临时发布到公域的沙箱中,外部用户才能在公域中使用。所有对外数据均需接受监管部门监管。在这种场景下,可以有效保障医用专病标准数据集在使用过程中的合规问题、隐私保护问题,以及确保使用过程可控。
注:KD患者表型数据即KD患者临床特征;EMR为电子病历;HIS为医院信息管理系统;LIS为实验室信息管理系统图1 KD标准数据模型体系架构图
注:NAS(network attached storage)为网络附属存储,是一种存储服务方式。图中实线为直接使用, 虚线则为被监控图2 安全计算沙箱架构图
2 结 果
2.1 标准数据集准备及KD患儿一般情况 本研究纳入的998例患儿均为汉族,月龄为(31.45±23.51)个月。其中,男性 639例(64.03%),女性359例(35.97%)。IVIG治疗实际无应答患儿99例(99/998,9.92%),其中男性65例(65.66%),女性34例(34.34%)。
2.2 新框架下的模型比较
2.2.1 KD高危预测模型判定结果 根据KD高危预测模型评分判定为KD高危的患儿931例(931/998,93.29%),其中在发热病程<5 d的326例患儿中,被判定为KD高危的患儿312例(95.71%);在病程≥5 d的672例患儿中,被判定为KD高危的患儿619例(92.11%)。
2.2.2 IVIG治疗无应答预测模型分析结果 根据IVIG治疗无应答预测模型评分,将患儿分为 IVIG无应答型KD组(315例)和IVIG敏感型KD组(683例)。 与IVIG敏感型KD组相比, IVIG无应答型KD组患儿的FDP、血清白蛋白和AST水平均显著升高(P值<0.01),NLR显著降低(P<0.01)。见表1。
表1 IVIG治疗无应答预测模型分析结果
2.2.3 IVIG治疗无应答预测模型与Kobayashi预测模型预测效率比较结果 IVIG治疗无应答预测模型和Kobayashi预测模型的ROC的AUC分别为0.72(95%CI为0.67~0.78)和0.66(95%CI为0.58~0.70)。IVIG治疗无应答预测模型的灵敏度和特异度均为0.73,Kobayashi预测模型的灵敏度和特异度分别为0.29和0.89。
3 讨 论
目前,不同地区、不同医疗机构间的数据标准不同,医院信息系统产生的数据缺乏同质化、均一化的标准术语体系,无法实现真正意义上的互联、互通及数据的有效整合。制订标准化与规范化的术语集是推进医疗服务同质化与规范化的基础,也是促进临床研究与国际多中心合作交流的基础。我国目前尚缺乏儿童健康管理与专病疾病相关的标准数据集。在国际肿瘤研究领域,形成了如肿瘤基因组图谱(the cancer genome atlas,TCGA)项目为代表的典型标准数据集[18](https://www.cancer.gov/tcga),而在其他疾病领域,少有同等规模的数据采集项目。这种以标准数据集为基础的研究思路可以用于所有专病。至截稿时,国内外尚无关于KD的标准数据集发布。因此,全面、规范地制订标准数据集,提高KD疾病诊治的准确性和同质性,以实现早发现、早诊断、早治疗、早管理的儿童健康与疾病全周期性规范化、统一化管理的模式显得十分迫切。在大数据和大模型逐步融入临床研究和诊疗工作的过程中,标准数据集的建立是一个临床研究方向成熟的标志。
本文基于标准数据集,回顾性分析了2017年1月—2021年12月在上海市儿童医院住院的998例初诊为KD的患儿资料。依据前期本课题组研发的KD高危预测模型,其中被判定为KD高危的患儿931例(93.29%),发热病程<5 d的326例患儿中被判定为KD高危的患儿312例(95.71%),表明该模型在各类型KD患儿中具有较高的诊断一致性,可作为KD诊断的重要参考依据。同时,在这998例初诊KD的患儿中,有99例(9.92%)对IVIG治疗无应答,结合应用本课题组前期研发的IVIG治疗无应答预测模型,IVIG治疗无应答的灵敏度和特异度均为0.73,ROC的AUC为0.72(95%CI为0.67~0.78);而Kobayashi预测模型的灵敏度和特异度分别为0.29和0.89,ROC的AUC为0.66(95%CI为0.58~0.70)。上述结果提示,本课题组IVIG治疗无应答预测模型预测汉族KD患儿IVIG治疗无应答的效率略优于Kobayashi预测模型,灵敏度高于Kobayashi模型,但特异度略低于Kobayashi预测模型。与大多数已报道的预测模型[19-21]相比,本课题组建立的IVIG治疗无应答预测模型在灵敏度和特异度方面具有一定的优势, 但就临床应用而言,该模型的预测灵敏度和特异度仍不够理想(<0.80),表明该评分系统还有待进一步完善,或采用新的思路寻找更理想的预测方法。在此基础上,未来本课题组将收集多中心数据进一步系统、全面地探索KD的诊治。
综上所述,随着精准医学和大数据技术的发展,KD专病标准数据集的构建和应用进一步提升了临床KD的诊治水平。标准数据集的开发是一项系统工程,需运用科学、适宜的方法论,才能保证研究的合规性和持续性。本研究使用院内搭建的隐私计算环境对KD专病标准数据集进行处理分析,有利于打破机构之间的数据壁垒,实现高效、高质量临床信息资源的整合利用。相信在建立多中心专病标准数据集后,将进一步加速KD诊治技术的创新工作。