APP下载

基于机器学习的脑出血分型评估血肿扩大

2023-04-29杨凯白映红王智房建忠郝解贺

临床神经外科杂志 2023年2期
关键词:机器学习脑出血

杨凯 白映红 王智 房建忠 郝解贺

【摘要】 目的 通过无监督机器学习算法将自发性脑出血分为不同的类型,评估急性期可能出现血肿扩大的患者。方法 收集2018年7月—2020年12月晋中市第一人民医院收治的348例自发性脑出血患者的临床资料和影像学数据,采用3D Slicer软件描记血肿并提取影像学特征,使用无监督学习算法将这些患者分为不同的类型。不同分型间进行了临床基线特征、是否出现血肿扩大和患者预后的比较。结果 最终共选定166个特征,包括54个临床特征和112个影像学特征,通过无监督学习方法分为A、B、C、D、E 5个不同的分型,不同分型间比较提示有多个特征存在显著差异(P<0.05),其中D型和E型发生血肿扩大的比例较高。与未发生血肿扩大相比,发生血肿扩大的患者入院时GCS评分低(t=2.214 4,P<0.05),初次头颅CT检查的血肿量较大(t=3.940 7,P<0.05),中线结构移位明显(t=2.001 3,P<0.05),预后更差(t=4.953 4,P<0.05)。结论 首次头颅CT检查显示出血量偏大、中线移位明显、GCS评分低的自发性脑出血患者发生血肿扩大的可能性大、预后差。可以通过整合临床资料和头颅CT影像数据,使用无监督学习算法对自发性脑出血患者进行分型,辅助临床预测及判断。

【关键词】 脑出血;血肿扩大;机器学习;无监督学习

【中圖分类号】 R651 【文献标志码】 A 【文章编号】 1672-7770(2023)02-0141-06

Abstract: Objective To classify spontaneous intracerebral hemorrhage(SICH) into different types to assess patients who may experience hematoma enlargement during the acute phase by using unsupervised machine learning algorithms. Methods The clinical data and imaging data of 348 patients with SICH who hospitalized in the First People's Hospital of Jinzhong from July 2018 to December 2020 were collected. By 3D Slicer software,the hematoma was recorded and the imaging features were extracted. Then unsupervised learning algorithm was used to categorize these patients by similarities in clinical and imaging parameters. Results A total of 166 features, including 54 clinical features and 112 imaging features were selected. Through unsupervised learning, five different types of ABCDE were classified. The comparison between different types suggested significant differences in multiple characteristics(P<0.05), with a higher proportion of hematoma enlargement occurring in type D and type E. Compared with patients without hematoma enlargement, patients with hematoma enlargement had a lower GCS score on admission(t=2.214 4,P<0.05), a larger hematoma volume on initial head CT examination(t=3.9407,P<0.05), a significant displacement of the midline structure(t=2.001 3,P<0.05), and a worse prognosis(t=4.953 4,P<0.05). Conclusions The first cranial CT scan showed that patients with SICH who have a large amount of bleeding, significant midline displacement, and low GCS score have a higher probability of hematoma expansion and a poor prognosis. By integrating clinical data and skull CT image data, unsupervised learning algorithms can be used to classify patients with spontaneous cerebral hemorrhage to assist in clinical prediction and judgment.

Key words: spontaneous intracerebral hemorrhage; hematoma expansion; machine learning; unsupervised learning

基金项目:山西省卫生健康委科研课题计划项目(2020156)

作者单位:030600 晋中,晋中市第一人民医院神经外科(杨凯,白映红,王智,房建忠);山西医科大学第一医院神经外科(郝解贺)

通信作者:郝解贺

自发性脑出血(spontaneous intracerebral hemorrhage,SICH)指非创伤因素所致的脑实质内的出血,多由高血压引起,病情进展迅速、差异较大,病变转归不确定性也较大,临床工作中常常无法及时观察到患者的病情变化。早期、快速识别血肿扩大高危患者,可以采取相应的干预措施从而改善预后[1]。无监督机器学习可以根据多种特征(包括但不限于人口统计学特征、既往病史、相关检查等)将患者进行分型[2],来分析不同分型间的特征及预后的差异。本研究收集2018年7月—2020年12月晋中市第一人民医院收治的348例SICH患者的临床资料和影像学数据(DICOM格式),基于无监督学习算法,通过临床资料和头颅CT影像学特征将不同的SICH患者进行分型,以利于采取不同的治疗策略,更好地诊治脑出血患者并改善其预后。

1 资料与方法

1.1 一般资料 共纳入348例患者,其中男215例(61.78%),女133例;年龄28~89岁,平均年龄(61.60±11.78)岁;此次发病前诊断有高血压者226例(64.94%),68例(19.54%)既往服用了阿司匹林,入院时GCS评分均值为12.71,基线血肿体积为(18.43±16.53)mL;出血位于丘脑和基底节区为258例(74.14%)、脑叶为59例(16.95%)、幕下为31例(8.91%);出现血肿扩大者42例(血肿增加>6 mL,12.07%)。纳入标准:(1)年龄满18周岁;(2)首次CT检查时间在发病后24 h以内;(3)血肿位于脑实质且发病48 h内复查了头颅CT。排除标准:(1)伪影严重;(2)进行手术治疗以及出血原因明确为创伤、动脉瘤、血管畸形、血液病等。所有患者均签署知情同意书,且本研究获得晋中市第一人民医院伦理审查委员会的批准。

1.2 血肿扩大的判断 分别将首次及复查的头颅CT原始数据导入3D Slicer软件(v4.11),逐层描记血肿边界测得血肿体积,不包括脑室内和蛛网膜下腔的出血,对于部分血肿破入脑室或蛛网膜下腔边界不清之处,可根据脑室或脑沟的轮廓来大致判断。血肿体积增加6 mL以上者确定为血肿扩大。

1.3 影像数据处理及特征提取 将所有患者的首次头颅CT数据分别导入3D Slicer软件(v4.11),手工逐层描记原发出血部位的血肿边界形成ROI区,导出模型,通过python(3.7.5)的radiomics模块提取影像学特征(图1A)。

1.4 基线特征和数据预处理 收集患者的基线特征,包括临床信息、既往病史及用药史、个人史、入院时体征、入院后首次实验室检查(血细胞分析、肝功、肾功、离子、随机血糖、血凝等)及头颅CT影像学表现(包括血肿量、出血部位、是否破入脑室、中线移位情况)。将收集到的特征全部转换为数字形式,删除缺失数据≥20%、Pearson相关系数≥0.8的特征。根据均数、标准差来填充缺失数据。

1.5 无监督机器学习 采用python(3.7.5)分析临床资料及影像学特征,对每位患者的临床参数以及影像DICOM数据和ROI数据进行分析。通过无监督学习算法分析,使用sklearn模块将输入数据进行标准化处理后进行降维(2维),使用Kmeans模块进行聚类(图1B)。

1.6 统计学分析 分类变量以计数和百分比表示,采用χ2检验评估不同分型间的差异。连续变量用均数±标准差(x-±s)表示,采用方差分析或t检验评估不同分型间或组间差异。以P<0.05认差异为有统计学意义。

2 结 果

2.1 特征提取及预处理 共收集到130个临床参数,筛选确定了54个临床特征,这些基线特征数据缺失0~18.4%。根据头颅CT影像原始数据和手工绘制的ROI区域,提取了129个影像学特征,筛选确定了112个特征。最终共选定了166个特征输入机器学习算法(图1、表1)。

2.2 机器学习分型结果 依据选定的166个特征使用无监督机器学习的方法将病例进行分型(即聚类),尝试分为2~10型多个不同的分型方案,比较发现五型方案最佳,将整个患者群体分为A、B、C、D、E共5型,即5个具有不同临床和影像学特征的分型(图1)。其中A型出现血肿扩大(>6 mL)的比例最低,为1.92%,且血肿增加量超过>12 mL的比例为0,发病后30 d的mRS评分为(2.04±1.52),预后最佳。而E型出现血肿扩大(>6 mL)达28.26%,预后也最差,30 d的mRS评分为(4.10±1.45)。见表1。

2.3 不同分型间基线特征及预后的比较 A型中有52例患者,年龄(66.13±10.14)岁,高于平均年龄,既往诊断糖尿病、脑梗死者比例较高,吸烟、饮酒者少,发病后意识障碍程度轻,初始血肿体积较小,(3.11±2.11)mL,中线结构移位不明显。B型有88例患者,服用阿司匹林比例高,发病后意识清楚者比例高,GCS评分较高。C型67例患者,男性居多,达74.63%,既往饮酒者居多,初始血肿体积较大。D型95例,既往患有高血压、糖尿病、脑出血者较多,发病后意识清楚者比例低。E型患者46例,男性比例高,69.57%,平均年龄大,(66.54±13.14)岁,既往有高血压病史的患者比例较其他组低,既往患脑出血、脑梗死及服用阿司匹林等药物者少,入院后GCS评分偏低,初始血肿量为(47.02±18.20)mL,中線结构移位明显,破入脑室、蛛网膜下腔者较多,脑叶出血比例高(表1)。

不同分型间比较差异显著,有统计学差异(P<0.05)的特征包括性别、年龄、高血压病史、饮酒史、意识障碍、GCS评分、首次CT出血量、出血部位、白细胞计数等(表1)。不同分型间血肿扩大和预后分析显示,A型发生血肿扩大的比例最低,预后也最好。B型与A型接近。C型出现血肿扩大的风险高于A、B两型,预后也较差。E型出现血肿扩大的风险最高,>6 mL者13例(28.26%),>12 mL者8例(17.39%),发生血肿扩大的患者较多,血肿增加量较大,总体预后最差。D型发生血肿扩大的风险也比较高,但预后比E型好(表2)。不同分型间血肿扩大和30 d mRS评分的比较统计学意义显著(P<0.05)。见表1。

2.4 血肿扩大相关因素分析 根据是否发生血肿扩大,将患者分为血肿扩大组和无血肿扩大组。组间比较显示,与无血肿扩大组相比,血肿扩大组入院时GCS评分低(t=2.214 4,P<0.05),初次头颅CT检查的血肿量较大(t=3.940 7,P<0.05),中线结构移位明显(t=2.001 3,P<0.05),预后更差(t=4.953 4,P<0.05)。见表3。

3 讨 论

SICH起病急,进展迅速,病死率、致残率高[1]。丘脑和基底节区是最常见的出血部位,可破入脑室或蛛网膜下腔。中国约46%的脑出血患者在发病1年内死亡或严重残疾[3]。出现血肿扩大是病情进展、导致患者死亡的重要因素之一。早期血肿扩大者预后差、死亡率高[4]。脑出血早期血肿扩大导致患者神经功能迅速恶化,是预后不良的重要预测因素。血肿扩大是脑出血患者临床干预的一个指征,是临床医师进行治疗决策、手术时机、术式选择及预后评估的重要依据,因此预测血肿扩大具有重要意义[5]。

目前脑出血患者出现血肿扩大的影像学特征相关研究为一大热点,包括CTA点征[6]和NCCT影像标志物,如血肿内低密度、黑洞征、漩涡征、混合征、血肿密度不均匀、血肿形状不规则、岛征、卫星征等[7-15],以及预测量表[16-17]。依据有无这些影像学特征分组进行比较研究,来判断这些特征是否为血肿扩大的风险因素,筛选血肿扩大可能性高的患者,进一步指导治疗和判断预后。然而,这些影像学特征的评估主观性较强,评判者一致性差,评定复杂,不便操作,耗时耗力,漏诊率高,准确率差,评估不精确。根据某一个特征对研究人群进行分组后,组内患者的异质性显著,组间其他特征也难以做到基线一致,研究人员还可能根据自己希望的结论有选择性地纳入病例、剔除不利于论点的病例,因此研究结果的可信度较低,选择多个分组依据同时进行分组,增加分组数量,仍无法克服这些弱点。此外,患者的临床特征有许多个,某一个特征无法完整描述患者的疾病特点,SICH患者出现血肿扩大、预后差的原因可能不是某一个或数个特征所致,而是由患者的所有临床信息(包括临床表现、既往病史、实验室检查、影像学检查等)共同所致,依据少数特征对患者分组存在一定的局限性。

近年来随着人工智能机器学习技术的发展,已经应用于多种疾病的临床诊断及结局预测[18-21]。无监督学习是一种机器学习方法,根据多个特征发现患者之间的相似性,将相似的患者聚类在一起,就可以分析相似个体的特征,并将它们与病情变化或预后联系起来[2]。本研究引入影像组学与人工智能的方法,将临床指标和影像学特征综合考虑,即把患者全部可能有关的医学信息作为分组依据,将纳入的研究病例分为不同的类型,不同分型的患者出现血肿扩大的概率不同,以此来预测血肿扩大的风险。通过整理分析收集到的全部信息,最终选定166个特征作为分组依据,包括54个临床特征和112个头颅CT影像学特征,将这些特征进行标准化处理后降成二维,然后使用Kmeans聚类法,根据数据之间的内在关系,把SICH患者划分为不同的类型,同一分型的患者相似度高,不同分型间的患者相似度低。尝试了分为2~10型多个不同的分型方案,发现分为5个类型后,血肿体积增大及预后的分型间比较差异最为显著,所以最后选择了A、B、C、D、E 5型的分型方案。临床工作中可以通过该方法将新入院患者归属于其中一个型,以此来评估出现血肿扩大的可能性和判断预后,比如某患者属于E型,则血肿扩大风险高、预后差,即使当前出血量不大,也需警惕发生血肿扩大的风险,应密切观察神经系统功能变化,及时复查CT,做好手术准备,告知预后不良可能。该分型方案中,性别、年龄、高血压病史、饮酒史、意识障碍、GCS评分、首次CT出血量、出血部位等特征在不同分型间比较差异显著,可能对分型的作用较大。

此外,许多研究提出,血肿扩大的相关因素包括发病到首次头颅CT时间,基线血肿体积,GCS评分,服用抗凝、抗血小板药物,血小板计数及功能,纤维蛋白原等[22-23]。本研究进一步分析了导致血肿扩大的风险因素,提示出现血肿扩大的患者GCS评分低,血肿量大,中线结构移位明显。脑内血肿量较大时,血肿的占位效应对周围脑组织造成牵拉,由于剪切作用撕裂周围多个微小动脉破裂诱发活动性出血,导致血肿稳定性差,从而导致继发性出血和血肿再扩大[22,24-26]。 凝血功能异常的SICH患者发生血肿扩大的风险高[9-10,25,27]。本研究中,存在血小板计数异常和凝血功能障碍的患者已被剔除,相关指标在正常范围内的波动可能不是导致血肿扩大的原因。既往服用阿司匹林可能是导致脑出血的高危因素[27],但是否会导致血肿扩大尚不清楚,其他抗血小板药物和抗凝药物的使用比例偏低,分析结果可能不准确。

本研究的价值在于开发了一种基于人工智能的SICH影像组学分型方法,不同分型间比较差异显著证明该分型方案有效、可行。当然该分型方法及过程较为复杂,可以把运行代码编译为临床应用软件进行操作,使用人工智能工具来辅助临床诊疗,为临床医生筛选血肿扩大高危人群提供高效便捷的工具。下一步将纳入更多的病例数来测试其稳定性,扩大纳入标准增加适用范围,与其他分组方案进行比较证实其优越性。

[參 考 文 献]

[1]中华医学会神经外科学分会,中国医师协会急诊医师分会,中华医学会神经病学分会脑血管病学组,等.高血压性脑出血中国多学科诊治指南[J].中国急救医学,2020,40(8):689-702.

[2]Cikes M,Sanchez-Martinez S,Claggett B,et al.Machine learning-based phenogrouping in heart failure to identify responders to cardiac resynchronization therapy[J].Eur J Heart Fail,2019,21(1):74-85.

[3]Wang WZ,Jiang B,Sun HX,et al.Prevalence,incidence,and mortality of stroke in China:results from a nationwide population-based survey of 480 687 adults[J].Circulation,2017,135(8):759-771.

[4]Sporns PB,Kemmling A,Minnerup J,et al.Imaging-based outcome prediction in patients with intracerebral hemorrhage[J].Acta Neurochir(Wien),2018,160(8):1663-1670.

[5]Liu JJ,Xu HL,Chen Q,et al.Prediction of hematoma expansion in spontaneous intracerebral hemorrhage using support vector machine[J].EBioMedicine,2019,43(5):454-459.

[6]庫洪彬,孟志勇,张卫民,等.CTA点征在中等量脑出血超早期手术方式选择中的应用价值分析[J].中华神经医学杂志,2020,19(7):689-694.

[7]Yu ZY,Zheng J,He MY,et al.Accuracy of swirl sign for predicting hematoma enlargement in intracerebral hemorrhage:a meta-analysis[J].J Neurol Sci,2019,399(2):155-160.

[8]Yang WS,Zhang SQ,Shen YQ,et al.Noncontrast computed tomography markers as predictors of revised hematoma expansion in acute intracerebral hemorrhage[J].J Am Heart Assoc,2021,10(3):e018248.

[9]毛益光,孙青,陈罡.自发性脑出血发生血肿扩大的影响因素分析[J].中华神经外科杂志,2022,38(1):89-93.

[10]王希,仲艳,颜伟,等.CT平扫岛征和黑洞征对原发性脑出血早期血肿扩大的预测价值[J].中华神经外科杂志,2021,37(6):557-561.

[11]孙帆,周赤忠,罗宽.岛征与凝血功能对高血压脑出血血肿扩大预测价值研究[J].中风与神经疾病杂志,2021,38(10):1075-1078.

[12]杨文松,李琦,王星辰,等.CT平扫混合征和黑洞征及其联合征象对脑出血患者早期血肿扩大的预测价值[J].中国脑血管病杂志,2017,14(11):561-565,579.

[13]王业青,时代,陆宽,等.CT平扫漩涡征与黑洞征在预测脑出血早期血肿扩大中的价值研究[J].中华神经医学杂志,2020,19(1):29-35.

[14]王玉才,王会,张梅.黑洞征和岛征对急性自发性脑出血血肿扩大的预测价值[J].临床神经病学杂志,2019,32(4):273-277.

[15]贺桂女,郭好战,韩雄.预测脑出血早期血肿扩大的非增强CT征象[J].中华神经科杂志,2018,51(8):649-652.

[16]Morotti A,Dowlatshahi D,Boulouis G,et al.Predicting intracerebral hemorrhage expansion with noncontrast computed tomography:the BAT score[J].Stroke,2018,49(5):1163-1169.

[17]李子聪,孔祥宇,黄鸿翔,等.基于平扫CT征象的脑出血早期血肿扩大预测量表[J].临床神经外科杂志,2021,18(4):375-380.

[18]Ehteshami Bejnordi B,Veta M,Johannes van Diest P,et al.Diagnostic assessment of deep learning algorithms for detection of lymph node metastases in women with breast cancer[J].JAMA,2017,318(22):2199-2210.

[19]Ting DSW,Cheung CYL,Lim G,et al.Development and validation of a deep learning system for diabetic retinopathy and related eye diseases using retinal images from multiethnic populations with diabetes[J].JAMA,2017,318(22):2211-2223.

[20]陈凯,佘华龙,吴涛,等.9种机器学习模型预测幕上深部自发性脑出血早期血肿扩张及预后不良的比较[J].中华解剖与临床杂志,2022,27(9):601-607.

[21]常健博,姜燊种,陈显金,等.基于卷积神经网络的自发性脑出血血肿分割方法的一致性评价[J].中国现代神经疾病杂志,2020,20(7):585-590.

[22]刘彪,王鹏,周游.高血压性脑出血病理解剖学与病理生理学的研究进展[J].中国临床神经外科杂志,2022,27(7):604-606.

[23]殷友永,石碑田,徐礼林.高血压脑出血早期血肿扩大的危险因素及入院时GCS评分联合血糖水平的临床预测价值[J].中风与神经疾病杂志,2020,37(5):424-428.

[24]Schlunk F,Bhm M,Boulouis G,et al.Secondary bleeding during acute experimental intracerebral hemorrhage[J].Stroke,2019,50(5):1210-1215.

[25]张爽,曾敏灵,郭春保,等.原发性脑出血患者血肿增大的影响因素及血栓弹力图参数的预测价值[J].中国实用神经疾病杂志,2021,24(14):1232-1238.

[26]张巧莹,周俊林.预测脑出血血肿扩大研究进展[J].中国医学影像技术,2019,35(3):443-446.

[27]蒋小兵,高文文,赵海康.高血压脑出血术后再出血危险因素的Meta分析[J].临床神经外科杂志,2021,18(2):209-213.

(收稿2022-09-08 修回2022-10-05)

猜你喜欢

机器学习脑出血
中西医结合治疗脑出血的疗效观察
老年人摔倒 警惕迟发性脑出血
脾切除后伴发脑出血1例并文献复习
基于词典与机器学习的中文微博情感分析
基于网络搜索数据的平遥旅游客流量预测分析
前缀字母为特征在维吾尔语文本情感分类中的研究
基于支持向量机的金融数据分析研究
机器学习理论在高中自主学习中的应用
纳洛酮在脑出血治疗中的应用探析
脑出血微创置管吸引术对老年脑出血患者血清IL-6、TNF-α和hs-CRP的影响分析