基于区域放射学相似性网络脑胶质瘤预后模型的构建
2024-05-07王凝瑞温静
王凝瑞 温静
[收稿日期]2023-11-14; [修訂日期]2024-01-01
[基金项目]国家自然科学基金项目(32000795)
[第一作者]王凝瑞(1995-),男,硕士研究生。
[通信作者]温静(1974-),女,硕士,教授,硕士生导师。E-mail:wj952020@163.com。
[摘要] 目的
使用无创的区域放射学相似性网络(R2SN)方法获取胶质瘤肿瘤组织信息,构建脑胶质瘤的预后预测模型。
方法 使用R2SN结合基因相似性网络,计算胶质瘤病人与健康对照间的差异基因。采用使用基因表达信息估计恶性肿瘤中的间质和免疫细胞结合加权基因共表达网络分析,鉴定与肿瘤免疫微环境相关的基因。通过Lasso回归筛选关键基因并结合临床因素建立胶质瘤预后模型。
结果 确定3个关键基因(PIWIL4、TGIF1和XKR8)建立风险标签,以风险标签结合临床因素构建的脑胶质瘤预后模型预测1、3、5年生存率的受试者工作特征曲线下面积为0.870、0.888和0.800,预测效果较好。
结论 结合影像和基因信息可以无创、准确地预测脑胶质瘤的预后。
[关键词] 神经胶质瘤;放射学;脑网络;列线图;预后
[中图分类号] R730.264
[文献标志码] A
[文章编号] 2096-5532(2024)01-0047-05
doi:10.11712/jms.2096-5532.2024.60.020
[开放科学(资源服务)标识码(OSID)]
[网络出版] https://link.cnki.net/urlid/37.1517.R.20240320.1545.002;2024-03-22 21:05:34
Establishment of a prognostic model for glioma based on regional radiomics similarity network
\ WANG Ningrui, WEN Jing
\ (Department of Epidemiology and Health Statistics, School of Public Health, Ningxia Medical University, Yinchuan 750000, China)
\; [Abstract]\ Objective\ To establish a prognostic prediction model for glioma by obtaining the information on glioma tumor tissue through noninvasive regional radiomics similarity network (R2SN).
\ Methods\ R2SN combined with gene similarity network was used to calculate the differentially expressed genes between glioma patients and healthy controls. The gene expression data were usedto estimate stromal and immune cells in malignant tumor, and the weighted gene co-expression network analysis was also performed to identify genes associated with tumor immune microenvironment. ALasso regression analysis was used to identify the key genes, and a prognostic model was established for glioma with reference to clinical factors.
\ Results\ Three key genes, i.e., PIWIL4, TGIF1, and XKR8, were identified to establish risk labels. The prognostic model for glioma established based on risk labels andclinical factors had an area under the ROC curve of 0.870, 0.888, and 0.800, respectively, in predicting 1, 3, and 5 year survival rates, suggesting that the model had a good predictive effect.
\ Conclusion\ The combination of imaging findings and genetic information can predict the prognosis of glioma in a noninvasive and accurate manner.
[Key words]\ glioma; radiology; brain network; nomograms; prognosis
胶质瘤作为脑部最常见的原发性肿瘤,其高发病率和极差的预后使之成为神经外科和神经病理学领域的研究焦点[1]。低级别胶质瘤(LGG)的平均生存时间约为7年[2],胶质母细胞瘤的中位生存时间小于2年[3]。世界卫生组织根据组织学特征对胶质瘤的分类反映了肿瘤的恶性程度和预后,给个体化治疗带来了积极的促进作用[4]。但目前获取肿瘤组织学特征的方法依赖有创的侵入性检查,这不仅给病人带来风险,也影响预测的准确性[5-6]。区域放射学不受侵入性检查的限制,并已在阿尔茨海默病、癫痫等疾病中得到验证[7-9],但在胶质瘤领域尚未得到充分应用。本研究拟建立基于区域放射学相似性网络(R2SN)的胶质瘤预后预测模型,旨在提供无创的胶质瘤预后预测方式,为胶质瘤的个体化治疗和临床决策提供依据。
1 材料与方法
1.1 R2SN基因集构建
1.1.1 数据来源 从癌症基因组图谱(TCGA)数据库中选择脑胶质瘤病人,并在癌症影像存档(TCIA)数据库中识别脑脑质瘤病人对应的影像数据,数据截止时间为2022年10月18日。共收集108例病人的术前T1加权磁共振成像(MRI)数据、临床信息和预后信息。
1.1.2 数据预处理 ①将T1加权MRI影像与蒙特利尔神经科学研究所提供的MNI152标准脑模板进行空间对齐,并使用线性和非线性配准的组合,将其重采样为1 mm×1 mm×1 mm;②使用Freesurfer 6.0去除头骨、分割脑的结构并重建大脑的皮质表面,根据Desikan-Kiliany图谱模板,将大脑皮质分为308个区域;③为每个脑区提取47个放射学特征,包括14个强度特征和33个纹理特征,移除冗余特征(即与其他特征高度相关(r>0.9)的特征)。为每个个体得到一个308×308的最终特征矩阵用于后续分析。
1.1.3 与基因相似性网络的相似性 基因相似性网络是使用来自6个健康供体大脑的预定义基因构建的。本研究使用这6个健康供体大脑左半球的基因表达数据作为健康对照组。计算纳入病人左半球各个脑区内所有基因的平均表达值,得到基因表达配置矩阵(152×15 632个基因),用于表征脑区间基因相似性的模式。采用偏最小二乘回归来评估每个胶质瘤病人左半球的基因表达配置矩阵与健康对照组之间的关系。评估基因表达矩阵的平均连接性与健康对照组内基因相似性网络的平均连接性之间的相关系数,用于衡量网络之间的相似程度。差异表达的基因(P<0.05)被纳入R2SN基因集,用于后续分析。
1.2 确定与肿瘤微环境密切相关的基因
1.2.1 数据获取 从TCGA数据库中下载511例胶质瘤病人的RNA测序表达数据及其临床信息,数据截止时间为2022年10月18日。以1∶1的比例将病人随机分为训练集和验证集,训练集和验证集病人的年龄、性别和肿瘤分级差异无统计学意义(P>0.05)。训练集用于建立模型,验证集用于测试模型。
1.2.2 使用基因表达信息估计恶性肿瘤中的间质和免疫细胞(ESTIMATE)与加权基因共表达网络分析(WGCNA)结合分析 ESTIMATE算法计算胶质瘤RNA测序数据中肿瘤组织中的细胞比例和纯度,根据临床信息分成不同的亚组,计算每个亚组的基质分数、免疫分数和ESTIMATE分数。再将ESTIMATE算法的结果与WGCNA方法相结合,用于识别与肿瘤免疫微环境相关的基因。数据使用样本聚类方法进行处理,以检测和处理异常值,确保其与特征的一致性。使用Pearson相关系数量化基因共表达的相似性。网络构建过程中创建拓撲重叠矩阵以过滤弱连接,软阈值被设置为16,以优化网络构建,保持与无尺度分布的一致性和平均连接性。
1.3 两基因集取交集
为了获得R2SN和WGCNA基因集的交集,使用R语言中的intersect函数比较两个集合中的基因名称,获取共同的基因。
1.4 Lasso筛选与模型建立
使用Lasso回归进行基因筛选与相关性分析,模型的惩罚参数(λ)根据十折交叉验证来确定。当λ为0.007 9(Log λ=-2.10)时,获得性能优异但变量数量最小的模型。根据每个基因的表达水平及其相应的回归系数计算病人的风险评分,以评分的中位数为界,将病人分为高风险组和低风险组。
1.5 高低风险组免疫检查点差异基因分析
使用R语言的DESeq2包识别高低风险组之间在免疫检查点基因表达上的显著差异。采用Benjamini-Hochberg进行多重检验校正。
1.6 统计方法
应用Python 3.10和MATLAB R2021b软件进行R2SN基因集的构建和获取,应用R语言进行WGCNA基因集的获取和统计分析,使用的R包包括CIBERSORT、ESTIMATE、GSVA和WGCNA等。组间比较采用t检验,生存差异分析采用log-rank检验,相关性分析使用Spearman等级相关分析。P<0.05为差异有统计学意义。
2 结 果
2.1 R2SN基因集的构建
计算纳入的108例胶质瘤病人左半球各个脑区内所有基因的平均表达值得到基因表达配置矩阵(152×15 632个基因),显示差异表达的354个基因(P<0.05)被纳入R2SN基因集,用于后续分析。
2.2 确定与肿瘤微环境密切相关的基因
将511例病人分别根据年龄、性别和肿瘤分级分成不同的亚组,生成相应的免疫评分结果表格,并使用散点图展示不同组别之间的关系和差异。结果显示,不同肿瘤分级亚组间的结果具有显著相关性,表明免疫微环境在胶质瘤发展中起到了重要作用。见图1。
将ESTIMATE算法的结果与WGCNA方法相结合,基因重要性(GS)是捕捉特定生物特征与模块内基因表达之间关系的度量标准。模块成员关系(MM)测量的是模块内连接性,代表了基因与模块之间的相关性。通过GS和MM确定了关键基因标记,随后进行了Pearson相关性分析。选择与免疫微环境具有强关联性的模块(其特征是|r|>0.50且P<0.05),总共1 776个基因作为WGCNA基因集。本研究最终选择了green、blue和pink 3个模块。见图2。
2.3 两个基因集的交集
R2SN和WGCNA基因集取交集,共获得了23个共同基因作为关键基因,对23个关键基因分别做了生存分析,其中有17个P<0.001,剩下的6个P<0.05。使用关键基因,在LGG数据库中对胶质瘤病人进行聚类分析,观察到数据被很好地分为两个簇。两个簇之间存在显著生存差异(P<0.001)。生成了临床相关性热图,并分析了两个簇之间的KEGG通路差异。见图3。
2.4 Lasso筛选与模型建立
Lasso回归分析从23个关键基因中筛选出与胶质瘤高度相关的3个基因,即PIWIL4、TGIF1和XKR8。Lasso回归的交叉验证图和路径系数图见图4a、b。用这3个基因来构建风险标签。
2.5 基于R2SN的胶质瘤预后列线图模型的构建及预测效果评价
根据年龄、性别、肿瘤分级和风险标签建立胶质瘤预后列线图模型(图4e),模型的受试者工作特征(ROC)曲线分析显示,训练集1、3、5年生存率的曲线下面积(AUC)分別为0.870、0.888和0.800(图4c),测试集1、3、5年生存率的AUC分别为0.836、0.739和0.735(图4d),说明该模型预测效果较好。其校准曲线见图4f。
2.6 高低风险组免疫检查点基因差异
免疫检查点基因在高低风险组中存在明显差异,说明其与免疫密切相关。见图5。
3 讨 论
本研究构建了R2SN基因集和WGCNA基因
集,共有23个基因同时与两个基因集相关,具有更关键的预后预测意义,包括PCBP3、ARHGAP25、PNPLA3、GLIS3、FAM163B、TGIF1、SLN、HLA-DOB、EPHA10、SYT16、NMB、SLC22A18、SPRN、ITPRIPL1、ASGR2、PIWIL4、SCN2A、SPON2、INPP5D、XKR8、ECHDC2、AURKC和NPL。其中,GLIS3、NMB、ITPRIPL1和XKR8被确定为胶质瘤不良预后相关基因[10-13]。SYT16和SLC22A18则是胶质瘤良好预后相关基因[14-15]。
有研究表明,PIWI蛋白在包括大脑在内的躯体环境中发挥重要的生物功能,PIWIL4不仅可以调节对正常神经发生至关重要的神经源基因,还可以调节与胶质瘤细胞活动有关的基因[16-18]。
TGIF1作为胶质瘤的一种新型致癌基因,是胶质瘤病人个性化治疗的潜在治疗靶点[19]。
TGIF1在癌症中发挥着关键的生物功能,其表达与肿瘤细胞的入侵、迁移和转移增强有关[20-21]。本研究确定3个关键基因(PIWIL4、TGIF1和XKR8)建立风险标签,以风险标签结合临床因素构建的脑胶质瘤预后模型在训练集和验证集中的预测能力均较强,进一步证实了
肿瘤免疫微环境在胶质瘤的发展中发挥着重要作用,这为个体化治疗和生物标志物的发现提供了有力支持。
本研究存在一定的局限性。首先,公共数据库中的影像数据质量和分辨率不统一,这对数据的分析结果有一定的影响。其次,由于疾病的特殊性,我们难以找到大量健康人的脑部基因数据来作为健康对照组。本研究确定了R2SN应用于胶质瘤的可行性,但仍需大量的实验和数据进行佐证。
综上所述,本研究建立了在脑胶质瘤中使用R2SN方法进行预后预测的模型,该模型在预后判断和免疫治疗反应预测方面具有一定的临床价值,为胶质瘤的治疗提供了新的视角。
[参考文献]
[1]CHEN R, SMITH-COHN M, COHEN A L, et al. Glioma subclassifications and their clinical significance[J]. Neurothe-
rapeutics, 2017,14(2):284-297.
[2]CLAUS E B, WALSH K M, WIENCKE J K, et al. Survival and low-grade glioma: the emergence of genetic information[J]. Neurosurgical Focus, 2015,38(1):E6.
[3]GUSYATINER O, HEGI M E. Glioma epigenetics: from subclassification to novel treatment options[J]. Seminars in Can-
cer Biology, 2018,51:50-58.
[4]LOUIS D N, OHGAKI H, WIESTLER O D, et al. The 2007 WHO classification of tumours of the central nervous system[J]. Acta Neuropathologica, 2007,114(2):97-109.
[5]REIFENBERGER G, WIRSCHING H G, KNOBBE-THOMSEN C B, et al. Advances in the molecular genetics of gliomas-implications for classification and therapy[J]. Nature Reviews Clinical Oncology, 2017,14(7):434-452.
[6]NICHOLSON J G, FINE H A. Diffuse glioma heterogeneity and its therapeutic implications[J]. Cancer Discovery, 2021,11(3):575-590.
[7]ZHAO K, ZHENG Q, DYRBA M, et al. Regional radiomics similarity networks reveal distinct subtypes and abnormality patterns in mild cognitive impairment[J]. Advanced Science, 2022,9(12):e2104538.
[8]YU H Y, DING Y H, WEI Y B, et al. Morphological connectivity differences in Alzheimers disease correlate with gene transcription and cell-type[J]. Human Brain Mapping, 2023,44(18):6364-6374.
[9]SHI D F, REN Z D, ZHANG H R, et al. Amplitude of low-frequency fluctuation-based regional radiomics similarity network: Biomarker for Parkinsons disease[J]. Heliyon, 2023,9(3):e14325.
[10]LI G W, LAN Q. Exosome-mediated transfer of circ-GLIS3 enhances temozolomide resistance in glioma cells through the miR-548m/MED31 axis[J]. Cancer Biotherapy & Radiopharmaceuticals, 2023,38(1):62-73.
[11]ZENG R J, XIONG X Y. Effect of NMB-regulated ERK1/2 and p65 signaling pathway on proliferation and apoptosis of cervical cancer[J]. Pathology, Research and Practice, 2022, 238:154104.
[12]LIU W T, ZOU J X, REN R J, et al. A novel 10-gene signature predicts poor prognosis in low grade glioma[J]. Technology in Cancer Research & Treatment, 2021,20:15330338-21992084.
[13]HAVRYSH K V, BOGDANOV M, KIYAMOVA R. PLSCR1 and XKR8: new markers for low-grade glioma progression and outcome[J]. Annals of Oncology, 2019,30: vii15.
[14]CHEN J F, WANG Z H, WANG W, et al. SYT16 is a prognostic biomarker and correlated with immune infiltrates in glio-
ma: a study based on TCGA data[J]. International Immunopharmacology, 2020,84:106490.
[15]CHU S H, FENG D F, MA Y B, et al. Promoter methylation and downregulation of SLC22A18 are associated with the development and progression of human glioma[J]. Journal of Translational Medicine, 2011,9:156.
[16]SUBHRAMANYAM C S, CAO Q, WANG C, et al. Role of PIWI-like 4 in modulating neuronal differentiation from human embryonal carcinoma cells[J]. RNA Biology, 2020,17(11):1613-1624.
[17]ARAVIN A, GAIDATZIS D, PFEFFER S, et al. A novel class of small RNAs bind to MILI protein in mouse testes[J]. Nature, 2006,442(7099):203-207.
[18]GIRARD A, SACHIDANANDAM R, HANNON G J, et al. A germline-specific class of small RNAs binds mammalian Piwi proteins[J]. Nature, 2006,442(7099):199-202.
[19]WANG B Y, MA Q, WANG X L, et al. TGIF1 overexpression promotes glioma progression and worsens patient prognosis[J]. Cancer Medicine, 2022,11(24):5113-5128.
[20]JIA K, WEN Q H, ZHAO X, et al. XTP8 stimulates migration and invasion of gastric carcinoma through interacting with TGIF1[J]. European Review for Medical and Pharmacological Sciences, 2020,24(5):2412-2420.
[21]SHAW E J, HAYLOCK B, HUSBAND D, et al. Gene expression in oligodendroglial tumors[J]. Cellular Oncology (Dordrecht), 2011,34(4):355-367.
(本文編辑 周晓彬)