基于单细胞转录组测序数据识别糖尿病肾病发生发展的关键细胞
2023-11-02万生芳李荣科杨雅丽王同亮张亚男魏昭辉白晓丹荀敏奇
杨 蕤,万生芳,张 磊,李荣科,杨雅丽,王同亮,张亚男,魏昭辉,白晓丹,荀敏奇
(1.甘肃中医药大学基础医学院,甘肃 兰州 730000;2.甘肃省中医方药挖掘与创新转化重点实验室,甘肃 兰州 730000)
糖尿病肾病(diabetic kidney disease,DKD)是糖尿病(diabetes mellitus,DM)的微血管并发症之一,长期高血糖导致肾损伤,病变可逐渐累积全肾,以持续性白蛋白尿和(或)肾小球滤过率(eGFR)进行性下降为主要特征,可发展为终末期肾病(end-stage renal disease,ESRD)。肾小球结构和功能的损伤在DKD 发生发展过程中起重要作用,其病理改变主要包括肾小球基底膜增厚、系膜基质增宽及肾小球硬化[1]。DKD 发病机制非常复杂,多与遗传因素、糖脂代谢紊乱、血流动力学改变、炎症反应、氧化应激等诸多病理生理机制相关[2],而针对DKD 发病相关细胞的研究相对较少。本研究通过单细胞转录组学探究DKD 患者和健康人肾组织细胞转录的差异,与大量数据的肾小球表型数据集比对后,通过Scissor 从单细胞数据中准确地识别出与表型基因最相关的肾小球细胞,根据不同细胞类型进行细胞亚群鉴定,选择其中的关键细胞筛选差异基因,结合基因富集分析(gene set enrichment analysis,GSEA)探讨差异基因富集情况及富集通路的表达情况,识别在DKD 发生发展中起到关键性作用的细胞,以期为进一步探究DKD 发病机制提供新思路。
1 材料与方法
1.1 DKD 单细胞测序数据 在基因表达数据库(gene expression omnibus,GEO)将物种设置为“Homo Sapiens”,以“(DKD)AND(Single cell)”为检索式搜索得到GSE131882 数据集,样本组织来源为肾脏,包含6个样本,其中3 个正常样本对照(GSM3823939~GSM3823941),3 个DKD 患者样本(GSM3823942~GSM3823944),见表1。通过nawo 对原始FASTQ 文件进行表达定量。按照Seurat 包中的NormalizeData函数对所有的数据进行标准化,FindVariableFeatures函数识别每个样本高差异度表达特征,使用Scale-Data 函数进行归一化,设置参数npcs=30 进行线性降维。随即去除核糖体或线粒体基因表达大于10%的细胞(图1),并通过harmony 方法进行样本批次校正,FindClusters 功能对细胞进行聚类,参数resolution=0.5;使用RunUMAP 和RunTSNE 功能进行UMAP 和TSNE 聚类,参数为dims=1∶20。最终得到11 个细胞群体,利用marker 基因进行细胞类型鉴定。使用scCATCH 和手动注释结合的方法鉴定整合后的细胞类型。选择对应的组织类型进行细胞注释,结合文献报道以及CellMarker 网站进行手工校正。
图1 各细胞中核糖体与线粒体基因表达量
表1 GSE131882 数据集患者基本情况
1.2 DKDbulk 测序数据 在GEO 数据库中将物种设置为“Homo Sapiens”,以(DKD)AND(glomerulus)为检索式搜索,选取GEO 数据库中的GSE96804 数据集,包含61 个样本,41 个DKD 患者样本(GSM2544275~GSM2544315)和20 个正常样本对照(GSM2544316~GSM2544335)。从GEOquery 下载表达量及表型数据,根据GPL17586 注释平台文件将探针定量注释为基因表达量。进一步在limma 包中的Normalize Between Arrays 进行四分位数校正。
1.3 DKD 相关重要细胞类型识别 将GSE96804 作为表型数据,在R4.2.0 版本中Scissor 包识别DKD疾病中关键细胞亚群。Scissor 的3 个输入数据源分别是单细胞表达矩阵、批量表达矩阵和目标表型;根据输入源计算相关矩阵和细胞-细胞相似性网络,将其与表型进一步整合到网络正则化稀疏回归模型中,选择最相关的细胞亚群;根据估计的回归系数的符号,分为剪刀阳性(Scissor+)细胞和剪刀阴性(Scissor-)细胞,表示与目标表型呈正相关和负相关;随后通过可靠性、显著性检验确定所选数据是否适合表型-细胞关联。
1.4 差异基因表达及GSEA 筛选关键细胞 在R4.2.0版本中ggplot2 包绘制差异基因表达情况火山图。使用clusterProfiler 包的gseKEGG 函数对DKD 发生发展过程中关键细胞的表达数据进行GSEA 富集分析,并通过Enrichplot 包进行结果可视化。
2 结果
2.1 细胞类型聚类分析 最终得到的细胞数据类型包括近曲小管上皮、连接小管上皮、髓袢上皮、远曲小管上皮、成纤维细胞、肾闰细胞、肾β-闰细胞、肾毛细血管内皮细胞、肾小球血管上皮细胞、间充质细胞以及巨噬细胞(图2)。maker 基因在对应细胞类型中表达情况见图3。
图2 细胞类型及分布情况
图3 细胞标记基因热图
2.2 细胞数量统计分析 细胞数量统计结果显示,DKD 患者肾组织中:巨噬细胞为2.96%、近曲小管上皮细胞为16.20%、连接小管上皮细胞为23.34%、髓袢上皮细胞为17.27%、远曲小管上皮细胞为9.73%、成纤维细胞为9.50%、肾闰细胞为6.58%、肾毛细血管内皮细胞为5.80%、肾小球血管上皮细胞为3.08%、肾β-闰细胞为3.06%、间充质细胞为2.47%。健康人肾组织中:巨噬细胞为0.32%、近曲小管上皮细胞为27.74%、连接小管上皮细胞为16.96%、髓袢上皮细胞为15.35%、远曲小管上皮细胞为14.13%、成纤维细胞为6.58%、肾闰细胞为8.54%、肾毛细血管内皮细胞为4.01%、肾小球血管上皮细胞为2.70%、肾β-闰细胞为2.03%、间充质细胞为1.59%(图4)。与健康人肾组织比较,DKD 患者肾组织中巨噬细胞比例增加2.64%、近曲小管上皮细胞比例降低11.54%、连接小管上皮细胞比例增长6.38%、髓袢上皮细胞比例增加1.92%、远端小管上皮细胞比例降低4.40%、成纤维细胞比例增长2.92%、肾闰细胞比例降低1.96%、肾毛细血管内皮细胞比例增长1.79%、肾小球血管上皮细胞比例增长0.38%、肾β-闰细胞比例增长1.03%、间充质细胞比例增长0.88%。
图4 DKD 患者及健康人肾组织细胞类型的分布情况及细胞比例
2.3 DKD 与健康人相关细胞亚群比较 多种细胞类型参与DKD 发生发展过程(图5A),筛选得出Scissor+细胞共2340 个,Scissor-细胞854 个(图5B)。将DKD 和健康人对比,健康人中Scissor+细胞仅占66%,而DKD 患者Scissor+细胞占80%(图5C);进一步检查细胞比例结果显示,Scissor+占比超过50%的细胞有巨噬细胞、间质细胞如肾毛细血管内皮细胞、肾闰细胞、肾远端小管上皮细胞、肾β-闰细胞、成纤维细胞、间充质细胞和连接小管上皮细胞(图5D)。
图5 DKD 患者与健康人细胞亚群比较
2.4 差异基因分析和GSEA 分析 综合上述分析结果,选取Scissor+占比超过50%细胞类型中细胞数量差异最显著的5 类细胞,最终选择巨噬细胞、间充质细胞、肾β-闰细胞、肾毛细血管内皮细胞和成纤维细胞,并对Scissor 结果有区别的4 类细胞筛选差异基因,并绘制火山图和GSEA 图。DKD 患者间充质细胞中差异基因共366 个,基因表达上调有108 个,分别为EGR1、ZFP36、FOSB、FOS、PDK4、BTG2 等;下调基因有258 个,分别为ITGA1、CARMN、A2M、NBEAL1、RBPMS、CRIM1 等;差异基因富集在Toll 样受体信号通路、B 细胞受体信号通路、心肌收缩、致心律失常性右心室心肌病等(图6)。肾β-闰细胞中差异基因共292 个,基因表达上调有271 个,分别为DNALI1、EGR1、ZFP36、SLC6A6、CYB561、ID1 等;下调基因有21 个,分别为IL-18、ATP6V0D2、SF1、PNISR、SF3B1、SPTLC3 等;差异基因富集在mTOR 信号通路、结直肠癌、赖氨酸降解等(图7)。肾毛细血管内皮细胞中差异基因共361个,基因表达上调有355 个,分别为EGR1、ZFP36、SLC39A4、ITGB2、FAM110D、SSX2IP 等;下调基因有26 个,分别为DDX5、MEIS2、ZNF207、ZRANB2、ANKRD36、HNRNPH1 等;差异基因富集在氧化磷酸化通路(图8)。成纤维细胞中差异基因共78 个,其中上调基因共51 个,分别为EGR1、ZFP36、FOS、ERRF11、GADD458、PDK4 等;下调基因共27 个,分别为ITGB8、ATP13A3、ITGAV、GLS、PROM1、DCDC2等;差异基因多富集在MAPK 信号通路、ECM 受体相互作用信号通路、黏着斑信号通路等(图9)。
图6 间充质细胞差异基因通路富集信息
图7 肾β-闰细胞差异基因通路富集信息
图8 肾毛细血管内皮细胞差异基因通路富集信息
图9 成纤维细胞差异基因通路富集信息
3 讨论
本研究通过单细胞转录组学分析DKD 患者和健康人肾小球细胞转录变化,对细胞类型聚类分析得到的细胞类型进行细胞数量统计分析可知,巨噬细胞、连接小管上皮、髓袢上皮、成纤维细胞、肾毛细血管内皮细胞、肾小球血管上皮细胞、肾β-闰细胞以及间充质细胞占比显著上升。选取GSE96804 作为表型数据,并使用Scissor 进行细胞亚群鉴定,结果显示在DKD 患者肾小球组织中巨噬细胞、间充质细胞、肾β-闰细胞、肾毛细血管内皮细胞、成纤维细胞、远曲小管上皮细胞在Scissor+细胞中比例明显高于Scissor-细胞,即以上细胞与DKD 发生发展呈正相关。随后筛选出Scissor+占比超过50%的细胞类型中细胞数量最显著的5 类细胞,包括巨噬细胞、间充质细胞、肾β-闰细胞、肾毛细血管内皮细胞和成纤维细胞,推断其细胞数量的改变可能与DKD 的发病有密切联系。
此外,本研究结果表明,巨噬细胞数量在DKD与健康人中差异较大,并且巨噬细胞均为Scissor+细胞,提示巨噬细胞与DKD 发生呈正相关。近年来有研究认为[3,4],慢性炎症是患者肾脏病理结构和生理功能改变的基础,而慢性炎症过程中巨噬细胞募集对DKD 发生发展起到推进作用。在DKD 患者肾活检和实验动物模型中,肾小球和肾间质中巨噬细胞是含量最多的浸润性白细胞[5],其浸润程度与尿蛋白、血肌酐等各项肾功能指标升高密切相关[6],且与肾小球硬化、肾小管萎缩及肾间质纤维化有关[7]。在一项使用链脲佐菌素(STZ)诱导的CD11b-DTR转基因小鼠糖尿病模型的研究中,经过白喉毒素(DT)清除巨噬细胞后可明显减少尿蛋白量,并显著改善肾小球组织改善与肾组织巨噬细胞募集[8]。因此,减轻巨噬细胞浸润程度可能是缓解DKD 肾脏损伤的新方向。
肾组织固有的间质细胞数量改变与DKD 的发展有密切联系,研究数量较多的当属间充质细胞。间充质细胞又称间充质干细胞(mesenchymal stem cells,MSC),是具有自我更新能力和多向分化潜能的多能干细胞,能够发挥多种治疗作用,包括促进血管生成、防止细胞凋亡、抑制炎症和调节细胞外基质动力学等,从而改善组织微环境和促进组织再生[9]。研究表明[10],在高糖环境中,MSC 能够通过减少肾脏细胞凋亡、调节自噬、改善炎症反应、改善氧化应激、抑制纤维化等途径治疗DKD。本研究中细胞数量结果显示,相较于健康人,DKD 患者间充质细胞比例增长0.88%,证实DKD 疾病过程中机体可能通过间充质细胞的增殖进而保护肾功能,延缓疾病进展。
DM 状态下MSC 直接传递到肾脏或迁移到肾间质间隙,可能会启动与肾近端小管上皮细胞(RPTEC)的旁分泌功能。同时,MSC 可通过RPTEC对炎症介质释放起调节作用,可能对单核细胞来源的巨噬细胞产生影响,下调促炎细胞因子的产生并抑制炎症信号通路。在DKD 发病过程中,足细胞和肾小管上皮细胞自噬功能受损,MSC 可通过抑制mTOR 信号通路提高肾脏细胞自噬功能,保护肾脏[11]。又有研究发现[12],MSC 可以显著改善肾脏纤维化,缩小DKD 小鼠肾脏的纤维化区域,并且降低如Ⅰ型胶原蛋白和纤连蛋白等促纤维化分子的表达水平上。由MSC 分化出的脂肪间充质干细胞能较好地抑制肾小管上皮细胞分化,同时减轻高糖状态对肾小球损伤、足细胞的损伤以及细胞外基质沉积,延缓肾纤维化进展[13,14];另骨髓间充质干细胞可以通过外泌体、生长因子和细胞因子发挥旁分泌作用,加速肾脏修复[15]。本研究中GSEA 结果显示,间充质细胞差异基因有EGR1、ZFP36、FOSB、ITGA1、RBPMS 等,目前通过调节肾组织间充质细胞中以上基因表达治疗DKD 的研究较少,后续可增加相关实验验证,为DKD 治疗提供新思路。
本研究中间充质细胞、肾β-闰细胞、肾毛细血管内皮细胞、成纤维细胞的GSEA 分析结果显示,Toll 样受体信号通路、氧化磷酸化通路、ECM 受体相互作用以及黏着斑信号通路在多个差异基因富集结果中出现,可能在DKD 疾病进展中起重要作用。Toll 样受体信号通路是免疫中重要的一环,应激或损伤的细胞可以释放相关因子激活Toll 样受体信号通路,Toll 样受体信号级联可以促进炎症基因转录,诱导无菌炎症的发生,TLR2 和TLR4 在肾脏炎症和纤维化中起主要作用[3,16]。研究表明[17],TLR4 敲除糖尿病小鼠可降低NF-κB 活性和炎症细胞因子的释放及肾脏纤维化。此外,线粒体通过氧化磷酸化反应产生ATP,而线粒体功能障碍是DKD 的重要原因,并且先于DKD 肾损害[18],调控线粒体氧化磷酸化途径对高血糖诱导的DKD 有保护作用[19]。DKD 中足细胞损伤可导致黏着斑激酶激活,导致足突的收缩和消失,通过抑制黏着斑激酶激活改善肾小球滤过功能[20,21]。而有研究表明[22],高糖环境对足细胞黏着斑表达无明显影响,但会明显促进黏着斑磷酸化。
综上所述,DKD 患者肾小球中巨噬细胞大量募集可能是其发生的重要原因,肾小球固有间充质细胞、肾β-闰细胞、成纤维细胞、肾毛细血管内皮细胞数量改变可能与DKD 疾病进展密切相关,间充质细胞可能对DKD 的治疗起到关键性作用。目前针对肾毛细血管内皮细胞、肾β-闰细胞研究较少,有望成为新的DKD 发病机制研究方向,然而本研究仅为理论研究,后续可进行实验研究验证该结果。