APP下载

腹主动脉瘤特异性ceRNA调控网络的筛选与构建

2023-01-30霍金龙吴浪赵纪春郭又铭瞿锐赵礼金

中国普通外科杂志 2022年12期
关键词:诊断模型差异基因特异性

霍金龙,吴浪,赵纪春,郭又铭,瞿锐,赵礼金

(1.遵义医科大学附属医院 普通外科,贵州 遵义 563000;遵义市第一人民医院/遵义医科大学第三附属医院 2.乳甲中心 3.心脏血管外科,贵州 遵义 563000;4.四川大学华西医院 血管外科,四川 成都 610043)

腹主动脉瘤(abdominal aortic aneurysm,AAA)一般指肾动脉下方的腹主动脉呈瘤样扩张,通常直径增大50%以上或直径≥3 cm,是一种常见的、具有潜在致命性的血管退行性疾病,其特征是腹主动脉(abdominal aorta,AA)壁变弱,随后逐渐扩张,最终导致扩张的动脉破裂[1]。在老年男性(>65 岁)和女性(>60 岁)发病率分别约为8%、1.53%[2],若发生破裂则致死率可达80%~90%[3-4]。AAA 形成的典型病理特征较为复杂,包括血管平滑肌细胞(vascular smooth muscle cells,VSMC)表型转换、VSMC 凋亡、炎症细胞浸润、细胞外基质(extracellular matrix,ECM)重塑、强烈的氧化应激、内皮细胞(endothelial cells,EC)功能障碍、腔内血栓形成、主动脉壁的恶化等[5]。目前具体发病机制不明,因此,阐明AAA 发病机制对疾病诊断、预测进展、治疗和预后具有重要的意义。

2011 年Salmena 等[6]在《Cell》上首次提出内源性竞争RNA(competing endogenous RNA,ceRNA)调控网络概念,这是转录组中各RNA 相互间的新的调控模式,其认为各RNA 共同构成了一种复杂的网络体系并处于动态平衡,网络中某一分子的表达上调或下调就会影响一系列的变化,最终这种动态平衡被破坏,从而导致机体出现相应异常表现。在ceRNA 调控网络中,微小RNA(miRNA)处于其核心地位,它是一种长度约为20 个核苷酸的非编码小RNA,通过碱基互补原则与靶基因结合来调控靶基因的表达[7]。调控网络中,能与miRNA 竞争性结合调控靶基因表达水平的RNA 称为ceRNA,常见的有长链非编码RNA(lncRNA)、环状RNA(circular RNA)。lncRNA 是长度>200 个核苷酸的非编码RNA[8],具有表观、转录和转录后水平调控基因表达的潜力,并在生理过程中发挥重要作用[9]。lncRNA 的表达和调控在某些组织、细胞和疾病具有高度特异性,这使它们有希望成为新的治疗干预点和生物候选标志物[10-11]。研究表明lncRNA 参与了多种疾病的ceRNA 网络构建,其作为上游分子竞争性与miRNA 结合,从而影响下游靶基因(即mRNA)的表达水平[12-14],这 种lncRNA-miRNA-mRNA 网络对疾病的发生发展起到关键的调控作用。因此,构建ceRNA 网络为探索疾病中尚未被鉴定的相关lncRNA 的功能提供了一个新的视角。

本研究结合基因表达数据库(GEO 数据库),选择人的AAA 和AA 组织的转录组数据,筛选出AAA 和AA 的差异lncRNA(DElncRNA)和差异mRNA(DEmRNA),进一步构建了AAA 特异性基因诊断模型,通过预测与lncRNA 和mRNA 结合的miRNA,构建了特异性基因诊断模型分子所参与的ceRNA 网络。这不仅进一步认识AAA 的发病机制,而且为AAA 的诊断提供了新的分子标记物及潜在的治疗靶点。

1 材料与方法

1.1 GEO数据集筛选及数据处理

从GEO 数据库(https://www.ncbi.nlm.nih.gov/geo)中检索关键词“Abdominal Aortic Aneurysm”,阅读数据集题目及摘要,选择合适的数据集进行后期分析。若有多个数据集则将合并数据去批次校正减少合并后数据误差。

1.2 差异基因分析

基于生物信息学,利用R 语言对训练集中提取的基因进行注释,log fold chang(|logFC|)>1 或<-1,矫正后的P<0.05 作为标准筛选DEmRNA;以矫正后的P<0.05 作为标准筛选DElncRNA,并绘制差异基因的火山图及热图,基因富集分析(GO 和KEGG)展示AAA 差异基因在细胞功能及信号通路上的区别。

1.3 AAA基因诊断模型构建

利用Lasso 回归对筛选的差异基因进行进一步优化分析,寻找诊断AAA 的最具有特征性的差异基因。

1.4 基因诊断模型中ceRNA网络构建

首先通过Starbase 数据库预测与之结合的miRNA;通过DElncRNA 预测与之结合的miRNA,两者取交集,利用cytoscape 软件构建lncRNAmiRNA-mRNA 的ceRNA 网络。利用cytoscape 中的cytoHubba 模块寻找参与AAA 发展的关键ceRNA网络。

2 结果

2.1 筛选后的数据集

在GEO 数据库检索后共得到819 个AAA 相关数据集,最终经筛选后获得两个数据集:GSE7084、GSE57691,将GSE7084 及GSE57691 两数据集数据合并,共计AA 组18 例,AAA 组56 例。

2.2 差异基因分析

合并后的数据按|logFC|>1,矫正后的P<0.05,共筛选DEmRNA 114 个(上调基因34 个,下调基因80 个)(图1);基因GO 富集分析显示,差异生物学功能主要体现肌肉系统过程(muscle system process)、抗氧化反应(response to oxidative stress)、肌肉收缩(muscle contraction)等差别上;基因KEGG 富集分析显示差异基因主要体现在脂质和动脉粥样硬化(lipid and atherosclerosis)、细胞因子受体相互作用(cytokine-cytokine receptor interaction)(图2);筛选到DElncRNA 13 个(上调9 个,下调4 个)(表1)。

表1 差异lncRNA列表Table 1 List of DElncRNAs

图1 AAA与AA差异基因筛选(图1A中绿色表示下调基因,红色为上调基因,黑色无差异基因;图1B中红色为上调基因,蓝色为下调基因) A:AAA与AA差异基因火山图;B:AAA与AA差异基因热图Figure 1 Identification of the differentially expressed genes between AAA and AA (green color represents down-regulated genes,the red color represents up-regulated genes,and black color represents no difference genes in figure 1A;red color represents the up-regulated genes and blue color represents the down-regulated genes in figure 1B)A: Volcano map of differentially expressed genes between AAA and AA;B: Heat map of differentially expressed genes between AAA and AA

图2 差异基因富集分析(颜色越红代表差异越显著,形状越大表示在该分子功能上富集越显著) A:GO 分析;B:KEGG 分析Figure 2 Enrichment analysis of the differentially expressed genes (the redder the color,the more significant the difference,and the larger the shape,the more significant of enrichment in the molecular function) A: GO analysis;B: KEGG analysis

2.3 基因诊断模型构建

利用Lasso 回归筛选差异基共得到17 个特异性基因模型(图3、表2)。

表2 AAA的17个特异性基因诊断模型Table 2 17 specific gene diagnostic models of AAA

图3 惩罚因素选择的交叉验证Figure 3 Cross-validation for the choice of penalty factors

2.4 基因诊断模型相关ceRNA 网络构建及关键ceRNA网络

由17 个基因诊断模型构建其参与到的ceRNA网络(图4A),利用cytoscape 中的cytoHubba 模块寻找关键ceRNA 网络,结果提示,lncRNA HCP5-miR-27a/b-FOSB 可能是AAA 发生发展最为关键的ceRNA网络(图4B)。

图4 基因诊断模型相关ceRNA 网络构建及关键ceRNA 网络分析(红色代表上调的基因,蓝色代表下调基因,绿色圆形为miRNA;方形为lncRNA,三角形为mRNA) A:AAA 特异性基因诊断模型参与的ceRNA 网络;B:AAA 关键ceRNA网络Figure 4 Establishment of ceRNA network involved in AAA-specific gene diagnosis model and analysis of key ceRNA network(red representing up-regulated genes,blue representing down-regulated genes,and green circles representing miRNAs;the square shapes representing lncRNAs,and the triangle representing mRNAs) A: The ceRNA network involved in AAA-specific gene diagnosis model;B: The key ceRNA network in AAA

3 讨论

AAA 是一种常见的、具有潜在致命性的血管退行性疾病[1,15]。在AAA 破裂前患者常无临床表现,老年患者中发病率及病死率较高[2-4]。病因较复杂,目前认为其与动脉粥样硬化关系最为密切,遗传因素、炎症、免疫、血流动力学等其他因素亦参与其中[16-18]。确切的致病机制上仍不明,充分了解AAA发生发展等相关的分子病理机制,不仅可用于疾病的早期诊断,同时也可能为治疗提供新的方案。

lncRNA 作为一类长链非编码的RNA 的总称,据研究报道其参与了多种肿瘤的发生发展[19-21],且与某些疾病的预后有着密切的关系[22]。近年来,关于lncRNA 在AAA 的形成发展中的机制亦有诸多报道[23-26],如缺氧诱发因子1α-AS1 是第一个被发现可促进胸腹部主动脉瘤的形成的lncRNA[27];另外的研究发现,lncRNA GAS5 通过miR-185-5p/ADCY7 轴来影响血管平滑肌细胞的凋亡及炎症反应,进而调控AAA 的形成[26];此外,Yang 等[28]采用测序数据识别了AAA 和正常腹主动脉间3 688 个不同表达的lncRNA,从分子层面为后期AAA 的研究奠定了基础,然而针对其分子作用及具体的机制却未能做出明确的解释。在本研究中,笔者借助生物信息学这一工具,分析了公共数据库GEO 中AAA 和AA 之间的差异基因,按照|logFC|>1,P<0.05这一标准,总共筛选出DEmRNA 114 个,DElncRNA 13 个,通过GO 及Kegg 富集分析进一步明确AAA 发生发展可能参与的重要的分子功能及信号通路,这同时也为AAA 后期基因层面的研究提供了重要的理论及数据支持。

目前,国内外期刊中关于AAA 中的特征性诊断基因的lncRNA 的模型研究较少[29-30],仅一项研究通过荧光定量聚合酶链式反应(qRT-PCR)技术验证了lncRNA ENST00000566954、ENST00000580897和T181556 在AAA 与AA 之间的特异性表达;该项结论通过基础实验获得,结果可靠性较强,但研究者对其得出结论的过程却未能给出详细的描述[29]。在本研究中,笔者通过生物信息学手段筛选了114 个AAA 与AA 的DEmRNA,这些差异基因GO 和KEGG 富集分析显示其差异主要体现在脂质和动脉粥样硬化、细胞因子受体相互作用、IL-17信号通路等。既往研究对AAA 形成的病理方面的变化包括VSMC 表型转换、VSMC 凋亡、炎症细胞浸润、ECM 重塑、强烈的氧化应激、EC 功能障碍、腔内血栓形成、主动脉壁的恶化等[5]。本研究所得富集分析结果显示与既往认识的AAA 的病理变化相类似,这也说明本研究筛选结果的准确性。为进一步明确AAA 的特征性基因,笔者通过Lasso回归筛选了17 个特异性的基因包括8 个上调基因,9 个下调基因,并构建了其参与的ceRNA 网络,最后揭示了lncRNA HCP5 可通过miRNA-27 来影响FOSB 的表达,同时也预测HCP5-miR27-FOSB 这条ceRNA 网络在AAA 发生发展起到尤为特异且关键的作用。

HCP5 已被证实参与了多种恶性肿瘤及自身免疫性疾病的发生,异常表达的HCP5 和疾病的预后有密切的关系[30-32],亦可作为胃癌早期诊断的潜在标记物[33],而在AAA 中的研究却鲜有报道。miR-27,主要包括有miR-27a 和miR-27b 两种,研究证实,其在血管内皮细胞及高度血管化组织中富集,具有促血管生成的作用[34]。目前对FSOB 的研究未有实质性的进展,仅作为诊断假肌源性血管内皮瘤的一种有效标志物[35-36]。而在本课题构建的基因模型中,FOSB 在AAA 较AA 组基因表达差异性最大,加之目前尚无FOSB 在AAA 中的研究报道,这值得进一步探究是否其参与到AAA 的形成及进展。

本研究有以下几点不足之处,其一,本研究来源于公共数据库,虽为降低误差笔者将两个公共数据库进行了合并分析,并做了批次化矫正,但并未在临床中收集样本做全基因测序来验证HCP5、miRNA-27 及FOSB 在AAA 中的表达情况。其二,未验证HCP5、miRNA-27 及FOSB 之间的动态变化情况;如敲低HCP5 对miRNA-27 及FOSB 的影响及对血管平滑肌细胞凋亡的影响,在后期可开展基础实验进一步来验证。

综上所述,本研究筛选的差异基因不仅从分子水平上揭示了AAA 发病机制,获得的DEmRNA,可作为后期AAA 治疗的潜在靶点,为AAA 的治疗打开新的思路,这也将是未来精准治疗发展的一种趋势。同时,诊断基因模型的构建筛选出了AAA的特征性基因,为AAA 早期诊断提供了依据;最后,ceRNA 网络HCP5-miR27-FOSB 可能在AAA 发生发展中起到尤为关键的作用,但这需要后续开展细胞、动物、组织学层面来进一步验证。

利益冲突:所有作者均声明不存在利益冲突。

猜你喜欢

诊断模型差异基因特异性
CT联合CA199、CA50检测用于胰腺癌诊断的敏感性与特异性探讨
管家基因突变导致面部特异性出生缺陷的原因
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
精确制导 特异性溶栓
紫檀芪处理对酿酒酵母基因组表达变化的影响
重复周围磁刺激治疗慢性非特异性下腰痛的临床效果
基于模糊优选反问题的电机电气故障诊断模型
对于电站锅炉燃烧经济性诊断模型的研究
SSH技术在丝状真菌功能基因筛选中的应用
肾阳虚证骨关节炎温针疗效的差异基因表达谱研究