加权共表达网络分析在肝癌环状RNA 研究中的应用
2023-03-24王俐勇赵焕英付文卓杨予涛
王俐勇,赵焕英,付文卓,杨予涛
(首都医科大学中心实验室1,基础医学院2,北京 100069)
肝癌(liver cancer)是一种常见恶性肿瘤,占所有癌症死亡11%,排名第2位[1]。肝癌发展过程中伴随肝细胞增殖和脂肪变性、氧化应激、线粒体损伤和活性氧诱导,但其发生机制尚未完全明确。已有研究表明[2],肝癌发展与癌细胞中核酸蛋白水平变化相关,找到合适分子生物标志物有助于研究肝癌发病机制及进行个性化治疗。1976 年首次在RNA 病毒中发现环状RNA(circRNAs),近年来随着RNA 测序技术和生物信息学发展,发现cirRNAs 作为蛋白复合物中的支架结构,从亚细胞定位隔离蛋白,调节亲本基因表达,调节选择性剪接和RNA-蛋白质相互作用,形成microRNA 海绵结构。circRNAs 与线性RNA 不同,其具有圆形共价键结构,对核酸外切酶耐受性更高。研究表明[3,4],circRNAs 可能参与肿瘤发生发展。WGCNA 共表达网络分析可用于microRNA 和非编码长链RNA 研究,通过构建共表达模块可挖掘筛选关键基因[5]。本研究探讨加权共表达网络分析在肝癌环状RNA 研究中的应用价值,现报道如下。
1 材料与方法
1.1 数据下载和收集 通过GEO 网站(https://www.ncbi.nlm.nih.gov/geo/)下载肝癌数据集(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE97332),将得到的circRNA 表达原始值均一化。从NCBI 数据库下载circRNA 芯片数据GSE97332(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE97332),包括14 例肝癌数据,其中7 例肿瘤组织,7 例正常组织。
1.2 数据集差异基因筛选分析 利用DESeq2 包(http://www.bioconductor.org/packages/release/bioc/html/DESeq2.html)按照差异倍数大于2 倍,P值小于0.05 标准对肝癌circRNA 进行差异表达分析。
1.3 WGCNA 共表达分析 该数据集共检测到3032个circRNA 分子,均一化后应用WGCNA 方法构建circRNA 共表达网络。应用R 软件包WGCNA 构建共表达网络,通过以下公式构建加权邻接矩阵Sij=|cor(Xi,Xj)|aij=Sijβ,其中i 和j 代表不同的circRNA,Xi 和Xj 代表circRNA 的表达量,Sij 表示皮尔逊相关系数,aij 表示2 个circRNA 之间的相关系数。本研究中选择软阈值β=10,无尺度模型拟合系数R2=0.91。
1.4 确定关键circRNA 将邻接矩阵转化成拓扑矩阵(TOM),TOM 矩阵是定量网络节点之间加权关系相似性的方法,然后通过层次聚类确定模块,每个模块至少包含30 个circRNA,最后确定可能在肝癌起关键作用的circRNA。
1.5 基因富集分析和聚类 应用circRNA 在线数据库(https://circinteractome.nia.nih.gov/)筛选出circRNA 可能结合的miRAN,通过miRNA 数据库(http://mirwalk.umm.uni-heidelberg.de/)得 到miRNA对应的靶基因,利用DAVID(https://david.ncifcrf.gov/summary.jsp)在线分析工具对靶基因进行KEGG 通路富集分析。
1.6 qPCR 验证 DMEM 培养液和10%胎牛血清体外培养人肝癌细胞系(HepG2)和正常肝细胞系(L02),收集细胞悬液使用TRIzol 从这些细胞中分离总RNA,通过RNase R 处理提高circRNA 的浓度,逆转录后使用实时定量qPCR 分析定量circRNA。以β-actin为内参照,PCR 的反应条件:95 ℃2 min、95 ℃15 s、58 ℃60 s,共40 个循环,qPCR 引物序列见表1。
表1 circRNA 引物序列
1.7 生存分析验证 通过Kaplan-Meier plotter 数据库(http://kmplot.com/analysis/index.php)对筛选出来circRNA 靶向的microRNA 进行生存分析验证。
2 结果
2.1 数据均一化和选择软阈值 共检测到3032 个circRNA 分子,均一化后应用WGCNA 方法构建circRNA 共表达网络,当软阈值为10 时,基因之间连通性符合无尺度网络分布,无尺度模型拟合系数R2=0.91,见图1。
图1 WGCNA 软阈值确定
2.2 共表达模块构建与肝癌相关模块的关系 应用WGCNA 方法共得到7 个模块,其中Turquoise 模块与肝癌组织呈正相关(P<0.05),见表2、图2。
图2 Turquoise 模块与肝癌组织的相关性
表2 共表达模块构建与肝癌相关模块的关系
2.3 circRNA 与miRNA 关联基因筛选 Turquoise 模块中circRNA 表达量在肝癌组织中均表达上调,见表3。经过在线数据库比对筛选出hsa_circ_0064324和hsa_circ_0040827 进一步分析,共筛选出hsamiR-146b-3p、hsa-miR-331-3p、hsa-miR-874-3p和hsa-miR-942-3p 四个miRNA 分子,然后通过miRWalk 数据库miRDB、TargetScan、miRTarBase 软件筛选出这些miRNA 对应的靶基因,构建circRNA-miRNA-mRNA 网络,见图3。
图3 肝癌中circRNA-miRNA-mRNA 相互作用网络图
表3 Turquoise 模块中circRNA 量表达
2.4 功能富集分析验证 提取miRWalk 数据库miRDB、TargetScan、miRTarBase 软件筛选得到miRNA靶向基因,利用David 在线分析软件对这些基因进行Pathway 富集分析,结果显示这些靶向基因富集在鞘磷脂信号通路、癌症蛋白聚糖、血小板活化通路、胰腺癌通路、神经胶质细胞瘤、FoxO 信号通路、癌症中胆碱代谢通路等多个和癌症相关的通路上,见图4。
图4 KEGG 富集通路分析
2.5 功能验证 体外培养人肝癌细胞系(HepG2)和正常肝细胞系(L02),并对筛选到的hsa_circ_0064324和hsa_circ_0040827 定量检测,可见在肝癌细胞系中hsa_circ_0064324 和hsa_circ_0040827 均表达上调,见图5。Kaplan-Meier 生存分析发现,hsa-miR-146b-3p、hsa-miR-331-3p、hsa-miR-874-3p 和hsa-miR-942-3p 高表达与肝癌总体生存期呈负相关(P<0.05),见图6。
图5 关键circRNA 在不同细胞系中表达
图6 miRNA 生存分析验证
3 讨论
circRNA 是一类封闭环状非编码RNA,分为外显子环状RNA、内含子环状RNA,通过和miRNA 结合在转录、转录后以及翻译和翻译后水平调控基因表达发挥重要作用。circRNA 具有表达相对稳定、表达调控有时空特异性、成环序列保守等优势,在肝癌发生机制研究中备受关注[6]。目前已发现circRNA-5692[7,8]、circRNA-100338[9,10]、hsa_circRNA_104348[11,12]与 肝癌发生发展相关。这些环状RNA 通过内源竞争RNA(ceRNA)机制结合miRNA 分子导致靶基因沉默,影响肝癌细胞侵袭转移。由于肝癌发生发展机制复杂,需要更好的方法挖掘更多肝癌相关环状RNA 以揭示肝癌调控机制。
circRNA 芯片具有通量高检测灵敏度高特点,可以对人体内大多数circRNA 同时高效检测。本研究利用芯片数据中circRNA 之间相互关联绝对值定义共表达网络,通过一个邻接矩阵定义相互关联权重,采用软阈值参数构造加权网络,使用拓扑重叠度量(TOM)作为邻近度量,结合2 个邻接circRNA 相互作用强度,聚类成网络模块[13,14]。另在网络模块中,应用主成分分析计算出主成分和临床性状相互关系,确定与肝癌相关模块,并依据circRNA 与主成分模块相互关系确定出关键circRNA[15,16]。本研究从与肝癌正相关Turquoise 模块中挑选出上调表达cir cRNAs,经文献数据库比对筛选出hsa_circ_0064324、hsa_circ_0040827 进一步分析,利用qPCR 定量检测发现在肝癌细胞系HepG2 中它们均表达上调,并在数据库中发现这些circRNA 可能通过竞争结合hsa-miR-146b、hsa-miR-942、hsa-miR-331、hsa-miR-874;经生物信息学分析发现,这些microRNA 分子下游靶基因多富集在与癌症发生发展相关通路。有研究证明[17],FoxO 信号通路与肝癌转移密切相关,该通路中FoxO 转录因子调节多种生物过程,包括细胞增殖、死亡、衰老、血管生成、细胞迁移和转移所必需的基因。
预后评价是制定临床方案重要参考之一,对于延长患者生存期意义重大。Li C等[18]研究发现,TRAF6(TNF 受体相关因子)为肝癌中miR-146b-5p靶向位点,通过抑制TRAF6 介导AKT 通路磷酸化可减少肝癌细胞生长和转移。Zhang QF等[19]研究发现,与正常组织相比,肝癌组织和细胞系中miR-942-3p 表达水平升高,并与病理分期和肿瘤淋巴结转移分期相关,是肝癌患者生存率低的独立预后因素。PH 域和亮氨酸丰富重复蛋白磷酸酶(PHLPP)是miR-331-3p 靶点,miR-331-3p 通过抑制PHLPP 介导AKT 通路去磷酸化,促进肝癌细胞增殖。在肝癌细胞系PLC/PRF/5 中过表达的miR-874-3p 会抑制癌细胞生长,促进癌细胞凋亡。本研究Kaplan-Meier生存分析发现,hsa-miR-146b-3p、hsa-miR-331-3p、hsa-miR-874-3p 和hsa-miR-942-3p 高表达与肝癌总体生存期呈负相关,即表达量越低,患者肝癌预后生存期越长,提示hsa-miR-146b-3p、hsa-miR-331-3p、hsa-miR-874-3p 和hsa-miR-942-3p 高表达有可能是患者不良预后独立预测因子。
综上所述,利用WGCNA 方法筛选出hsa_circ_0064324 和hsa_circ_0040827,经生物信息学分析认为其可能结合hsa-miR-146b-3p、hsamiR-331-3p、hsa-miR-874-3p 和hsa-miR-942-3p,间接调控下游靶基因表达,影响肿瘤细胞增殖侵袭,这两个circRNA 分子可能作为肝癌的生物标记物和治疗靶点,对肝癌诊断和治疗有积极意义,然而如何调控靶基因作用于癌症发生与转移仍有待进一步探索。