APP下载

利用UALCAN与ENCORI数据库分析lncRNA H19在甲状腺癌中的表达及其作用机制*

2022-09-27张晓敏胡彩虹何继瑞

甘肃科技 2022年12期
关键词:甲状腺癌生存率调控

张晓敏,徐 坤,胡彩虹,何继瑞

(兰州大学第二医院特需内科(老年病科),甘肃 兰州 730030)

甲状腺癌(THCA)是内分泌系统最为常见的恶性肿瘤,其在头颈部恶性肿瘤中的发病率居于首位[1]。近年来,THCA 在全世界范围内的发病率呈迅速增长的态势[2],根据肿瘤起源及分化差异,一般将THCA 分为4 种类型:甲状腺乳头状癌(PTC)、甲状腺滤泡癌(FTC)、甲状腺髓样癌(MTC)以及甲状腺未分化癌(ATC),其中PTC 与FTC 合称分化型甲状腺癌(DTC)。THCA 中95%左右属于DTC,其生物行为温和,预后相对较好[3]。然而,依然有部分THCA 如局部进展或复发的DTC、髓样癌及所有未分化癌等多表现出高度的侵袭性,易复发、转移,且预后较差,是导致患者死亡的主要原因,是THCA 治疗所面临的一大挑战[4]。

后基因组时代,基于肿瘤发病机制与分子靶标的精准靶向治疗已成为难治性和高侵袭性THCA 前沿治疗方法[5]。近年来,随着人们对长链非编码RNA(lncRNA)生物学功能的认识不断加深,其在各类肿瘤发生、发展过程中所发挥的作用受到了医学界持续而广泛的关注[6-7]。大量研究表明,lncRNA在THCA 中存在差异化表达,并可通过多种方式参与THCA 的发生和发展[8-10]。然而,THCA 发病原因复杂,发病机制还不清楚,尤其对于高侵袭性THCA而言,临床上缺乏有效的诊断、治疗手段及预后指标。因此,探究lncRNA 表达与THCA 之间的关系可为阐明后者的发病机制、寻找新的分子治疗靶点和预后指标提供理论依据。

H19是一个只在母系等位基因上表达(父系印记)的长度为2.3 kb的lncRNA分子。研究表明,H19可通过多种机制调控细胞增殖、迁移、侵袭、抗凋亡和上皮-间质转化,具有致癌或抗癌作用[11],可作为肿瘤诊断、治疗及预后的生物学标志物。然而H19在THCA 中的表达规律及相关生物学机制目前仍知之甚少。因此,本研究旨在利用UALCAN 和RNA 相互作用百科全书(ENCORI)数据库分析lncRNAH19在THCA 中的表达情况及其可能的作用机制,以期为THCA 的诊断标志物和治疗靶点的选择以及预后分析提供一定的理论依据,为相关临床转化研究提供借鉴。

1 材料与方法

1.1 采用的数据库

(1)UALCAN 数据库。UALCAN(http://ualcan.path.uab.edu)是一个主要针对癌症基因组图谱(TCGA)数据库进行癌症数据分析与挖掘的在线平台。通过UALCAN 用户可方便、快捷地对TCGA 已公开的癌症组学数据进行访问,也可进行肿瘤生物标志分子鉴定或者对目标基因在肿瘤中的表达进行在线模拟验证和预后生存分析等。

(2)ENCORI 数据库。ENCORI(http://starbase.sysu.edu.cn)是由中山大学团队开发的用于研究由大规模紫外交联免疫沉淀结合高通量测序(CLIPSeq)产生的lncRNA、微小RNA(miRNA)、内源竞争RNA(ceRNA)、RNA 结合蛋白(RBP)和mRNA 互作网络的数据库。

(3)RegRNA 2.0 数据库。RegRNA 2.0(http://regrna2.mbc.nctu.edu.tw)是一个专门用于RNA 功能性motif 预测的网站,可实现上下游调控分子的预测。

(4)DAVID 数据库。DAVID(https://david.ncifcrf.gov)全名为注释、可视化和综合发现数据库(the Database for Annotation,Visualization and Integrated Discovery),是一个集生物学数据和分析工具于一体的生物信息数据库,可对批量的基因或蛋白列表进行系统全面的生物功能注释,从而帮助用户获取生物学信息。

1.2 检索与分析

(1)以“H19”为关键词,利用UALCAN 数据库分析H19在THCA 中的表达水平及其与肿瘤分期、种族、性别、年龄及病理亚型之间的关系及其预后。

(2)以“H19”为关键词,利用ENCORI 数据库中的“RNA-RNA 模块”和“RBP-Target 模块”分析预测可能与H19结合的上下游靶基因;利用RegRNA 2.0数据库对可能与H19结合的miRNA 进行预测,检索参数设定采用系统默认值。将两种数据库预测得到的靶基因利用Excel软件进行去重复处理。

(3)利用DAVID 数据库,对(2)中预测得到的H19靶基因进行GO和KEGG注释及富集分析。

(4)结合靶基因功能注释和通路富集分析结果,利用ENCORI 数据库中的“Pan-Cancer 模块”对H19和其靶基因SMAD4 在THCA 组织中表达相关性进行分析。

(5)以“SMAD4”为关键词,利用UALCAN 数据库分析SMAD4在THCA中的表达规律及其预后。

1.3 统计学处理

THCA 基因表达和临床患者资料源自TCGA 数据库,利用Perl 语言进行了各组间基因表达水平的差异t检验;利用R语言绘制分组Kaplan-Meier生存曲线,生存率曲线间的显著性测定采用log-rank 检验;通过Fisher 精确检验进行GO 和KEGG 富集显著性分析。以P<0.05表示具有统计学意义。

2 结果

2.1 H19在THCA中的表达及预后

通过UALCAN 数据库,以THCA 为标签共检索到564 例样品:其中,正常对照组(Normal)59 例,原发性肿瘤组(Primary tumor)505例;按肿瘤分期计,1期(Stage 1)284 例,2 期(Stage 2)52 例,3 期(Stage 3)112 例,4 期(Stage 4)55 例;按病理亚型计,经典型THCA(Classical Thyroid Papillary Carcinoma)358 例,高细胞型THCA(Tall Cell Thyroid Papillary Carcinoma)36 例,滤泡型THCA(Follicular Thyroid Papillary Carcinoma)102 例,其他类型THCA(Others)9例;按性别计,男性(Male)136 例,女性(Female)369例;按年龄计,21~40周岁(Yrs)175例,41~60周岁(Yrs)200 例,61~80 周岁(Yrs)103 例,81~100 周岁(Yrs)10 例;按种族计,高加索裔或白种人(Caucasian)334 例,非洲裔或黑种人(African-American)27例,亚洲裔或黄种人(Asian)51例。

H19在THCA 中的表达情况见图1。结果显示:与正常对照组相比,H19在THCA 中的表达无显著差异(P<0.05,图1-A),但与肿瘤分期显著相关,2期样品中H19基因的表达量显著下降,进入3 期以后则显著升高(P<0.05,图1-B);H19在THCA 中的表达与性别、年龄、种族因素无显著相关(P均>0.05),图1-D、图1-E、图1-F);此外,H19在THCA 中的表达与病理亚型关系密切:H19基因在高细胞型THCA 中的表达显著高于经典型THCA、滤泡型THCA 和其他类型THCA(P均<0.05);在经典型THCA 中的表达显著高于滤泡型THCA 和其他类型THCA(P均<0.05),见图1-C。

图1 H19基因在甲状腺癌中的表达

基因表达与预后相关分析表明,H19高表达的THCA 患者(n=127)其预后生存率显著低于中低表达的患者(n=377,P<0.05),见图2。

图2 H19基因表达对甲状腺癌患者生存预后的影响

2.2 H19靶基因预测、功能注释及通路富集分析结果

对H19靶基因进行GO 注释,共提取到与其相关的103条GO 功能标签。GO 注释标签富集分析显示,上述靶基因主要涉及RNA 聚合酶II启动子的转录调控、序列特异性DNA 结合、转录因子活性、转录因子结合、转录激活因子活性等功能。

KEGG 通路注释和富集分析显示,H19靶基因主要富集在致癌错误转录(transcriptional misregulation in cancer)、黏合连接(adherens junction)、癌症相关通路(pathways in cancer)、多能干细胞调控信号通路(signaling pathways regulating pluripotency of stem cells)、结肠直肠癌(colorectal cancer)、转化生长因子-β 信号通路(TGF-beta signaling pathway)、HTLV-I 感染(HTLV-I infection)、Hippo 信号通路(hippo signaling pathway)、急性髓系白血病(acute myeloid leukemia)、细胞周期(cell cycle)、FoxO 信号通路(FoxO signaling pathway)、Wnt 信号通路(Wnt signaling pathway)、THCA等13条通路。

2.3 H19与其靶基因SMAD4表达相关性

基于H19靶基因功能注释和通路富集结果,在ENCORI 数据库中的“Pan-Cancer 模块”选择“RNA-RNA CoExpression”,分析H19与其靶基因SMAD4 在THCA 组织中的表达相关性。结果显示:THCA 中H19和SMAD4 基因的表达呈显著负相关(r=-0.107,P<0.05)(图3)。推测THCA 中H19可能通过靶向性地调节SMAD4基因的表达,从而发挥其生物学效应。

图3 H19与SMAD4基因的表达相关性

2.4 SMAD4在THCA中的表达及预后

SMAD4 在THCA 中的表达情况见图4。结果表明:与正常对照组相比,SMAD4 在THCA 中的表达显著降低(P<0.05),见图4-A;SMAD4在THCA 中的表达与肿瘤分期、性别、年龄、种族因素无显著相关(P>0.05),见图4-B、图4-D、图4-E、图4-F;不同病理亚型病灶组织中的表达差异分析显示,SMAD4基因在经典型THCA 中的表达显著高于高细胞型THCA(P<0.05),与滤泡型THCA 和其他类型THCA相比则无显著差异(P均>0.05),见图4-C。由图5可以看出,SMAD4 高表达量THCA 患者与中低表达量患者的预后生存率无统计学意义(P>0.05),但存在SMAD4 中低表达患者生存率低于高表达患者的趋势。

图4 SMAD4基因在甲状腺癌中的表达

图5 SMAD4基因表达对甲状腺癌患者生存预后的影响

3 讨论

本研究利用UALCAN 数据库考察了lncRNAH19在THCA 中的表达情况。结果显示:H19在THCA 中的表达与肿瘤分期显著相关,尤其当肿瘤发展至3期以后其表达水平显著升高。此外,与中、低表达患者相比,H19高表达THCA 患者的预后生存率显著降低。这与刘娜等[12]的研究结果是一致的。H19表达上调与不同类型恶性肿瘤的发生具有相关性已被很多学者证实[13-17]。结合本研究的结果,我们推测H19可能是THCA 发生、发展过程中的重要生物学调控分子之一。

为了深入了解H19的分子作用机制,对H19的靶基因进行了预测,并对其进行GO和KEGG注释和富集分析。结果显示,靶基因SMAD4的出现频率最高且显著富集到了TGF-β 信号通路。进一步考察发现,H19与SMAD4 的表达呈显著的负相关关系;并且SMAD4在THCA中的表达显著降低,而SMAD4低表达THCA 患者预后变差。众所周知,TGF-β 信号通路在生理状态下被认为是恶性肿瘤发生的抑制性通路[18]。TGF-β 信号通路若出现紊乱,将使得细胞生长和分化过程失去控制,从而促进恶性肿瘤的发生与发展。SMAD4 是位于人类核染色体18 q21.1 上的一种抑癌基因,一旦SMAD4 基因缺失或突变,整个TGF-β 超家族信号转导网络即会被破坏,TGF-β 信号通路在肿瘤发展中的抑制效应便会消失[19]。相关研究也显示,结节性甲状腺肿与THCA 并存患者组织标本中SMAD4 蛋白表达阳性率相比于结节性甲状腺肿组、结节性甲状腺肿与甲状腺瘤并存组均显著降低[20]。因此,推测在THCA中,H19可能通过与SMAD4 相互作用使后者的表达量下调,从而对TGF-β 信号通路产生抑制,进而促进THCA的发生、发展。

需要指出的是,在本研究中,与健康人群相比,THCA 患者病灶组织中H19未呈现出表达上的差异,而与其显著相关的预测靶基因SMAD4则出现了显著的表达变化。分析原因,一方面图1-A 的结果中区只分了健康人群和THCA 患者2 个组,这就可能使得肿瘤分期导致的表达差异被掩盖,因为样本中THCA 患者可能处于不同的肿瘤分期,而如前所述,H19在THCA 中的表达与肿瘤分期显著相关;另一方面,基因转录调控具有非线性特点,上游分子信号还可能在基因表达调控过程中被级联放大[21]。另外,还要认识到mRNA-miRNA-lncRNA 三元ceRNA 网络是一个复杂生物学调控机制[22],lncRNA的分子功能具有多样性的特点。因此,本研究中结果显示H19基因的表达与肿瘤分期显著相关,而SMAD4 的表达则与肿瘤分期无关,且H19高调表达的THCA 患者其预后生存率显著低于中低表达的患者而SMAD4 高调表达与中低表达THCA 患者的预后生存率差异不显著,这可能与H19在分子调控功能上的多样性有关,其可能通过与其他分子互作从而调控肿瘤分期。本研究是基于生物信息数据库的预测和分析,H19和SMAD4 在THCA 中的表达规律及其互作关系尚有待今后通过体内外试验和临床加以验证;此外,在本研究中我们更多地着眼于H19和SMAD4 基因在THCA 中的表达,而未完成ceRNA 网络的构建,后续可利用甲状腺癌和正常配对组织的mRNA、miRNA、lncRNA 数据,完成mRNA、miRNA、lncRNA 互作的可视化分析,并结合试验验证识别出更多的关键生物标志物,以期为今后THCA的诊断、治疗及预后评估,提供一定的参考依据。

猜你喜欢

甲状腺癌生存率调控
甲状腺癌“低位领”式与“L”型切口淋巴结清扫术的比较
楼市调控是否放松
碘-125粒子调控微小RNA-193b-5p抑制胃癌的增殖和侵袭
分化型甲状腺癌切除术后多发骨转移一例
分化型甲状腺癌肺转移的研究进展
护理干预在降低甲状腺癌患者焦虑中的应用研究
“五年生存率”不等于只能活五年
影响胃癌术后5 年生存率的因素分析
如何调控困意
经济稳中有进 调控托而不举