APP下载

乳腺癌差异表达长链非编码RNA的筛选与分析

2022-03-31吐鲁洪沙列尔

新疆医科大学学报 2022年3期
关键词:通路编码乳腺癌

赵 倩,吐鲁洪·沙列尔

(新疆医科大学附属肿瘤医院乳腺外科,乌鲁木齐 830011)

乳腺癌是女性最常见的恶性肿瘤之一,截止2018年全球约有200万新诊断的女性乳腺癌病例,占女性癌症病例的1/4[1]。根据国家癌症中心发布的《2017 年中国肿瘤现状和趋势》,女性乳腺癌死亡率在女性最常见的恶性肿瘤中排名第六[2]。乳腺癌严重威胁着女性健康,因此寻找便捷且高效乳腺癌诊断标志物,对乳腺癌的防治具有重要意义[3-4]。非编码RNA 是指序列上缺乏明显的开放读码框,不具有编码蛋白能力的一类RNA,包括长链非编码RNA(lncRNAs)、环状RNA(Cir-cRNAs)和微小RNA(miRNAs)[5]。作为一种重要的癌症靶向标记物中,长链非编码的RNA(long non-coding RNA,lncRNA)在乳腺癌中的相关研究越来越多[6]。lncRNA 是一类长度大于200个核苷酸的非编码RNA[7],最近的系统基因组学研究揭示,其主要通过调控表观遗传学转录及转录后水平的基因表达,广泛参与多种疾病的发生、发展,但是其生物功能和作用机制尚待阐明。lncRNA 中有的发挥促癌作用,有的发挥抑癌作用,在乳腺癌的研究中,很多lncRNA被鉴定为致癌因子,很少被鉴定为抑制肿瘤的lncRNA,它们参与肿瘤细胞的生长、凋亡、迁移与侵袭,因此这种新型的RNA 可以作为诊断和预后的生物标记物,也可以作为潜在的治疗靶标[8-9]。基因芯片作为一种高效、大规模的生物信息学技术,可检测和分析肿瘤组织与正常组织之间差异表达的基因,为筛选新的肿瘤标志物提供机会[10]。本研究以乳腺癌为研究对象,利用基因芯片对乳腺癌组织中lncRNA 进行全面分析,以筛选差异表达的lncRNA,并探讨其在乳腺癌发生、发展中的作用及潜在功能,为寻找乳腺癌早期诊断标记物提供理论依据与方向。

1 资料与方法

1.1 一般资料收集2018 年9 月—11 月新疆医科大学附属肿瘤医院5 对女性乳腺癌组织及其癌旁正常组织(距肿瘤大于5 cm)标本,所有患者均经病理学诊断,术前未进行放、化疗等治疗。患者年龄31~67岁,中位年龄51 岁。该研究已通过新疆医科大学附属肿瘤医院伦理委员会审查(审批号:K2019003),并已获得患者的知情同意。

1.2 试剂与仪器紫外分光光度计(Nano Drop ND-1000)购自美国Nanodrop 公司,Trizol 试剂(Invitrgen),RNA 6000 Nano Lab-on-a chip 试剂盒和生物芯片分析系统2100 Bioanalyzer购自美国Agilent公司。

1.3 芯片制备由北京博奥晶典生物技术有限公司定制的Capital Bio Technology Human LncRNA Array V4,4×180K 芯片,检测人物种的基因表达谱,每个阵列包含41 000个lncRNA 检测探针和34 000个mRNA探针。

1.4 方法

1.4.1 RNA 提取、标记与杂交 根据试剂说明书,按照Trizol 法提取乳腺癌组织及癌旁正常组织中的总RNA,用紫外分光分度法测定总RNA 浓度和纯度,计算光密度(optical density,OD)OD260/OD280 值,抽提所得RNA 经安捷伦生物分析仪2100 Bio analyzer 电泳质检合格后备用。

1.4.2 芯片实验 本研究所选用的芯片为人4×180 K芯片,共10 个标本,需要完成10 张上述芯片。具体步骤如下:(1)RNA 的扩增和标记;(2)芯片杂交:按照Agilent 杂交标准流程和配套试剂盒将互补RNA(cRNA)产物与lncRNA芯片进行。(3)芯片扫描:完成杂交的芯片用安捷伦微阵列扫描仪进行扫描。使用逆转录试剂盒对RNA 逆转录为互补脱氧核糖核酸(cDNA)并进行纯化,体外转录成cRNA,对cRNA 产物进行荧光标记。以cRNA 为模板,用CbcScriptⅡ酶,随机引物(random primer)进行反转录。纯化回收反转录得到的cDNA 并定量。以反转录的cDNA 产物为模板,用Klenow Fragment 酶,随机引物(random primer),合成cDNA 互补链并掺入带有荧光基团的脱氧核糖核苷三磷酸(dNTP)(单通道为Cy3-dCTP,双通道为Cy3-dCTP 和Cy5-dCTP),纯化并定量标记产物。带有荧光基团DNA即可用于芯片杂交。

1.4.3 差异表达基因功能及通路富集分析 利用生物学信息注释数据库(DAVID)对差异基因进行基因本体(gene ontology,GO)生物学过程富集分析和京都基因与基因组百科全书(kyoto encyclopedia of genes and genomes,KEGG)通路富集分析,富集标准为P<0.05。

1.5 统计学处理对10张芯片的数据进行汇总和归一化。通过使用Gene Spring软件V13.0(Aglient)进行质量控制,选择差异表达的基因。差异表达lncRNA的筛选标准为差异倍数(FC)≥2倍,以P<0.05为差异有统计学意义。

2 结果

2.1 筛选差异表达lncRNA乳腺癌组织与癌旁组织相比,乳腺癌组织中具有2 倍(|log2FC|>1)以上差异的lncRNA 有1 150 条,其中上调的lncRNA 有551条,下调的lncRNA 有599 条。下调lncRNA 差异最显著的为XR_159043.1(FC=26.878,P<0.05),上调的lncRNA 差异最为显著的是ENST00000427451.1(FC=11.478,P<0.05),选取显著高表达的lncRNA 进行列表,见表1。

表1 乳腺癌组织中显著差异表达lncRNA

2.2 聚类分析对筛选的lncRNA进行聚类分析结果显示,同组的样本聚类在一起,说明样本间基因表达的趋势是一致的,见图1。

图1 乳腺癌差异表达的lncRNA聚类分析

2.3 lncRNA 参与的生物信息学功能分析通过GO 富集发现,lncRNA广泛参与多种生物学进程,包括RNA加工、mRNA 代谢过程、mRNA 加工、RNA 剪接、基因表达等,见图2。KEGG 信号通路分析发现,lncRNA参与了PI3K-AKT、RIG-I 样受体信号通路,参与了癌症中的转录失调、病毒感染、雌激素信号通路等进程,见图3。

图2 GO富集分析乳腺癌中差异表达的lncRNAs

图3 KEGG信号通路分析乳腺癌中差异表达的lncRNAs

2.4 差异表达lncRNA 靶基因预测差异表达lncRNA共有119 种靶基因,列举的20 种靶基因对应的lncRNA,见表2。

表2 20种靶基因对应的lncRNA

3 讨论

目前,人们在不断寻找能够作为乳腺癌诊断的生物学标志物和相关的治疗靶点[11]。蛋白质编码序列包含20 000 多个蛋白编码基因,占基因组总数不超过2%,大多数人类基因的转录子是长链非编码RNA[12]。众多研究发现,长链非编码RNA 在肿瘤的形成和进展中起重要的作用。目前已发现,在肿瘤组织和正常组织中有一系列的差异表达lncRNA,这些差异表达的lncRNA 有可能作为肿瘤诊断的标志物,甚至可以预测患者预后[13-15]。近年来随着分子医学的迅速发展,生物信息学成为探寻疾病诊断和治疗的主要方法与手段。基因芯片技术以其高通量、大规模检测肿瘤基因,并且具有自动化、灵敏度高、速度快等优点而被广泛应用于各个领域[16]。因此本研究采用基因芯片测序检测5 对乳腺癌患者的肿瘤组织和癌旁组织,进一步分析差异表达的lncRNA 结果显示,乳腺癌组织中具有2 倍(|log2FC|>1)以上差异的lncRNA 有1 150 条,其中上调的lncRNA 有551条,下调的lncRNA 有599 条。通过原始数据用软件归一化后,利用差异表达位数以及t检验统计方法进行差异筛选基因,将筛选所得的差异基因,通过聚类热图的方法,对结果进行了直观的图形展示,这说明乳腺癌组织和癌旁组织多基因表达量的聚类关系。

GO 分析和KEGG 通路分析也可为乳腺癌中相关基因和基因产物提供一定信息基础,并进一步说明乳腺癌中的相关基因和基因产物。本研究采用GO和KEGG 通路分析生物学功能发现,差异表达基因参与多种生物过程、细胞组织成分和分子功能有关。通过GO 分析发现,差异表达lncRNA 具有丰富的生物学功能,包括有核酸转运、RNA 加工等过程。而信号通路方面,PI3K-AKT 信号通路先前已被证实在乳腺癌的发生、发展中起重要作用,超过70%的乳腺癌患者至少存在一种该通路成分的改变[17]。这条通路最主要的基因变异是PTEN 基因活性缺失、PI3KAKT 激活点的突变以及AKT 的突变。本研究对5 对乳腺癌和癌旁组织差异表达的lncRNA 进行检测,发现与乳腺癌有关的信号通路有PI3K-AKT 信号通路,与相关研究结果一致。

通过生物信息学的方法,可为筛选肿瘤相关lncRNA 提供一个方便快捷的途径,为寻找肿瘤新型标志物提供新的思路。越来越多的肿瘤中发现存在异常表达的lncRNA。作为第一个被发现的lncRNA H19,在乳腺癌中H19 的过表达促进肿瘤的发展,在乳腺癌细胞的增殖、转移、化学耐药性和干细胞维持中起重要作用。相关研究证实,H19在乳腺癌组织和细胞中上调,并且与乳腺癌预后相关[18]。也有研究表明,H19 在雌激素受体(ER)阳性乳腺癌中比在ER 阴性乳腺癌组织中含量更高[19]。在乳腺癌中,HOX 转录反义RNA(HOTAIR)是目前较多的lncRNA 之一。HOTAIR 基因的启动子包含多个雌激素反应原件,并在雌激素受体阳性的乳腺癌细胞中雌二醇转录激活,HOTAIR 与乳腺癌1 号基因(BRCA1)竞争,它介导了Myc 原癌基因(c-Myc)的致癌作用。HOTAIR 最重要的作用是参与癌症的进展,其过度表达会刺激癌细胞侵袭和转移[20]。另外,HOTAIR 可通过与自噬基因特有的mRNA 相互作用,调节自噬,这对于乳腺癌的发展至关重要[21]。

综上所述,本研究通过生物芯片和生物信息学技术发现了乳腺癌患者中差异表达的lncRNA,但差异表达的lncRNA数量较多,而且功能未知,今后应逐一进行差异表达lncRNA 的功能验证,分析其与乳腺癌的相关性,进一步探讨其在乳腺癌发病机制中的作用。

猜你喜欢

通路编码乳腺癌
DJ-1调控Nrf2信号通路在支气管哮喘中的研究进展
基于改进TF-IDF算法的基因通路富集方法
HEVC对偶编码单元划分优化算法
AngⅡ激活P38MAPK信号通路在大鼠NSAID相关小肠损伤中的机制研究
住院病案首页ICD编码质量在DRG付费中的应用
别逗了,乳腺癌可不分男女老少!
男性也应注意乳腺癌
太干净的女性易患乳腺癌
吃错了 小心得乳腺癌!
论纪录片影像中的组合编码运用