基于高通量数据分析DNA甲基化和拷贝数畸变对C1orf26基因表达的影响
2020-06-21赵小芳杜欣娜
赵小芳,杜欣娜
(1.江苏医药职业学院基础医学部, 江苏 盐城 224005;2.佳木斯大学基础医学院,黑龙江佳木斯 154007)
乳腺癌作为女性常见的恶性肿瘤之一,位居女性恶性肿瘤首位,也是导致女性癌症相关性死亡的主要原因[1-2]。因此,积极寻找经济有效的乳腺癌预防、筛查、治疗及护理方式,有效降低其发病率与病死率,提高患者生活质量显得尤为重要。1号染色体开放阅读框26(Chromosome 1 Open Reading Frame 26,C1orf26)又名RNA内切核糖核酸酶同源物(RNA Endoribonuclease Homolog, SWT1),前期研究结果发现C1orf26在乳腺癌组织中高表达。本研究通过高通量数据分析DNA甲基化和拷贝数畸变对乳腺癌组织中C1orf26基因表达的影响。
1 资料与方法
1.1一般资料:本文高通量多组学数据来源于癌症多组学和临床数据库LinkedOmics[3](http://linkedomics.zhang-lab.org/admin.php)。选取患者均为浸润性乳腺癌,总数为1 105例,另外,还包括702例血液样本和111例正常乳腺组织样本,患者随访时间超过250个月。1 105例患者中,1 093例包含C1orf26 mRNA水平数据,963例包含C1orf26基因突变、拷贝数畸变和mRNA水平数据。
1.2数据分析方法:登录LinkedOmics网站,查询乳腺癌患者中C1orf26表达与临床指标的相关性。另外,笔者还利用该网站分析了C1orf26 mRNA水平与其基因拷贝数畸变或甲基化水平的相关性。
1.3统计学方法:不同组织类型、肿瘤纯度和种族中C1orf26的表达差异采用非参数T检验,P<0.05为差异有统计学意义;C1orf26基因拷贝数畸变和甲基化水平对其表达的影响采用Spearman相关分析,P<0.05为差异有统计学意义。
2 结果
2.1DNA甲基化和拷贝数畸变与C1orf26基因在乳腺癌组织中表达的相关性:LinkedOmics结果显示,C1orf26基因拷贝数变化与C1orf26表达呈正相关,差异有统计学意义(r=0.509,P<0.01),见图1B;而C1orf26基因甲基化水平与C1orf26表达呈负相关,差异有统计学意义(r=-0.333,P<0.01),见图1A。
2.2乳腺癌中C1orf26表达与临床指标的相关性:LinkedOmics结果显示,C1orf26的表达分别受到乳腺癌组织类型、肿瘤纯度和患者种族的影响,差异有统计学意义(P<0.01、P<0.05、P<0.01),见图2A~图2C。
A:DNA甲基化与C1orf26基因表达变化的相关性;B:拷贝数畸变与C1orf26基因表达变化的相关性。统计学方法均为斯皮尔曼相关性检验
A:乳腺癌组织类型对C1orf26表达影响,统计方法为非参数T检验;B:肿瘤纯度对C1orf26表达影响,统计方法为非参数T检验;C:患者不同种族对C1orf26表达影响,统计方法为非参数T检验
3 讨论
乳腺癌是女性最常见的恶性肿瘤之一,根据美国癌症协会统计分析,2017年美国新发的乳腺癌病例达到255 180例,因乳腺癌死亡的人数达到41 070例。而在中国,新发的乳腺癌病例和死亡病例也分别达到272 400例和70 700例,并且呈持续增长的模式[4-5],严重威胁女性健康和生活质量[6-7]。因此,研究乳腺癌发病的分子机制以及寻找新的预后标志物对于乳腺癌患者具有重要意义。C1orf26在肿瘤中的作用及其机制尚不明确。本文首次发现DNA甲基化和拷贝数畸变与C1orf26基因在乳腺癌组织中表达的相关性。
C1orf26是一种蛋白质编码基因,主要位于细胞核和细胞质中,主要功能是促进细胞核周边异常的前体mRNA降解,防止缺陷型mRNPs进入细胞质[8]。有研究表明,C1orf26是具有转录功能的蛋白质[9],并在前期研究中发现其在乳腺癌中高表达,可能促进肿瘤的相关基因的表达。
C1orf26基因拷贝数增加促进了该基因的表达,这符合基因表达调控机制的认知[10-11]。C1orf26基因甲基化水平负向调控其表达,表明该基因呈低甲基化水平,符合低甲基化状态的原癌基因表达增强促进肿瘤发生的机制[12-13]。然而,有关C1orf26基因在肿瘤中的表达情况目前尚未见报道。这提示C1orf26作为具有转录功能的蛋白[9],其高表达极有可能促进了乳腺癌的发生和发展。因此,检测乳腺癌中C1orf26基因表达具有重要的临床意义,可作为乳腺癌预后的潜在标志物,此结果有进一步研究的价值。此外,C1orf26在不同组织学类型的乳腺癌中表达不同,说明可能参与不同亚型乳腺癌的发生和进展。肿瘤纯度与C1orf26表达有关,说明不同细胞中C1orf26的表达丰度不同,具有细胞表达特异性。而患者种族与C1orf26表达相关,说明C1orf26的表达可能具有种族差异性。
利用TCGA数据库和LinkedOmics数据库进行数据挖掘以及预后的分析,可以快速分析一个或多个基因在肿瘤中的特异性表达,为以后的实验研究提供理论基础,可以对数据进行很好的整合,缩短科研周期,这给广大科研工作者提供了新的思路[14]。笔者通过生物信息学预测的方式初步筛选出肿瘤与正常组织有差异性表达的基因C1orf26,鉴于患者样本数据较大,随访时间较长,组学数据完备,C1orf26高表达不利于乳腺癌患者预后这一结果的可信度较高。但是,基因C1orf26是否能作为新的乳腺癌肿瘤标记物还需进一步的研究。