APP下载

多组学数据筛选乳腺癌miRNA效应标志物研究*

2022-03-01宋佳杰赵天米王嘉璐李恩泽邢凯循

包头医学院学报 2022年2期
关键词:调控样本乳腺癌

宋佳杰,赵天米,王嘉璐,李恩泽,邢凯循,朱 浩

(1内蒙古医科大学中医学院,内蒙古 呼和浩特 0101102;内蒙古医科大学第三临床医学院;3.内蒙古医科大学公共卫生学院)

乳腺癌是一种常见肿瘤,男女均可发病。数据显示2018年全球新发乳腺癌超过200万例,仅次于肺癌[1]。在中国,乳腺癌是45岁以下妇女癌症死亡的主要原因。2015年中国女性乳腺癌发病率高达268.6 / 千人,死亡率高达69.5 / 千人[2]。由此可见,防治乳腺癌已经成为一个刻不容缓的任务。

乳腺癌防治的关键在于早发现、早诊断、早治疗,但其发病症状不明显,多数患者在发现自身罹患乳腺癌时往往已经错过最佳治疗时间。因此开发高效的筛查方法早期发现乳腺癌患者,对于改善患者的预后至关重要。目前乳腺癌的筛查主要依靠超声检查和钼靶摄影,这些检查方式不仅价格较高,且涉及到隐私部位使得部分受检者不愿配合[3]。而且一些受检者对于有放射性的检查心存疑虑,使得乳腺癌的早期筛查推广和应用受到限制。

miRNA是短链非编码RNA,在真核生物中参与调控多种生物过程。研究显示miRNA表达异常与肿瘤的发生和发展存在密切联系。不同癌症患者体内普遍存在miRNA表达异常。研究显示miRNA可在患者组织和血液中稳定存在,具有良好的作为生物标志物的潜力[4]。因此可以使用miRNA对肿瘤进行诊断、分期和预后判断[5]。本研究的目的在于通过比较正常人的乳腺组织和乳腺癌患者癌组织中miRNA表达状况,并结合乳腺癌患者生存资料寻找有潜力作为生物标志物的miRNA。

1 对象与方法

1.1数据来源 本研究中所使用的miRNA芯片数据集GSE26659(含77例肿瘤样本、17例正常样本)、GSE44899(含76例肿瘤样本、4例正常样本)、GES44124(含50例肿瘤样本、3例正常样本)来源于GEO (Gene Expression Omnibus)数据库,此三个数据集的实验设计均为乳腺癌患者的癌组织和健康人的正常组织比较。生存时间等数据来源于TCGA (The Cancer Genome Atlas Program)数据库的乳腺癌数据(含1103肿瘤样本,104正常样本)。靶基因预测数据来源于miRDB、miRTarBase、TargetScan数据库。蛋白相互作用分析利用了STRING数据库。

1.2分析方法 对乳腺癌芯片数据集进行差异分析,找到上调或下调表达的miRNAs,对这些miRNAs进行生存分析,筛选出有统计学意义的miRNAs,使用ROC曲线评估这些miRNA对肿瘤和正常组织的区分能力,在此基础进行靶基因预测和功能分析,了解这些miRNA功能和作用。

1.3使用工具 本研究使用R语言进行(版本:4.0.4),关键的R包有:GEOquery、Limma、TCGAbiolinks、survival、pROC、clusterProfiler、STRINGdb。

2 结果

2.1差异分析 在对数据进行标准化和log转换之后对每个数据集进行差异分析,以log fold change>1且调整P值<0.05为标准筛选差异miRNA,然后对三个数据集得到的差异miRNA取交集,以至少共同出现在两个数据集中的miRNA为差异miRNA,共筛选出21个miRNA,其中表达上调的4个,表达下调的17个。详见表1。

表1 筛选出的miRNA在癌组织中表达情况

2.2生存分析 使用TCGA数据库中的乳腺癌miRNA表达数据和患者生存情况资料对上一步得到的21个miRNA进行生存分析,结果显示has-miR-96 - 5p、has-let - 7g - 5p、has-miR-425 - 5p三个miRNA表达情况不同的患者预后情况存在统计学差异。总体来看,3个miRNA都呈现表达量增高与良好预后效果成正比。详见图1。

图1 不同miRNA表达情况与生存期的关系

2.3ROC曲线分析 对上一步中得到的3个miRNA,使用TCGA数据库中的乳腺癌miRNA表达数据评估其区分肿瘤样本和正常样本的能力,结果显示has-miR-96 - 5p和has-miR-425 - 5p具有良好的区分能力,其曲线下面积(AUC)均大于0.7。详见图2。

图2 不同miRNA的ROC曲线

2.4靶基因预测和功能分析 进一步对具有良好区分性能的两个miRNA进行靶基因预测,探讨其通过何种途径发挥生物学作用。首先分别使用miRDB、miRTarBase、TargetScan靶基因数据库对miR-96-5p和miR-425 - 5p进行预测,对3个数据库的预测结果取交集作为最终结果,共得到61个靶基因。其中miR-96 - 5p有39个,miR-425 - 5p有22个。

在此基础上,对预测出的结果进行GO和KEGG分析。GO分析显示这两个miRNA调控的靶基因主要参与调节蛋白激酶活性、MAP激酶活性、细胞对肽的反应、MAP激酶活性正调控、对前列腺素E的反应、细胞对肽激素刺激的反应等生物学过程(biological process,BP)。KEGG分析显示这两个miRNA调控的基因主要富集于产热通路、MAPK信号通路、miRNA癌症相关通路、长寿调节、癌症相关的PD - L1表达和PD - 1检查等通路。结果见图3。

图3 富集分析结果

2.5蛋白互作网络分析(PPI) 将得到的61个靶基因输入到STRING在线工具中构建蛋白互作网络,将连接系数的阈值设置为0.4,经过筛选28个靶基因调控的蛋白具有相互关系。结果见图4。其中可以看出KRAS、DDIT3、FOXO1、NRAS与其他蛋白联系较为密切。

图4 靶基因蛋白互作网络的构建

3 讨论

世界卫生组织已明确早发现早治疗是提高乳腺癌治愈率的最佳途径。特别是在我国人口中,乳腺癌发病的年龄早于西方国家[6]。本研究发现相对于正常乳腺组织,癌组织中有21个miRNA表达量明显改变。考虑到相似内容的研究中由于筛选标准界定不同,筛选出的miRNA数量存在较大差别。由于本次研究采用的方法是多芯片数据筛选出的结果再取交集,这虽然减少了筛选出的差异miRNA数量,但使得选出的标志物具有较好的泛化能力。

这21个miRNA中有多个已经在不同的研究中被证实同肿瘤的发生和发展存在广泛的联系。如miR-21在多个关于乳腺的研究中都被证实是上调的[7],而miR-125b、miR-145-5p 在乳腺癌中呈现下调[8]。本研究进一步利用TCGA数据对这21个miRNA进行了预后分析和ROC分析,筛选出2个对乳腺肿瘤样本和正常样本的具有区分能力良好且和患者预后有统计学关联的两个小RNA:miR-96 - 5p、miR-425 - 5p。此外,本研究中得出的主要基因及其调控的蛋白(KRAS、DDIT3、FOXO1、NRAS)在其他文献中也表现出与肿瘤的发生发展相关[8-10]。

miR-96 - 5p已被证实在乳腺癌和其他几种肿瘤组织中呈现高表达。Li等阐明了miR-96 - 5p可以通过调控MEK/ERK通路进而来影响乳腺癌病人的预后[11]。本研究也发现miR-96 - 5p可能和乳腺癌患者的预后情况存在密切关联。有研究显示miR-96 - 5p通过靶向FOXO3促进乳腺癌的增殖和侵袭[12]。这说明miR-96 - 5p在乳腺癌转移和侵袭过程中可能扮演了重要角色。

RQ - PCR试验证实了miR-425 - 5p在乳腺癌病人的组织中稳定存在[13]。文献报道miR - 425通过影响诱导PI3K / AKT信号通路促进肿瘤细胞的发生[14]。同时miR - 425的高表达可能会抑制某些lncRNA诱导的对乳腺癌细胞增殖和侵袭的抑制作用[15]。可见该miRNA参与的生物学过程和对乳腺肿瘤的调控机制十分复杂。总的来说,miR-425 - 5p在乳腺癌肿瘤组织中表达失调是毋庸置疑的。

本次研究通过分析3个芯片数据集合筛得出了2个具有作为乳腺癌生物标志物潜力miRNA,并在通过TCGA测序数据对其性能进行了验证和评估。由于本研究仅是对于多组学数据集的生物信息学分析,对于这些miRNA的作为效应标志的实用价值还需要进一步进行实验验证。

综上所述,本研究发现miR-96-5p、miR-425-5p两个miRNA对肿瘤组织和正常组织的具有区分能力良好且对乳腺癌患者的预后有重要影响,这两个miRNA有作为效应标志在乳腺癌筛查发挥作用的潜力。

猜你喜欢

调控样本乳腺癌
楼市调控是否放松
如何调控困意
规划·样本
别逗了,乳腺癌可不分男女老少!
男性也应注意乳腺癌
强化国土资源管理,调控土地交易行为
随机微分方程的样本Lyapunov二次型估计
太干净的女性易患乳腺癌
吃错了 小心得乳腺癌!
基于支持向量机的测厚仪CS值电压漂移故障判定及处理