催乳素处理的乳腺癌T-47D细胞lncRNA和mRNA表达谱差异分析
2017-10-24朱林静姚俊魏钦俊鲁雅洁曹新
朱林静,姚俊,魏钦俊,鲁雅洁,曹新
南京医科大学 基础医学院生物技术系,江苏 南京 211166
研究报告
催乳素处理的乳腺癌T-47D细胞lncRNA和mRNA表达谱差异分析
朱林静,姚俊,魏钦俊,鲁雅洁,曹新
南京医科大学 基础医学院生物技术系,江苏 南京 211166
目的:观察催乳素处理引起乳腺癌T-47D细胞中长链非编码RNA(lncRNA)和mRNA表达谱的变化。方法:利用转录组测序技术检测催乳素处理前后乳腺癌T-47D细胞中lncRNA和mRNA的表达谱;通过数据库KEGG、GO富集对有差异表达且具有统计学意义的mRNA进行通路分析,得到mRNA参与的生物学途径;运用荧光定量PCR(qRT-PCR)技术对部分差异表达的 lncRNA(lnc-AK4-2、XLOC_075541、XLOC_093371、XLOC_081110、XLOC_047068、XLOC_006637、XLOC_064063、XLOC_086865、XLOC_099517、XLOC_106798、lnc-ZNF639-1)进行验证,并利用生物信息学方法预测其靶基因,通过数据库KEGG、GO富集对差异lncRNA的靶基因进行通路分析。结果:分析得到3564个差异lncRNA和477个差异mRNA(差异倍数>2,P<0.05),差异表达的mRNA主要富集在134条不同的信号通路,其中包括催乳素/催乳素受体信号通路相关的MAPK信号通路、p53信号通路和JAK-STAT信号通路;选取的11条lncRNA的变化趋势(XLOC_093371、XLOC_006637、XLOC_064063、XLOC_086865、lnc-ZNF639-1表达上调,lnc-AK4-2、XLOC_075541、XLOC_081110、XLOC_047068、XLOC_099517、XLOC_106798表达下调)经qRT-PCR技术得到验证;lncRNA靶基因富集的信号通路同样包括MAPK信号通路。结论:催乳素处理前后T-47D细胞中lncRNA的表达存在明显差异,为进一步研究与乳腺癌发病机制相关的关键lncRNA分子提供了基础,并为寻找乳腺癌潜在的诊疗方法提供理论支持。
长链非编码RNA;表达谱;乳腺癌;催乳素;T-47D细胞
乳腺癌是当今困扰女性健康的最普遍的癌症之一,且其发病率呈逐年上升的趋势,由于乳腺癌起病隐匿,部分乳腺癌患者检出或确诊时已属中晚期,治疗效果不甚理想,因此早期诊断、早期治疗是提高生存率的关键[1]。目前,已经发现多种因素与乳腺癌有着密切关系。人催乳素(prolactin,PRL)是由脑垂体前叶分泌的由199个氨基酸残基构成的一种重要的多肽类生长激素,参与正常乳腺上皮的增生和分化[2]。有实验报道PRL在乳腺癌变过程中发挥重要作用[3]。PRL以内分泌、旁分泌及自分泌的方式与靶细胞膜表面的催乳素受体(PRL receptor,PRLR)结合并启动相应的细胞内信号转导过程(如MAPK信号通路、p53信号通路和JAK-STAT信号通路等),从而发挥非常广泛的生物学作用[4]。
近年来,长链非编码RNA(long non-coding RNA,lncRNA)在肿瘤发生、迁移及抗药性中作为调控因子和潜在治疗因子被广泛关注[5]。lncRNA由于缺少开放读框而不具有编码能力,因此一直以来被认为是转录噪音或克隆产物而很少受到关注[6]。但是,越来越多的实验证据表明lncRNA在人体内的异常表达与包括乳腺癌在内的多种恶性肿瘤的发生、发展关系密切[7]。
本研究利用Illumina测序平台检测了催乳素处理前后T-47D细胞RNA的表达谱,并结合生物信息学分析了处理组与对照组lncRNA和mRNA的表达变化,得到一系列差异明显且具有统计学意义(差异倍数>2,P<0.05)的 lncRNA和mRNA。从这些差异明显的lncRNA中选择了11个,利用荧光定量PCR对其表达差异情况进行验证。同时,利用生物信息学方法对这11个lncRNA进行了靶基因预测,并对这些靶基因进行了生物功能分析,结果显示催乳素处理前后T-47D细胞ln⁃cRNA和mRNA的表达变化可能与乳腺癌发生发展过程中催乳素受体信号通路相关。
1 材料和方法
1.1 细胞培养与催乳素处理
乳腺癌T-47D细胞购于中国科学院上海细胞库,由本实验室保存,细胞在含10%胎牛血清(Hyclone公司)的RPMI1640培养基(Gibco公司)中,于37℃、5%CO2的培养箱中培养。催乳素处理T-47D细胞过程参照本实验室之前的工作[8],将生长密度为70%~80%的细胞分为对照组与处理组,对照组仅加完全培养基,处理组加入含150 μg/mL PRL的培养液,每组均设3个平行复孔,于37℃、5%CO2饱和湿度孵箱内培养24~48 h,提取细胞总RNA。
1.2 总RNA提取与cDNA合成
用TRIzol(Invitrogen公司)分别提取催乳素处理组与对照组T-47D细胞中的总RNA,紫外分光光度计测定D260nm和D280nm值,对总RNA进行定量;计算D260nm/D280nm值,结合甲醛变性凝胶电泳,分析RNA质量。样品中提取RNA的D260nm/D280nm值为1.8~2.0,经甲醛变性胶电泳检测有清晰的28S、18S条带,无降解,且28S条带亮度约是18S的1~2倍,则认为这些样本的RNA可用于后续实验。
1.3 转录组测序
分别提取催乳素处理组与对照组T-47D细胞总RNA并用DNaseⅠ消化DNA后,用带有Oligo(dT)的磁珠富集mRNA;加入打断试剂在Thermo⁃mixer中将mRNA打断成短片段,以打断后的mRNA为模板合成单链cDNA,然后配制双链合成反应体系合成双链cDNA,用试剂盒纯化回收、粘性末端修复、cDNA的3'端加上碱基“A”并连接接头,然后进行片段大小选择,最后进行PCR扩增;构建的文库经Agilent 2100 Bioanalyzer和ABI StepOnePlus Real-Time PCR System质检合格后,用Illumina HiSeq 2000测序仪测序。
1.4 实时荧光定量PCR
从变化倍数在2倍以上并有显著差异(P<0.05)的lncRNA分子中挑选11个进行Real-time PCR验证。分别以催乳素处理组和对照组T-47D细胞的cDNA为模板,每条lncRNA引物由在线软件 Primer 5(http://sourceforge.net/projects/primer5/)合成,并在NCBI中经BLAST验证,采用StepOneplus荧光定量PCR仪,SYBR Green荧光染料(Ta⁃KaRa公司)掺入法相对定量。以内参GAPDH为参照,计算差异表达的倍数。
1.5 差异lncRNA与mRNA的生物信息学分析
为了寻找与lncRNA相互作用的mRNA,用2种不同的算法进行lncRNA靶基因预测。第一种算法是搜寻lncRNA顺式作用基因,通过在线软件UCSC(http://genome.ucsc.edu/)直接查找到的位于lncRNA位点上游或下游10 kb范围内转录的基因被认为是此lncRNA的顺式作用基因[9]。第二种算法是寻找lncRNA反式作用基因,首先用BLAST比对找到在序列上有一定同源性的mRNA和lncRNA,然后利用mRNA和lncRNA的相关性对结果进行过滤,最后用RNAplex(一个用来寻找2条长链RNA之间短的相互作用的软件)预测反义lncRNA与mRNA之间的互补结合[10]。
分别对预测得到的靶基因以及具有统计学意义的差异表达mRNA做进一步生物信息学分析,包括GO富集和KEGG通路分析。GO富集包括生物学过程、细胞组分、分子功能[11]。KEGG通路及GO富集分析由在线软件DAVID(Database for Annotation,Visualization and Integrated Discov⁃ery,https://david.ncifcrf.gov/)完成。错误发现率(false discovery rate,FDR)用来表示P值的有效性。FDR<0.05表示差异具有统计学意义[12]。
2 结果
2.1 催乳素处理组与对照组lncRNA和mRNA表达模式
对转录组测序得到的原始数据进行清理,去除低表达量、无意义及未比对上的数据,再对数据进行标化,得到对照组样品lncRNA和基因表达量整体的比较(图1A),以及催乳素处理后样品lncRNA和基因表达量整体的比较(图1B),结果显示该转录组测序检测到的RNA信息基本全面,2组数据具有可比性。散点图表示催乳素处理组与对照组之间RNA表达差异情况,红色代表明显上调的标签,绿色代表明显下调的标签,中间蓝色为差异不明显的标签(图1C)。
此次转录本测序检测到的2组样品间差异明显且具有统计学意义的lncRNA有3564条,其中586条为已知lncRNA,它们的信息可以从http://ln⁃cipedia.org/db/search获得。为了进一步分析这些差异lncRNA,分别对它们的染色体位置和长度信息进行了整理,结果见图1D和1E。
2.2 差异mRNA的GO和KEGG分析
对所有差异明显且具有统计学意义的mRNA进行GO分析,筛选标准为q值<0.05,得到这些差异表达mRNA分别在基因本体论三个功能方面的富集表达谱。图2A、B和C为催乳素处理组和对照组比较所得差异mRNA的GO分析。结果显示在生物学进程方面,差异mRNA显著富集于16条通路(图2A);在细胞组件方面,差异mRNA显著富集于9条通路(图2B);在分子功能方面,差异mRNA显著富集于8条通路(图2C)。
催乳素处理组与对照组差异mRNA的KEGG分析结果显示,这些mRNA显著富集于p53、JAKSTAT、MAPK等信号通路(图2D),而这些信号通路与PRL/PRLR信号通路明显相关。
2.3 差异lncRNA的定量验证及其靶基因的功能富集分析
从催乳素处理T-47D细胞前后差异明显且具有统计学意义的全部lncRNA分子中选取11条(5条上调,6条下调)(表1)进行实验验证,荧光定量结果显示这11条差异lncRNA的表达变化与测序结果一致(图3A)。对所选差异表达的lncRNA相关基因进行GO分析,结果显示在生物学进程方面,相关基因显著富集于8条通路(图3B);在细胞组件方面,相关基因显著富集于2条通路(图3C);在分子功能方面,相关基因显著富集于6条通路(图3D)。对所选差异表达的lncRNA相关基因应用DAVID数据库进行KEGG分析,发现其在PRL/PRLR相关的一条信号通路,即MAPK信号通路中显著富集(图3E)。
图1 催乳素处理组与对照组lncRNA和mRNA表达谱差异分析
3 讨论
转录组测序是指用新一代高通量测序技术对物种或组织的转录本进行测序并得到相关的转录本信息,它的研究对象为特定细胞在某一功能状态下所能转录出来的所有RNA的总和,包括mRNA和非编码RNA[13]。本实验采用的基于Illu⁃mina高通量测序平台的转录组测序技术能够在单核苷酸水平对任意物种的整体转录活动进行检测。在分析转录本的结构和表达水平的同时,还能发现未知转录本和稀有转录本,精确地识别可变剪切位点及SNP(编码序列单核苷酸多态性),提供最全面的转录组信息[14]。另外,通过荧光定量PCR对转录组测序结果进行随机验证,结果也证实了该测序手段的可靠性。在本实验中,分别发现了3564和477个显著差异的lncRNA和mRNA,这为后续探讨乳腺癌发病机制及发病过程中的关键分子提供了宝贵的数据。
1977年,首次有报道指出催乳素对乳腺癌的发病机制和发展进程具有显著作用[15]。许多研究报道指出催乳素是乳腺癌上皮细胞主要的分化因素[16-18]。LncRNA是一类缺乏编码蛋白能力,位于细胞核或胞质内的非编码RNA分子,已有大量研究表明[19-21],lncRNA表达失调在肿瘤的发生发展过程中发挥着重要的作用。但是,至今仍未有关于催乳素介导的乳腺癌细胞中lncRNA异常表达的研究报道。在此,本文较深入地分析了催乳素处理前后T-47D细胞中lncRNA的表达情况,从而探讨催乳素介导的通过催乳素受体信号通路对乳腺癌细胞中lncRNA表达的调控。通过对差异mRNA和差异lncRNA相关基因的KEGG分析,结果提示这些差异基因主要富集在催乳素/催乳素受体信号通路相关信号通路上,这可能归因于催乳素的诱导表达。
图2 催乳素处理组与对照组差异mRNA的GO和KEGG分析
表1 长链非编码RNA的靶基因预测
总之,本文首次报道了催乳素处理乳腺癌T-47D细胞后RNA的差异表达谱,而这些差异RNA在乳腺癌中的生物功能及分子机制仍有待更深入的研究。同时,本实验为进一步阐明由催乳素诱导表达引起的乳腺癌的发病机制,通过调控关键lncRNA寻找其新的药物靶点提供了新的依据。
图3 差异lncRNA的荧光定量PCR验证及其靶基因的GO和KEGG分析
[1]范雅文,张旭.三阴乳腺癌的异质性及靶向治疗[J].生物技术通讯,2015,26(3):442-444.
[2]Carver K C,Arendt L M,Schuler L A.Complex pro⁃lactin crosstalk in breast cancer:new therapeutic im⁃plications[J].Mol Cell Endocrinol,2009,307(1):1-7.
[3]Tworoger S S,Hankinson S E.Prolactin and breast cancer risk[J].Cancer Lett,2006,243(2):160-169.
[4]谭敦勇,彭湘萍.催乳素受体研究[J].生理科学进展,2012,43(1):17-23.
[5]冯维熙,曹新.基于目标基因芯片数据预测lncRNAs调控脑缺血再灌注损伤后的作用效应[J].生命科学研究,2016,20(3):235-242.
[6]Chen J,Fu Z Y,Ji C,et al.Systematic gene microar⁃ray analysis of the lncRNA expression profiles in hu⁃man uterine cervix carcinoma[J].Biomed Pharmacoth⁃er,2015,72:83-90.
[7]Brunner A L,Beck A H,Edris B,et al.Transcription⁃al profiling of long non-coding RNAs and novel tran⁃scribed regions across a diverse panel of archived hu⁃man cancers[J].Genome Biol,2012,13(8):1-13.
[8]Wei Q J,He W,Yao J,et al.Identification and char⁃acterization of microRNAs expressed in human breast cancer T-47D cells in response to prolactin treatment by Solexa deep-sequencing technology[J].Biochem Bio⁃phys Res Commun,2013,432(3):480-487.
[9]Han L,Zhang K,Shi Z,et al.LncRNA profile of glio⁃blastoma reveals the potential role of lncRNAs in con⁃tributing to glioblastoma pathogenesis[J].Int J Oncol,2012,40(6):2004-2012.
[10]Tafer H,Hofacker I L.RNAplex:a fast tool for RNARNA interaction search[J].Bioinformatics,2008,24(22):2657-2663.
[11]Lin X C,Zhu Y,Chen W B,et al.Integrated analy⁃sis of long non-coding RNAs and mRNA expression profiles reveals the potential role of lncRNAs in gas⁃tric cancer pathogenesis[J].Int J Oncol,2014,45(2):619-628.
[12]Kanehisa M,Goto S.KEGG:kyoto encyclopedia of genes and genomes[J].Nucleic Acids Res,2000,28(1):27-30.
[13]Zhu L,Mok S,Imwong M,et al.New insights into the Plasmodium vivax transcriptome using RNA-Seq[J].Sci Rep,2016,6:20498.
[14]Huang X,Jing Y,Liu D J,et al.Whole-transcrip⁃tome sequencing of Pinellia ternata using the Illumina platform[J].Genet Mol Res,2016,15(2):gmr.15028062.
[15]Welsch C W,Nagasawa H.Prolactin and murine mam⁃mary tumorigenesis:a review[J].Cancer Res,1977,37(4):951-963.
[16]Liu F,Pawliwec A,Feng Z,et al.Prolactin/Jak2 di⁃rects apical/basal polarization and luminal linage matu⁃ration of mammary epithelial cells through regulation of the Erk1/2 pathway[J].Stem Cell Res,2015,15(2):376-383.
[17]Kobayashi K,Tsugami Y,Matsunaga K,et al.Prolac⁃tin and glucocorticoid signaling induces lactation-spe⁃cific tight junctions concurrent with beta-casein ex⁃pression in mammary epithelial cells[J].Biochim Bio⁃phys Acta,2016,1863(8):2006-2016.
[18]Medina-Estrada I,Alva-Murillo N,Lopez-Meza,et al.Non-classical effects of prolactin on the innate im⁃mune response of bovine mammary epithelial cells:Im⁃plications during Staphylococcus aureus internalization[J].Microb Pathog,2015,89:43-53.
[19]Jiang J F,Sun A J,Xue W,et al.Aberrantly ex⁃pressed long noncoding RNAs in the eutopic endome⁃tria of patients with uterine adenomyosis[J].Eur J Ob⁃stet Gynecol Reprod Biol,2016,199:32-37.
[20]Chen Y,Wu J J,Lin X B,et al.Differential lncRNA expression profiles in recurrent gliomas compared with primary gliomas identified by microarray analysis[J].Int J Clin Exp Med,2015,8(4):5033-5043.
[21]Zhan Y,Lin J,Liu Y,et al.Up-regulation of long non-coding RNA PANDAR is associated with poor prognosis and promotes tumorigenesis in bladder cancer[J].J Exp Clin Cancer Res,2016,35(1):83.
Comprehensive Investigation on the Expression Profiles of Long Noncoding RNAs and mRNAs in Breast Cancer T-47D Cells Treated with Prolactin
ZHU Lin-Jing,YAO Jun,WEI Qin-Jun,LU Ya-Jie,CAO Xin*
Department of Biotechnology,School of Basic Medical Science,Nanjing Medical University,Nanjing 211166,China
Objective:To analyze the variation of long non-coding RNA(lncRNA) and mRNA expression pro⁃files in breast cancer T-47D cells after they were treated with prolactin(PRL).Methods:RNA-seq was used to detect the lncRNA and mRNA expression profile in T-47D cells before and after PRL treatment.The statistically differential expressed mRNA were selected for Gene ontology(GO) and Kyoto Encyclopedia of Genes and Genomes(KEGG)pathway.Quantitative real-time PCR(qRT-PCR)was used to validate the 11 differentially expressed ln⁃cRNA,and their target genes were predicted by bioinformatcs,and biological pathways those genes involved in were analyzed by GO and KEGG.Results:3564 lncRNA and 477 mRNA were detected with varied expression(fold<0.5 or >2.0,P<0.05) in T-47D cells.GO and KEGG analysis indicated that these differentially expressed mRNA were mainly implicated in 134 pathways,of which the MAPK signaling pathway,p53 signaling pathway and JAK-STAT signaling pathway were included in the PRL/PRL receptor(PRLR) signaling pathway.The qRTPCR analysis of 11 selected lncRNA(XLOC_093371,XLOC_006637,XLOC_064063,XLOC_086865,lnc-ZNF639-1 up-regulated;lnc-AK4-2,XLOC_075541,XLOC_081110,XLOC_047068,XLOC_099517,XLOC_106798 downregulated)confirmed the results of RNA-seq,and their targets are also enriched in the MAPK signaling pathway.Conclusion:Significant variation of lncRNA expression in T-47D cells was detected before and after PRL treat⁃ment,which may provide a useful database for further investigation on lncRNA' function and mechanism in breast cancer,and contribute to find potential diagnostic and therapeutic targets for breast carcinoma.
long non-coding RNA;expression profile;breast cancer;prolactin;T-47D cells
Q78;Q811.4
A
1009-0002(2017)05-0577-07
10.3969/j.issn.1009-
*Corresponding author,E-mail:caoxin@njmu.edu.cn
2017-03-01
国家自然科学基金(81172142);国家自然科学基金青年基金(51403103)
朱林静(1991- ),女,硕士研究生,(E-mail)1115020628@qq.com;姚俊(1979- ),男,讲师;二者为并列第一作者
曹新,(E-mail)caoxin@njmu.edu.cn