高通量测序技术在动物MicroRNA研究中的应用
2014-01-24柏亚铎李勐伟
柏亚铎 尹 羿 汪 琳 李勐伟,2 蒲 静
(1.北京出入境检验检疫局 北京 100026;2.西南大学)
1 前言
MicroRNA(miRNA)是一类新发现的内源性非编码单链RNA分子,广泛存在于动物、植物细胞中,长度为18-25nt。虽然这类RNA不能直接编码蛋白质,但在基因的转录后调控中发挥着重要功能。线虫中与靶基因mRNA3′UTR互补的miRNA分子是最早观察到的miRNA,包括lin-4[1]和let-7[2],它们控制着线虫的时序性发育[3-4]。miRNA通过与靶基因mRNA特异性互补配对,导致靶mRNA的降解,或者抑制靶基因的表达,产生基因沉默[5-6]。目前,在不同物种中共发现24521种miRNA,这些miRNA 在动物体多个调节途径中发挥关键作用,其功能涉及细胞增殖控制、细胞死亡、脂肪代谢、神经元形成、造血细胞系分化的调节等各个方面。
随着对miRNA的深入研究,分子生物学和生物信息学等一系列方法已被引入该领域[7-8],如结合了克隆测序和生物信息学的高通量测序技术为基因组测序提供了很大的便利,已被用于多种动物的miRNA测序。
2 miRNA的产生
研究发现,miRNA是存在于动植物细胞内一类非编码蛋白质的短序列RNA[9],是一类重要的负调控因子,具有很高的保守性[10]。多数动物的miRNA位于前体mRNA的内含子中,由独立转录单位表达。miRNA基因常以单拷贝、多拷贝或基因簇等多种形式存在于基因组的基因间隔区,且以基因簇形式存在的miRNA基因多以多顺反子形式转录。miRNA在动物体内的形成过程包括转录、加工和与蛋白复合体结合。细胞核内编码miRNA的基因首先在RNA聚合酶Ⅱ的作用下形成具有帽子结构(5MGpppG)和多聚腺苷酸尾巴(PolyA)的几百个核苷酸初级转录物pri-miRNA[11];pri-miRNA在Drosha[12](一种第2类的RNase Ⅲ内切酶)的作用下,形成大约60-70nt、具有茎环结构的pre-miRNA[13],它具有重要的二级结构,能被连续地切割成一个或多个miRNA[14-15];pre-miRNA 通过Ran-GTP及其受体Exportin-5转运到细胞质[16-18],在Dicer 酶的作用下转化为成熟的双链miRNA[19-22],互补双链中只有一条miRNA,另一条为miRNA*(注:miRNA*是miRNA加工成熟过程中与其互补的大约22个核苷酸的RNA序列);随后miRNA 的双链解链形成成熟miRNA[23],它与一种类似RISC(the RNA-induced silencing complex)的核糖核蛋白结合形成miRNP而发挥相关基因沉默作用[24-25]。
3 miRNA的作用机理
研究表明:成熟miRNA通过引导miRISC与靶mRNA 3′UTR的碱基配对,从而降解靶mRNA或抑制靶mRNA翻译。miRNA与靶基因mRNA的作用方式有2种,采取何种方式由mRNA的特性所决定,与miRNA和靶基因的配对程度有关。当miRNA与目的基因不完全配对时,将抑制靶基因mRNA的翻译,但并不影响mRNA的数量和稳定性,大多数动物为这种作用方式,如线虫中的miRNAlin-4就是通过抑制lin-14和lin-28两个靶基因的翻译[26-27];当miRNA与目的基因某段序列配对完全时,该目的基因将被RISC特异地降解。在动物中,miRNA与靶基因mRNA的结合位点通常有多个,例如lin-14基因有7个结合位点[28],并且总在3UTR[29],这些结合位点的数量和互补性可能与翻译减弱的程度有关。研究表明,位点被结合较少,靶基因mRNA的翻译被抑制程度也较少;当所有位点都被结合时,翻译就被完全抑制[30]。说明结合位点的互补程度与翻译程度具有一定的正比例关系,这也通过在3′UTR添加多个结合位点而得到证实[30]。此外,翻译抑制具有可调节性和可逆性,从结合位点移去miRNA,mRNA又可翻译;反之,在编码区裂解可永久破坏mRNA,产生的彻底抑制只有mRNA重新转录才能逆转。
4 高通量测序技术原理
目前,生物试验法和生物信息学法是研究miRNA的2种主要方法。生物实验法主要是直接克隆法,但是在克隆过程中,受到高表达miRNA以及降解片段等的干扰,许多物种特异的、低表达的miRNA很难被发现;生物信息学法则主要是通过计算机预测获得miRNA[31-32],虽然此方法解决了克隆测序对表达量的偏向性,但是对物种基因组信息依赖度高、结果还需实验验证。近几年来,随着生物技术的快速发展,miRNA测序技术也发生了革命性变化,最近开发的高通量测序技术[33-34],大大提高了miRNA的研究。如NGS(Next Generation Sequencing)结合了克隆测序和生物信息学预测的优点,不需要载体扩增,直接通过聚合酶或者连接酶进行体外合成测序,具有高通量、高准确性,高灵敏度、低成本等优点,因而也被称为下一代测序技术,在miRNA研究过程中,能捕捉体内一些低表达的miRNA,也能对未知小片段RNA进行预测。NGS主要包括罗氏公司(Roche)的454 测序仪(Roch GS FLX Sequencer)、Illumina 公司的Solexa基因组分析仪(Illumina Genome Analyzer)和ABI的SOLiD测序仪(ABI SOLID Sequencer)。
2003年,454公司首先建立了基于焦磷酸测序法的高通量第二代测序技术,2005年,454公司被罗氏诊断公司收购。454测序法是以DNA扩增的乳胶系统(emulsion system)和皮升( picoliltre )大小焦磷酸( pyrophosphate)为基础的测序方法,其原理是:首先将基因组DNA或者BAC打断成300-800bp的片段,对于小分子的非编码RNA或者PCR扩增产物,这一步则不需要;然后将双链解开,用特别设计的DNA捕获磁珠将其中一条单链DNA文库固定,每一个磁珠固定一个独特的单链DNA片段;用乳液PCR进行扩增,扩增后产生单分子多拷贝的分子簇,然后将乳液混合物打破,把磁珠放入PTP板中进行后继的测序反应。利用焦磷酸测序原理可以准确、快速地确定待测模板的碱基序列。
SOLiD(Supported Oligo Ligation Detetion)测序技术是ABI公司推出的以4色荧光标记寡核苷酸的连续连接反应为基础的高通量测序技术,取代了利用DNA聚合酶在合成过程中读取序列。其原理为:将切断成短序列的DNA片段固定在一个独立的微珠上,并进行乳液PCR扩增,将扩增后的微珠沉积到一块玻片上,加入8碱基单链荧光探针,探针的5'端分别标记了4种不同的荧光染料,3'端第1、2位碱基对应5端荧光信号的颜色,探针按照碱基互补规则与单链DNA模板链配对,因为2个碱基有16种不同的组合情况,所以4种碱基对应一种颜色的荧光;连接测序反应进行5轮,每轮测序反应含有多次连接反应;最后反应得到的是原始颜色序列。由于SOLiD系统采用了双碱基编码技术,在测序过程中对每个碱基判读两遍,从而减少原始数据错误,提供内在的校对功能。目前最新款SOLiD 5500xl 含有2张微流体芯片(microfluidic flow chip),每张芯片含有6条相互独立的运行通道(run lane),每条通道都能运行相对独立的测序反应;这样的设计使得SOLiD 5500xl测序平台极具灵活性,最大测序读长为75 nt,同样支持Fragment、Pair-end和Mate-Paired文库;单次运行能得到的最大数据量为300 Gb(使用最新设计的nanobeads);测序的系统准确性能达99%。
Illumina公司的新一代测序法-Solexa测序法最早由Solexa公司研发,2007年Solexa 公司被Illumina公司收购,随之Solexa测序仪也被命名为Illumina genome analyzer。该方法利用“DNA簇”和“可逆性末端终结(reversible terminator)技术,进行边合成边测序。其基本原理为:将切割为短序列的基因片段固定到光学透明的玻璃表面(即Flow cell),通过扩增形成单克隆DNA簇,然后加入改造过的DNA聚合酶和带有4种荧光标记的dNTP进行合成;荧光标记的dNTP是可逆终止子,3'羟基末端带有可化学切割的部分。因此每个循环只允许掺入单个碱基,通过检测不同荧光标记碱基的引入导致发出相应波段的荧光,从而测出基因片段的序列。
5 高通量测序技术在动物miRNA的应用
在动物研究领域中,高通量测序技术使miRNA的测序、表达、探查变得更加容易。近些年来,利用高通量测序法结合生物信息学分析手段可以预测新的miRNA,研究miRNA的保守性,建立miRNA表达谱,比较miRNA表达丰度以及发现其他非编码RNA等。凌英会等[35]使用solexa测序技术成功获取了山羊肌肉组织miRNA序列及其表达谱,共鉴定出517个物种间保守的miRNA和2个山羊基因组特有的miRNA,并通过miRNA靶基因预测和功能分析,表明很多miRNA可能影响动物肌肉发育的细胞信号通路;这为进一步研究特定miRNA参与山羊肌肉细胞的增殖与分化等生长发育机制奠定了理论基础。miRNA广泛参与哺乳动物的生殖调控,尤其在卵巢功能发挥中起重要作用[36-37]。张晓东等[38]通过Solexa测序成功构建了山羊卵巢组织miRNA表达文库,发现山羊卵巢组织表达的508个miRNA,预测出4个新的山羊miRNA,首次分析了山羊卵巢组织miRNA表达情况,为进一步研究miRNA调控哺乳动物生殖发育奠定了基础。为了增加甲壳类动物miRNA的数目,欧江涛等[39]研究宿主miRNA表达与病原体感染的关系,利用Illumina/Solexa高通量深度测序法对正常和感染颤抖病螺原体的中华绒螯蟹血细胞进行miRNA测序和表达分析,生物信息学分析发现735中特异性miRNA,其中228种miRNA在正常和感染情况下具有显著的表达差异,133条(58%)miRNA在感染颤抖病螺原体的血细胞中表达上调,95条(42%)表达下调;这一研究结果表明许多miRNA在病原体侵染后会出现差异性表达。同样,关于miRNA的差异性表达,孙等人[40]通过深度测序方法对SD大鼠在出生后第0天、21天、42天3个不同阶段股骨头软骨miRNA库测序和构建,3个miRNA库一共发现246个miRNA;采用solexa测序法分析大鼠股骨头软骨在不同发育阶段表达的miRNA,其中23个miRNA基因上调,6个下调,显示miRNA在关节软骨发育不同阶段具有差异表达。李成华等[41]通过Illumina公司的Hiseq2000测序平台构建l健康刺参和具有“腐皮综合征”刺参血细胞两个miRNA库,用solexa测序技术发现刺参40个保守miRNA;在这两个miRNA库中,发现miR-31和miR-2008具有显着差异性表达,这可能为“腐皮综合征”内在机制的阐述作为依据,也进一步说明miRNA在宿主-病原体相互作用过程中起着关键的介导作用。Rathjen Tina等[42]应用高通量Solexa测序技术对鸡胚胎的体节中miRNA进行测序鉴定,发现85种已知miRNA、18种已知miRNA的新变型、8种新miRNA,其中1个新发现的miRNA大量存在于体节组织中,说明深度测序其他组织有可能发现其他的新miRNA。张丽等人[43]通过高通量测序技术构建鸭廓羽和绒羽毛囊miRNA基因库,比较表达差异性发现miRNA在皮肤功能和皮肤演化具有重要的功能,不同的羽囊可能存在不同的miRNA调控机制;禽羽毛囊和哺乳动物的毛囊也可能存在不同的miRNA调控机制;来自于器官的保守miRNA能为动物的进化提供重要信息。张彦明等[44]用solexa高通量测序法对猪永生化血管内皮细胞进行测序,确定了154个猪的miRNA基因,其中有146个具有跨物种保守性,8个具有猪特异性;146个miRNA基因编码116个保守成熟的miRNA和66个miRNA,8个猪特异性miRNA基因编码4个成熟的miRNA,并发现miR-206、miR-21和miR-378具有相对高表达性,这些被研究的、具有生物活性的miRNA可能与血管疾病、炎症和血脑屏障有关。
6 结语
miRNA在动物生长发育、细胞分化和凋亡过程中发挥着重要的作用,目前已经对其合成与功能进行了初步探究,但是依然有很多问题亟待解决,如miRNA的作用模式等。随着分子生物学技术和生物信息学的高速发展,高通量测序技术的出现和发展为基因组的测序带来革命性的改变,它将替代传统测序技术,不仅能快速的进行miRNA的测序,而且通过对miRNA库的序列对比,能更好地进行miRNA的靶基因预测和新miRNA的预测。
[1]Lee R C,Feinbaum R L,Ambros V.The C.elegans heterochronic gene Lin-4 encodes small RNAs with antisense complementarity to lin-14[J].Cell,1993,75:843-854.
[2]Reinhart B J,Slack F J,Ruvkun G,et al.The 21 nucleotide let-7RNA regulates developmental timing in Caenorhabditis elegans[J].Nature,2000,403:901-906.
[3]Bartel D P,Chen C Z.Micromanagers of gene expression:the potentially widespread influence of metazoan microRNAs[J].Nat Rev Genet,2004,5:396-400.
[4]Lau N C,Lim L P,Weinstein E G,et al.An abundant class of tiny RNAs with probable regulatory roles in Caenorhabditis elegans[J].Science,2001,294(5543):858-862.
[5]Baley J,Li J.MicroRNAs and ovarian function[J].J Ovarian Res,2012,5:8-14.
[6]Cardinalib B,Caetellani L,Fasanro P,et al.MicroRNA-221 and microRNA-222 modulate differentiation and maturation of skeletal muscl cells[J].PloS ONE,2009,4(10):1-13.
[7]Eisen M B,Brown P O.DNA arrays for analysis of gene expression[J].Methods Enzymol,1999,303:179-205.
[8]Schena M,Shalon D,Davis R W,et al.Quantitative monitoring of gene expression patterns with a complementary DNA microarray[J].Science,1995,270(5235):467-470.
[9]Lee R C,Ambros V.An extensive class of small RNAs from in Caenorhabditis elegans[J].Science,2001,294:862-864.
[10]Bartel B,Bartel D P.Micro RNAs.At the root of plant development[J].Plant Physiol,2003,132:709-717.
[11]Yoo A S,Greenwald I.LIN-12/Notch activation leads to microRNA Nmediated down-regulation of VavinC[J].Elegans Science,2005,310(5752):1330-1333.
[12]Kim V N,Han J,Siomi M C.Biogenesis of small RNAs in animals[J].Nature Reviews Molecular Cell Biology,2009,10(2):126-139.
[13]Lee Y,Ahn C,Han J,et al.The nuclear RNase II.Drosha initiates microRNA processing[J].Nature,2003,425:415-419.
[14]Lin S L,Chang D,Wu D Y,et al.A novel RNA splicing-mediated gene silencing mechanism potential for genome evolution[J].Biochem Biophys Res Commun,2003,310(3):754-760.
[15]Lee Y,Ahn C,Han J,et al.The nuclear RNase III Drosha initiates microRNA processing[J].Nature,2003,425(6956):415-419.
[16]Lund E,Guttinger S,Calado A,et al.Nuclear export of microRNA precursors[J].Science,2004,303(5654):95-98.
[17]Yi R,Qin Y,Macara I G,et al.Exportin-5 mediates the nuclear export of pre-microRNAs and short hairpin RNAs[J].Genes and Development,2003,17(24):3011-3016.
[18]Bohnsack M T,Czaplinski K,Gorlich D.Exportin 5 is a RanGTP-dependent dsRNA-binding protein that mediates nuclear export of pre-miRNAs[J].RNA,2004,10(2):185-191.
[19]Grishok A,Pasquinelli A E,Conte D,et al.Genes and Mechanisms Related to RNA Interference Regulate Expression of the Small Temporal RNAs that Control C.elegans Developmental Timing[J].Cell,2001,106(1):23-24.
[20]Hutvagner G,Mclachlan J,Pasquinelli A E,et al.A cellular function for the RNAinterference enzyme Dicer in the maturation of the let 7 small temporal RNA[J].Science,2001,293(5531):834-838.
[21]Ketting R F,Fischer S E J,Bernstein E,et al.Dicer functions in RNA interference and in synthesis of small RNA involved in developmental timing in C.elegans[J].Genes and Development,2001,15(20):2654-2659.
[22]Knight S W,Bass B L.A role for the RNase III enzyme DCR-1 in RNA interference and germ line development in Caenorhabditis elegans[J].Science,2001,293(5538):2269-2271.
[23]Lee Y,Jeon K,Lee J T,et al.MicroRNA maturation:stepwise processing and subcellular localization[J].EMBO J,2002,21:4663-4670.
[24]Schwarz D S,Hutvagner G,Du T,et al.Asymmetry in the assembly of the RNAienzyme complex[J].Cell,2003,115(2):199-208.
[25]Khvorova A,Reynolds A,Jayasena S D.Functional siRNAs and miRNAs exhibit strand bias[J].Cell,2003,115(2):209-216.
[26]Wightman B,Ha I,Ruvkun G.Posttranscriptional regulation of the heterochronic gene lin-14 by lin-4 mediates temporal pattern formation in C.elegans[J].Cell,1993,75:855-862.
[27]Moss E G,Lee R C,Ambros V.The cold shock domain protein LIN-28 controls developmental timing in C.elegans and is regulated by the lin-4 RNA[J].Cell,1997,88:637-646.
[28]Lee R C,Feinbaum R L,Ambros V.The C.elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14[J].Cell,1993,75(5):843-854.
[29]Lewis B P,Shih I H,Jones-Rhoades M W,et al.Prediction of mammalian microRNA targets[J].Cell,2003,115(7):787-798.
[30]Doench J G,Peterson C P,Sharp P A.SiRNAs can function as miRNAs[J].Genes & Development,2003,17:438-442.
[31]Wang X J,Reyes J L,Chua N H,et al.Prediction and identification of Arabidopsis thaliana microRNAs and their mRNA targets[J].Genome Biol,2004,5:65-80.
[32]Li Y,Li W,Jin Y X.Computational identification of novel family members of microRNA genes in Arabidopsis thaliana and Oryzasativa[J].Acta Biochim Biophys Sin,2005,37:75-87.
[33]Lu C,Tej S S,Luo S,et al.Genetics:Elucidation of the small RNA component of the transcriptome[J].Science,2005,309(5740):1567-1569.
[34]Margulies M,Egholm M,Altman W E,et al.Genome sequencing in microfabricated high-density picolitre reactors[J].Nature,2005,437(7057):376-380.
[35]凌英会,张晓东,王丽娟,等.山羊肌肉组织microRNA Solexa测序与生物信息学分析[J].畜牧兽医学报,2013,44(3):481-487.
[36]Baley J,Li J.MicroRNAs and ovarian function[J].Journal of Ovarian Research,2012,5:8-14.
[37]Cutting A D,Bannister S C,Doran T J,et al.The potential role of microRNAs in regulating gonadal sex differentiation in the chicken embryo[J].Chromosome Research,2012,20(1):201-213.
[38]张晓东,凌英会,张运海,等.应用Solexa 测序技术挖掘山羊卵巢组织microRNA[J].中国农业科学,2013,46(1):146-153.
[39]Ou J T,Meng Q G,Li Y,et al.Identification and comparative analysis of the Eriocheir sinensis microRNA transcriptome response to Spiroplasma eriocheiris infection using a deep sequencing approach[J].Fish&Shellfish Immunology,2012,32(2):345-35.
[40]Sun J,Zhong N,Li Q,et al.MicroRNAs of rat articular cartilage at different developmental stages identified by Solexa sequencing[J].Osteoarthritis and Cartilage,2011,19(10):1237-1245.
[41]Li C H,Feng W D,Qiu L H,et al.Characterization of skin ulceration syndrome associated microRNAs in sea cucumber Apostichopus japonicus by deep sequencing[J].Fishd&Shellfish Immunology,2012,33(2):436-441.
[42]Rathjen T,Pais H,Sweetman D,et al.High throughput sequencing of microRNAs in chicken somites[J].FEBS letters,2009,583(9):1422-1426.
[43]Zhang L,Nie Q,Su Y,et al.MicroRNA profile analysis on duck feather follicle and skin with high-throughput sequencing technology[J].Gene,2013,519(1):231-240.
[44]Dai C,Zhang Y M,Zhang Q,et al.A MicroRNA Catalog of Swine Umbilical Vein Endothelial Cells Identified by Deep Sequencing[J].Agricultural Sciences in China,2011,10(9):1467-1474.