









第一代测序的强力推动[1]、第二代测序[2]的快速普及、第三代测序[3]和蛋白质组学分析[4]的逐步兴起,使人们能快速、低成本获得海量DNA、RNA和蛋白质序列,并基于这些序列解析众多生物学过程和现象的生理、遗传机制。但是,这些分子生物学研究的主流手段根植于“序列和结构相似性”,对基因功能的认知实际上是“从已知到已知”的过程。不论是基因组测序,还是转录组、蛋白组分析,依据相似性注释的基因只占一定比例且无法知晓这些基因的新功能;而在非模式生物中,可注释基因比例经常更低。同样的情况还见于基因克隆和表达分析。基因克隆经常是基于其他物种相同功能基因的同源性,与依据化学、物理性质差异分离特定物质的过程相似,依据基因间同源性分离基因。尽管常冠以新或全新基因克隆,但这样的“克隆”只能说是分离,不是真正的克隆,更不是从头克隆(Denovo cloning),分离的基因也不是新(New)基因,更不是全新(Novel)基因。基因克隆必须包括锁定基因序列和阐明基因功能2个环节,实际上,两者经常是不可分的过程。即使在目前的技术背景下,锁定新基因序列、阐明新基因功能仍十分困难。因此,从头克隆一个基因并阐明其功能仍然是极其出彩的工作。直至今天,基因的从头克隆仍能发表在顶级期刊上,例如动物育性基因[5]和性别决定基因[6]。试图克隆选定物种的基因时,必须牢记不仅仅要锁定基因序列,还要阐明其功能(包括已知基因的新功能);不只是基于相似性推知基因功能,而是用生物体系证明基因功能。


1 基因敲除(Gene knockout)

基因敲除经同源重组(Homologous recombination)插入阻断目标基因表达,比较敲除前后表型差异阐明基因功能。基因敲除是阐明基因功能最有效方法之一[7]。目标基因可随机选定,亦可依已有认知确定,或经遗传学分析锁定。基因敲除有基因打靶、基因捕获等不同表述。

1.1基因打靶(Gene targeting)




1.2基因捕获(Gene trapping)



基因打靶可敲除任何基因,但耗时费力;而基因捕获高效,但有随机性。国际基因敲除小鼠联盟(The international knockout mouse consortium,IKMC)致力于组合使用基因打靶和基因捕获,开发出定向捕获、条件性基因捕获等方法,以达到覆盖基因更多、打靶效率更高的效果[20]。


2 基因沉默(Gene silencing)

基因沉默通过降低基因表达水平改变表型,从而验证基因功能。基因沉默手段主要是RNA干扰(RNA interference,RNAi)和反义吗啉代寡核苷酸(Morpholino)干扰。RNA干扰通过人工引入完美碱基配对的dsRNA,经Dicer酶、Ago蛋白等(RNA干扰系统)作用形成siRNA,诱导mRNA特异性降解,沉默基因功能,改变对应性状表现[30-31]。引入干扰RNA的方法主要包括显微注射、基因枪、喂食可转录双链RNA细菌、直接双链RNA浸泡、病毒和农杆菌介导转化、电转化等。Morpholino是吗啡啉类似物修饰的反义寡核苷酸,与mRNA前体或与剪切处结合,通过空间位阻特异性抑制翻译或RNA剪切,实现基因沉默[32]。

干扰绿色荧光蛋白报告基因表达证明了RNA干扰在芽殖酵母(Saccharomyces castellii)中的可行性[33]。用此方法阐明功能的酵母基因有端粒酶和二态性相关基因等[34-35]。将RNA干扰构建物导入果蝇和线虫胚胎,已阐明与生殖、胚胎发育、细胞分裂和分化、信号传导通路等生命过程相关的许多基因的功能,并建立起全基因组RNA干扰转基因文库[36-39]。在斑马鱼[40]、小鼠[41]等的基因功能解析中,RNA干扰也是常用方法。RNA干扰与表达谱、蛋白质互作分析[42]、敏感突变株[43]等组合使用,可对任何组织任何发育阶段的基因功能进行研究,同时还可用于反向遗传学研究[44]。RNA干扰同样适用植物,其解析的基因包括拟南芥耐寒性调节基因[45]、有丝分裂相关基因[46]、水稻抗病毒基因[47]等。与果蝇、线虫等模式动物一样,植物RNA干扰库的建立进一步提高了基因功能解析效率[48]。

特别需要明晰RNA干扰蛋白系统和小RNA的区别和关联。小RNA(Small RNA)长约20~30个核苷酸,是基因表达和基因组结构管控的关键因子,调节基因表达、维持基因组稳定。依起源、结构、效应蛋白等可将小RNA分为短干扰RNA(Short interfering RNA,siRNA)、微小RNA(MicroRNA,miRNA)和piwi互作RNA(Piwi-interacting RNA,piRNA)3个主要类群。短干扰RNA源自转入基因、病毒;着丝粒、转座子和其他重复序列;双向mRNA转录本(Convergent mRNA transcript)、正义-反义配对物(Sense-antisense pair)、假基因反义转录本和正常基因正义转录本双链、发卡结构RNA(Hairpin RNA,hpRNA)等。因此,短干扰RNA既可源自外源核酸,也可基因组内部产生。微小RNA是动植物基因组编码的miRNA基因的转录剪切产物,有加帽和加尾修饰。Piwi互作RNA指那些与piwi蛋白结合发挥作用的小RNA,它们控制转座子活动,维持基因组稳定。piRNA前体一般从基因组称为“聚丛(Cluster)”的区域(富含转座子区域)转录而来。除piRNA外,其他2类小RNA发挥功能都需要Dicer酶、Ago蛋白等发挥作用。miRNA、piRNA和内源siRNA源自基因组,而外源siRNA源自人工引入;Dicer酶、Ago蛋白等早已存在,而miRNA可能只存在于多细胞真核生物中。



3 图位克隆和基因组目标区重测序


图位克隆(Map-based cloning)基于遗传连锁或遗传关联,将特定性状控制区锁定在一个很小的染色体区域(越小越好,如<1c M)的过程。测序该区域对应的细菌人工染色体(BAC)或BAC重叠群,甄别所有但数量很少的功能基因,再比较相对性状对应基因,进一步锁定功能基因,最后通过引入完整功能基因恢复性状表现或敲除基因丧失性状表现验证基因功能。锁定基因序列依赖RFLP、SSR、SNP等分子标记连锁图,因而称为图位克隆。高多态性分子标记和高效基因型分型技术,如基于海量平行测序的RAD[52]等,将进一步提高图位克隆效率。

重测序技术是在已知基因组序列基础上,对群体或个体基因组中的特定区域(甚至全基因组)进行测序,扫描序列变异,甄别基因[53]。在化学诱变突变体中,组合使用重测序方法、定向诱导基因组局部突变技术(Targeting induced local lesions in genomes,TILLING)和多种信息学分析手段,可高效率、高通量识别和筛查基因突变[54-56]。


4 插入突变(Insertional mutation)




5 基因组编辑(Genome editing)


锌指核酸内切酶就是为基因组编辑设计的1种限制性内切酶-锌指蛋白融合蛋白。锌指核酸内切酶由一系列锌指蛋白单元和非特异性限制性内切酶Fok I切割域融合形成[75],每个锌指蛋白可用其α螺旋上-1~+6氨基酸残基识别1个三联体碱基[76],因此,设计改造氨基酸残基组成就可设计出特异性识别DNA序列的锌指蛋白[77]。当两个特别设计的“锌指蛋白-内切酶”与目标DNA结合,内切酶切断DNA,基因组修复切点时定点引入突变。锌指核酸内切酶已被成功用于果蝇、线虫、斑马鱼和哺乳动物等基因组编辑,其特异位点突变效率与基因敲除相比可提高103~105倍[78],但也存在许多问题,例如锌指蛋白结构间的相似性可能影响识别的特异性,使可操作基因范围受到限制。

转录激活因子样效应物(Transcription activatorlike effectors,TALE)是一类可调节内源基因转录活动的蛋白质,其DNA结合结构域有多个重复单位,每个重复单位由33~35个氨基酸构成,可识别1个碱基对。TALENs是人工合成的含TALE DNA结合域和Fok I切割域的融合蛋白,可用于基因组编辑[79]。与锌指核酸酶相比,TALENs不会有重复单元间的关联影响,相对更易设计,DNA识别更特异[80]。

成簇的规律间隔的短回文重复序列(Clustered regularly interspaced short palindromic repeats,CRISPR)来自特殊的遗传座位,这些遗传座位一般由21~48 bp的回文重复序列和重复序列间26~72 bp非重复性间隔序列组成,侧翼序列为4~20个数量不等的CRISPR相关基因(cas)。CRISPR/Cas系统是1种细菌特有的防御系统[81]。Cas核酸酶受短链RNA引导进行位点特异性DNA切割,并引发细胞使用事先引入的正确的基因序列模板按照相似性进行损伤修复。这种RNA引导的核酸酶技术易于设计、应用广泛,且可将多条引导序列编码到1个CRISPR上,从而实现基因组多个位点同步编辑[82]。CRISPR/Cas介导的基因调节能抑制某些细菌蛋白(如脂蛋白)转录物的生成,转录水平可降低100倍。因此,也可通过对蛋白表达的抑制来研究相关基因功能[83]。


6 结语



Function-Verifying Techniques of Novel Genes and Their Applicability in Gene Cloning of Microalgae

YANG Guan-Pin,LIN Gin-Mei
(College of Marine Life Sciences,Ocean University of China,Qingdao 266003,China)

In microalgae,a group of eukaryotic,single cellular and photosynthesis-performaing microbes belong.Diverse microalgae inhabit various environments,and many of them are of values to aquaculture and biofuel exploitation.Being similar to model organisms and economic animals and plants,cloning novel genes is one of the major researching activities of microalgal biology.Genome annotation,transcriptome analysis and gene isolation are based on sequential and structural homology,which are actually a process of searching the homologs by using known queries.In contrast,cloning a novel gene needs to obtain the sequence of a gene and most crucially verify its function at the same time.The currently available methods of verifying the function of a gene includes gene knockout,gene silencing,insertional mutation,genome editing and among others.Genetic transformation has met success in many microalgal species,making function verifying of microalgal genes by adopting directly the methods available for model organisms and economic animals and plants possible.Here we reviewed these methods and analyzed their applicability to microalgae.Such an analysis may aid to cloning novel microalgal genes.

microalga;novel gene;gene cloning;genetic transformation




