APP下载

原核生物的免疫系统和CRISPR基因编辑技术

2020-12-17剌浩亮符兆英

延安大学学报(医学科学版) 2020年1期
关键词:噬菌体质粒间隔

剌浩亮,符兆英,2*

(1.延安大学医学院;2.延安大学分子生物学与免疫学研究所,陕西 延安 716000)

CRISPR(clustered regularly interspaced short palindromic repeat)是原核生物染色体DNA中的一种片段,由具有回文结构的重复序列(repeats)和间隔序列(spacers)组成,Cas(CRISPR associated)基因与CRISPR片段紧密相邻,CRISPR-Cas系统可见于约40%的细菌和约90%的古生菌,是原核生物的免疫系统,可抵抗噬菌体和质粒等外来基因的入侵[1-2]。2012年,CRISPR-Cas系统被研究人员用于进行真核基因编辑(genome editing)[3]。CRISPR-Cas9基因编辑技术是一种强有力的基因编辑工具,并有快速、简便易行、节省经费、可操作对象广等优点;这一技术创立后,迅即被世界各国相关实验室纷纷采用,Science杂志于2015年初称CRISPR-Cas9基因编辑技术为继PCR以来生物医学技术上一次新的突破或革命[4]。在CRISPR-Cas9基因编辑的基础上,近几年衍生出了几种新技术。

1 CRISPR-Cas系统的发现与发展历史

1987年,Yoshizumi Ishino首次描述了大肠杆菌染色体DNA中成簇的重复序列,但完全不知道它们的功能[5]。2000年,通过计算机DNA序列分析,在其他细菌和古生菌中发现了类似的重复序列,被称为SRSR(Short Regularly Spaced Repeats)。2002年,其他研究人员用基因序列分析软件在更多的其他细菌和古生菌中发现了类似的重复序列,SRSR被更名为CRISPR;此外,与CRISPR相关的一组基因也被他们发现,这组基因被命名为Cas基因[6]。Cas基因编码的蛋白质为核酸酶或解旋酶,可以切割DNA,但是,CRISPR-Cas系统的功能仍然不明确。

2005年,三个研究小组各自独立报道,一些CRISPR间隔序列与噬菌体DNA和细菌染色体外DNA(质粒)具有同源性[7-8]。这些间隔序列片段可能是细菌在先前被病毒感染时获得的。这一重要发现导致了一个假说的提出:CRISPR-Cas系统可能在细菌体内发挥适应性免疫的作用[9]。当时认为,CRISPR间隔序列可以作为合成RNA的模板,细菌的CRISPR-Cas系统可能与真核生物的RNAi系统具有类似的作用。

2007年,加拿大拉瓦尔大学的Moineau研究小组和丹麦Danisco公司的研究人员发现,改变CRISPR间隔序列DNA可以改变嗜热链球菌(Streptococcus thermophilus,属乳酸菌)对噬菌体攻击的抵抗力[10],证实了CRISPR-Cas系统在细菌体内发挥适应性免疫作用的假说。这些研究人员发现,细菌被噬菌体感染后,噬菌体来源的间隔序列可整合入受体菌CRISPR区域内,这些细菌即具有了对同一种系的噬菌体感染的抵抗力;如果把间隔序列从CRISPR区域去掉,这种抵抗力就会丧失。他们的研究还显示,Cas基因编码切割RNA的核酸酶,细菌抗噬菌体免疫的发挥,至少需要有一个Cas基因的参与。

2012年,美国加利福尼亚大学伯克利分校的Jinek和Doudna等设计用一个(操作起来)比较简单的CRISPR-Cas系统,即II型CRISPR-Cas系统,编辑基因(这个系统使用Cas9蛋白质),创立了CRISPR-Cas9基因组编辑技术[11]。2013年以来,CRISPR-Cas9基因组编辑技术很快被其他实验室采用,用于编辑多种生物的基因组,在世界范围内掀起了一个用CRISPR-Cas9技术编辑基因的热潮。

2 CRISPR-Cas系统的结构

CRISPR-Cas系统有3种主要的型别,I型、II型和III型;3种型别的区分,主要在于Cas基因的不同。CRISPR-Cas系统的序列,从5′末端到3′末端,依次是Cas基因、前导序列和重复序列与间隔序列交替的CRISPR阵列。Cas基因编码Cas蛋白质,不同型别的CRISPR-Cas系统可有不同数量和不同种类的Cas基因,但所有型别的CRISPR-Cas系统均含有Cas1基因和Cas2基因;前导序列含有转录CRISPR片段的启动子;重复序列含有回文(palindromic)序列,可以形成发夹式结构;间隔序列是从入侵的噬菌体或质粒DNA获取的,所以各不相同,可以用于区分不同种属的细菌。CRISPR座位或阵列的大小不等,重复序列可以是23-55bp,一般是28-37bp;间隔序列可以是21-72bp,一般是32-38bp。一个细菌细胞一般含1~2个CRISPR-Cas座位,但亦有19个座位和25个座位的报道[12]。

3 CRISPR-Cas系统的免疫防御机制

原核生物不断遇到各种外源性基因比如噬菌体和质粒DNA的侵袭,所以它们必须有一定的防御机制,必须能区分外源DNA与自身DNA,以保护他们免受噬菌体和质粒的入侵,使它们能在相应的环境中生存。和真核生物类似,原核生物也有固有性和获得性/适应性免疫或防御机制。固有性防御包括防止吸附、阻止DNA注入、使感染流产等,这些机制对防御噬菌体入侵有效;固有性防御还包括限制性核酸内切酶系统,对抵御质粒入侵有效。新近发现的CRISPR-Cas系统能够提供一种有效的和特异性的适应性或获得性免疫机制,对抵御噬菌体入侵和质粒入侵均有效[1]。

CRISPR-Cas系统的免疫防御机制分为两个阶段:间隔序列获得阶段(免疫力获得阶段)和干扰阶段(免疫力执行阶段)。噬菌体首次入侵细菌后,细菌中的Cas核酸酶将噬菌体DNA的特定部位切割形成短的片段(原间隔序列),原间隔序列整合入已有的CRISPR座位的5′末端(前导序列的3′末端侧),形成一个新的间隔序列及相应的重复序列,即原来的CRISPR座位增加了一个间隔序列和相应的一个重复序列片段;以上为免疫力获得阶段。细菌遇到同一种系的噬菌体的再次入侵后,CRISPR重复序列和间隔序列转录出一条长的RNA分子,这条长的RNA链然后被切割为短的crRNAs(CRISPR RNAs),特异性的crRNA间隔序列与入侵的噬菌体或质粒DNA通过碱基互补特异性结合,然后通过Cas核酸酶切割破坏目标DNA;这一阶段为免疫力实现阶段[2]。

不同型别的CRISPR-Cas系统的作用机制不完全相同,其区别主要在免疫力执行阶段。以下比较详细地并分型别描述CRISPR-Cas系统的免疫防御作用机制。

3.1 免疫力获得

噬菌体或质粒侵入细菌细胞后,细菌细胞中的Cas1蛋白和Cas2蛋白在特定部位识别并切割外源性DNA并将其整合入已有的CRISPR序列。三个主要型别的CRISPR系统均有Cas1和Cas2,为细菌获得间隔序列所必须;Cas1和Cas2变异后,细菌丧失获得间隔序列的能力,但仍保留免疫应答能力。Cas1和Cas2的作用机制尚不完全明了,但已知Cas1是金属依赖酶,能识别DNA的特定序列并与之结合。Cas2具有ssRNA或dsDNA核酸内切酶活性。Cas1和Cas2均能将外源性DNA剪切出一个片段并将其插入CRISPR阵列[6]。外源性DNA中被Cas1和Cas2识别和切割的序列称原间隔序列(protospacer),Cas1和Cas2能通过原间隔序列相邻模体(protospacer adjacent motif,PAM)进行特异性识别。分析发现,基于PAM的识别只对I型和II型CRISPR-Cas系统重要而对III型不重要。PAM是3~5个碱基对的DNA序列,位于CRISPR的3′末端并与其相邻。Cas1和Cas2识别PAM后,在其5′末端附件剪切出原间隔序列,用的是Cas1蛋白所固有的“量尺(ruler)”机制,从而保证切割出的序列长度的规则性。不同型别的CRISPR系统的PAM序列的保守性不同,主要与Cas1和前导序列相关[7]。新的间隔序列一般在CRISPR阵列的5′末端(前导序列和已有的第一个重复序列/间隔序列之间)插入。在大肠杆菌的I-E型CRISPR-Cas系统,第一个直接重复序列被复制出一个拷贝,新的间隔序列在第一个直接重复序列和第二个直接重复序列之间插入。

3.2 免疫力执行

免疫力的执行可分为两个阶段:CRISPR-RNA(crRNA)的生物合成阶段和外源性DNA降解破坏阶段(免疫阶段)。

3.2.1 crRNA的生物合成 CRISPR序列首先转录出一条长的RNA链,这条链经切割加工后形成多个短的crRNA,每个crRNA片段含有一个完整的或不完整的间隔序列。3种类型的CRISPR序列切割加工形成crRNA的机制不同。在I-E型和I-F型CRISPR系统,Cas6e和Cas6f分别识别重复序列形成的发夹式结构,并在双链和单链RNA的交界处进行切割,形成的crRNA从5′端至3′端依次是8 nt的重复序列、完整的间隔序列和重复序列的发夹式结构。II型CRISPR系统首先合成与重复序列互补的一个RNA片段,叫做tracrRNA(trans-activating RNA);tracrRNA与CRISPR转录物的重复序列以碱基互补结合形成双链RNA,然后在RNase III的作用下形成前crRNA或不成熟crRNA,所形成的前crRNA从5′端至3′端依次是不完整的重复序列片段-完整的间隔序列-不完整的重复序列片段,前crRNA在3′端被进一步切割,失去10 nt的间隔序列和不完整的重复序列片段,形成成熟的crRNA。在III型CRISPR系统,重复序列不形成发夹式结构,而是包绕Cas6,Cas6在间隔序列和重复序列交界处上游8 nt的地方进行切割形成前crRNA或不成熟crRNA,前crRNA从5′端至3′端依次是8 nt的重复序列-完整的间隔序列-比较长但不完整的重复序列,前crRNA在3′端被进一步切割,形成成熟的crRNA[1-2]。

3.2.2 crRNA引导的Cas介导的外源性DNA降解破坏 在免疫阶段(immunity stage),crRNA与Cas形成复合体、crRNA识别靶分子上的互补序列并与之结合、Cas介导外源性DNA的降解破坏。3种类型的CRISPR序列切割加工形成crRNA的机制不同。在I型CRISPR系统,crRNA与5种Cas蛋白形成复合体,识别与crRNA互补的靶分子链上的PAM序列,crRNA序列与靶分子上的互补序列结合,引起crRNA-Cas复合体构象改变,招募Cas3,导致DNA降解。II型CRISPR系统依赖多功能的Cas9发挥作用,其crRNA与单一的Cas9蛋白形成复合体,识别与crRNA同意义(same sense)的靶分子链上的PAM序列,然后由Cas9蛋白的核酸内切酶活性切割降解靶分子DNA[1-2]。与I型CRISPR系统类似,III型CRISPR系统的crRNA亦与多种Cas蛋白(6种或7种)形成复合体,但与另外两个型别的CRISPR系统不同,III型CRISPR系统的crRNA-Cas复合体可以靶向和降解RNA类的靶分子,如RNA噬菌体。

4 基于CRISPR-Cas的基因编辑技术

CRISPR-Cas基因组编辑技术用的是II型CRISPR系统,这个系统使用单一但多功能的Cas9蛋白质,所以操作起来比使用蛋白复合体的I型CRISPR系统和III型CRISPR系统都简单,而且高保真[13]。

CRISPR-Cas9基因组编辑技术通常利用质粒转染靶细胞,故该技术首先要构建CRISPR-Cas9质粒,CRISPR-Cas9质粒必须含有crRNA、tracrRNA和Cas9基因,根据需要亦可含有DNA修复模板。一般用转染方式将CRISPR-Cas9质粒导入细胞,质粒进入细胞后表达产生crRNA-tracrRNA和Cas9蛋白。一个或多个crRNA片段与一个tracrRNA片段一起构成的一条链叫做sgRNA或gRNA(single guide RNA or guide RNA),其中的tracrRNA一般呈发夹-环式结构。gRNA和Cas9蛋白结合形成有活性的复合体,复合体中的crRNA可靶向引导该复合体到特异的宿主DNA序列(包括与crRNA互补的序列及其3′邻近部位的PAM),有活性的Cas9蛋白切割目标DNA,形成单链缺口(single strand nicking)或双链断裂(double strand break,DSB)。DSB激活细胞的DSB修复功能,从而实现对基因的编辑[14]。

细胞主要有两种修复DSB的机制:同源定向修复(homology directed repair,HDR)和非同源末端连接(non-homologous end joining,NHEJ)修复。在有同源DNA序列,如DNA修复模板存在时,可用HDR、否则用NHEJ修复。对基因编辑而言,NHEJ导致靶基因功能的丧失/敲除;而(在有DNA修复模板存在的情况下)HDR机制可将所需基因片段插入基因组DNA[15]。

CRISPR-Cas9基因组编辑技术精确有效、成本低、易于操作,让许多科学家实现了基因操作的梦想,无论是在生物医学领域还是农业领域,成千上万个实验室开始使用并应用这一技术。虽然人们对这种技术亦有一些担忧,特别是对人类生殖细胞和胚胎的基因编辑存在着争议,但CRISPR-Cas9基因组编辑技术已经在生物技术领域引起了暴风骤雨般改变的事实是无人否认的,这一技术的进一步发展应用,必将会在生命科学领域带来更加令人瞩目的成就。

5 从CRISPR-Cas9基因编辑衍生出的技术

近年,在CRISPR-Cas9基因编辑技术的基础上衍生出了几项新的技术,这些技术可以从转录水平沉默基因,可以编辑RNA或从转录后水平沉默mRNA,亦可以优化对DNA基因的编辑。

5.1 CRISPRi基因沉默技术

在CRISPR-Cas9基因编辑技术的基础上首先衍生出来的一项技术,叫做CRISPR干扰(CRISPR interference,CRISPRi),该项技术属于一种转录水平上的基因沉默技术[16]。CRISPRi技术用的仍然是CRISPR-Cas9系统,其基本原理与CRISPR-Cas9基因编辑类似,但是利用了没有酶活性的Cas9(dCas9)蛋白(通过在Cas9基因的D10A和H840A两处引入点突变),所以当gRNA将dCas9引导到目标基因的特定序列时,其结果不是切割或破坏DNA序列,而是阻遏目标基因的转录,即沉默目标基因[16]。CRISPRi主要是通过阻遏转录启动或阻遏转录延伸而沉默基因。阻遏转录启动可通过设计与启动子区域互补的gRNA而实现;阻遏转录延伸可通过设计与外显子区域互补的gRNA而实现(模板链和非模板链均可利用,但与非模板链互补的gRNA的阻遏效率更高)。CRISPRi的基因沉默效率在原核生物一般可以达到99%,在人类细胞可以达到90%[17]。有报道称,若将Kruppel相关盒(KRAB)与dCas9进行融合,则在人类细胞也能够得到99%的基因沉默效率[18]。

5.2 CRISPR-Cas13基因编辑/沉默技术

2017年,麻省理工学院张锋实验室利用2类VI型CRISPR-Cas系统的Cas13a(亦称C2c2)具有核糖核酸酶活性、能够切割RNA的特性,创立了CRISPR-Cas13技术[19]。该技术仍然利用gRNA,将Cas13a蛋白导向于目标,但利用的是后者的RNA酶活性切割RNA或者用没有酶活性的Cas13a蛋白抑制或干扰mRNA的翻译,所以可以用于编辑或抑制RNA;如果将gRNA设计为靶向mRNA的,即可从转录后水平沉默基因[20]。CRISPR-Cas13技术与RNAi技术都可从转录后水平沉默基因,二者沉默基因的效率基本接近,但CRISPR-Cas13技术比RNAi技术具有特异性高的优点[21]。

5.3 基于CRISPR-Cpf1的第二代基因编辑技术

由Doudna等于2012年创立的CRISPR-Cas9基因编辑技术可被称为第一代CRISPR基因编辑技术。2015年,张锋小组[22]利用Prevotella and Francisella菌的Cas蛋白Cpf1(CRISPR-associated endonuclease in Prevotella and Francisella 1),属2类CRISPR系统的V型,创立了CRISPR-Cpf1基因编辑技术,该技术被认为是第二代的基于CRISPR的基因编辑技术,近两年在国际上得到了广泛的应用[23]。和CRISPR-Cas9基因编辑技术相比,CRISPR-Cpf1基因编辑技术具有以下优点[24]:(1)Cpf1只需一个RNA分子(crRNA)协助所以操作更简单,而Cas9需要2个RNA分子协助,crRNA和tracrRNA;(2)Cpf1的分子量比Cas9小,其基因更容易被导入细胞故编辑成功率高;(3)Cpf1系统的PAM序列距离crRNA识别位点远,使编辑位置的选择有更多的可选项;(4)Cpf1切割产生黏性末端,便于新的DNA序列插入(Cas9切割产生平端)。

6 结语

CRISPR相关基因编辑技术的创立,使人们能够相对比较容易地修复基因错误或使某些基因失去功能即敲除这些基因,从而可以治疗或预防疾病、改变或优化生物性状,在医疗、制药、生命科学和农林畜牧业等方面有着广阔的应用前景,但是基因编辑技术本身却是一把“双刃剑”,如果应用不当,可能会给人类社会和生态环境造成破坏或带来灾难。应进一步加深对CRISPR基因编辑技术的认识,对CRISPR基因编辑技术的应用应谨慎而合法。

猜你喜欢

噬菌体质粒间隔
农杆菌转化法中的“Ti质粒转化载体系统”的简介
——一道江苏高考题的奥秘解读和拓展
全基因组测序后质粒的组装与鉴定研究进展*
不同富集培养方法对噬菌体PEf771的滴度影响
植物青枯菌噬菌体保存方法的研究
mcr-1阳性类噬菌体质粒与F33∶A-∶B-质粒共整合形成的融合质粒的生物学特性分析
开发新方法追踪植物病害的全球传播(2020.6.7 iPlants)
科学家发现最大噬菌体
间隔之谜
上楼梯的学问
头夹球接力