基因编辑新技术CRISPR-Cas系统研究及应用进展
2020-06-15康细林储丹丹单斌
康细林,储丹丹,单斌,*
(1 昆明医科大学第一附属医院检验科,昆明 650032;2 云南省检验医学重点实验室,昆明 650032;3 云南省实验诊断研究所,昆明 650032)
1 CRISPR-Cas系统简介
1.1 CRISPR-Cas系统的发现与发展
CRISPR-Cas系统结构从发现到功能的确定共经历了20余年的时间,近年来其基本结构和作用机制逐渐得到阐明。CRISPR-Cas系统是细菌长期进化过程中抵御噬菌体入侵和外源质粒转移而形成的一种获得性免疫系统,该系统的发现最早可追溯到1987年,日本的Ishino等[3]研究团队在大肠埃希菌的碱性磷酸酶基因中观察到一个29bp的重复序列,这一发现在当时并没有引起人们的关注,但随后更多的研究发现在细菌和古细菌中广泛存在这种重复序列。直到2002年将其正式命名为规律成簇间隔短回文重复序列(Clustered regularly interspaced short palindromic repeat,CRISPR)[4-6],同时CRISPR相关蛋白也得以命名[2]。2005年,三组生物信息学团队报道了CRISPR中的间隔DNA序列与入侵细菌的外源核酸序列相符合,推测C RIS PR系统在微生物免疫中可能起了作用[7-9]。2007年,Barrangou等[10]的研究证实,CRISPR系统可以从噬菌体基因组上取得新的间隔序列,从而获取相应的免疫能力。2010年CRISPR的基本功能和机制变得清晰。2011年,Charpentier团队发表了完整的CRISPR-Cas9系统的结构,预测了其在基因组工程中极大的潜在价值[11]。2012年,由RNA介导的基因组编辑技术CRISPR-Cas9(CRISPR/CRISPRassociate 9)开始发展起来[12-13]。2013年,两项研究同时实现从嗜热链球菌和酿脓链球菌中设计Ⅱ型CRISPR系统,并完成在哺乳动物细胞中的基因组编辑[14-16]。从此作为新一代的基因编辑技术,CRISPR技术具有广阔的发展空间和应用前景[14]。
1.2 CRISPR-Cas系统的结构
CRISPR-Cas系统主要由前导序列(Leader sequence,LS)、CRISPR基因座及CRISPR相关基因 (CRISPR-associated gene,Cas gene)组成(见图1)。前导序列位于CRISPR第一个重复序列的上游,大约200~500bp,其序列中富含AT[17],在CRISPR-Cas系统中扮演为新间隔序列获得提供识别位点[18]和转录时启动子的角色[19]。CRISPR基因座是由长度相似的重复序列和间隔序列排列而成的CRISPR阵列,重复序列长度约为21~48bp,其序列存在二重对称性,即可以形成发夹结构,重复次数可多达250次,是Cas蛋白的结合区域[4,20]。间隔序列是高度可变的序列,具有丰富的多样性,间隔序列长度与细菌种类和CRISPR位点有关,长度一般为20~72bp[20]。该序列与噬菌体或质粒序列存在高度同源性[3,21],甚至有一些间隔序列与噬菌体基因组序列完全一致[22],这 表明间隔序列来源于噬菌体基因组。每个重复序列与间隔序列构成一个CRIS PR单位,数个CRISPR单位构成CRISPR阵列。CRISPR相关基因是靠近CRISPR基因座附近的一组高度保守基因群,其所编码的Cas蛋白,包含核酸内切酶、解旋酶以及与核糖核酸结合的结构域,能够识别外源DNA,通过位点特异性的切割将入侵DNA切断[23]。
1.3 CRISPR-Cas系统的分类
根据CRISPR-Cas系统中Cas蛋白参与作用与功能不同,Makarova等[25]将CRISPR-Cas系统分为以下三种类型:即I型、II型和III型。I型CRISPR-Cas系统中起主要作用的是Cas3基因,它编码的Cas 3蛋白具有解旋酶活性及DNA酶活性,是干扰阶段起主要作用的酶[26]。II型 CRISPR-Cas 系统起主要作用的是Cas9基因,该系统可以分为3个亚型,即具有Cas2附加基因的Ty pe II-A系统、具有Cas4附加基因的Type II-B系统和无附加基因的Type II-C系统[25]。而III型 CRISPR-Cas系统可编码聚合酶和RAMP分子,分为两个亚型,即可识别靶DNA序列的Type III-A系统和识别RNA的Type III-B系统。
图1 CRISPR-Cas系统结构模式图 [24]
1.4 CRISPR-Cas系统的作用机制
CRISPR-Cas系统的作用机制可归纳为:“适应”、“表达”和“干扰”三个阶 段。
在适应阶段CRISPR-Cas系统获得新的间隔序列。当噬菌体或质粒进入含有CRISPR-Cas系统的细菌和古细菌中时,宿主体内的CRISPR相关蛋白质复合体与噬菌体或质粒DNA的原型间隔序列 毗邻基序(protospacer adjacent motifs,PAM)进行结合,将与PAM毗邻的一段DNA序列作为候选的原型间隔序列(protospacer),然后在相关蛋白的作用下[27],将原型间隔序列整合至前导序列与第一个重复序列之间,形成一个新的间隔序列,从而使得CRISPR基因座中存在该噬菌体或质粒的序列信息,为细菌的获得性免疫奠定了结构基础。
在表达阶段CRISPR-Cas系统表达产生成熟的CRISPR R NA(crRNA)。当噬菌体或质粒再次入侵时,CRISPR-Cas系统的前导序列发挥“启动子”样的功能启动转录并转录出一段序列特异的CRISPR RNA前体(pre-crRNA),经加工剪接成为成熟的crRNA。该加工过程是由Cas蛋白催化的,不同CRISPR-Cas系统中参与该催化过程的Cas蛋白不同[23]。
在干扰阶段CRISPR-Cas系统实现对靶基 因的裂解。pre-crRNA在Cas蛋白的作用下被加工为成熟的crRNA。后者与Cas蛋白结合形成蛋白复合物,该蛋白复合物中crRNA的间隔序列识别入侵的噬菌体或质粒的核酸序列并与之互补结合,随后对外源DNA或RNA的特定位 点进行切割,使得外源核酸的序列因其完整性受到破坏而无法在宿主体内进行自我复制[28-30]。
2 CRISPR-Cas系统的应用进展
近年来,随着人们对CRISPR-Cas系统认识的不断加深,CRISPR-Cas系统因其操作较简单、编辑效率较高、成本较低、耗时较短而被广泛运用于农业、林业、工业、生物工程、医药卫生等领域。
[7] 潘立友,李彩荣,陈理强.断层夹持型不规则工作面冲击地压成因与防控[J].煤炭科学技术,2018,46(10):45-50.
2.1 CRISPR-Cas系统在基因编辑中的应用
朱健康实验室利用CRISPR-Cas系统在拟南芥和水稻中实现了基因组的突变,突变效率为5%~48%[31]。有人曾设想在发酵工程中,利用CRISPR-Cas系统的“免疫功能”来抵抗噬菌体的感染,即在工业用菌的CRISPR序列中插入与目的噬菌体同源的间隔序列。关于这个设想,目前已经申报了国际专利(2007025097)。2012年Doudn研究小组首先利用酿脓链球菌的CRISPR-Cas系统和人工合成的crRNA序列对体外的DNA进行精确切割,并且把crRNA:tracrR NA复合物改造成单链向导的RNA嵌合体,后者同样可以用来指导Cas9蛋白在特定位点剪切双链DNA[32]。有研究小组发现将Cas9、crRNA、tracrRNA三者构建于同一个质粒上转染可对293T细胞的特定位点进行精确切割[14]。随后有很多研究团队在人、小鼠和斑马鱼等细胞中利用 CRISPR-Cas系统进行基因组的编辑[15,33-34]。2013年Cong等[14]首次报道利用CRIS PR-Cas9系统对人293T细胞的EMXl和PVALB基因以及小鼠Nem2A细胞的Th基因实现了定点突变,该文章同时报道了哺乳动物细胞内crRNA的成熟不需要细菌的RNaseⅢ。由此可见,CRISPR-Cas系统作为基因编辑工具的一种,已经广泛应用于很多领域。
2.2 CRISPR-Cas系统在基因表达中的应用
除了将CRISPR-Cas系 统作为基因工具外,科学家还将其改造为调节基因表达的工具。Bikard等[35]将Cas9蛋白的结构域(RuvC、HNH)突变后形成不能裂解目标DNA但能结合目标DNA的dCas9蛋白,发现当dCas9蛋白结合到基因启动子的不同区域时能抑制转录的起始或延伸。同时作者还发现将RNA聚合酶(RNAP)的ω亚基与Cas9蛋白的融合体结合至启动子的上游区域能达到转录激活的目的。随后,有研究团队在真核生物细胞内源性基因上进一步证实了dCas9蛋白对基因表达的调控作用[36-37]。这说明改变Cas蛋白的结构域或将转录激活亚基结合至Cas蛋白能将CRISPR-Cas系统改造成基因表达调控工具。
2.3 CRISPR-Cas系统在细菌领域的应用
2.3.1 CRISPR-Cas系统与细菌分型
目前发现在40%已测序的细菌中存在CRISPRCas系统。在细菌进化过程中,CRISPR序列中间隔序列的插入和剔除使得CRISPR位点具有极高的多态性。利用适当的引物PCR扩增CRISPR位点,测序后获得CRISPR序列。通过分析CRISPR位点中间隔序列的组成和排列顺序,可以用于细菌分型。因此,CRISPR也可作为细菌分型的理想位点,且目前已有研究者利用这一原理对细菌进行分型。例如基于CRISPR的分子分型在结核杆菌领域的应用有近20年的历史,为结核杆菌的区域性分布和暴发流行研究提供有力的分析手段。Kamerbeek等[38]于1997年利用CRISPR-Cas系统创建了“spacer oligotyping”(恒间隔序列谱系分型)或“Spoligotyping”(恒间隔点阵分型)分型方法,目前以CRISPR位点多态性为基础的恒间隔点阵分型是应用较为广泛的分型方法。这种分型方法已成为结核分枝杆菌分型的标准方法之一;法国的研究者对783株沙门菌进行了研究,证明CRISPR对于沙门菌是一种高分辨力和实用的分型方法,对检测沙门菌感染和暴发有重要作用。Liu等[39]在沙门菌的分型研究过程中建立了一种新的MLST分型方法;基于CRISPR的空肠弯曲杆菌的分子分型始于2003年[40],研究者用CRISPR位点对184株空肠弯曲杆菌(Campylobacter jejuni)分型,发现74%的样本中存在典型的CRISPR位点,对其进行分型的结果表明其分辨率与扩增片段长度多态性分析(amplifi ed fragment length po lymorphism,AFLP)和多位点序列分型(multilocus sequencetyping,MLST)相近[41]。Louwen[42]于2013年将空肠弯曲杆菌分子分型从CRISPR扩展到了Cas蛋白的多态性。
2.3.2 CRISPR-Cas系统与细菌进化分析
在细菌与噬菌体等外源DNA的斗争过程中,新的间隔序列的插入使细菌获得了对噬菌体等的免疫。研究发现新间隔序列的插入是有规律的,其总是插入前导序列和其原来临近的重复序列之间,而被剔除的间隔序列通常位于CRISPR位点3'端的尾随序列[22]。CRISPR位点间隔序列的变化,在一定程度上记录了细菌在不同时期、不同环境中遭遇外源DNA攻击的历史。因此,CRISPR位点间隔序列的特点可以反映细菌的进化历程,有助于研究不同细菌之间的亲缘关系。Philippe等[22]通过对嗜热链球菌CRISPR位点间隔序列的组成情况分析,从而推导出不同嗜热链球菌的亲缘关系;Pourel等[9]通过建立CRISPR的进化模型,推测出了鼠疫杆菌祖先基因序列中CRISPR位点的序列情况;崔玉军等[43]通过CRISPR位点分析建立了鼠疫菌的进化模型,从而推断鼠疫菌的主要传播路线及传播方式。
2.3.3 CRISPR-Cas系统与细菌的毒性和耐药性
有研究显示化脓链球菌携带的间隔序列数与菌株带有的前嗜菌体数成反比[44]。Bikard等[45]构建了以致病性肺炎链球菌中的荚膜基因为靶标的CRISPRCas系统。结果发现,不论是在体外还是体内感染实验中,该系统都能有效阻止含有荚膜基因的质粒进入无毒菌株从而抑制了毒力的传播。Bikard还构建了以受体菌染色体上一段耐药基因为靶标的CRISPRCas系统,将含有该系统的质粒导入受体菌后导致了细菌的死亡。有研究表明CRISPR-Cas系统还能通过限制质粒结合而控制药物抗性基因在致病菌之间的扩散[46]。
2.3.4 CRISPR-Cas系统与细菌的防御作用
1987年,在研究大肠埃希菌K12参与碱性磷酸酶iap酶时,人们发现在iap基因的下游存在29nt的重复序列,它被5个32nt的非重复序列所间隔。它们存在于40%的细菌和90%的古细菌中。Jansen和Mojica将包含上述间隔重复序列的微生物基因组位点命名为CRISPR。同时,CRISPR关联基因(Cas)被发现高度保守,且往往与CRISPR重复元件结合。II型CRISPR-Cas免疫系统只需要一个Cas9蛋白来切割DNA双链,这使得它易于改造。
Horvath团队发现CRISPR间隔序列决定靶标特异性,而Cas酶控制间隔序列的获得和噬菌体防御。原始间隔序列相邻元件(PAM)可能介导II型Cas9核酸酶切割DNA,基于这一推测,Moineau团队通过证明噬菌体基因组PAM序列的突变可规避CRISPR的干扰,证实了PAM序列的重要性。另外,对I型和II型来说,CRISPR的直接重复序列不含有PAM,从而阻止CRISPR系统的自我切割。
2010年前后,两项研究描述了天然II型CRISPR系统的功能机制,阐述了它的基本组成。首先,Moineau团队通过对嗜热链球菌的遗传学研究揭示了Cas9是Cas基因簇中唯一介导靶DNA切割的酶。接着,Charpentier团队揭示了II型CRISPR系统中crRNA的生物发生和加工过程中一个关键的成分—一种非编码的反式激活crRNA(tracrRNA),它与crRNA杂交以促进RNA介导的Cas9靶向。这个双RNA杂交复合物,与Cas9及内源的RNA酶III一起,是将CRISPR转录并加工为成熟的crRNA所必需的。这两项研究表明,至少有3个元件(Cas9、成熟crRNA和tracrRNA)是重构II型CRISPR核酸酶系统所必需的。
2011年,Siksnys团队发现II型CRISPR位点可以从嗜热链球菌移植到大肠埃希菌且重现CRISPR干扰功能。2012年,Charpentier、Doudna和Siksnys 3个团队的研究表明,纯化的Cas9在体外可以通过crRNA介导来切割DNA。进一步地,一种将crRNA和tracrRNA融合而得的单向导RNA(sgRNA)被证明可以成功地介导体外源DNA切割。
2.4 CRISPR-Cas系统在医学中的应用
2.4.1 CRISPR-Cas系统在疾病模型构建中的应用
Wang等[47]将Cas9的mRNA及两种不同的导向RNA直接注射入小鼠的受精卵细胞中,获得了两种基因同时缺陷的小鼠,并且效率高达80%,大大简化了基因敲除鼠的形成过程,缩短了疾病模型鼠的产生周期。由于模拟人类血管性血友病的大鼠模型不能很好地完全概括人类血管性血友病的特点,而猪血管的大小及结构与人类的血管很相似,因此,有人利用CRISPR-Cas系统成功构建了更能代表人类血管性血友病的特点的猪模型[48]。目前有人已经成功地在细胞HEK293和其他生理相关的细胞中构建了染色体易位导致的肺腺癌模型、一系列因染色体插入而导致肺腺癌的细胞系[49]、急性髓系白血病以及肉瘤模型[50]。
2.4.2 CRISPR-Cas系统在疾病治疗中的应用
随着CRISPR-Cas系统在基因编辑领域的应用越来越广泛,它为基因疾病的治疗提供了很好的前景。众所周知,人的诱导多能干细胞(iPS细胞)在治疗一些人类的遗传疾病方面很有前景[51-52]。CRISPRCas系统与iPS联合利用能为某些疾病的治疗提供有效的治疗方法,例如用iPS细胞治疗人类的镰刀型贫血症,可以将病人的皮肤细胞诱导成iPS细胞,然后利用CRISPR-Cas9突变型的切口酶来介导同源重组修复突变的血红蛋白基因,再将修复的iPS细胞定向诱导分化为造血干细胞移植到病人体内。目前,人们在动物模型中实现了利用CRISPR-Cas系统来修正疾病的突变位点,例如2013年Wu等[53]在大鼠的胚胎中用CRISPR-Cas系统修正了能导致大鼠白内障的Crygc基因的一个突变结构域后发现这些大鼠的白内障得以解除。因此,人们推测该系统可能在肿瘤及重大传染病的治疗中发挥重要作用。除了在疾病模型的构建及疾病治疗方面的应用外,该系统在药物的研发和制造方面也可能发挥重要作用。
3 结语
CRISPR-Cas系统作为细菌在适应噬菌体攻击所进化而成的 “免疫系统”,在抵御外来入侵时发挥重要作用。到目前为止,CRISPR位点在很多细菌和古生物菌中都有发现,这种结构普遍的存在于细菌及古生物菌中,证明该位点对于细菌的生存进化有着举足轻重的作用,因此成为众多科学家研究的重点。基于其类似RNA干扰的作用,人们对它的应用不仅仅局限于原核生物,目前CRISPR-Cas系统已广泛应用于农业、林业、养殖业、医学卫生事业等诸多领域。CRISPR-Cas系统除了可以用作基因编辑工具外,还可以通过对其改造而作为基因表达调控工具。但不可否认的是CRISPR-Cas系统作为一种新型的基因编辑工具,其自身也存在一定的问题,其中最主要的问题就是脱靶效应。因此,如何降低操作过程中的脱靶率,成为了更好利用该系统进行基因编辑的关键因素。随着对CRISPR-Cas系统地深入研究,CRISPR-Cas系统将会在更多的领域发挥更重要的作用。