提高CRISPR/Cas9系统靶向编辑效率方法的研究进展
2017-02-27赵盼盼王丽袁园园
赵盼盼+王丽+袁园园
摘要:近年来,CRISPR/Cas9系统经过一系列改造后已成为继锌指核酸酶ZFNs和TALENs后的新型高效定点编辑的新技术,目前,该技术已成功应用于人类细胞、斑马鱼、小鼠以及细菌的基因组精确编辑,但是该技术在农作物等植物中的应用还比较受限,且其脱靶效应等问题还有待解决。本文首先简要综述了CRISPR/Cas9系统的发展历程、结构组成和作用机制及其在农作物中的应用,进而综述了近年来探索出的提高CRISPR/Cas9系统靶向编辑效率的方法。最后,对基因组编辑技术在农作物和作物育种上的应用进行了展望。
关键词:CRISPR/Cas9系统;向导RNA;脱靶效应;农作物
中图分类号:S188 文献标志码:A 文章编号:1002-1302(2017)01-0012-04
基因组编辑技术产生于20世纪80年代,在CRISPR/Cas出现之前,科学家们只能通过对庞大的突变体库进行筛选,或通过同源重组途径来对DNA进行编辑。由于细胞发生随机同源重组的效率只有百万分之一,用同源重组方法进行基因编辑耗时长、成本高,因此限制了基因组编辑技术的广泛应用[1-2]。21世纪初,科研人员相继开发出锌指核酸酶(zinc finger nucleases,简称ZFNs)技术和类转录激活因子效应物核酸酶(transcription activator-likeeffector nucleases,简称TALENs)技术,基因组编辑技术得到迅速发展[3]。2013年初,《Science》《Nature》《Biotechnology》《Cell》等杂志几乎同时报道了1种不依赖于FokⅠ核酸酶的基因组编辑技术——clustered regularly interspaced short palindromic repeats/associated nuclease 9(CRISPR/Cas9),CRISPR/Cas9技术具有多个选择的靶向基因的位点,可实现多基因编辑,编辑的类型包括基因的定点插入、小片段的缺失、多个位点同时突变、基因定点的插入/缺失indel突变等。与其他靶向编辑技术相比,还具有精确可靠、设计简单、容易操作、成本低廉等优点。CRISPR/Cas9技术突破了基因编辑的瓶颈,为基因编辑提供了一把精确的“手术刀”。该技术从发现至今发展迅速,正在成为基因改造的重要方法。
1 发展简史
1987年日本大阪大学(Osakua University)学者Ishino在研究大肠杆菌碱性磷酸酶基因时,发现该基因附近有1段由简单重复序列组成的特异序列[3]。随后,研究者们在其他物种也发现了类似序列,并给予了各种不同的命名:直接可变重复(direct variable repeat,简称DVR),串联重复(tandem repeat,简称TREP),长串联重复的重复(long tandemly repeated repetitive,简称LTRR),长串串联重复(long clusters of tandem repeats,简称LCTR),间隔穿插直接重复(spacers interspersed direct repeats,简称SPIDR)[4]。Mojica等在2000年提出把类似序列作为重复序列家族的一类成员,并将其命名为规律的短间隔序列(short regularly spaced repeats,简称SRSRs)。2002年,荷兰学者Jansen分析该序列发现:它由长度不一(21~37 bp)的正向重复序列(repeats)与长度类似的间隔序列(spacers)间隔排列而成,并将其命名为成簇的、规律间隔的短回文重复序列(clustered regularly interspaced short palindromic repeats,简称CRISPRs),并在其附近发现CRISPR相关(CRISPR-associated,简称Cas)基因,分析发现Cas基因表达产物与DNA解螺旋酶及核酸酶具有高度同源性,提示Cas蛋白具有DNA内切酶功能。到了2005年,有3个研究小组发现CRISPR可能与微生物的免疫作用有关。2007年,Barrangou等首次利用试验证明了嗜热链球菌的CRISPR系统直接参与细菌对噬菌体的适应性免疫反应。2012年,Jinek等对细菌的Ⅱ型CRISPR系统进行改造和优化,成功地在体外定点切割了环状质粒DNA和线性寡聚核苷酸片段,并证明将分开作用的crRNA、tracrRNA通过1段linker连接成1条单一向导RNA(single-guide RNA,简称sgRNA),仍然能高效地介导Cas9蛋白对DNA的定点切割。近年来CRISPR/Cas9系统被应用到真核生物中,引起了一场遗传操作的革命性改变。2013年,麻省理工学院张锋团队和哈佛大学Church团队在《Science》杂志上同时发表了CRISPR/Cas9系統在哺乳动物细胞中的应用,多个靶向sgRNAs可以同时对基因组的多个位点进行识别,并通过Cas9作用产生断裂,通过DNA修复系统的不精确修复在多个断裂点周围同时引发突变,从而使之作为一种基因编辑方法投入应用。2014年,Nishimasu等解析了Cas9、sgRNA和DNA复合体的晶体结构,为CRISPR/Cas9技术的进一步改进提供了研究条件[3]。CRISPR/Cas9系统介导的基因组编辑,是继ZFNs、TALENs后的第3代基因组编辑技术。该技术已在拟南芥、烟草、高粱和水稻等多个物种中实现了基因组编辑[5]。鉴于此,CRISPR/Cas9技术展现出了广阔的应用前景,并受到众多分子生物学家的青睐,但该技术的脱靶效应是基因靶向过程中受到广泛关注的一个重要问题,因此如何改善和提高基因组编辑效率,同时最大限度降低脱靶风险成为了亟待解决的问题。
2 CRISPR/Cas9的组成、结构及作用机制
CRISPR基因座结构包括5′端的tracrRNA(trans-activating crRNA)基因,中间是一系列Cas蛋白编码基因(包括Cas1、Cas2、Csn2和Cas9等),3′端由启动子区域、大量spacers、repeats顺序构成。CRISPR上游的前导序列启动CRISPR序列的转录,转录产物为precrRNA,接下来precrRNA在Cas9和核酸酶的作用下被剪切为成熟的crRNA,crRNA以碱基互补配对的方式与tracrRNA结合为tracrRNA:crRNA复合体,tracrRNA:crRNA复合体与Cas9核酸酶形成RNA-蛋白质复合体,由crRNA中的特异性序列引导至临近前体间隔序列毗邻基序(protospacer adjacent motif,简称PAM)的靶位点,crRNA中的引导序列与靶位点DNA碱基互补配对结合并启动Cas9核酸酶切割DNA双链,Cas9蛋白的HNH核酸酶结构域剪切互补链,而Cas9的RuvCI结构域剪切非互补链,进而在靶位点产生DNA双链断裂(DNA double strand break,简称DSB),然后利用细胞的非同源性末端连接(non-homologous endjoining,简称NHEJ)或同源重组(homologous recombination,简称HR)修复机制对断裂的DNA进行插入、缺失(Indel)、修复(Repair)或替换(Replacement)。与ZFNs、TALENs相比,CRISPR/Cas9技术的优势是可针对多个基因设计sgRNA并在1次打靶中同时完成多基因编辑。根据Cas9可多位点同时打靶的特点,在待删除片段两端设计sgRNA,1次打靶便可实现片段的定向删除,这一特点可满足基因簇删除、多基因删除、调控区域删除、外源标记基因的大片段删除等的需求[6]。
3 提高CRISPR/Cas9靶向效率的方法
自CRISPR/Cas9编辑技术投入使用至今,研究者们一直在探索提高该技术靶向效率的方法。有研究者指出,通过调节Cas9核酸酶和sgRNA浓度可降低脱靶风险,但浓度降低后,相应基因组编辑能力会减弱[7]。Zhang等分别通过定性、定量的方法系统地比较了PAM对基因组编辑效率的影响,并发现编辑效率依次是NGG>NGA>NAG(N=A、T、C或G)[8]。考虑到细胞在DNA修复过程中NHEJ、HDR是2个相互拮抗的过程,多个研究组通过体外筛选找到小分子化合物对NHEJ过程进行抑制,从而达到了增强HDR过程提高定点敲入效率的目的。Maruyama等通过小分子抑制剂Scr7抑制NHEJ修复途径中的连接酶Ⅳ,大大提高了HR效率,为HR介导的基因组编辑更广泛地应用奠定了基础[9-10]。CRISPR/Cas9的脱靶效应在研究中造成的诸多不确定性,无疑制约了该技术的广泛应用。脱靶率的高低不仅取决于不同的基因编辑平台(目前对于各种基因组编辑平台脱靶率的比较还没有确切的结论),也同样受靶向序列、细胞类型、基因编辑工具在细胞内的表达时间和强度、载体的选择以及脱靶率的检测方法等影响。笔者主要从提高sgRNA的特异性、改造Cas9蛋白结构以及载体的选择与构建3个方面介绍了提高CRISPR/Cas9技术靶向效率的方法。
3.1 提高sgRNA的特异性
靶向sgRNA的设计对于DNA片段的编辑效率尤为重要。由于sgRNA载体设计的简易性,研究者可针对1个基因设计多个sgRNA,并可结合阵列试验构建sgRNA文库用于功能基因筛选。有关sgRNA文库设计的相关综述详见谢胜松等的报道[11]。2012年,Jinek等将CRISPR/Cas9系统中crRNA、tracrRNA 2个非编码RNA改造成1个RNA,即sgRNA,它能够指导Cas9蛋白对特定的DNA序列进行靶向断裂,为CRISPR/Cas9系统的广泛应用奠定基础[3]。靶向sgRNA序列可以选择GC含量高一些的序列,尽量使碱基分布均匀,靶点尽量选择在DNA超敏位点,这样可以更好地实现Cas9对DNA片段的切割[12]。Doench等系统性研究了CRISPR/Cas9系统介导的基因组编辑效率,并对1 841条sgRNA进行比较,发现若sgRNA的3′末端第20位碱基为G和第16位碱基为C时,基因组编辑效率较高,若第20位碱基为C、第16位碱基为G时,则基因组编辑效率低;若sgRNA第3位碱基为A,其基因组编辑效率比该位置为C时高;若第18、19位碱基为T,其基因组编辑效率则相对较低[13]。这一研究为设计高效的sgRNA提供了强大的实验数据支持。还有的研究者发现在sgRNA的5′端额外增加2个G后能够显著提高CRISPR/Cas9系统的特异性[14]。此外,也有研究者尝试缩短sgRNA的长度来提高其特异性,Fu等使用17~18 nt的“truncated sgRNA”进行基因打靶发现不会影响其活性,但可显著降低脱靶风险[15]。
3.2 通过改造Cas9蛋白结构降低脱靶效应
为降低CRISPR/Cas9系统的脱靶效应,有的研究者对野生型的Cas9进行了改造,使其中1个结构域失活,并得到突变型D10A Cas9切口酶和H840A Cas9切口酶。野生型的Cas9蛋白有2个内切酶活性结构域,而Cas9的其中1个结构域失活只能切割DNA单链,产生1个单链切口,Cas9蛋白经过这一改造,CRISPR/Cas9技术应用时就需要设计2条sgRNA,2条sgRNA分别结合不同的DNA链,突变体切口酶D10A Cas9或H840A Cas9会在每个sgRNA结合的地方造成单链缺口,2个相邻的单链切口会形成1个DSB。这种单链切口酶的优点在于,如果1条sgRNA发生错配,只会形成1个切口,不会形成DSB,这种情况下细胞会自动将其修复正常;如果2条sgRNA同时错配,那么形成双链断裂的脱靶几率会很小,这就极大地提高了靶点的专一性。张锋课题组用这一方法对靶向DNA进行切割,发现该策略可使脱靶效应降至1/1 000[3]。另有研究指出,将该方法和适当缩短sgRNA的靶标序列相結合,能够进一步降低脱靶效应[15]。随后,研究者将Cas9蛋白的核酸酶结构域突变,产生失活的dCas9,然后将dCas9与FokⅠ核酸酶结合形成融合蛋白(FokⅠ-dCas9),发现只有当2个融合蛋白单体彼此靠近并形成二聚体时才能行使切割功能,简单过程是2个sgRNA分别引导dCas9-FokⅠ结合到相距15~20 bp的靶DNA区域,FokⅠ实现二聚化而被激活,对中间的DNA序列进行切割,产生双链末端断裂。Tsai等报道了dCas9-FokⅠ融合蛋白可有效降低CRISPR的脱靶效应至1/5 000[16]。此外,研究者还对Cas9蛋白进行适当的修饰(如加上信号肽,或标签蛋白)[17-19],用来提高基因组编辑效率。
3.3 选择构建合适的载体
如何有效地将CRISPR/Cas9基因组编辑质粒准确地靶向运输到特定的细胞、组织和器官中,实现精确导向的基因编辑,也是提高CRISPR/Cas9靶向效率应考虑的重要因素,尤其在基因治疗领域成为了当今一大难题。在体外对一些细胞进行基因组编辑,可以用电穿孔或病毒载体将CRISPR/Cas9基因组编辑质粒转入细胞之中。电穿孔的方法进行基因转染对细胞的损伤较大,这些细胞在体外经过电穿孔处理后,细胞的活力可能会降低,回输到体内后达不到理想的效果。病毒载体如逆转录病毒载体、慢病毒载体、腺病毒载体等在体外应用比较广泛[20-21]。将CRISPR/Cas9基因编辑系统与腺病毒(adeno-associated virus,简称AAV)系统相结合,成功地对小鼠脑细胞进行了基因编辑,还构建了肺腺癌小鼠模型。也有报道利用AAV递送CRISPR/Cas9基因编辑系统,成功地对小鼠脑部神经细胞的多个基因进行编辑,并观察到了小鼠行为上的变化[22]。此外,纳米颗粒和脂质体也是一种颇具前景的递送工具[23-24]。在农作物等植物中,则载体的选择比较单一,一般会构建含有分别驱动Cas9(如35S)、sgRNA(如:U6或U3)表达的启动子序列、密码子优化的Cas9以及设计好的sgRNA的表达载体,可以将Cas9、sgRNA构建到同一表达载体,也可以构建为不同的表达载体。Upadhyay等在烟草细胞中比较了sgRNA、Cas9核酸酶构建到同一个载体或分别构建到不同的2个载体表达对突变效率的影响,结果表明,在构建到同一载体中表达的突变效率显著高于分别构建到不同载体中表达的突变效率[19]。
4 CRISPR/Cas9系統在农作物中的应用
为了检测CRISPR/Cas9系统能否应用于植物细胞,Orel等设计Gateway双元T-DNA表达载体来共表达Cas9、sgRNA,利用外源报告基因DGU.US研究CRISPR/Cas9系统在水稻的愈伤组织中能否产生双链DNA断裂。结果发现当CRISPR/Cas9系统、DGU.US报告基因共转化到水稻的愈伤组织时,在愈伤组织上发现GUS的着色点,而只有报告基因转入的愈伤组织上则无GUS着色点[25]。由此可知,CRISPR/Cas9系统能够在植物细胞中产生双链DNA断裂,这是该系统在动物、人之后成功应用于植物中进行外源基因编辑,并且明显简化了试验过程。我国学者利用CRISPR/Cas9技术成功剔除了1个基因,使小麦获得白粉病抗性,进而在小麦抗病关键生物技术领域取得重要进展,并第1次在1个多倍体物种中证明了可以对多个部分同源的基因同时并准确进行编辑,而在水稻上使4个基因功能失活的试验,则意味着该技术可以用于水稻这种重要农作物的改良[17,26]。此外,该技术在玉米、高粱、甜橙、大豆、马铃薯、番茄等农作物中均实现了基因的定点编辑甚至多位点的精确编辑[27-28]。但在这些农作物中只有水稻得到了稳定的突变体植株,其余物种均是通过原生质体或者叶片注射等瞬时验证系统证明了CRISPR/Cas9系统在植物细胞中的可行性[29]。
5 展望
CRISPR/Cas9作为一种新型的基因靶向修饰技术,虽然其应用尚处起步阶段,但相比于ZFNs、TALENs技术的耗时、耗力以及设计繁琐等缺点而言,CRISPR/Cas9以其设计简单、耗时短、试验操作性强等优势而备受科研人员青睐。2014年初,《Nature Methods》将TALENs和CRISPR/Cas9技术评为2014年值得关注技术,但同时也明确指出了CRISPR/Cas9的脱靶现象,我们相信随着科研人员对改善脱靶效应方法的不断探索研究,不久的将来CRISPR/Cas9系统将更好地帮助研究者们了解基因的功能,探索基因组的奥秘。除了应用于植物功能基因组研究,基因组编辑技术还可以应用于农作物品种改良[30],便于育种工作者加快培育更优质、高产、多抗性的农作物优良品种。例如:通过基因组编辑技术将花粉或花药发育相关的基因进行定点突变,可以人工创制隐性核雄性不育材料,进一步用于农作物杂种优势的利用。如何改造该技术及供体基因载体的设计,利用HDR在基因组特定位点引入功能基因,这将是今后CRISPR/Cas9技术重点发展的方向,一旦获得突破必将使该技术在农作物改良方面起到更大的作用。除了技术方面仍存在的问题(例如如何更完善地提高靶向效率,更精确地脱靶效应评估体系的研发等),作物育种方面面临的最大问题在于通过该技术产生的植物和相关产物是否受转基因相关法律约束,这更引发了知识产权保护和法律、社会伦理等诸多领域问题的思考。总之,CRISPR/Cas9技术在农作物中的应用,既是机遇又充满了挑战。
参考文献:
[1]Szostak J W,Orr-Weaver T L,Rothstein R J,et al. The double-strand-break repair model for recombination[J]. Cell,1983,33(1):25-35.
[2]Keeney S,Giroux C N,Kleckner N. Meiosis-specific DNA double-strand breaks are catalyzed by Spo11,a member of a widely conserved protein family[J]. Cell,1997,88(3):375-384.
[3]Hsu P D,Lander E S,Zhang F. Development and applications of CRISPR-Cas9 for genome engineering[J]. Cell,2014,157(6):1262-1278.
[4]崔玉军,李艳君,颜焱锋,等. 规律成簇的间隔短回文重复:结构、功能与应用[J]. 微生物学报,2008,48(11):1549-1555.
[5]Jiang W Z,Zhou H B,Bi H H,et al. Demonstration of CRISPR/Cas9/sgRNA-mediated targeted gene modification in Arabidopsis,tobacco,sorghum and rice[J]. Nucleic Acids Research,2013,41(20):e188.
[6]Schaeffer S M,Nakata P A. CRISPR/Cas9-mediated genome editing and gene replacement in plants:transitioning from lab to field[J]. Plant Science,2015,240:130-142.
[7]Hsu P D,Scott D A,Weinstein J A,et al. DNA targeting speci-ficity of RNA-guided Cas9 nucleases[J]. Nature Biotechnology,2013,31(9):827-832.
[8]Zhang Y L,Ge X L,Yang F Y,et al. Comparison of non-canonical PAMs for CRISPR/Cas9-mediated DNA cleavage in human cells[J]. Scientific Reports,2014,4:5405.
[9]Maruyama T,Dougan S K,Truttmann M C,et al. Increasing the efficiency of precise genome editing with CRISPR/Cas9 by inhibition of non-homologous end joining[J]. Nature Biotechnology,2015,33(5):538-542.
[10]Chu V T,Weber T,Wefers B,et al. Increasing the efficiency of homology-directed repair for CRISPR-Cas9-induced precise gene editing in mammalian cells[J]. Nature Biotechnology,2015,33(5):543-U160.
[11]謝胜松,张 懿,张利生,等. CRISPR/Cas9系统中sgRNA设计与脱靶效应评估[J]. 遗传,2015,37(11):1125-1136.
[12]Li J H,Shou J,Guo Y,et al. Efficient inversions and duplications of mammalian regulatory DNA elements and gene clusters by CRISPR/Cas9[J]. Journal of Molecular Cell Biology,2015,7(4):284-298.
[13]Doench J G,Hartenian E,Graham D B,et al. Rational design of highly active sgRNAs for CRISPR-Cas9-mediated gene inactivation[J]. Nature Biotechnology,2014,32(12):U130-1262.
[14]Cho S W,Kim S,Kim Y,et al. Analysis of off-targeteffects of CRISPR/Cas-derived RNA-guided endonucleases and nickases[J]. Genome Research,2014,24(1):132-141.
[15]Fu Y F,Sander J D,Reyon D,et al. Improving CRISPR-Cas nuclease specificity using truncated guide RNAs[J]. Nature Biotechnology,2014,32(3):279-284.
[16]Belhaj K,Chaparro-Garcia A,Kamoun S A,et al. Editing plant genomes with CRISPR/Cas9[J]. Current Opinion in Biotechnology,2015,32:76-84.
[17]Shan Q W,Wang Y P,Li J,et al. Targeted genome modification of crop plants using a CRISPR-Cas system[J]. Nature Biotechnology,2013,31(8):686-688.
[18]Xu R F,Li H,Qin R Y,et al. Gene targeting using the Agrobacterium tumefaciens-mediated CRISPR-Cas system in rice[J]. Rice,2014,7(1):5.
[19]Upadhyay S K,Kumar J,Alok A,et al. RNA-Guided genome editing for target gene mutations in wheat[J]. G3-Genes Genomes Genetics,2013,3(12):2233-2238.
[20]Liu Y J,Chen C Y,He H X,et al. Lentiviral-mediated gene transfer into human adipose-derived stem cells:role of NELL1 versus BMP2 in osteogenesis and adipogenesis in vitro[J]. Acta Biochimica et Biophysica Sinica,2012,44(10):856-865.
[21]Voit R A,Mcmahon M A,Sawyer S L,et al. Generation of an HIV resistant t-cell line by targeted “stacking” of restriction factors[J]. Molecular Therapy,2013,21(4):786-795.
[22]Swiech L,Heidenreich M,Banerjee A A,et al. In vivo interrogation of gene function in the mammalian brain using CRISPR-Cas9[J]. Nature Biotechnology,2015,33(1):102-U286.
[23]Kormann M S,Hasenpusch G,Aneja M K,et al. Expression of therapeutic proteins after delivery of chemically modified mRNA in mice[J]. Nature Biotechnology,2011,29(2):U96-154.