浅谈基因编辑技术与猪遗传改良
2019-11-29李嘉楠徐在言
李嘉楠,顾 浩,徐在言,左 波
(华中农业大学动科动医学院,农业农村部猪遗传育种重点实验室,农业动物遗传育种与繁殖教育部重点实验室,湖北 武汉,430070)
前言
从本质上讲,转基因技术是人为的在生物体原DNA 中引入一段外源DNA 序列,从而达到改变生物自身性状并稳定遗传的技术。而基因编辑技术则是对物种本身的基因进行各种 “粘贴复制” 或者 “剪切替换” 等修饰,从而抑制机体内 “不好” 基因的表达,促进机体内 “好” 基因的表达,且不具有引入未知成分的风险,相较于转基因技术其安全性更高、可控性更强。目前,新兴的CRISPR/Cas9 基因编辑技术在分子生物学中呈现出了巨大的潜力,将现代生物学研究推向了一个新的水平,几乎所有的生物实验室均可掌握这项技术并对任何物种进行研究,基因改变未来的时代已经到来。
1 CRISPR/Cas 系统
CRISPR/Cas 系 统 最 早 是1987 年日本学者在大肠埃希菌(Escherichia coli) 中 发 现 的, 并将其命名为规律性成簇间隔的短回文重复序列(CRISPR), 随后又有大量学者证明多种细菌和古细菌中也存在这种系统,并预测该系统可能与DNA 修复和基因调控相关[1-3]。2007 年,研究人员首次使用细菌中CRISPR 系统对噬菌体进行适应性免疫,并证明了CRISPR 基因座附近存在的一系列相 关 蛋 白(CRISPR associated 蛋白;Cas 蛋白) 能对外源DNA 进行切割[4]。CRISPR 基因是由一段长度约为300 ~500 bp 富含AT 碱基序列的前导序列和一段具有发卡结构的重复序列以及多个捕获外源基因的间隔序列组成;前导序列的上游为一系列多态型Cas 基因,目前已经发现了Cas1 ~Cas10 等多种类型的Cas 基因,与CRISPR 组合形成CRISPR/Cas 系统。根据不同Cas 基因编码的蛋白功能不同,将CRISPR/Cas 系统分为三个类型,其中Ⅰ型和Ⅲ型CRISPR/Cas 系统都是由多种Cas 蛋白共同发挥作用, 参 与CRISPR RNA(crRNA)加工并促进其与DNA 双链结合,形成R 环结构, 最终与反式激活CRISPR RNA(tracrRNA) 识别R 环结构切断DNA 双链;Ⅱ型CRISPR/Cas 系 统 仅 需 一 种Cas 蛋白,就可以在RNA 的介导下造成DNA 双链断裂,因此其成为了目前应用最广泛的基因编辑系统,其中包括CRISPR/Cas9、CRISPR/Cas12(cpf1)、CRISPR/Cas13 系统等[5]。
2 新型基因编辑技术概述
2.1 CRISPR/Cas 基因编辑技术
Ⅱ型CRISPR/Cas 系统中CRISPR/Cas9 蛋白的基因编辑是由RNA 介导,主要结构包括Cas9 蛋白、crRNA和tracrRNA 组 成,tracrRNA 负 责激活RNase Ⅲ从而促进crRNA 成熟,成熟的crRNA 通过碱基配对与靶序列结合,引导Cas9 蛋白的两个活性位点RuvC 和HNH 分别对靶序列的两条链进行的切割,造成DNA双链断裂,从而使细胞发生非同源末端修复机制(NHEJ)和同源末端修复机制(HDR),实现目的基因的敲除和插入[6]。2012 年,Jinek 等将crRNA 和tracrRNA 的核心区连接在一起形成一个20 bp 长度左右的sgRNA(single guide RNA)去引导Cas9 蛋白,仅仅只需一个蛋白质和一个RNA 分子就可以实现基因编辑,这一改造大大简化了CRISPR/Cas9 基因编辑系统在基因组中的应用[7,8]。但其自身存在的严重脱靶问题也被人们所诟病,因此,其同源蛋白也成为了研究热点之一,其中CRISPR/Cas12a(cpf1)与CRISPR/Cas9 一样都是由RNA 介导的基因编辑,但与CRISPR/Cas9 相比具有以下几点不同:首先,该系统只由Cas12a(cpf1)和crRNA 组成,不需要tracrRNA 的参与,因为Cas12a(cpf1)蛋白自身就可以促进crRNA成熟, 进而识别靶序列。 其次,Cas12(cpf1)的PAM 识别区为5’-TTTN-3’,而Cas9 的PAM 识别区为5’-NGG-3’,两者的结合能够有效提高基因编辑在基因组中的识别范围。 最后,Cas12a(cpf1) 蛋白与Cas9 蛋白同样具有切割活性的RuvC 和特殊的HNH 结构域,不同的是Cas12a(cpf1)蛋白切割后会产生一个4 ~5bp 的黏性末端,有利于细胞发生同源末端修复机制,提高编辑效率,而Cas9 蛋白切割产生的是平末端[9]。同时,也有研究表明CRISPR/Cas12b 与CRISPR/Cas12a(cpf1) 发挥同样的作用,只是Cas12b 蛋白分子量更小,编码序列更短,具有更高的编辑效率和较低的脱靶率[10]。CRISPR/Cas13基因编辑系统也是由RNA 介导的基因编辑系统,与前几种Cas 系统的不同之处在于,Cas13 蛋白具有两个高度保守的HEPN endoRNase结构域,具有RNA 酶活性,能在crRNA 介导下对单链RNA 进行精确编辑[11]。
2.2 单碱基编辑技术
上述的CRISPR/Cas 基因编辑系统通常是通过碱基配对定位到目 标DNA 序 列 上, 在sgRNA 指定的特定位点造成双链断裂。通过细胞对DNA 双链断裂的同源末端修复或非同源末端修复机制造成目的基因的插入和敲除,达到改变生物性状的目的,然而对于很多基因操作而言,不需要双链断裂,仅仅改变单个碱基就可以实现生物性状的改变,这一技术称为单碱基编辑技术。2016 年, 哈佛大学的研究学者将Cas9 蛋白的两个结构域进行突变,得到两种突变体,分别为Cas9 切口酶突变体(Cas9 nickase,Cas9n)和核酸酶缺陷Cas9(dead Cas9, dCas9), 其 中Cas9n 具有切割DNA 单链的能力,将Cas9n 与鼠源的胞嘧啶脱氨酶融合在一起构成了第一代胞嘧啶碱基编辑器(cytosine base editor, CBE),实 现 从C 到T 或G 到A 的 转 换,造成错义突变或者提前终止翻译,达到目的基因的敲除[12]。随后2018年该研究团队在CBE 的基础下,对大肠杆菌的腺苷脱氨酶进行改造获得了第一代腺嘌呤碱基编辑器(adenine base editor, ABE),实现了单碱基从A 到G 或从T 到C 的转换。与CRISPR/Cas9 系统相比,ABE 和CBE 单碱基编辑系统能够在不切断DNA 双链的情况下实现四种碱基对之间的完美转换[13]。目前,ABE 和CBE 单碱基编辑系统在拟南芥、小麦、水稻、大豆、玉米等植物的性状改良和抗病性应用较为广泛,但是在动物方面研究较少,尤其是应用于猪、牛、羊等大动物。2019 年,中国科学家通过胚胎注射和体细胞核移植首次在猪的细胞、胚胎和个体水平上对猪的多基因位点进行单碱基编辑,培育出了单基因突变的早衰猪模型和杜氏肌肉营养不良猪,同时也获得了与免疫机能相关的多基因突变的免疫缺陷猪模型[14]。随着对单碱基编辑技术的深入研究、系统的优化和完善,未来基因编辑定会进入一个精确编辑的时代。
2.3 基于CRISPR/Cas9 技术衍生的基因表达调控
在CRISPR/Cas9 系统广泛应用之前,锌指核酸内切酶(ZFNs)和类转录激活因子效应物核酸内切酶(TALENs) 的应用在基因转录调控方面已经取得了很大的进展,但是由于它们DNA 结构域对碱基识别的规律复杂性,在调控多个内源基因时出现了很大的阻碍[15-17]。但在CRISPR/Cas9 基因编辑系统中,Cas9 蛋白是由sgRNA 引导通过与靶位点进行碱基互补配对和DNA结合并发挥剪切作用,可以设计不同的sgRNA 同时引导Cas9 蛋白定位到多个基因组位点,实现多基因同时调控。也有研究学者发现Cas9蛋白的另一种突变体dCas9 具有只结合DNA 而不发挥剪切作用的能力[18], 可 以 将dCas9 与 转 录 抑 制域或转录激活域进行融合,形成CRISPR interference(CRISPR i)和CRISPR activator(CRISPR a) 系统实现对靶基因的抑制或激活[19]。dCas9 在调节表观遗传修饰上也发挥了一定的作用,有研究学者将dCas9 与人乙酰基转移酶 p300 的催化核心融合,结果表明经过基因修饰后的增强子,其靶向到启动子上时对乙酰化具有强有力的转录激活作用[20]。
3 基因编辑技术在猪遗传改良中的应用
自CRISPR/Cas9 技术问世以来,基因组编辑已经迅速席卷整个生物医学领域,包括畜牧业,尤其在猪基因组编辑中的研究已成为了一个势不可挡的趋势,它不仅克服了大动物传统育种中育种周期长、遗传效力低等问题,而且在抗病性、肉质改善、动物福利及动物疾病模型等研究上都有重要突破,基因编辑技术在猪基因组编辑中应用的部分实例见表1。
4 基因编辑技术的局限性及优化策略
近 几 年,CRISPR/Cas9 基 因编辑技术在生物学领域发挥着巨大潜力,尤其是在功能基因研究和动物疾病模型上。但是该技术在应用过程中还存在脱靶效应、编辑效率低等一系列风险,给精确基因编辑造成一定的阻碍。基于此,科学家们在降低脱靶效应和提高基因编辑特异性等方面进行了很多研究:1)sgRNA 的选择及优化:减少脱靶和提高sgRNA 特异性的首要任务是正确选择活性高的sgRNA,目前有许多关于sgRNA 设计的软件程序,研究人员可以根据2 ~3 个不同软件综合比较挑选出得分较高的sgRNA,有助于最大化的降低脱靶效应。更有研究者通过截短sgRNA的3’端或在sgRNA 的5’端加入两个碱基,证明了截短和修饰后的sgRNA 特异性更高,且不影响靶基因组的编辑效率[34]。2)cas9 蛋白的结构改造:有研究证明SpCas9-HF1[35]、eSpCas9[36]及HypaCas9[37]等Cas9 核酸酶突变体,都具有较低的脱靶效应,同时还和野生型Cas9具有相同的基因编辑能力。除此之外,Hu 等研究团队通过获得Cas9的突变体xCas9 来拓宽Cas9 蛋白识别更广泛的PAM 序列(NGG、NG、GAA、GAT 等),增加在基因组中的靶向范围[38]。2014 年,Ran等研究团队发明了一种双切口编辑技术,通过将两个成对的sgRNA与Cas9n 结合起来,分别切割DNA的两条链,提高了sgRNA 对靶向基因组序列识别的特异性,证明了在基因组编辑效率不变的情况下,sgRNA 的脱靶效率显著降低[39]。3)基因组位点、宿主细胞类型、培养条件、Cas9 及sgRNA 复合物浓度和Cas9 蛋白持续表达的时间等多种因素都会影响编辑的精确性[40-42]。宿主细胞中持续高水平的表达Cas9蛋白能够提高靶基因编辑效率,但sgRNA 的错配耐受数也在增加,脱靶效应的风险会更高。为了减少这种影响,2017 年,Rauch 等人通过添加Cas9 核酸酶抑制剂Acr ⅡA4调节Cas9 核酸酶在细胞中表达的时间[43]。
表1 基因编辑技术在猪基因组编辑中应用的部分实例
5 小结与展望
近年来,CRISPR/Cas9 基因编辑技术除了在小鼠、果蝇、斑马鱼等常见的实验动物中应用之外,还在猪、牛、羊等大型动物以及灵长类动物—食蟹猴等都有广泛应用,展现出基因编辑技术未来发展的无限可能,但编辑效率、脱靶效应和打靶特异性等许多问题亟待解决,尤其是需要克服脱靶效应,“零脱靶” 是未来基因编辑走向临床应用上的重中之重。目前,CRISPR/Cas 系统所衍生出来的新技术正在逐步优化和改进,但开发更精准高效的基因编辑新技术仍是未来需要攻破的难题和努力的方向,这对于研究人员来说既是一种新的挑战,同时也是基因编辑技术发展的机遇和重要突破。