基因编辑系统CRISPR/Cas9 在作物基因工程育种中的应用
2020-12-17王亦学郝曜山张欢欢
王亦学,郝曜山,张欢欢,孙 毅
(山西省农业科学院生物技术研究中心,山西太原030031)
高产、稳产、优质一直以来都是育种家不断努力追求的目标。常规的杂交育种方法是将作物种内的优异基因聚合在一起,从而培育出高产、优质、抗逆性强的作物新品种,但是其选育时间长,可选择的范围有限,极大地限制了育种的进程。作物内源基因定向改造的实现为作物的遗传改良提供了新的思路与途径。近年来,在生命科学领域中不断发展和完善的基因编辑(genome editing)技术,可以对目标基因进行精准修饰,为作物基因工程育种提供了新的技术手段。
本文介绍了基因编辑技术的发展历程以及CRISPR/Cas9 系统的结构组成、工作机制和技术优势,综述了CRISPR/Cas9 系统在作物基因工程育种上的应用进展,探讨了CRISPR/Cas9 系统一些亟待解决的问题和未来的发展方向,以期为开展这一领域工作的研究提供参考,推动该项技术得到更加广泛的应用。
1 传统的基因工程育种技术
伴随着DNA 重组技术和植物组织培养技术的发展,植物基因工程技术应运而生。作为传统的植物基因工程育种技术转基因技术,可以将特定遗传属性的目标基因转移到植物体内,通过目标基因的重组,从而培育出具有特定遗传属性的作物新品种[1]。其克服了传统育种周期长、打破了物种间生殖隔离及不良基因连锁等一系列问题。目前,转基因技术已经在近200 种植物中得到广泛应用,转化的目标性状也从抗病虫害、抗除草剂拓展到抗逆、品质改良等各个方面[2-5]。
虽然转基因技术可以通过调控相关基因的表达获得理想的目标性状,但是也存在自身的技术缺陷和潜在的风险因素。一是外源基因表达量不确定。在超表达过程中,外源基因整合到植物基因组中之后,容易发生基因沉默[6];由于外源基因在整合到植物基因组时,其插入位置具有随机性,这很可能导致某些决定植物重要性状的基因遭到破坏,从而造成不良性状的产生。二是无法对基因进行精准敲除。T-DNA 插入技术和转座子技术对基因的敲除是随机的;反义技术和RNAi 技术只能在转录水平上对目标基因进行表达干扰,其抑制效果不完全,而且遗传不稳定[7]。三是转基因技术存在安全性问题。转基因技术可以使得来自不同遗传背景的基因在不同的种、属间进行转移,这些基因在新的遗传背景中是否会脱离控制,至今仍然没有明确的定论[8]。另外,转基因技术在操作过程中不可避免地插入报告基因、筛选标记基因等,使得获得的品种存在一定的争议性。总之,作为传统基因工程技术的核心转基因技术,虽然可以对目标基因的表达进行调控,但是其无法对目标基因进行精准修饰,在基因工程育种中受到了一定的限制。
2 基因编辑技术介绍
序列特异性核酸酶(Sequence specific nucleases,SSNs)的出现使得基因的精准修饰成为可能。基因编辑技术就是利用序列特异性核酸酶在基因组特定位点产生DNA 双链断裂(Double strand breaks,DSBs),随后通过非同源末端连接(Non-homologous end joining,NHEJ)和同源重组(Homology directed repair,HDR)2 种自我修复途径,实现基因的敲除、定点插入或替换。其中,NHEJ 往往能够使断裂位置发生不精确的重新连接,包括碱基的缺失或插入,实现基因敲除的目的;而HDR 主要是通过同源重组来实现精确的定点替换[9]。通常情况下,DNA 双链断裂的修复方式以NHEJ 为主,HDR 发生的概率很低。
2.1 基因编辑技术的发展
20 世纪90 年代,利用不同锌指蛋白可特异性识别DNA 序列上的碱基三联体以及核酸酶Fok I二聚化后可以切割DNA 序列的特点,人们将序列特异性识别的锌指蛋白DNA 结合域偶联Fok I,形成了第一代基因编辑技术即锌指核酸酶技术(Zinc finger nucleases,ZFNs)[10-12]。但由于锌指蛋白的种类有限,使其可识别并切割的DNA 序列不多,而且其操作复杂、成本高,极大地限制了ZFNs 的应用。
之后人们发现,植物病原体黄单胞菌分泌的TALE 蛋白能够特异性识别DNA 序列中的一个碱基,于是TALE 蛋白替代锌指蛋白,形成了第二代基因编辑技术即转录激活因子样效应核酸酶技术(Transcription activator-like effector nucleases,TALENs),并且在2010 年首次应用于植物中[13]。虽然TALENs 比ZFNs 操作简单,但是TALENs 仍然需要在TALE 蛋白中构建复杂的串联重复表达单元,这也在一定程度上限制了TALENs 的应用。
最近,一种新型基因编辑系统成簇的规律间隔短回文重复序列(Clustered regularly interspaced short palindromic repeats/CRISPR)相关核酸酶系统(CRISPR/Cas),以其实验操作简单、高效切割靶位点等优势,迅速取代了前2 代基因编辑技术,成为第三代基因编辑技术[14]。该技术利用一段向导RNA和配套的核酸酶,对特定的基因组DNA 序列进行精准修饰,已经在动、植物基因组编辑中得到广泛应用。
2.2 CRISPR/Cas9 基因编辑系统介绍
CRISPR/Cas 基因编辑系统是真细菌和古细菌为了抵御外界病毒或噬菌体的侵入,通过切割外源DNA 来保护其不受病毒或噬菌体等核酸的侵袭而形成的自身免疫系统[15],其是由前导序列(Leader sequence)、CRISPR 序列和一组Cas 基因家族共同组成。其中,前导序列负责启动转录形成CRISPRRNA(crRNA);CRISPR 序列则是由一些高度保守的正向重复序列(repeat)和非重复间隔序列(spacer)交替排列组成(spacer 是病毒、噬菌体等核酸侵入后的痕迹,赋予细菌对相应病毒、噬菌体的免疫防御能力);Cas 基因家族编码多种Cas 蛋白形成复合体,起着核酸酶切割修饰作用,防御入侵的外源遗传物质[16-17]。CRISPR/Cas 系统基于CRISPR 序列和Cas 蛋白种类的不同,可以分为3 种类型:I 型、II 型和III 型。其中,I 型和III 型系统较为复杂,需要多个Cas 蛋白参与才能完成切割活性;而II 型系统较为简单,只需一个Cas9 蛋白即可完成对特定外源DNA 的切割[18]。
目前,应用最为广泛的CRISPR/Cas9 基因编辑系统就是在II 型系统基础上经过遗传工程改造获得的。改造后的CRISPR/Cas9 系统由sgRNA(single guided RNA)与Cas9 蛋白2 个部分组成,通过人工设计特异的sgRNA,识别靶标DNA 序列,引导Cas9蛋白对其进行切割,Cas9 蛋白的HNH 结构域特异性识别与crRNA 互补的模板链并进行切割;RuvC结构域切割另一条非互补链,最终导致双链断裂。切割过程还需要在靶标DNA 序列上有一段保守的前间隔序列邻近基序(Protospacer adjacent motif,PAM),sgRNA 与PAM 序列共同决定CRISPR/Cas9对靶位点结合的特异性[19]。通常在进行植物基因组编辑时,一般将sgRNA、Cas9 基因和筛选标记基因这3 个表达框同时构建到双元载体的T-DNA 区。如果在双元载体的T-DNA 区中构建多个sgRNA表达框,就可以同时对基因组上的多个靶位点进行编辑[20]。
2.3 CRISPR/Cas9 基因编辑系统的优势
CRISPR/Cas9 基因编辑系统作为一项新兴技术,与传统转基因技术相比,具有几个方面的优势:一是CRISPR/Cas9 系统能够在基因组DNA 水平上实现对靶标基因的定点敲除,从而彻底抑制靶标基因的转录与表达,并且可以稳定遗传。二是CRISPR/Cas9 系统不仅可以同时对多个靶位点进行编辑,而且还可以实现对靶位点的精确修饰。三是CRISPR/Cas9 系统可以实现基因编辑位点和筛选基因、报告基因的分离,通过后代筛选去除这些外源基因[21]。四是经过CRISPR/Cas9 系统改良的作物新品种,与自然突变材料一样,在生产应用上更为安全,因而人们更容易接受[22-23]。
3 CRISPR/Cas9 基因编辑系统在作物育种中的应用
目前,许多科研团队相继开发了多种高效的CRISPR/Cas9 载体系统,为推动该系统在作物育种中的应用提供了坚实的理论依据和技术保障。CRISPR/Cas9 基因编辑系统现已在拟南芥[24-25]、小麦[26]、玉米[27]、水稻[28-29]、烟草[30-31]等多种植物中实现了定点基因组编辑,用于改善作物的多种性状,包括抗病、抗逆、抗除草剂、产量水平以及营养价值等。
3.1 目标基因的敲除
由于双链断裂修复方式中同源重组的发生概率很低,所以CRISPR/Cas9 基因编辑系统目前应用最为广泛的就是目标基因的敲除,并且可以同时对多个目标基因进行敲除。2013 年8 月,在《Nature Biotechnology》期刊报道了2 篇有关CRISPR/Cas9系统在模式植物拟南芥和烟草上获得成功应用的研究[32-33];2014 年10 月,在《Nature Protocols》期刊又报道了1 篇CRISPR/Cas9 系统在水稻和小麦上实现目标基因的敲除的研究[34]。LI 等[32]定点敲除了模式植物拟南芥中的3 个基因AtPDS、AtFLS 以及AtRACK,并且植株的突变效率达到26%~84%。NEKRASOV等[33]定点敲除了本生烟中的基因NbPDS。SHAN 等[34]定点敲除了水稻中的4 个基因OsPDS、OsMPK2、OsBADH2 和Os02g23823,其中,敲除水稻OsPDS 基因后的突变体呈现矮小白化的表型性状。此后,CRISPR/Cas9 系统在其他植物中也得到了广泛应用。WANG 等[35]同时敲除小麦3 个同源基因TaMLO 后获得的突变体对白粉病表现出较强的抗性。WANG 等[36]在水稻中靶向OsERF922 基因诱导突变,提高了水稻对稻瘟病的抵抗能力。LI 等[37]通过靶向敲除玉米ZmTMS5 基因,获得具有热敏雄性不育性状的玉米新材料。SHI 等[38]对玉米乙烯反应的负调控因子ZmARGOS8 基因的启动子区域进行基因编辑,提高了玉米的抗旱性。
3.2 目标基因的定点替换或敲入
利用测序技术和关联分析对一些作物基因组中的优异变异位点进行鉴定之后,CRISPR/Cas9 基因编辑系统通过定点替换为利用这些优异变异位点提供了可能。SVITASHEV 等[39]利用CRISPR/Cas9系统对玉米ZmALS2 基因进行精确替换,使编辑后的玉米材料具有了除草剂抗性。SUN 等[40]对水稻中淀粉分支酶OsSBEIIb 基因进行了精确替换,使得水稻的直链淀粉含量增加。LI 等[41]在水稻中对内源基因OsEPSPS 实现了基因替换,效率为2.0%。利用CRISPR/Cas9 系统还可以在植物基因组中定点高效地敲入目标基因。WANG 等[42]利用CRISPR/Cas9系统和双生病毒载体系统,对水稻进行了外源基因的定向敲入,其效率达到19%,这是一种简单而且高效的外源片段定点敲入方法,为基因功能研究和作物精细育种提供了新的研究手段。
4 CRISPR/Cas9 基因编辑系统的展望
尽管CRSPR/Cas9 基因编辑系统在作物基因工程育种中取得了一定的理论和实践成果,但其仍存在一些亟待解决的问题。一是在切割过程中,与靶位点序列高度相似的其他位点也有可能被切割,引起非靶位点的突变,造成脱靶效应。二是Cas9 蛋白能够识别的PAM序列主要是经典的NGG,使得基因编辑的范围有限。三是双链断裂的修复方式中同源重组效率较低,难以实现高效率的大片段插入或精准的碱基替换。四是许多植物仍然没有成熟高效的遗传转化体系,限制了该系统在该种植物上的研究与应用。五是虽然目前许多植物的基因组测序工作已经完成,但是许多决定重要农艺性状的主效基因以及与重要农艺性状相关联的优异变异位点仍然没有被完全挖掘与鉴定,这也在一定程度上限制了该系统的应用。针对上述问题,科学家们也在不断发展与完善这项技术,如提高sgRNA 序列特异性,有效降低脱靶效应,提高编辑效率;通过对Cas9蛋白进行改造,使其识别不同的PAM序列,扩大编辑范围;另外,选择适合于目标生物的启动子,保证高效驱动Cas9 蛋白和sgRNA 的转录。
基因编辑技术是继转基因技术之后在生物遗传操作领域的又一项新技术。伴随着测序技术的不断发展以及测序成本的不断降低,许多作物的基因组测序工作已经完成,这为基因组编辑改良作物提供了便利。CRISPR/Cas9 基因编辑系统具有成本低廉、周期短、载体构建简单、编辑效率高等特点,为作物的遗传改良提供了新的思路。利用CRISPR/Cas9 基因编辑系统定点敲除不良基因,从而对作物的目标性状进行精准改良,将会大大提高定向遗传改良的效率。CRISPR/Cas9 基因编辑系统将会在植物基因工程育种研究领域发挥更为广泛而重要的作用。