APP下载

CRISPR/Cas9技术在小麦育种中的应用进展

2021-01-25曹巧史占良张国丛班进福郑树松傅晓艺张士昌何明琦韩然高振贤

生物技术进展 2021年6期
关键词:碱基突变体基因组

曹巧,史占良,张国丛,班进福,郑树松,傅晓艺,张士昌,何明琦,韩然,高振贤*

1.石家庄市农林科学研究院,石家庄050041;

2.中国科学院遗传与发育生物学研究所,北京100101

靶向突变或对基因组进行精确的改变是生物学研究的重点,过去10年,锌指核酸酶(zinc-finger nucleases,ZFNs)[1]、TAL效应子核酸酶(transcription activator like effector nucleases,TALENs)[2]和成簇规律间隔短回文重复(clustered regularly interspaced short palindromic repeats/CRISPR-associated nuclease 9,CRISPR/Cas9)[3]对应的3种基因组编辑技术得到迅速发展,这些系统以类似方式在基因组中产生位点特异性双链断裂(double strand breaks,DSBs),诱导生物体通过非同源末端连接(non-homologous end joining,NHEJ)或同源重组(homology-directed repair,HDR)的方式修复DSBs。在修复过程中NHEJ在酶切位点发生碱基插入或缺失(insertions/deletions,Indels),当人为提供同源供体DNA时,HDR可实现对基因组DNA的定点替换[4]。ZFNs和TALENs具有识别DNA特异序列和切割DNA靶序列的限制性内切酶两种功能结构域,已成功应用于多种植物[1-2]。相比之下,CRISPR/Cas9系统由一个短引导核糖核酸(small guide RNA,sgRNA)和条件性脱氧核糖核酸酶Cas9组成[3],sgRNA 5′端的20个核苷酸引导Cas9/sgRNA复合体沿着染色体脱氧核糖核酸寻找目标,直至完全匹配。如果染色体上存在一个NGG三核苷酸-原间隔基序(protospacer adjacent motif,PAM)位于靶位点的下游,则会引起Cas9构象变化,激活Cas9两个独立的核酸酶结构域并导致靶位点的切割[5],目前CRISPR/Cas9系统已广泛运用于植物研究中。

小麦基因组编辑技术和遗传转化系统的发展使小麦进入了基因改造时代,然而由于小麦基因组的复杂性和遗传转化效率低,小麦基因组编辑的进展仍落后于其他农作物。目前,小麦基因组编辑的研究主要集中于破坏基因,关于基因打靶和碱基编辑的报道仍较少。TALENs和CRISPR/Cas9技术已成功应用于小麦基因编辑中,尤其是CRISPR/Cas9基因编辑技术,因系统的简便、高效等特点应用最广泛,占比高达92.86%[6]。本文主要综述了CRISPR/Cas9基因编辑技术在近代小麦新品种培育中的成功实践,对前人的育种工作进行归纳,以期为未来育种工作提供参考,促进优良小麦品种的持续更新和产业的健康发展。

1 CRISPR/Cas9基因编辑技术的发现

早在1987年就有研究者在细菌DNA中鉴定出CRISPRs[7],但直至2007年CRISPRs才 被证明与Cas蛋白联合提供免疫力[8]。2011—2012年人类最初在细菌和古细菌中发现了CRISPR/Cas9系统通过CRISPR-RNAs(crRNAs)介导入侵核酸的沉默,从而为细菌和古细菌提供了针对病毒和质粒的适应性免疫[9-10]。之后,5个独立的研究小组将该基因编辑系统运用于动物中[11−15]。2013年有研究者首次利用CRISPR/Cas9系统在模式植物拟南芥、烟草和水稻开展基因编辑研究[16-17]。截至目前共发现有3种类型CRISPR/Cas系统(typeⅠ、typeⅡ和typeⅢ)[18-19],其中Ⅰ型和Ⅲ型CRISPR/Cas系统存在共同点:特异的Cas核酸内切酶处理pre-CRISPR-derived RNA(pre-crRNA)一旦成熟,每个crRNA组合成一个大型多Cas蛋白复合物,该复合物识别并切割与crRNA互补的核酸序列;相比之下,Ⅱ型CRISPR/Cas系统通过一种不同的机制处理pre-crRNA,利用tracrRNA(atrans-activating crRNA)与pre-crRNAs中的重复序列互补,同时在Cas9存在时触发双链RNA特异核糖核酸酶RNaseⅢ活性[20],Cas9被认为是唯一负责crRNA引导的外源DNA沉默的蛋白质[21]。目前经过改造的Ⅱ型CRISPR/Cas系统已成为一个高效、简便的基因编辑工具,并在微生物、植物和动物基因功能研究和遗传改良中得到广泛应用[22]。

2 CRISPR/Cas9基因编辑技术的原理

成熟的crRNA与反式激活crRNA(transactivated crRNA,tracrRNA)碱基配对形成一个双RNA结构,该结构引导CRISPR相关蛋白Cas9触发靶DNA双链断裂[3]。Cas9是一种DNA特异性的核酸内切酶,Cas9蛋白在整个细菌界均较丰富,但序列和大小差异较大,所有已知的Cas9酶均含有一个HNH结构域,该结构域切割与sgRNA序列互补的DNA链(靶链),以及一个RuvC核酸酶结构域,该结构域切割非互补链(非靶链),产生双 链DNA断 裂(double strand break,DSB)[23]。Jinek等[5]研究了2种主要Cas9酶亚型2.6和2.2埃分辨率的晶体结构,揭示了所有Cas9家族成员共有的核心结构,结构中含一个结合核酸的裂缝,单粒子电子显微镜重建显示,形成裂缝的两瓣类似钳状,当sgRNA与Cas9结合后诱导结构重塑,形成一个中心通道,与DNA底物结合。Cas9广泛的结构重塑发生于与靶DNA双链结合之前,暗示sgRNA的装载是Cas9激活的关键步骤。使用CRISPR/Cas进行基因组编辑时,含部分双链tracrRNA:crRNAs被设计成sgRNAs,sgRNAs保留了2个关键特征,5′端与靶DNA互补,3′端与Cas9蛋 白结 合[24]。CRISPR/Cas结 合和 切 割DNA均需要识别一个短的三核苷酸原间隔基序(protospacer adjacent motif,PAM),DNA异源双链形成始于PAM,并向靶序列的远端方向进行,与PAM的相互作用触发Cas9的催化活性[25],导致DSBs,进而诱导生物体通过非同源末端连接(non-homologous end joining,NHEJ)或同源重组(homology-directed repair,HDR)修复DSBs,完成基因编辑过程。

3 CRISPR/Cas9基因编辑技术的优缺点

使用传统育种方法在多倍体农作物,如甘蔗、棉花、小麦和马铃薯中引入理想性状是一项具有挑战性且耗时的工作,此外多倍体植物中用传统育种方法进行多性状的渗入和代谢改变也较困难。CRISPR/Cas基因组编辑技术与传统的育种方法相比优势明显,可同时靶向多个基因或代谢途径,而不产生任何连锁冗余。如CRISPR/Cas9可有效用于编辑多个目的基因,已被开发用于在小麦中产生对白粉病的广谱抗性[26];且还用于棉花[27]、邓肯葡萄柚[28]和马铃薯[29]多倍体农作物中产生突变。

Cas9蛋白的脱靶活性是CRISPR/Cas基因组编辑的主要问题,因Cas蛋白可以编辑任何与其sgRNA约5个错配的DNA序列[30],但在大多数情况下,Cas9/sgRNA不能识别与sgRNA错配大于3的DNA序列[24]。尽管在植物中观察到的脱靶活性处于表面水平,但仍需要开发直接的方法以克服脱靶效应,确保Cas9编辑的特异性。CRISPR/Cas9试剂的一些特性已被证实与Cas9的脱靶倾向有关。有报道表明Cas9/sgRNA不能识别和编辑PAM位点10~12 bp范围内不匹配的DNA位点,Cas9蛋白质对NGG-PAM的亲和力高于NAG-PAM[31]。根据以上结果设计了几种策略以降低高离标率:①选择GC含量较高(大于70%)的目标位点[32];②截短sgRNAs,使目标互补区长度小于20个核苷酸,在不降低目标基因组编辑效率的情况下,降低偏离目标部位的意外突变(≥5 000倍)[33];③Cas9催化亚基的突变(RuvC中的D10A和HNH中的H840A)使Cas9转化为DNA切刻酶,2个Cas9切刻酶与一对与靶基因座互补的sgRNAs可以介导DSB,有效降低脱靶[34]。随着测序发展和生物信息学软件工具的开发,以及对Cas9的不断改良,可以明显提高编辑效率,降低脱靶造成的不利影响[24]。

4 CRISPR/Cas9基因编辑技术在小麦中的应用

CRISPR/Cas9是目前小麦中应用最广泛的基因编辑技术,其较ZFNs和TALENs具备以下5个明显优点:①CRISPR/Cas9系统只有Cas9蛋白和sgRNA两个简单组分,而ZFNs和TALENs均为嵌合核酸酶,含有FokI切割和DNA结合两个结构域,且以二聚体的形式发挥作用;②CRISPR/Cas9系统通过sgRNA借助碱基配对将Cas9招募到靶向DNA序列,而ZFNs和TALENs需要借助蛋白和DNA的相互作用;③Cas9的目标大小仅为20 bp,而ZFNs和TALEN为40 bp;④同时对多个基因进行基因编辑时CRISPR/Cas9系统较ZFNs或TALENs更高效、省时[14];⑤用于CRISPR/Cas9系统的质粒较ZFNs和TALENs系统易于组装。鉴于以上原因使CRISPR/Cas9成为全世界最流行的基因组编辑技术。

4.1 农杆菌介导的CRISPR/Cas9系统

目前农杆菌介导的遗传转化是将CRISPR/Cas9 DNA组分输送到植物中最重要和最常见的方法[35]。2018年前小麦获得基因编辑后代植株的基因组编辑系统多是通过粒子轰击法实现遗传转化的[36-37],但其在将载体骨架上的大片段DNA共转移时易导致高频的转基因沉默事件发生[38]。相比之下,农杆菌介导的遗传转化因待转移的DNA片段被限定在双元载体中的左右边界,通常在转移DNA(transfer DNA,T-DNA)时只产生简单的插入,降低了转基因沉默频率[39]。随着小麦中农杆菌介导转化效率的提高[40]和可用于转化的受体小麦基因型范围扩大[41],使其在小麦基因组编辑中成为一种更有前景的转运遗传物质的手段。Zhang等[42]成功地构建了农杆菌介导的CRISPR/Cas9系统,在4个籽粒调控相关基因中分别产生靶向突变,转基因保持活性并持续诱导T1代和T2代的位点特异性突变。

4.2 影响CRISPR/Cas9基因编辑的因素

CRISPR/Cas9系统无论采用粒子轰击法还是农杆菌介导的遗传转化进行基因编辑时,均需要先将构建好的载体进行原生质体转化,并对其转化效率进行评价,进而选出构建的最佳载体进行后续愈伤组织的转化试验。Zhang等[42]通过将构建的pOsUbi-GFP、pUC-35S:GFP+1载体转染小麦原生质体后进行荧光比较,发现绿色荧光蛋白(green fluorescent protein,GFP)中1 bp的插入导致GFP无法表达,当pTaU6.1-gGFP、pTaU6.2-gGFP、pTaU6.3-gGFP、pTaU6.5-gGFP分别与ZmUbi-Cas9-GFP共同转化小麦原生质体时会对GFP进行基因编辑,导致荧光发生变化,荧光经过标准化校正后发现U6启动子引导的sgRNA编辑效率为47.4%~68.5%。表明构建含有不同启动子的sgRNA载体转化小麦原生质体时,对基因的编辑效率存在明显差异,因此小麦中构建农杆菌介导的CRISPR/Cas9系统进行遗传转化时,选用sgRNA的高效率启动子有利于提高基因编辑效率。Wang等[43]在TaGW7基因的前3个外显子内共选择了8个靶位点,利用CRISPR/Cas9编辑系统对其进行基因编辑,3个同源基因(TaGW7⁃A1、TaGW7⁃B1和TaGW7⁃D1)中有7个目标位点是保守的,GW7T4靶基因仅在TaGW7⁃B1和TaGW7⁃D1之间是保守的,通过构建载体转化原生质体和下一代测序对每个gRNA靶点的效率进行评估,结果发现基因编辑效率为0.10%~10.94%,其中GW7T6效率最高,而GW7T4效率最低。表明靶点位置的选择显著影响CRISPR/Cas9系统在小麦中的基因编辑效率,在六倍体小麦中同时实现对3个等位基因的编辑时应优先选取保守序列作为靶位点。

4.3 CRISPR/Cas9基因编辑效果

CRISPR/Cas9基因编辑系统通过产生DSBs,进而诱导生物体修复DSBs,此时导致的突变多为缺失和插入突变。如部分遗传易感个体在摄入小麦醇溶蛋白时引发乳糜泻,其是一种自身免疫性疾病,Sánchez-León等[36]利用CRISPR/Cas9技术获得α-醇溶蛋白突变体,这些突变体中碱基变化范围在−126~+158 bp,在一个已经鉴定出45个不同野生型α-醇溶蛋白基因的小麦品系中,使多达35个基因发生了突变,从而使该突变体小麦的免疫反应性降低了85%。GW2基因是谷类作物粒重的一个关键遗传决定因素,在六倍体普通小麦中有3个 同 源 基 因(TaGW2⁃A1、TaGW2⁃B1和TaGW2⁃D1),Zhang等[44]利用CRISPR/Cas9技术获得缺失1个(B1或D1)、2个(B1和D1)或3个(A1、B1和D1)TaGW2同源基因的基因编辑突变体,结果发现来自不同基因组的TaGW2的单拷贝突变的小麦植株,其粒径和千粒重(thousand-grain weight,TGW)均呈上升趋势;双同源突变体表现出比单基因组突变体更高的表型变异;在三重突变体中粒径和TGW的增加幅度最大。Singh等[45]利用CRISPR-Cas9技术在Ta⁃Ms45基因的A、B和D同源序列中产生突变,最终导致花粉发育中止,实现雄性不育。Abe等[46]利用农杆菌介导的CRISPR/Cas9技术研究了小麦中控制种子休眠的Qsd1同源等位基因,获得了多重突变,延长了种子的休眠期,并降低了小麦穗发芽率。以上均是CRISPR/Cas9基因编辑系统在小麦中进行实践的成功案例,随着该技术的不断成熟,未来会有越来越多的对人类有益的小麦基因编辑突变体产生,也更有利于对小麦基因功能进行解析。

4.4 CRISPR/Cas9基因编辑的发展

新开发的高效胞嘧啶脱氨酶介导了胞嘧啶转化为胸腺嘧啶,在疾病治疗和农艺性状改良方面具有巨大应用潜力[47],扩大编辑更多的DNA核苷酸需额外的碱基编辑工具,如嘌呤碱基的替换或嘌呤和嘧啶之间的颠换。Zong等[48]将改良的tRNA腺苷脱氨酶与核酸酶灭活的CRISPR/Cas9融合,首次在小麦中实现将靶点目标腺嘌呤转化成鸟嘌呤。高效的碱基编辑效率,低插入缺失突变和高纯度产品使该植物的腺嘌呤碱基编辑器(adenine base editor,ABE)表现优于CRISPR/Cas9系统中HDR介导的基因组编辑。Zong等[48]通过优化tRNA腺苷脱氨酶相对于nCas9的位置、核定位信号(nuclear localization signal,NLS)的数量和位置以及不同形式的sgRNA,发现腺苷脱氨酶ecTadA-ecTadA*置于nCas9氨基末端,3个NLSs置于nCas9碳端,并搭配esgRNA使得ABE在小麦中的编辑效率最高。该ABE系统仍有进一步优化和扩展的可能,如可以使用生物技术改造Cas9识别不同的PAM,扩展目标的位点数量[49]。

Lin等[50]基于CRISPR/Cas9系统开发的Prime editor在小麦中实现点突变、插入和缺失,较碱基编辑系统可以创制更多的突变类型。Prime editors是CRISPR-Cas9切口酶和逆转录酶相融合,经过改造的向导RNA(prime editing guide RNAs,pegRNA)与Prime editors蛋白结合,基因编辑过程中不涉及供体DNA或双链断裂。Lin等[50]通过对密码子、启动子和编辑条件的优化,开发了用于小麦的Prime editor,小麦原生质体基因编辑的效率约为1.4%。目前该方法在小麦中转化效率较低,仅限于原生质体的瞬时表达研究,尚未获得基因编辑的小麦植株。

5 展望

虽然基因编辑技术在小麦上已经有了发展路线,但仍有许多方面需要改进以提高小麦的生产力。①基因编辑过程中涉及的农杆菌介导遗传转化对小麦基因型具有依赖性。虽然已有15个中国商品小麦品种被农杆菌成功转化,但大多数基因型的转化效率较低,如济麦22、矮抗58、轮选987和京411[51],因此,在小麦遗传转化中,需克服基因型依赖性;②虽然CRISPR/Cas9相关技术因其高效、特异、简单和多功能而被广泛用于小麦基因组编辑,但通常Cas9识别的PAM为NGG,限制了其目标范围,尤其对于碱基编辑器,单个碱基的变化有时不能使氨基酸改变。水稻中已经开发出SpCas-NG,可以识别的PAM为NG、NTG、NTT和NCG,可明显提高基因编辑效率。但小麦中尚未见相关报道,因此,扩大PAM兼容性对小麦基因组编辑具有重要意义;③获得无转基因的基因编辑小麦植株。无转基因的基因编辑小麦植株与传统射线诱变获得的突变体相似,无任何载体序列,但目前小麦中多借助载体进行遗传转化,需要在后代中对是否含有载体片段进行检测。有研究者将预组装的TALENs蛋白、CRISPR/Cas9核糖核蛋白或其mRNA递送到植物细胞中,获得了不含转基因的基因编辑植物[52-53],但由于组织培养过程中不存在选择压力,直接将TALENs或Cas9蛋白输送至小麦细胞中低效且费力。采用RNA病毒做为载体完成DNA转运可以获得无转基因的基因编辑小麦,Choi等[54]已成功利用被修饰的小麦条纹花叶病毒携带异源编码序列,实现蛋白质在小麦中的表达。将来需要科研工作者研发出将CRISPR/Cas9转至到小麦中的高效病毒载体,获得无转基因的基因编辑小麦植株,以广泛应用于商业化生产。

猜你喜欢

碱基突变体基因组
盐胁迫对水稻耐盐突变体sst芽苗期生长的影响
牛参考基因组中发现被忽视基因
航天搭载小麦株高突变体研究初探
科学家找到母爱改变基因组的证据
应用思维进阶构建模型 例谈培养学生创造性思维
血清HBV前基因组RNA的研究进展
烟草叶形突变体的形态特征与关键基因表达差异研究
中国科学家创建出新型糖基化酶碱基编辑器
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员