APP下载

CRISPR/Cas9 基因编辑体系及其在作物育种中的应用

2022-11-25冯留锁任帅朱旭玲卢文燕王雅丽范永胜

关键词:结构域作物蛋白

冯留锁,任帅,朱旭玲,卢文燕,王雅丽,范永胜

(1.新乡市农业科学院,河南 新乡4 53000;2.河南农业大学农学院,国家小麦工程技术研究中心,河南郑州 450046;3.河南女子职业学院,河南 郑州 450000)

民以食为天,粮食安全的重要性一直倍受关注.特别是近年来,极端气候频发以及洪涝、干旱等灾害影响,粮食生产面临极大威胁,并且由于全球工业化进程加速,可利用耕地面积不断缩小,农药、化肥过度施用导致环境污染以及水资源匮乏.另外,世界人口不断增加,据资料显示,全球人口2050 年预计达到96亿,这要求相应食物供给比现在要提高100%~110%才能保证供应[1].因此,如何扩大粮食生产和保障粮食安全是全世界亟待解决的问题.

人类在漫长的农业生产过程中积累了丰富的育种经验.杂交育种、突变体育种、转基因育种是传统育种中最常用的技术.杂交育种通过遗传重组的方法将优良基因导入待试品种,在后代中筛选出优良基因性状,这个过程需要花费较长时间.由于长期进行正向选择的结果,许多优质基因形成连锁群,遗传多样性减少,这在一定程度上加大了遗传重组的难度,使得改变额外性状尤为困难.突变体育种利用化学物质或物理射线使基因组发生遗传变异,但由于突变位点的随机性,需要筛选数目庞大的突变群体才能获得理想的基因型.上述两种方法耗时长,而且消耗极大的人力、物力和财力,已不能满足现代育种的需求[2].转基因育种虽然可以打破生殖隔离,将外源基因导入所需品种,但是由于公众的反对和担忧,使得转基因品种商业化进程缓慢.因此,开发效率高、耗时短、安全可靠的育种技术成为现代育种的需求.

1 CRISPR/Cas9 基因编辑体系的优点

自从1988 年首例基因定点诱变技术在烟草原生质体中成功开展后[3],科学家们开始大规模研究基因定点诱变技术的应用1993 年,PASZKOWSKI 发现DNA 双链缺口可以增加定点突变效率[4],2005 年,锌指核酸酶(ZFN)在烟草中开发出来并迅速拓展到其他作物[5],2010 年,转录激活类效应物核酸酶(TALENs)在烟草和拟南芥基因编辑中获得成功[6].虽然这些方法在作物育种中取得较大进展,由于它们自身存在缺陷, 如ZFN 同其靶序列的对应性并不特异, 容易产生脱靶效应;TALEN 技术虽然特异性高,脱靶效应较低,但TALEN 蛋白较大,并且序列重复性强,同时编辑多个基因过程繁琐,而且编辑效率偏 低 , 导 致 该 技 术 目 前 在 作 物 育 种 中 未 能 实 现 大 规 模 应 用 .

2013 年,世界上3 个独立的实验室分别报道利用CRISPR/Cas9 技术在水稻、小麦、烟草和拟南芥中成功进行基因编辑[7-9],报道CRISPR/Cas9 技术成本低廉、简单易操作,突变不同的靶位点时仅需重新设计、合成与靶序列互补的sgRNA,而不需要更换Cas9 核酸酶.自此以后,科学家们利用CRISPR/Cas 基因编辑技术对许多作物进行了定点改造.此外,CRISPR 体系也在不断研发升级,例如新的Cpf1 核酸酶代替Cas 酶体系[10]以及单碱基编辑技术[11-12]等,这使得CRISPR/Cas 系统成为一种广泛采纳的、成本低廉且易于操作的基因编辑手段而倍受青睐.

2 CRISPR/CAS 体系的原理

2.1 CRISPR/CAS 体系组成

CRISPR/CAS 体系最早是由细菌和古细菌中RNA 介导的免疫体系开发而来.当噬菌体或外来入侵DNA 进入细菌或古细菌细胞后,细菌和古细菌利用自身编码的核酸酶产生相应抵御机制将入侵的遗传物质切除.因此,CRISPR/CAS 体系包含两个重要核心:CRISPR 重复间隔序列和Cas 蛋白家族.CRISPR重复间隔序列由一系列高度保守的重复序列(Repeat)与间隔序列(Spacer)相间排列组成.其中CRISPR重复间隔序列起靶向作用,Cas 蛋白家族起核酸酶切割作用[13-14].

根据Cas 基因核心元件序列的不同,CRISPR/Cas 可以分为Ⅰ型、Ⅱ型和Ⅲ型系统.这3 类系统又可以根据其编码Cas 蛋白而分为更多的亚类.Ⅰ型和Ⅲ型CRISPR/Cas 免疫系统需要多个Cas 蛋白形成复合体切割DNA 双链,而Ⅱ型只需要1 个Cas9 蛋白.Cas9 蛋白包含氨基端的RuvC-like 结构域及位于蛋白中间位置的HNH 核酸酶结构域,HNH 核酸酶结构域切割与单导向RNA (sgRNA)互补配对的模板链,RuvC-like 结构域对另1 条链进行切割.切割位点位于原型间隔序列毗邻基序(PAM)上游3nt 处.自2012 年起,人们优化了Ⅱ型CRISPR/Cas 系统,利用Cas9 蛋白和sgRNA 构成简单的sgRNA/Cas9 系统[6,15],使其能够在真核生物中发挥类靶向切割DNA 的作用.Cas9 蛋白与sgRNA 结合形成RNA-蛋白质复合体,共同完成识别并切割DNA 靶序列的功能.其中,Cas9 蛋白作为核酸酶切割双链DNA,而sgRNA 则通过碱基互补配对决定靶序列的特异性.

2014 年,链球菌(Streptococcus pyogenes)和放线菌(Actinomycesnaeslundii)Cas9 蛋白的三维晶体结构被解析出来[16-17].结果发现,Cas9 家族的成员具有相同的核心结构域,该结构域可以裂开两瓣形成钳状,一瓣负责目标识别,另一瓣具有核酸酶活性能切断DNA.两瓣中间有1 个带正电的沟槽,可以容纳sgRNA:DNA 异源双链分子.目标识别瓣对于结合sgRNA 和DNA是必须的,而核酸酶瓣包含HNH 和RuvC核酸酶结构域,它们所处位置恰好可以分别切开一条DNA 链.Cas9 蛋白单独存在时处于非活性状态,但与sgRNA 结合后,它的三维结构会经历剧烈的变化,允许Cas9 与目标DNA 结合.这一结构可以帮助改良Cas9 核酸酶,设计不影响其功能的小Cas9 突变体,使其更适合基础研究和基因工程.

2.2 CRISPR/CAS 基因编辑原理

CRISPR 基因编辑的一个主要特点是在基因组特异位置处创造DNA 双链断裂(DSBs),随后形成的双链断裂可以通过两种方式修复:非同源末端连接(NHEJ)和同源重组(HDR).修复的过程可以引入突变.通过NHEJ 方式,断裂的染色体会重新连接,但往往是不精确的,断裂位置会产生少量核苷酸的插入或删除,从而产生基因敲除突变体;通过HDR 方式,在引入同源序列的情况下,以同源序列为模板进行合成修复,从而产生精确的定点替换或者插入突变体[18].在这两种途径中,NHEJ 方式占绝对主导,可以发生在几乎所有类型的细胞以及不同的细胞周期中(G1、S 和G2 期);而HR 发生频率很低,主要发生在S 和G2 期[19].

2.2.1 NHEJ 介导的基因编辑NHEJ 方式修复可以发生在细胞周期的任何时间,并且不需要同源DNA 链作为模板,因此在修复过程中起主导作用.大多数基因编辑产生的突变都是由NHEJ 方式修复产生的,它可以引入小片段的插入和缺失.利用NHEJ 修复方式,人们可以利用一个简单的Cas9 蛋白和多重序列的sgRNA 创造多位点突变,并且这种突变方法已经应用到许多作物[20-21].

2.2.2 HR 介导的基因编辑 HR 介导的基因编辑方式相对于NHEJ 要更加精准.HR 方式可以精确地在基因组特定位点创造点突变,也可以引入或替换人们需要的核苷酸序列[22].HR 修复方式一般在细胞的S和G2 周期,需要一个与断裂位点同源的DNA 作为修复模板.修复模板可以是同源染色体的姐妹染色单体或外源单链DNA,如果外源单链DNA 模板上存在突变信息,经过HR 修复以后,在相应断裂位置处就引入了突变.

HR 方式的基因编辑目前主要应用于动物基因改造,植物上的应用还很少.主要因为植物上的HR 编辑方式效率很低;另一个原因可能是植物有特殊的细胞壁结构,不利于供体DNA(同源模板序列)在植物细胞中运输.尽管如此,人们还是开发了在植物中具有较好的HR 编辑系统,比如改用豆科植物的黄矮病毒以及小麦中的矮化病毒来转运供体模板DNA[23-24];另一种方法是构建sgRNA 和供体模板嵌合的载体.这两种方法都能提高HR 方式在植物中进行基因编辑的效率[25-26].

2.2.3 非双链断裂修复编辑方式 除了创造DBs 进行修复引起基因编辑以外,CRISPR/Cas9 还可以对基因表达进行调控,比如表观遗传修饰、基因表达抑制/激活、基因组成像等.

将转录抑制结构域(如KRAB、SRDX 等结构域)或转录激活结构域(如VP64,p65AD 和VPR 等结构域)与dCas9 融合,通过sgRNA 靶向特异位点,可以对特定基因进行抑制或激活[27].如Lowder 等利用这一方法在拟南芥中成功地对多重基因进行抑制.他们构建了pCo-dCas9-3X-SRDX 抑制载体并转入拟南芥中, 在转基因后代中观察到CLEAVAGE STIMULATING FACTOR64 基因和小分子RNA,miR159A、miR159B 在转化植株中表达量明显下降[28].相反,将dCas9 和转录激活结构域融合,可以极大地提高单基因或多基因的转录活性[29].此外,dCas9 还可以和表观遗传调控因子如组蛋白去甲基化酶LSD1、组蛋白乙酰化酶p300、交换易位蛋白等融合,以此改变相应位点上的表观修饰,造成特殊的染色质结构,从而调控基因表达的开关[30].将dCas9 和绿色荧光蛋白eGFP 融合,还可以观察着丝粒和端粒等特定位点上基因组构象[31-32].

3 基因编辑技术在作物育种中的应用

3.1 基因敲除改良作物性状

育种实践中,有的基因对性状起正向调控作用.有的则对性状起负向调控作用.因此,抑制负调控基因的表达来改良作物是作物育种上最简单和常用的手段.利用CRISPR/Cas9 方法将负调控基因敲除,获得想要的性状已得到大规模应用.主要体现在提高产量、增强品质、提高生物或非生物逆境抗性、加速杂交育种等方面.

3.1.1 提高产量 植物的产量一直是育种的重要目标.作物产量形成受很多因素影响,包括环境因素和自身遗传组成等.国内外育种家们将影响产量的负调控基因敲除,如编辑突变负调控穗粒数目基因(OsGn1a)、粒形基因(OsGS3)、粒质量基因(TaGW2,OsGW5,OsGLW2 以及TaGASR7 等)、穗形基因(OsDEP1,TaDEP1)和分蘖基因(OsAAP3)等都产生了理想表型,证明CRISPR-Cas9 突变编辑方法对作物改良是十分有效的[33-38].同时,敲除水稻中3 个负调控粒质量的基因(GW2,GW5 和TGW6)促使粒质量聚合,大大提高千粒质量[39].但是,由于产量因素的复杂性,有时单一敲除某一个基因在实际应用中并不能显著增加产量,HUANG 等[40]结合基因聚合分析,基因组测序以及CRISPR-Cas9 方法分析了影响产量形成的数量基因座,他们对绿色超级稻IR8 衍生的30 个亲本以及后代进行了测序,发现通过CRISPR-Cas9基因编辑后,57 个基因在所有高产品种中都有表达, 表型分析也验证了这些基因对产量有很高的贡献.该方法对今后寻找产量相关基因进行基因编辑提高作物产量提供了借鉴作用.

3.1.2 增强品质 品质受外界环境和众多遗传因素的影响,品质育种具有包含广、跨度大,育种目标多等特点.到目前为止,通过基因编辑技术改良作物品质主要包括以下几方面:①淀粉含量;②香度;③营养价值;④贮藏品质等.MA 和ZHANG 等[41-42]通过CRISPR-Cas9 方法敲除直链淀粉含量基因Waxy,极大提高了稻米的口感和蒸煮品质.DuPont 等[43]在玉米中也通过CRISPR-Cas9 方法敲除玉米Waxy 基因提高了玉米产量.相反,敲除支链淀粉基因SBEIIb 使水稻中直链淀粉含量提高,这对患有消化慢性疾病的特殊人群很有帮助[44].

香度是稻米的一个重要品质,香稻米不仅可以增加人们的食欲,还具有较高的营养价值.2- 乙酰1-1 吡咯啉是稻米香味中的重要组成物质,而甜菜碱乙醛脱氢酶2(BADH2)基因功能的缺失可以促进2-乙酰1-1 吡咯啉的生物合成.中国科学院遗传与发育生物学研究所高彩霞老师课题组通过基因编辑技术将水稻中的BADH2 基因敲除, 获得了和自然条件下badh2 突变体2-乙酰1-1 吡咯啉含量相当的水稻株系[45],并且进一步将中国水稻产区的30 多个主栽优良品种稻米香度都进行了改良,这对提高稻米香度具有重要意义.

面筋是谷物籽粒主要的蛋白组成形式.许多谷物作物(如小麦)面筋含量过高,导致西方国家人群(7%以上)对面筋敏感,表现出不同程度的消化疾病.α 上醇溶蛋白基因家族在小麦中具有100 多个成员,是面筋蛋白的主要组成部分,科学家们利用CRISPR-Cas9 方法设计出保守的sgRNA,并借此将小麦中α 上醇溶蛋白基因家族全部同时敲除,从而获得了低面筋蛋白的小麦品系,缓解了患有消化疾病人群对面筋不适应的矛盾[46].

3.1.3 提高生物或非生物胁迫抗性 生物或非生物逆境是造成作物产量和品质下降的最主要因素.在生物逆境方面,通过CRISPR-Cas9 基因敲除的方法,许多基因编辑作物都提高了逆境抗性,主要包括细菌、真菌、病毒等病原菌的感染以及昆虫取食等.例如,白粉病是一种毁灭性的真菌病害,通常可以造成作物绝产绝收.通过CRISPR-Cas9 基因敲除方法, 中科院遗传发育所WANG 等[47]将小麦中所有的6 个TaMLO 基因进行敲除,获得了极高抗白粉病的小麦品系[47].NEKRAAOV 等[48]也发现MLO 基因敲除的番茄较没有敲除的对照表现出对白粉病更高的抗性.稻瘟病可以导致水稻严重减产甚至颗粒无收.OsERF922 在水稻中编码一个乙烯响应因子类转录因子,人们将OsERF922 基因进行敲除,获得了对稻瘟病抗性的水稻品种[49].水稻细菌性枯萎病是由Xanthomonas oryzae pv.Oryzae 感染造成的,将OsSWEET13 基因的启动子利用CRISPR-Cas9 方法进行缺失, 可以大幅提升水稻对细菌性枯萎病的抗性[50].在病毒病抗性方面,人们利用CRISPR-Cas9 基因敲除方法,获得了广谱抗马铃薯y 病毒的黄瓜[51]、抗卷叶病的棉花[52].在抗虫方面,LU 等[53]最近发现敲除水稻OsCYP71A1 基因使5-羟色胺合成减少,导致水杨酸含量升高,进而提高对稻飞虱和钻心虫的抗性.

CRISPR-Cas9 技术也用来对非生物胁迫抗性的改良.敲除水稻中的OsARM1, OsNramp5 和OsHAK1 基因,育种家们分别获得了抗镉元素[54]、放射性铯元素[55]以及砷元素[56]的水稻品种.2018 年,科学家们将水稻中的3 个脱落酸受体基因PYL1/4/6 敲除,获得pyl1/4/6 三突变体,进一步对突变体分析发现,pyl1/4/6 不仅可以显著提高水稻产量,同时也抗极端高温和抑制穗发芽的发生[57].

3.1.4 加速杂交育种进程 作物杂种优势利用是提高粮食产量强有力的武器.杂种优势利用的前提必须有优良的雄性不育系,但许多优良品种是可育的.为解决这一难题,育种家们利用CRISPR-Cas9 方法创建了许多性状优良的不育系,比如水稻和玉米中的温敏不育系tm5[58],水稻中的光敏不育系csa[59],小麦中的光敏不育系ms45[60]等.杂种育性低是杂种优势利用的另外一个障碍,这种现象通常是由生殖隔离造成的,比如水稻中的籼、粳亚种,它们杂交后代几乎得不到种子.为了打破生殖隔离,育种家们在决定生殖隔离的Sa 基因位点上的SaF/SaM[61]以及S1 位点上的OgTPR1[62]基因进行了敲除.另外SHEN 等[63]也发现籼稻基因组上的Sc 基因1~2 个拷贝的敲除可以使籼、粳亚种杂交后代结实率大大提高.YU 等[64]研究发现将水稻中的致死基因ORF2 敲除,也大大提高了籼、粳亚种杂种结实率.最近,人们利用CRISPR-Cas9方法对有丝分裂和减数分裂过程进行调控,将水稻减数分裂过程的3 个关键基因REC8,PAIR1 和OSD1敲除,人们发现水稻不进行减数分裂而只进行有丝分裂.另外,他们将水稻卵母细胞中的BBM1[65]基因激活或将MTL 基因敲除,可以让水稻进行无性繁殖,这一试验成果使杂种F1 代异质性的长期维持变为现实,为杂种优势利用创造了极为便利的条件.

3.2 单核苷酸置换或插入改良作物性状

有些农艺性状是由单核苷酸改变引起的,这种单核苷酸的改变在分子水平上会造成基因表达的变化,或由于编码氨基酸的改变赋予基因新的功能.对基因精确的修饰和改变比如额外核苷酸的插入或替换能够不打破原有的连锁群而引入自然条件下不存在的基因型,大大加速了育种进程.但是,由于HDR修复方式不占主导地位,单核苷酸置换或插入技术还不是很成熟,它们在作物改良中的应用还十分有限.玉米中的ARGOS8 是基因编码乙烯反应中的一个负调控因子, 大部分玉米自交系中ARGOS8 基因表达量很低,SHI 等[66]设计通过HDR 修复方式在ARGOS8 启动子区利用CRISPR/Cas9 方法将GOS2 启动子引入并且驱动ARGOS8 的表达.基因编辑后的玉米自交系中ARGOS8 基因表达量上升,提高了玉米抗旱能力.YU 等[67]也通过CRISPR/Cas9 方法将ALC 基因编码框第317 位T 置换成A,将西红柿的生育期延长而提高了产量.

为了提高HR 修复方式效率,人们将双生病毒(geminivirus)DNA 的复制子构建到CRSPR 转化载体用以提高修复过程中同源模板数量,这种方法可以大幅提升编辑效率,并且在许多作物如土豆[68]、西红柿[24,69]、水稻[70]、小麦[23]以及木薯[71]中都获得了成功应用.2015 年CERMAE 等[24]利用双生病毒将35S启动子插入番茄ANT1 基因启动子上驱动ANT1 基因表达,插入效率提高近10 倍,高效表达的ANT1基因使番茄果实变紫,花青素含量提高.

3.3 单碱基编辑改良作物

研究表明,很多重要农艺性状都是由单核苷酸多态性(SNP:single-nucleotide polymorphism)决定的.单核苷酸变异可以位于基因编码区,也可以位于非蛋白编码区,如启动子和3’端非翻译区域.因此,单碱基编辑对作物遗传改良是非常有用的.单碱基编辑蛋白编码区域一个重要的应用是抗除草剂.抗咪唑啉酮和磺酰脲的水稻[11]、小麦[72]、拟南芥[73]和西瓜[74]都是由单碱基编辑ALS 基因获得.抗甲基化吡氟氯禾灵的水稻由单碱基编辑乙酰辅酶A 羧化酶ACCase 获得[75].

选择性拼接可以让一个基因编码多种蛋白,这使得生物体内蛋白种类多样化,并且可能产生新的表型.单碱基编辑在基因选择性拼接过程也发挥重要作用.绝大多数真核生物mRNA 拼接过程遵循GU/AG规则,通常拼接的内含子5’端包含一个拼接供体位点GU,3’端包含拼接受体位点AG,单碱基编辑可以让这些保守位点发生突变,产生不经过拼接的mRNA.RANG等[76]通过单碱基编辑方法将拟南芥AtPDS基因的mRNA 一个内含子拼接受体位点上的A 突变为G;XUE 等[77]利用单碱基编辑方法将拟南芥AtHAB基因内含子供体位点上的G 突变成A,使得基因编辑后的拟南芥对脱落酸敏感;LI 等[78]通过破坏mRNA拼接创制了拟南芥AtMTA 完全丧失功能突变体和水稻OsGL1、OsNAL1 的双突变体.

3.4 抗病毒育种

病毒作为病原物造成世界上一半以上植物病害, 严重影响了作物产量.CRISPR/Cas 体系可以抵御外来入侵的质粒、DNA 病毒以及RNA 病毒,因此在植物中也可以用来防御病毒入侵.双生病毒是一种单链DNA 分子,它在复制时会形成一种双链结构的中间体.将sgRNA 设计为特异靶向双生病毒基因组,稳定表达的Cas 蛋白和sgRNA 能够在双生病毒复制时能够切割双生病毒基因组,因此育种上也被用来防御双生病毒入侵植物[79].CRISPR/Cas 一个最大的缺点是组成型表达的Cas 蛋白和sgRNA 容易造成脱靶效应,最近有报道表明利用病毒的启动子驱动Cas 蛋白和sgRNA 的表达可以有效克服这一缺点[80].

相对于DNA 病毒,RNA 病毒造成的危害比DNA 病毒更严重[81].在哺乳动物细胞中,FnCas9 以不依赖于PAM 序列的方式结合RNA 切割丙型肝炎病毒RNA 分子,抑制丙型肝炎病毒的翻译和复制[82].在植物中,人们发现FnCas9 也能够切割黄瓜花叶病毒和烟草花叶病毒RNA 分子,从而可以有效防治黄瓜花叶病毒病和烟草花叶病毒病[81].另外值得一提的是与大多数Cas 蛋白不同,C2c2 类型的核酸酶可以切割单链RNA,因此被用来防治芜菁花叶病毒对植物造成的伤害[83].

4 结语

自从CRISPR/Cas9 技术发明以来,经过短短的数十年时间,基因组编辑及相关领域已经取得了革命性变化,极大加快了植物功能基因组学以及分子育种的研究步伐.但目前也存在一些亟待解决的问题:精确基因定点编辑的能力,即通过HR 途径实现定点插入或替换的效率.不同物种和细胞类型中HR 频率差异很大,而且不同报道的基因打靶载体设计以及提高效率方法也不尽相同.在植物中如何提高效率还需要进行深入系统的探索,建立一套适合植物的体系.在提高基因编辑效率的同时,还要避免产生脱靶突变.脱靶效应主要出现在sgRNA 靶向不稳定,因此解决脱靶效应最主要的方法还是在设计靶位点时选择特异性较高的位点,即在全基因组上没有和其相似性高的序列.另外也有报道表明使用截短的sgRNA(即17、18 或19nt 导向序列),可以将脱靶效应降低几个数量级,且不影响靶位点处的突变效率[84].sgRNA 截短后可能使RNA-DNA 复合体对核苷酸错配更加敏感,因而提高靶向特异性.多基因编辑技术在植物中目前已能实现3~4 个基因同时敲除,更多个基因(10 个或以上)同时敲除尚无报道.

总之,CRISPR/Cas9 作为现代生物学育种技术, 虽然在很多领域已取得突破, 但离我们的目标还很远,需要不断研发新的体系,包括高效表达sgRNA 的载体和新的Cas 核酸酶,以及效率更高的植物转化体系,相信未来CRISPR/Cas9 基因编辑技术能够更好地为作物育种服务.

猜你喜欢

结构域作物蛋白
覆盖作物及其作用的研究进展
中国农业科学院揭示大塑料和微塑料对作物生长发育和土壤健康的潜在影响
RNA结合蛋白与恶性肿瘤发生发展关系的研究进展
细菌四类胞外感觉结构域的概述
锌指蛋白与肝细胞癌的研究进展
吉林省省级作物种质资源保护单位名单(第一批)
细砂糖对法式蛋白糖的质量影响研究
水通道蛋白的发现
结核分枝杆菌蛋白Rv0089的生物信息学分析
黄星天牛中肠中内切葡聚糖酶的鉴定与酶活性测定