APP下载

CRISPR/Cas 在定向进化技术中的应用

2021-07-30李奉庭

集成技术 2021年4期
关键词:编辑器变体文库

金 帆 李奉庭 夏 霖

1(中国科学院深圳先进技术研究院 深圳合成生物学创新研究院中国科学院定量工程生物学重点实验室 深圳 518055)

2(中国科学院大学 北京 100049)

1 引 言

随着定向进化技术的不断发展,利用传统的物理、化学和生物诱变技术[1-2]寻找所需的生物性状往往会带来过多有害突变,已无法满足研究或应用的需求。于是人们通过先对单个基因或生物途径建立突变文库,再筛选得到具有更高活性的酶[3]、目的产物产量更高的生物体[4]。但这些方法大多需要体外建立突变文库、体内进行筛选,反复迭代,这无疑增加了得到目的突变体的难度与成本。而 CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)技术的出现和发展,使人们可以站在新的角度,利用新的工具开发定向进化技术,以解决目前所面临的问题。

借助 CRISPR/Cas 系统,可以实现对特定基因或区域进行编辑。根据小向导 RNA(small guide RNA,sgRNA)引导的 Cas 蛋白或 Cas 融合蛋白的特性,可以使该区域基因产生双链断裂、单链缺刻和单碱基替换[5]等变化。再由修复机制、错配机制或化学催化机制引入突变,实现突变文库的构建。结合生物大分子如转录因子、核酸适配体等,CRISPR 的功能可以扩展到分子检测领域。由此可见,CRISPR 系统的性能与定向进化技术的需求有着很高的契合度。

另外,通过 PubMed 数据库检索 CRISPR 与定向进化的论文数量发表情况可知,定向进化论文数从 1975 年开始,到 2018 年左右出现平台期,其年增长速率仅为 2%~5%。而 CRISPR在同期正呈蓬勃发展的趋势,年增长速率达14%~24%。因此,借助 CRISPR 为定向进化技术提供新的方法和策略,对于定向进化技术将是一个新的机遇。

本文首先介绍 CRISPR 技术的最新进展,包括不同核酸酶及诱导系统的介绍。其次,从定向进化的两个核心出发,总结利用 CRISPR 工具产生遗传多样性的策略以及借助 CRISPR 工具进行筛选与选择的方法。最后设想 CRISPR 介导的定向进化(CRISPR-Mediated Directed Evolution,CDE)可能的未来发展方向。

2 不断丰富的 CRISPR 工具箱

2.1 CRISPR-Cas9 及其衍生变体

图1 主要的 CRISPR-Cas 工具分子特征与调控Fig. 1 Main CRISPR-Cas tools’ molecule characteristic and regulation

但在 SpCas9 系统中,存在 PAM 序列限制、SpCas9 蛋白较大和脱靶等问题,限制了其进一步的应用。早期人们通过开发其他细菌和古细菌的 Cas9 同源蛋白来改善这些问题。比 SpCas9 更小的来自金黄色葡萄球菌的Cas9(SaCas9)可以识别 5′-NNGRRT-3′PAM[20],且当引入 D10A 和 N580A 突变时,SaCas9 同样可显示出缺刻酶活性[21]。来自脑膜炎奈瑟氏球菌 Cas9 (NmCas9)则可以识别 5′-NNNRRT-3′或 5′-NNNNGMTT-3′PAM 且脱靶效应降低[22]。同样还有嗜热链球菌 Cas9(St1Cas9)可以识别 5′-NGGNG-3′或 5′-NNAGAAW-3′[23],空肠弯曲杆菌 Cas9(CjCas9)可以识别5′-NNNNACAC-3′或 5′-NNNNRYAC-3′[24],犬链球菌(ScCas9)可以识别 5′-NNG-3′[25]。

通过基于结构信息,借助细菌生存选择的定向进化策略与突变位点组合设计,SpCas9 VQR、EQR 和 VRER 变体可以分别识别 NGA、NGAG和 NGCG PAM[26]。借助噬菌体辅助的连续进化,得到可以识别广泛 PAM 序列(NG、GAA 和GAT)且特异性更高的 SpCas9 变体 xCas9[27]。另一种 SpCas9 变体(SpCas9-NG)则是通过结构设计获得识别 NG PAM 的能力[28]。SpCas9、xCas9和 SpCas9-NG 的 PAM 均包含鸟嘌呤(G),但人们希望 PAM 能不受依赖 G 的限制。Miller 等[29]借助噬菌体辅助进化,得到 3 个对非 G PAM 具有活性的 SpCas9 变体,分别可以识别 NRRH、NRCH 和 NRTH PAM;利用结构导向工程策略同样得到识别非 G PAM 的 SpG(NGN PAM)和SpRY(NRN>NYN PAM)[30]。这些新型 SpCas9变体的开发使得 CRISPR-Cas9 系统几乎可以靶向基因组任意位置而不再受 PAM 序列的限制。

改善 CRISPR 系统特异性和表达泄露对宿主的影响,可以对 Cas9 蛋白进行组合诱变[31]以及将 Cas9 蛋白与诱导性二聚体结构域进行融合,如光介导的 Mag 蛋白二聚化[32]、雷帕霉素诱导的 FRB 与 FKBP 互作、脱落酸及赤霉素诱导的对转录的激活或抑制[33-34],以实现时间或空间上的表达(图 1(d))。

2.2 CRISPR-Cas12 家族

3 利用 CRISPR 工具实现的遗传多样性

CRISPR 工具首先作为基因编辑系统,可以与 DNA 修复机制串联,既可以对单基因进行突变,也可以在基因组水平引入广泛的变化。同时 CRISPR 作为招募平台,通过蛋白质融合或sgRNA 蛋白相互作用,将功能域募集到特定位点,也可以在目标基因中引入突变。

3.1 通过 CRISPR 产生双链断裂进行突变库的建立

利用 CRISPR 系统可以对靶向 DNA 序列进行切割的特性,并激活 DNA 修复机制,可以在基因组 DNA 中引入多样性的突变,表 1 总结了基于该原理的定向进化平台。通过 Cas9-sgRNA复合物对 DNA 双链的切割作用产生双链断裂(Double-Strand Break,DSB),而 DSB 的修复主要通过非同源末端连接(non-Homologous End Joining,NHEJ)途径和同源性修复(Homology-Directed Repair,HDR)途径完成[45](图 2(a))。其中,NHEJ 不依赖同源模板[46],通常产生较小的插入或缺失,导致不可控的随机突变,对单核苷酸取代能力不足[47]。HDR 途径则需要外源双链或单链寡脱氧核苷酸(double-strand/single strand DNA,dsDNA/ssDNA)提供模板,所以其擅长利用携带突变的供体模板进行单核苷酸的替换,但效率一般较低[48]。由于依赖 HDR 途径可以获得更为精确的人工设计突变,不会造成基因大片段的缺失,于是人们开展了提高 HDR 效率的研究,如调节修复机制[49-50]、合理设计供体模板等[51-52]。

表1 基于双链断裂的 CDE 策略Table 1 CDE strategy based on double-strand break

3.1.1 大肠杆菌底盘系统

在原核生物中,CRISPR 介导的 DNA 链切割可以杀死未被编辑过的细胞,从而可以增加筛选效率又避免使用抗性标记[53]。Wang 等[54]借助λRed 与 dsDNA/ssDNA 开发了多重自动化基因组工程(Multiplex Automated Genome Engineering,MAGE),该系统可同时靶向染色体多个位置。将 CRISPR-Cas9 引入该系统则可以提高较大核糖体结合位点(Ribosome Binding Site,RBS)的替换效率(与 MAGE 相比提高了 56%),并且在单轮循环中引入单突变和双突变的效率比 MAGE分别高 93% 和 90%[55]。Li 等[56]报道了一种基于CRISPR-Cas9 的迭代基因组编辑系统。该系统以dsDNA 作为编辑模板,实现基因缺失、插入和替换的效率可接近 100%,随后针对 β-胡萝卜素,进行了甲基赤藓糖醇磷酸和中心代谢途径的组合优化,筛选得到的最优菌株在发酵中可产出2.0 g/L 的 β-胡萝卜素。

随着 DNA 合成与测序成本的降低,人们可以借助高通量方法来在定向进化过程中产生突变并分析表型(图 2(b))。结合大规模并行寡核苷酸合成和测序,Garst 等[57]开发了可在全基因组范围内产生能追踪的编辑平台(CRISPR-Enabled Trackable Genome Engineering,CREATE)。该平台的核心设计是将每个 gRNA 连接到同源修复盒上,该盒既可以编辑基因位点,又可以作为条形码来追踪基因型与表型关系,实现引导切割的 gRNA 和同源修复模板序列的偶联。借助 CREATE 可以对大肠杆菌耐热和耐药性的相关基因绘制超过 50 000 个全基因组突变,并鉴定其赋予目标表型的突变。利用迭代CREATE(iCREATE)系统[58],研究人员为得到高葡萄糖和木糖利用率且抗水解产物抑制的大肠杆菌菌株以用于 3-羟基丙酸(3-Hydroxypropionic Acid,3HP)生产,针对 30 个基因中约 40 000 个突变设计文库,得到的突变株可以在高水解产物浓度下达到亲本株 3HP 产量的 7~8 倍。同时Liu 等[59]又针对 115 个基因中约 162 000 个突变设计文库,优化了 3HP 合成代谢相关途径,使突变株 3HP 产量高出野生型菌株 60 倍。这种系统的局限性是在追踪基因型与表型的关系时,以质粒为载体的条形码稳定性较低,但可以采取基因组整合的办法解决该问题。

图2 DNA 修复途径介导的定向进化策略Fig. 2 DNA repair pathway mediated directed evolution strategy

3.1.2 酵母底盘系统

酵母的代谢途径工程研究对于生物燃料、化学药品的生成具有重要意义,故人们开展了酵母中的基因组多样性研究。早期人们使用的突变文库多为可以在酵母细胞内自我复制的环状质粒,这种着丝粒质粒在单细胞水平拷贝数差异很大,相当于在表型与基因型之间增加了拷贝数的干扰项,这会导致定向进化的效率大大降低。

Ryan 等[60]在酵母中建立了 CRISPRm(Multiplex CRISPR System),该系统以 dsDNA 为模板,可在二倍体或多倍体酿酒酵母基因组中创建多个 DSB。另外,为增加 CRISPRm 的编辑效率,将 sgRNA 与自切割肺炎三角洲病毒核酶 3′端融合以保护 sgRNA 免受核酸外切酶的影响。最后在单轮定向进化中筛选出纤维糊精转运蛋白变体,将纤维二糖到酒精的发酵速率提高了 10 倍。

对于多基因相关代谢途径的优化,可以利用CRISPR 系统对酿酒酵母基因组中甲羟戊酸代谢相关的 5 个基因进行组合编辑[64],得到 31 个突变株,其中产量最高的突变菌株比野生型菌株高41 倍。CasPER (Cas9-Mediated Protein Evolution Reaction)[61]是一种 CRISPR-Cas9 介导的大序列定向进化方法,可以整合 300~600 bp 的供体模板,其首先通过易错 PCR 得到甲羟戊酸途径两个关键代谢酶的突变文库,再利用 CRISPR 系统在靶标处引入 DSB 后发生的 HDR,使突变文库整合到靶向位点,最后得到了异戊二烯产量增加11 倍的突变体。

借助高通量寡核苷酸合成与测序技术同样可以实现酵母基因组范围的定向进化研究。Guo等[65]介绍了一种基于 CRISPR-Cas9 的策略用于在酵母细胞中同时创建数百个无选择标记的遗传变异,并针对 315 个特性不明的小型开放阅读框进行评估,研究这些小型开放阅读框对环境适应性生长的必要性,讨论了该策略用于定向进化的可能性。CRISPR-Cas9 与 HDR 辅助的基因组规模工程(CRISPR-Cas9 and Homology-Directed-Repair-Assisted Genome-Scale Engineering,CHAnGE)[62]可以实现单核苷酸精度的全基因组突变,进化出对生长抑制剂(如糠醛、乙酸)具有耐受性的菌株。在酵母中也可以使用类似大肠杆菌中 CREATE 的策略,利用条形码对每个引导-供体对序列进行标记,实现对突变文库的高通量测序和功能分析[66]。同时,该实验还发现利用融合蛋白 LexA-Fkh1p 将供体 DNA 招募到断裂位点,可以将编辑效率提高 5 倍以上[66]。

在基因组水平对基因表达水平进行单一类型的调节(上调、下调或敲除)是不全面的,因为其无法研究具有不同表达水平基因间的相互作用对复杂表型的影响。多功能基因组水平 CRISPR系统(Multi-Functional Genome-Wide CRISPR,MAGIC)[67]可以有效解决这一问题。MAGIC 使用 3 个正交的 Cas 蛋白开发了三功能 CRISPR 系统,将基因激活、干扰和缺失整合在一起。与CHAnGE 相比,在相同筛选条件下 MAGIC 可以发现更多糠醛耐受性相关基因间的相互作用,进化出糠醛耐受性菌株的效率更高。

3.1.3 植物与动物底盘系统

尽管在酵母中 HDR 途径非常活跃[68],但是在植物和哺乳动物产生 DSB 后首个反应是NHEJ。主要原因是动植物中 NHEJ 途径发生的概率要高于 HDR,且难以传递足够的供体DNA(修复模板)。目前利用 NHEJ 途径可以实现广泛的动植物基因缺失文库的建立[69-73]。尽管多数条件下 NHEJ 途径会导致基因的插入和缺失,使开放阅读框出现移码突变,但借助 NHEJ 开发定向进化平台仍然是可行的。例如,在水稻中开发的 CRISPR-Cas9 定向进化平台[74],可以进化 SF3B1 剪接体蛋白,以抵抗剪接抑制剂。其sgRNA 文库靶向必需基因SF3B1,并从 15 000个愈伤组织中得到 6 个抗剪接抑制剂(GEX1A)的 SF3B1 突变体。

在哺乳动物底盘中,NHEJ 产生的基因多样性可以用于细胞耐药性研究。CRISPRres(CRISPR-Induced Resistance in Essential Genes)系统[63]可以利用大规模的 sgRNA 文库进行癌细胞抗药性的遗传筛选,快速获得和鉴定必需基因中的耐药性突变。为验证系统的有效性,结合蛋白晶体结构,解析了烟酰胺磷酸核糖基转移酶突变前后与抗癌药 KPT-9274 的结合机制。Ipsaro 等[75]对赖氨酸甲基转移酶(DOT1L)的KMT 结构域设计了包含 73 个 sgRNA 的文库,并在 EPZ-5676 抑制剂的选择作用下得到具有VVEL293MM(两个蛋氨酸替换为两个缬氨酸,同时缺失谷氨酸和赖氨酸残基)突变的 DOT1L 变体,生化分析发现该突变可以使酶活增加,同时降低对 EPZ-5676 抑制剂的敏感性。

对于抗体工程,NHEJ 无法满足精确位点突变的需求,所以人们开发了利用 HDR 获得高效抗体的研究。早期,研究人员利用 CRISPR-Cas9,针对 BRCA1 第 18 个外显子中 6 个碱基[76],克隆了包含随机六聚体的 HDR 文库,证明了利用借助 HDR 对基因组区域进行饱和编辑的可能性。Mason 等[77]利用单链寡核苷酸作为供体模板,将文库引入抗鸡蛋溶菌酶抗体(HEL3)重链可变域(VH)的互补决定区 3 (CDRH3),使用定向进化和高通量筛选方法获得了新的 CDRH3 序列。将 DNA 供体形式由 ssDNA 变为可自线性化质粒,可以增加 HDR 的效率,再借助易错 PCR对 HEL3 的 VH 区生成随机突变文库,筛选出亲和力范围在皮摩尔范围内的变体[78]。

3.2 CRISPR 系统与具有诱变功能的蛋白联用

借助 CRISPR 系统对基因组产生 DSB 后修复途径,往往会对宿主本身造成损伤,并且受到需要提供 HDR 供体模板的限制,而利用 Cas9的引导功能,引导诱变功能蛋白可以解决这些问题[79]。碱基编辑器是由 DNA 靶向模块(dCas9 或nCas9)与催化结构域(胞嘧啶或腺苷脱氨酶[80-81])组成的融合蛋白,其中靶向模块可以结合到特定的 DNA 位点,随后 sgRNA 与靶 DNA 结合形成“R-环”[82],导致一小段单链 DNA 移位,这一小段单链 DNA 作为催化窗口被催化结构域进行碱基替换。由于碱基编辑的 DNA 靶向模块使用的是 dCas9 或 nCas9,所以并不会导致 DSB 的产生。借助目前开发的各类 CRISPR 融合蛋白平台,可以实现单碱基的变化、局部序列的多样化[83-84],用于生成新的蛋白质突变体或作物改良[85-86]等。表 2 为相应平台的汇总描述。

表2 基于与诱变功能蛋白联用 CDE 策略Table 2 CDE strategy based on coupling protein with mutation

3.2.1 碱基编辑工具的开发

胞嘧啶碱基编辑器(Cytosine Base Editor,CBE)可以令胞嘧啶(C)脱去氨基,使其转化为尿嘧啶(U),从而将 C·G 碱基对转化为 T·A 碱基对(图 3(a))。第一代碱基编辑器由来自大鼠的胞嘧啶脱氨酶 APOBEC1,通过连接肽与 dCas9连接。以 PAM 的远端作为位置 1,其有效脱氨窗口在距 PAM 的 4~8 位。由于尿嘧啶糖基化酶(Uracil DNA Glycosylase,UDG)经常会除去尿嘧啶,导致编辑效率较低(体外脱氨效率为25%~40%,细胞内脱氨效率为 0.9%~7.7%),所以在 dCas9 蛋白的 C 末端偶联了 UDG 的抑制剂 UGI (Uracil DNA Glycosylase Inhibitor),开发了第二代碱基编辑器,使体内编辑效率与第一代碱基编辑器相比提高了 3 倍。而如果将dCas9 替换为 nCas9(D10A),则可将第二代碱基编辑器效率进一步提升 2~6 倍[80]。借助丰富的CRISPR 工具盒,人们开发了诸多针对不同 PAM或者编辑窗口的碱基编辑器。如利用 SpCas9 变体(VQR-BE3、VRER-BE3)分别识别 NGAN 和NGCG PAM,编辑窗口分别为 4~11 和 3~10位[90];利用不同来源的 Cas 蛋白(Sa-BE3、SaKKH-BE3 和 Cas12a-BE)分别识别 NNGRRT、NNNRRT 和 TTTV[90-91]。

腺嘌呤碱基编辑器(Adenine Base Editor,ABE)则是可以将 T·A 转化为 C·G (图 3(b))。与CBE 类似,人们开展了一系列 ABE 的优化及应用[92-94]。例如,Wang 等[95]通过对 ABE 进行核心模块组合优化(包括 sgRNA、nCas9、脱氨酶与核定位信号肽),获得了具有更精确的编辑窗口、更高编辑效率的 sABE 系统。

3.2.2 基于碱基编辑的定向进化技术

定向进化的实现需要借助单碱基取代和局部序列多样化,创建遗传突变库[96]。CRISPR-X[83]和 TAM (Targeted AID-mediated Mutagenesis)[84]是两个碱基编辑介导的产生局部序列多样化的平台。其中,CRISPR-X 使用的 sgRNA 融合有两个 MS2 结合适体,可以招募 MS2-AID (Activation Induced Cytidine Deaminase,AID)融合蛋白实现对局部区域的诱变(图 3(c))。Hess 等[83]对野生型绿色荧光蛋白进行诱变,得到 S65T 和 Q80H的绿色荧光蛋白变体(加强型绿色荧光蛋白)。借助 CRISPR-X 同样可以进行耐药机制的研究:PSMB5 是蛋白酶抑制剂硼替佐米的靶标,作者通过迭代进化发现了 5 个对硼替佐米强抗性突变与3 个适度抗性突变。在 TAM 系统中(图 3(d)),研究人员则在慢性髓性白血病细胞中用 dCas9-AID-P182X (AIDx)靶标BCR-ABL基因,有效鉴定了赋予细胞伊马替尼抗性的已知突变和新突变[84]。除了耐药性研究,将碱基编辑工具与哺乳动物细胞展示系统结合使用,可以在多轮突变和选择下得到更高亲和力的抗体[97]。

图3 Cas9 与诱变蛋白联用介导的定向进化Fig. 3 Cas9 and protein with mutation coupling mediated directed evolution

单纯依靠 CBE 或 ABE 可能无法产生足够丰富的突变类型,而 CBE 和 ABE 的联合使用可以有效解决这一问题。Liu 等[98]通过对编码 OsACC羧基转移酶结构域基因设计 141 条 sgRNA,结合两种 CBE (eBE3 和 eCDA),及一种 ABE(eABE),分别构建了 3 个碱基编辑文库。从eABE 文库中获得了未报道过的 I1879V 突变,赋予水稻除草剂抗性,而另外两个文库未获得新的突变。碱基编辑器介导的基因进化技术(a Base-Editing-Mediated Gene Evolution,BEMGE)[99]则是将胞嘧啶碱基编辑器(rBE9)和腺嘌呤碱基编辑器(rBE14)同时转入水稻细胞,对水稻除草剂靶标基因OsALS1进行靶向诱变,获得 4 个自然界中未曾被发现的、对除草剂双嘧菌钠具有抗性的蛋白变体。类似的策略同样被用于在放线菌的单碱基编辑。CRISPR-BEST (CRISPR-base Editing System)[87]包含两个独立的碱基编辑器(CRISPRcBEST 和 CRISPR-aBEST),并在非模式链霉菌中通过引入终止密码子失活了奇霉素合成途径中两个拷贝的kirN基因,同时该研究借助 Csy4(1 类 IF 型核糖核酸内切酶)设计了 sgRNA 多重化系统,可以实现仅依靠一对启动子和终止子表达多个 sgRNA,且每个 sgRNA 表达强度相同,显示出强大的用于代谢工程类定向进化的潜力。饱和靶向内源基因突变碱基编辑器(Saturated Targeted Endogenous Mutagenesis Editors,STEME)[88]则将 CBE 与 ABE 系统进行合并融合(图 3(e)),通过将胞嘧啶脱氨酶(APOBEC3A)和腺嘌呤脱氨酶(ecTadA-ecTadA7.10)同时融合在nCas9 的 N 端,并将 UGI 融合至 nCas9 (D10A)的 C 端,实现只在一个 sgRNA 引导下就可以诱导靶位点 C>T 和 A>G 的同时突变,显著增加靶基因碱基突变的饱和度与多样性,最后验证 STEME 在植物中的定向进化能力,获得了OsACC 羧基转移酶结构域 3 个对氟吡甲禾灵具有抗性的新突变位点。

3.2.3 Cas-DNA 聚合酶定向进化技术

除了利用碱基编辑器进行单碱基的转换,借助 CRISPR 系统来招募其他诱变蛋白同样可以产生局部序列多样化。EvolvR 系统[89]将 nCas9 与易错 DNA 聚合酶 I (PolI3M)进行融合(图 3(f)),利用 nCas9 创建的 DNA 缺刻作为 DNA 聚合酶起始位点,诱变窗口长度、突变率和取代偏差则由聚合酶变体本身性质决定。该系统可以产生高于野生型细胞 770 多万倍的突变率,编辑 350 个核苷酸。最后使用 EvolvR 鉴定对抗生素壮观霉素耐药的新型核糖体突变位点。借助类似的原理,Tou等[100]在酿酒酵母中也开发了 EvolvR 系统。

4 CRISPR 介导的筛选与选择

对多样化突变文库进行筛选与选择是定向进化中另一个关键部分。筛选可以对每种突变体的特性进行评估,而选择则只会产生理想的突变体[101]。筛选技术可以减少错过所需突变体的机会,但降低通量;选择技术则可以用于更大的文库,但需要对突变文库施加选择压力来消除非目的突变体[102]。CRISPR 系统除了具有出色的基因编辑能力外,还已应用于分子检测。而筛选和选择方法恰恰依赖分子检测等检测技术的开发,因为大多数生物分子与可直接观察的表型无关[96],需要荧光、比色或其他报告分子。例如,借助气相色谱检测产物的形成,获得具有高活性细胞色素 P450 酶变体[103],通过一连串酶促反应来产生与纤维素酶活相对应的荧光[104]等。目前,CRISPR 系统被广泛地应用于核酸分子的检测[105-106],在 2019 年也出现了对非核酸靶标的检测系统,所以本节重点对CRISPR 介导的筛选检测技术进行阐述,在未来展望部分则对 CRISPR 介导的选择进行讨论。

Liang 等[107]开发了 CRISPR-Cas12a 和细菌变构转录因子(allosteric Transcription Factors,aTFs)介导的小分子检测平台 CAT-SMelor(CRISPR-Cas12a- and aTF-mediated Small Molecule Detector),借助 CRISPR-Cas12a 的单链 DNA 切割能力与 aTFs 对小分子和双链 DNA的竞争结合活性,当目的小分子存在时,aTF 的构象发生改变,导致 dsDNA 从 aTF 结合域解离,dsDNA 激活 Cas12a 对携带有荧光团-淬灭剂(Fluorophore Quencher,FQ)标记的 ssDNA 的切割,检测荧光信号发生变化,实现对尿酸和对羟基苯甲酸的纳摩尔水平的高通量检测。另一种 CRISPR 介导的传感器则是借助功能性 DNA(functional DNA,fDNA)。当 fDNA 的靶标出现时,单链 DNA 激活剂与 fDNA 解聚,触发 Cas12a对标记有 FQ 的单链 DNA 进行裂解,进而出现可检测的荧光信号,该策略也成功地用于检测 ATP和 Na+[108]。类似地,Li 等[109]同样借助 fDNA 实现了对 Pb2+、鲍曼不动杆菌和微小 RNA 的检测,再次扩充了 CRISPR 系统对非核酸分子的检测范围。

5 总结与展望

CRISPR 技术的出现和发展已经彻底改变人们对基因进行编辑、表达调控、分子检测的能力,出现了一系列基于 CRISPR 技术的拓展工具,这也促进定向进化技术的发展,并已应用于代谢工程、抗体工程、植物育种等领域(图 4(a))。不同来源的 CRISPR 系统及其相关变体,已经可以较为有效地解决如 PAM 位点限制[110]、脱靶[111]等问题,为进一步多基因间协同进化(如人造基因回路或代谢通路)提供可能。利用大规模gRNA 文库及高通量测序,结合 DNA 条形码技术,可以更高效地追踪与获得基因组层面上与突变相关的遗传信息,提高定向进化效率。同时通过机器学习与建立模型[112],有希望从获得的原始数据对进化模型进行完善,或通过逻辑线路设计实现对基因突变(如重复序列导致的缺失)的追踪与定量[113],得到普适性的系统突变库与目的性状的定量关系,帮助人们更好地借助 CRISPR工具箱对定向进化进行操纵和预测。

图4 CRISPR 介导定向进化的应用与机遇Fig. 4 Application and opportunities of CRISPR-mediated directed evolution

借助 CRISPR 系统对 DNA 的切割活性或靶向活性,可以实现多样化突变文库的建立。在 CRISPR 介导的修复途径的诱变中,NHEJ 和HDR 途径产生的突变文库各有利弊,选择哪种途径要取决于宿主本身性质和研究需求。因此对修复途径进行更深入的研究,规避不同修复途径的劣势,对于 CRISPR 介导的定向进化非常重要。而对于 Cas 蛋白将诱变功能蛋白引入靶向位点的策略,可以避免出现双链断裂对宿主造成不利影响,实现对特定窗口核苷酸进行突变。另外,自 2017 年以来,Cas13 系统也展示出巨大的应用潜力,其 RNA 的靶向能力将给研究者在RNA 水平开发定向进化系统提供可能。与 DNA文库相比,RNA 文库多样性更强,但是如何将活性 RNA 突变体映射到 DNA 上并迭代遗传是其开发难点。

基于 CRISPR 的检测技术已经拓展到了多种小分子,这为开发新型筛选与选择系统提供了可能。如在选择方法的展示技术中,已提出的CRISPR 展示系统可以构建结合有蛋白质、人工适体、随机序列库或长非编码 RNA 的 Cas9 蛋白复合物[114],在定向进化的高通量选择方法中具有广阔的应用前景。同时,借助 Cas9 对 DNA 的切割宿主致死性,可以进一步开发基于生存和生长的选择方法,而不是仅依靠药物或抗生素选择导致的淘汰,拓宽可研究表型。目前已有研究利用该性质进行微生物种群水平的选择性调控[115],以及结合致死基因,设计基于 CRISPR的正负选择策略用于 Cas9 蛋白的定向进化[116]。由此可见,CRISPR 技术在定向进化中筛选与选择策略上仍有很大的发展空间。

CRISPR 的多用途性,能更好地实现基因型-表型的联系,实现将建立突变文库和选择与筛选的偶联,并帮助已有定向进化技术进行改良。Cas 蛋白作为模块化程度极高的核酸靶向平台,可以通过串联多种功能蛋白来满足定向进化的多种需求,实现更高的序列多样性、有效活性域可及性。Cas 蛋白介导的有效活性域可及性将提高突变位点的精准性,致突变功能蛋白(如易错DNA 聚合酶、脱氨酶等)将提高序列的多样性。二者共同决定了待进化分子的进化潜力。利用恰当的传感器对变体活性进行筛选,并开发基于传感器-靶向器-效应器之间反馈基因回路的新型可迭代定向进化技术(如当筛选系统检测到高活性变体在种群中占比较高时,线路会产生反馈,进而调节效应器与靶向器的效率,使得高活性变体在迭代过程中具有更小突变压力的同时,靶向器可对更广泛的位点进行探索),将是未来的发展方向之一(图 4(b))。

未来,CRISPR 技术将加速定向进化相关领域的发展,CRISPR 工具盒将为人们提供多元化工具以解决定向进化中的问题并使定向进化技术设计进入全新的阶段。值得一提的是,也可以借助定向进化手段对 CRISPR 系统进行优化,而CRISPR 技术又能改善定向进化策略,显示出二者潜在的紧密联系。

猜你喜欢

编辑器变体文库
基于DDPG算法的变体飞行器自主变形决策
专家文库
优秀传统文化启蒙文库
关于推荐《当代诗坛百家文库》入选诗家的启事
你距离微信创作达人还有多远?
车辆段收发车运行图编辑器的设计与实现
专家文库
非仿射参数依赖LPV模型的变体飞行器H∞控制
耀变体喷流高能电子谱的形成机制
基于VLIW目标机的ELF二进制编辑器设计与实现