紫花苜蓿基因编辑数据库(AlfalfaGEDB)的应用研究
——以MsHB7 和MsPALM1 为例
2022-07-17蒋晓可刘长宁
蒋晓可,刘长宁
(1.中国科学院西双版纳热带植物园,云南 勐腊 666303;2.中国科学院大学,北京 100049)
紫花苜蓿(Medicago sativaL.)因其高产潜力、广泛的适应性和优良的营养特性被誉为“牧草之王”,是世界上分布最广、栽培历史最悠久的饲草之一。近年来,随着畜牧业的迅速发展,紫花苜蓿的需求增加,对紫花苜蓿的研究应用愈加广泛[1]。2020 年,四倍体紫花苜蓿两个品种(新疆大叶和中苜一号)的参考基因组公布[2-3],完成了染色体水平的基因组组装,极大推进了紫花苜蓿基因功能的研究和品种改良的发展。
基因编辑是一种利用序列特异性核酸酶(sequence-specific nucleases,SSNs)在序列特定位点引起碱基突变的技术。CRISPR/Cas9 因其操作简单、实用高效而成为目前应用最为广泛的基因编辑技术,已被广泛用于水稻、高粱、小麦、玉米、大豆、番茄、马铃薯的作物改良[4-6]。
基于以上背景,我们利用Django Web 框架,结合SQLite 数据库,构建了紫花苜蓿基因编辑数据库(Alfalfa Gene Editing Database,AlfalfaGEDB),提供基因基本信息浏览、BLAST 序列比对、JBrowse基因组浏览器、多条件查询、sgRNA 靶点设计、在线Heatmap 绘制、生物复杂网络绘制、基因家族预测和数据下载等功能。AlfalfaGEDB 及其相关工具为研究人员提供了一个实用性强、操作简便的平台,用以检索紫花苜蓿基因的相关信息,帮助研究人员更好的开展研究。本研究以MsHB7和Ms-PALM1基因为例,对AlfalfaGEDB 的功能进行展示,旨在证明AlfalfaGEDB 的实用性和数据库结果的可靠性。
1 材料和方法
1.1 AlfalfaGEDB 的数据处理
通过文献检索,对四倍体紫花苜蓿两个品种(新疆大叶、中苜一号)的基因组数据进行全面收集,将四倍体紫花苜蓿的蛋白序列比对至多个基因功能公共数据库,获得了KEGG、GO、Pfam 等多种注释信息;基于NCBI SRA 数据库、EBI 和国家基因库生命大数据平台(CNGBdb)等公共数据库,收集分析了212 份紫花苜蓿转录组数据,涵盖紫花苜蓿不同组织、不同环境胁迫等多种样本;利用CRISPR-GE[7]和CRISPR-Local[8]靶点预测工具,对紫花苜蓿两个品种分别进行了sgRNA 预测,获得4 套全基因组靶点预测数据,基因组覆盖率达99%以上。
1.2 AlfalfaGEDB 的实现
基于紫花苜蓿多组学数据的挖掘和整理,利用Django Web 框架,结合SQLite 数据库,构建了紫花苜蓿基因编辑数据库(Alfalfa Gene Editing Database,AlfalfaGEDB),访问网址为:http://alfalfagedb.liu-lab.com/。AlfalfaGEDB 收录了紫花苜蓿两个品种基因组信息、多样本的基因表达谱、全基因组sgRNA 靶点预测等信息,提供基因组信息在线浏览,转录组表达量可视化以及sgRNA 靶位点预测数据在线浏览等功能模块。此外,数据库也集成了在线BLAST、热图绘制,生物复杂网络查询、基于CRISPR/Cas9 的sgRNA 靶位点设计等工具。
1.3 AlfalfaGEDB 的应用
以紫花苜蓿、CRISPR 等作为关键字进行文献搜集,选择经过实验验证的功能基因MsHB7和MsPALM1作为主要查询对象。通过AlfalfaGEDB的BLAST 序列比对工具,对基因进行验证,得到该基因在AlfalfaGEDB 中对应的基因名,实现基因ID 的转化。Browse 功能用于查询基因的基本信息;利用JBrowse 基因组浏览器进行基因结构的可视化;在线Heatmap 绘制工具展示基因在不同组织和胁迫条件下的表达信息;多条件查询用于查询基因所在网络的信息;Network 工具绘制基因所在的共表达网络和蛋白互作网络;基因家族预测结果确定该基因所在的转录因子家族;sgRNA 靶点设计提示了该基因预测到的所有可能的靶点信息。
2 结果与分析
2.1 MsHB7 基因在AlfalfaGEDB 中的应 用
已有研究表明,MsHB7作为HD-Zip 转录因子家族中的一员,其过表达对紫花苜蓿盐胁迫耐受性具有负调节作用[9]。此外,还有一些植物物种中的HD-Zip 成员在非生物胁迫反应中发挥作用。JcHDZ07基因是小桐子(Jatropha curcasL.)中HD-Zip 家族的成员,它在拟南芥中的过表达使转基因品系对盐胁迫更加敏感[10]。玉米(Zea maysL.)中ZmHDZ1的过表达使转基因水稻盐敏感性增强[11];棉花(Gossypium hirsutumL.)GhHB12基因过表达也对拟南芥和棉花的盐胁迫和耐旱性产生了负调控作用[12]。盐碱胁迫是重要的植物非生物胁迫因子,土壤盐碱化也是世界范围内备受关注的生态问题,紫花苜蓿作为优质的牧草品种,选育适宜的耐盐碱品种将极大促进紫花苜蓿的生产和发展[13]。
在AlfalfaGEDB 中搜索MsHB7(MsG0380016624.01)基因,可以得到如下结果:
(1)Browse 搜索结果如图1 所示,可以得到该基因的染色体位置信息、序列信息、基因注释信息、sgRNA 靶位点预测结果。根据数据库搜索结果,该基因在公共数据库中被注释为HD-Zip 相关蛋白。
图1 MsHB7(MsG0380016624.01)基本信息浏览
(2)BLAST 工具鉴定结果显示:紫花苜蓿中苜一号品种中MsHB7(MsG0380016624.01)基因与蒺藜苜蓿中响应ABA、盐胁迫的MtHB12(XP_003602321.2)基因的氨基酸序列相似性高达98%(图2A)。
(3)JBrowse 可视化结果显示:MsHB7具有两个外显子和两个CDS 区域(图2B)。
(4)如图2C 所示,转录因子基因家族鉴定结果表明MsHB7基因属于HD-Zip 转录因子家族。
除基因的详细信息,AlfalfaGEDB 提供的共表达网络和蛋白互作网络分析工具可帮助研究人员分析和挖掘更多的基因功能。AlfalfaGEDB 网络查询工具显示:MsHB7与MsG0380016581.01 基因有蛋白互作关系(图2D)。共表达网络查询结果表明MsHB7与821 个基因有共表达关系,我们对p-value 值前10 的基因进行了共表达网络展示(图2E)。热图聚类(图2F)显示,MsHB7及其相关基因受盐胁迫诱导变化明显:与对照组相比(CZM、CXJ),这些基因在盐处理下(TZM、TXJ)表达量上升。MsHB7基因sgRNA 靶位点预测结果如图1D所示,利用CRISPR-GE 工具在MsHB7中预测出54个靶点,CRISPR-Local 工具预测出36 个靶点,两个工具预测到的相同靶点数为35 个。
图2 MsHB7在AlfalfaGEDB中查询结果
2.2 MsPALM1 在 AlfalfaGEDB 中的应用
茎叶比是衡量紫花苜蓿品质的重要指标,与紫花苜蓿的营养价值呈正相关,培育多叶型新品种有助于改善紫花苜蓿茎叶比,从而提高其产量和营养价值。已有研究证明,C2H2 型锌指转录因子——PALM1在二倍体蒺藜苜蓿复叶形成过程中发挥了关键作用[14-15]。2020 年,研究人员利用紫花苜蓿新疆大叶基因组数据,以MtPALM1作为查询,成功在紫花苜蓿中鉴定出4个MsPALM1等位基因:MS.gene059669,MS.gene09654,MS.gene21467 和 MS.gene015309。利用CRISPR/Cas9 技术,对调控紫花苜蓿小叶数目的Ms-PALM1等位基因进行定点突变,将三出复叶的紫花苜蓿突变为5 小叶的类掌状复叶,大大加快了紫花苜蓿育种速度。
为了更直观地对本数据库sgRNA 靶点设计工具进行验证,我们以MsPALM1为例,通过BLAST得到MtPALM1在新疆大叶基因组中的4 个等位基因,序列相似性99%以上(图3A)。转录因子家族预测结果如图3B 所示,MsPALM1的4 个等位基因属于C2H2 转录因子家族,该结果进一步印证了BLAST 结果的真实性。Browse 查询结果显示,4 个基因位于5 号染色体组的不同亚染色体上,GO 和Pfam 注释结果相同,编码C2H2 型锌指蛋白(图3C)。MsPALM1等位基因的表达矩阵热图显示,其在敲除palm1 的叶片里明显高表达(图3D)。
图3 MtPALM1在AlfalfaGEDB中的查询结果
利用本数据库的多靶点预测工具,成功预测到陈海涛等的研究中[16]敲除MsPALM1等位基因所用靶点:5’-GGAGACGAGCACGGTCGCGGCGG-3’(图4),有力地证明了AlfalfaGEDB 靶点预测的可用性。
图4 MsPALM1等位基因靶点预测结果
3 小结
紫花苜蓿基因编辑数据库(AlfalfaGEDB)共收集了两个品种紫花苜蓿的基因组数据、212 份紫花苜蓿转录组数据以及4 套全基因组sgRNA 预测数据。在此基础上,利用Django Web 框架,结合多种生物信息学工具,构建了一个相对全面的紫花苜蓿基因编辑数据库。本文通过对MsHB7和Ms-PALM1两个实例进行分析,对AlfalfaGEDB 的工具进行了全方位的测试与验证,数据库查询结果与已有研究结果[3,17]的一致性也进一步印证了紫花苜蓿基因编辑数据库的实用性和可靠性。
豆科作物紫花苜蓿在改良土壤、水土保持、生物固氮等方面发挥了重要作用,其应用对饲料、作物轮作和土壤肥力至关重要,是可持续农业的重要组成部分。作为目前最全面的紫花苜蓿功能基因研究平台,AlfalfaGEDB 为研究人员提供了友好的Web 服务和便捷高效的生物信息学工具,成为紫花苜蓿功能基因研究的重要补充工具,期待其能够持续为紫花苜蓿基因功能研究和遗传育种提供有用的资源。