InDel标记及其在食用菌研究中的应用与展望
2020-12-16沈秀芬章炉军张美彦尚晓冬于海龙
沈秀芬,章炉军,张美彦,尚晓冬,李 玉,于海龙*
(1上海市农业科学院食用菌研究所,农业部南方食用菌资源利用重点实验室,国家食用菌工程技术研究中心,国家食用菌加工技术研发分中心,上海市农业遗传育种重点开放实验室,上海 201403;2吉林农业大学食药用菌教育部工程研究中心,长春130118)
综观世界食用菌产量发展趋势,食用菌产量快速增长,近年来我国食用菌的生产厂家更是如雨后春笋般应运而生[1]。根据中国食用菌协会统计,截至2018年底,我国食用菌产量达到3 842.04万t[2],食用菌已成为我国农业种植业中继粮食作物、蔬菜作物、果树作物、油料作物之后的第五大农作物[3]。我国食用菌资源丰富,是与我们生活密切相关的生物资源。近年来,随着人们对食用菌营养价值、药用价值的开发利用不断提高,基于分子标记QTL定位的食用菌遗传育种已成为研究热点之一[4]。现代作物分子育种方法主要有:分子标记辅助育种(Molecule marker associated selection)、分子设计育种(Molecule design breeding)、转基因育种(Genetically modified breeding)。随着生物信息学的快速发展,分子标记辅助育种逐渐成为全世界动植物育种的重要手段[5]。
目前,分子标记技术主要经历了三次技术革新。作为最早发展起来的以DNA-DNA杂交为基础的第一代分子标记——限制性内切酶片段长度多态性(Restriction Fragment Length Polymorphism,RFLP),在食用菌中主要应用于遗传多样性和亲缘关系的鉴定[6-9]。在此基础上研发出一系列以PCR扩增技术为基础的第二代分子标记。食用菌中,简单序列重复(Simple Sequence Repeat,SSR)标记主要应用于遗传育种[10-13];简单序列重复间区(Inter-simple sequence repeat,ISSR)主要运用在品种鉴定、遗传多样性、杂交育种等方面[14-15];随机扩增多态性 DNA 标记(Random Amplified Polymorphic DNA,RAPD)主要应用于系统发育、种质资源多样性、基因鉴别等研究中[16-17]。基于DNA芯片技术的单苷酸多态性(Single Nucleotide Polymorphisms,SNP)被称为第三代分子标记,具有多态性好,分辨率高等特点,有效克服了第一代和第二代分子标记在开发中面临的因DNA序列长度影响的缺点[18-20]。InDel(Insertion-Deletion)分子标记作为一种新型分子标记,含量丰富度仅次于SNP标记,相对于SNP标记的单碱基多态性突变,InDel标记可排除单碱基的无义突变[21]。InDel分子标记是一种基于高通量测序技术的应用,开发成本较低[22],适用于食用菌全基因组测序分子标记的开发[23],能有效地鉴定出样品间的亲缘关系。
1 InDel 分子标记的产生机制和特点
1.1 InDel 标记产生机制
在同一物种不同个体或亲缘关系较近物种的同源序列或基因组相同位点的序列中存在不同数量碱基的插入或缺失标记被称为InDel分子标记[24]。InDel产生主要与基因组序列本身特征和DNA复制错误有关[25]。通过对19个人类基因座编码外显子序列进行研究,发现当序列中含有GTAAGT序列以及嘌呤嘧啶在样本DNA两条链上的含量不平衡时,会增加缺失突变的发生概率,因此InDel的产生类型与所在序列的碱基种类有一定关系;当突变热点前后含有TACCRC序列和AT(A/C)(AC)GCC序列时会增加插入的发生率,而TATCGC序列会减少缺失率,GCGG序列会减少插入率也被确定[26]。有2/3的删除会删除重复序列,超过4/5的插入会创建重复序列,即它们是序列的复制品。基因序列中Poly(A/T)结构热稳定性较低,在DNA复制过程中聚合酶容易发生复制滑移,复制滑移会导致序列发生插入/缺失突变,复制滑移几率与序列GC碱基的含量成正相关;InDel分子标记的长度与其形成机制也有一定关系,一般来说,较长的InDel是由转座因子复制多拷贝或者非常规重组造成的,而较短的InDel位点是由于复制滑移导致[27]。
1.2 InDel 分子标记的特点
Mills等[28]于2006年通过InDel分子标记创建了第一个人类基因组的InDel图谱。通过对InDel位点序列分析发现,InDel分子标记可分为5种类型:(1)单个碱基插入/缺失;(2)单碱基对插入;(3)2—15 bp重复单元多碱基对插入;(4)随机DNA片段插入;(5)转座子插入。InDel长度变化范围很大,插入/缺失碱基数目在1—1 000bp,但99%以上的InDel长度小于50bp,平均长度为36bp[29]。
InDel在基因组中数目众多、分布广泛、密度大。 InDel分布和密度仅次于SNP[30-31],远高于SSR。冯芳君等[32]选用‘日本晴’和‘9311’筛选得到均匀分布在染色体上的20对InDel标记和53对SSR标记,分析91份样品的遗传多样性。结果表明,InDel标记相对于SSR标记具有数量多,扩增产物稳定,多态性高,易于检测等优点。InDel标记更准确、高效,可避免由基因序列复杂性和特异性导致的分型模糊,进而缩短育种周期。与SNP标记相比,InDel标记利用琼脂糖凝胶或者聚丙烯酰胺凝胶电泳即可进行分型检测,方法简便,对检测技术和设备要求较低[33]。
1.3 InDel 标记的开发
InDel标记作为高通量分子标记仍具有以PCR(聚合酶链式反应)扩增技术为基础的其他分子标记的优点。InDel标记的开发通常基于已知的基因组序列,利用 Blast比对同一物种不同个体的重测序数据,寻找该物种之间的碱基序列差异,挑选InDel序列长度在5—20 bp的位点,最后在InDel位点两侧搜索合适位置设计20 bp左右长度的序列作为扩增引物[32]。大量研究表明,InDel标记具有操作简单,重演性好,亚种间多态性高,结果准确,以及开发成本低等优点[34-35],适用于动植物分子辅助育种、遗传研究[36-41]等方面。因此,开发动植物中的 InDel 标记越来越受到研究者的关注,目前在医学诊断、人类遗传学[42-44]等领域应用广泛。
2 InDel分子标记在食用菌遗传育种中的应用
2.1 遗传图谱的构建
遗传图谱是进行分子标记辅助育种、基因定位、图位克隆的重要工具,为食用菌分子生物学的深入研究提供了依据[45]。周雁等[46]利用毛木耳杂交子 APM2—16 菌丝体和成熟子实体的转录组为基础,以 APM2—16 的 123 个担孢子单核体后代为作图群体,开发了包括 SSR、SCAR、CAPs、InDel 等一系列基因内分子标记,其中选用373 对InDel 引物进行亲本单核体间的群体基因型分型和多态性分析,经遗传连锁分析获得了一张由14个连锁群组成、含有160个基因内标记的毛木耳遗传图谱。
Gong等[47]利用SRAP、TRAP、InDel等共524个分子标记以146株孢子单核体菌株为构图群体,构建了一张包含13个连锁群的高密度香菇遗传图谱,连锁图全长1 006.1 cM,标记之间的平均遗传距离为2.0 cM,是迄今为止标记密度最饱和的香菇连锁图谱。在香菇遗传作图中,首次引入基于基因组设计的InDel标记,利用新増的InDel标记技术进行比较作图后,发现图谱的12个连锁群中有2个属于同一个连锁群,即图谱共包含11个连锁群。龚文兵[48]引入基于基因组开发的InDel分子标记技术,对前期构建的香菇遗传图谱进行改良。根据146个F1孢子单核体菌株为作图群体(M群体)进行连锁作图和基因型分析,获得了一张高密度的香菇单核体遗传图谱。这表明InDel分子标记可为遗传图谱与基因组序列的整合提供重要依据。
2.2 对性状标记和基因定位
功能性分子标记是建立在等位基因功能性基序中单核苷酸多态性位点功能性序列基础上的一类新型分子标记,根据近等基因系中等位基因或关联分析对数量性状进行标记,利用该标记可有效提高分子标记辅助选择育种的效率。髙质量的遗传连锁图谱是解析农艺性状遗传的准确标尺,在食用菌研究中获得与目的基因紧密连锁的分子标记是分子标记辅助育种技术快速发展和高效应用的基础。
培育出根据标记辅助选择(MAS)加速改良性状的新品种,是蘑菇育种家的长期以来的育种目标,但在食用菌领域尚未应用。Im等[49]利用28个InDel标记、226个SSR标记和2个交配因子,构建了白灵菇的遗传连锁图谱。该图谱由12个连锁群组成,全长1 047.8 cM,标记之间平均相距4.09 cM。基于KNR2312减数分裂后单核细胞标记物的分离分析,共256个位点被映射。以KNR2532的4个单核细胞作为试验菌株,与来自KNR2532的98个单核细胞杂交采用KNR2312对产量、品质、菌盖颜色、菌龄等9个性状进行了数量性状定位(QTL),为白灵菇遗传育种奠定了基础。利用分子标记对食用菌农艺性状和生理特性进行标记,为F2代进行遗传改造提供了数据资源,使育种目标更加明确。Gong等[50]基于香菇基因组重测序筛选出572个标记(包含82个InDel分子标记),这些标记定位在12个连锁群上,构建了长度为 983.7 cM的香菇高密度遗传连锁图谱,并在此基础上,在两个测交群体中利用QTLs定位了62个与7项香菇子实体表型相关性状。LI等[51]通过对89个香菇全基因组测序,使用297个分子标记(其中249个InDel标记)进行了基因分型,结果表明我国香菇品种具有丰富的遗传多样性、遗传位点和种群结构;对11个农艺性状的进一步关联分析,为香菇分子标记辅助育种提供了有利线索。
2.3 研究近缘种属间遗传进化关系和品种间遗传多样性
迄今为止,利用InDel分子标记技术分析食用菌的遗传进化关系未曾被报道,遗传多样性研究也仅于香菇。Xiang 等[52]从全国香菇主产区收集89个香菇野生菌株并构建了关联分析群体,筛选252对InDel引物对香菇栽培群体进行遗传多样性分析,共检测到800多个等位基因,其中82%具有多态性,通过InDel标记,把68株香菇划分为四个类群。Shannon信息指数和基因多样性的总体值分别为0.836和0.435,这表明所选香菇群体遗传多样性较为丰富,同时也说明InDel分子标记多态性较高,适用于食用菌遗传多样性研究。
3 展望
由于科学和经济等多方面原因,分子育种在不同作物间还存在很大的差异。作为一种基因特异性分子标记,在作物育种中已开始应用于鉴定水稻[53-54]和小麦[55]特异性和偏离分析、大白菜[56]育种材料身份证的构建、基于基因组重测序的棉花[57]、黄瓜[58]、辣椒[59-60]InDel 标记开发。由于InDel位点是通过基因组同源序列比对分析获得,但全基因组序列已知的生物物种有限,大多为模式物种或经济作物,对于食用菌而言,仅有香菇[61]、金针菇[62]、双孢菇[63]等30余种食用菌全基因组序列已测出[64],大量食用菌基因组序列未知,导致在食用菌领域大规模开发与应用InDel标记存在一定的难度。
随着基因组时代的到来,高通量测序技术的快速发展以及测序成本逐渐降低,国际公共基因序列数据库(GenBank、EMBL、DDBJl等)序列信息将越来越丰富,为食用菌基于全基因组开发功能性分子标记提供了前所未有的机遇。为了使 InDel标记在食用菌中发挥重要作用,应结合全基因组测序、扩增子重测序等技术,根据已挖掘的调控食用菌重要农艺性状的功能基因,开发出快速鉴定育种材料的InDel分子标记,为食用菌定向育种奠定基础。
在已知食用菌序列中对InDel标记方法研究较少,在食用菌遗传进化和分子辅助育种中尚未被报道,应拓展InDel标记在食用菌领域应用范围。InDel标记能更全面地揭示MAS群体的遗传结构,如QTL在MAS群体中的离散程度,加速遗传进化关系研究。另外,运用自动化基因检测手段,通过定向诱变、RNA干扰等提高基因的功能鉴定,加速食用菌分子育种产业化进程。
近年来,随着基因组学、分子生物学、生物信息学等多组学联合并与分子标记相结合,食用菌生理和育种方面已取得一些新的突破,相信未来会有越来越多的功能基因被挖掘,这为食用菌遗传规律实质的解读、开展现代分子标记辅助育种工作和生产应用等方面提供了极其广阔的利用价值和应用前景。可以预见,今后在食用菌的遗传育种研究中,InDel标记开发的可利用资源不断增加,InDel标记在食用菌研究领域中将会发挥更大的作用。