甘薯近缘野生种ISBP分子标记的开发及其在遗传多样性分析和品种鉴定中的应用
2023-04-05孟羽莎赖齐贤吴永华郑嫣然顾兴国吴列洪
孟羽莎, 王 寅, 赖齐贤, 刘 雷, 项 超, 吴永华, 郑嫣然, 顾兴国,方 豪, 苗 苗, 吴列洪, 汤 勇,*
(1.浙江省农业科学院 农村发展研究所,浙江 杭州 310021; 2.农业农村部创意农业重点实验室,浙江 杭州 310021; 3.浙江省农业科学院 作物与核技术利用研究所,浙江 杭州 310021)
甘薯[Ipomoeabatatas(L.) Lam.]是世界重要的粮食作物,广泛种植于100多个国家和地区,据FAO统计,中国年总种植面积为2 373 737 hm2,年产量为5 199.21万t,分别占世界年总种植面积和年产量的30.6%和56.6%,是最大的甘薯生产国。甘薯高产、稳产,耐瘠薄,生长适应性广,不与粮争地[1]。甘薯营养价值丰富,含有大量的淀粉、可溶性糖、氨基酸、多种维生素、蛋白质、膳食纤维和矿质元素。《本草纲目》中有记载,红薯有“补虚乏,益气力,健脾胃,强肾阴”的功效,使人“长寿少疾”。甘薯不仅是重要的粮食和保健食品,而且也是重要的饲料和工业原料。近年来,随着能源消费需求不断增长,甘薯作为一种高效、无污染的生物质能源作物备受瞩目并被人们大量地研究利用[2]。
甘薯为同源六倍体作物,染色体多且结构复杂(2n=6x=90,4.4 Gb,单套染色体大小在700~800 M)[3],基因组中富含大量的重复序列[4],这些特点使得甘薯基因组学的研究远落后于水稻、玉米等二倍体植物,严重制约了甘薯功能基因组学研究和分子育种工作的深入。分子标记技术可以在不受外界环境影响的情况下,准确地在DNA水平上进行有效选择[5],已成为物种亲缘关系鉴定、遗传规律分析及高密度遗传图谱构建等研究的主要方法。近年来,三代测序技术的快速发展为分子标记的开发提供了新的办法。目前,基于RAD-seq和基因组测序技术已经开发了一些SSR、RBIP及SNP标记,并用于遗传分析、图谱构建及QTLs定位中[6-11]。但由于标记数目不够,图谱密度依然在2 cM以上,很难进行精细定位[6,8,11]。目前甘薯中的分子标记都是根据栽培种六倍体的序列得到的,栽培种六倍体的雏形可能是由近缘野生种二倍体祖先和四倍体祖先发生一次自然杂交后染色体加倍形成的[12],但是目前尚缺乏来自近缘野生种二倍体基因组的分子标记,其在甘薯材料的亲缘关系、遗传进化树分析等方面的作用也尚未可知。因此,本研究旨在通过近缘种二倍体祖先的基因组序列设计开发多态性分子标记,一方面可以增加甘薯中有效的多态性标记数量,另一方面可以填补来自二倍体基因组序列的分子标记的空白,探究其在栽培种六倍体中的应用价值,推动分子标记辅助育种在甘薯育种实践中的应用。
植物基因组中有大量的重复序列,其中包含转座子,根据转座子转座的方式将其分为2类:Class Ⅰ是逆转录转座子,通过RNA利用“复制粘贴”机制来完成转座;Class Ⅱ转座子通过DNA利用“剪切粘贴”机制来完成转座[13]。逆转座子(Class Ⅰ)是经DNA转录为RNA,再通过反转录成为cDNA并插入到基因组中新的位点上的因子,它在植物基因组内分布广泛,具有高拷贝性及高异质性,对植物基因组的组成、结构和功能具有重要影响,在植物基因组进化过程中发挥了重要作用[14-17]。逆转座子通常处于静止状态,但在各种生物和非生物因子的胁迫下可诱导其发生转座,导致基因突变、基因组扩增及重排,造成植物的遗传变异[14]。利用逆转座子的以上特点开发了几类常见的逆转座子分子标记:序列特异扩增多态性(sequence-specific amplification polymorphism,SSAP)、反转录转座子间扩增多态性(inverse retrotransposon amplified polymorphisms,IRAP)、 反转座子微卫星间扩增多态性(retrotransposon microsatellite amplified polymorphism,REMAP)、基于反转录转座子插入的多态性(retrotransposon based insertion polymorphism,RBIP)、基于插入位点的多态性(insertion-site-based polymorphisms,ISBP)[18-23]。逆转座子的分子标记具有灵敏度高、覆盖面广、多态性高等显著优点,因此,逆转座子分子标记在很多物种中得到了应用,比如油菜、玉米、小麦、血橙、大麦、桦木等[16,24-29]。但是,甘薯基因组逆转座子标记开发的相关报道较少,且主要是RBIP标记[6,8,10],ISBP类型的分子标记鲜有报道。因此,开发更多的、新类型的逆转座子标记并将其应用于甘薯遗传关系分析和分子育种实践中具有重要意义。
本研究利用甘薯近缘野生种Ipomoeatriloba和Ipomoeatrifida的基因组测序序列[30],根据LTR harvest软件进行LTR逆转座子预测。使用ClustalW找出获得的LTR保守区,对比到基因组中进行ISBP引物设计。利用2015和2016年资源普查时收集的甘薯种质资源作为试验材料,提取基因组DNA,随机选取4份材料评估ISBP引物的多态性,得到的高多态性ISBP引物再用于56份种质资源的遗传多样性分析和品种鉴定。本研究不仅丰富了甘薯中逆转座子标记的数量,而且为后续甘薯品种资源鉴定、保护和利用提供了有力工具,对推动分子标记辅助选择育种和QTL精细定位也具有重要意义。
1 材料与方法
1.1 实验材料及基因组DNA的提取
本试验所用的56份甘薯种质资源来自第三次全国农作物种质资源普查与收集行动浙江甘薯种质资源种植苗圃。在甘薯种质资源营养生长早期(秧苗种植一个月后)取各株系3~4片新鲜叶片,用液氮迅速冷冻,利用改良的CTAB法提取基因组DNA,最终将每份种质的DNA浓度稀释到50 ng·μL-1备用[31]。
1.2 甘薯LTR-RT序列的获得与分类
从网站(http://sweetpotato.uga.edu/)获取甘薯近缘野生种Ipomoeatrifida和Ipomoeatriloba的基因组数据,利用LTRharvest软件对基因组数据进行分析,搜索LTR全长序列,搜索标准为LTR长度范围为100~1 000 bp, LTR起始点之间的距离在1 000~15 000 bp,相似临界值为85%,每个靶位点重复序列的长度为4~20 bp,并且两个完全相同的LTR两侧要有4~6 bp的靶位点重复序列或者类似多嘌呤束和引物结合位点。将检索出的LTR序列进行六码翻译,得到相应的蛋白序列,从PFAM数据库下载Coipa和Gypsy(gag,PF03732;integrase,PF00665;reversetranscriptase,PF00078和PF07727)的多比对数据进行Coipa和Gypsy家族及亚家族的分类,在此基础上进行ISBP引物设计。
1.3 ISBP引物的获得与评价
利用Clustalw找出获得的LTR序列的保守区,然后BLAST到基因组,利用Primer3根据LTR的保守区和侧翼序列设计ISBP上下游引物。设计原则如下:引物长度18~25 bp,扩增产物100~1 000 bp,GC含量35%~55%,退火温度50~61 ℃,且上下游引物退火温度相差不超过5 ℃。设计的引物由北京擎科生物科技有限公司(Tsingke Biotechnology Co., Ltd.)合成。
100对ISBP引物的多态性分别利用4份种质资源进行筛选。本研究随机抽取到的材料有胜利百号、六十日-龙泉、超声5号、万斤薯、广薯87、浙薯75,打乱顺序后随机选取4个DNA进行PCR制作。PCR反应体系如下:2×Hieff PCR Master Mix (HieffTaqDNA Polymerase、dNTP混合物、MgCl2) 12.5 μL,10 μmol·L-1正、反向引物各1 μL,50 ng·μL-1DNA 模板3 μL,ddH2O 7.5 μL。PCR扩增程序如下:94 ℃预变性5 min;94 ℃变性30 s,59 ℃复性1 min,72 ℃延伸1 min,35个循环;最后72 ℃充分延伸10 min,4 ℃降温保存。用德国Biometra TRIO/Biometra TAdvanced Twin进口PCR仪进行扩增,扩增结束后向扩增产物中加入6×Loading Buffer,使用PCR仪变性程序:94 ℃ 5 min,变性结束后立刻放置冰水混合物中降温。将变性好的PCR产物于6%变性聚丙烯酰胺凝胶上进行电泳,恒功率65 W,电泳1.5 h,用北京六一生物科技有限公司电泳设备进行电泳。100 bp DNA Ladder作为marker,所用试剂均购于Thermo Fisher Scientific。电泳结束后进行银染、显色,拍照记录,具体操作参照李慧[32],选取扩增产物差异明显、清晰、稳定的条带作为多态性条带,筛选出来进行群体分析。
1.4 ISBP标记在遗传多样性分析和品种鉴定中的应用
将筛选得到的多态性ISBP引物在56份甘薯种质资源中进行PCR分析,PCR反应体系及程序同1.3节。按照每对引物在56份甘薯资源中出现与否的规律进行统计记录,选取清晰、稳定的条带,“有带”记作“1”,“无带”记作“0”,得到56份资源的“0”“1”数字矩阵,即数字指纹图谱,根据“0”“1”数据利用Popgene软件计算有效等位基因数 (effective number of alleles,Ne*),根井正利基因多样性指数(Nei’s gene diversity,H*),Shannon多样性指数(Shannon’s information index,I*)和基因频率(gene frequency)。再根据基因频率,利用PIC_Calc 0.6软件进行PIC计算。根据得到的“0”“1”数字矩阵利用NTsys-pc软件分析56份种质资源间的遗传相似度、遗传距离并进行PCA分析,根据NTsys-pc得到的遗传距离利用MEGA软件进行UPGMA聚类分析。
2 结果与分析
2.1 甘薯二倍体基因组中LTR-RT的筛选与分类
通过利用LTR harvest在甘薯基因组中搜索,根据搜索和筛选条件得到2 360条LTR-RT序列,其中318条属于Copia家族,2 042条属于Gypsy家族。根据BLAST将2 360条序列进行了亚家族的划分,I.triloba基因组中Copia家族包括162条LTR序列,被划分为140个亚家族,128个亚家族只含1条LTR序列,6个亚家族含2条LTR序列,6个亚家族含3及以上条LTR序列;I.triloba基因组中Gypsy家族含1 177条LTR序列,被划分为1 124个亚家族,其中1 102个亚家族只含1条LTR序列,13个亚家族含2条LTR序列,9个亚家族含3及以上条LTR序列;I.trifida基因组中Copia家族有156条LTR序列,被划分为135个亚家族,其中126个亚家族只含1条LTR序列,4个亚家族含2条LTR序列,5个亚家族含3及以上条LTR序列;I.trifida基因组中Gypsy家族包含865条LTR序列,被划分为841个亚家族,其中826个亚家族只含1条LTR序列,12个亚家族含2条LTR序列,3个亚家族含3及以上条LTR序列(表1)。
表1 LTR-RT分类结果
从家族的划分来看,I.triloba中包含162条Copia家族的LTR-RT序列,I.trifida中包含156条Copia家族的LTR-RT序列,两者比例约为1∶1,而I.triloba中Gypsy家族的LTR-RT的数量(1 177)明显多于I.trifida(865)。无论是在I.triloba中还是在I.trifida中,Gypsy家族中LTR-RT的数量均是Copia家族中LTR-RT数量的5~7倍。在亚家族划分中,I.triloba和I.trifida的Copia家族中亚家族的数量均是Gypsy家族中亚家族数量的1/6至1/7。在不同亚家族中,含3个及以上LRT-RT的亚家族数量占比最小,在I.triloba和I.trifida中分别为1.18%和0.82%,只含1个LTR-RT的亚家族占比最大,分别为96.62%和97.54%。
2.2 甘薯二倍体基因组ISBP引物的评价与指纹图谱构建
根据搜索及筛选得到的2 360条LTR-RT序列,BLAST到基因组序列,利用Primer3软件在LTR的保守区和侧翼序列设计上下游引物。根据引物设计的原则,共得到100对ISBP引物,其中32对属于trifida_Copia家族,34对属于triloba_Copia家族,34对属于triloba_Gypsy家族。100对ISBP引物的退火温度在57~61 ℃,GC含量在36%~60%,扩增产物长度为202~959 bp。
从收集的56份种质资源中随机选取4份材料,利用变性聚丙烯酰胺凝胶对100对ISBP引物进行多态性筛选,结果显示,24对ISBP引物扩增的条带清晰、稳定、特异性强(图1)。将24对多态性好的ISBP引物用于56份种质资源的指纹图谱构建和遗传多样性分析(图2)。
M,100 bp DNA ladder;1~16,分别对应17~32号引物。
通过PCR鉴定,24对ISBP引物在56份种质资源中产生182条多态性条带,并构建了56份种质资源的“0”“1”数字指纹图谱。遗传多样性分析表明:24对ISBP引物的有效等位基因数(effective number of alleles,Ne*)从1.251 4到1.823 9,平均值为1.551 4,处于比较高的范围;Nei’s基因多样性(Nei’s gene diversity,H*)范围为0.172 6~0.445 0,平均值为0.321 2,香农信息指数(Shannon’s information index,I*)从0.283 8到0.635 2,平均值是0.480 3,说明基因多样性处于中等水平,引物多态性信息含量(PIC)范围为0.200 8~0.339 6,平均值为0.289 6,信息含量处于中等偏上(表2)。综合这些特征可以看出,这24对ISBP引物具有良好的多态性,可以作为多态性分子标记用于甘薯品种遗传分析。
2.3 甘薯品种遗传多样性分析和品种鉴定
根据24对ISBP引物得到的182条多态性条带对56份甘薯资源进行亲缘关系分析。结果表明,56份甘薯资源的遗传距离范围从0.027 5至0.653 8,平均遗传距离为0.373 2,遗传距离范围较小,平均遗传距离比较低,表明这56份资源之间的遗传背景比较窄,亲缘关系较近。
根据遗传距离进行UPGMA聚类分析,结果如图3所示,这24对引物能将所有种质资源完全区分开,每一份种质资源都有自己独特的指纹信息。从图3中可以看出,56份资源共分为2个群体,第一个群体包含11个种质资源,第二个群体有两份种质资源独自在一个分支上,其余被划分为4个亚群,每个亚群上有6~17个种质资源。从收集地点和聚类分析比较来看,淳安县有4份材料,其中2份聚类在同一亚群上;建德市的4份材料中有2份聚类在同一亚群上;缙云县的4份材料中有2份聚于同一亚群上;黄岩区的2份材料聚在同一亚群上;莲都区的2份材料聚在同一亚群上,而其他材料聚集方式与收集地点关系不大。这些种质资源的聚类主要是由基因型决定的,尽管这些种质资源的遗传背景狭窄,但通过这24对ISBP引物的鉴定,每份资源的数字指纹依然具有很强的特异性,说明了这24对引物在种质资源保护和品种鉴定中具有非常大的应用价值。
对56份材料进行主成分分析(principal component analysis,PCA),结果显示,第一主成分特征值为0.81,第二主成分特征值为0.74,第三主成分特征值为0.91(图4),从特征值的范围来看,材料分布比较集中,说明材料间遗传变异较小。
图4 五十六份种质资源的主成分分析
3 讨论
逆转座子标记是根据长末端重复(LTR)逆转录转座子开发的,前人研究发现,LTR逆转录转座子在全基因组中占的比例很大[14-17],例如,梨的全基因组中有42.4%为LTR逆转录转座子[33];玉米中有5个逆转录转座子家族占了全基因组的60%[34];在300万年前,水稻中逆转录转座子australiensis转座导致水稻全基因组大小几乎增加了一倍[35]。甘薯中有报道称,Class Ⅰ类型逆转座子占了所有重复DNA含量的69.92%,占总基因组的8.51%,其中,LTR逆转录转座子占总逆转座子的86.52%,占总基因组的7.37%,且Ty3-Gypsy与Ty1-Copia的比例约为1∶1.15[4],意味着Ty3-Gypsy和Ty1-Copia在甘薯基因组中的贡献程度几乎一致。
前人从甘薯中开发的逆转座子标记的方法主要是利用测序平台,基于引物结合位点进行双末端测序来构建文库,筛选出合适的LTR,再用于开发分子标记,利用这种方法开发的标记品种特异性较强,在其他种质资源中多态性会受到限制,不能广泛地应用于此物种的遗传分析中。而本研究是基于甘薯近缘野生种Ipomoeatriloba和Ipomoeatrifida的基因组测序序列[30],通过搜索和筛选LTR序列,进而开发ISBP标记,由基因组得到的ISBP分子标记在甘薯亲缘关系分析、品种鉴定和多样性分析中具有普遍适用性。本研究共鉴定出318个Ty1-Copia家族和2 042个Ty3-Gypsy家族的LTR逆转录转座子,比例为1∶6.42,意味着Ty3-Gypsy家族的逆转座子对Ipomoeatriloba和Ipomoeatrifida基因组的贡献更大,这与栽培种中的情况是截然相反的[4]。原因可能是在栽培种自然杂交基因组重组的过程中Copia家族的转座子比Gypsy家族的更活跃,也可能是在栽培种不断进化中Copia家族的转座子更容易受到外界环境的影响,从而被激活的频率较高。根据Ty1-Copia和Ty3-Gypsy的比例可以间接地估计转录因子的转录活性,同时有助于基因组数据的注释。
本研究从Ipomoeatriloba和Ipomoeatrifida近缘野生种基因组序列中筛选得到了2 360条LTR-RT序列,根据保守区和侧翼序列设计了100对ISBP引物。经过PCR扩增和6%变性聚丙烯酰胺凝胶实验表明24对ISBP引物在56份供试品种中多态性较好,共产生182条多态性条带,每对引物的多态性条带为4至15不等,平均每对引物有7.6条清晰稳定的差异性条带,使每份种质资源均有自己独特的指纹信息,并将其完全区分开。以上结果表明,甘薯近缘野生种中开发的分子标记能够应用于栽培种中,并展现出了良好的多态性。Nei’s基因多样性(H*)从0.172 6到 0.445 0,平均值为0.321 2,基因多样性又被称为异质性指数,其值越高说明基因间差异性越大,从平均值来看,供试群体内个体间基因差异性较小,这与群体的遗传距离(0.373 2)显示的结果是相同的。香农信息指数(I*)从0.283 8到0.635 2,平均值为0.480 3,表明供试群体的多样性处于中等偏下水平。多态性信息含量(PIC)主要用于衡量一个标记用于检测群体多态性的情况,24对ISBP引物在56份供试群体中的PIC值从0.200 8~0.339 6,平均值为0.289 6,显示了这24对引物较高的多态性。虽然群体的遗传变异较小,遗传背景较窄,但24对引物的PIC值依然处于偏上水平,表明了本研究的24对ISBP引物在甘薯亲缘关系分析、品种鉴定和遗传进化分析等中具有较高的应用价值。
从UPGMA聚类图和PCA分析来看,56份材料被分为2个大群,第一个群体包含11个种质资源,第二个群体有2份种质资源独自在一个分支上,其余被划分为4个亚群,每个亚群上有6~17个种质资源,PCA主成分的特征值范围(0.74~0.91)显示这些种质资源的遗传物质是相对集中的。对聚类情况和收集地点进行比较分析发现有5对来自同一地点的材料分别分布于不同的亚群中,说明本研究中这些材料的亲缘关系和收集地点具有一定的关系。图中黄皮红心和金瓜黄遗传物质非常接近,遗传距离为0.027 5,它们的表型性状也非常相似,经过分子标记鉴定,这两个材料可能原来为同一份种质资源,但经过长期自留种的无性繁殖使遗传物质出现分离。金瓜黄与红皮黄心(东阳)聚在一个亚群上,这一结果与本研究室前期研究结果一致[10],说明这两份材料的亲代中可能至少有一个是相同的[10]。
综上,本研究从甘薯野生种二倍体材料Ipomoeatriloba和Ipomoeatrifida基因组测序序列中开发了24对多态性良好的ISBP引物,经过56份甘薯种质资源的评估,这24对引物在甘薯品种亲缘关系、品种鉴定及遗传结构分析中具有很大的应用价值。本研究证实了野生种二倍体基因组开发的分子标记在栽培种中的可应用性,开发的ISBP标记增加了甘薯中逆转座子标记的数量,填补了ISBP标记在指纹图谱构建及种质资源多样性分析中的空白,为甘薯品种资源鉴定、保护与利用提供了理论依据,为甘薯QTL定位和分子标记辅助选择育种提供了有力工具。