APP下载

橡胶草转录组SSR信息分析与标记开发

2019-04-28甘霖吴景杨玉双

热带农业科学 2019年1期
关键词:转录组

甘霖 吴景 杨玉双

摘 要 为了在总RNA水平上揭示橡胶草SSR分布规律和特性,利用GRAMENE网站提供的SSR鉴定工具SSRIT(Simple Sequence Repeat Identification Tool),对橡胶草6 756条无冗余的EST分别进行SSR鉴定。结果共搜查到2 761个1~6碱基SSR,出现频率最高的为单碱基重复基元类型,其次为三碱基重复基元类型与二碱基重复基元类型,分别为2 139、338与219个,其出现频率分别为77.5%、12.2%与7.9%。AG/CT为二核苷酸中优势重复类型,占其总数的73.1%;而AAG/CTT与ACC/GGT则为三核苷酸中优势重复类型,二者分别占三核苷酸SSR总数的24.3%与23.7%。设计了20对SSR引物并验证了它们在蒲公英属3个高度近缘种共24个不同个体中的存在情况。结果表明,引物扩增率为100%,多态率为95%,能够在DNA水平上将橡胶草(TKs)与其他2个高度近缘种短喙蒲公英(TB)及药用蒲公英(TO)有效地区分开。由此表明,将所开发的SSR标记用于橡胶草种质鉴定、蒲公英属不同种间多态性检测和彼此区分是可行的。

关键词 橡胶草 ;转录组 ;SSR ;种质鉴定

中图分类号 Q756 文献标识码 A Doi:10.12008/j.issn.1009-2196.2019.01.009

Abstract Russian dandelion is an important crop for natural rubber. In this study, simple sequence repeat identification tool was used to screen SSRs in Russian dandelion. A total of 2 761 SSRs were found in 6 756 unique root transcripts. Of the 2 761 SSRs, the most abundant SSR is the mon- nucleotide type, with the SSR numbers being 2 139, followed by the tri- and di- nucleotide ones, with 338 and 219 SSR numbers, accounting for 77.5%,12.2%,and 7.9%, respectively. Among the di-nucleotide repeats, AG/CT was the most motifs and accounted for 73.1%. However,AAG/CTT and ACC/GGT were both the most frequent motif among the tri-nucleotide repeats, accounting for 24.3% and 23.7%,respectively. 20 pairs of SSR primers were designed and tested for the presence of 24 individuals in 3 closely related species of Taraxacum. The results showed that the amplification efficiency was 100%, and the polymorphism efficiency was 95%. It could separate the Taraxacum kok-saghyz (TKs) from the other 2 relatives, Taraxacum brevirostre (TB) and Taraxacum officinale (TO), at DNA level. These results indicated that the developed SSR markers could be used for germplasm identification of TKs, and it was feasible to detect and differentiate different species between Taraxacum.

Key words russian dandelion ; transcriptome ; SSR ; germplasm identification

橡膠草(Taraxacum kok-saghyz Rodin, TKs)又名俄罗斯蒲公英(Russian dandelion),为菊科蒲公英属多年生草本植物,根部含有丰富的天然橡胶。原产于哈萨克斯坦、欧洲以及中国新疆等地,野生种质常分布于盐碱化草甸、河漫滩草甸及农田水渠边。甘肃、陕西以及东北、华北、西北等地也有分布[1]。橡胶草适应性强、生长收获期短,适合机械化种植和采收,并且具有较强的抗病虫、抗寒、抗旱能力以及较好的生物相容性、抗过敏性等优点,成为具有发展前途的巴西橡胶树橡胶替代作物[2]。另外,橡胶草也是研究植物产胶机理的良好模式植物和生物反应器,其根、叶中可以提取菊糖,提胶后的残渣可以加工成酒精、沼气,并且具有一定药用价值。橡胶草在模式植物研究、工业原料生产和生物质能源转换等领域均具有较好的发展前景[3],有助于缓解面临的能源和战略原材料短缺问题。由于目前国内对这一资源还缺乏系统的保护,对其遗传育种方面的研究更是滞后;此外,橡胶草原产地的过度放牧使野生橡胶草资源面临着灭绝的风险。因此如何快速对野生橡胶草资源进行系统搜集保存,利用现代分子标记技术快速开展育种研究,挖掘其产胶潜能有着十分重要的意义。

SSR分子标记因其具有信息量丰富、多等位性以及共显性等特点而得到了广泛应用,目前已成功从多种植物和微生物中开发出了SSR标记。一般而言,物种全基因组测序会受到基因组大小、重复序列及杂合度的影响,加之成本高,这使得短时间内获得大量序列信息面临着挑战。然而Denovo转录组测序不依赖于种基因组,能够快速、廉价地获得物种全转录本序列信息,其中蕴含着大量可用的SSR标记。本文利用已公布的橡胶草75 868条转录组数据,从中查找并分析橡胶草SSR序列信息,旨在总RNA水平上揭示橡胶草SSR分布规律和特性,同时为橡胶草遗传图谱构建、功能基因的定位和克隆、系谱分析提供实用的分子标记。

1 材料与方法

1.1 材料

从PlantGDB网站(http://www.plantgdb.org)下载75 868条橡胶草转录组数据。SSR扩增用的24份材料采集自中国新疆伊犁地区。

1.2 方法

1.2.1 数据预处理及其SSR位点筛选

利用blast软件进行比对,相似度≥80%的默认为同一序列,按照此标准进行去冗余拼接获得Unigene;利用SSRIT在线分析软件(http://www.gramene.org/db/searches/ssrtool)对获得的无冗余Unigene进行SSR鉴定。以重复序列总长≥24 bp作为SSR筛选标准,即单核苷酸,二、三、四、五和六核苷酸的最少重复次数分别在24次、12次、8次、6次、5次、4次以上。

1.2.2 SSR引物设计及多态性分析

对鉴定出的各EST-SSR进行比较,对于含同一个重复基元的多条Unigene,优先选取重复序列长、重复次数多的片段,在重复基元上下游合适的位置设计引物。引物设计原则为: GC含量45%~65%,Tm值55~65℃,引物序列长18~25 bp,且无错配、无发夹结构等。DNA提取参照天根DNA提取试剂盒方法进行。PCR扩增及多态性分析参照黄海燕等[4]方法进行。

2 结果与分析

2.1 橡胶草EST-SSR类型及频率分析

对75 868条橡胶草转录组序列进行去冗余和组装拼接,得到6 756条Unigene,总长度为5.13×106 bp。共鉴定到2 761个SSR,分布于2 376条无冗余的EST上,发生频率为35.2%(含有SSR的EST与无冗余EST数之比),SSR平均分布距离为1.86 kb。其中有323条Unigene包含有1个以上SSR(表1)。在2 761个SSR中,单核苷酸以及二、三、四、五、六核苷酸SSR分别为2 139、219、338、8、11和46个,出现频率分别为77.5%、7.9%、12.2%、0.3%、0.4%与1.7%(图1)。其中,二、三核苷酸基元类型分布最为广泛,以AG/CT基元为最丰富类型;在三核苷酸SSR中共存在10种不同基元类型,其中AAG/CTT与ACC/GGT为主导类型。

2.2 橡胶草EST-SSR多态性预测及引物设计

SSR标记多态性与其基元重复数密切相关[5],往往重复数越高,其变异概率越大[6-7],多态性越显著。多态性是判断分子标记是否可用的一个重要依据。为了提高引物的多态率,本研究将24 bp以下的低多态潜能SSR过滤掉,保留了重复次数依次为24、12、8、6、5及4次以上的单、二、三、四、五和六核苷酸Unigene。共鉴定到大于24 bp的SSR 303个(表2),占总SSR的11%。分别在303个EST-SSR的上下游合适位置设计引物,推测这些SSR在橡胶草上具有比较丰富的多态性。表3仅列出了其中20对SSR引物。

2.3 引物有效性检测

为了检测已设计的20对SSR引物在蒲公英属不同植株中的存在情况,分别对24份DNA进行扩增和电泳检测。结果发现20对引物在橡胶草基因组DNA中均能有效扩增(图2,部分结果),其中具有多态性的19对引物均能扩增出目标条带,占总引物数的95%。有的引物对甚至能扩出2个及以上的等位基因,如引物对Ts491F/R在橡胶草中能特异扩增出单一目标带,而在其它材料中存在2个或以上等位基因的情况(图2-i)。引物对Ts767F/R扩增出来的条带中存在明显的大小差异(图2-c);引物对Ts451F/R及引物对Ts661F/R扩增出来的条带大小差异多态明显(图2-d,2-g)。可见,基于橡胶草EST-SSR序列所开发的SSR标记在橡胶草植株中能够较好地扩增,而且能够在DNA水平上将橡胶草与其他2个近缘种短角蒲公英(TB)及普通蒲公英(TO)进行较好地区分。说明所开发的SSR标记对蒲公英属进行多态性检测和筛选是可行的。

3 讨论

由于橡胶草与蒲公英属的其他2个高度近缘种短喙蒲公英(TB)及药用蒲公英(TO)在形态上极为相似,因此如何快速、准确地鉴定橡胶草资源,挖掘优异种质并及时开展物种保护具有十分重要的意义。传统的依托植株外形进行品种鉴定或橡胶含量判定的办法往往存在较大的误差,可能降低育种以及品种改良的效率。因此,通过SSR标记开发和验證技术,快速准确地鉴定橡胶草种质,寻找与橡胶含量连锁的SSR分子标记,开展分子标记辅助(MAS)育种,将是获得高产橡胶草品系的快捷途径。

SSR标记已广泛应用于多物种的遗传多样性、连锁图谱构建、比较基因组学及关联分析等领域[8-9]。随着高通量测序技术的不断升级以及测序成本不断降低,越来越多的物种基因组与转录组数据被释放和公布,这为广覆盖、高效开发SSR标记提供了快速途径[10]。本研究对橡胶草的6 756条无冗余Unigene进行了SSR鉴定,共筛选到2 761个1~6碱基SSR,分布在2 376条无冗余的EST上,发生频率为35.2%。在搜索出来的SSR中,其中出现频率最高的为单碱基重复基元类型,其次为三碱基重复基元类型与二碱基重复基元类型。SSR平均分布距离为1/1.86 kb,低于安泽伟等[11]此前报道的巴西橡胶树的EST-SSR数值1/3.93 kb。

在本研究中,二碱基重复基元类型SSR中,共存在AC/GT、AG/CT、AT/AT等3种类型,其中AG/CT为主导类型;而在三碱基重复基元类型中共存在10种不同基序,其中AAG/CTT与ACC/GGT为主导类型,这与巴西橡胶树EST-SSR类似,其以二碱基和三碱基重复基元为主,分别以AG/TC和CTT/GAA为最多[11]。

为增大后续SSR标记开发的成功率,本研究过滤了多态潜能较低的24 bp以下SSR,最终获得303个SSR。验证了20对SSR引物在蒲公英属不同植株中的存在情况,对24份DNA进行PCR扩增的结果表明,引物均能在橡胶草基因组DNA中有效扩增;而且19对引物均显示出多态性。如图2所示,9对引物中的任意一对均能将TKs、TB及TO区分开,这在种质分子鉴定中具有一定的应用价值。本研究所获得的引物在橡胶草中是否如推测的那样具有丰富的多态性以及如何获得能够精细地将每个个体进行区分的分子标记,如何得到通用性及多态性更好的引物,还需扩大样本量进行检测,进一步通过实验验证。

参考文献

[1] 林伯煌,魏小弟. 橡胶草的研究进展[J]. 安徽农业科学,2009,37(13):5 950-5 951.

[2] Beilen J B V , Poirier Y . Establishment of new crops for the production of natural rubber[J]. Trends in Biotechnology, 2007, 25(11): 522-529.

[3] 趙平娟,安 锋,林位夫,等. 大力开展巴西橡胶树替代产胶植物及技术研发的建议[J]. 中国农学通报, 2012,28(34): 124-130.

[4] 黄海燕,杜红岩,乌云塔娜,等. 基于杜仲转录组序列的SSR分子标记的开发[J].林业科学,2013,49(5):176-181.

[5] Cho Y G,Ishii T,Temnykh S, et al. Diversity of microsatellites derived from genomic libraries and GenBank sequences in rice(Oryzasativa L.)[J]. Thero Appl Genet, 2000, 100:713-722.

[6] Upupa S M, Robertson L D, Weigand F, et al. Allelic variation at(TTA)n microsatellite loci in a word collection of chickpea(Cicerarietinum L.) germplasm[J]. Mol Gen Genomics, 1999, 261: 354-363.

[7] Burstin J, Deniot G, Potier J, et al. Microsatellite polymorphism in Pisum sativum[J]. Plant Breed, 2001, 120:311-317.

[8] Feng S J, Ma J H, Lin F, et al. Construction of an electronic physical map of Magnaporthe oryzae using genomic position-ready SSR markers[J]. Chinese Science Bulletin, 2007, 52(24): 3 346-3 354.

[9] Zheng Y, Zhang G, Lin F C, et al. Development of microsatellite markers and construction of genetic map in rice blast pathogen Magnaporthe grisea[J]. Fungal Genetics and Biology, 2008, 45:1 340-1 347.

[10] Cristancho M, Escobar C. Transferability of SSR markers from related Uredinales species to the coffee rust Hemileia vastatrix[J]. Genet Mol Res, 2008, 7(4):1 186-1 192.

[11] 安泽伟,赵彦宏,程 汉,等. 橡胶树EST-SSR标记的开发与应用[J].遗传,2009,31(3):311-319.

猜你喜欢

转录组
红麻肌醇加氧酶基因的分离及表达分析
红麻肌醇加氧酶基因的分离及表达分析
基于云计算的RNA—seq转录组数据分析流程初探
基于高通量测序的药用植物“凤丹”根皮的转录组分析
基于高通量测序的药用植物“凤丹”根皮的转录组分析
基于高通量测序的玄参根部转录组学研究及萜类化合物合成相关基因的挖掘
多穗柯转录组分析及黄酮类化合物合成相关基因的挖掘
基于转录组测序的山茱萸次生代谢生物合成相关基因的挖掘
金钗石斛转录组SSR位点信息分析
人参属药用植物转录组研究进展