APP下载

咖啡叶锈病菌转录组SSR信息分析

2014-04-29吴伟怀等

热带作物学报 2014年8期
关键词:转录组

吴伟怀等

摘 要 咖啡叶锈病是咖啡一种毁灭性病害。利用GRAMENE网站提供的SSR鉴定工具SSRIT(Simple Sequence Repeat Identification Tool),对咖啡叶锈病菌8 310条无冗余的EST分别进行SSR鉴定。结果共搜查到1 292个1~6碱基SSR,出现频率最高的为三碱基重复基元类型,其次为二碱基重复基元类型与六碱基重复基元类型。分别为459、321与214个,其出现频率分别为35.5%、24.8%与16.6%。AT/AT为二核苷酸中优势重复类型,占其总数的49.8%;而ATC/ATG与AAG/CTT则为三核苷酸中优势重复类型,二者分别占三核苷酸SSR总数的23.5%与23.3%。进一步对SSR多态性进行了预测,从而筛选出长度在22 bp以上具有潜在多态性的SSR 223个。此结果对于咖啡叶锈病菌群体遗传变异、多样性和进化等研究提供了分子标记。

关键词 咖啡叶锈病菌;转录组;SSR

中图分类号 S432.4 文献标识码 A

Transcriptome Sequences SSR Information Analysis

of Coffee Leaf Rust

WU Weihuai1, ZOU Haijuan2, HE Chunping1 *, LIANG Yanqiong1

XI Jingen1, ZHENG Xiaolan1, ZHENG Jinlong1, LI Rui1, YI Kexian1 *

1 Environment and Plant Protection Institute, CATAS, Haikou / Ministry of Agriculture Key Laboratory for Monitoring and Control

of Tropical Agricultural and Forest Invasive Alien Pests / Hainan Key Laboratory for Detection and Control of Tropical

Agricultural Pests, Haikou, Hainan 571101, China

2 College of Environment and Plant Protection, Hainan University, Haikou, Hainan, 570228, China

Abstract Leaf rust, caused by Hemileia vastatrix, is a devastating disease of coffee plants(Coffea arabica L.). In this study, simple sequence repeat identification tool(SSRIT)was used to screen Simple Sequence Repeat(SSRs)in coffee leaf rust transcriptome. A total of 1 292 SSRs were found in coffee leaf rust transcripts. Of the 1 292 SSRs, the most abundant SSR is the tri- nucleotide type, with the SSR numbers being 459, followed by the di- and hexa- nucleotide ones, with 321 and 214 SSR numbers, accounting for 35.5%, 24.8%,and 16.6%, respectively. Among the di-nucleotide repeats, AT/AT was the most motifs and accounted for 49.8%. However, ATC/ATG and AAG/CTT were both the most frequent motif among the tri-nucleotide repeats, accounting for 23.5% and 23.3%, respectively. Furthermore, the polymorphism of SSRs was assessed by filter out in the length of more than 22 bp SSR, and 223 potentially polymorphism SSRs were identified. Therefore, these results are useful to analyze genetic viaration, diversity, and evolution of coffee leaf rust pathogen.

Key words Coffee leaf rust; Transcriptome; Simple sequence repeat(SSR)

doi 10.3969/j.issn.1000-2561.2014.08.024

由Hemileia vastatrix引起的咖啡叶锈病是咖啡一种主要病害[1]。在适宜的气候条件下该病严重发生时,可以导致叶片损失最多可达50%,浆果损失可高达70%[2]。采用抗性品种是控制该病害比较经济适用与环保的方法[3-4]。然而,培育新的抗性品种需要花费大量的时间,即使是培育出来的抗性品种在推广几年后仍然面临着由于病原菌的变异而克服其抗性的风险[5]。由此可见,如何利用现代分子标记技术快速掌握与监测病原菌小种与寄主互作过程中群体动态变化及其趋势,对于防止咖啡叶锈病有着十分重要的意义。

在许多分子标记中,SSR分子标记由于其具有信息量丰富、多等位性以及共显性等特点被公认为是检测与监测病原菌变异中一种理想的分子标记。目前已成功从稻瘟病菌[6]、粗糙脉孢菌[7]、构巢曲霉菌[8]、禾谷镰刀菌[9],以及剑麻茎腐病菌[10]等多种植物病原菌中开发出了SSR标记并广泛应用。最近2个来自咖啡叶锈病菌冬孢子与附着胞的转录组数据已经公布[11],这为开发咖啡叶锈病菌EST-SSR标记提供了可能。为此,笔者利用咖啡叶锈病菌冬孢子与附着胞的共9 234条转录组数据,从中查找并分析咖啡叶锈病菌SSR序列信息,以期为进一步利用这些SSR信息奠定基础。

1 材料与方法

1.1 材料

从网站http://www.frontiersin.org/journal/10.3389/

fpls.2014.00088/abstract下载9 234条咖啡叶锈病菌转录组数据。

1.2 方法

1.2.1 数据预处理及其SSR位点筛选 利用blast 软件进行比对,以相似度 大于80%时即为同一个EST的标准进行拼接,从而获得Unigene;利用SSRIT在线分析软件(http://www.gramene.org/db/searches/ssrtool)对Unigene序列进行SSR搜索。SSR筛选的标准为:单核苷酸,二、三、四、五和六核苷酸的最少重复次数分别为20、6、5、4、3、3 次以上。

1.2.2 SSR引物设计 对鉴定出的各EST-SSR进行比较,选取含有碱基数较大的SSR的核苷酸序列,在其基元上下游合适的位置,通过软件primer5.0设计引物。设计引物基于下列原则: 引物一般要求GC含量40%~65%,Tm值55~65 ℃,引物序列长18~25 bp,且无错配、不形成二聚体和发夹结构等。

2 结果与分析

2.1 叶锈病菌EST-SSR 类型及其出现频率

9 234条咖啡叶锈病菌转录组数据序列,经过去冗余处理后得到8 310条无冗余的Unigene,总长度为5.3×106 bp,经搜索共发掘出1 292个SSR,分布在997条无冗余的EST上,发生频率为12%(含有SSR的EST与无冗余EST数之比),SSR平均分布距离为4.1 kb。其中有199条EST序列中包含有1个以上SSR(表1)。在1 292个SSR中,单核苷酸,以及二、三、四、五、六核苷酸SSR分别为17、321、459、101、180和214个,其出现频率分别为1.3%、24.8%、35.5%、7.8%、13.9%与16.6%(图1)。由此表明,出现频率最高的为三核苷酸基元类型、其次为二核苷酸基元类型、接着为六核苷酸基元类型。而就SSR重复次数数量而言,出现频率较高的则是重复数为4、6以及7,三者出现次数均在200次以上(数据未列出)。

2.2 二核苷酸碱基元组成及其频率

由于二、三核苷酸基元类型分布最为广泛,为此进一步对二者核苷酸基元及其频率作进一步地深入分析。在321个二核苷酸SSR中,共存在AC/GT、AG/CT、AT/AT以及CG/CG等4种核苷酸基元类型,其数量分别为49、111、160及1个,分别占二核苷酸SSR总数的15.3%、34.6%、49.8%及0.3%。由此可见,AT/AT基元为二核苷酸SSR中最为丰富类型(图2)。

2.3 三核苷酸碱基元组成及其频率

在三核苷酸SSR中共存在10种不同基元类型,根据其出现频率又可分为4种类型:第一类为出现次数最多的2个基元ATC/ATG与AAG/CTT,分别出现108和107次,占三核苷酸SSR总数的24%与23%;第二类为出现次数介于40~60次,包括AAC/GTT与AAT/ATT等2种基元类型,二者出现次数分别为56及53,其出现频率依次为12.2%及11.5%。第三类为出现次数介于20~39之间,包括ACT/AGT、AGC/CTG、ACC/GGT与AGG/CCT等4种基元类型;第四类则为出现次数低于10,包括ACG/CGT与CCG/CGG 2种基元类型,二者均只出现7次(图3)。

2.4 所发掘的叶锈菌EST-SSR多态性预测及引物设计

由于多态性是判断分子标记可用性的一个重要依据。而SSR标记多态性又与其基元重复数密切相关[12],而且重复数越高,其变异概率越大[13-14]。为此,进一步过滤掉多态潜能较低的22 bp以下SSR。即单核苷酸,二、三、四、五和六核苷酸的最少重复次数分别为22、11、8 、6、5、4次及以上。结果表明,搜索出大于22 bp SSR共计223个(表2),占总SSR的17.3%。在223个EST-SSR其上下游合适位置设计引物。推测这些SSR在咖啡锈菌上具有比较丰富的多态性。表3仅列出了其中20对SSR引物。

3 讨论与结论

咖啡叶锈病是威胁小粒咖啡的重要病害[1]。该病原菌目前具有至少45个生理小种,因此如何快速、准确地了解该病原菌的生理小种的变化动态对于预警与防控该病害有着十分重要的作用。传统监测该病害的生理小种动态及变化趋势一贯采用鉴别寄主,依据鉴别寄主的反应型最终确定其生理小种。该方法不仅费时而且费力。因此,如何利用现代分子标记技术快速准确监测病原菌的变化情况是一条比较快捷的途径。

SSR标记已经成为一种有效的、应用最广泛的分子工具,已广泛地用于病原菌的遗传多样性、连锁图谱构建、比较基因组学及关联分析等领域[6,15]。SSR标记开发途径归纳起来有3条,其一为基于基因组序列进行SSR位点筛选;其次是利用同源或相关物种SSR信息而开发标记,通过验证其转移性,从而到达开发目的物种或病原菌SSR[16];第三则是基于现有转录组数据库信息进行SSR标记开发。在这三种方法中,第一种方法由于基于基因组序列,分析工作量比较大,而且如果没有已测序的话,则开发成本较高;第二种方法则常常面临转移率的问题,限制了SSR开发的效率;比较而言,利用 EST 数据开发 EST-SSR 标记比较简单有效,并且 EST 本身是基因的一部分,其变化可能直接导致与该基因相关功能的改变。

随着生物技术的高速发展,以及高通量技术的应用和测序费用不断降低,越来越多的病原菌基因组与转录组数据被释放和公布。这为开发SSR标记提供了丰富的资源。本研究对咖啡叶锈病菌冬孢子与附着胞的转录组数据中的8 310条无冗余的Unigene 进行了 SSR 搜索,结果共筛选到1 292个1~6碱基SSR,分布在997条无冗余的EST上,发生频率为12%。在搜索出来的SSR中,其中出现频率最高的为三碱基重复基元类型、其次为二碱基重复基元类型与六碱基重复基元类型。而早前对剑麻茎腐病菌基因组SSR的分析结果表明,含9个碱基重复基元类型最多,其次为6个碱基重复基元类型,接着为3个碱基重复类型[10]。比较而言,在构巢曲霉菌基因组中,五核苷酸基元类型为优势的类型,其次为六碱基以及三碱基类型,而最少的类型则是二核苷酸重复类型[8]。在粗糙脉孢菌基因组中,其主导类型是三碱基SSR,数量达到4 729个,其次为六碱基SSR(2 940个)和单碱基SSR(2 489个);而数量最少的是二碱基SSR[7]。由此表明,不同病原菌菌体中SSR类型存在明显差异。上述这些差异一方面可能是由于不同病原菌之间的真实SSR信息差异,但也有小部分可能由于搜寻SSR时所设定长度最低标准等参数设置的不同而导致的。

除此之外,不同病原菌主导重复基元的类型也存在着差异。在本研究中,二碱基重复基元类型SSR中,共存在AC/GT、AG/CT、AT/AT以及CG/CG等4种类型,其中AT/AT为主导类型,而在三碱基重复基元类型中共存在10种不同基序,其中ATC/ATG与AAG/CTT为主导类型。这与水稻稻瘟病菌中SSR 的分布有明显差异,因为在其双核苷酸SSR中,数量最多的是AG类;三碱基SSR中,ACG、AGC、AAG和GGC是其中主要的组成部分,每一类SSR的数量都在500个以上[17]。

本研究进一步过滤了多态潜能较低的22 bp以下SSR,最终共获得了223个SSR。推测这些引物在咖啡叶锈病菌中具有丰富的多态性。当然,这些标记是否如推测的那样具有丰富的多态性,还需要进一步地验证。

参考文献

[1] Silva M C, Várzea V, Guimaraes L G, et al. Coffee resistance to the main diseases: leaf rus tand coffee berry disease[J]. Braz J PlantPhysiol, 2006, 18: 119-147.

[2] Daivasikamani S, Rajanaika. Biological control of coffee leaf rust pathogen, Hemileia vastatrix Berkeley and Broome using Bacillus subtilis and Pseudomonas fluorescens[J]. Journal of Biopesticides, 2009, 2(1): 94-98.

[3] Gichimu B M. Field screening of selected Coffea arabica L. genotypes against coffee leaf rust[J]. Afr J Hort Sci, 2012, 6: 82-91.

[4] Alwora G O, Gichuru E K. Advances in the management of coffee berry disease and coffee leaf rust in Kenya[J]. Journal of Renewable Agriculture, 2014, 2(1): 5-10.

[5] Varzea V M P, Marques D V. Population variability of Hemileia vastatrix against durable resistance[M].//Zambolim E, Zambolim M, Varzea V M P, et al. Durable Resistance to Coffee Leaf Rust, Brazil: Vicosa, 2005: 305.

[6] Feng S J, Ma J H, Lin F, et al. Construction of an electronic physical map of Magnaporthe oryzae using genomic position-ready SSR markers[J]. Chinese Science Bulletin, 2007, 52(24): 3 346-3 354.

[7] 李成云, 李进斌, 周晓罡, 等. 粗糙脉孢菌基因组中的微卫星序列的组成和分布[J]. 中国农业科学, 2004, 37(6): 851-858.

[8] 李成云, 李进斌, 周晓罡, 等. 构巢曲霉菌基因组中的数量可变重复序列的组成和分布[J]. 遗传学报, 2005, 32(5): 538-544.

[9] 李成云, 李进斌, 刘 林, 等. 禾谷镰刀菌和稻瘟病菌基因组中的微卫星序列比较[J]. 植物保护学报, 2005, 32(3): 251-255.

[10] 吴伟怀, 贺春萍, 严传帝, 等. 剑麻茎腐病菌基因组SSR标记开发[J]. 热带作物学报, 2014, 35(4): 758-763.

[11] Talhinhas P, Azinheira H G, Vieira B, et al. Overview of the functional virulent genome of the coffee leaf rust pathogen Hemileia vastatrix with an emphasis on early stages of infection[J]. Frontiers in Plant Science, 2014, 5: 88.

[12] Cho YG, Ishii T, Temnykh S, et al. Diversity of microsatellites derived from genomic libraries and GenBank sequences in rice (Oryza sativa L.)[J]. Thero Appl Genet, 2000, 100: 713-722.

[13] Upupa S M, Robertson L D, Weigand F, et al. Allelic variation at(TTA)n microsatellite loci in a word collection of chickpea(Cicer arietinum L.)germplasm[J]. Mol Gen Genomics, 1999, 261: 354-363.

[14] Burstin J, Deniot G, Potier J, et al. Microsatellite polymorphism in Pisum sativum[J]. Plant Breed, 2001, 120: 311-317.

[15] Zheng Y, Zhang G, Lin F C, et al. Development of microsatellite markers and construction of genetic map in rice blast pathogen Magnaporthe grisea[J]. Fungal Genetics and Biology, 2008, 45: 1 340-1 347.

[16] Cristancho M, Escobar C. Transferability of SSR markers from related Uredinales species to the coffee rust Hemileia vastatrix[J]. Genet Mol Res, 2008, 7(4): 1 186-1 192.

[17] 李成云, 李进斌, 周晓罡, 等. 稻瘟病菌基因组中微卫星序列的频率和分布[J]. 中国水稻科学, 2004, 18(3): 269-273.

猜你喜欢

转录组
红麻肌醇加氧酶基因的分离及表达分析
红麻肌醇加氧酶基因的分离及表达分析
基于云计算的RNA—seq转录组数据分析流程初探
基于高通量测序的药用植物“凤丹”根皮的转录组分析
基于高通量测序的药用植物“凤丹”根皮的转录组分析
基于高通量测序的玄参根部转录组学研究及萜类化合物合成相关基因的挖掘
多穗柯转录组分析及黄酮类化合物合成相关基因的挖掘
基于转录组测序的山茱萸次生代谢生物合成相关基因的挖掘
金钗石斛转录组SSR位点信息分析
人参属药用植物转录组研究进展