基于模型的香蕉种质资源群体结构聚类分析及其亲缘关系分析
2014-04-29张俊王静毅陈友冯慧敏武耀廷王沛政
张俊 王静毅 陈友 冯慧敏 武耀廷 王沛政
摘 要 应用SSR分子标记技术,结合structure软件分析了32份香蕉种质之间的遗传关系。结果显示32份香蕉群体分为4大亚群:本地大蕉群、ABB群(包含引进大蕉亚群、粉蕉群)、AAA群及mix群。国内大蕉与引进大蕉遗传关系较远;粉蕉和大蕉各个品种之间存在丰富的遗传多样性;AAA群的皇帝蕉、Yangambi KM5和AAcv Rose栽培品种与我国早期引进的主栽品种Williams遗传关系较远;本地大蕉群中的酸芭蕉(ABB)和东莞中把大蕉(ABB)与其它大蕉相聚较远;ABB群组中巨型大蕉(ABB)和FHIA-03(AABB)与该群中的其它品种相聚较远;华农15和Williams没有被区分开,它们可能是同一克隆。研究结果表明基于模型的structure聚类分析也能用于遗传多样性分析。
关键词 香蕉;SSR;Structure分析;聚类分析
中图分类号 S668.1 文献标识码 A
香蕉(Musa spp)是世界上产量最大的水果作物,在发展中国家是除水稻、小麦、玉米之外的第一大食物来源[1]。香蕉的主要栽培品种是由尖苞叶蕉(Musa acuminata Colla, A基因组)和长梗蕉(M. balbisiana Colla, B基因组)这2个原始野生蕉种内、蕉种间杂交或变异进化而成的[2]。香蕉分为鲜食香蕉(dessert bananas)和熟食香蕉(cooking bananas or plantains)。根据植株形态上的特征及经济性状,我国习惯上把鲜食香蕉品种分为香牙蕉(AAA)、大蕉(ABB)、粉蕉(ABB)和龙牙蕉(AAB)等,并通称为香蕉。香蕉种质资源丰富,种类品种繁多,具有特殊的生物学特性(如多倍体、无性繁殖、营养结实、小染色体等),除三倍体外,还有二倍体和四倍体品种(系)。其种质资源的系统学研究一直是个难题,这不但阻碍了香蕉种质资源的合理利用,也影响香蕉的品种改良与育种。
国内外香蕉种质遗传多样性研究已有不少报道。Gawel等[3]报道了利用RFLP技术对香蕉属的19个种和亚种的分类和系统发育的研究。Howell等[4]利用RAPD引物对9个栽培蕉种质系统分析认为AA、AAA、AAB、ABB和BB 5种基因型能反映出所研究的栽培种的特征。国内冀小蕊等[5]利用SSR分子标记发现引进的香蕉种质包括A和AB基因中均存在有遗传差异较大的亚群。利用RAPD标记陈源等[6]对福建香蕉种质资源的基因组的聚类分析结果与传统Simmonds分类法的结果一致。
Structure软件中的多样性分析方法是一种基于模型的聚类方法(贝叶斯聚类方法对群体进行分类)。其原理是:假设群体中含有K个类群(K是未知的),这些类群在每个位点上都具有一套不同的等位基因频率。该软件可以分析多种分子标记(SSR、RFLP、SNP等)。不仅可以分析群体的遗传多样性,同时亦能用于分析群体遗传结构等。在此基础上可以分析标记的连锁不平衡类群和进行性状与标记的关联分析作图[7-11]。Structure软件在人类和动物的遗传多样性和群体结构中研究应用广泛[12-18],目前尚未见利用structure软件研究香蕉亲缘关系和群体结构的报道。本研究基于香蕉种质资源的SSR分子数据,利用structure软件分析香蕉种质的亲缘关系,为香蕉资源分类研究和合理利用奠定基础。
1 材料与方法
1.1 材料
香蕉叶片样品取自广州农业科学院果树研究所国家香蕉种质圃和中国热带农业科学院热带作物品种资源研究所香蕉种质圃(表1)。
1.2 DNA的提取以及SSR标记鉴定
DNA提取采用CTAB方法[19]。PCR反应、聚丙烯酰胺凝胶电泳和银染方法参照文献[20]进行。结果用“1”和“0”记录带的有或无,“-9”表示条带缺失。
1.3 群体结构分析
用Structure 2.3软件[21]来分析群体结构及其遗传多样性分析,估计最佳群体组群数K,软件中K取值范围设置1~8,7次重复,采用admixture model,计算ΔK值[22]作为衡量最佳K值的标准。
2 结果与分析
2.1 群体结构分析
SSR标记多态性分析的结果见王静毅等[23]。基于SSR标记的371条差异条带的基因型作为群体结构分析的数据,利用structure软件参照ΔK的算法[22]对32份香蕉材料群体结构进行分析,结果从图1可以看出,当k=3时,ΔK达到最大。依据k=3时Simulation Result中的bar plot可以绘制各品种在各群中所占比例(图2)。图2可以看出,利用structure软件分析,32份香蕉材料分成3大类群,分别用3种颜色来表示。柱状图描述的是不同品种被分到这三类群中所占比例。图中可以看出,大部分品种的分类与基因型分类一致,即表现出structure分类结果与传统Simmonds分类结果的一致性,但也存在着一定的差异性。在Simulation Result中(表2)可以得到k=3时,各品种被分配到各群体中的概率Q值,将同一类群下Q≥0.70的品种划分到一组。
2.2 品种的遗传多样性分析
利用structure软件分析得到的聚类三角图(图3)。图中的3个顶点代表了3个群组(本地大蕉群组、ABB群组、AAA群组),图中具有相同颜色的点代表相似的基因型,点与点之间的二维距离衡量品种之间的遗传距离。从图中可以看出,32份香蕉种质之间存在着丰富的遗传多样性。根据Q值划分到ABB群组中的m42(巨型大蕉ABB)和m59(FHIA-03 AABB)与该群中的其它品种遗传距离较远;本地大蕉群中的m41(酸芭蕉ABB)和m46(东莞中把大蕉ABB)与其它大蕉遗传距离较远;AAA群组中的m1、m4、m8和m32单独聚到一起(AA亚组)。三角图中间的m60、m2、m55、m56由于与三个类群差异较大,被聚为Mix群。
2.3 香蕉种质的亲缘关系分析
经过第1轮structure分析,32份香蕉种质被分成4个群体,各个群体中是否还存在亚群,需要在各个群体内部再进行一次structure分析,如此反复,直至群体内部不存在亚群状态,各个品种被完全分开。判断是否存在亚群的标准为:是否具有显著差异的△K存在。本研究进行了4轮structure分析,最终将这32份种质分为4个种群:Ⅰ:本地大蕉型;Ⅱ:AAA型;Ⅲ:ABB型;Ⅳ:mix型。其中Ⅰ类群包含:尖峰岭大蕉、兴隆山芭蕉、东莞高把大蕉、木棉蕉组成的第一亚群和酸芭蕉和东莞中把大蕉各自独立的两个亚群。Ⅱ类群:皇帝蕉、Yangambi KM5、Pisang Ceylan和AAcv Rose为一组的第一亚群、FHIA-02、FHIA-18、SH-3640、Grose Michel、华农15、Williams为一组的第二亚群,其中华农15和Williams经过4轮structure分析依然分不开;Ⅲ类群又可以分为三个亚群:粉蕉组(保亭粉蕉、广粉、三亚粉蕉、FHIA-01、FHIA-03);引进大蕉组:MCachaco、孟加拉大蕉(MCachaco和孟加拉大蕉在之后的分析中聚在一起)、巨型大蕉、华农芭蕉1号;第三亚群:海口BB、华农芭蕉2号、金手指。Mix种群中包含:FHIA-21、CRBP-39、Pisang Jari Buaya AA和BITA-3(图4)。
3 讨论与结论
3.1 structure软件的聚类分析方法
用于分析群体结构常见的聚类方法主要有两种。一是基于遗传距离的方法。计算一对距离矩阵,计算出每对样品之间的距离。这种矩阵再运用图示来表示出来(例如树状图或者多维比例图),最后根据经验将群体进行分类。二是基于模型的方法(Structure)。该方法假定每个类群中的观测值是随机来自于一些参数模型中。然后运用一些统计学方法(最大似然值或者贝叶斯方法)得到的各个类群的参数值来对群体进行分类。基于遗传距离方法,其分类结果太过于依赖遗传距离的测定和研究者对于图表的陈述,结果由于人为干扰因素较大,同时不能利用到样品的额外信息,例如:样品的地理位置信息。基于模型的方法优点是可以将各样品的额外信息(地理位置)同遗传信息结合来对群体分类,同时分类结果与遗传距离相比更加可靠。但structure 2.3版本不适用一些连锁紧密的标记。
本文利用Structure软件进行数学模型聚类来分析,主要依据运行结果中的似然值[LnP(D)]的变化来绘制△K的变化图,选择出最佳K值(分类群组)。在群组的划分中,选择在各品种被分配到同一类群下概率Q值≥0.70的品种划分到一组。并多次运行structure软件直至群体中无亚群存在。本研究利用香蕉种质资源的SSR基因型数据作为structure分析中各样品的ID信息,以此来对32份香蕉种质进行分类,结果显示利用structure软件能将材料中的亚群分开,与使用UPGMA聚类分析相比显示出独特的优越性。
3.2 香蕉种质资源的遗传结构分析比较
本实验供试的包括AA、BB、AAA、AAB、ABB、AAAA、AAAB、AABB和ABBB 9种类型的32份香蕉种质,structure分类结果与香蕉在基因型上的划分基本一致。其中4份香牙蕉(AAA)种质在被分到同一类群。3份二倍体(AA)种质之间的多样性差异较大,这与它的多样性起源有关系。二倍体(AA)栽培蕉由小果野蕉种内杂交或直接突变而来,因小果野蕉种内变异较大,这些遗传变异丰富的二倍体(AA)种质为育种提供基础。本研究表明AAA群体中的AA型亚群与该群中的其它亚群相聚较远,基因型为AAB的Pisang Ceylan被划分到与基因型为AA的皇帝蕉、AAcv Rose为一组。在B型基因组方面,同为ABB基因型的粉蕉和大蕉被分开,同为大蕉的国内大蕉组和引进大蕉组并未聚在一起,结果与王静毅等[23]一致。基因型为AABB的FHIA-03被划分到粉蕉组。在已划分的群组中发现了很多亚群存在,在国内大蕉组中,酸芭蕉和东莞中把大蕉独立成亚群;海口BB被分到ABB组中,且与华农芭蕉2号、金手指组成单独亚群;在引进的大蕉组中,MCachaco和孟加拉大蕉单独成一亚群,这些结果在王静毅等[23]使用UPGMA聚类分析结果中并未分开。Sotto等[25]和Geering等[26]研究发现野生芭蕉(M. balbisiana)BB基因组中含有较强的病性,本研究对指导抗病育种有一定的意义。FHIA-02(AAA)和Williams(AAA),FHIA-21(AAAB)和Pisang Jari Buaya(AA), FHIA-18(AAAB)和SH-3640(AAAB)分别聚在相同的组群,反映了它们之间真实的遗传关系。华农15和Williams经过4轮structure分析依然分不开(不存在显著的△K),说明它们可能分别是同一克隆。本地大蕉群中的酸芭蕉(ABB)和东莞中把大蕉(ABB)与其它大蕉相聚较远;ABB群组中巨型大蕉(ABB)和FHIA-03(AABB)与该群中的其它品种相聚较远。
参考文献
[1] FAO. Production Year book 1992[M]. Rome: Food and Agriculture Organization of United Nations. 1993. 254.
[2] 秦献泉, 彭宏祥, 曹辉庆. 香蕉种质资源研究与利用进展[J]. 广西农学报, 2007, 22(6): 53-56.
[3] Gawel N J,Jarret R L, Whiremore A. Restriction Fragment Length Polymorphism(RFLP)based on phylogenetic analysis in Musa[J]. Theoretical and Applied Genetics, 1992, 84(3-4): 286-290.
[4] Howell E C,Newbury H J, Swennen R L, et al. The Use of RAPD for identifying and classifying Musa germplasm[J]. Genome, 1994, 37(2): 328-332.
[5] 冀小蕊, 陈业渊, 王静毅, 等. 香蕉引进种质遗传关系的微卫星检测[J]. 热带作物学报, 2008, 29(2): 169-174.
[6] 陈 源, 赖钟雄, 余亚白, 等. 福建香蕉种质资源的RAPD分析[J]. 福建农业学报, 2008, 23(1): 44-47.
[7] Ewens W J, Spielman R S. The transmission/disequilibrium test: history, subdivision, and admixture[J]. Am. Hum. Genet, 1995, 57: 455-464.
[8] 张 军, 赵团结, 盖钧镒. 大豆育成品种农艺性状QTL与SSR标记的关联分析[J]. 作物学报, 2008, 34(12): 2 059-2 069.
[9] 文自翔, 赵团结, 郑永战,等. 中国栽培和野生大豆农艺及品质性状与SSR标记的关联分析Ⅱ. 优异等位变异的发掘[J]. 作物学报, 2008, 34(7): 1 339-1 349.
[10] 文自翔, 赵团结, 郑永战,等. 中国栽培和野生大豆农艺品质性状与SSR标记的关联分析Ⅰ. 群体结构及关联标记[J]. 作物学报, 2008, 34(7): 1 169-1 178.
[11] Jun T H, Van K, Kim M Y, et al. Association analysis using SSR markers to find QTL for seed protein content in soybean[J]. Euphytica, 2008, 162(2): 179-191.
[12] Beaumont M, Gottelli D, Barratt E M, et al. Genetic diversity and introgression in the Scottish wildcat[J]. Molecular Ecology, 2001, 10: 319-336.
[13] Conrad D, Jakobsson M, Coop G, et al. A worldwide survey of haplotype variation and linkage disequilibrium in the human genome[J]. Nature Genetics, 2005, 38: 1 251-1 260.
[14] Falush D, Wirth T, Linz B, et al. Traces of human migrations in Helicobacter pylori populations[J]. Science, 2003b, 299: 1 582-1 585.
[15] Harter A, Gardner K, Falush D, et al. Origin of extant domesticated sunowers in eastern North America[J]. Nature,2004, 430: 201-205.
[16] Murgia C, Pritchard J K, Kim S, et al. Clonal origin and evolution of a transmissible cancer[J]. Cell, 2006, 126: 477-487.
[17] Pritchard J K, Stephens M, Rosenberg N A, et al. Association mapping in structured populations[J]. Am.J.Hum.Genet., 2000b, 67: 170-181.
[18] Rosenberg N A, Burke T, Elo K, et al. Empirical evaluation of genetic clustering methods using multilocus genotypes from 20 chicken breeds[J]. Genetics, 2000, 159: 699-713.
[19] Paterson A H, Brubaker C, Wendel J F. A rapid method for extraction of cottonn(Gossypium spp.)genomic DNA suitable for RFLP or PCR analysis[J]. Plant Mol. Biol. Rep, 1993, 11: 122-127.
[20] 张 军, 武耀廷, 张天真,等. 棉花微卫星标记的PAGE/银染快速检测[J]. 棉花学报, 2000, 12(5): 267-269.
[21] Pritchard J K, Stephens M, Donnelly P. Inference of population structure using multilocus genotype data[J]. Genetics, 2000a, 155: 945-959.
[22] Evanno G, Regnaut S, Goudet J. Detecting the number of clusters of individuals using the software Structure: a simulation study[J]. Molecular Ecology, 2005, 14: 2 611-2 620.
[23] 王静毅,冀小蕊, 武耀廷. 香蕉品种(系)遗传多样性的SSR分析[J]. 安徽农业科学, 2011, 39(10): 5 706-5 710.
[24] 冀小蕊, 陈业渊, 王静毅,等. 香蕉A基因组品种间遗传关系的SSR检测[J]. 果树学报, 2007, 24(6): 783-787.
[25] Sotto R C, Rabara R C. Morphological diversity of Musa balbisiana colla in the Philippines[J]. InfoMusa, 2000, 9(2): 28-30.
[26] Geering A D, Pooggin M M, Olszewski N E, et al. Characterisation of banana streak mysore virus and evidence that its DNA is integrated in the B genome of cultivated Musa[J]. Arch. Virol., 2005, 150(4): 787-796.