绣球属(Hydrangea L.)植物分子系统学及系统发育分析
2021-03-29杨加文龙成昌
张 梅,杨加文,龙成昌,周 艳,王 永
(贵州省植物园,贵阳550004)
随着DNA测序技术等各项分子生物学研究手段的不断完善与成熟,利用叶绿体基因组序列与核基因组序列信息构建系统发育关系目前已经成为植物系统学研究的热点和主要手段,它向我们揭示了许多以往传统方法无法发现和难以解决的问题。目前,利用分子系统学手段来得到更自然的系统演化关系已成为有效且普遍的途径[1-3],随着测序技术的进步和系统演化算法的发展,越来越多的植物类群在分子水平上陆续开展了工作,利用核基因和叶绿体DNA片段序列进行植物类群的分子系统学研究,能够更加客观地显示其系统发育关系。
核基因组ITS序列(5.8S rDNA和28S rDNA 基因间隔序列,也称为内部转录间隔区,即Internal Transcribed Spacer,简称ITS)已成为植物分子系统学研究中应用最为广泛的DNA片段之一。一方面由于ITS在核基因组中的高度重复性,同时这些重复单位已发生了质同进化(concerted evolution)[4];另一方面由于其引物是通用引物,这些特性为测序工作提供了极大的方便。已有资料表明被子植物ITS长度通常为565~700 bp变异幅度很窄,并且无一例外地小于700 bp[5]。ITS序列大小只需用扩增时的1对引物即可进行全序列测定,使该序列在探讨被子植物属下水平的系统分类与进化的研究中得到广泛应用[6-10]。ITS序列表现的变异水平比较适合于属间、属下和种间等分类单元的系统学研究,或有时也用于科、亚科、族内的系统发育研究[6,11-21]。叶绿体基因组(cpDNA)为闭环结构,其编码区和非编码区的进化速率相差较大,适于不同分类阶元的系统发育学研究:编码区的核苷酸代替速率相对较低,如rbcL,matK,ndhF和atpB等,因在大多数被子植物中为母系遗传,且进化速率较慢,被应用在较高分类阶元的分子系统学研究中。而非编码区trnL-F片段则适用于较低分类阶元种即近缘种的系统关系研究[5,7,22-24]。
基于分子证据对绣球花科、绣球花族、绣球属的系统发育研究目前也逐渐展开。绣球属隶属于绣球花科,该科共有3个族,分别是黄山梅族(Kirengeshomeae)、山梅花族(Philadelpheae)、绣球花族(Hydrnageeae);该属主要在绣球花族内,本族除了绣球属外还有其余的8个属,分别是赤壁木属(Decumaria)、冠盖藤属(Pileostegia)、Broussaisia、常山属(Dichroa)、草绣球属(Cardiandra)、蛛网萼属(Platycrater)、钻地风属(Schizophragma)和叉叶蓝属(Deinanthe)。很多研究者的研究表明绣球属不是一个严格意义上的自然类群,从分子系统树中,外围的几个小属已插入该属中,如葛丽萍[25]对绣球族的系统学研究,进一步验证了该属非单系类群;Samain 等[26]基于叶绿体数据进一步确认了该属为并系类群,绣球花科中的其他属,如常山属、冠盖藤属、草绣球属、钻地风属均镶入该属中。但研究中我们也发现有些物种的系统位置与前人的研究[27]存在明显不同,故在该属植物的系统学研究中物种鉴定仍然是一个值得关注的问题。
虽然前人在绣球属的起源演化方面做了很多工作,也在不同程度上解决了很多问题,但对于种类繁多、形态变异复杂的绣球属来说,仍然有很多工作有待开展。此外,以上研究虽然在一定程度上解决了绣球属的起源与演化关系,但由于取样密度小,代表性不够,地区性工作开展少,属内不少类群的演化关系不清楚,比如绣球属各类群之间的起源演化关系。因此,要更好地探讨绣球属的系统演化关系还有很多工作需要去做。我们希望通过代表性的取样,采用合适的DNA序列变异来阐明绣球属的系统发育关系。
1 材料和方法
1.1 材料的选取
选取绣球属植物61个种进行分析。实验所用的材料主要采自野外和PE的标本。凭证除特殊标注外,所有的凭证均存于中国科学院植物研究所标本馆(PE)。
所有的鉴定标准都是按照原始文献、模式标本及照片和已发表的《中国植物志》《Flora of China》描述来处理[28-30]。本研究选取叶绿体基因rbcL、atpB、trnL-F及核糖体核基因ITS区域进行PCR扩增,对所得序列使用贝叶斯法(BI)和最大简约法(MP)建立系统发育树(简称BI树和MP树)。根据文献资料,在确定性状和性状状态是祖征还是衍征时,经常所采用的最重要的(甚至是唯一的)方法是外类群比较[31]。由于山梅花族和绣球族位置很近,在形态和整个分类系统学以及前人[25]的研究中发现绣球花族为一个单系类群,而山梅花族与绣球花族是姐妹类群,因此本研究选取山梅花族的物种(Philadelphus和Deutziae)作为外类群(outgroup),其外类群的基因片段从Genbank上下载。详细的材料信息见表1。
表1 材料来源
续表1 Continued Table 1
1.2 DNA的提取方法
硅胶干燥的新鲜叶片提取方法使用天根(Tiangen)生化科技(北京)有限公司生产DP305-02试剂盒提取。
标本材料DNA的提取使用CTAB法[32]。
1.3 序列扩增和测序
DNA序列扩增通过多聚酶链式反应PCR(Polymerase Chain Reaction),在Applied Biosystem 9902PCR仪上完成。扩增引物见表2(Table 2)。
表2 扩增和测序所用引物
1.3.1 PCR反应体系25 μL体系,其中总DNA 2 μL,2×Taq PCR Master Mix(北京博迈德生物科技有限公司生产)12.5 μL,正反向引物各2 μL,ddH2O 6.5 μL。
1.3.2 扩增程序(1)ITS扩增程序:94 ℃预变性5 min,94 ℃变性1 min,53 ℃退火45 s,72 ℃延伸2.5 min,35个循环,72 ℃延伸10 min。
(2)atpB扩增程序:92 ℃预变性3 min,92 ℃变性1 min,57.5 ℃退火1 min,72 ℃延伸2.5 min,31个循环,72 ℃延伸10 min。
(3)trnL-F扩增程序:94 ℃预变性3 min,94 ℃变性1 min,49 ℃退火1 min,72 ℃延伸2 min,32个循环,72 ℃延伸10 min。
(4)rbcL扩增程序:95 ℃预变性5 min,95 ℃变性1 min,52 ℃退火30 s,72 ℃延伸2 min,35个循环,72 ℃延伸10 min。
1.3.3 测序将PCR产物在1%琼脂糖上电泳检测,条带清晰且没有拖尾现象的送至华大基因和美吉生物进行测序,测序引物和PCR扩增引物一致。
1.4 序列分析及系统树的构建
测序结果用Contig Express软件进行拼接,序列排列用Clustal X v.1.83软件完成,再用BioEdit v.7.0软件手工校对(或者直接用BioEdit自动比对,再手工校对),删除矩阵两端缺失部分和内部无法准确比对的区域(poly结构)。用Modeltest ver.3.06软件确定序列进化最适模型,系统发育关系采用最大简约法(Maximum Parsimony,MP)和贝叶斯分析法(Bayesian Inference,BI)进行重建。MP分析利用PAUP v.4.0b10软件完成,BI分析用MrBayes 3b4软件完成。
2 结果与分析
2.1 核基因 (ITS) 的数据
用于建立核基因的矩阵共61个种(包括变种和亚种),一些种类有少数的插入或缺失的位点,矩阵序列长度为739 bp,则保守位点(Mark Conserved sites)为113个,变异位点(Mark Variable sites)为596个,信息位点(Mark Parsim-infomative sites)为266个。运用贝叶斯法算得的BI树见图1,从贝叶斯树来看,大体可以分为5个进化支:Clade1、Clade2、Clade3、Clade4和Clade5,从每个支的最大简约法的自展支持率(Bootstrap,BP值)和贝叶斯分析法的先验概率(Posterior probabilities,PP值)值来看,支持率都很低,但每个支内的小分支支持率基本都达到95%以上(图1)。
图1 基于核基因的贝叶斯树Fig.1 Bayesian consensus phylogram based on the branch length of the complete ITS dataset
2.2 叶绿体(rbcL,trnL-F,atpB)的数据
用于建立叶绿体基因rbcL的样品共51个种(包括变种和亚种),一些种类有少数的插入或缺失的位点,矩阵序列长度为1 528 bp,则保守位点为1 040个,变异位点为227个,信息位点为103个。用于建立叶绿体基因trnL-F的样品共55个种(包括变种和亚种),一些种类有少数的插入或缺失的位点,矩阵序列长度为1 178 bp,则保守位点为592个,变异位点为412个,信息位点为187个。用于建立叶绿体基因atpB的样品共43个种(包括变种和亚种),一些种类有少数的插入或缺失的位点,矩阵序列长度为1 439 bp,则保守位点为1 098个,变异位点为289个,信息位点为104个。
叶绿体基因rbcL、trnL-F、atpB三个片段连合基因长度为3 800 bp,其保守位点为3 269个,变异位点为321个,信息位点为121个。运用贝叶斯和最大简约法算得的BI和MP树见图2,从树上看分辨率很低,不能很好地把这个类群分开。从整个系统树上来看,基部草绣球没有聚在一起,形成一把梳子的结构,除基部的草绣球以外,其余的物种分为5个进化支。Clade1主要的类群为绣球属绣球组、蛛网萼属和Broussaisia(PP=0.65);Clade2主要为绣球属挂苦子组的物种,但是有离瓣组的西南绣球和临桂绣球插入其中(PP=1.00,BP=98);Clade3主要类群为绣球属的部分物种和常山(PP=1.0,BP=78);Clade4主要是赤壁木和冠盖藤,其支持率较低(PP=0.68);Clade5主要为草绣球(图2)。
图2 基于叶绿体联合矩阵的贝叶斯树Fig.2 Bayesian consensus phylogram based on the branch length of the complete chloroplast dataset
2.3 核基因(ITS)与叶绿体基因(rbcL、trnL-F和atpB)联合建树
ITS、rbcL、trnL-F和atpB四个片段联合矩阵长度为4 539 bp,包括3 224个保守位点,1 068个变异位点,293个信息位点。贝叶斯分析所得联合数据的系统树的拓扑结构与两套分子数据独立分析的结果大体上一致,但有些分支的分辨率和支持率有所提高(图3)。
图3 基于核基因和叶绿体基因的贝叶斯树Fig.3 Bayesian consensus phylogram based on the branch length of the complete ITS+rbcL+trnL_F+atpB dataset
从整个系统发育树来看,分为两个大的进化支,8个Group;Clade1具有较低的支持率(PP=0.66),该支主要有绣球属中的绣球组、星毛组和冠盖组以及蛛网萼属、钻地风属、冠盖藤属和赤壁木属的类群,该大进化支内具有3个小的进化支,第1个小进化支支持率最高(PP=0.98),除珠网萼属以外主要是绣球组的类群;第2个小组进化支支持率较低(PP=0.84),主要类群是钻地风属、绣球属星毛组、赤壁森木属以及冠盖藤属;第3个小进化支只有绣球属冠盖组的冠盖绣球;Clade2的支持率也不高(PP=0.56,BP=96),该支主要有绣球属离瓣组和挂苦子组、常山属、草绣球属以及叉叶蓝属的类群,该大支具有4个小支,第1个小的进化支在整个Clade2中支持率最低(PP=0.98,BP=73),该小支的类群有绣球属离瓣组、常山属的类群;第2个小的进化支支持率相对较高(PP=1.00,BP=96),该支主要有绣球属挂苦子组的类群,但有离瓣组的西南绣球插进该支内;第3个小的进化支支持率最高(PP=1.00,BP=100),主要类群是草绣球属和叉叶蓝属,这两个属互为姐妹类群,且支持率达100%;最后一个小支主要为乔木绣球(H. arborescens),该类群主要分布在北美,且支持率很高(PP=1.00,BP=96)。
3 讨 论
3.1 绣球属的系统发育关系
从核基因ITS序列,叶绿体基因rbcL、trnL-F、atpB序列以及核基因和叶绿体基因联合建成的树来看,绣球属不是一个严格意义上的自然类群,与前人[3,17,33-35]的研究成果相一致。在整个系统树上可以看出,乔木绣球(H.arborescens)先分化出来,再到草绣球属和叉叶蓝属,这个结果与葛丽萍[25]和Samain等[26]的结果有冲突,他们的结果显示,草绣球属和叉叶蓝属最先分出。
从整个分支系统来看,可分为两大支,叉叶蓝、草绣球、绣球属中的挂苦子组、Broussaisia、常山属以及绣球属中的离瓣组为基部类群;而绣球属中冠盖组、赤壁木属、冠盖藤属、钻地风属、蛛网萼属、绣球属以及绣球属中绣球组为进化的类群。总体来看可分为8个Group,Group 1主要为绣球属中绣球组的类群,这个结果与Jacobs[27]的结果一致,该Group的关键特征是子房完全下位,蒴果顶端截平;Group 2为蛛网萼属和北美的H.involucrata、H.sikokiana;Group 3主要是钻地风属、冠盖藤属和赤壁木属,该Group与Hufford 等[33]的Schizophragmaclade一致;而绣球属中的冠盖组单独成一支为Group 4;Group 5为绣球属中的离瓣组、常山属和Broussaisia,该支与Samain 等[26]的研究结果一致,该Group的性状为子房上位,蒴果顶端突出的部分非圆锥形;Group 6主要为挂苦子组的类群,其中离瓣组的西南绣球与挂苦子组的东陵绣球形成了姐妹群,且支持率达到100%,但无论在宏观形态上或是种子微形态、孢粉形态上这两个种都有很大的出入,导致这种情况的原因可能是在序列数据处理时,我们发现绣球属广泛出现套峰结构,我们对这种情况的处理方法是将其标记为简并碱基,因此导致大量的信息位点消失,从而导致以上的这种情况;Group 7主要为草绣球属和叉叶蓝属,支持率都为100%,他们互为姐妹类群与trnL-F序列[25]、matK序列[33]和rbcL序列[3]建立的系统树一致支持这个结果,说明这两个属在系统上形成两个姐妹群是毋庸置疑的,他们的最大特征是均为草本,多数的雌蕊、雄蕊发生时形成对萼三联体、覆瓦状的花冠卷叠式等。Group 8为北美的种乔木绣球,该种为林奈于1753年最早提出的。
3.2 绣球属内物种间的关系
马桑绣球(H.aspera)和柔毛绣球(H.villosa)在形态上极为相似,其叶、叶柄、小枝及花序毛被为单毛,叶下面密被颗粒状腺体,而马桑绣球叶下面密被灰白色、直或稍弯曲、彼此略交结的短柔毛,脉上的毛稍长,花柱多数3,少有2;柔毛绣球伞房状聚伞花序分枝密集,紧靠,彼此间隔短,一般长5~20 mm,有时也有个别较长的,叶下面密被灰白色短绒毛,脉上的毛较长,常带黄褐色,小枝和总花梗较粗,常具钝棱,密被灰白色或黄褐色短柔毛和粗长毛;从形态性状上来看这两个种没有太大区别;分布上,两者均分布在云南、四川、贵州以及广西,而柔毛绣球还分布在甘肃、陕西、江苏、湖北、湖南等地,相对马桑绣球来说,分布较广且在马桑绣球分布区的外围,因此柔毛绣球应为马桑绣球的辐射类群。
根据核基因构建的系统发育树显示,柔毛绣球、马桑绣球、紫彩绣球聚为一支,且PP值和BP值都达到最高值,但在形态上,紫彩绣球与其两个种的差异甚远;根据叶绿体基因和核基因联合构建的系统发育树,其2个种聚在一起,与紫彩绣球互为姐妹类群,且支持率达最高值;在野外对其二者的识别度极低,最大的区别是柔毛绣球的叶是披针形和卵披针形,而马桑绣球为长卵形、卵披针形或长椭圆形;但从生物地理学以及居群的水平可以发现两者叶形只是一个渐变的过程,且种子、花粉形状及表面纹饰均属于同一种类型[35-36],因此本研究的数据结果均支持此二者应为一个类群,则支持最新版FOC中将柔毛绣球作为马桑绣球的异名并入该种的处理结果。
3.3 形态性状的演化趋势
绣球属的分类性状主要为子房、蒴果、花序、可育花与不育花、种子微形态、叶表皮、孢粉等,因此探讨这些性状对绣球属的分类修订和系统演化关系具有很重要的意义。
关于蒴果的类型,从整个系统发育树上来看(图4、图5),我们发现挂苦子组在树的基部,其蒴果为顶端突出,而到中部的常山属和离瓣组,蒴果顶端突出的部分只有1/3~1/2,再到最顶端的绣球组,蒴果顶端截平;则说明蒴果顶端截平和子房完全下位是较为进化的类群。
图4 核基因和叶绿体基因的BI树与叶片形态相关性Fig.4 Correlation analysis of BI tree of ITS and chloroplast genes with leaf morphology
图5 核基因和叶绿体基因的BI树与种子形态和孢粉学的相关性Fig.5 Correlation analysis of BI tree of ITS and chloroplast genes with seed morphology and palynology
花序、花在整个系统树上看不出任何的变化规律以及演化趋势,而花粉自身的演化趋势在本次研究中体现得并不明显,在系统树的基部、中部和顶端均未发现具有同一类型花粉的物种集中出现的现象(图5)。但在部分小属中体现出了相应的规律性,如赤壁木、冠盖藤的花粉为长球体形,而钻地风、常山、蛛网萼的花粉形状为近球体形,从系统树上看,赤壁木、冠盖藤较钻地风、常山、蛛网萼进化,则花粉长球体形比近球体形进化,这个结论与前人[37-39]的理论一致:花粉的进化趋势是花粉粒相对体积的缩小过程,即由大到小的进化。
种子演化趋势在系统树上可以看出部分规律(图5),如基部为挂苦子组的类群,其种子的形状为长柱形,其种子表面具平直状的脊,脊间较光滑,种子翅的类型为两端具翅;而中部为离瓣组的类群,其种子形状为椭圆体形、网脊为波状或深波状、脊间有不规则或规则或孔穴的次级纹饰,多数为不规则纹饰,少部分为规则或孔穴纹饰,种子的翅为一端或两端具翅;中上部的冠盖组种子为长柱形或椭球形,表面具网状多边形纹饰,网眼内具洼点,具周翅;最顶端的绣球组种子均为椭球形、网脊近平直,脊间较光滑,两端具翅;从整个演化过程来看种子的椭球形较长柱形进化,网脊平直较网脊弯曲进化。
叶表皮微形态在本研究中没有发现相应的变化规律,可能的原因是叶表皮受到环境因素的影响较大,性状较不稳定(图4);但在某些小支上也表现出相应的一致性,比如Clade 1的最顶支,其叶的形态为椭圆披针形,表皮毛被较多,且毛被表面不光滑。