一年蓬叶绿体基因组特征及系统进化分析
2023-05-16周芸芸郭敏彭英权金晨钟张雪娇胡一鸿陈功龚意辉
周芸芸 郭敏 彭英权 金晨钟 张雪娇 胡一鸿 陈功 龚意辉
关键词:一年蓬;叶绿体;基因组;结构特征;系统发育
中图分类号:S668.3 文献标识码:A
一年蓬[Erigeron annuus (L.) Pers.]隶属于菊科(Asteraceae),紫菀族(Astereae),飞蓬属(Erigeron),一年或两年生植物,原产于北美洲,早年作为观赏植物进入我国,现广泛分布于我国[1]。一年蓬的花形似小雏菊,民间用全草或根可入药,具有清热解毒、消食止泻的功效[1]。近年来有研究报道一年蓬植株提取液具有抗炎、抑菌、止血、镇痛的效果[2-5],在一年蓬水提物的研究中还发现其对高脂肪饮食的小鼠具有抗肥胖的作用[6]。一年蓬被认为是一种修复金属和类金属污染土壤的潜能植物,对Cd 和Zn 等金属及柴油具有较好的富集和耐受效果[7-8]。然而它作为一种入侵植物,对我国农林业发展、本地物种多样性及生态系统具有严重的影响,被我国生态环境部列入第三批外来入侵物种名单[1, 9]。目前国内外对一年蓬活性化合物[10-12]、入侵及适应机制[13-15]、防除[16-17]等方面研究较多,而有关一年蓬叶绿体全基因组特征、序列分析及其相关系统发育分析等尚未见报道。
叶绿体(chloroplast, CP)是为绿色植物提供能量的光合细胞器,它们在光合作用及相关代谢活动中起重要作用[18]。被子植物中典型的叶绿体基因组为双链共价闭合环状分子,具有典型的四分体结构,其中一个大单拷贝区(large single copyregion, LSC),小单拷贝区(small single copyregion, SSC),反向重复区A(inverted repeat regionA, IRA),反向重复区B(inverted repeat region B,IRB)[19]。基因组的长度一般在120~ 170 kb 之间,通常编码110~130 个基因,约40 个基因是参与光合作用、转录和翻译[20]。叶绿体基因具自我复制的特点,在大多数植物中为母系遗传,进化过程中不经历重组,能直接反映植物在长期的进化过程中积累的遗传变异,已被广泛用于阐明物种遗传多样性、进化历程、系统发育地位及近缘种间和种内的遗传关系等相关研究[21-22]。随着新一代测序技术的发展,植物基因组得到了广泛的研究,多种菊科植物的叶绿体基因组研究都已被报道,涉及到的属有紫菀属( Aster )、向日葵属( Heloanthus )、飞蓬属( Erigeron )、蒿属( Artemisia )、菜蓟属( Cynara )、莴苣属(Lactuca)、禾叶金菀属(Pityopsis)等[23-27]。本研究以一年蓬为试材,利用高通量测序,对组装后的一年蓬叶绿体基因组结构、序列特征、与近缘物种序列的差异,在紫菀族族中的地位及与该属其他植物的亲缘关系等方面进行分析与研究,旨在为后续一年蓬的遗传、系统发育、进化历程及资源开发利用与防除等研究奠定分子理论基础。
1 材料与方法
1.1 材料
供试材料一年蓬采集于湖南省娄底市娄星区湖南人文科技学院校园内( 27°5331"N ,111°542"E),植物樣本经湖南人文科技学院金晨钟、胡一鸿教授进行植物分类学鉴定。采摘一年蓬健康植株幼嫩绿色叶片,用液氮速冻后放置于–80 ℃的超低温冰箱中,备用。
1.2 方法
1.2.1 DNA 提取与测序分析 植物全基因组DNA 用天根生化科技(北京)有限公司的植物基因组DNA 提取试剂盒(DP305)提取,并通过NanoDrop2000 分光光度计和琼脂糖凝胶电泳检测总DNA 的质量和浓度。将高质量的DNA 样本送南京集思慧远生物科技有限公司进行测序,测序采用Illumina NovaSeq 6000 平台,使用fastp0.20.0( https://github.com/OpenGene/fastp)软件对原始数据进行过滤得到高质量reads,得到18 635 007 条reads(Q20 为97.49%,Q30 为93.02%)供后续组装和注释用。
1.2.2 叶绿体基因组组装与注释 从NCBI 上下载已发表的小蓬草( Erigeron canadensis, MT806101.1)的叶绿体全基因组序列为参照,采用SPAdes[28]v3.10.1(http://cab.spbu.ru/software/spades/)、SSPACE v2.0(https://www.baseclear.com/sevices/bioinformatics/basetools/sspace-standard/)、Gapfillerv2.1.1[29](https://sourceforge. net/projects/gapfiller/)在线组装软件对叶绿体基因组进行组装、校正,得到完整的一年蓬叶绿体环状基因组序列。使用在线软件prodigal v2.6.3(https://www.github.com/hyattpd/Prodigal)注释叶绿体的CDS,使用hmmer v3.1b2(http://www.hmmer.org/)在线软件预测rRNA,使用在线软件aragorn v1.2.38(http://130.235.244.92/ARA GORN/)预测tRNA,再使用blastv2.6(https:// blast.ncbi.nlm.nih.gov/Blast.cgi)比对组装的序列,获得最终的注释。将注释完成的一年蓬叶绿体基因组序列,用在线软件OGDRAW(https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)制作叶绿体基因组图谱。
1.2.3 叶 绿 体基因组特征及对比分析 使用MISA v1.0 ( MIcroSAtellite identification tool,http://pgrc.ipk-gatersleben.de/misa/misa.html)在线软件分析一年蓬叶绿体全基因组SSR 位点,利用Find repeats 工具获得小蓬草、多舌飞蓬(E. multiradiatus)、短葶飞蓬(E. breviscapus)、香丝草(E. bonariensis)等4 种基因组的LSC 序列、SSC 序列和IR 序列,采用MAFFT 软件[30]进行多序列比对, 最后使用RAxML v8.2.10( https://cme.h-its.org/exelixis/software.html ) 软件,选用GTRGAMMA 模型,rapid Bootstrap 分析,bootstrap=1000,构建最大似然系统发育树。
2 结果与分析
2.1 一年蓬叶绿体基因组结构
一年蓬叶绿体基因组是一个典型的四分体结构,其基因组全长为153 283 bp,AT、GC 含量分别为62.95%、37.05%。其中包括大单拷贝区(LSC)84 833 bp,GC 含量为34.87%;小单拷贝区(SSC)18 412 bp,GC 含量为30.95%;反向重复区(IRa和IRb)长25 019 bp,GC 含量为42.98%(表1,图1)。一年蓬叶绿体基因组共注释出132 种基因,编码蛋白质基因、tRNA 基因和rRNA 基因分别为88、36、8(表1)。
2.2 叶绿体基因的组成和特点
按照功能分類将已注释到的这些基因分为光合作用相关基因(photosynthesis genes)、自我复制基因(self-replication genes )、其他基因(othergenes)、未知功能基因(genes of unknown function)四大类(表2)。光合作用相关基因主要包括5 个光合系统I 基因(subunits of photosystem I)、15 个光合系统 II 基因(subunits of photosystem II)、12 个NADH 脱氢酶基因(subunits of NADH dehydrogenase)、6 个细胞色素复合物编码基因(subunits of cytochrome b/f complex)、6 个ATP合酶基因(subunits of ATP synthase)、1 个二磷酸核酮糖羧化酶大亚基基因( large subunit ofrubisco);自我复制基因主要包括11 个核糖体蛋白大亚基基因(proteins of large ribosomal subunit)、14 个核糖体小亚基基因(proteins of smallribosomal subunit)、4 个RNA 聚合酶亚基基因(subunits of RNA polymerase)、8 个rRNA 基因和36 个tRNA 基因;此外还有6 个其他功能基因及8 个未知功能基因。其中ndhB、rpl2、rpl23、rps12、rps7、rrn16、rrn23、rrn4.5、rrn5、trnA-UGC、trnI-CAU、trnI-GAU、trnL-CAA、trnN-GUU、trnRACG、trnV-GAC、ycf1、ycf15 和ycf2 均含2 个拷贝基因。18 个基因含有1 个内含子,分别为ndhA、ndhB(2)、petB、petD、atpF、rps12*(2)、rps16、rpoC1、trnA-UGC(2)、trnG-UCC、trnI-GAU(2)、trnK-UUU、trnL-UAA、trnV-UAC。2 个基因含有2 个内含子,分别为clpP 和ycf3。值得注意的是,本研究所注释到8 个未知功能基因(ycf1(2)、ycf15(2)、ycf2(2)、ycf3、ycf4)仍需利用先进的分子技术手段对其功能进行鉴定。
2.3 IR 边界的特征
使用在线网站IRscope(https://irscope. shinyapps.io/irapp/)绘制对比图,比较一年蓬与多舌飞蓬(E. multiradiatus)、香丝草(E. bonariensis)、短莛飞蓬(E. breviscapus)、小蓬草(E. canadensis)4 个物种的LSC、SSC 和IR 区的边界位置(图2),这5 个菊科物种叶绿体基因组4 个区域中,IR 区较为保守,其片段大小为24 326~25 019 bp。rps19基因位于LSC/IRb 区域中,其中一年蓬、香丝草、短莛飞蓬和小蓬草中LSC 和IRb 区向扩张程度相同,均为217、62 bp,多舌飞蓬在LSC 和IRb 区向扩张分别为212、67 bp。这5 种植物中的rpl2基因均位于IR 区域内。一年蓬中的tmN 基因位于IRa 区域内,而多舌飞蓬、香丝草、短莛飞蓬和小蓬草中位于IRb 区域内;一年蓬存在2 个ycf1基因,分别在SSC/IRb 边界扩张,距离JSB 边界567、12 bp,SSC/IRa 边界区域中扩张,距离JSA边界分别为4482 bp 和15 bp,而其他4 种植物只存在1 个ycf1 基因;SSC/IRb 边界显示,一年蓬、多舌飞蓬、短莛飞蓬和小蓬草中的ndhF 基因全部在SSC 区域内扩张,而香丝草并没有检测到ndhF基因。这5 种植物中的tmH 基因全部在LSC 区域内扩张。
2.4 叶绿体基因组SSR 位点分析
使用MISAv1.0(http://pgrc.ipk-gater-sleben.de/misa/misa.html)在线软件对一年蓬叶绿体基因组进行重复单元(SSR)位点分析(图3)。共在一年蓬叶绿体基因组中查找到200 个符合条件的SSR 位点,分布在LSC、SSC、IR 区域的SSR 数量分别为126、40、34 个,分别占总SSR 位点数比重为63%、20%、17%。单核苷酸重复单元共139 个,主要以A 和T 为主,双核苷酸重复单元20 个,主要以AT 和TA 为主,三核苷酸重复单元106 个,主要以TTA、TAA 和TAT 为主。四核苷酸重复单元13 个,主要以TATT 和 TTAT 为主,五核苷酸重复单元3 个,分别为TACTA、TATAT、TTAGA。说明一年蓬叶绿体基因组中A/T 碱基占优势,具有碱基偏好性。这与该物种中AT 含量占62.95%的结果相一致。
2.5 系统发育分析
将一年蓬与菊科管状花亚科紫菀族21 种植物叶绿体基因组序列,以舌状花亚科苦荬菜属植物苦荬菜(Ixeris polycephala)为外群构建发育树(图4)。进化树结果显示,一年蓬与一枝黄花(Solidago decurrens)、钻叶紫菀(Symphyotrichumsubulatum)、多舌飞蓬、短莛飞蓬、香丝草、小蓬草、瓶头草(Lagenophora cuchumatanica)聚在一个分支上,紫菀属植物聚类在另外一支。从飞蓬属的5 个物种的亲缘关系来看,一年蓬与同属的小篷草(MT806101.1)聚在一起,形成2 个姊妹类群。
3 讨论
叶绿体细胞器参与高等植物光合作用和碳固定等生理活动,是承担能量转换的重要细胞器[31]。叶绿体基因组是植物细胞内3 种基因组中最为保守的一类,具有高度的保守性和较慢的进化速率,在不同物种间的系统进化研究中有更好的统一性[32]。植物叶绿体基因组长度一般为107~218 kb,不同物种之间长度略有不同,其長度的变化主要是由IR 区的收缩和扩张导致[33]。本研究所获得的一年蓬叶绿体基因组大小与结构与已报道的被子植物研究结果相符。一年蓬叶绿体基因组是一个典型的四分体结构,全长为153 283 bp,与同属植物小蓬草( 152 721 bp )、多舌飞蓬(152 281 bp)、短葶飞蓬(152 357 bp)、香丝草(153 014 bp)差异小,与已报道的菊科植物叶绿体基因组长度(149.51~153.20 kb)相比较,一年蓬及其所属的飞蓬属植物叶绿体基因组长度较长[23-34]。一年蓬叶绿体基因组中AT、GC 含量分别为62.95%、37.05%,其中反向重复区(IRs)中GC 含量达到最高(42.98%),这与其他菊科植物叶绿体基因组特征一致[25]。一年蓬基因组大单拷贝区(LSC)84 833 bp,小单拷贝区(SSC)18 412 bp,反向重复区(IRs)25 019 bp,与多舌飞蓬(AT:62.90%、GC:37.10%;LSC:84 881 bp、SSC:18 102 bp、IRs:24 692 bp)、短葶飞蓬(AT:62.80%、GC:37.20%;LSC:84 789 bp、SSC:18 110 bp、IRs:24 691 bp)遗传差异很小,主要差异在SSC 和IRs 区域,相差300 bp 左右[35]。通过IRscope 比较分析,发现飞蓬属的几个物种叶绿体基因组结构和大小高度保守,但是SC 和IR边界仍会有细微区别。这与苏玥等[36]对乳苣叶绿体基因组特征研究结果一致,乳苣与其他5 种菊科近缘种植物叶绿体基因组进行比较分析时发现基因组序列整体高度相似,但是在rps19、rpl2、ycf1、trnN、ndhF、trnH 和rpl23 等基因上有变化。
一年蓬叶绿体基因组共注释出132 种基因,其中编码蛋白质基因、tRNA 基因和rRNA 基因数量分别为88、36、8 个。梁凤萍等[23]对27 种菊科植物叶绿体基因组进行注释,发现菊科植物叶绿体基因组共有基因一般为125~138 个,编码蛋白基因为83~90 个,tRNA 基因32~43 个,rRNA基因7~9 个。同属多舌飞蓬和短葶飞蓬叶绿体基因组共注释129 个基因,编码蛋白质基因84 个、tRNA 基因37 个和rRNA 基因8 个[35]。一年蓬叶绿体基因组基因数目特征与其他菊科植物一致,值得提出的是本研究注释到8 个未知功能基因[ycf1(2)、ycf15(2)、ycf2(2)、ycf3、ycf4],需进一步利用先进的分子技术手段对其功能进行鉴定。
叶绿体SSR(cp SSR)通常是短的单核苷酸串联重复序列,当位于线粒体基因组的非编码区域时,通常显示种内变异重复次数[37]。cp SSR 可以在同一物种内表现出高度变异,被广泛应用于群体遗传学和系统发育分析等领域[38-39]。在一年蓬叶绿体基因组LSC、SSC、IR 区域的SSR 数量分别为126、40、34 个,单核苷酸重复单元最多,其次是三核苷酸重复单元,A/T 碱基占优势,在菊科[40-41]和其他植物科[42-43]中研究结果一致。这些SSR 可为飞蓬属物种分子标记开发及物种鉴定提供理论依据。
随着叶绿体基因组测序数量的增加,很多学者通过该类基因组重建了菊科植物的系统发育关系。本研究在NCBI 上下载了22 种紫菀族植物,以舌状花亚科苦荬菜属植物苦荬菜为外群,构建系统发育树。一年蓬在内的飞蓬属与联毛紫菀属、一枝黄花属和瓶头草属的植物聚类在一个分支上,紫菀属植物另聚类为一支。这与基于ITS 等分子标记建立的分子系统发育树显示的小蓬草与飞蓬属、一枝黄花属等构成一个分支的结果一致[44]。一年蓬与同属小蓬草聚在一起,认为基于叶绿体基因组数据,同属植物的亲缘关系最近。本研究对一年蓬绿体基因组基因结构、SSRs 数量及分布和基因功能等进行了分析,结合已公布的紫菀族族物种叶绿体基因组序列构建了系统发育树,阐明了一年蓬和紫菀族不同物种之间的系统发育关系,丰富了菊科植物的进化关系,为植物分类、遗传进化、系统发育及一年蓬的开发和防除等研究奠定了分子基础。