APP下载

乳苣叶绿体基因组特征及其系统发育分析

2021-06-29苏玥刘娟娟完斌张鹏举陈正根宿俊吉王彩香

中国农业科技导报 2021年6期
关键词:叶绿体莴苣基因组

苏玥, 刘娟娟, 完斌, 张鹏举, 陈正根, 宿俊吉, 王彩香

(甘肃农业大学生命科学技术学院, 兰州 730070)

乳苣(Mulgediumtataricum)又名蒙山莴苣、紫花山莴苣,为菊科(Compositae)乳苣属(Mulgedium)多年生草本植物。其广泛分布在俄罗斯、阿富汗、印度、伊朗等国,我国主要分布在甘肃、山西、青海、新疆等北部省区,生长于海拔1 200—4 300 m的河滩、湖边、草甸、田边、固定沙丘以及砾石地[1]。中国学者石铸以“总苞宽钟状或圆柱状,果期不为卵球状;总苞片通常为紫红色舌状小花蓝色或紫红色,舌片顶端截形,五齿裂,瘦果纺锤状,每面有5~7条高起的钝纵肋,顶端渐尖成喙,喙绝不为丝状”等特征将其与莴苣属分开,独立成属[2]。乳苣富含蛋白质、糖类、脂肪、膳食纤维、氨基酸、矿物质、维生素、微量元素等营养物质,具有清热、杀菌、消炎、止痛等功效,民间多作为野菜食用[3]。乳苣中含有丰富的天然黄酮类化合物,具有抗心血管疾病、抗氧化、抗肿瘤等医学价值[4]。

叶绿体基因组(cpDNA)中含有大量功能基因,在物种鉴定及系统进化中具有重要研究价值。叶绿体基因组以共价闭合的双链形式存在,由四个区域组成:一对反向重复序列区(inverted repeat region, IR)、一个大单拷贝序列区(large single-copy region, LSC)和一个小单拷贝序列区(small single-copy region, SSC)[5-6]。叶绿体基因组序列具有高度保守、结构稳定、分子进化速率慢且分子量小等特点,使其在胞质遗传、植物系统发育、DNA条形码的开发、遗传多样性和亲缘关系等方面发挥着重要作用[7]。因此,叶绿体基因组已成为研究植物系统发育最有效的工具之一。自1986年烟草(Nicotianatabacum)和地钱(Marchantiapolymorpha)叶绿体基因组完整序列报道以来[8-9],植物叶绿体基因组测序工作进入快速发展阶段。2007年,菊科植物莴苣(Lactucasativa)和向日葵(Helianthusannuus)的叶绿体基因组组装完成[10];2018年,GenBank数据库已收录了12个属27种菊科植物[11]。然而有关菊科乳苣属植物叶绿体基因组序列的研究还未见报道。本研究基于高通量测序技术获得了乳苣叶绿体基因组全长序列,比较了乳苣属与近缘属叶绿体基因组序列,并探讨了乳苣的系统进化与亲缘关系,以期为菊科植物叶绿体基因组的变异和分子系统进化发育等提供证据。

1 材料与方法

1.1 供试材料

乳苣于2019年4月采自甘肃省兰州市安宁区(36.10°N、103.72°E)黄河岸边,选择健康植株,取正常发育的幼嫩叶片100 mg,用锡箔纸包裹后液氮速冻,-80 ℃冷冻保存。

1.2 研究方法

1.2.1DNA提取及测序 将乳苣样品送至南京集思慧远生物科技有限公司,用改良的CTAB法[12]提取叶片DNA,经1%琼脂糖凝胶电泳和Nanodrop分光光度计对其浓度、纯度进行检测。合格DNA经超声波片段化后进行PCR扩增,形成测序文库,文库质检合格后用Illumina Novaseq平台进行测序,双末端(Paired-end,PE)测序读长为150 bp。

1.2.2叶绿体基因组的组装与注释 测序完成后得到7 283 Mb的原始数据(raw read),过滤低质量值数据,确保数据质量reads(质量值Q≤5的碱基数占整个read的50%以上的reads),得到约24 Mb高质量reads(clean data)。将clean data参考物种宽果蒲公英(Taraxacumplatycarpum, KU736960)的cpDNA序列进行序列组装,为了降低序列组装的复杂度,使用bowtie2 v2.2.4(http://bowtie-bio.sourceforge.net/bowtie2/index.shtml),与本地化构建的叶绿体基因组数据库进行比对,将比对上的序列作为测试样品的cpDNA序列。利用blast v2.2.25软件(https://blast.ncbi.nlm.nih.gov/Blast.cgi)将乳苣cpDNA与参考物种叶绿体基因组CDS序列比对并进行注释,再经过手工校正后得到cpDNA的注释结果;利用SPAdes v3.10.1软件(http://cab.spbu.ru/software/spades/)组装cpDNA序列[13]。然后用hmmer v3.1b2软件(http://www.hmmer.org/)比对参考基因组的rRNA序列,获得乳苣cpDNA的rRNA注释信息[14]。利用aragorn v1.2.38软件(http://130.235.244.92/ARAGORN/)对cpDNA序列进行tRNA预测,获得cpDNA的tRNA注释信息[15]。再用OGDRAW软件(https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)绘制乳苣cpDNA物理图谱[16]。将注释完整的乳苣cpDNA序列用BankIt向NCBI在线提交,获得序列GenBank登录号(MT845217)。

1.2.3重复序列和SSR分析 利用Vmatch v2.3.0软件(http://www.vmatch.de/),结合Perl脚本鉴定串联重复序和散在重复序列[17],其中散在重复序列包括正向、反向、回文和互补四部分。参数设置为:最小长度(minimum length)30 bp,海明距离(hamming distance)3。利用MISA v1.0软件(http://pgrc.ipk-gatersleben.de/misa/misa.html)鉴定乳苣cpDNA中的简单重复序列(SSR)[18],搜索参数设置为:1-8、2-5、3-3、4-3、5-3、6-3(前面数字代表重复碱基数量,后面数字代表最低重复次数,如1-8为单碱基重复8次及以上)。

1.2.4边界和共线性分析 从NCBI数据库下载苦苣菜(Sonchusoleraceus, MG878405)、加纳利苦苣菜(Sonchuscanariensis, NC_042381)、Sonchuswebbii(NC_042383)、宽果蒲公英(Taraxacumplatycarpum, KU736960)和莴苣(Lactucacativa, NC_007578)5个菊科菊苣族物种cpDNA序列,分析乳苣和上述5个菊科菊苣族物种IR和SC区域间的边界和共线性。使用IRscope软件(https://irscope. shinyapps. io/irapp/)绘制出IR边界对比图[19]。使用Mauve(v2.3.1)软件默认参数进行基因组比对[20],对上述6个物种的叶绿体序列共线性进行分析。

1.2.5系统发育分析 从NCBI数据库下载已公布的32个菊科代表属物种完整的cpDNA序列,同时以十字花科拟南芥(Arabidopsisthaliana, NC_000932)为外类群,用MAFFT v7软件对共有序列进行多重比对后用最大似然法(maximum likelihood, ML)对系统进化关系进行分析[21],利用RAxML v8.2.10软件GTR模型(bootstrap=1 000)生成系统发育进化树[22]。

2 结果与分析

2.1 乳苣叶绿体基因组结构与特征

组装结果显示,乳苣叶绿体基因组总长为152 401 bp,其中反向重复序列区(IRs)的长度为25 010 bp,大单拷贝区(LSC)和小单拷贝区(SSC)的长度分别为83 833和18 548 bp,GC含量为37.59%(图1)。乳苣叶绿体基因组中共注释132个基因(表1),其中包含8个rRNA基因(9.20%)、37个tRNA基因(28.03%)和87个mRNA基因(65.91%)。按照功能可将这些基因分为四类:第一类为与自我复制有关的基因(总计45个),包含rrn16、rrn23、rrn4.5等8个rRNA和trnH-GUG、trnK-UUU、trnQ-UUG等37个tRNA;第二类为与光合作用有关的基因(总计75个),包含14个核糖体小亚基基因、11个核糖体大亚基基因、4个DNA依赖核酸聚合酶基因、12个NADH脱氢酶亚基基因、7个亚光系统Ⅰ基因、14个亚光系统Ⅱ基因、6个细胞色素复合物b/f亚基基因、6个ATP合酶亚基基因和1个Rubisco酶大亚基基因;第三类为其他蛋白基因(6个),包括转录起始因子infA、成熟酶matK、蛋白酶clpP等;第四类功能未知,包含ycf2、ycf15、ycf1等8个基因。

2.2 SSR位点分析

通过SSR位点分析(图2),共检测到197个串联重复序列和21个散在重复序列。从图2可以看出,在197个串联重复序列中,100个位点(50.76%)位于基因编码区(exon)、12个位点(6.09%)位于基因内含子区(intron)、85个位点(43.15%)位于基因间隔区(intergenic)。在这些串联重复序列中,120个(60.90%)位于LSC区域,39个(19.80%)位于SSC区域,38个(19.30%)位于IR区域。按照碱基重复位点数目分类,这些串联重复序列可分为单碱基重复位点(P1,124个)、双碱基重复序列(P2,6个)、三碱基重复序列(P3,65个)和四碱基重复序列(P4,2个),其中单核苷酸重复最多,占到62.94%,四核苷酸重复数量最少, 占到1.01%。在21个散在重复序列中,包含10个正向重复序列(forward repeat sequence,F)、2个反向重复序列(reverse repeat sequence,R)、11个回文重复序列(palindromic repeat sequence, P),无互补重复序列。在这些重复序列中,AT基序占据优势,具有碱基偏好性,这与前面的在叶绿体基因序列中AT含量较高的结果保持一致。

注:正向编码的基因位于圈外侧而反向编码的基因位于圈内侧,内部的深、浅灰色的区域分别代表GC、AT含量。Note: Genes inside the circle are transcribed clockwise, and those outside are transcribed counter clockwise. Darker and lighter areas in the inner circle indicate GC content and AT content, respectively.图1 乳苣叶绿体基因组图谱Fig.1 Gene map of Mulgedium tataricum chloroplast genome

图2 乳苣叶绿体基因组SSR位点分布Fig.2 SSR distribution of chloroplast genome from Mulgedium tataricum

2.3 边界分析

通过比较乳苣和5个菊苣族物种cpDNA的IR与SC边界区域基因的分布状况,分析乳苣在进化过程中IR/SC边界上是否存在扩张与收缩现象。借助IRscope工具生成6个菊苣族植物物种的边界图(图3),发现这6个菊苣族植物物种的叶绿体基因组长度差异较小(分布在151 307~152 765 bp之间),其序列整体上高度相似,但不同物种间边界基因的类型和位置有所差异(图3)。第一个边界LSC-IRb位于rps19基因内部,边界上仅分布一个基因,基因类型相同;而rps19基因分布在IRb中的长度在6个菊苣族物种间存在明显差异,分别为66、89、89、87、67和60 bp。第二边界IRb-SSC上分布的基因类型和大小在物种间均存在较大的差异,在苦苣菜和宽果蒲公英中,ycf1基因横跨IRb-SSC边界,在SSC中长度分别为44和3 bp;在乳苣和宽果蒲公英中,ndhF基因横跨IRb-SSC边界,在IRb中的长度分别为2和18 bp;在加纳利苦苣菜、莴苣和Sonchuswebbii3个物种中,ndhF基因没有横跨IRb-SSC边界。在第三个边界SSC-IRa上,基因类型和大小都存在差异。除莴苣外,5个物种均有ycf1基因横跨该边界,但ycf1基因分布在IRa中的长度物种间存在差异。在第四个边界IRa-LSC上,6个物种中均无基因横跨,但是该边界离trnH基因的距离在6个物种间存在71和75 bp两种类型。上述边界分析结果表明,乳苣与其他5个菊科莴苣族物种在边界基因上存在一定差异,且IR/SC区存在明显扩张和收缩现象。

图3 6个菊苣族物种叶绿体基因组LSC、SSC和IR边界比较Fig.3 Comparison of LSC, SSC and IR borders among six chloroplast genomes of Lactuceae species

2.4 叶绿体序列共线性分析

为了评估乳苣与其他5个菊苣族物种在进化上的差异程度,利用Mauve软件[20]对乳苣和上述5种菊苣族物种的叶绿体基因进行对照分析,结果如图4所示。可以看出,这6个物种的叶绿体基因高度相似,没有检测到大片段的倒位或基因重排现象,基因的排列顺序基本一致并且具有较高的保守性。从叶绿体基因组4个组分上看,IR区序列变异最低,SSC区的变异程度最高。

图4 6个菊苣族物种叶绿体基因组的共线性分析Fig.4 Collinearity analysis of chloroplast genomes from six Lactuceae species

2.5 乳苣与菊科近缘物种间系统发育分析关系

为了揭示乳苣与32个菊科物种之间的系统发育关系,以拟南芥为外类群,将乳苣和32个菊科物种的叶绿体基因组序列进行聚类分析。结果(图5)显示,菊科14个属的33个物种之间存在较为明确的系统进化关系,它们可聚为两大分支。第一分支由蒲公英属(Taraxacum)、莴苣属(Lactuca)、乳苣属(Mulgedium)、苦苣菜属(Sonchus)、香青属(Anaphalis)、火绒草属(Leontopodium)、茼蒿属(Chrysanthemum)、蒿属(Artemisia)、紫菀属(Aster)和向日葵属(Helianthus)10个属的26个物种组成。第二分支由蓟属(Cirsium)、红花属(Carthamus)、风毛菊属(Saussurea)和苍术属(Atractylodes)4个属7个物种构成,它们均属于菜蓟族(Cynareae)植物。乳苣属位于系统进化树的第一分支中,紧邻莴苣属,说明乳苣与莴苣属植物(NC_007578和DQ383816)的亲缘关系最近,这与前人通过分子系统学分类方法[2]和分支分析方法[23]获得的研究结果一致,同时也证明通过叶绿体基因组序列可以有效进行系统发育关系研究。

图5 基于34种植物叶绿体基因组序列的系统发育树Fig.5 Phylogenetic tree based on complete chloroplast genomes sequences from 34 species

3 讨论

菊科是被子植物中较大的科,适应多种生态环境。由于菊科是一个较年轻的科,正处在分化强烈阶段,加之种类繁多,形态变异复杂,使得对其科内等级的划分和系统学研究产生极大困难,因此研究菊科植物的系统进化关系是植物学的研究热点[24]。传统分类方法主要依据外部形态、内部解剖特征,结合地理分布和古生物学等进行。由于传统分类方法研究周期较长,主观因素较大,严重影响分类系统开展。而利用分子生物学手段获取植物各种DNA序列,通过分析DNA序列遗传变异,可以推断植物类群之间的演化,探讨植物的系统发育关系,对于揭示植物系统与进化有着重要作用[24]。

叶绿体是所有绿色植物和藻类微生物细胞进行光合作用的细胞器,自身具有相对独立的遗传物质且基因组结构稳定,大多数属于母系遗传[25]。与核基因组DNA相比,cpDNA具有分子量小、多拷贝和结构简单的特点,这些都有利于对其进行分析(包括物理图谱的构建及特定基因的分离、鉴定和序列测定)[26]。其中,非编码区的进化速度快,适用于较低分类阶元(如科、属)的系统研究;编码区的进化速度慢,适用于较高分类阶元(如科、目及更高的分类单位)的系统研究[27]。1986年,烟草(Nicotinanatabacum)和地钱(Marchantiapolymorpha)的叶绿体基因组测序完成,这是最早被报道的叶绿体全基因组序列[8-9]。此后,国内外研究者开始对一些植物的叶绿体基因组进行研究,现已广泛应用于植物物种鉴定、系统进化、遗传多样性等多个领域。目前已有多种菊科植物的叶绿体全基因组被报道,2018年,GenBank数据库已登录了菜蓟属、蒿属、紫菀属等12个属27种菊科植物[11],除此之外,苦苣菜属叶绿体基因组同样被报道[28-29]。本研究采用第二代高通量测序技术对乳苣进行叶绿体全基因组测序,构建了乳苣叶绿体基因组物理图谱,注释132个基因,明确了乳苣叶绿体基因组结构与特征,为后续深入研究菊科植物的系统进化提供理论基础。前期研究认为,菊科植物叶绿体基因组长度分布在149.51~153.20 kb之间[11]。本研究中组装的乳苣叶绿体基因组全长为152.40 kb,分布在已报道的菊科植物叶绿体全基因组大小范围之内,且乳苣同样呈典型的环状四分体结构,GC含量为37.59%。菊科植物的IR区的长度在20~28 kb[11],而乳苣IR区长度为25 010 bp,同样与菊科植物IR区长度相吻合。

植物叶绿体基因组的扩张和收缩是植物比较基因组学中的重要数据,它们被认为是叶绿体基因组变异的主要机制[30]。叶绿体基因组大小与非编码区域的收缩和扩张有关,且IR区域是叶绿体基因组中最保守的。梁凤萍等[11]对27个菊科植物叶绿体基因组进行研究,发现基因的位置除了trnH基因之外,rps19、ycf1、ndhF等基因均十分保守。尽管叶绿体基因组结构和大小高度保守,但是IR与SC的边界区域仍会有细微差别。Cho等[29]对苦苣菜属3个物种叶绿体基因组LSC、SSC和IR区域进行了边界分析,发现rps19、ycf1、ndhF、rpl2和trnH基因在位置或大小上物种间存在一些细微差异。本研究对乳苣和其他5个菊科莴苣族物种叶绿体基因组进行边界和共线性比较分析,发现6个物种的叶绿体基因组序列整体上高度相似,但其仍存在明显差异,主要表现为rps19、rpl2、ycf1、trnN、ndhF、trnH和rpl23等基因的扩张和收缩。

近年来,有不少学者通过叶绿体重建了部分菊科植物的系统发生关系。例如,梁凤萍等[11]完成27种菊科植物叶绿体基因组特征及系统进化分析,证明莴苣属与矢车菊属植物存在较近的亲缘关系。Cho等[29]利用叶绿体基因组通过对32种菊科植物的系统发育分析,揭示了4种苦苣属植物(苦苣菜、无茎苦苣菜、加纳利苦苣菜、Sonchuswebbii)与莴苣(DQ383816)、Taraxacumobtusifrons具有较近的亲缘关系。乳苣属、莴苣属、蒲公英属和苦苣菜属均属于菊科菊苣族植物,该族植物存在一个最易辨认的表型特征,具有大而鲜艳的舌状花和牛奶状的白色乳汁使它们全然不同于菊科中任何一个特别的族。系统进化树结果表明,乳苣属、莴苣属、蒲公英属和苦苣菜属存在最近的亲缘关系,本研究从分子上证明了菊苣族的4个属具有较近的亲缘关系(图5)。同时也发现,相对于菜蓟族植物,菊苣族与旋覆花族、春黄菊族、紫菀族和向日葵族存在较近的亲缘关系(图5)。本研究通过对乳苣叶绿体基因组测序及分析,补充了菊科植物叶绿体基因组缺失的属种,为今后全面揭示菊科植物系统进化关系奠定基础。

猜你喜欢

叶绿体莴苣基因组
“植物界大熊猫”完整基因组图谱首次发布
我国小麦基因组编辑抗病育种取得突破
第一代基因组设计的杂交马铃薯问世
牛参考基因组中发现被忽视基因
秋日野餐会
共生
人不吃饭行吗
莴苣和韭菜
一种快速提取微藻完整叶绿体及其DNA的方法
爱上莴苣