APP下载

鼠曲草叶绿体全基因组特征及系统发育分析

2023-05-26吴永飞杨雪莲

种子 2023年3期
关键词:菊科密码子叶绿体

吴永飞, 杨雪莲, 颜 丽, 王 霞

(贵州大学农学院, 贵阳 550025)

鼠曲草(PseudognaphaliumaffineD.Don)俗名清明菜,属菊科管状花亚科鼠曲草属一年生或两年生草本植物[1]。在我国南方少数民族地区的清明节前后,采摘鼠曲草的嫩茎叶用来炒食,也可采集带花序的茎叶拌入米面或玉米面,用来制作清明果或青饼等民族传统保健特色风味食品,故有清明菜之称,是清明时节极具特色的野菜,其香味浓郁,味道独特,是少数民族地区民间喜爱的时令野菜[2]。鼠曲草也是一种重要的中草药植物,全草富含黄酮、氨基酸、维生素等多种功能性成分,营养价值高[3],具有祛风、化痰、止咳等功效[4]。此外,鼠曲草具有显著的抗菌[5]、抗炎[6]、抗氧化[7]、抑制酶活性[8]等作用,可用于治疗高尿酸血症、急性痛风性关节炎、慢性支气管炎等疾病[9]。鼠曲草资源丰富,无毒无害,除了具有药理作用和食用作用之外,还可用作化学农药和化妆品天然添加剂,常见的产品包括甜味剂、杀虫剂、抗氧化剂等,是一种极具开发利用潜质的天然资源[10]。

叶绿体是绿色植物进行光合作用的场所,为植株生长发育提供所需物质,也是绿色植物细胞中一种重要的母体遗传细胞器,具有独立的圆形基因组、单独的转录和转运系统,在光合作用和碳固定中起着关键作用[11-12]。叶绿体基因组具有较低的变异率,以及较为保守的结构和组成,被广泛应用于物种保护、系统发育和分子进化[13]。近几年,高通量技术的快速发展,为多种植物叶绿体基因组的检测提供更加便捷、准确、迅速的方式[14-16]。

作为用途广泛且资源充沛的生物资源,叶绿体基因组的检测对鼠曲草进一步开发利用及保护具有重大的意义。但目前有关鼠曲草叶绿体基因组的研究鲜有报道。本研究以贵州省贵阳市乌当区下坝镇宋家坝村采摘的鼠曲草为材料,利用高通量技术对其叶绿体基因组进行测序,对其叶绿体全基因组进行组装注释及相关分析,旨在为鼠曲草属植物物种鉴定、保护及开发利用等研究奠定基础。

1 材料与方法

1.1 试验材料

鼠曲草采自贵州省贵阳市乌当区下坝镇宋家坝村(25°47′20″N;106°51′28″E),样品于-80 ℃冰箱保存。

1.2 DNA的提取及测序

DNA提取按照Yang[17]的方法,从新鲜的鼠曲草叶片中提取DNA,质检合格的DNA,用机械打断的方法进行片段化处理;接着对DNA片段进行纯化、末端修复、3′端加A、连接测序接头,用琼脂糖凝胶电泳进行片段大小选择;通过PCR扩增构建DNA文库,质检合格的DNA文库委托深圳市惠通生物科技有限公司进行测序。剩余DNA保存于贵州大学农学院实验室(编号GDQMC 01)。

1.3 鼠曲草的叶绿体基因组组装、注释

使用CLC Genomics Workbench v 8.0软件组装鼠曲草叶绿体基因组。使用DOGMA和Geneious软件对叶绿体基因组进行注释[18-20],注释良好的鼠曲草叶绿体基因组提交至GenBank,登录号为NC_060507。使用OGDRAW软件[21]制作鼠曲草叶绿体基因组完整图谱。

1.4 密码子偏好性分析和重复序列分析

运用CodonW 1.4.2软件[22]统计分析鼠曲草叶绿体基因组密码子的偏好性。利用Reputer软件[23]对鼠曲草叶绿体基因组的散在重复序列进行检测,最小重复长度设置为30,最小排列值为50,最多碱基错配为3。利用MISA软件[24]检测鼠曲草叶绿体基因组的简单重复序列,单核苷酸的最小重复值设置为10、二核苷酸设置为5,三核苷酸设置为4,四、五、六核苷酸均设置为3。

1.5 鼠曲草叶绿体基因组系统发育分析

从NCBI数据库下载了与鼠曲草亲缘关系相近的13个物种(管状花亚科)叶绿体基因组序列,包括三裂叶豚草(NC_036810.2)、香青(NC_034648.1)、横斜紫菀(MK 290823.1)、野菊花(JN 867592.1)、香丝草(NC_035884.1)、菊芋(MG 696658.1)、蜡菊(NC_041458.1)、葫芦花(NC_034819.1),火绒草(NC_027835.1)、小滨菊(MG 748695.1)、鹿蹄橐吾(NC_039381.1)、银党参(NC_013553.1)和瓜叶菊(NC_031898.1),并将舌状花亚科的莴苣(DQ 383816.1)和菊苣(MK 569377.1)作为外类群参与系统进化分析。经多重比对后,利用MEGA 7.0软件构建系统发育树;自举检测值为1 000。

2 结果与分析

2.1 鼠曲草叶绿体全基因组特征分析

鼠曲草叶绿体基因组(Genbank登录号NC_060507)大小为153 103 bp,具有典型的四分体结构特征,即一个大单拷贝区(LSC),一个小单拷贝区(SSC)和一对反向重复序列(IRs)(图1)。

图1 空心泡叶绿体基因组图谱Fig.1 Complete chloroplast genome map of P. affine

鼠曲草叶绿体基因组LSC区长度为85 064 bp,SSC长度为18 509 bp,IRs区长度为24 765 bp,全基因组的GC含量为37.1%。共编码了113个独特的基因,其中蛋白质编码基因、rRNA基因和tRNA基因分别为80、4、29个(表1)。

表1 鼠曲草叶绿体基因组结构特征Table 1 Structural characteristics of P. affine chloroplast genome

根据功能的不同可以将这些基因分为:自我复制相关基因、光合作用相关基因、其他基因和未知功能基因(表2)。鼠曲草113个独特基因中有19个基因在反向重复区复制,包括全部4种rRNA基因,tRNA基因:trnA-UGC、trnG-UCC、trnI-CAU、trnI-GAU、trnL-CAA、trnN-GUU、trnR-ACG、trnV-GAC和蛋白编码基因:rpl2、rpl23、rps7、ndhB、ycf1、ycf2、ycf15。此外,trnA-UGC、rpoC1、rps16、rpl2等14个基因具有1个内含子,clpP和ycf3具有2个内含子,大部分基因不具内含子,rps12基因存在反式剪接。

表2 空心泡叶绿体基因组注释基因信息Table 1 Annotation gene information in the chloroplast genome of P. affine

2.2 鼠曲草叶绿体基因组重复序列分析

由表3可知,鼠曲草叶绿体基因组中共鉴定出48个4种不同类型的散在重复序列,其中有19个正向重复(39.58%),3个反向重复(6.25%),1个互补重复(2.08%)和25个回文重复(52.83%)。其中回文重复占比最大,互补重复占比最小。除个别重复序列较长外(24 765 bp、105 bp),4种重复序列的长度主要集中在30~60 bp之间。各重复序列在基因编码区(ndhA、ndhB、psaA等)、基因间隔区(rps19-rpl2、petN-psbM、psbC-trnS-UGA等)、tRNA(trnG-UCC、trnS-GGA)和ycf3基因内含子区域均有分布,以ycf2基因中出现的序列最多(表3)。

表3 鼠曲草叶绿体基因组的重复序列Table 3 Repetitive sequences of chloroplast genome of P. affine

2.3 鼠曲草叶绿体基因组SSR分析

鼠曲草叶绿体基因组中共鉴定了74个9种不同序列的SSR位点,SSR重复类型从单核苷酸到五核苷酸均有包含,重复次数分别为31、10、13、19、1,未鉴定出六核苷酸(表4)。单核苷酸序列重复次数最多,占所有SSR位点的41.89%,且全部为A/T重复序列,无C/G重复序列。此外,该物种的SSR位点主要是由碱基A和碱基T组成的(68个),占所有SSR位点的91.89%。

表4 鼠曲草叶绿体SSR信息Table 4 SSR information in chloroplast of P. affine

2.4 鼠曲草密码子偏好性分析

利用CodonW统计鼠曲草叶绿体基因组密码子使用情况,结果表明,鼠曲草叶绿体基因组含有64种密码子,总密码子数为51 034个,这些密码子共编码了22种氨基酸(表5)。其中,亮氨酸(10.21%)出现频率最高,色氨酸(1.39%)出现的频率最低,而使用频率最高和最低的密码子分别是AGA(RSCU=2.10)和CGA(RSCU=0.47)。在所有密码子中,RSCU>1的密码子有31个,其中14个密码子以A结尾,13个密码子以U结尾,而仅有4个以C/G结尾,说明鼠曲草叶绿体基因组偏好使用A/U结尾的密码子。

表5 鼠曲草各氨基酸相对同义密码子使用度Table 5 Relative synonymous codon usage in each amino acid of P. affine

2.5 鼠曲草叶绿体全基因组系统发育分析

以鼠曲草、13个管状花亚科植株和2个来自舌状花亚科植株(作为外群)的叶绿体基因组构建系统发育树,以评价鼠曲草与其他植物之间的进化关系。管状花亚科14个物种构成一个单系类群,该单系类群被分为5个小的类群,香青、蜡菊、鼠曲草和火绒草为一个类群,属于旋覆花族;小滨菊和野菊花为一个类群,属于春黄菊族;葫芦花、香丝草和横斜紫菀为一个类群,属于紫菀族;瓜叶菊和鹿蹄橐吾为一个类群,属于千里光族;菊芋、银党参和三裂叶豚草为一个类群,属于向日葵族;作为外群的两个舌状花亚科物种为一个类群,属于莴苣族。鼠曲草与香青和蜡菊构成的单系分支互为姊妹类群,且它们构成的单系分支与火绒草互为姊妹类群。所有菊科植物中,鼠曲草与香青、蜡菊和火绒草的关系最为密切(图2)。本研究获得的鼠曲草叶绿体基因组为深入研究管状花亚科植物物种之间的进化关系奠定了基础。

图2 基于菊科16个物种的系统发育树Fig.2 Phylogenetic tree based on 16 species of compositae

3 讨 论

目前鼠曲草的研究主要在功能性成分的提取和药理作用等方面[25-26],对其物种进化和叶绿体基因组研究较少。叶绿体是绿色植物最重要的细胞器之一,其基因组是独立且完整的[27],鼠曲草叶绿体基因组的研究补充了鼠曲草遗传背景等相关信息。不同植物其叶绿体基因组长度不同,高等植物一般在120~180 kb以间,通常可编码100~130个特异基因,叶绿体基因组在基因内容和基因组结构上高度保守[28]。梁凤萍等[29]对已报道的菊科植物叶绿体全基因组序列进行了统计,发现菊科植物叶绿体基因组长度在149 510~153 202 bp之间,基因组总GC含量为30%~40%,叶绿体总基因数量在106~138之间。本研究发现,鼠曲草叶绿体基因组大小为153 103 bp,GC含量为37.1%,共编码113个基因(19个在IR区重复),包括80个蛋白质编码基因、4个rRNA 和29个tRNA。这与在马钱子[30]、横斜紫菀[31]和蜈蚣草[32]等菊科植物的叶绿体基因组结构特征基本类似,说明叶绿体基因组高度保守[33]。

重复序列会导致叶绿体基因组的重排,改变基因组的结构,在叶绿体基因组的进化中发挥着重要的作用[34]。本研究鉴定了48个散在重复序列,4种重复类型均被检测出来,以回文重复占比最大,大多数重复序列分布在基因间隔区和ycf2基因中,这与Yan等[35]在豆瓣菜的研究结果类似。同时,检测到74个9种不同类型的SSR位点,其中单核苷酸重复序列占比最大,且均表现为A/T型,具有很强的A/T偏性,这与在匙叶紫菀[36]中的研究结果相似,原因是SSR通常由短聚腺嘌呤或多胸腺嘧啶重复序列组成。鼠曲草叶绿体基因组重复序列的解析,为鼠曲草属植物的鉴定和进一步的演化研究提供参考。

密码子偏好性是指同义密码子使用不均衡的现象,在生物体基因组进化过程中扮演重要作用,通常以同义密码子使用频率(RSCU)来反映密码子使用情况[37]。鼠曲草叶绿体基因组中共有22种氨基酸被64种密码子编码,其中编码Leu的密码子最多(5 209, 占10.21%),编码Trp的密码子最少(707, 占1.39%)。RSCU分析表明,RSCU值最大和最小的密码子分别是AGA(2.10)和CGA(0.47),且均是编码Arg的密码子;各密码子中,RSCU值大于1的有31个,其中27个以A/U结尾,说明鼠曲草叶绿体基因组偏好使用A/U结尾的密码子,这种密码子使用偏性现象与猕猴桃[38]类似。

目前有关菊科植物系统发育关系的研究越来越广泛[39-40]。为确定鼠曲草在菊科植物中的进化地位和亲缘关系,选取15种菊科物种,以莴苣和菊苣作为外类群进行系统进化分析。研究表明,鼠曲草与香青和蜡菊构成的单系分支聚为同一分支,再与火绒草聚为同一分支,说明鼠曲草与三者的亲缘关系较近。

本研究测序并组装了鼠曲草的叶绿体基因组,揭示了鼠曲草的叶绿体基因组结构、重复序列、密码子偏好性及系统发育关系,为今后鼠曲草属植物系统发育分析提供理论依据,为菊科的分类学研究和系统发育分支内的进化关系分析提供重要参考。

猜你喜欢

菊科密码子叶绿体
密码子与反密码子的本质与拓展
菊科药用植物遗传多样性及亲缘关系的ISSR分析
10种藏药材ccmFN基因片段密码子偏好性分析
两种羽叶菊属植物(菊科:千里光族)的细胞学研究及其系统学意义
菊科植物总黄酮的提取工艺研究进展
南方红豆杉叶绿体非编码序列PCR体系优化及引物筛选
青岛崂山菊科药用植物资源调查研究
茶树CsActin1基因密码子偏性分析
茶树叶绿体DNA的PCR-RFLP反应体系优化
烟草叶绿体密码子的偏好性及聚类分析