桔梗叶绿体比较基因组学分析及系统发育研究
2023-08-03杜晨晖詹海仙尚彩玲李瑞锋原淑佳
张 瑜,杜晨晖,詹海仙,尚彩玲,李瑞锋,原淑佳
桔梗叶绿体比较基因组学分析及系统发育研究
张 瑜,杜晨晖*,詹海仙,尚彩玲,李瑞锋,原淑佳
山西中医药大学中药与食品工程学院,山西 晋中 030619
以桔梗为材料,分析其叶绿体基因组特征,探究不同地区桔梗叶绿体基因组的差异及桔梗科其他物种的系统发育关系。利用 Illumina NovaSeq测序平台对桔梗叶绿体全基因组进行测序,完成其组装、注释和特征分析,采用生物信息学方法对不同地区桔梗进行比较基因组分析和系统发育分析。桔梗叶绿体基因组全长172 770 bp,呈现典型的环状四分体结构,总GC含量为38.10%,注释到139个基因,其中蛋白质编码基因95个,核糖体RNA 8个和转运RNA 36个。经序列分析鉴定出139个SSR位点,大部分重复由A和T组成。该叶绿体基因组密码子偏好性A/U大于G/C。边界分析表明,不同地区桔梗的JLA边界区域存在差异。对比不同地区桔梗叶绿体基因组序列发现21个变异区间,包括、、和等编码区以及、和等非编码区。基于最大似然法(maximum likelihood method,ML)对桔梗及其他17种桔梗科植物进行系统发育分析,发现桔梗科物种形成一个单系群,各属物种聚为一束,支持率达100%。桔梗科物种聚为一支与传统相符合,不同地区桔梗叶绿体基因组序列存在显著差异,为后期开展分子鉴定及群体遗传学研究提供提供科学依据。
桔梗;叶绿体基因组;序列比对;系统发育;SSR
药用植物桔梗(Jacq.) A. DC.隶属于桔梗科桔梗属,为多年生草本,别名包袱花、铃当花、道拉基[1]。在《中国药典》2020年版中桔梗以根入药,具有宣肺利咽、祛痰排脓等功效,多用于咳嗽痰多、胸闷不畅、咽痛音哑、肺痈吐脓[2]。桔梗的主要化学成分为含桔梗皂甙,此外含有丰富的多糖、各种氨基酸及矿物质等,国家卫生部将桔梗列为药食两用的中药材[3]。桔梗科有60~70个属,中国产16个属,而桔梗属仅有1个种桔梗[4]。桔梗产自东北、华北、华东、华中各省,韩国、朝鲜、日本等地区也有分布[5]。山西省阳泉市盂县山地面积广,海拔高,土壤中富含磷钾,为桔梗的生长提供了得天独厚的自然环境。桔梗作为山西盂县地道中药材,因其品质好被百姓誉为“小人参”。目前,药用植物桔梗的叶绿体基因组虽然已经报道[6],但是对于不同地区桔梗的叶绿体基因组组装、基因组特征和系统进化分析等未见报道。
叶绿体基因组一般由1个大单拷贝区域(large single copy,LSC)、1个短单拷贝区域(small singlecopy,SSC)和2个反向重复区域(inverte drepeat,IR)组成闭环双链DNA结构,基因组大小多为150~200 kb[7-9]。叶绿体是植物细胞内半自主性的细胞器,拥有相对独立的基因组,依赖于母系遗传,具有结构稳定、序列保守、间隔区变异位点丰富,分子进化速率慢等特点,广泛应用于亲缘关系、系统进化关系及遗传多样性研究[10-12]。
随着测序技术的不断发展以及测序成本的降低,已报道多种重要的药用植物叶绿体基因组序列,如人参C. A. Meyer[13]、银杏L.[14]、厚朴(Rehder & E. H. Wilson) N. H. Xia & C. Y. Wu[15]、红豆杉var. chinensis (Pilger) Florin[16]、肉苁蓉Ma[17]、三七(Burkill) F. H. Chen ex C. Y. Wu & K. M. Feng[18]、石斛Lindl.[19]、丹参Bunge[20]等。本研究基于高通量测序技术,对桔梗开展叶绿体全基因组测序、组装及注释,获得其叶绿体基因组的全长序列信息;利用生物信息学手段比较分析不同地区桔梗的结构特征、简单重复序列(simple sequence repeats,SSRs)位点、边界分析、序列变异程度等,同时构建系统进化树,为深入研究桔梗的鉴定、分子标记开发及系统发育关系提供数据支撑。
1 材料
桔梗新鲜叶片材料采自山西省阳泉市盂县桔梗种植基地(38°13′55″E,113°6′16″N),凭证标本号为XZ-2020-1。叶片装入取样袋带回实验室,液氮速冻后放于−80 ℃冰箱保存备用。样品由山西中医药大学杜晨晖教授鉴定,凭证标本存放于山西中医药大学标本馆。桔梗及其近缘物种叶绿体基因组序列来源于NCBI数据库,实验材料详细信息见表1。
表1 植物样品来源
2 方法
2.1 提取DNA及测序
采用北京天根生化植物DNA提取试剂盒(Tiangen Biotech有限公司,中国)提取叶片DNA,1%琼脂糖凝胶电泳和微量分光光度计(Nanodrop 2000,美国)检测DNA质量及浓度。以1 μg DNA起始量建库,随机打断检测合格的基因组总DNA,构建长度约350 bp的插入片段文库。构建好的文库经过质检后,利用lllumina NovaSeq平台进行双末端测序,序列读长为150 bp,测序工作由北京上锋基因生物科技有限公司完成。
2.2 序列拼接、注释及绘制物理图谱
利用Trimmomatic软件[21]对测序得到的原始序列(raw reads)进行质控(参数设置选择默认值),滤过去除接头(adapter)和低质量序列(reads),得到高质量待分析序列(clean reads)。参考序列为桔梗(NC_035624),运用NOVOPlasty软件[22]对桔梗叶绿体基因组组装,并利用GapCloser软件对组装结果进行内洞修补。然后使用CPGAVAS软件[23]进行叶绿体基因组注释,并运用Apollo软件对注释结果进行人工校准,最终结果提交至GenBank获得登录号(MZ202358)。运用Organellar Genome DRAW在线软件[24]绘制桔梗叶绿体基因组物理图谱。
2.3 简单重复序列分析
利用MISA软件检测桔梗叶绿体基因组的SSRs[25],参数设置为:单核苷酸重复单元≥10,二核苷酸重复单元≥5,三核苷酸和四核苷酸重复单元≥4,四核苷酸、五核苷酸和六核苷酸重复单元≥3,且2个SSRs之间的最小距离为100 bp。
2.4 密码子偏好性分析
使用CodonW软件[26](http://codonw. sourceforge.net/)获得桔梗叶绿体基因组的有效密码子数(effective number of codon,ENC)、密码子的第3个碱基出现G/C的概率(GC3s)、相对同义密码子使用度(relative synonymous codon usage, RSCU)。以ENC值为参考,对桔梗叶绿体基因组编码序列从大到小排序,筛选最高和最低两端各10%的基因,分别建立高、低表达基因库,以ΔRSCU(高表达基因RSCU-低表达基因RSCU)≥0.08为条件,筛选出高表达密码子;以RSCU>1为条件,筛选出高频密码子。同时满足高频和高表达条件的密码子确定为最优密码子[27]。
2.5 叶绿体基因组IR边界的收缩和扩张分析
IR区域相对保守,IR边界的膨胀和收缩被认为是被子植物叶绿体全基因组大小变化的主要机制[28]。本研究使用IRscope在线软件(https://ir-scope. shinyapps.io/irapp/)获得并比较分析桔梗及桔梗科其他4种植物叶绿体基因组的IRA/IRB、LSC和SSC和边界基因的序列长度,探讨桔梗科植物叶绿体基因组IR边界的收缩和扩张特征[29]。
2.6 叶绿体基因组序列变异分析
本研究基于LAGAN模型,利用mVISTA软件对中国地区桔梗(MZ202358)与韩国地区桔梗(NC_035624)叶绿体全基因组进行序列比对和变异分析[30]。
2.7 系统发育分析
从GenBank获取紫茎泽兰(NC_036222)、展枝沙参(NC_036221)、薄叶荠苨(NC_026999)等桔梗科17种(19个)物种和2个外类群物种的完整叶绿体基因组信息,分析获得66个共有蛋白质编码基因:、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、。利用在线软件MAFFT7(https://mafft. cbrc.jp/alignment/ server/)将上述物种的共有编码基因进行比对,比对结果使用IQ-TREE multicore 2.0.5(http:// www.iqtree.org/)软件[31],最大似然法(maximum likelihood method,ML)构建系统发育树,构树参数设置:-mMFP- B1000-alrt 1000,优构树模型:GTR+F+R3,Bootstrap value为1000。
3 结果与分析
3.1 叶绿体基因组的基本特征
与大多数被子植物相同,桔梗的叶绿体基因组呈现典型的四分体结构,由2个大小相同、方向相反的反向重复区(IRa、IRb)、1个LSC区和1个SSC区组成(图1)。桔梗的叶绿体基因总长度为172 770 bp,其中LSC区长79 115 bp,SSC区长7841 bp,IRa区长42 907 bp,IRb区长42 907 bp。桔梗叶绿体基因组整体GC含量为38.10%,其中蛋白编码区的GC含量是38.11%,4个区段中GC含量最高的是IR区(39.53%),其次是LSC区(37.25%)和SSC区(31.03%)。
桔梗叶绿体基因组共注释到139个基因,包括95个蛋白编码基因、36个tRNA基因和8个rRNA基因(表2)。蛋白编码基因的长度为90 594 bp,占整个基因组长度的52.44%;tRNA基因的长度为2713 bp,占总长度的1.57%;rRNA基因的长度为9176 bp,占总长度的5.31%。非编码区主要包括内含子、假基因(、、、等)和基因间隔区,占整个基因组长度的40.68%。在桔梗叶绿体基因组注释到4个具有内含子的基因,包括、、、。
图1 桔梗叶绿体基因组物理图谱
表2 桔梗叶绿体基因组注释信息
3.2 密码子的偏好性
桔梗叶绿体基因组的密码子使用偏性中,叶绿体基因组的ENC值为51.24,明显高于35,表明密码子偏好性较弱。GC3s含量为28.61%,表明密码子第3位偏好于A和U结尾。通过最优密码子分析显示(表3),有30个密码子RSCU>1,25个密码子ΔRSCU≥0.08,筛选发现同时满足这2个条件的最优密码子有9个,分别为UUG、AUU、UCA、AGC、CCU、GCU、CAU、CGU和GAU,其中以A/U结尾的有7个,以C/G结尾的有2个。
表3 桔梗叶绿体基因组最优密码子
下划线表示RSCU>1;*表示该密码子ΔRSCU≥0.08,**表示ΔRSCU≥0.3,***表示ΔRSCU≥0.5;加粗标注的密码子为最优密码子
The underline indicates RSCU > 1;*represents the codon ΔRSCU ≥ 0.08,**represents ΔRSCU ≥ 0.3, and***represents ΔRSCU ≥ 0.5; The codons highlighted in bold are the optimal codons
3.3 SSR位点分析
共检测到桔梗叶绿体基因组139个SSR位点,包括115个单核苷酸重复序列、6个二核苷酸重复序列、5个三核苷酸重复序列、11个四核苷酸重复序列和2个六核苷酸重复序列。其中,60个SSR位于基因间隔区(IGS),65个SSR位于外显子(exon),14个SSR位于内含子(intron)。叶绿体不同区域的SSR分布情况见图2,大部分SSR位于LSC和IRs区域内,只有少数位于SSC区域内。SSR中重复占比最大的是单核苷酸,约82.73%,而二核苷酸、三核苷酸、四核苷酸和六核苷酸则占比减小,分别占4.32%、3.60%、7.91%和1.44%。桔梗叶绿体基因组中的SSR主要是有A和T组成的,占所有重复序列的83.45%,其中A/T碱基构成的单核苷酸重复108条,AT/AT组成的二核苷酸重复序列5条,ATT/TAA组成的三核苷酸重复序列2条,AAAT组成的四核苷酸重复序列1条。
图2 桔梗叶绿体基因组中SSR位点类型及数量
桔梗科5种植物叶绿体基因组序列中,总共检测到SSR位点103~143个SSR位点(表4),其中单核苷酸重复为90~117个、二核苷酸重复为6~8个、三核苷酸重复5~14个、四核苷酸重复1~11个、五核苷酸重复0~4个、六核苷酸重复0~2个。这些SSR主要分布于叶绿体基因组的LSC区(36.70%~65.12%),编码基因序列中分布的SSR数量仅占总数的32.56%~54.37%。
3.4 桔梗及桔梗科部分物种叶绿体全基因组特征比较
桔梗科部分植物叶绿体全基因组特征的比较分析见表5,桔梗及其近缘种物种共5种(6个)植物叶绿体基因组的序列长度范围为159 759~172 770 bp,其中沙参的叶绿体基因组长度最短,而桔梗的叶绿体基因组最长,不同地区的桔梗叶绿体基因组长度相差952 bp。6个物种叶绿体基因组总GC含量为38.10%~39.03%,IR区的GC含量(39.53%~51.00%)均显著高于LSC区(36.86%~38.18%)和SSC区(31.03%~35.42%)。其中桔梗的GC含量最低,铜锤玉带草的GC含量最高。不同地区桔梗全基因组的总GC含量相差不大,分别是38.10%和38.12%。
利用Geneious 11.0.3软件获取桔梗及4种近缘桔梗科植物的IR 区、LSC区和SSC区序列。结果表明,IR区的序列长度范围为20 200~85 814 bp,其中沙参的IR区最短,桔梗的IR区最长,不同地区桔梗的IR区的长度相差948 bp。LSC区序列长度范围为79 061~112 321 bp,其中桔梗的LSC区长度最短(79 061 bp),沙参LSC区长度最长(112 321 bp),不同地区的桔梗LSC区的长度相差54 bp。SSC区序列长度范围介于7840~27 238 bp,其中沙参的SSC区最长(27 238 bp),桔梗的SSC区最短(7840 bp),不同地区桔梗的SSC区的长度仅相差1 bp。
表4 桔梗科物种叶绿体基因组中SSR信息统计
表5 桔梗科植物叶绿体全基因组基本特征
3.5 桔梗及桔梗科部分物种的叶绿体基因组边界分析
桔梗及桔梗科5个属共5种植物叶绿体基因组的IR-LSC和IR-SSC边界比较显示(图3),桔梗与其余4种桔梗科植物叶绿体全基因组相比,边界处基因不完全相同,基因的长度也有差异。LSC/IRb 边界(JLB)边界扩张范围显示,桔梗与其余4种桔梗科植物相比,JLB边界侧翼基因为和基因,而铜锤玉带草、毛细钟花和小党参JLB边界处具有相同的基因,左翼为基因,右翼为基因,但扩张程度稍有差异,沙参的JLB边界位于基因左翼。SSC/IRb(JSB)边界扩张范围显示,桔梗、毛细钟花与铜锤玉带草JSB边界位于基因,但扩张程度不同。小党参JSB边界位于基因的右翼,距离1 bp,而沙参JSB边界位于基因的左翼。SSC/IRa(JSA)边界扩张范围显示,桔梗和小党参JSA边界位于基因内,但扩张程度稍有差异。毛细钟花和铜锤玉带草JSB边界位于基因右翼,距离分别为273、139 bp,而沙参JSB边界位于基因右翼。LSC/IRa(JLA)边界扩张范围显示,桔梗与其余4种桔梗科植物JLA边界位于基因左翼,但扩张程度有差异。不同地区的桔梗其边界具有高度的保守性,各边界侧翼基因完全相同,扩张程度略有差异。
3.6 叶绿体基因组序列变异分析
本研究测序的桔梗植物叶绿体基因组与韩国地区桔梗全基因组序列相似性比较结果见图4。结果表明,2种不同地区桔梗叶绿体基因组序列的整体相似度较高,但仍存在明显的差异。变异程度最高的区域集中在IR区,编码区和非编码区都有不同程度的变异。、、、等基因的编码区存在7个单碱基突变(SNP),基因的编码区有2个插入突变。非编码区存在7个单碱基突变和5个插入突变,包括、、等,如新测序桔梗在基因间隔区108 704 bp处插入255个碱基。这些变异位点是不同地区桔梗鉴定的潜在分子标记,具有极高的研究价值。
图3 桔梗科物种叶绿体基因组边界序列差异
A-桔梗(MZ202358) B-桔梗(NC_035624)
3.7 系统进化分析
本研究以桔梗、2个外类群和已公布的17种(18个)桔梗科植物的66个共有蛋白编码基因进行比对,将比对结果采用IQ-TREE软件ML法构建系统进化树(图5)。结果显示,19个桔梗科物种构成一单系分支,显著区分于外类群拟南芥和人参,具有100%支持率。在系统树上,桔梗科物种可以分为3个主要分支。A分支是半边莲亚科构成的单系分支,支持率为100%。B分支和C分支由桔梗亚科构成,支持率为100%。分支C包括2个族,桔梗族和蓝钟花族。不同地区的桔梗聚为一小支,进一步与党参属、蓝钟花属、细钟花属物种聚为一支。分支B是风铃草族构成的构成的单系分支,支持率为100%。基于叶绿体基因组的系统进化树与已知的物种进化关系一致,为桔梗科物种系统进化关系的建立提供依据。
图5 基于66个蛋白编码基因构建的ML树
4 讨论
桔梗始载于《神农本草经》,是中医常用的一味止咳平喘的良药。本研究完成了桔梗叶绿体基因组的测序、组装和注释。结果表明,桔梗叶绿体基因组具有被子植物叶绿体基因组典型的四分体结构,包括1个LSC区、1对IR区和1个SSC区,序列长172 770 bp,其长度高于其他4个近缘种。不同地区桔梗叶绿体基因序列长度在171 800~172 800 bp,IR区的差异最大(952 bp),原因是本研究测序的桔梗位于IR区的基因存在明显的序列插入现象,导致其比已报道的韩国地区桔梗序列长。桔梗叶绿体基因组GC含量低于其他4个近缘种。不同地区桔梗叶绿体基因组GC含量基本一致(38.10%~38.12%),IR区的GC含量均高于其他区域,可能与IR区含有高GC含量的rRNA基因有关。不同地区桔梗叶绿体基因组分别注释到139和140个基因,包括95个蛋白编码基因、36~37个tRNA基因和8个rRNA基因,体现了叶绿体基因组的稳定性。
植物叶绿体基因组中IR区域的收缩和扩张是一种相对普遍的现象,使相同植物群体之间的整个叶绿体基因组之间出现差异[32]。本研究中桔梗与其他4个近缘种IR边界分析显示,其LSC/IRb边界(JLB)、SSC/IRb边界(JSB)、SSC/IRa边界(JSA)和LSC/IRa边界(JLA)的侧翼基因类型和扩张程度有明显差异,对研究物种进化等具有重要意义。不同地区桔梗叶绿体基因组边界基因和扩张程度完全相同,仅JLA边界与侧翼基因trnH的距离相差2 bp。本研究中桔梗叶绿体基因组SSR位点有139个,以单核苷酸重复(占总数的83.40%)为主要类型,且随着拷贝数目增加,SSRs数量明显减少,这种现象在其它植物中也有报道[33]。桔梗叶绿体基因组中的SSR主要分布于LSC和IR区,多数由碱基A和T组成,与石斛属部分物种的SSR碱基组成相似[34]。不同地区桔梗的核苷酸重复类型基本相同,但SSR的数量有差异,原因是IR区的SSR数量存在差异。桔梗科不同属的物种叶绿体基因组中的SSR的数量和分布模式差异显著,这些SSRs为桔梗科物种鉴定和系统发育分析奠定基础。
已有研究表明,叶绿体基因组常应用于物种鉴定和系统发育关系研究[10-12]。比对2个不同地区的桔梗叶绿体基因组序列编码区和非编码区都有不同程度的变异,、、、等基因的编码区和、、等基因间隔区存在14个单碱基突变和7个插入缺失突变,基于21个差异区可开发特异DNA条形码,鉴定不同地区的桔梗,为优化种质资源及良种繁育奠定基础。
为进一步界定药用植物桔梗在桔梗科的系统位置,探讨桔梗属与其近缘属的系统发育关系。基于桔梗科19个物种66个共有编码基因构建系统发育树结果显示,所有的桔梗科物种形成一个单系群,支持率为100%。桔梗族物种与蓝钟花族物种聚为一组,该结果与Li等[34]的研究结果类似。不同地区的桔梗聚为一小支,进一步与党参属、蓝钟花属、细钟花属物种聚为一支,说明桔梗属、党参属、蓝钟花属、细钟花属亲缘关系较近。有学者认为铜锤玉带属与半边莲属有密切的亲缘关系,应合并为半边莲属[10]。铜锤玉带草原隶属于铜锤玉带属,但目前《中国植物志》已修订铜锤玉带草为半边莲属[35]。图5显示铜锤玉带草与其他半边莲属物种互为姐妹群,支持“半边莲属与铜锤玉带属应合并成为半边莲属”的说法[10]。本研究中桔梗科系统进化树与已知的物种进化关系一致。
本研究对桔梗叶绿体基因组重新测序,综合分析桔梗的叶绿体基因组序列、结构和特征,筛选出不同地区桔梗叶绿体基因组的差异序列,探讨桔梗科物种系统进化关系,结果不仅丰富了桔梗的叶绿体基因组信息,为叶绿体基因组序列中筛选特异性DNA条形码基因序列及系统发育关系研究提供了参考。
利益冲突 所有作者均声明不存在利益冲突
[1] 赵琪, 王玲, 吴杨璐, 等. 中药桔梗的本草考证 [J]. 中药材, 2022, 45(5): 1266-1272.
[2] 中国药典 [S]. 一部. 2020: 284.
[3] 蒋桃, 祖矩雄, 李兰岚. 药用型和食用型桔梗定向选育的研究进展 [J]. 中国中医药现代远程教育, 2018, 16(20): 158-160.
[4] 刘自刚, 张雁, 王新军, 等. 桔梗育种研究进展 [J]. 中草药, 2006, 37(6): 962-964.
[5] 张燕, 李阳, 李倩, 等. 桔梗种质资源研究新进展 [J]. 中国野生植物资源, 2017, 36(3): 53-56.
[6] Hong C P, Park J, Lee Y,. accD nuclear transfer ofgrandiflorum and the plastid of early Campanulaceae [J]., 2017, 18(1): 1-13.
[7] Twyford A D, Ness R W. Strategies for complete plastid genome sequencing [J]., 2017, 17(5): 858-868.
[8] Yu X Y, Zuo L H, Lu D D,. Comparative analysis of chloroplast genomes of fivespecies: Genome comparative and evolution analysis [J]., 2019, 689: 141-151.
[9] 李雪佩, 孟静, 张琳娜, 等. 黄草乌与展毛黄草乌叶绿体全基因组结构的比较分析 [J]. 中药材, 2018, 41(8): 1812-1820.
[10] Li C J, Lu J M, Li Y,. Comparative morphology of the leaf epidermis in(Lobelioideae) from China [J]., 2017, 80(7): 763-778.
[11] 丁怡宁, 毕光耀, 胡赛文, 等. 红花不同花色变异类型叶绿体基因组特征与系统进化分析 [J]. 中草药, 2023, 54(1): 262-271.
[12] Yu B, Sun Y B, Liu X F,. Complete chloroplast genome sequence and phylogenetic analysis of[J]., 2020, 5(4): 3840-3842.
[13] Kim K J, Lee H L. Complete chloroplast genome sequences from Korean ginseng (schinseng Nees) and comparative analysis of sequence evolution among 17 vascular plants [J]., 2004, 11(4): 247-261.
[14] Jiao P, Qi Z, Jiang Z Z,. Characterization of the complete chloroplast genome ofL. (Ginkgoaceae), an endangered species endemic to China [J]., 2019, 4(2): 4128-4129.
[15] 李西文, 胡志刚, 林小涵, 等. 基于454FLX高通量技术的厚朴叶绿体全基因组测序及应用研究 [J]. 药学学报, 2012, 47(1): 124-130.
[16] Zhang Y Z, Ma J, Yang B X,. The complete chloroplast genome sequence ofvar.(Taxaceae): Loss of an inverted repeat region and comparative analysis with related species [J]., 2014, 540(2): 201-209.
[17] 宋菊, 龙月红, 林丽梅, 等. 五加科植物叶绿体基因组结构与进化分析 [J]. 中草药, 2017, 48(24): 5070-5075.
[18] Biswal D, Konhar R, Debnath M,. Chloroplast genome sequence annotation of(Asparagales: Orchidaceae), an endangered medicinal orchid from northeast India [J]., 2017: 78-89.
[19] Hu J L, Zhao M A, Hou Z J,. The complete chloroplast genome sequence of, a medicinal plant for preventing and treating vascular dementia [J]., 2020, 5(3): 2460-2462.
[20] 李冉郡, 武立伟, 辛天怡, 等. 大黄药材基原物种叶绿体基因组分析与特异DNA条形码开发 [J]. 药学学报, 2022, 57(5): 1495-1505.
[21] Guo Y P, Yao B Q, Yuan M R,. The complete chloroplast genome and phylogenetic analysis ofBunge 1833 [J]., 2021, 6(12): 3364-3366.
[22] Wu M L, Li Q, Xu J,. Complete chloroplast genome of the medicinal plant: Gene organization, comparative analysis, and phylogenetic relationships within Zingiberales [J]., 2018, 13(1): 1-12.
[23] Skuza L, Gastineau R, Sielska A. The complete chloroplast genome of(Poaceae: Triticeae) [J]., 2022, 63(1): 115-117.
[24] Zhu B, Gao Z M, Qian F,. The complete chloroplast genome of a purple Ethiopian rape (: Brassicaceae) from Guizhou Province, China and its phylogenetic analysis [J]., 2021, 6(7): 1821-1823.
[25] Wang W B, Yu H A, Wang J H,. The complete chloroplast genome sequences of the medicinal plant(Oleaceae) [J]., 2017, 18(11): 2288.
[26] 杨林, 谭萍, 姜月影, 等. 3种木莲属濒危药用植物叶绿体基因组密码子偏好性分析 [J]. 中国中医药信息杂志, 2022, 29(8): 93-99.
[27] Wang Z J, Cai Q W, Wang Y,. Comparative analysis ofbias in the chloroplast genomes of Theaceae species [J]., 2022, 13: 824610.
[28] Amiryousefi A, Hyvönen J, Poczai P. IRscope: An online program to visualize the junction sites of chloroplast genomes [J]., 2018, 34(17): 3030-3031.
[29] Wu L W, Cui Y X, Wang Q,. Identification and phylogenetic analysis of fivespecies (Rosaceae) based on complete chloroplast genomes [J]., 2021, 254(1): 14.
[30] Ma J Y, Wang J M, Li C Y,. The complete chloroplast genome characteristics ofBuch.-Ham. ex DC. (Polygalaceae) from Yunnan, China [J]., 2021, 6(10): 2838-2840.
[31] Mehmood F, Shahzadi I, Waseem S,. Chloroplast genome of(Malvaceae): Comparative analyses and identification of mutational hotspots [J]., 2020, 112(1): 581-591.
[32] 杨小英, 刘畅, 曾宪法, 等. 八角枫及其亚种叶绿体基因组序列结构及系统发育分析 [J]. 药学学报, 2022, 57(10): 3229-3239.
[33] 李卓蔚, 邱迁, 郎佳琪, 等. 尖刀唇石斛和翅梗石斛叶绿体全基因组分析 [J]. 中草药, 2022, 53(16): 5159-5169.
[34] Li C J, Wang R N, Li D Z. Comparative analysis of plastid genomes within the Campanulaceae and phylogenetic implications [J]., 2020, 15(5): e0233167.
[35] 中国科学院中国植物志编辑委员会. 中国植物志(第七十三卷, 第二分册) [M]. 北京: 科学出版社, 1983: 56.
Comparative and phylogeny analysis ofcomplete chloroplast genomes
ZHANG Yu, DU Chen-hui, ZHAN Hai-xian, SHANG Cai-ling, LI Rui-feng, YUAN Shu-jia
College of Traditional Chinese Medicine and Food Engineering, Shanxi University of Chinese Medicine College, Jinzhong 030619, China
To explore the differences of chloroplast genomes of Jiegeng [(Jacq.) A. DC.] from different regions and phylogenetic relationship betweenit and its relatives, the complete chloroplast genome ofwas sequenced and assembled.We sequenced the chloroplast genome ofusing Illumina NovaSeq sequencing platform, and assembled, annotated and characterized them, compared the chloroplast genomes sequences using bioinformatics methods, and analyzed the phylogenetic relationships.The full chloroplast genome ofwas 172 770 bp in length and its GC content was 38.10%, with a typical circular tetrad structure. A total of 139 genes were annotated, including 95 protein-coding genes, 8 rRNA genes, and 36 tRNA genes. A total of 139 SSRs were detected, most of which consisted of A and T. The codon preference of A/U was greater than that of G/C. The comparison of boundary region showed that there were differences in inverted repeat region (IR) of two different regions of. Analyses of sequences from the two different regions ofshowed that 21 diverse regions are found in the protein coding regions such as,,,,and in the intergenic regions such as,,. Based on the maximum likelihood method (ML) for phylogenetic analysis ofand 17 other Campanulaceae plants, it was found that Campanulaceae species formed a single monophyletic group. The clustering of plants of the same genus was in line, and the support rate reached 100%.The clustering of Campanulaceae species was in line with tradition. There were significant differences in chloroplast genome sequence ofamong different regions. These results will provide an important basis for the further development of molecular identification and population genetics.
(Jacq.) A. DC.; complete chloroplast genome; sequence alignment; phylogenetic analysis; SSR
R286.12
A
0253 - 2670(2023)15 - 4981 - 11
10.7501/j.issn.0253-2670.2023.15.023
2023-03-10
基于基因组学的“盂桔梗”道地性研究(SZY-YQZX-2019006);山西省应用基础研究计划项目(201901D211540);山西道地药材品质形成机制创新团队(2022TD2009);山西中医药大学中药资源学(2023XKJS-23)
张 瑜(1982—),女,讲师,研究方向为中药资源与开发。E-mail: 15364887652@163.com
通信作者:杜晨晖,教授,硕士生导师,研究方向为中药鉴定学。E-mail: dch@sxtcm.edu.cn
[责任编辑 时圣明]