APP下载

4种金花茶叶绿体基因组比较分析

2023-05-13丁祥青李文芳吴丽君陈义堂王子墨邹双全

关键词:柠檬黄密码子叶绿体

丁祥青, 李文芳, 吴丽君, 陈义堂, 王子墨, 郑 宏, 郑 航, 邹双全

(1.福建农林大学园林学院,福建 福州 350002;2.福建农林大学林学院,福建 福州 350002;3.福建省洋口国有林场,福建 顺昌 353200;4.福州植物园,福建 福州 350012;5.自然生物资源保育利用福建省高校工程技术研究中心,福建 福州 353002)

叶绿体起源于内共生体,因其富含叶绿素而得名[1].叶绿体基因组(chloroplast DNA, cpDNA)的2条单链是全转录链,即叶绿体基因组可在任意位置发生转录起始和终止,有研究表明,叶绿体基因组存在基因重叠现象[2-3].通常高等植物叶绿体基因组高度保守,由4部分组成,大单拷贝区(large single copy region, LSC)、小单拷贝区(small single copy region, SSC)、反向重复区A(inverted repeat region a, IRa)和反向重复区B(inverted repeat region b, IRb),2个IR区被LSC和SSC隔开.它们长度相等,方向相反[4].但也有少数植物存在变异,主要表现为IR区的丢失、收缩与扩张,序列方向改变[5].此外,在寄生植物的叶绿体基因组中,有的植物丢失了与光合作用有关的基因,有的植物则完全丧失了叶绿体基因组[6].目前,叶绿体基因组在开发分子标记、重建系统发育关系以及基因工程育种等领域应用广泛.

金花茶植物隶属于山茶科(Theaceae)山茶属(Camellia),是山茶花中唯一花色金黄的类型,观赏价值高,在植物界颇负盛名.现今已发掘的金花茶植物有42种和5个变种[7],它们之间表型相似,难以通过生物学形态将其有效区分.因此,发掘能有效区分不同金花茶的分子标记对金花茶植物的研究具有重要意义.山茶和金花茶的杂交已被证实是培育黄色山茶花的有效途径,但其缺点是操作难、周期长和见效慢等[8].随着基因与花色形成机制的不断深入研究,基因工程育种有望成为黄色山茶花培育的重要手段[9].

随着测序技术的进步[10],叶绿体基因组测序的相关研究越来越多,截至2022年1月,NCBI已公布6733个叶绿体全基因组序列(https://www.ncbi.nlm.nih.gov/genome/browse#!/eukaryotes/).目前,金花茶植物遗传学和基因组学的研究较少.本试验基于全基因组重测序技术首次报道了簇蕊金花茶(Camelliafascicularis)、夏石金花茶(Camelliaxiashiensis)、柠檬黄金花茶(Camellialimonia)、小果金花茶(Camellianitidissimavar.microcarpa)的叶绿体全基因组序列,并对其进行注释和比较分析,以期了解金花茶植物的分子生物学特性,保护优良的种质资源,为金花茶植物的群体遗传学和系统发育研究提供依据.

1 材料与方法

1.1 文库构建和测序

试验材料簇蕊金花茶、夏石金花茶、柠檬黄金花茶、小果金花茶均于2020年采集于福建省洋口国有林场(117°48′54.18″E,26°47′30.16″N),其种质资源均引种于广西南宁金花茶公园.采用改良的十六烷基三甲溴化铵法(cetylrimethylammonium bromide,CTAB)从金花茶植物嫩叶中提取DNA,用琼脂糖凝胶电泳和分光光度计检测DNA浓度和质量,将高质量的DNA通过Covaris仪超声波处理,经过末端修复、DNA片段3′加A、连接接头处理后,选取270 bp的DNA片段进行PCR扩增,对扩增产物进行引物二聚体去除后,用于构建文库.最后将质量检测合格的文库在Illumina平台进行测序.

1.2 序列拼接及注释

SOAPnuke1.6.5(https://github.com/BGI-flexlab/SOAPnuke)用于过滤原始数据中的低质量序列,过滤参数为-n 0.05-l 20-q 0.4-i-Q 2-G-M 2-A 0.5-d,每个物种获得约20 Gb的clean data.利用GetOrganelle软件[11]对clean data进行自动化组装,然后用Bandage软件可视化去除多余contig并编辑成环状,环状序列即为金花茶植物叶绿体全基因组序列.以凹脉金花茶(Camelliaimpressinervis)的叶绿体基因组序列(NC022461)为参考[12],利用Plastid Genome Annotator软件[13]对金花茶叶绿体基因组序列进行预测及基因注释.利用Geneious软件可视化注释结果并人工检查编码基因的起始密码子和终止密码子,得到金花茶叶绿体基因组的最终注释结果(GenBank文件).经组装注释的金花茶叶绿体基因组fasta文件和GenBank文件已提交至NCBI GenBank数据库(OM238071、OM238074、OM868265、OM238072),利用网站(https://irscope.shinyapps.io/chloroplot/)在线可视化簇蕊金花茶叶绿体基因组.

1.3 密码子偏好性与共线性分析

提取叶绿体基因组的蛋白编码序列(coding sequence,CDS),使用CodonW计算密码子的使用频率和相对同义密码子使用度(relative synonymous codon usage, RSCU),然后用perl脚本绘制直方图,采用TBtools软件绘制密码子使用分布热图.利用Geneious软件的mauve插件进行叶绿体基因组共线性可视化分析.

1.4 分子标记开发

在线(http://genome.lbl.gov/vista/mvista/submit.shtml)进行叶绿体基因组比对可视化分析,设置shuffle-LAGAN模式.使用DnaSP软件计算4种金花茶植物叶绿体全基因组序列的核苷酸多态性,设置步长为200 bp,窗口长为600 bp.通过网站(https://webblast.ipk-gatersleben.de/misa/)进行简单重复序列(simple sequence repeat, SSR)识别,将单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸的最小重复数分别设置为10、5、4、3、3和3个.

1.5 系统发育关系

从NCBI GenBank数据库下载14个金花茶叶绿体基因组序列[显脉金花茶(Camelliaeuphlebia)OL405564、抱茎金花茶(Camelliatienii)OL435568、薄叶金花茶(Camelliachrysanthoides)MZ618349、崇左金花茶(Camelliachuongtsoensis)MT663341、贵州金花茶(Camelliahuana)KY626040、凹脉金花茶NC022461、东兴金花茶(Camelliaindochinensisvar.Tunghinensis)OK135162、龙州金花茶(Camellialungzhouensis)MN579509、小花金花茶(Camelliamicrantha)MZ680503、富宁金花茶(Camelliamingii)NC046699、金花茶(Camellianitidissima)NC039645、金花茶(Camelliapetelotii)NC024661、顶生金花茶(Camelliapingguoensisvar.terminalis)OK149109、毛瓣金花茶(Camelliapubipetala)NC054365].采用MAFFT软件进行多序列比对,利用网站(http://www.phylo.org/)的RAxML-HPC2 on XSEDE构建系统发育树,用Bootstrap method进行自展值检验,设置1 000次重复.由于不同叶绿体基因组区域的分子进化速率不同,本试验分别利用了叶绿体基因组、LSC、IRa、SSC序列构建系统发育树.

2 结果与分析

2.1 结构与特征

基于全基因组重测序数据组装,注释了4种金花茶植物的叶绿体全基因组,金花茶植物的叶绿体基因组为典型的四分体结构(图1).4种金花茶植物叶绿体基因组均预测注释134个基因,包含89个蛋白编码基因、8个rRNA和37个tRNA.其中,小果金花茶叶绿体全基因组序列最长,为157 046 bp,柠檬黄金花茶叶绿体全基因组序列最短,为156 657 bp(表1),叶绿体基因组长度差异较小.结果表明,4种金花茶植物LSC、SSC、IR、rRNA、tRNA和蛋白编码基因长度均相似,长度差异主要发生于LSC的基因间隔区,在atpH-atpL相较于小果金花茶、柠檬黄金花茶丢失了1个400 bp的片段,相较于夏石金花茶丢失了1个398 bp的片段,而柠檬黄金花茶在trnGUU-ndhF比夏石金花茶多1个77 bp的片段.GC含量为37.32%~37.33%,其中,IR GC含量(42.95%~42.99%)最高,其次为LSC(35.31%~35.35%)和SSC(30.56%~30.62%).IR区GC含量高,能使其序列稳定且高度保守.

表1 叶绿体基因组特征统计

图1 簇蕊金花茶叶绿体全基因组图谱

2.2 密码子偏好性

提取金花茶叶绿体基因组CDS序列进行密码子偏好性分析(图2),结果表明,4种金花茶植物具有相似的密码子偏好性.其中,使用频率较高的为ATT、AAA和GAA,单物种使用频率均达900次以上,使用频率较高的第3位密码子具有较高的A/T偏好性,大约有一半的密码子较少被使用.通常使用RSCU衡量密码子使用偏好性,除色氨酸(Trp)和蛋氨酸(Met)外,其他大部分氨基酸表现为高密码子偏好性,叶绿体基因组氨基酸的高密码子偏好性和密码子的第3位高A/T偏好性在高等植物中十分普遍,说明金花茶叶绿体基因组进化具有较高的保守性.终止密码子偏好使用TAA,其次为TAG.

从左至右依次为簇蕊金花茶、柠檬黄金花茶、小果金花茶和夏石金花茶.

2.3 共线性

为了评估4种金花茶叶绿体基因组的差异程度,利用Geneious软件的mauve插件对叶绿体基因组进行共线性可视化分析.结果表明,4种金花茶叶绿体基因组序列高度相似,未检测到大片段的倒位或基因重排现象.

2.4 差异性

选用检测基因重排和倒位的全局比对模式(Shuffle-LAGAN),以簇蕊金花茶叶绿体基因组序列为参考,对金花茶叶绿体基因组序列进行可视化比对分析(图3).结果表明,叶绿体基因组具有高度相似性,IR区和编码区的分化水平分别低于SC区和非编码区,存在较高差异的序列为rps16、ycf1、ycf2和trnE-UUC-psbD.核苷酸多样性分析表明(图4),共检测出269个变异位点,其中,简约性信息位点22个.Pi为0~0.01,筛选到6个核苷酸多样性较高的位点,分别为rps16-trnQ-UUG、petN-psbM、accD-ycf4、rpl16、trnN-GUU-ndhF和ycf1,其中,有4个位点位于LSC,这些位点的发掘对于金花茶植物分子标记的开发具有重要意义.

图3 叶绿体基因组序列的可视化分析

图4 滑动窗口分析

2.5 简单重复序列和长重复序列

SSR是由1~6个核苷酸重复单位组成的序列,由于重复单位和次数的差异,SSR产生了高度的变异性.本试验检测了4种金花茶叶绿体基因组的2~6个核苷酸重复单位的分布(表2).结果表明,在簇蕊金花茶、柠檬黄金花茶和小果金花茶中均检测出20个SSR,在夏石金花茶中检测出17个SSR.SSR的分布具有异质性,呈现IGS>CDS>Intron、LSC区>IR区>SSC区和非编码区>编码区,最多的是4核苷酸重复,不具有5核苷酸重复,AT和AAAT重复出现较多,柠檬黄金花茶有1个独特的SSR.金花茶叶绿体基因组中存在36(柠檬黄金花茶、夏石金花茶)~48(簇蕊金花茶)条长重复序列,主要是位于IR区的ycf2基因,其次为基因间区.长重复序列为30~82 bp,包含正向重复、反向重复(仅2个,簇蕊金花茶和夏石金花茶各1个)和回文重复,其中,簇蕊金花茶含有14个独特的长重复序列,小果金花茶含有1个独特的长重复序列(表3).

表2 金花茶植物叶绿体基因组简单重复序列1)

表3 金花茶植物长重复序列鉴定1)

2.6 亲缘关系

为了明确金花茶植物间的亲缘关系,构建了18种金花茶的叶绿体全基因组、LSC序列、SSC序列和IRa序列的系统发育树(图5).其中,SSC和IRa序列构建的系统发育树支持度较低,叶绿体全基因组和LSC序列构建的系统发育树较相似且支持度较高(簇蕊金花茶最接近于贵州金花茶,夏石金花茶最接近于富宁金花茶,柠檬黄金花茶最接近于抱茎金花茶,小果金花茶最接近于Camelliapetelotii),样本之间具有相似的进化关系.

图5 基于不同序列的18种金花茶系统发育树

3 讨论

在4种金花茶叶绿体基因组中,atpB和atpE的重叠区域为4 bp,psbC和psbD的重叠区域为52 bp,trnP-GGG和trnP-UGG的重叠区域为71 bp,rps3和rpl22的重叠区域为16 bp;orf42具有非标准起始密码子ATC,ycf68具有非标准起始密码子CTG,ndhD具有非标准起始密码子ACG,rps19具有非标准起始密码子GTG.上述结果在山茶属的其他植物叶绿体基因组中也存在.

共线性分析表明,金花茶叶绿体基因组结构具有较高的进化保守性,除了叶绿体基因组本身具保守性的因素外,可能与金花茶地理分布集中有关(均分布于中国广西和越南北部).小果金花茶叶绿体基因组序列最长,其IR区有少许扩张,长度的差异主要存在于LSC,分析表明,这与叶绿体基因组进化过程中的插入—缺失有关.通常IR区边界的收缩和扩张被认为是影响被子植物叶绿体基因组长度变化的主要因素,而本试验结果表明,主要影响金花茶叶绿体基因组长度变化的是Indels事件而非IR区边界的收缩和扩张,这与山茶[14]的研究一致.A/T偏好性是叶绿体基因组的重要进化特征,几乎所有RSCU>1的密码子均以A/T结束,金花茶植物的叶绿体基因组也支持此结论,具有这些密码子的基因通常受到自然选择的影响且表达量较高[15].金花茶植物由于多倍化和种间杂交的频繁发生,从形态上难以准确辨别,DNA条形码结合形态学对未知物种进行鉴定的方法已广泛应用,例如rbcL、matK和ycf1在其他物种中已作为识别生物体的DNA条形码[14].本试验发掘了rps16和ycf1等高变异片段,为金花茶植物DNA条形码的开发提供依据.同时,金花茶植物叶绿体基因组序列的公布也将为其DNA条形码和分子标记的开发提供依据.

山茶属具有200多个种,大量具有不确定亲缘关系的山茶属植物还需进行详细研究[16].目前,叶绿体基因组常被用于解决物种水平或以上的系统发育和进化问题[17].由于频繁的种间杂交和多倍化,金花茶亲缘关系的研究比较困难,本试验明确了金花茶植物的系统发育位置,也为金花茶植物亲缘关系的研究和重建山茶属系统发育提供了依据.黄色山茶花因其具有较高观赏价值,是育种研究的热点之一,叶绿体基因工程具有多拷贝、无位置效应和基因沉默现象、安全系数高等优越性[18-19],将来可能成为黄色山茶花育种的有效手段.金花茶植物叶绿体全基因组序列的获得有助于确定最适合转基因整合的区域,并开发位点特异性的叶绿体转化载体.

猜你喜欢

柠檬黄密码子叶绿体
食品废水中柠檬黄的吸附研究
密码子与反密码子的本质与拓展
荧光光谱法研究柠檬黄与溶菌酶的相互作用
10种藏药材ccmFN基因片段密码子偏好性分析
南方红豆杉叶绿体非编码序列PCR体系优化及引物筛选
主流柠檬黄
茶树CsActin1基因密码子偏性分析
茶树叶绿体DNA的PCR-RFLP反应体系优化
高效液相色谱法测定榨菜中柠檬黄的不确定度评定
烟草叶绿体密码子的偏好性及聚类分析