APP下载

云南樟叶绿体基因组密码子偏好性分析

2022-07-15肖明昆熊贤坤沈绍斌宋记明易怀锋张林辉

中南林业科技大学学报 2022年6期
关键词:密码子叶绿体碱基

肖明昆,严 炜,熊贤坤,沈绍斌,宋记明,易怀锋,张林辉

(云南省农业科学院 热带亚热带经济作物研究所,云南 保山 678000)

密码子是mRNA 分子中一系列三联体核苷酸,在遗传信息传递中起着重要作用[1-3]。在翻译过程中编码同种氨基酸的几个同义密码子使用频率不均等的现象被定义为密码子偏好性[4]。密码子偏好性被认为是影响外源基因表达的重要因素,密码子偏好性不仅反映了物种起源、进化及突变方式,另外也会对蛋白质的表达及基因功能等造成影响[5-7]。因此,密码子使用偏好性在解释基因调控的分子生物学原理、蛋白质结构、基因表达和遗传信息传递等方面均具有极其重要的意义[8-10]。生物中普遍存在同义密码子非均衡使用,在进化过程中形成了独特的密码子使用偏好性。密码子偏好性不仅受到长期进化过程中的环境因素、碱基突变、基因漂移的影响,而且还受到基因组大小、tRNA 丰度和基因表达水平的影响[4]。突变和自然选择压力是影响密码子使用偏好性的两个主要因素,对导致云南樟叶绿体基因组密码子偏好性的相关因素进行剖析,可以明确影响密码子使用偏好性的主要因素。

叶绿体是高等植物所特有的能量转换器,拥有相对独立的遗传物质,其结构高度保守,在揭示物种起源、进化、亲缘关系等方面具有重要作用[11]。除此之外,叶绿体基因拷贝数多,细胞内的叶绿体基因组数量较多[12],如果将目的基因成功转入到其基因组内,便可迅速获得高表达量的转基因后代[13]。目前,叶绿体基因工程已在拟南芥Arabidopsis thaliana[14]和棉花Gossypium hirsutum[15]等植物中转化成功。但是从现有的研究看来,对叶绿体基因工程的涉猎仍较少。对叶绿体基因组密码子的碱基组成进行研究,有助于提高遗传转化效率及目的基因的稳定表达[4],而基于最优密码子设计的叶绿体基因表达载体可以提高叶绿体基因组的基因表达水平[16]。在云南樟叶绿体基因组中检测到密码子的使用模式和最佳密码子,可能对探索物种进化和提高外源性基因的表达具有重要意义。

云南樟Cinnamomum glanduliferum是我国重要的经济树种。其终年常绿,外形美观,具有优良的材质,是园林绿化的首选良木。同时,提取的樟脑及樟油在医药、工业、香料等行业具有广泛的应用前景,木材可制作家具,根、树皮、叶及果等可入药[17-19]。因此,云南樟具有较高的栽培利用价值。然而目前关于云南樟的研究多集中在良种选育、栽培、引种驯化和精油成分等方面[20-21],缺乏分子生物学等方面的研究,关于云南樟叶绿体基因组密码子偏好性的研究尚未见报道。鉴于此,本研究对云南樟叶绿体基因组密码子的使用模式、偏好性及其成因进行分析,以期为云南樟叶绿体基因组学的研究提供理论依据,同时丰富云南樟分子生物学的研究内容。

1 材料与方法

1.1 材 料

在云南省农科院热带亚热带经济作物研究所种质资源圃中采集幼嫩完整的云南樟叶片,样品保存于干冰中,由浙江安诺优达生物科技有限公司进行叶绿体基因组的测序,后将测序结果提交至NCBI 数据库中(登录号为:MW369062)。对云南樟叶绿体基因组进行分析时,为降低误差,从83 条CDS(Coding DNA sequence)中剔除序列长度小于300 bp、内部含有终止密码子的序列和重复基因,最终筛选出52 条以ATG 为起始密码子,TAA、TGA、TAG 为终止密码子的基因序列用于后续分析。

1.2 方 法

运用CodonW 1.4.2 软件对云南樟叶绿体基因组中筛选出的52 条CDS 进行分析,获得各CDS的有效密码子数(ENC)和同义密码子相对使用频率(RSCU)。通过在线软件CUSP 分析获得不同基因的GC 总含量及各个密码子第1 位(GC1)、第2 位(GC2)、第3 位(GC3)碱基的GC 含量,根据获得的参数绘制相关系数矩阵图。以GC12(GC1、GC2 的平均值)为纵坐标、GC3 为横坐标进行中性绘图分析,初步判断云南樟叶绿体基因组密码子使用偏好性受选择的影响或受突变的影响。以GC3 为横坐标、ENC 值为纵坐标进行ENC-plot分析,分析突变在云南樟叶绿体基因组密码子使用模式中的作用。以A3/(A3+T3)为纵坐标,G3/(G3+C3)为横坐标进行PR2-plot 分析(偏倚分析),分析云南樟叶绿体基因各密码子第3 位碱基A、T和G、C 之间突变是否平衡。通过以上分析探明云南樟叶绿体基因组密码子的使用偏好性。以云南樟叶绿体基因52 条CDS 的ENC 值为偏好性标准,由低到高对其进行排序,分别选出两端10%的基因,建立高、低表达库,ENC 值小的为高表达库,ENC 值大的为低表达库。选取RSCU 值>1 的为高频密码子,ΔRSCU≥0.08(ΔRSCU=RSCU 高表达−RSCU 低表达)的密码子作为高表达密码子[22],将同时满足高频和高表达的密码子确定为云南樟叶绿体基因组的最优密码子。

2 结果与分析

2.1 云南樟密码子碱基组成

应用CodonW 1.4.2 和在线软件CUSP 对符合要求的CDS的碱基组成及ENC值进行分析(图1)。结果表明,GC1 含量为35.02%~58.62%,平均值为47.61%;GC2 含量为27.67%~55.73%,平均值为40.28%;GC3 含量为22.44%~36.29%,平均值为30.67%。全部3 个位置的GC 含量为32.09%~45.45%,平均值为39.55%。各位置的GC 含量平均值从高到低依次为GC1>GC2>GC3,其第3 位平均GC 含量远低于第1 位和第2位,表明云南樟密码子3个位置的碱基组成不均衡,且第3 位密码子尤其偏好使用A 和T(U)碱基。

图1 云南樟叶绿体基因组密码子不同位置的GC 含量及ENC 值Fig.1 GC content and ENC value of different codon positions in Cinnamomum glanduliferum chloroplast genome

ENC 的理论值在20~ 61 之间,值越小表示偏好性越强。一般以ENC 值为35 来区分密码子偏好性强弱[23],当ENC 值大于35 时表明密码子使用偏好性较弱。根据此标准对云南樟的ENC值进行判别,发现云南樟各CDS 的ENC 值在36.82~57.85 之间,52 条CDS 序列的ENC 值均大于35,说明云南樟叶绿体基因组密码子偏好性较弱。

对云南樟密码子偏好性参数进行相关性分析(图2),结果显示,GC 与GC1、GC2、GC3 之间呈显著或极显著相关关系(P<0.05),GC3和GC1、GC2 之间无显著相关关系,说明密码子3 个位置碱基的组成存在差异性。ENC 与GC3 呈显著相关关系,表明第3 位碱基对云南樟密码子的使用偏好性影响较大。GC3、ENC 与N(密码子数目)呈显著相关关系,表明基因序列长度会对GC3 和有效密码子数产生影响。

图2 密码子数各位置GC 含量、数量与ENC 值的相关系数图Fig.2 Correlation coefficient diagram of GC content,quantity and ENC value of different codons

对云南樟叶绿体基因组的同义密码子相对使用频率进行分析(图3),发现RSCU>1 的密码子有31 个,分别为UCU、CGU、GUU、ACU、

图3 云南樟各氨基酸的同义密码子RSCU 分析Fig.3 Relative synonymous codon usage analysis of each amino acid in C.glanduliferum

CCU、GGU、GCU、AUU、UAU、UUU、CAU、UGU、GAU、AAU、CUU、AGU、UUA、UAA、AAA、GAA、CAA、UCA、CGA、GUA、ACA、CCA、GGA、GCA、AGA、UUG、UCC。其中,以U 结尾的最多,有16 个,以A 结尾13 个,以G 结尾1 个,以C 结尾1 个。说明云南樟叶绿体基因组偏好以A 或U 结尾的密码子。

2.2 中性绘图分析

中性绘图分析表明(图4),GC12 范围在0.341~0.550 之间,GC3 在0.224~0.368 之间,GC12 与GC3 的相关系数为0.040,回归系数为-0.055 1。可见,云南樟叶绿体基因组中GC12和GC3 无显著的相关性,说明GC1、GC2、GC3的碱基组成存在差异,因此,选择是云南樟叶绿体基因组密码子偏好性主要影响因素。

图4 云南樟叶绿体基因组中性绘图分析Fig.4 Neutrality plot analysis of C.glanduliferum chloroplast

2.3 ENC-plot 分析

ENC-plot 分析显示结果(图5),云南樟的部分基因在标准曲线周围分布,而大部分基因落在标准曲线下方,离标准曲线较远。对ENC 比值进行计算(表1)发现ENC 比值在-0.05~0.05 之间的有19 个,与预期ENC 值较为接近,而有33个基因则分布在这个区间以外,与预期ENC 值差距较大。因此,选择是云南樟叶绿体基因组密码子使用偏好性的主要影响因素,其他因素的影响较弱。

图5 云南樟叶绿体基因组ENC-plot 绘图分析Fig.5 ENC-plot analysis in the chloroplast of C.glanduliferum

表1 云南樟叶绿体基因组ENC 比值频数分布表Table 1 Distribution table of ENC ratios in the chloroplast of C.glanduliferum

2.4 PR2-plot 分析

偏倚分析结果(图6)显示了云南樟叶绿体基因组密码子第3 位碱基的使用情况。对云南樟编码基因的碱基使用情况进行分析,发现各个区域中的基因位点未呈现均匀分布。多数基因位处在中心点稍右下的位置,在第3 位碱基的选择上密码子具有偏好性,且碱基T 的使用频率高于A,碱基G 的使用频率高于C,说明云南樟叶绿体基因组密码子偏好性受到选择的影响,也受其他因素的影响。

图6 云南樟叶绿体基因组PR2-plot 绘图分析Fig.6 Analysis of PR2 bias plot in the chloroplast of C.glanduliferum

2.5 最优密码子的确定

结合高频(RSCU>1)及高表达密码子(ΔRSCU≥0.08)对云南樟叶绿体基因组最优密码子进行确定。结果(表2)表明,ΔRSCU≥0.08 的高表达密码子有26 个,结合图3挑选出的31 个高频密码子,最终确定云南樟叶绿体基因组最优密码子12 个,分别为UUA、UCU、ACA、UAU、GCU、UAG、CAA、AAA、GAU、GAA、CGA、AGA,其中有7 个以A 结尾,有4 个以U 结尾,仅1 个以G 结尾。

表2 云南樟叶绿体基因组最优密码子的确定†Table 2 Determination of optimal codons in the chloroplast genome of C.glanduliferum

3 讨 论

植物叶绿体基因组结构高度保守,对于研究植物系统进化、物种鉴定等极其重要。对叶绿体基因组密码子偏好性及其影响因素进行研究,有助于理解物种的起源与进化[24-25]。核苷酸组成是影响密码子使用偏好性的重要因素之一,在基因组中,AT 及GC 含量与同义密码子使用偏好性紧密相关[26-27]。本研究依托云南樟叶绿体基因组数据,筛选出52 条完整的CDS 序列,对密码子的碱基构成及偏好性进行分析后发现云南樟叶绿体基因组的密码子使用频率表现为CG 结尾的密码子低于AU 结尾的密码子,总体上偏好使用碱基为A 或U的密码子。在樟树Cinnamomum camphora[28-29]和藿香Agastache rugosa[30]等物种的研究中也得出类似结论,这些研究均指出叶绿体基因组密码子偏好使用A 碱基或U 碱基。

在蛋白质的转录翻译过程中,突变和选择会影响基因翻译效率。密码子偏好性的形成受到多种因素的共同影响[31],研究表明自然选择会促使密码子使用偏好性形成[28],并且与基因表达量密切相关[32]。本研究通过对云南樟叶绿体基因组密码子相关参数及其影响因素进行分析,结果显示云南樟叶绿体基因组中GC12和GC3的相关性不显著,GC1、GC2、GC3 的碱基组成存在差异,说明选择是影响云南樟树叶绿体基密码子使用偏好性的关键因素。有效密码子数作为分析同义密码子使用偏好性的关键参数,借助ENC 分析能够判别密码子使用偏好性的影响因素。本研究显示有33 个基因与预期ENC 值差距较大,多数基因位处在中心点稍右下的位置,揭示了云南樟叶绿体基因组密码子使用偏好性主要受选择的影响,受其他因素的影响较弱。因此,自然选择是影响云南樟叶绿体基因组密码子偏好性的主要因素。在樟树[28-29]、迎春樱桃Cerasus discoidea[33]、云南蓝果树Nyssa yunnanensis[34]、马尾松Pinus massoniana[35]等的研究中也得出类似结论,这些研究均指出选择是影响密码子偏好性的关键因素。但也有研究指出突变是密码子偏好性的关键影响因素。朱沛煌等[27]的研究指出马尾松密码子使用偏好性形成主要受突变影响,其次受自然选择等多重因素共同影响;原晓龙等[36]的研究表明受突是影响西南桦Betula alnoides叶绿体基因组密码子偏好性的关键因素;赵森等[37]的研究也指出秋茄Kandelia candel叶绿体基因组密码子使用偏好性主要受突变作用,同时自然选择和碱基组成也有一定影响。由此可见,密码子偏好性可能会受到多种因素的共同影响,且不同物种的影响因素可能不同。

结合高频(RSCU>1)及高表达密码子(ΔRSCU≥0.08)对云南樟叶绿体基因组最优密码子进行筛选。最终确定云南樟叶绿体基因组最优密码子12 个,分别为UUA、UCU、ACA、UAU、GCU、UAG、CAA、AAA、GAU、GAA、CGA、AGA,其中有7 个以A 结尾,有4个以U 结尾,以G 结尾仅1 个。与罗茜等[38]和滕腾等[39]的研究结果类似,他们也发现最优密码子大多以A 或U 结尾。

本研究仅对云南樟叶绿体基因组密码子使用偏好性进行了分析,未对樟属其余物种进行分析,未能确定其是否与樟属其他物种的偏好性一致。因此,下一步可对樟属内其他物种进行密码子偏好性研究,探究其他樟属物种是否也同时受到突变和选择的影响,以此来确定造成同一属间不同植物密码子偏好性差异的因素是否相同。

4 结 论

对云南樟叶绿体基因组密码子的偏好性及其影响因素进行研究,得出云南樟基因的密码子偏好性比较弱,偏好以A 或U 结尾的密码子。自然选择是影响云南樟叶绿体基因组密码子偏好性的关键因素。通过构建高低基因表达库,结合高频及高表达密码子最终确定出云南樟叶绿体基因组的12 个最优密码子,且最优密码子大多以A 或U结尾。研究结果可为今后开展云南樟叶绿体基因工程、异源表达基因改造、种源鉴定等相关研究提供参考依据。

猜你喜欢

密码子叶绿体碱基
应用思维进阶构建模型 例谈培养学生创造性思维
密码子与反密码子的本质与拓展
中国科学家创建出新型糖基化酶碱基编辑器
生命“字母表”迎来4名新成员
生命“字母表”迎来4名新成员
10种藏药材ccmFN基因片段密码子偏好性分析
南方红豆杉叶绿体非编码序列PCR体系优化及引物筛选
嗜酸热古菌病毒STSV2密码子偏嗜性及其对dUTPase外源表达的影响
茶树叶绿体DNA的PCR-RFLP反应体系优化
烟草叶绿体密码子的偏好性及聚类分析