APP下载

菠萝叶绿体基因组密码子偏好性分析

2022-03-25杨祥燕蔡元保谭秦亮覃旭黄显雅吴密

热带作物学报 2022年3期
关键词:叶绿体碱基绘图

杨祥燕 蔡元保 谭秦亮 覃旭 黄显雅 吴密

摘  要:葉绿体基因组密码子偏好性影响基因的表达效率,对于叶绿体基因工程应用及物种遗传改良具有重要的科学意义。为了明确菠萝叶绿体基因组密码子偏好性的使用特征及主要影响因素,本研究以菠萝叶绿体基因组为研究对象,利用生物信息学软件分析其密码子的使用模式和偏好性。密码子偏好性相关参数分析显示:(1)菠萝叶绿体基因密码子的GC含量平均值为38.31%,密码子第1~3位的GC含量平均值分别为46.78%、39.61%、28.53%,密码子前两位的GC平均含量明显高于第3位;(2)有效密码子数(ENC)的取值范围为38.48~61.00,平均值为47.21,其密码子偏性较弱。相关性分析显示:(1)GC1与GC2显著相关,GC与GC1、GC2、GC3都极显著正相关,GC3与GC1、GC2都不显著相关;(2)ENC与GC1不显著相关,但与GC2和GC3分别显著和极显著相关;(3)密码子数(N)只与GC3显著相关,说明密码子3个位置中第3位碱基组成主要影响着密码子数。RSCU分析显示,29个RSCU>1的密码子中以A结尾有12个、以U结尾有16个、以G结尾有1个。中性绘图分析显示,GC12与GC3的相关系数和回归系数分别为0.065和0.085,二者不显著相关。ENC-plot绘图分析显示,大多数基因分布于标准曲线附近,多数ENC比值分布在–0.05~0.05区间。PR2-plot绘图分析显示,所有基因不均匀分布在平面图的4个区域内,密码子第3位嘧啶T/C的使用频率高于嘌呤A/G。这3种绘图分析综合表明,自然选择和突变作为主要因素,相对均衡地影响菠萝叶绿体基因组的密码子偏好性。最优密码子和RSCU分析显示,29个RSCU>1的密码子及筛选的18个最优密码子绝大多数偏好以A或U结尾。这些研究结果可为外源基因的密码子优化及提高其表达效率提供科学依据。

关键词:菠萝;叶绿体基因组;密码子偏好性;最优密码子中图分类号:S668.3      文献标识码:A

Analysis of Codon Usage Bias in the Chloroplast Genome of

YANG Xiangyan, CAI Yuanbao, TAN Qinliang, QIN Xu, HUANG Xianya, WU Mi

Guangxi Subtropical Crops Research Institute / Guangxi Academy of Agricultural Sciences, Nanning, Guangxi 530001, China

The codon usage bias of chloroplast genome affects the genes expression efficiency, which provides important information for chloroplast genetic engineering and species genetic improvement. To determine the codon usage characteristic of the chloroplast genome and its main influencing factors in pineapple (), the codon usage pattern and its preference of pineapple chloroplast genome were analyzed using bioinformatics softwares. The average GC content of codons of pineapple chloroplast genes was 38.31%, the average GC content of codons from the first position to the third position was 46.78%, 39.61% and 28.53%, respectively, and the average GC contents at the first and second positions of codons were significantly higher than that at the third position. The value range of effective number of codons (ENC) was 38.48—61.00, and its average value was 47.21, indicating weak codon bias. GC1 was significantly correlated with GC2, GC was significantly positively correlated with GC1, GC2 and GC3, and GC3 was not significantly correlated with GC1 and GC2. ENC was not significantly correlated with GC1, but significantly and extremely significantly correlated with GC2 and GC3, respectively. Codon number (N) was only significantly correlated with GC3, which indicating that the base composition of the third position in the three positions of the codon mainly affects codon number. RSCU analysis showed that among the 29 codons with RSCU>1, 12 codons ended with A, 16 codons ended with U, and 1 codon ended with G. Neutrality plot analysis showed that there was not significant correlation between GC12 and GC3, and the correlation coefficient and regression coefficient was 0.065 and 0.085, respectively. ENC-plot analysis showed most genes were distributed near the standard curve, and most ratios were distributed in the interval of –0.05—0.05. PR2-plot analysis showed that all genes were unevenly distributed in the four regions of the PR2 plan, and the use frequency of pyrimidine T/C at the third position of codon was higher than that of purine A/G. Bias analysis of Neutrality plot, ENC-plot and PR2-plot suggested that natural selection and mutation as the main factors affect the codon usage bias of pineapple chloroplast genome. Analysis of optimal codons and RSCU showed that most of the 29 codons with RSCU>1 and the 18 optimal codons ended with A or U. The results provide scientific basis for codon optimization of exogenous genes and improvement of their expression efficiency.

pineapple (); chloroplast genome; codon usage bias; optimal codons

10.3969/j.issn.1000-2561.2022.03.001

叶绿体基因组是细胞核以外相对独立的遗传物质,具有母系遗传方式,其分子结构稳定、简单,分子量较小;且拷贝数较多,进化速率适中,已广泛用于植物的系统发育研究、遗传多样性分析、基于DNA条形码的物种鉴定等,尤其是叶绿体基因工程。基于叶绿体基因组的独特结构与遗传方式,使得叶绿体基因工程可以实现外源基因的定点整合与高效表达,并有效避免花粉飘逸所引起生态环境的污染问题。植物叶绿体基因组编码蛋白过程中,普遍存在密码子偏好性,即偏好使用一种或几种特定的密码子。已有研究表明,在长期进化中物种的密码子偏好性受到碱基突变、自然选择等主要因素的影响,这种密码子偏好性又会影响到外源基因在叶绿体中的表达水平。而且,密码子的偏好性在不同的物种间却有着较大的差异。因此,通过叶绿体基因组的密码子偏好性研究,可以优化外源基因在叶绿体中的表达水平,对于推进叶绿体基因工程的应用及物种遗传改良具有重要意义。

随着现代高通量测序技术的快速发展,物种叶绿体基因组序列陆续公开,国内外对叶绿体基因组的密码子偏好性研究均有报道,如水稻(Oryza sativa)、棉花(spp)和小麦()等。菠萝()是世界三大草本果树之一,其营养价值高,风味独特,深受广大消费者的青睐。目前,REDWAN等利用高通量测序技术获得菠萝卡因类MD-2品种的叶绿体全基因组序列。陈哲等分析了菠萝核基因组的密码子偏好性,但有关菠萝叶绿体基因组的密码子偏好性研究在国内外还未见报道。基于本课题组的前期研究工作,本研究利用菠萝叶绿体基因组的蛋白编码区序列,分析其密码子偏好性的影响因素及使用特征,筛选出最优密码子,以期通过叶绿体基因工程优化外源基因的表达效率,为菠萝重要农艺性状的遗传改良打下坚实的基础。

材料与方法

  材料

从NCBI数据库中下载菠萝()叶绿体基因组序列,GenBank登录号为NC_026220.1。该基因组序列全长159 636 bp,共有86条编码蛋白的CDS序列。为了提高密码子偏好性分析的准确性,剔除重复的CDS序列及小于300 bp的CDS序列,将剩余的52个CDS序列作为后续分析的样本序列。

  方法

1.2.1  密码子偏好性相关参数分析  利用CodonW 1.4.2软件分析菠萝叶绿体基因组52个CDS序列的相对同义密码子使用度(RSCU)、有效密码子数(ENC)、密码子数(N)等。利用CUSP软件分析52个CDS序列的密码子总GC含量、第1、2、3位的GC含量(分别以GC、GC1、GC2、GC3表示)。采用SPSS 18.0软件对密码子偏好性相关参数进行相关性分析。

1.2.2  密码子碱基组成的差异性分析  通过中性绘图分析用Excel软件以GC3为横坐标,GC1和GC2的平均值GC12为纵坐标绘制散点图和回归曲线,图中每个点代表相应基因的位置。采用SPSS 18.0软件分析GC3与GC12的差异显著性和相关性,以此推测密码子偏好性的主要影响因素。如果二者显著相关,则密码子偏好性主要受到突变压力的影响;如果二者不显著相关,则密码子偏好性更多地受到自然选择的影响。

1.2.3  碱基组成对密码子偏好性分析  利用ENC-plot绘图分析方法,在Excel中以各基因的GC3为横坐标,ENC实际值为纵坐标,绘制二维散点图;并根据公式ENC=2+GC3+29/[GC3+ (1-GC3)]计算ENC期望值,以GC3为横坐标,ENC期望值为纵坐标绘制其标准曲线。如果各基因的散点分布于标准曲线上或其附近,则密码子偏好性受到突变压力的影响;如果各散点分布于标准曲线下方较远的地方,则其偏好性主要受到自然选择的影响。根据公式ENC比值=(ENC期望-ENC实际)/ENC期望计算ENC比值频率,更直观地判断密码子偏好性的主要影响因素。

1.2.4  碱基奇偶偏好分析  利用CodonW 1.4.2软件计算各基因8种氨基酸(丝氨酸、亮氨酸、精氨酸、脯氨酸、苏氨酸、缬氨酸、丙氨酸和甘氨酸)的密码子第3位上的A、T、C、G含量(分别以A3、T3、C3、G3表示)。在Excel中以G3/(G3+C3)為横坐标,A3/(A3+T3)为纵坐标进行PR2偏倚分析作图。从图的中心点(A=T且C=G,即密码子偏好性全部受突变的影响)发出的矢量距离则表示各基因的偏倚方向与程度。

1.2.5  最优密码子筛选  对菠萝52个叶绿体基因的ENC值进行排序,分别选取两端基因各5个,构建高表达基因库(ENC值小)和低表达基因库(ENC值大),并计算二者的RSCU差值(ΔRSCU)。筛选ΔRSCU≥0.08的高表达密码子,且RSCU>1的高频率密码子定义为菠萝叶绿体基因组的最优密码子。

 结果与分析

 密码子偏好性相关参数分析

利用CodonW 1.4.2软件和CUSP软件分析菠萝叶绿体基因组密码子偏好性相关参数可知(表1),52个基因密码子的GC含量平均值为38.31%,其中,密码子第1~3位的GC含量平均值分别为46.78%、39.61%、28.53%,可见,密码子3个不同位置GC含量不是均匀分布,且绝大多数基因密码子前两位的GC含量明显高于第3位,

表明菠萝叶绿体基因组密码子末位碱基偏好使用A或U。此外,菠萝52个叶绿体基因ENC的取值范围为38.48~61.00,平均值为47.21,表明菠萝叶绿体基因组编码区的密码子偏性较弱。

相关性分析可见(表2),GC1与GC2显著相关,GC与GC1、GC2、GC3都极显著正相关,GC3与GC1、GC2都不显著相关,说明菠萝叶绿体基因组密码子中,前2位碱基相似度很高,但与第3位差异较大;ENC与GC1不显著相关,但与GC2和GC3分别显著和极显著相关,说明密码子第2、3位(尤其是第3位)碱基组成会影响密码子使用的偏好性;密码子数(N)只与GC3显著相关,说明密码子3个位置中第3位碱基组成主要影响着密码子数;密码子数(N)与ENC不显著相关,说明基因序列长度影响密码子的使用偏好性很小。

RSCU分析可见(表3),29个RSCU>1的密码子中以A结尾有12个、以U结尾有16个、以G结尾有1个,说明菠萝叶绿体基因组密码子偏好以A或U结尾。

 密码子碱基组成的差异性分析

菠萝叶绿体基因组52个基因的中性绘图分析结果显示(图1),GC12的取值范围为0.3294~ 0.5468,GC3的取值范围为0.2014~0.3729;在图中除了基因、和接近于对角线,其余49个基因都偏离对角线,并分布在对角线上方。GC12与GC3的相关性分析显示,其相关系数为0.065,二者不显著相关,回归系数(即对角线斜率)为0.085。说明在菠萝叶绿体基因组中绝大多数基因的密码子前两位的碱基组成与第3位显著差异,因此,其密码子偏好性除了受突变影响外,更多地受到自然选择的影响。

  碱基组成对密码子偏好性分析

ENC-plot绘图分析结果显示(图2),大多数基因分布于标准曲线附近,即这些基因密码子偏好性受到突变压力的影响;基因、和距离标准曲线最远,其偏好性更多地受到自然选择的影响。通过ENC比值频率分析进一步显示(表4),32个基因(占总基因数的61.5%)的ENC比值分布在–0.05~0.05区间,说明这些基因的ENC实际与ENC期望值差异很小,即大多数基因密码子的偏性受到了突变的影响,这与ENC-plot绘图分析结果相一致。

碱基奇偶偏好分析

由菠萝叶绿体基因的PR2-plot绘图分析可知(图3),52个基因不均匀分布在平面图的4个区域内,右上方区域几乎无基因分布,大部分基因分布在左下方区域,说明这些基因密码子第3位的T>A且C>G,即嘧啶T/C的使用频率高于嘌呤A/G;且基因、和偏离中心点(A=T且C=G)的矢量距离最远。因此,这4种碱基的不均衡使用说明菠萝叶绿体基因组密码子使用模式受到突变压力、自然选择等因素的综合影响。

 最优密码子筛选

RSCU分析显示(表3),RSCU>1的密码子有29个,并作为菠萝叶绿体基因组的高频密码子。根据ENC值分别构建高表达基因库(基因、、、和)和低表达基因库(基因、、、和)。2个基因库的RSCU分析显示(表3),ΔRSCU≥0.08的密码子有23个,并作为菠萝叶绿体基因组的高表达密码子。同时满足高频密码子和高表达密码子确定为菠萝叶绿体基因组的最优密码子,即UUU、UUA、UUG、AUU、GUA、UCC、AGU、CCU、ACA、GCA、CAU、CAA、AAA、GAA、UGU、CGU、AGA、GGU等18个密码子。这些最优密码子绝大多数以U或A结尾(各有8个),以G和C结尾各1个。

讨论

叶绿体基因组密码子偏好性是物種长期适应外界环境的进化结果,主要受到碱基突变、基因表达水平、自然选择等因素的影响。与密码子前两位碱基相比,第3位碱基突变所受到的自然选择压力小,且又决定氨基酸的种类特征,对于研究密码子偏好性具有重要作用。本研究的菠萝叶绿体基因组中绝大多数基因密码子的第3位GC含量明显低于前两位碱基,偏好使用A或U。这与水稻、棉花和小麦、灯盏花()等多种植物叶绿体基因组密码子的使用偏好性很相似,也表明在长期进化过程中这些植物叶绿体基因组密码子的使用模式相对保守且高度相似。

已有研究表明,碱基突变和自然选择是影响叶绿体基因组密码子偏好性的2个主要因素。本研究中菠萝叶绿体基因组的编码区存在较弱的密码子偏性;中性绘图分析表明其密码子偏好性更多地受到自然选择的影响;而ENC-plot绘图分析表明突变是绝大多数基因密码子偏好性形成的主要因素。可见,自然选择和突变作为主要因素,相对均衡地影响着菠萝叶绿体基因组密码子偏好性。本研究的PR2-plot分析结果也进一步验证了该结论。不少植物叶绿体基因组的密码子使用特性在漫长进化中也受到了类似的影响因素,如陆地棉()、巨桉()、芒果()等。这些研究结论表明,碱基突变和自然选择综合影响这些植物叶绿体基因组的密码子偏性,但其具体的分子作用机制还有待于深入研究。

大多数单子叶植物叶绿体基因组密码子偏好以G或C结尾,也有少数植物偏好以A或U结尾。本研究中菠萝作为单子叶草本植物,其叶绿体基因组密码子和最优密码子偏好以A或U结尾,这和其他少数单子叶植物的密码子偏好性一致,如糜子()、文心兰(Gower Ramsey)、蒙古韭( Regel)等。而且,植物叶绿体基因组最优密码子可以有效提高氨基酸的翻译准确性与效率,从而促进基因的表达。本研究筛选出的18个菠萝叶绿体基因组最优密码子,符合大多数植物叶绿体基因组的最优密码子以NNA或NNU为使用模式。通过对菠萝叶绿体基因组密码子偏好性分析及最优密码子确定,为下一步外源基因的密码子优化,从而提高该基因在菠萝叶绿体中的表达效率提供重要的参考依据。

参考文献

  1. Meucci S, Schulte L, Zimmermann H H, Stoof- Leichsenring K R, Epp L, Bronken Eidesen P, Herzschuh U. Holocene chloroplast genetic variation of shrubs (, , Salix sp.) at the siberian tundra-taiga ecotone inferred from modern chloroplast genome assembly and sedimentary ancient DNA analyses[J]. Ecology and Evolution, 2021, 11(5): 2173-2193.
  2. Wang K, Cui Y, Wang Y, Gao Z, Liu T, Meng C, Qin S. Chloroplast genetic engineering of a unicellular green alga with expression of an antimicrobial peptide[J]. Marine Biotechnology, 2020, 22(4): 572-580.
  3. Wannathong T, Waterhouse J C, Young R E, Economou C K, Purton S. New tools for chloroplast genetic engineering allow the synthesis of human growth hormone in the green alga [J]. Applied Microbiology and Biotechnology, 2016, 100(12): 5467-5477.
  4. Liu H, Lu Y, Lan B, Xu J. Codon usage by chloroplast gene is bias in [J]. Journal of Genetics, 2020, 99: 8.
  5. Kong W Q, Yang J H. The complete chloroplast genome sequence of and and comparative analysis within L[J]. PeerJ, 2017, 5(31): e3037.
  6. Bhattacharyya D, Uddin A, Das S, Chakraborty S. Mutation pressure and natural selection on codon usage in chloroplast genes of two species in L. (Fabaceae: Faboideae)[J]. Mitochondrial DNA, 2019, 30(4): 664-673.
  7. Wu S, Xu L, Huang R, Wang Q. Improved biohydrogen production with an expression of codon-optimized and genes in the chloroplast of [J]. Bioresource Technology, 2011, 102(3): 2610-2616.
  8. Chakraborty S, Yengkhom S, Uddin A. Analysis of codon usage bias of chloroplast genes in species: codon usage of chloroplast genes in species[J]. Planta, 2020, 252(4): 1-20.
  9. Redwan R M, Saidin A, Kumar S V. Complete chloroplast genome sequence of MD-2 pineapple and its comparative analysis among nine other plants from the subclass Commelinidae[J]. BMC Plant Biology, 2015, 15(196): 1-20.
  10. 陳  哲, 胡福初, 王祥和, 范鸿雁, 张治礼. 菠萝密码子使用偏好性分析[J]. 果树学报, 2017, 34(8): 946-955.CHEN Z, HU F C, WANG X H, FAN H Y, ZHANG Z L. Analysis of codon usage bias of with genome sequencing data[J]. Journal of Fruit Science, 2017, 34(8): 946-955. (in Chinese)
  11. 杨祥燕, 蔡元保, 张治礼, 孙光明, 孙伟生, 吴青松, 王运儒. 菠萝MADS-box基因的克隆与表达分析[J]. 植物生理学报, 2016, 52(9): 1406-1412.YANG X Y, CAI Y B, ZHANG Z L, SUN G M, SUN W S, WU Q S, WANG Y R. Cloning and expression analysis of MADS-box gene from pineapple ()[J]. Plant Physiology Journal, 2016, 52(9): 1406-1412. (in Chinese)
  12. 蔡元保, 杨祥燕, 孙光明, 黄  强, 刘业强, 李绍鹏, 张治礼. 菠萝花发育相关基因的克隆与组织表达特性分析[J]. 植物学报, 2014, 49(6): 692-703.Cai Y B,Yang X Y, Sun G M, Huang Q, Liu Y Q, Li S P, Zhang Z L. Cloning of flowering-related gene and characterization of expression in tissues of pineapple ()[J]. Chinese Bulletin of Botany, 2014, 49(6): 692-703. (in Chinese)
  13. 李显煌, 杨生超, 辛雅萱, 屈亚亚, 杨琳懿, 冯发玉, 范  伟, 辛培尧. 灯盏花叶绿体基因组密码子偏好性分析[J]. 云南农业大学学报(自然科学), 2021, 36(3): 384-392.LI X H, YANG S C, XIN Y X, QU Y Y, YANG L Y, FENG F Y, FAN W, XIN P Y. Analysis of the codon usage bias of chloroplast genome in (Vant.) Hand- Mazz[J]. Journal of Yunnan Agricultural University (Natural Science), 2021, 36(3): 384-392. (in Chinese)
  14. Li G, Pan Z, Gao S, He Y, Xia Q, Jin Y, Yao H. Analysis of synonymous codon usage of chloroplast genome in [J]. Genes and Genomics, 2019, 41(10): 1173-1181.
  15. 尚明照, 刘  方, 华金平, 王坤波. 陆地棉叶绿体基因组密码子使用偏性的分析[J]. 中国农业科学, 2011, 44(2): 245-253.SHANG M Z, LIU F, HUA J P, WANG K B. Analysis on codon usage of chloroplast genome of [J]. Scientia Agricultura Sinica, 2011, 44(2): 245-253. (in Chinese)
  16. 王鹏良, 吴双成, 杨利平, 王华宇, 陈乃明, 张照远. 巨桉叶绿体基因组密码子偏好性分析[J]. 广西植物, 2019, 39(12): 1583-1592.WANG P L, WU S C, YANG L P, WANG H Y, CHEN N M, ZHANG Z Y. Analysis of codon bias of chloroplast genome in [J]. Guihaia, 2019, 39(12): 1583-1592. (in Chinese)
  17. 刘  慧, 王梦醒, 岳文杰, 邢光伟, 葛玲巧, 聂小军, 宋卫宁. 糜子叶绿体基因组密码子使用偏性的分析[J]. 植物科学学报, 2017, 35(3): 362-371.Liu H, Wang M X, Yue W J, Xing G W, Ge L Q, Nie X J, Song W N. Analysis of codon usage in the chloroplast genome of Broomcorn millet ( L.)[J]. Plant Science Journal, 2017, 35(3): 362-371. (in Chinese)
  18. 李冬梅, 吕复兵, 朱根发, 操君喜, 孙映波, 刘海林, 王  真. 文心兰叶绿体基因组密码子使用的相关分析[J]. 广东农业科学, 2012, 39(10): 61-65.LI D M, LV F B, ZHU G F, CAO J X, SUN Y B, LIU H L, WANG Z. Analysis on codon usage of chloroplast genome of Gower Ramsey[J]. Guangdong Agricultural Science, 2012, 39(10): 61-65. (in Chinese)
  19. 王媛媛, 杨美青. 蒙古韭叶绿体基因组密码子使用偏好性分析[J]. 分子植物育种, 2021, 19(4): 1084-1092.Wang Y Y, Yang M Q. Analysis of the codon usage bias in the chloroplast genome of Regel[J]. Molecular Plant Breeding, 2021, 19(4): 1084-1092. (in Chinese)

猜你喜欢

叶绿体碱基绘图
32年前血案告破!揭开两张手绘图背后的故事
编辑部故事
基因“字母表”扩充后的生命
叮咚鸟
创建新型糖基化酶碱基编辑器
共生
人不吃饭行吗
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员
一种快速提取微藻完整叶绿体及其DNA的方法