紫九牛叶绿体基因组密码子偏好性分析
2022-09-07梁湘兰黄青青严其伟覃逸明
郭 松, 梁湘兰, 黄青青, 卢 祥, 严其伟, 张 鹏, 覃逸明 *
( 1. 广西科技师范学院 食品与生化工程学院, 广西 来宾 546199; 2. 广西科技师范学院 特色瑶药资源研究与开发重点实验室, 广西 来宾 546199 )
密码子是联结生物体内遗传物质和蛋白质翻译的纽带(谢平,2017;柳燕杰等,2020),在生物体内起着重要作用。20种常见氨基酸,除了蛋氨酸(methionine,Met)和色氨酸(tryptophane,Trp)具有单一密码子外,其余氨基酸均由2~6个同义密码子编码(胡晓艳等,2019)。同义密码子的使用具有非均一性的特点(梁菲菲,2010)。某一物种或者某一基因倾向使用一种或者使用几种特定的同义密码子的现象称为密码子的使用偏好性(codon usage bias,CUB)(吴宪明等,2007)。密码子偏好性是生物长期进化过程中所形成,不同物种间密码子使用的偏好性不同(赵森等,2020)。随着高通量测序技术的发展,目前已经有多种药用植物叶绿体基因组完成了密码子偏好性的分析,对于探索物种进化及提高外源基因的表达水平起到了推动作用。
紫九牛为传统老班瑶药“虎牛钻风”中的“牛”类药物,来源于鼠李科属植物翼核果()的根和茎,别名血风藤、铁牛入石、红穿破石、青筋藤、牛参等。瑶医认为紫九牛具有养血祛风、舒筋活络、固肾益精等功效(覃迅云等,2001),民间常用其治疗慢性肝炎、肝风化、风湿筋骨疼痛、风湿性关节炎、腰肌劳损等疾病(林明琛等,2020)。现代医药学研究表明,紫九牛中富含翼核果醌和大黄素等活性化合物(应百平等,1988;王雪芬等,1993),具有抗菌、止咳、抗肿瘤等活性(Wang et al.,2008;梁冰等,2012;Hu et al.,2020)。作为一种经典瑶药,已经开始被广泛应用于多种疾病的开发治疗,但是对于紫九牛叶绿体基因组密码子偏好性的分析,尚未有研究。
本文利用Codon W 1.4.2、在线软件CUSP和Chips、R语言等软件和程序,对紫九牛叶绿体基因组的密码子进行分析,研究其密码子的偏好性以及偏好性形成的因素,并确立最优密码子,为紫九牛叶绿体基因组基因的改良,目标基因的优化提供依据。
1 材料与方法
1.1 叶绿体基因组序列的获得
紫九牛叶绿体基因组序列信息由本实验室测序获得,已上传NCBI数据库(GenBank登录号为MT974496),共有91条可以编码蛋白质的基因序列(coding DNA sequence,CDS)。选择其中长度大于300 bp的蛋白质编码序列为分析样本,最终得到50条CDS用于后续的分析。
1.2 分析方法
1.2.1 密码子偏好性相关参数分析 使用软件Codon W 1.4.2计算紫九牛叶绿体基因组同义密码子的相对使用度(relative synonymous codon usage, RSCU)。根据RSCU分析的结果:当RSCU=1时,该密码子不存在偏性(吴妙丽等,2019;梁晓静等,2020);当RSCU>1时,同义密码子中偏好使用该密码子,并将该密码子确定为高频密码子(林涛等,2002),反之亦然。使用在线软件Chips可以分析各CDS的有效密码子数(effective number of codons,ENC),ENC值可以反映密码子偏倚性的强弱,其取值范围为20到61,当ENC值为20时,同义密码子完全处于偏倚状态,当ENC值为61时,则表明同义密码子没有偏倚(赵森等,2020);ENC值从大到小偏倚性由弱变强,通常ENC值45作为区分偏倚性强弱的标准(吴宪明等,2007)。通过在线软件CUSP,分析各CDS的GC含量,分别用GC、GC、GC来表示密码子第一、第二、第三位的G/C含量,用GC来表示三个密码子的平均GC含量。
1.2.2 影响密码子偏好性的因素 使用软件SPSS 19.0对各CDS中不同位置的GC,即GC、GC、GC、GC,以及密码子数目(N)和ENC进行相关性分析,判断各参数之间的相关性,进而判断密码子偏好性受到的因素影响。通过中性绘图,分析GC和GC的平均值GC和GC的相关性。将各CDS同义密码子的第三位碱基GC(用GC表示)和ENC利用R语言作ENC-plot分析,标准曲线方程为ENC=2+GC+{29/[GC+(1-GC)]}(罗洪等,2015)。并利用标准方程求出ENC,根据ENC=(ENC-ENC)/ENC,根据数据分析50个基因中ENC的期望值与实际值的相差程度。
1.2.3 最优密码子的确定 以ENC为基准,从两端各选10%的基因,即两端各选5条CDS,以ENC值较小的5条CDS确定为高基因表达库,ENC数值较大的5条CDS确定为低基因表达库,将从两端筛选出来的两个高低基因库的基因序列分别整合到两个fasta文件中,通过软件Codon W 1.4.2来分析其RSCU值,以得到高低基因库的△RSCU,将△RSCU≥0.08的密码子确定为高表达的优越密码子(林涛等,2002)。若一密码子既符合高表达优越密码子的条件,又符合高频密码子的条件,则将该密码子确定为最优密码子(刘慧等,2017)。
2 结果与分析
2.1 偏性
2.1.1 RSCU分析 通过软件Codon W 1.4.2分析了紫九牛叶绿体基因组50条CDS中的各同义密码子的相对频率,结果如表1所示。各同义密码子中RSCU>1的有29个,其中以A/U结尾的有28个,说明了紫九牛叶绿体基因偏好以A/U结尾。
表 1 紫九牛叶绿体基因组中各氨基酸的RSCU分析Table 1 RSCU analysis of amino acids in chloroplast genomes of Ventilago leiocarpa
2.1.2 GC含量及ENC分析 通过在线软件CUSP和Chips分析了紫九牛各CDS不同位置的GC含量,结果如表2所示。可以看出GC平均含量:GC(47.38%)>GC(39.81%)>GC(29.60%),GC含量最高,GC含量最低,不同位置的GC含量存在较大差异。而此处ENC值的范围为37.350~55.547,平均值为48.227,其中ENC值大于45的有40个,小于45的仅有10个,进一步说明了紫九牛叶绿体基因组密码子具有较弱的偏好性。
表 2 紫九牛叶绿体基因组50条CDS序列密码子不同位置的GC含量Table 2 GC contents in different positions of codons in chloroplast genomes 50 CDS of Ventilago leiocarpa
2.2 影响偏性的因素
2.2.1 相关性分析及中性绘图分析 利用软件SPSS 19.0对50条CDS序列密码子不同位置的GC、密码子数量N以及ENC值进行相关性分析,结果如表3所示。GC与GC、GC没有显著相关性,而与GC、N以及ENC呈显著相关性,三位碱基的组成存在差异,初步说明了紫九牛叶绿体基因受到选择作用的影响。ENC与GC、GC达到显著相关的水平,说明了紫九牛叶绿体基因的后两位密码子的碱基会影响密码子的使用偏好性。
表 3密码子各位置GC含量、数量N及ENC值相关性分析Table 3 Correlation analyses of GC content, number (N) and ENC on chloroplast genomes of Ventilago leiocarpa
以GC和GC的平均值GC为纵坐标,GC为横坐标进行中性绘图分析,结果如图1所示。结果表明,相关系数=0.131,相关性不显著,密码子偏好性主要受到选择的影响。
图 1 紫九牛叶绿体基因中性绘图分析Fig. 1 Neutrality plot analysis of chloroplast genes of Ventilago leiocarpa
2.2.2 ENC-plot分析 由图2可知,紫九牛叶绿体基因主要分布于标准曲线附近,密码子偏好性主要受到突变的影响。通过表4分析可知,密码子基因组限在-0.05~0.05附近的基因占52%,组限在其以外的占48%。
图 2 紫九牛叶绿体基因组的ENC-plot分析Fig. 2 ENC-plot analysis of chloroplast genomes of Ventilago leiocarpa
表 4 ENC比值频数分布Table 4 Number distribution of ENC ratio
2.3 最优密码子的确定
利用软件Codon W 1.4.2来计算高低基因库中各同义密码子的RCSU值,进而得到△RSCU,结果如表5所示。由表5可知,△RSCU≥0.08的密码子有22个,其中大于0.3的有14个,大于0.5的有5个。由表1可知,RSCU>1的密码子有29个。将两者共有的密码子确定为最优密码子,最终得到密码子15个,分别为GAA、UUG、AUU、GUU、CAA、AAC、GCU、UCU、CCU、ACU、ACA、UGU、GUA、CGU和GGU,其中有14个以A/U结尾。
表 5 紫九牛叶绿体基因组最优密码子分析Table 5 Analysis of optimal codons in chloroplast genomes of Ventilago leiocarpa
3 讨论与结论
在紫九牛叶绿体基因组的RSCU分析中,由于TAG、TAA和TGA为叶绿体通用密码子表64种密码子中的终止密码子,不编码任何氨基酸,而ATG是蛋氨酸唯一密码子,TGG是色氨酸唯一密码子,没有偏性,在RSCU分析中被剔除(柳燕杰等,2020)。剩下的59种密码子中,RSCU>1的有29个,RSCU<1的有30个,约各占一半, 且并未发现RSCU>2的密码子,初步说明了紫九牛的密码子存在较弱的偏好性。而且,在50个基因中,表示密码子偏倚程度的ENC值小于45的仅有10个,ENC 的平均值为48.277,大于45,这进一步说明紫九牛密码子的偏好性较弱。29个RSCU>1的密码子当中,有28个密码子以A/U结尾,这与已经发表的大多数物种例如美国红梣()(柳燕杰等,2020)、云南蓝果树()(原晓龙等,2020)、蒺藜苜蓿()(杨国锋等,2015)等叶绿体密码子偏好性较弱且偏好以A/U结尾的结果一致。
密码子是生物体内联结核酸和蛋白质的钥匙,而密码子的使用频率在不同植物和基因中存在差异,这种密码子偏好性是物种在长期进化和对环境的适应过程中形成的(赵洋等,2016)。密码子的偏好性是多个因素共同作用的结果,中性选择影响和方向突变影响是两个主要因素,关于二者在密码子偏好性形成中的作用大小是当下关于密码子偏好性研究所关注的热点。生物在进化过程中形成稳定的密码子偏好性,即相对固定的密码子使用模式,其中GC含量是生物基因组中碱基组成的一个重要指标(杨国锋等,2015),在基因组的演变中具有重要意义。方向性突变的强弱可以通过GC含量判断,尤其是密码子的第三位碱基。由于密码子第三位受到的选择压力比前两位小,故GC常常被用来衡量密码子偏好性的指标(柳燕杰等,2020)。紫九牛叶绿体基因组中GC与GC,GC没有显著相关性,说明偏好性受到选择的影响,这与已经报道了的美国红梣 ()(柳燕杰等,2020)、黄芩 ()(王文斌等,2018)、普通油茶 ()(王鹏良等,2018)、樟树 ()(秦政等,2018)的叶绿体特征相同。而ENC-plot分析中,密码子大部分都位于标准曲线附近,只有少量基因的ENC值离标准曲线较远,表明密码子偏好性还受到突变作用的影响,与蒺藜苜蓿()(杨国锋等,2015)相类似。
我们此次将RSCU>1且△RSCU≥0.08的密码子确定为最优密码子,得到15个最优密码子为GAA、UUG、AUU、GUU、CAA、AAC、GCU、UCU、CCU、ACU、ACA、UGU、GUA、CGU和GGU。其中,以A/U结尾有14个,这与上述中的紫九牛叶绿体基因组密码子偏好以A/U结尾的结论一致。
在紫九牛叶绿体基因工程的外源基因载体设计时选用以A/U结尾的最优密码子可以提高外源基因的表达效率。紫九牛叶绿体基因组偏好性的研究以及最优密码子的确立,为优化目标基因,通过基因工程来改良紫九牛的性状提供了科学的依据。同时,对于物种的进化,以及提高外源基因表达水平具有重大意义。