APP下载

灰毛浆果楝叶绿体基因组密码子使用特征分析

2020-06-20原晓龙张劲峰

森林与环境学报 2020年2期
关键词:密码子叶绿体浆果

原晓龙,王 毅,张劲峰

(1.云南省林业和草原科学院,云南 昆明 650201;2.云南省森林植物培育与开发利用重点实验室,云南 昆明 650201)

叶绿体拥有一套独立于核的基因组,是一种存在于植物中的半自主性细胞器,属细胞质遗传[1]。叶绿体是植物光合作用的细胞器,且植物的能量供给和次生代谢产物的生物合成均在其参与下完成[2]。植物花粉中不含叶绿体,且叶绿体基因拷贝数多、基因组数量多[3],因此以叶绿体基因组为受体进行转基因操作可避免花粉逃逸带来的生物安全问题[4],并可迅速得到表达量较高的转基因后代[1],叶绿体基因工程已在拟南芥[Arabidopsisthaliana(L.) Heynh][5]、棉花(GossypiumhirsutumL.)[6]等植物中成功转化。叶绿体基因工程是以基因序列的同源重组为基础[7],因此通过研究叶绿体基因组的蛋白编码序列特征和密码子的碱基组成,有助于提高遗传转化效率和目的基因高效稳定表达[8],还可以评估分子系统进化水平[9]。蛋白编码序列的DNA由除起始密码子和终止密码子外通用的61个密码子翻译,除蛋氨酸和色氨酸外,其余氨基酸均有两种以上的同义密码子共同编码[10];各同义密码子在翻译过程中的使用频率并不均等,这种现象称为密码子偏好性(codon usage bias, CUB)[11]。密码子偏好性在不同物种、组织或基因中具丰富的多样性,这是物种或基因在长期的进化过程中受自然选择、碱基突变及遗传漂移等因素综合作用的结果[12-13];同时密码子偏好性还与基因组大小[14]、内含子数量[15]、tRNA丰度[16]和基因表达水平[17]等因素存在关联。密码子偏好性是物种的进化特征之一,分析密码子的使用模式和影响因素,有助于对生物适应性的分子机制、物种间的进化关系等研究提供参考依据。

灰毛浆果楝[Cipadessacinerascens(Pell.) Hand.-Mazz.]又名亚洛轻、假茶辣等,为楝科(Meliaceae)浆果楝属(Cipadessa)植物,灌木或小乔木,主要生长在四川、贵州、广西及云南等地160~2400m的雨林、常绿阔叶林、山坡灌丛和草地[18-19]。灰毛浆果楝的根、叶及全株均可入药,目前已报道的主要成分包括二萜、黄酮及其苷,以及作为楝科植物特征次生代谢产物的柠檬苦素等化合物,其中柠檬苦素类化合物含有丰富的四降三萜的结构骨架,含四降三萜结构骨架的化合物具抗肿瘤、抗菌、拒食活性等生物活性[18,20-21]。目前多种植物的叶绿体基因组全长序列已经测定完成,叶绿体基因密码子使用模式在竹亚科植物[10]和7种作物[1]中已有报道。本研究通过对灰毛浆果楝叶绿体基因组进行高通量测序,通过同源序列比对和基因注释获得了蛋白编码序列,以此为基础,对灰毛浆果楝叶绿体基因的密码子使用模式进行初步分析,探讨影响其密码子使用偏性形成的主要因素,以期为灰毛浆果楝叶绿体分子进化、明确灰毛浆果楝的系统发育位置、不同种源鉴定及叶绿体基因工程等提供基础数据。

1 材料与方法

1.1 试验材料

灰毛浆果楝叶片采自云南省林业和草原科学院普文热带林业研究所,送至生工生物工程(上海)股份有限公司进行测序,获得灰毛浆果楝叶绿体基因组数据并提交至美国国立生物技术中心(National Center for Biotechnology Information, NCBI)查询其登录号为MN126582,对其叶绿体的编码序列(coding sequence, CDS)进行筛选,剔除序列长度小于300bp、序列不完整和序列中间存在终止密码子的序列,留存含有起始密码子ATG和末端终止密码子UAA、UAG、UGA的CDS[22]。从灰毛浆果楝叶绿体基因组85条蛋白编码序列中筛选得到54条CDS。

1.2 研究方法

对从灰毛浆果楝叶绿体基因组中筛选得到的54条CDS进行分析,其中通过在线软件CUSP(http:∥emboss.toulouse.inra.fr/cgi-bin/emboss/cusp)计算不同基因密码子各位置的鸟嘌呤和胞嘧啶(guanine and cytosine, GC)含量(GC1、GC2、GC3)[1],以GC12(GC1、GC2的平均值)为纵坐标、以GC3为横坐标进行中性绘图分析,以GC3为横坐标、有效密码子数(effective number of codons,Nec)为纵坐标进行有效密码子数绘图(Nec-plot)分析,以A3/(A3+T3)为纵坐标、G3/(G3+C3)为横坐标进行奇偶偏差(PR2-plot)分析,通过上述分析以明确灰毛浆果楝叶绿体基因组密码子的使用偏性规律[1,10]。

结合灰毛浆果楝叶绿体基因组密码子的高频率密码子和高表达密码子的分析结果,将同义密码子相对使用度(relative synonymous codon usage,URSC)>1的密码子确定为高频密码子;以Nec值为偏好性标准,选择两极10%的基因构建高低偏性基因库,将ΔURSC≥0.08的密码子定为高表达优越密码子;最终将同时满足2种条件的密码子定为灰毛浆果楝叶绿体基因组的最优密码子[23]。

2 结果与分析

2.1 叶绿体编码基因同义密码子的使用偏性

选择灰毛浆果楝叶绿体基因组中CDS长度大于300bp的54个蛋白编码序列整合成一个整体进行同义密码子偏好性分析,该序列共有64473bp的核苷酸序列,21491个有义密码子,其中含21437个同义密码子。用Codon W1.4.2和在线软件CUSP分析该序列,得到灰毛浆果楝叶绿体基因组不同位置的GC含量(表1),在灰毛浆果楝叶绿体基因组中,密码子的平均GC含量为38.70%,3个位置上GC含量从大到小依次为GC1、GC2、GC3,含量分别为47.41%、39.74%和28.95%,可见叶绿体基因中的GC含量总体较低,且3个位置上GC含量差异较大,表现为GC3含量最低,说明在灰毛浆果楝叶绿体中,以A和T碱基结尾的密码子的使用频率高于以G和C碱基结尾的密码子。Nec作为判断密码子使用偏性的指标之一,取值范围从20到61,具体可阐释为若每个氨基酸仅用一个密码子则Nec值为20,若各同义密码子的使用机会完全均等则Nec值为61,即Nec值越小则密码子使用偏性则越大[24];灰毛浆果楝叶绿体基因组的Nec平均值为48.09,Nec实际值介于34.60~61.00,Nec值大于45的基因有39个,说明该叶绿体基因组的密码子使用偏性非随机选择,且偏性较弱。

GC1、GC2、GC3、GCall、Nec和密码子数目(N)的相关性分析结果(表2)表明,GCall与GC1、GC2、GC3,GC1与GC2等均呈极显著相关,GC3与GC1、GC2均未达到显著相关,说明密码子的第1位和第2位碱基组成相似,而与密码子第3位碱基组成存在差异。Nec与GC3呈极显著相关,Nec与GC2呈显著相关,Nec与GC1未达到显著相关水平,说明密码子第2位和第3位碱基GC含量对密码子偏好性有影响,其中第3位影响最大。GC3和N呈显著相关关系,说明N对Nec具一定的影响。除蛋氨酸和色氨酸外,其余18种氨基酸的URSC值(表3)显示,URSC值大于1的密码子有29个,其中16个以U结尾,12个以A结尾,1个以G结尾,密码子以A和U出现的频率较高,说明其为灰毛浆果楝叶绿体基因组的偏好密码子,而以C和G结尾的密码子为非偏好密码子。

注:**表示在P<0.01水平(双侧)上显著相关;*表示在P<0.05水平(双侧)上显著相关。Notes:**means extremely significant correlation atP<0.01(bilateral);*means significant correlation atP<0.05(bilateral).

表3 灰毛浆果楝各氨基酸相对同义密码子使用度Table 3 URSC analysis of protein coding region in C. cinerascens

2.2 叶绿体基因组密码子使用的中性绘图分析

灰毛浆果楝叶绿体基因组中各基因中性绘图分析(图1)显示,GC12处于0.331 7~0.575 6区间,GC3处于0.200 0~0.369 5区间;除ycf2基因的GC12(0.384 4)、GC3(0.369 5),二者的比值为1.04,在图中接近对角线;其余基因均分布在对角线上方。采用SPSS 19.0软件分析GC12和GC3的相关性统计(Pearson)的相关系数为0.098 4,相关性不显著,回归系数(对角线斜率)为0.137 9,表明在灰毛浆果楝叶绿体基因组中,各基因的密码子第1位、第2位与第3位的碱基组成无显著差异,其密码子使用偏性较多地受选择压力的影响。

2.3 叶绿体基因组有效密码子数绘图分析

GC3与Nec的关联分析(图2)显示,灰毛浆果楝叶绿体中的部分基因位于标准曲线附近,这部分基因的实际Nec值与预期Nec值接近;另一部分基因距离标准曲线较远的位置,即实际Nec值与预期Nec值差异较大。为了更准确地说明哪些基因离标准曲线较近,采用Nec比值((预期Nec值-实际Nec值)/预期Nec值)统计Nec比值频数(表4),结果显示Nec比值位于-0.05~0.05区间外的基因数有36个,即大部分基因的实际Nec值与预期Nec值的相差较大,密码子偏好性与GC3的差异有关,故灰毛浆果楝叶绿体基因组密码子偏好性更多地受选择的影响。

图1 密码子使用的中性绘图分析 图2 密码子使用的有效密码子数绘图分析

Figure 1 Neutrality plot analysis of the codon usage Figure 2Nec-plot analysis of the codon usage

表4 有效密码子数比值频数分布Table 4 Distribution of Nec ratio of the codon usage

2.4 叶绿体基因组密码子的奇偶偏差绘图分析

通过PR2-plot绘图分析灰毛浆果楝各基因编码的部分氨基酸的嘌呤(A和G)与嘧啶(T和C)的关系(图3),结果显示,大部分基因位于PR2平面图的下方,其中位于PR2平面图右下方的基因较多,说明在碱基使用频率方面,T>A且G>C;如果仅受碱基突变的影响,则4个碱基平均分布在PR2平面,这个结果说明灰毛浆果楝叶绿体基因组密码子使用模式受多种因素共同作用的影响。

2.5 叶绿体基因组中最优密码子的确定

将灰毛浆果楝叶绿体基因组中的54个编码基因作为一个整体在Codon W 1.4.2软件上运行,以Nec值为标准进行排序,选择两极5%的构建高表达

图3 奇偶偏差绘图分析

和低表达基因库,分别对两个库中的密码子计算URSC值,再统计各基因ΔURSC值(表5),筛选得到0.08≤ΔURSC<0.30的密码子,含UUC、UUG和CUA等26个高表达优越密码子(在表5中用*表示),其中6个以A结尾、9个以U结尾、2个以G结尾和9个以C结尾;0.30≤ΔURSC<0.50的有9个,ΔURSC≥0.50的有5个。结合高频密码子和高表达优越密码子,将同时满足2种条件的密码子确定为灰毛浆果楝叶绿体基因组的最优密码子,即可最终确定GUU、GUA、UCU、AGU、CCU、ACU、GGU、GCU、CAA、AAA、UGU、AGA和AUU,且全部以A或U结尾,其中9个以U结尾,4个以A结尾。

表5 灰毛浆果楝叶绿体基因组最优密码子确定Table 5 Preferred codons in chloroplast genome of C. cinerascens

注:*表示0.08≤ΔURSC<0.30,**表示0.30≤ΔURSC<0.50,***表示ΔURSC≥0.50。Notes:*means 0.08≤ΔURSC<0.30,**means 0.30≤ΔURSC<0.50,***means ΔURSC≥0.50.

3 讨论与结论

遗传密码子是关联基因组DNA和功能蛋白质的联系枢纽,是构成生命信息的基本单元。然而除了蛋氨酸和色氨酸外,其余氨基酸的同义密码子的使用频率并不相同,而是存在一定的使用偏性[17];同义密码子的主要区别在于密码子的第3位碱基,密码子第3位碱基的改变通常不会引起编码氨基酸的改变,所受选择压力较小,因此研究密码子第3位碱基组成对研究植物叶绿体密码子使用偏好性具重要意义[23]。本研究通过中性绘图分析及比较灰毛浆果楝叶绿体基因组密码子3位碱基上的GC含量发现,密码子第3位碱基大多数为A和T;与大多数植物的叶绿体基因组密码子偏好性基本一致[1,10,23-24]。密码子使用偏性的主要驱动力是自然选择和碱基突变[12],Nec与GC3的相关性分析结合Nec比值频数分布能够推断密码子使用偏性的主要影响因素,即通过比较基因与标准曲线的距离远近的数量,若距标准曲线距离近的基因数量较多,则主要受突变的影响;而距标准曲线距离较远的基因数量较少,则主要受选择的影响[25];同时Nec值以45为界限,小于45则偏性较强,相反则偏性较弱[1]。本研究中灰毛浆果楝叶绿体基因组中的密码子偏好性较弱,且36个基因与标准曲线的距离较远,即大多数基因与标准曲线距离较近,说明其密码子偏好性主要受选择的影响;该植物叶绿体基因组密码子的使用偏性与蒺藜苜蓿(MedicagotruncatulaL.)[23]、刺五加[Eleutherococcussenticosus(Rupr. and Maxim) Maxim][25]、黄芩(ScutellariabaicalensisGeorgi)[26]、酸枣[ZiziphusjujubaMill. var.spinosa(Bunge) Hu ex H. F. Chou][27]等植物一致。同时PR2-plot分析亦证明灰毛浆果楝叶绿体基因组中的密码子偏好性受突变及其他因素的影响,说明影响植物密码子偏好性的因素均非单一因素,而是多因素综合的结果。

密码子偏好性说明某些蛋白质编码基因序列内存在较少使用的稀有密码子,与其匹配的同义tRNA数量同样较少,会导致翻译速率降低,生物合成酶产出量亦会减少,因此对目标基因的密码子进行优化,可有效提高其蛋白的产出量[11,12,17]。最优密码子的确定需满足高频率和高表达密码子两个标准[24],本研究中灰毛浆果楝叶绿体基因组的最优密码子均以A或U结尾。之所以要采用高频率和高表达优越密码子结合的方式,因为采用单一因素会造成最优密码子确定的错误,如本研究中编码天冬氨酸(Asp)的GAU密码子虽然其URSC值均大于1,但其高表达密码子的URSC值小于低表达蛋白编码基因,这种仅采用高频率密码子分析法已被证明无法将高低表达编码基因有效分开,当某些密码子的高表达优越性在总体上表现不突出时,这种优越性易被湮灭[28];同样在编码天冬氨酸的GAC密码子,虽然其ΔURSC≥0.50,但其URSC值小于1,故而不可作为最优密码子,因此对最优密码子增加条件,使URSC值小于1.00的密码子不能成为主要偏爱密码子,就可有效获得各植物叶绿体基因组的最优密码子[16]。这对于从分子水平上研究物种进化具有重要的指导意义,同时对目标基因进行密码子优化以提高该基因在宿主细胞中的表达量,并通过的叶绿体基因工程对潜在新基因的功能进行预测。

猜你喜欢

密码子叶绿体浆果
德国:2021年浆果产量增长27%
设施浆果
镰翅羊耳蒜叶绿体基因组密码子偏好性分析
以“题”带“面” 突破密码子与反密码子的特性
共生
浆果王
人不吃饭行吗
新型密码子、反密码子、氨基酸对应盘
2种果蝇(Drosophila melanogaster与D.sechellia)线粒体及NADH dehydrogenase subunit基因的密码子偏好性分析
一种快速提取微藻完整叶绿体及其DNA的方法