APP下载

糠椴核酮糖-1,5-二磷酸羧化酶/加氧酶基因生物信息学分析

2020-08-25李金鑫周海城王玉文关乃千穆怀志

关键词:密码子叶绿体氨基酸

李金鑫,周海城,王玉文,关乃千,孙 昆,穆怀志

(1.长白山自然保护管理中心,吉林 二道白河 133613;2.北华大学林学院,吉林 吉林 132013)

糠椴(Tiliamandshurica)又称辽椴,为椴树科(Tiliaceae)椴树属(Tilia)高大乔木,在我国主要分布于东北三省及河北、内蒙古、山东和江苏北部等地.糠椴枝繁叶茂、生长迅速,不仅广泛应用于园林绿化,也是重要的蜜源树种[1].近年来,关于糠椴的研究主要集中在种群分布格局[2-4]、解剖结构[5-7]、扦插生根[8]、化学成分[9-10]、光合特性[11]、传粉生物学[12]等方面.核酮糖-1,5-二磷酸羧化酶/加氧酶(Rubisco)是植物光合作用过程中催化CO2固定和光呼吸的关键酶,直接影响植物的净光合速率[13].目前,关于糠椴Rubisco基因的研究相对较少.因此,本研究对糠椴Rubisco基因进行生物信息学分析,为进一步研究糠椴Rubisco基因的结构和功能提供参考.

1 材料及方法

NCBI(https:∥www.ncbi.nlm.nih.gov)数据库中糠椴叶绿体基因组的序列号为NC_028589.1.选取NCBI中糠椴Rubisco基因转录和翻译产生的mRNA序列和氨基酸序列为材料,利用ORF Finder分析基因开放阅读框[14];利用ProtParam分析氨基酸组成[15];利用Protscale的Hphob./Kyte & Doolittle标准分析亲水性/疏水性[16];利用TMHMM分析蛋白质跨膜结构域[17];利用Predict Protein进行亚细胞定位[18];利用JPred4分析氨基酸序列的二级结构[19];利用SWISS-MODEL通过同源建模构建氨基酸序列的三级结构[20].

2 结果与分析

2.1 开放阅读框

开放阅读框(Open Reading Frame,ORF)是指从起始密码子开始,结束于终止密码子的连续碱基序列,具有编码蛋白质的潜能[21].经ORF Finder分析,糠椴Rubisco基因共获得5个开放阅读框(ORF1~ORF5).其中,ORF1的长度最大,为1 455 bp,起始密码子位于叶绿体基因组的60 980 bp,终止密码子位于62 434 bp(图1),共编码484个氨基酸.

2.2 氨基酸组成

ProtParam分析结果表明:糠椴Rubisco共含有20种氨基酸.其中,甘氨酸的比例最高,占所有氨基酸的9.71%;其次为丙氨酸和亮氨酸,占比分别为9.09%和8.88%;其后依次为谷氨酸(7.44%)、缬氨酸(6.61%)、苏氨酸(6.40%)、精氨酸(6.20%)、天冬氨酸(5.58%)、赖氨酸(5.17%)、异亮氨酸(4.34%)、苯丙氨酸(4.34%)、脯氨酸(4.34%)、丝氨酸(3.72%)、酪氨酸(3.72%)、天冬酰胺(3.10%)、组氨酸(3.10%)、谷氨酰胺(2.27%)、甲硫氨酸(2.27%)、半胱氨酸(2.07%);色氨酸的比例最低,仅占所有氨基酸的1.65%(图2).糠椴Rubisco的分子式为C2400H3719N663O704S21,相对分子质量为53 798.21,理论等电点为6.04,不稳定指数为40.36,为不稳定蛋白.

2.3 蛋白质亲/疏水性

在糠椴Rubisco中,甘氨酸、苏氨酸、丝氨酸、半胱氨酸、天冬酰胺、谷氨酰胺、酪氨酸、赖氨酸、精氨酸、组氨酸、天冬氨酸和谷氨酸为亲水性氨基酸,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、色氨酸、甲硫氨酸和脯氨酸为疏水性氨基酸,氨基酸的亲/疏水性会对蛋白质的高级结构产生影响[22].ProtScale分析结果表明:糠椴Rubisco氨基酸序列的352 bp得分最高,达到2.05,315 bp得分最低,仅为-2.60(图3);GRAVY值为-0.279,小于0,说明糠椴Rubisco为亲水蛋白.

2.4 蛋白质跨膜区

跨膜蛋白在细胞增殖和分化、能量转换、信号转导及物质运输等方面具有重要作用,是介导细胞间物质和能量信号的传递者[23].通过TMHMM分析糠椴Rubisco的跨膜区发现,糠椴Rubisco在膜内的概率为0,在膜外的概率为100%(图4),说明糠椴Rubisco不存在跨膜结构域.

2.5 亚细胞定位和结合区

利用Predict Protein对糠椴Rubisco进行亚细胞定位发现,糠椴Rubisco广泛分布在叶绿体中.靶位点分析表明:糠椴Rubisco共有12个蛋白结合区.其中,长度为2的蛋白结合区有2个,分别位于1~2位氨基酸和100~101位氨基酸;长度为3的蛋白结合区有1个,位于50~52位氨基酸;长度为6的蛋白结合区有1个,位于362~367位氨基酸;长度为1的蛋白结合区有8个,分别位于4、36、171、243、310、438、440、442位氨基酸(图5).

2.6 二级结构与同源建模

蛋白质二级结构是指多肽主链骨架原子沿一定轴盘旋或折叠而形成的特定构象,主要包括α螺旋、β折叠、β转角和无规则卷曲[24].利用JPred4分析糠椴Rubisco氨基酸序列的二级结构,结果发现:糠椴Rubisco由α螺旋、β折叠和无规则卷曲等3种二级结构组成.组成α螺旋、β折叠和无规则卷曲的氨基酸数目分别为169、55和260个,分别占所有氨基酸的34.92%、11.36%和53.72%(图6).利用SWISS-MODEL对糠椴Rubisco氨基酸序列进行同源建模,得到的三维结构见图7.

3 结论与讨论

Rubisco是广泛存在于植物叶绿体基质中的一种双功能酶,既能催化C3与CO2的羧化反应进行光合作用,又能催化C5的加氧反应进行光呼吸,处于光合碳氧化和碳还原的交叉点上,对于植物的净光合速率具有决定性影响[25].周晓馥等[26]对21个常绿杜鹃亚组的Rubisco大亚基基因进行了生物信息学分析,结果发现,虽然不同常绿杜鹃的Rubisco催化位点和大亚基具有高度的保守性,但在进化上仍存在差异.魏军亚等[27]利用PCR技术克隆了香蕉Rubisco小亚基的基因序列,并分析了香蕉Rubisco小亚基的理化性质、亲/疏水性、信号肽、跨膜区、二级结构和高级结构.本研究分析了NCBI数据库中的糠椴Rubisco基因序列,该序列共有5个开放阅读框,其中最长的开放阅读框为1 455 bp;翻译产生的Rubisco位于叶绿体中,为亲水蛋白,共有12个蛋白结合区,不含跨膜区,由484个氨基酸组成,其中α螺旋、β折叠和无规则卷曲的比例分别为34.92%、11.36%和53.72%.上述结果为研究糠椴Rubisco基因的功能和表达机制提供了依据,为下一步克隆糠椴Rubisco基因、增加Rubisco基因表达量、提高Rubisco利用效率和活力,进而促进糠椴的光合作用奠定了基础.

猜你喜欢

密码子叶绿体氨基酸
胰岛素受体底物氨基酸相互作用网络鲁棒性研究
鹅掌柴蜂蜜氨基酸组成识别研究
镰翅羊耳蒜叶绿体基因组密码子偏好性分析
低蛋白日粮平衡氨基酸对生长猪生产性能的影响
共生
人不吃饭行吗
新型密码子、反密码子、氨基酸对应盘
对“翻译”过程中几个问题的探讨
2种果蝇(Drosophila melanogaster与D.sechellia)线粒体及NADH dehydrogenase subunit基因的密码子偏好性分析
一种快速提取微藻完整叶绿体及其DNA的方法