APP下载

甘蔗细胞色素C基因的电子克隆与分析

2014-11-14张玉叶肖新换苏炜华阙友雄

生物信息学 2014年1期
关键词:甘蔗色素克隆

张玉叶,黄 宁,肖新换,苏炜华,黄 珑,罗 俊,阙友雄

(福建农林大学农业部福建甘蔗生物学与遗传育种重点实验室国家甘蔗产业技术研发中心,福州350002)

细胞色素C(Cytochrome C,Cyt C)是呼吸链中一个重要的电子传递体,由核基因编码的多肽和线粒体编码的亚铁血红素组成,其主要功能是通过分子中的半胱氨酸巯基与血红素共价结合,通过血红素辅基中心铁离子价态的变化在细胞色素C还原酶(Cytochrome c reductase)和细胞色素c氧化酶(Cytochrome c oxidase) 之间传递电子[1-3]。Cyt C松散地结合在富含不饱和脂肪酸的线粒体内膜外侧心磷脂上,表面带正电荷,无法自由通过线粒体外膜[4]。Cyt C一般由103~113个氨基酸组成,其分子量小,多介于1.2~1.3 kDa。Cyt C蛋白含有18个赖氨酸,属于碱性蛋白质,等电点10.5~10.8。该蛋白的性质很稳定,这是由于在Cyt C中,血红素辅基heme除与轴向配体甲硫氨酸和组氨酸形成配位键外,还通过两个半光氨酸形成两个硫醚键和肽链共价相连[5]。此外,前人研究还发现,Cyt C在诱导细胞凋亡[6-9]和抗氧化[10]中也起着重要的作用。另一方面,鉴于Cyt C在生物进化中的高度保守性,可以应用于生物系统进化分类。综合以上,Cyt C的相关研究一直受到生物学研究中的热点问题之一,但在甘蔗中Cyt C的研究还处于初步阶段,通过文库的构建有测到相似基因的EST[11],但具体的功能验证研究仍然需要完善。

电子克隆(In silico cloning)是一种基于EST或基因组的序列组装和拼接,快速地获得部分或全长cDNA的技术。该技术首先被运用在人、鼠和水稻等EST丰富的模式生物中[12-13],随后在其它植物中此技术得到广泛运用,在甘蔗中也有相关报道[14-15]。电 子 表 达 分 析 (Electronic expression analysis)是通过整合某物种中特定基因的所有相关表达序列标签(Expression sequence Tag,EST)信息,从而获得该基因表达相关信息的一种新型基因表达分析技术[16-17]。目前,电子表达分析常与电子克隆技术相结合,共同应用于新基因挖掘和基因功能分析,已被成功应用于多种植物目标基因的表达分析,此技术在甘蔗中也得到逐步运用[15-16]。

本研究利用电子克隆方法,以甘蔗类似细胞色素C的EST序列CF576943.1为探针,通过电子克隆技术获得了甘蔗细胞色素C基因,用生物信息学方法对该基因氨基酸序列与组成、亚细胞定位、跨膜区与信号肽、疏水性/亲水性、蛋白质二、三级结构以及功能等进行分析与预测,而后采用电子表达分析技术分析该基因表达情况。研究为深入解析甘蔗细胞色素C基因的结构与功能提供了参考与借鉴依据。

1 材料和方法

1.1 甘蔗ScCyt C基因序列获得

以甘蔗类似细胞色素C的EST序列CF576943.1为探针,使用Blastn检索甘蔗EST数据库,选取与探针序列同源性较高的甘蔗EST序列,使用在线工具CAP3(http://pbil.univ-lyon1.fr/cap3.php)进行拼接,以拼好的contig重叠群为新探针,再次比对检索,直到没有新的 EST可供拼接为止[15-16]。将拼接所得的 contig用 ORF Finder(http://www.ncbi.nlm.nih.gov/gorf/gorf.html)软件查找其开放读码框,有完整的开放读码框则为基因序列。

1.2 生物信息学软件分析

利用 ExPASy中ProtParam pI/Mw(http://web.expasy.org/compute_pi/)分析基因的理化性质;SignalP 4.1 Server(http://www.cbs.dtu.dk/services/SignalP/)分析编码蛋白的信号肽有无;利用 ProtScale(http://web.expasy.org/protscale/)分析蛋白的亲疏水性;利用Profun 2.2 Server(http://www.cbs.dtu.dk/services/ProtFun/)预测蛋白的功能;利用 Psort(http://www.psort.org/)分析查看蛋白的亚细胞定位;SWISSMODEL(http://swissmodel.expasy.org/) 进行蛋白质三级结构预测。最后利用Blast查找同源氨基酸序列。

1.3 甘蔗ScCyt C基因的电子表达分析

将得到的同探针序列同源性较高的甘蔗EST序列在NCBI中逐一分析;根据这些EST序列的登陆信息得出所有EST序列组织来源,最后计算出在不同组织中的出现比例及各EST序列来源材料受到的生物或非生物胁迫情况,分析该基因的组织特异性表达情况和不同胁迫条件下的表达特性[14-16]。

2 结果与分析

2.1 甘蔗ScCyt C基因的获得

以甘蔗类似细胞色素C的EST序列CF576943.1为探针,在甘蔗EST数据库中比对检索,选中1条同源性高的甘蔗EST序列。CAP3拼接重组该EST聚类(Unigene)的28条非冗余甘蔗EST后获得2条重叠群序列,通过ORF Finder软件和Blast分析比对,最终得到一个全长为1 073 bp的基因序列。该cDNA序列具有完整的开放阅读框(ORF,377~715 bp),编码112个氨基酸,说明此序列为一条完整的甘蔗细胞色素C基因的cDNA序列,命名为ScCyt C。图1为电子克隆所得的序列。

图1 电子克隆获得的甘蔗ScCyt C基因的cDNA序列及其推导的氨基酸序列(*终止密码子)Fig.1 Nucleotide acid sequence and deduced amino acid sequence of sugarcaneScCyt C gene obtained by in silico cloning(* stop codon)

2.2 甘蔗ScCyt C基因的生物信息学分析

2.2.1 甘蔗ScCyt C基因编码氨基酸的一级结构预测

通过在线工具ExPASy对甘蔗ScCyt C基因编码氨基酸进行一级结构预测(见表1),可知,在甘蔗中Cyt C的一些一级结构预测结构与前人在其他不同植物中研究的Cyt C表现普遍的理化性质大致相符[5]。

2.2.2 甘蔗ScCyt C蛋白二级结构预测和分析

通过在线软件GOR IV对甘蔗ScCyt C蛋白进行二级结构预测(见图2,表2),结果显示无规则卷曲所占比例最大65.18%,主要集中在1~50aa。α-螺旋和延伸链所占的比例相差不远分别为15.18%和19.64%。α-螺旋主要集中在100~110aa。

表1 ScCyt C的一级结构预测分析Table1 Primary structure analysis of ScCyt C

图2 甘蔗ScCyt C蛋白二级结构预测Fig.2 Predicted secondary structure of sugarcane ScCyt C protein

表2 甘蔗ScCyt C蛋白二级结构预测分析Table 2 Secondary structure prediction of sugarcane ScCyt C protein

2.2.3 甘蔗ScCyt C蛋白信号肽预测和分析

ScCyt C基因的蛋白序列进行信号肽预测结果如表3、图3所示:第23位半胱氨酸残基具有最高的原始剪切位点分值0.110和第1位甲硫氨酸具有最高的信号肽分值0.112,第12位脯氨酸残基具有最高的综合剪切位点分值0.112。由于最后算得氨基酸残基的加权平均值较小0.112(≪0.5),则推测ScCyt C基因所编码的蛋白不存在信号肽,说明该蛋白为非分泌性蛋白,在细胞质中合成后不能进行蛋白转运。与前人研究该基因在线粒体内膜外侧上,不能自由通过线粒体外膜的结果相符[4]。

图3 甘蔗ScCyt C蛋白信号肽预测Fig.3 Signal P-NN prediction for sugarcane ScCyt C protein

表3 甘蔗ScCyt C蛋白信号肽预测Table 3 Signal P-NN prediction for sugarcane ScCyt C protein

2.2.4 甘蔗ScCyt C蛋白疏水性/亲水性的预测和分析

ScCyt C基因所编码氨基酸序列的疏水性/亲水性预测结果如图4所示,第107位具有最高分值为0.700,则疏水性最强;第96位具有最低分值-2.122,则亲水性最强。Cyt C基因所编码蛋白序列GRAVY值为-0.651,故推测甘蔗ScCyt C是一种亲水蛋白。

图4 甘蔗ScCyt C蛋白氨基酸疏水性/亲水性预测Fig.4 Predicted hydrophobicity/hydrophilicity of the amino acid sequence of sugarcane ScCyt C protein

2.2.5 甘蔗ScCyt C蛋白质三级结构预测

甘蔗ScCyt C蛋白质三级结构预测结果如图5所示:ScCyt C的空间结构以无规则卷曲和螺旋为主。将该蛋白与玉米、粟米和高粱中Cyt C蛋白的三级空间结构虚拟图,结果显示甘蔗的三级空间结构在四个近缘物种中高度相似。

图5 甘蔗ScCyt C蛋白三级结构预测Fig.5 Predicted third structure of sugarcaneScCyt C protein

2.2.6 甘蔗ScCyt C蛋白的功能预测

甘蔗ScCyt C蛋白功能预测结果如表4所示,该蛋白的最主要功能为翻译,也有一定可能性参与了复制与转录、中间代谢、脂肪酸新陈代谢、能量新陈代谢。

表4 甘蔗ScCyt C蛋白功能预测Table 4 Function prediction for sugarcane ScCyt C protein

2.2.7 甘蔗ScCyt C蛋白的亚细胞定位

ScCyt C蛋白亚细胞定位预测结果如表5所示,甘蔗ScCyt C蛋白可能定位于细胞质或叶绿体中。由于细胞色素C是生物氧化的一个非常重要的电子传递体,在线粒体和叶绿体中,细胞色素常常结合在电子传递和相关代谢途径的复合物酶中,则预测结果与实际相符。

表5 甘蔗ScCyt C蛋白的亚细胞定位Table 5 Subcellular location ofScCyt C protein

2.2.8 甘蔗ScCyt C蛋白的保守结构域分析

ScCyt C蛋白的保守结构域预测结果如图6所示,甘蔗ScCyt C蛋白包含Cytochrom C superfamily一个保守结构域。

图6 甘蔗ScCyt C蛋白的保守结构域分析Fig.6 Conserved domain prediction of ScCyt C protein

2.2.9 甘蔗ScCyt C蛋白的同源氨基酸序列比对与进化分析

使用NCBI中的Blastp程序,对甘蔗ScCyt C蛋白的氨基酸进行同源性分析。选择玉米(Zea mays_gb|NP_001170028.1||)、粟米(Setaria italica_gb|XP_004962043.1||)、高粱(Sorghum bicolor_gb|XP_002439820.1||)、马铃薯(Solanum tuberosum_gb|AFX66977.1||)番茄(Solanun lycopersicum_gb|XP_004230430.1||)、水稻(Oryza sativa Japonica Group_gb|NP_00105 5578.1||)、向日葵(Helianthus annuus_gb|P00070.3|)和二穗短柄草(Brachypodium distachyon_gb|XP_003568426.1|)进行分析,蛋白的氨基酸序列相似性分别为99%、99%、98%、94%、94%、93%、92%和91%。

用软件DNAMAN软件多重地对甘蔗与上述8个近缘物种中的Cyt C蛋白的氨基酸序列(图7),并输出有根系统进化树(图8)。从图7可以看出,同属单子叶植物的甘蔗和玉米同源性最高。图8系统进化树显示:单子叶植物甘蔗、玉米、粟米和粟米为一分支,同属双子叶植物的番茄、马铃薯和甘蔗同源性较低,但不同物种件同源性高达90%以上,仅有几个氨基酸的差别。因此,该基因在不同物种间具有高度的保守性,它们对应的蛋白属于同一个家族。

图7 甘蔗ScCyt C蛋白与其它植物种蛋白的氨基酸序列比对Fig.7 Homology analysis of ScCyt C encodes amino acid sequences and those from other plant species

图8 九种植物基于Cyt C基因氨基酸序列的系统进化树Fig.8 Phylogenetic tree of nine plant species based on amino acid sequences of the Cyt C gene

2.3 甘蔗ScCyt C基因的电子表达分析

甘蔗ScCyt C基因的电子表达结果如表6和图9所示,在甘蔗根尖、根颈、花序、叶片、茎、全株和芽中组成型表达,与其他组织类型中表达量相比,其中在根和茎中的表达量高。此外,该基因的表达受低温调控(见表6,图9)。

表6 甘蔗ScCyt C基因电子表达分析的EST分类结果Table 6 EST classification results analysis

图9 甘蔗ScCyt C基因电子表达分析结果Fig.9 The electronic expression analysis result of ScCyt C gene

3 结论

电子克隆和电子表达分析技术由于其简便高效的特性已经被广泛应用于已用于动植物基因克隆及其表达分析[11-18]。甘蔗EST数据库中包含了大约28万条EST,已经能够非常好地覆盖甘蔗的全基因组,这也说明了基于电子克隆和电子表达分析技术克隆目标基因并对其表达特性进行分析的可行性和准确性。本研究通过电子克隆技术获得了甘蔗细胞色素C基因的一条cDNA全长序列,生物信息学方法结果表明:甘蔗Cyt C基因全长1 073 bp,编码112个氨基酸,蛋白质结构稳定,分子量为1.29 kDa,氨基酸带正电荷,偏碱性。该基因位于细胞质或叶绿体中,编码蛋白为非分泌型亲水蛋白,无规卷曲为主要二级结构原件,含有1个保守功能域,主要功能为翻译。分析还揭示,甘蔗细胞色素C是分子量小,带正电荷,稳定的亲水蛋白,这与前言研究结果是相似的[4-5]。甘蔗的Cyt C蛋白与其他植物同源序列比对,表现出高度保守性,其三级结构与同为C4单子叶植物的玉米、粟米和高粱极为相似,与单子叶植物马铃薯、番茄的同源性也高达90%以上,这从一定程度上说明Cyt C蛋白可以成为研究生物进化的代表性蛋白。另一方面,本研究利用Unigene数据库分析了甘蔗细胞色素C基因的电子表达情况,检索到28条同源性较高的EST序列,该基因在甘蔗各个组织均有表达,其中在茎和根中的表达量比其他组织类型中表达量高,此外,该基因的表达可能受到低温的调控。但是,鉴于Cyt C基因与电子传递链相关,定位于叶绿体,理论上在叶片中的表达量应较高,故电子表达分析的结果需进一步通过定量PCR或者Northern杂交等技术分析的修正与完善。本研究为进一步深入研究甘蔗天细胞色素C基因的结构及其功能奠定了一定的基础。

References)

[1] DOPNER S,HILDEBRANDT P,ROSELL F I,et al.The structural and functional role of lysine residues in the binding domain of cytochrome c in the electron transfer to cytochrome c oxidase [J]. European Journal of Biochemistry,1999,261,(2):379-91.

[2] WANG Y,MARGOLIASH E.Enzymic activities of covalent 1∶1 complexes of cytochrome c and cytochrome c peroxidase[J].Biochemistry,1995,34(6):1948 -58.

[3] MEI H,WANG K,PEFFER N,et al.Role of configurational gating in intracomplex electron transfer from cytochrome c to the radical cation in cytochrome c peroxidase[J].Biochemistry,1999,38(21):6846 -54.

[4] 马伟科,张宏艳.线粒体细胞色素C与细胞凋亡[J].实用医学杂志,2007,23(23):3786-3788.MA Weike, ZHANG Hongyan. Therelationshipof cytochrome C in the mitochondrial and cell death [J].The Journal of Practical Medicine,2007,23(23):3786-3788.

[5] 马志科,昝林森.细胞色素C在生物医学方面的研究进展[J].畜牧兽医杂志,2006,25(5):30-35.MA Zhike,ZAN Linsen.The advancement of cytochrome C on biology medicine[J].Journal of Animal Science and Veterinary Medicine,2006,25(5):30-35.

[6] 孙英丽,赵允,刘春香,等.细胞色素C能诱导植物细胞编程性死亡[J].植物学报,1999,41(4):379-383.SUN Yingli, ZHAO Yun, LIU Chunxiang, etal.Cytochrome c can induce programmed cell death in plant cells[J].Acta Botanica Sinica,1999,41(4):379 -383.

[7] 王艳杰,邓雯,张鹏飞.细胞色素C与细胞凋亡研究进展[J].动物医学进展,2012,33(7):89-92.WANG Yanjie, DENG Wen, ZHANG Pengfei. The research progress of cytochrome c about cell death [J].Progress in Veterinary Medicine,2012,33(7):89-92.

[8] LI K,LI Y,SHELTON J M,et al.Cytochrome c deficiency causes embryonic lethality and attenuates stress-induced apoptosis[J].Cell,2000,101(4):389 -99.

[9] LIU Z,LIN H,YE S,et al.Remarkably high activitiesof testicular cytochrome c in destroying reactive oxygen species and in triggering apoptosis[J].Proceedings of the National Academy of Sciences,2006,103,(24):8965-70.

[10] ZHAO Y,WANG Z B,XU J X.Effectof cytochromecon the generation and elimination of O2and H2O2in mitochondria[J].Jaurnal Biological Chemistry,2003,278(4):2356-60.

[11] CASU R E,DIMMOCK C M,CHAPMAN S C,et al.Identification of differentially expressed transcripts from maturing stem of sugarcane by in silico analysis of stem expressed sequence tags and gene expression profiling[J].Plant Molecular Biology,2004,54(4):503 -17.

[12]王海涛,畅继武,马小兵,等.人和大鼠自噬相关新基因WIPI-3的电子克隆和序列分析[J].现代生物医学进展,2006,6(4):16-21.WANG Haitao,CHANG Jiwu,MA Xiaobing,et al.Identification and characterization ofhuman and rat autophagy-related novelgene WIPI3 in silico [J].Progress in Modern Biomedicine,2006,6(4):16-21.

[13]黄骥,王建飞,张红生,等.水稻葡萄糖-6-磷酸脱氢酶 cDNA的电子克隆[J].遗传学报,2002,29(11):1012-1016.HUANG Ji,WANG Jianfei,ZHANG Hongsheng,et al.In silico cloning of glucose-6-phosphate dehydrogenase cDNA from rice(Oryza Sative L.) [J].Acta Genetica Sinica,2002,29(11):1012-1016.

[14]黄宁,张玉叶,苏亚春,等.甘蔗天冬氨酰半醛脱氢酶基因的电子克隆与分析[J].生物信息学,2013,11(2):91-99.HUANG Ning, ZHANG Yuye, SUE Yachun, et al.Electronic cloning and characterization ofsugarcane ScASADH gene using bioinformatics tools[J].Chinese Journal of Bioinformatics,2013,11(2):91-99.

[15]张玉叶,黄宁,阙友雄,等.甘蔗苏氨酸脱氨酶基因的克隆与表达分析[J].热带作物学报(待发表).ZHANG Yuye,HUANG Ning,QUE Youxiong,et al.Cloning and expression analysis of threonine deaminase gene in sugarcane [J].Chinese Journal of Tropical Crops,2014,35(1):1 -7.

[16]黄宁,张玉叶,阙友雄,等.甘蔗二氨基庚二酸异构酶基因的克隆与表达分析[J].热带作物学报,2013,34(11):2200-2208.HUANG Ning,ZHANG Yuye,QUE Youxiong,et al.Cloning and expression analysis of a diaminopimelate epimerase gene in sugarcane [J].Chinese Journal of Tropical Crops,2013,34(11):2200 -2208.

[17]上官凌飞,王晨,房经贵,等.利用GenBank中大量葡萄EST序列分离有效基因的电子表达分析平台[J].中国农业科学,2011,44(13):2748-2759.SHANGGUAN Lingfei,WANG Chen,FANG Jinggui,et al.Isolation of effective genes with digital northern platform of NCBI grapevine(Vitis vinifera L.)EST sequences[J].Scientia Agricultura Sinica,2011,44(13):2748-2759.

[18]王丽芳,杜希华,于涌鲲,等.番茄WRKY转录因子基因片段的克隆及序列分析[J].中国农学通报,2009,25(23):70-73.WANG Lifang,DU Xihua,YU Yongkun,et al.Cloning and Sequence Analysis of WRKY Transcription Factor GeneFragmentin tomato [J].ChineseAgricultural Science Bulletin,2009,25(23):70 -73.

猜你喜欢

甘蔗色素克隆
克隆狼
色素热舞
清明甘蔗“毒过蛇”
“听话”的色素
浙江:诞生首批体细胞克隆猪
甘蔗的问题
爱咬甘蔗的百岁爷爷
甜油的生产及色素控制
23个甘蔗品种对甘蔗黑穗病的抗性测定
抗BP5-KLH多克隆抗体的制备及鉴定