西藏野生甜荞碳酸酐酶基因的克隆和生物信息学分析
2017-07-21侯维海王建林旦巴胡单
侯维海+王建林+旦巴+胡单
摘要:依据已公布的荞麦转录组测序信息,从Contig文库中获得了1个碳酸酐酶(carbonic anhydrase,简称CA)转录本,通过逆转录PCR(RT-PCR)扩增得到CA基因全长序列。生物信息学分析表明,基因全长1 233 bp,开放阅读框978 bp,编码325个氨基酸;分子量35.11 ku,等电点7.59;包含9个α-螺旋、6个β-折叠、多个无规则卷曲和延伸链;含有1个信号肽和1个跨膜区;具有β-类碳酸酐酶典型的2个氨基酸保守域。亚细胞定位显示,该蛋白出现在叶绿体中的可能性最大。利用同源建模法构建了FsCA1三维结构模型,表明甜荞CA与豌豆CA同型八聚体能很好地匹配,推测甜荞CA也是同型八聚体。用实时荧光定量PCR检测在荞麦不同器官中的表达水平,结果显示,[WTBX][STBX]FsCA1[WTBZ][STBZ] 在叶中表达水平最高,其次是在茎中,在根中表达水平最低。
关键词:西藏甜荞;碳酸酐酶;基因;三维结构预测;生物信息学
中图分类号: S188文献标志码: A
文章编号:1002-1302(2017)10-0020-04[HS)][HT9.SS]
碳酸酐酶(carbonic anhydrase,简称CA,EC4.2.1.1)是一类含锌的金属酶,广泛存在于动物、植物等有机体的组织和器官中[1]。植物中CAs至少包括5个基因家族(α、β、γ、δ和ε),主要分布在绿色组织中,可逆地催化CO2的水合反应,产生HCO-3和H+,参与植物光合CO2的固定、CO2转运、呼吸作用、离子交换等生理过程[2-3]。CA能加快CO2在细胞内的水合速度,有助于CO2运输到活跃的光合细胞中,从而提高光合速率;同时,CA活性随着叶绿素含量、锌含量增加而增强,具有明显提高光合作用的能力,在一定程度上CA活性与光合作用呈正相关[4-6]。近年来,前人对植物CA的研究主要涉及生理生化作用和酶学特性,而对编码该酶基因的组成、结构和功能等尚未形成统一认识;现有研究仅限于少数几种植物,如拟南芥(Arabidopsis thaliana)[4,7]、黄顶菊(Flaveria)[8]、玉米(Zea mays)[2]、龙眼(Dimocarpus longan Lour)[9]等,尚未见关于荞麦CA基因克隆和表达分析的报道。在高等植物中CA主要有3类,即α-CA、β-CA和γ-CA,各种类型之间氨基酸序列保守性较低,同时每个亚基因家族又包含多个成员,其成员亚细胞定位有较大差异。例如,拟南芥β-CA基因家族有6个成员([WTBX][STBX]β-CA1~β-CA6),其中β-CA1、β-CA5定位于叶绿体中,β-CA2、β-CA3、β-CA4定位于细胞质中,β-CA6[WTBZ][STBZ]定位于线粒体中[4-5,10-11];在黄顶菊属(Flaveria)中,C3类F. pringlei、C4类F. bidentis的叶片中均分离到3个不同的[WTBX][STBX]β-CA单体(βCA1~βCA3[WTBZ][STBZ]),这些成员基因之间的序列相似性或保守性超过90%。CA基因的功能验证在模式植物拟南芥上已取得进展,以β-CA基因家族的研究较为深入。有研究发现,[WTBX][STBX]Atβ-CA1[WTBZ][STBZ]编码蛋白可发生巯基亚硝酸化,降低与水杨酸结合的能力,进而影响CA活性,其表达丰度与拟南芥幼苗存活率相关[12-13];同时Atβ-CA1、Atβ-CA4参与调控保卫细胞气孔运动,是保卫细胞气孔运动的上游调节因子[14]。但是,关于其他β-CA的功能目前还不清楚[10]。总体而言,在C3植物中,β-CA主要分布在叶绿体叶肉细胞的基质中[7],可能参与协助CO2从叶绿体被膜扩散或者催化HCO-3快速脱水形成CO2;质粒中也存在β-CA,可能与气孔的关闭、脂类合成和抗病性有关[12,15-17]。
甜荞属蓼科(Polygonaceae)荞麦属(Fagopyrum),是一种重要的杂粮兼药用植物。随着市场上对荞麦需求量的增加,蕎麦育种研究显得愈发重要。荞麦起源于西藏地区,该区是世界荞麦的起源中心之一[18],属于低纬度高海拔农业区,具有全球最典型的立体生境,其地质独特,地形地貌复杂,土壤种类繁多,生态环境千差万别,产生了丰富的荞麦变异类型,具有区域独特的荞麦种质。本研究拟以西藏林芝市郊区野生甜荞为材料,根据已公布的甜荞转录组Contig文库中筛选出的碳酸酐酶转录本信息,设计CA基因的特异引物,通过逆转录PCR(RT-PCR)获得荞麦CA基因全长序列,并进行生物学信息分析,初步明确荞麦CA基因的结构和表达特点,为荞麦抗逆品种的选育提供依据。
1材料与方法
1.1材料及其总RNA提取
甜荞种子于2013年10月在西藏林芝市章麦村(地理位置29°50′N、93°25′E,海拔3 000 m)野外收集,次年4月初,将收集的野生甜荞种子散播种植于西藏大学农牧学院试验田内,除人工除草、浇水外,均在自然条件下生长。在荞麦5叶期,选取5株健壮植株的幼嫩叶片,作为提取RNA的试验材料。选取材料均设3次重复,用清水冲洗5~8次,然后再用吸水纸轻轻吸去水分,立刻置于液氮中速冻,-80 ℃保存备用。[JP]
取新鲜幼叶3.0 g,在液氮保护中快速研磨成粉末状,然后按照TRIzol试剂盒(北京康为世纪生物科技有限公司)说明书介绍的方法提取总RNA,用DNaseⅠ去除RNA中的痕量DNA。用1%琼脂糖凝胶检测总RNA的完整性,紫外分光光度计分析其浓度、纯度。
1.2基因全长序列的克隆
测序结果经NCBI网站(http://www.ncbi.nlm.nih.gov)进行BLAST比对和开放阅读框(http://www.ncbi.nlm.nih.gov/gorf/gorf.html)分析,用DNAMAN软件进行同源核苷酸和氨基酸序列多重比对分析,确定克隆序列为[WTBX][STBX]β-CA1[WTBZ][STBZ]。利用在线工具ExPASy Proteomics Server(http://www.expasy.org)预测编码蛋白质的理化性质,用Psipred Server、SWISS-MODEL (http://swissmodel.expasy.org)分别对编码蛋白二级结构进行预测和三级结构建模。用Scan Prosite(http://prosite.expasy.org/scanprosite)在线工具预测FsCA1编码蛋白的motif保守序列,并用Signal P4.0 (http://www.cbs.dtu.dk/services/SignalP)预测蛋白定位信号。用WOLF PSORT (http://wolfpsort.org)对FsCA1进行亚细胞定位,用TMHMM Server v. 2.0软件(http://www.ch.embnet.org/software/TMPRED_form.html)预测跨膜区。用Clustalx、MEGA5.1[JP]构建邻接(Neighbor-Joining)系统发生树。
1.4荞麦不同器官中实时定量PCR分析
在荞麦开花期,选取叶片、主茎和主根作为试验材料,按照“1.2”节的cDNA第1链合成法分别获得叶片、主茎和主根cDNA第1链,将3种器官的cDNA溶液按倍比稀释成相同浓度,再按SYBR premix Ex TaqⅡ试剂盒说明书操作方法,在CFX-96 PCR仪(Bio-Rad)上进行qRT-RCR反应,每个样品至少重复3次。反应体系20 μL,含10 μL 2×PrimeScript buffer,各1 μL 10 μmol上、下游引物,10 ng cDNA模板。PCR反应程序:94 ℃ 30 s;94 ℃ 15 s,退火温度56~95 ℃,每个循环增加0.5 ℃,持续20 s,72 ℃延伸15 s,40个循环。延伸阶段搜集信号,持续0.05 s获得解链温度,采集熔解曲线荧光信号。程序运行结束后,系统自带的CFX管理软件根据设定的参数给出结果。qRT-RCR扩增片段长度均为150 bp。以三磷酸甘油醛脱氢酶基因(GAPDH)为内参基因(表1),以叶片中的表达量为对照。
2结果与分析
[HTK]2.1全长基因的获得[HT]
测序结果表明,目的基因长1 233 bp,是正确的CA基因序列。ORF finder预测发现,该序列具有完整的开放阅读框(ORF),长度为978 bp,编码325个氨基酸残基,详见图1。
2.2编码蛋白的理化性质和高级结构预测
预测FsCA1的分子式为C1 574H2 484N412O470S13,分子量 35.11 ku;正电残基(Arg+Lys)、负电残基(Asp+Glu)分别为34、33个,等电点7.59;不稳定指数为50.78,表明该蛋白不稳定;脂肪系数89.75;亲水性系数0.023。
预测FsCA1蛋白的二级结构主要有4种类型,由9个α-螺旋、6个β-折叠、多个延伸链和无规则卷曲组成。利用SWISS MODEL蛋白质在线建模工具Alignment Model,以荞麦FsCA1为目标序列,以同源性高达82.38%的豌豆CA蛋白三维结构(POB:1ekj.1.B)为模板进行同源建模,建模残基范围116~325个,目标序列和模板蛋白序列相似性达到56%。豌豆CA蛋白为同型八聚体,而FsCA1蛋白三维结构具有丰富的α-螺旋、无规则卷曲,因此推测本研究获得的编码产物也是同型八聚体(图2)。
编码蛋白信号肽、亚细胞定位和跨膜区的预测
Signal P4.0软件预测表明,FsAC1的第1~25位氨基酸残基间有1个信号肽。用WoLF PSORT预测表明,该蛋白在叶绿体的定位系数为12.0(chlo:12),在线粒体的定位系数为2.0 (mito:2.0),在其他细胞器官中无分布。据此判断,[WTBX][STBX]FsAC1[WTBZ][STBZ]编码蛋白最有可能在叶绿体、线粒体内发挥作用,或附着在这些细胞器上共同完成。HMMTOP分析结果显示,第192~214位氨基酸之间有23个氨基酸形成的跨膜区。
编码蛋白的motif分析
β-碳酸酐酶具有2个典型的保守区,保守区H1:C-[SA]-D-S-R-[LIVM]-x-[AP],保守序列L2[EQ]-[JP3][YF]-A-[LIVM]-x(2)-[LIVM]-x(4)-[LIVMF](3)-x-G-H-x(2)-C-G。FsAC1序列完全与此符合,其中保守区H(第156~163位)的保守序列为CSDSRVcP,保守区F(第200~220位)的保守序列为EYAVlhLkvsnIVViGHsaCG。[JP]
2.5不同物种[WTBX][STBX]AC1[WTBZ][STBZ]基因及其编码蛋白的序列同源比对
以[WTBX][STBX]FsAC1[WTBZ][STBZ]基因序列为探针,通过BLASTn同源对比,发现9条与[WTBX][STBX]FsAC1[WTBZ][STBZ]基因相似度较高的序列,分别为大豆(Glycine max)GmCA(XM_003553786.1)、拟南芥(Arabidopsis thaliana)[WTBX][STBX]AtCA1[WTBZ][STBZ](NM_111016.3)、豇豆(Vigna unguiculata)VuCA(JQ429799)、黄百合(Flaveria brownii)FbCA(FBU08402)、绿豆([WTBX][STBX]Vigna radiata)VrCA1[WTBZ][STBZ](AF139464.2)、豌豆(Pisum sativum)PsCA(M63627.1)、线叶黄顶菊(Flaveria linearis)FICA1[JP3](FLU19738)、甘蓝(Brassica oleracea)BoCA1(XM_003553786.1)、[JP]甘蓝型油菜(Brassica napus)BnCA(GQ36780)、鹰嘴豆(Cicer atietinum)CaCA(XM_004489219.1)、煙草(Nicotiana tabacum)NtCA(AF4479.2)、蓖麻(Ricinus communis)RcCA(XM_002524596.1)、亚洲棉(Gossypium arboreum)GaCA(KHG255181)、亚麻荠(Camelina sativa)CaCA1(XP_010496563)、日中花([WTBX][STBX]Mesembryanthemum nodiflorum)MnCA1[WTBZ][STBZ](JN228098.1)、川桑(Morus notabilis)MnCA(XM_010110474)、龙眼(Dimocarpus longan)DlCA(JN033201)、欧洲与美洲山杨杂种(Populus tremula×Populus tremuloides)PtCA(PTU838)、胡杨(Populus euphratica)PeCA2(XM_011049011)、富贵草(Pachysandra terminalis)PtCA(DQ781308.1)、银合欢(Leucaena leucocephala)LICA(KC92476.1)、菠菜(Spinacia)SpCA(J05403.1)和葡萄([WTBX][STBX]Vitis vinifera)VvCA1[WTBZ][STBZ](XM_002277921.3)。利用ClustalX、MEGA5.1软件,构建[WTBX][STBX]FsCA1和其他物种CA1[WTBZ][STBZ]编码蛋白的系统进化树,可见5种豆科植物CA1蛋白序列相似度较高,明显聚为一类,除苋科藜亚科的菠菜、番杏科的日中花[WTBX][STBX]AC1[WTBZ][STBZ]序列有一定相似度外,其他物种均单独成类(图3)。[FL)]
3讨论
碳酸酐酶(CA)普遍存在于绿色植物中,但物种间CA活
性差别很大。本试验对荞麦CA基因进行全长克隆和序列分析,通过生物信息学分析、多物种同源序列比对,初步明确了[WTBX][STBX]FsAC1[WTBZ][STBZ]基因编码蛋白的基本特性、高级结构。亚细胞定位和跨膜区预测发现,FsCA1主要定位于叶绿体中,少量分布于线粒体中;组织特异性表达分析印证了上述结果,表明β-CA主要分布在叶绿体叶肉细胞的基质中[16]。在荞麦绿色组织中的表达丰度显著高于在非绿色组织中,暗示FsCA1可能与光合作用有关。编码蛋白motif预测发现2个保守序列,具有β-CA典型结构特征,进一步证明编码蛋白是β-CA,似乎也支持FsCA1可能在光合作用中发挥功能的推测。这些结果为深入研究[WTBX][STBX]FsAC1[WTBZ][STBZ]基因奠定了基础。
不同物种[WTBX][STBX]AC1[WTBZ][STBZ]基因序列比对结果显示,荞麦与菠菜的同源性(64%)略高于豌豆(61%),远高于日中花(58%)。有趣的是,根据蛋白序列比对生成的进化树却显示,荞麦FsAC1却与MnCA关系最近,其次是菠菜,而与豌豆的进化距离较远。分析蛋白序列发现,荞麦与日中花存在1段完全相同的序列(FMVFACSDSRVCPSHVLDFQPGEAFVVRNIANMVP),与菠菜的片段仅差异1个氨基酸(CEKEAVNVSLGHLLTYPFVRDGLVKKTLALKGGYYDFI),而与豌豆在2段蛋白片段上都有差异,分别相差1、2个氨基酸。这种同源基因保守序列上的差异可能反映物种的亲缘关系,也可能与蛋白官能团有关,但与预测的motif保守序列存在异议,还须进一步论证。根据现有结果推测,荞麦CA可能由上述2个官能团决定功能,FsCA1在功能上可能更接近MnCA。本研究建立[WTBX][STBX]FSCA1[WTBZ][STBZ]编码蛋白的三维结构时,是以已知的同源豌豆CA(POB:1ekj.1.B)为模板的,这可能会带来误差,但是POB数据库现存的模板数量有限,未发现与荞麦CA功能最接近物种的模板,因此,FSCA1三维结构还需进一步完善。
参考文献:
[1]Hewett-Emmett D,Tashian R E. Functional diversity,conservation,and convergence in the evolution of the alpha-,beta-,and gamma-[JP]carbonic anhydrase gene families[J]. Molecular Phylogenetics and Evolution,1996,5(1):50-77.
[2]Tems U,Burnell J N. Characterization and expression of the maize β-carbonic anhydrase gene repeat regions[J]. Plant Physiology and Biochemistry,2010,48(12):945-951.
[3]Deng Q H,Gan L,Fu C H,et al. Comparison of carbonic anhydrase activities of several species in Brassica[J]. Plant Physiol Commun,2009,45(7):663-666.
[4]Moroney J V,Bartlett S G,Samuelsson G. Carbonic anhydrases in plants and algae[J]. Plant Cell and Environment,2001,24(2):141-153.
[5]楊霄,刘再华,曹建华,等. 岩溶区和非岩溶区玉米光合作用与锌含量和碳酸酐酶关系的对比研究[J]. 中国岩溶,2008,27(2):20.
[6]Tsuzuki M,Miyachi S,Edwards G E. Localization of carbonic anhydrase in mesophyll cells of terrestrial C3 plants in relation to CO2 assimilation[J]. Plant Cell Physiol,1985,26:881-891.[HJ1.7mm]
[7]Ivanov B N,Ignatova L K,Romanova A K. Diversityinforms and functions of carbonic anhydrase interrestrial higher plants[J]. Russ J Plant Physiol,2007,54(2):143-162.
[8]Tetu S G,Tanz S K,Vella N,et al. The flaveria bidentis β-carbonic anhydrase gene family encodes cytosolic and chloroplastic isoforms demonstrating distinct organ-specific expression patterns[J]. Plant Physiol,2007,144(3):1316-1327.
[9]陈虎,何新华,罗聪,等. 低温胁迫下龙眼碳酸酐酶基因(CA)的克隆与表达分析[J]. 园艺学报,2012,39(2):243-252.
[10]Fabre N,Reiter I M,Becuwe-Linka N,et al. Characterization and expression analysisof genes encoding α and β-carbonic anhydrases in Arabidopsis[J]. Plant Cell Environ,2007,30(5):617-629.
[11]Coleman J R. Carbonic anhydrase and its role in photosynthesis[J]. Adv Photosyn Respiration,2000,9:353-367.
[12]Wang Y Q,Feechan A,Yun B W,et al. S-nitrosylation of AtSABP3 antagonizes the expression of plant immunity[J]. The Journal of Biological Chemistry,2009,284(4):2131-2137.
[13]Ferreira F J,Guo C,Coleman J R. Reduction of plastid-localized carbonic anhydrase activity results in reduced Arabidopsis seedling survivorship[J]. Plant Physiology,2008,147(2):585-594.
[14]Hu H H,Boisson-Dernier A,Israelsson-Nordstroem M,et al. Carbonic anhydrases are upstream regulators of CO2-controlled stomatal movements in guard cells[J]. Nature Cell Biology,2010,12(1):87-93,S1-S18.
[15]Price G D,von Caemmerer S,Evans J R,et al. Specific reduction of chloroplast carbonic anhydrasea ctivity by antisense RNA in transgenic tobacco plants has a minor effect on photosynthetic CO2 assimilation[J]. Planta,1994,193(3):331-340.
[16]Hoang C V,Chapman K D. Biochemical and molecular inhibition of plastidial carbonic anhydrase reduces the incorporation of acetate into lipids in cotton embryos and tobacco cell suspensions and leaves[J]. Plant Physiology,2002,128(4):1417-1427.
[17]Restrepo S,Myers K L,del Pozo O,et al. Gene profling of acompatible interaction between Phytophthora infestans and Solanum tuberosum suggests a role for carbonic anhydrase[J]. Mol Plant-Microbe Interact,2005,18(9):913-922.
[18]Tomiyoshi M,Yasui Y,Ohsako T,et al. Phylogenetic analysis of AGAMOUS sequences reveals the origin of the diploid and tetraploid forms of self-pollinating wild buckwheat,Fagopyrum homotropicum Ohnishi[J]. Breeding Science,2012,62(3):241-247.