毛竹捕光色素结合蛋白基因结构及表达模式分析
2015-10-19李利超孙化雨娄永峰赵韩生高志民
李利超 孙化雨 娄永峰 赵韩生 高志民
(国际竹藤中心 国家林业局竹藤科学与技术重点实验室 北京 100102)
毛竹捕光色素结合蛋白基因结构及表达模式分析
李利超孙化雨娄永峰赵韩生高志民
(国际竹藤中心国家林业局竹藤科学与技术重点实验室北京100102)
植物通过光合作用将光能转换为化学能,捕光色素结合(LHC)蛋白与色素形成的复合体在捕获、传递和转化光能过程中发挥着重要作用,因此研究毛竹(Phyllostachys edulis)LHC基因结构及表达模式对于揭示其在毛竹光合作用中的功能具有重要意义。采用生物信息学的方法,对毛竹基因组中的LHC基因进行了系统分析。结果表明,在毛竹中共有29个LHC基因同源序列,其包含的内含子数量为0~5个。序列分析表明,29个LHC基因编码的蛋白分别属于光系统Ⅰ和光系统Ⅱ的捕光色素结合蛋白家族LHCⅠ和LHCⅡ。LHCⅠ包含5个亚家族(Lhca 1—Lhca 5),除了Lhca 4含有3个成员外其他亚家族只有1个成员;而LHCⅡ包含6个亚族(Lhcb 1—Lhcb 6),每个亚家族的成员不同,其中Lhcb 1的成员最多为7个。亲疏水性预测表明,不同亚家族成员存在着一定差异。蛋白结构预测发现,29个蛋白均包含导肽和成熟蛋白,具有跨膜结构域,均包含色素结合位点;其中12个蛋白的组成以α-螺旋为主,17个蛋白的组成以随机卷曲为主。基因表达谱分析表明,大多数LHC基因主要在叶片和花序中表达,笋中略有表达,而根和鞭中几乎检测不到表达。研究结果为进一步研究毛竹LHC基因的功能奠定了基础。
毛竹;LHC基因;结构;表达模式
光合作用是生命赖以生存的基础,植物利用类囊体膜上的捕光色素结合(LHC)蛋白复合体接收太阳能并最终同化CO2[1],LHC蛋白在光能的捕获、传递、转化等方面发挥着重要作用[2]。LHC是一类在光保护机制中起着关键作用的跨膜蛋白,含3个跨膜螺旋以及结合叶绿素a、叶绿素b、叶黄素的位点,依据蛋白参与活动所属光系统Ⅰ(PSⅠ)和光系统Ⅱ(PSⅡ)将其分为2个亚类:LHCⅠ和LHCⅡ[3]。近年来对LHC的研究十分活跃,并取得了很大进展,如已经对模式植物拟南芥(Arabidopsis thaliana)、水稻(Oryza sativa)和杨树(Populus trichocarpa)中的LHC基因进行了系统鉴定等[4-6]。
由于竹子速生且用途广泛,对其研究和开发利用一直倍受关注。光合作用是竹子有机物质快速积累的源泉,对其研究已涉及生理、生化以及分子生物学等方面,并取得了一定的研究进展。在光合生理方面,毛竹(Phyllostachys edulis)叶片净光合速率与光照强度、气温、纬度的关系[7-8],雷竹(Ph. violascens)、绿竹(Bambusa oldhamii)的光合日变化规律等均有报道[9]。多个光合作用相关基因已被克隆,包括绿竹cab-BO1、BoLhca4-1以及毛竹中cab-PhE1等[10-12],不同基因的比较分析包括毛竹、红壳竹(Ph.iridescens)和角竹(Ph.fimbriligula)中的Lhca基因以及毛竹中的Lhcb基因的分子特征[13-15],有关蛋白结构与色素组成已有毛竹Lhcb重组单体和三体的结构与功能分析[16],但尚缺乏对竹类植物LHC的全基因组分析。
随着测序技术的飞速发展以及生物信息学方法的日渐成熟,毛竹基因组草图和竹子基因组数据库先后相继完成[17-18],使得在全基因组水平上对毛竹中编码重要功能的基因进行预测和分析成为可能。本研究以毛竹为研究对象,通过生物信息学的方法对毛竹捕光色素结合蛋白基因的结构及表达模式进行了深入分析,以期为从分子育种角度对毛竹捕光色素结合蛋白基因功能的开发与利用提供参考。
1 材料与方法
1.1材料
从毛竹基因组数据库(http://www.bamboogdb. org/)中下载毛竹捕光色素结合蛋白基因序列和对应的基因组序列,利用本实验室前期获得的转录组数据进行表达谱分析;拟南芥、水稻捕光色素结合蛋白基因序列下载于Phytozome v10.3(http://phytozome.jgi.doe.gov/pz/portal.html)。
1.2方法
1.2.1毛竹捕光色素结合蛋白基因的获取与进化分析
从毛竹基因组数据库(http://www.bamboogdb. org/)下载毛竹捕光色素结合蛋白基因序列,利用MEGA 6.0软件内置程序Clustal W对毛竹、拟南芥和水稻捕光色素结合蛋白基因及其编码的氨基酸序列进行比对分析。根据序列比对结果,用MEGA 6.0邻接法(Neighbor-Joining)构建基于捕光色素结合蛋白氨基酸序列的系统发育进化树,Bootstrap值设为5 000,其他参数均使用系统默认值。依据聚类关系,参考拟南芥中的捕光色素结合蛋白基因命名[19],对毛竹捕光色素结合蛋白基因进行系统命名。
1.2.2毛竹捕光色素结合蛋白基因及蛋白结构分析
用在线软件Gene Structure Display Server 2.0(http://gsds.cbi.pku.edu.cn/)分析基因结构[20];用ProtParam(http://web.expasy.org/protparam/)分析蛋白理化特性[21];用在线软件ChloroP 1.1 Prediction Server(http://www.cbs.dtu.dk/services/ChloroP/)预测基因编码的导肽[22];使用在线软件SPOMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)预测蛋白二级结构[23];用Phyre 2(http://www.sbg.bio.ic. ac.uk/phyre2/html/page.cgi?id=index)来预测蛋白质三级结构[24]。
1.2.3毛竹捕光色素结合蛋白基因表达组织特异分析
利用毛竹转录组数据,从NCBI的Short ReadArchive(SRA)数据库中下载毛竹7个不同组织(叶、鞭、早花期花序、晚花期花序、根、20 cm笋和50 cm笋)的转录组数据,基因的表达丰度用RPKM表示,每个表达值取以2为底数的对数(Log2),并用Matrix2png(http://www.chibi.ubc. ca/matrix2png/bin/matrix2png.cgi)绘制基因表达图谱。7个组织中表达量最高的用红色方框表示,其次有表达的用绿色方框表示,灰色框则表示不表达。
2 结果与分析
2.1毛竹捕光色素结合蛋白鉴定与进化分析
通过同源基因比对分析,从毛竹基因组数据库中鉴定出29个捕光色素结合蛋白基因的同源序列,数量高于模式植物水稻(17个)和拟南芥(23个)[19]。进一步分析表明,毛竹29个捕光色素结合蛋白基因分别属于LHCⅠ的5个亚家族及LHCⅡ的6个亚家族,其中LHCⅠ的5个亚家族Lhca1—Lhca5中除了Lhca4含有3个成员外都只含有一个成员,而LHCⅡ的6个亚家族Lhcb1—Lhcb6的成员数量差异较大,其中Lhcb1亚家族成员最多为7个,Lhcb2—Lhcb6亚家族成员依次为3、2、2、3和4个(图1)。
利用拟南芥、水稻和毛竹捕光色素结合蛋白基因编码的氨基酸序列构建系统进化树,结果分析表明,毛竹捕光色素结合蛋白基因编码的蛋白进化上与拟南芥的相一致,Lhca1与LHCⅡ的关系更加相近,而Lhcb6与LHCⅠ的关系更加相近,Lhca2与其他LHCⅠ成员关系较远,而在水稻中Lhca2也只有一个成员,这表明在该亚家族成员进化过程中最可能是以单拷贝的形式存在[25]。已有研究表明,Lhcb4和Lhcb6编码的蛋白在体内主要以单体的形式存在[3]。将毛竹29个捕光色素结合蛋白基因依次命名(表1)。
图1 基于毛竹、拟南芥和水稻捕光色素结合蛋白序列构建的系统进化树
2.2毛竹捕光色素结合蛋白基因结构分析
对基因结构分析表明,毛竹LHC基因中内含子个数为0~5个不等,但处于同一亚家族成员的外显子和内含子数量分布相对保守(图2)。其中,Lhcb1和Lhcb6亚家族基因成员的内含子个数为0个或1个,Lhca5亚家族基因成员内含子个数为5个,Lhca4亚家族基因成员的内含子个数都是2个,Lhcb4亚家族基因成员内含子个数都是1个,内含子完全符合GT-AG剪接原则[26]。此外,Lhcb1亚家族中3个成员和Lhcb6亚家族中的2个成员仅含有1个外显子而没有内含子。基因结构上的差异,意味着其在毛竹生长发育过程中具有不同的功能。
表1 毛竹中LHC基因
2.3毛竹捕光色素结合蛋白基本理化性质分析
对毛竹LHC蛋白的基本理化性质进行了分析(表1),结果表明,毛竹LHC蛋白长度存在一定差异,其中LHCⅠ家族成员较为保守(244-271 aa),分子量为26.7~29.5 kDa,PeLhca3.1编码氨基酸残基数目最大为244个,分子量值为29.5 kDa,PeLhca4.3编码最小244个氨基酸残基,氨基酸分子量为26.7 kDa;理论等电点pI值为5.65~7.87,除PeL-hca3.1和PeLhca4.4外,其余成员等电点都在酸性范围内,表明蛋白质分子中富含酸性氨基酸;蛋白亲疏水值范围为-0.125~0.058;除Lhca5亚家族成员外,其他4个亚家族成员均为亲水性蛋白(蛋白亲疏水值<0);导肽预测结果显示,其导肽大小为37~56个氨基酸残基,成熟蛋白大小为207~15个氨基酸残基。
图2 毛竹LHC基因结构
LHCⅡ各亚家族成员编码蛋白差异较大,达到106~373个氨基酸残基,分子量值为11.8~39.6 kDa,其中PeLhcb5.1分子量值最大为39.6 kDa,PeLhcb6.3分子量值最小为11.8 kDa;理论等电点pI值为4.78~9.21,但大部分成员氨基酸等电点都在酸性范围内,表明蛋白质分子中富含酸性氨基酸;蛋白亲疏水值为-0.488~0.463,其中亲水性蛋白约占38.1%;导肽预测结果显示,除PeLhcb2.3和PeLhcb5.1预测不准确外,其导肽大小为14~50个氨基酸残基,成熟蛋白大小为92~323个氨基酸残基。
2.4毛竹捕光色素结合蛋白结构分析
蛋白质二级结构是指它的多肽链中有规则重复的构象,限于主链原子的局部空间排列,通过骨架上的羰基和酰胺基团之间形成的氢键维持的稳定结构,主要包括α-螺旋和β-折叠等[27]。对29条毛竹LHC氨基酸序列二级结构进行预测,结果显示有12条以α-螺旋为主要组成部分,所占比例范围为35.47%~49.57%,17条以随机卷曲为主要组成部分,所占比例为35.09%~48.37%。此外,β-转角(7.32%~14.15%)则散布于蛋白质序列中。由于毛竹LHC各亚家族内成员的三级结构非常相似,因此在每个亚族中选取1个有代表性的成员进行三级结构预测。结果显示,11个亚家族蛋白质PeLhca1.1、PeLhca2.1、PeLhca4.1、PeLhcb1.3、PeLhcb2.1、PeLhcb3.1和PeLhcb6.2都有5个α-螺旋;PeLhca3.1和PeLhca5.1的α-螺旋是7个;PeLhcb5.2的α-螺旋是6个(图3)。蛋白质的三级结构是由α-螺旋、β-折叠和随机卷曲等共同组成,虽然部分毛竹LHC蛋白α-螺旋个数一样,但由于29条毛竹LHC蛋白中随机卷曲均占很大比例,且它们的长度都不相同,可能会造成蛋白质空间结构有所不同,进而决定了其功能上的差异。
图3 毛竹11个代表性LHC蛋白三级结构
2.5毛竹捕光色素结合蛋白基因表达模式分析
根据毛竹不同组织的表达谱数据,对毛竹LHC基因的组织表达模式进行分析。结果显示,除PeLhcb2.3仅在叶和早花期花序中表达且表达峰度很低外,毛竹LHC基因在叶、早花期花序和晚花期花序中表达量均很高,在根、鞭、20 cm和50 cm高的笋中表达量均很低,尤其是在鞭中,大部分LHC基因表达量极低甚至不表达(图4),这与LHC基因由核基因编码,在类囊体膜上结合不同色素或结合其他天线蛋白来行使其生物学功能的特性相符合[28]。在毛竹中找到的2个Lhcb4基因PeLhcb4.1和PeLhcb4.2,其表达量较高且相似,这与拟南芥中发现的3个Lhcb4基因,其中2个表达量很高且表达量相类似,而另外一个表达量则很低[3]。
3 讨论
光合作用一直是生命科学研究中的热点之一,尤其是以绿色经济为社会发展主题的今天,植物光合作用的研究倍受关注。人们除了从形态、生理角度来开展研究外,已经深入到分子、蛋白水平,并与生理、生化研究紧密结合起来,正在从微观结构来揭示光合作用的分子机制。研究显示所有结合叶绿素a/b的生物体都有LHCⅡ同系物,其蛋白均具有一个三聚体结构(WYGDR motif)[29]。Kargul等模仿了衣藻中LHC-PSⅠ超复合体的结构,并预测有11个LHCⅠ蛋白呈月牙形排在每个PSⅠ复合体一侧[30]。通过对豌豆(Pisum sativum)的超级膜蛋白PSⅠ-LHCⅠ(600 kDa)的晶体结构研究,分辨率达2.8埃,揭示出蛋白复合体的结构,尤其是LHCⅠ内色素和其他协同因子的排列方式,以及PSⅠ核心与LHCⅠ的相互作用[31]。对竹类植物PSⅠ和PSⅡ结构与功能的研究刚刚起步,更缺乏生理、生化、分子与结构之间的有机结合。
图4 毛竹LHC基因在7个组织中的表达分析
高等植物通过2大色素——蛋白复合体PSⅠ和PSⅡ来实现太阳能转变为化学能,遗传物质是决定其光合作用过程的内在基础,基因结构决定着其蛋白结构,而蛋白一级结构又是决定了蛋白质的空间结构[32]。对竹类植物PSⅠ和PSⅡ中重要组分LHC结构与功能的认知将是从分子水平全面认识其光合作用的基础。因此,本研究充分利用毛竹基因组、转录组数据,借助利用生物信息学方法,对毛竹基因组中的捕光色素蛋白基因家族进行了系统鉴定,明确了该基因家族29个成员的类别、结构、进化以及表达特性等基本信息,对于深入了解毛竹类捕获、传递、转化光能的过程,及其在维持类囊体膜的结构、调节激发能在PSⅠ和PSⅡ之间分配中的作用具有重要价值。基于转录组数据构建的表达谱尚存在一定的不确定性,如PeLhcb2.3在叶片中竟然没有检测到表达,因此毛竹LHC基因的表达尚需要通过实验进一步验证。
[1]石兰馨,张晓平,梁厚果.捕光叶绿素a/b结合蛋白和cab基因[J].植物生理通讯,1995,31(6):470-476.
[2]孙钦秒,冷静,李良璧,等.高等植物光系统Ⅱ捕光色素蛋白复合体结构与功能研究的新进展[J].植物学通报,2000,17(4):289-301.
[3]Jansson S.A guide to the Lhc genes and their relatives in Arabidopsis[J].Trends Plant sci,1999,4(6):236 -240.
[4]Chan A P,Crabtree J,Zhao Q,et al.Draft genome sequence of the oilseed species Ricinus communis[J].NatBiotechnol,2010,28(9):951-956.
[5]Sato S,Hirakawa H,Isobe S,et al.Sequence analysis of the genome of an oil-bearing tree,Jatropha curcas L.[J]. DNA Res,2011,18(1):65-76.
[6]Prochnik S,Marri P R,Desany B,et al.The Cassava genome:Current progress,future directions[J].Trop Plant Biol,2012,5(1):88-94.
[7]陈存及,邱尔发,梁一池,等.毛竹不同种源光合特性研究[J].林业科学,2000,37(6):15-19.
[8]黄承才,葛滢,常杰.中亚热带东部毛竹叶片光合及呼吸的研究[J].浙江林业科技,2000,15(4):14-16.
[9]黄勇.绿竹种源的光合特性研究[J].福建林业科技,2003,30(3):50-53.
[10]高志民,李雪平,彭镇华,等.竹子捕光叶绿素a/b结合蛋白基因全长的克隆和序列分析[J].林业科学,2007,43(3):34-38.
[11]高志民,刘成,刘颖丽,等.毛竹捕光叶绿素a/b结合蛋白基因cab-PhE1的克隆与表达分析[J].林业科学,2009,45(3):145-149.
[12]李雪平,彭镇华,高志民,等.绿竹光系统I竹子捕光叶绿素a/b结合蛋白基因的cDNA全长的克隆及分析[J].安徽农业大学学报,2010,37(4):643-648.
[13]唐文莉,彭镇华,高健.毛竹光系统I基因LhcaPe02全长的克隆与分析[J].安徽农业大学学报,2008,35(2):153-158.
[14]唐文莉,彭镇华,高健.刚竹属3种重要散生竹光系统I(PSI)的克隆、序列分析和蛋白结构预测[J].北京林业大学学报,2008,30(4):109-115.
[15]高志民,刘颖丽,彭镇华.毛竹PSⅡ大量捕光天线蛋白基因克隆及表达分析[J].植物科学学报,2012,32(1):64-71.
[16]Jiang Z H,Peng Z H,Gao Z M,et al.Characterization of different isoforms of the light-harvesting chlorophyll a/b complexes of photosystem II in bamboo[J].Photosynthetica,2012,50(1):129.
[17]Peng Z H,Lu Y,Li L B,et al.The draft genome of the fast growing non-timber forest species moso bamboo(Phyllostachys heterocycla)[J].Nat Genet,2013,45(4):456 -461.
[18]Zhao H S,Peng Z H,Fei B H,et al.BambooGDB:a bamboo genome database with functional annotation and an analysis platform[J].Database,2014:bau006.
[19]Umate P.Genome-wide analysis of the family of light-harvesting chlorophyll a/b-binding proteins in Arabidopsis and rice[J].Plant Signal Behav,2010,5(12):1537-1542.
[20]Hu B,Jin J,Guo A Y,et al.GSDS 2.0:an upgraded gene feature visualization server[J].Bioinformatics,2015,31(8):1296-1297.
[21]Gasteiger E,Gattiker A,Hoogland C,et al.ExPASy:the proteomics server for in-depth protein knowledge and analysis[J].Nucleic Acids Res,2003,31(13):3784-3788.
[22]Emanuelsson O,Nielsen H,von Heijne G.Chloro P,a neural network-based method for predicting chloroplast transit peptides and their cleavage sites[J].Protein Sci,1999,8(5):978-984.
[23]Geourjon C,Deléage G.SOPMA:significant improvement in protein secondary structure prediction by consensus prediction from multiple alignments[J].Comput Appl Biosci,1995,11(6):681-684.
[24]Kelley L A,Sternberg M J.Protein structure prediction on the Web:a case study using the Phyre server[J].Nat Protoc,2009,4(3):363-371.
[25]邹智,杨礼福,安锋,等.4种大戟科植物Lhca基因家族的全基因组鉴定、分类和进化分析[J].中南林业科技大学学报,2014,34(10):57-60.
[26]Moore M J,Query C C,Sharp P A.Splicing of precursors to mRNA by the spliceosome[M].Cold Spring Harbor:Cold Spring Harbor laboratory Press,1993:303-357.
[27]张春华,上官凌飞,俞明亮,等.桃NAC基因家族生物信息学分析[J].江苏农业学报,2012,28(2):406 -414.
[28]Redlinger T,Gantt E.Phycobilisome structure of Porphyridium cruentum:POLYPEPTIDE COMPOSITION[J]. Plant Physiol,1981,68(6):1375-1379.
[29]Hobe S,Förster R,Klingler J,et al.N-proximal sequence motif in light-harvesting chlorophyll a/b-binding protein is essential for the trimerization of light-harvesting chlorophyll a/b complex[J].Biochemistry,1995,34(32):10224 -10228.
[30]Kargul J,Nield J,Barber J.Three-dimensional reconstruction of a light-harvesting complex I-photosystem I(LHCIPSI)supercomplex from the green alga Chlamydomonas reinhardtⅡ.Insights into light harvesting for PSI[J].J Biol Chem,2003,278(18):16135-16141.
[31]Qin X,Suga M,Kuang T,et al.Photosynthesis.Structural basis for energy transfer pathways in the plant PSI-LHCI supercomplex[J].Science,2015,348(6238):989-995.
[32]王艳春.基于GEP和ANN的蛋白质二级结构预测方法研究[D].西安:西北农林科技大学,2009.
Structure and Expression Analysis of Light-harvesting Chlorophyll a/b Binding Protein Genes in Moso Bamboo(Phyllostachys edulis)
Li LichaoSun HuayuLou YongfengZhao HanshengGao Zhimin
(International Center for Bamboo and Rattan,Key Laboratoryof State Forestry Administration on the Science and Technology of Bamboo and Rattan,Beijing 100102,China)
Plants convert the solar energy into chemical energy through photosynthesis,and the light-harvesting chlorophyll a/b binding(LHC)protein plays a crucial role in the process of energy capture,transfer and conversion.Therefore,the study on the structure and expression pattern of LHC genes is of great significance to reveal their functions in photosynthesis of moso bamboo(Phyllostachys edulis).A genome-wide analysis of LHC genes in moso bamboo was carried out using bioinformatics methods.The results showed that there were 29 LHC homologous genes in moso bamboo,of which the intron numbers ranged from 0 to 5.On the basis of sequence analysis,the proteins encoded by 29 LHC genes belonged to LHCⅠin PSⅠand LHCⅡin PSⅡrespectively.LHCⅠcontained 5 subfamilies(Lhca1-Lhca5),each of which only had one member except Lhca 4 with 3 members,while LHCⅡcontained 6 subfamilies(Lhcb1-Lhcb6)which have a varied range of members each,among which Lhcb1 subfamily had a maximum of seven members.Hydrophilic and hydrophobic prediction demonstrated that there was a certain difference in the members of different subfamilies.The results of protein structure prediction showed that all the 29 proteins encoded by LHC genes was composed of transit peptide and mature protein,which contained transmembrane structure and pigment binding sites.There were 12 proteins predicted with priority of alpha helix and 17 proteins with priority of random curl.The analysis of gene expression profile suggested that most of LHC genes mainly express in leaves and panicles,and few in shoot,but almost undetectable in rhizome and root.Overall,these results laid a significant foundation for further study on the LHC gene function in moso bamboo.
Moso bamboo,LHC gene,gene structure,expression pattern
10.13640/j.cnki.wbr.2015.06.001
国家自然科学基金“竹子叶黄素循环分子调节机制研究”(编号:31370588);林业公益性行业科研专项“毛竹核心种质重测序及竹壁发育关键基因研究”(编号:201504106)。
李利超,在读硕士生,从事竹子分子育种研究。E-mail:lilicao1991@126.com。
高志民,男,研究员,博士生导师,研究方向为竹藤生长发育的分子基础。E-mail:gaozhimin@icbr.ac.cn。