金龙飞 尹欣幸 曹红星
摘 要:生長调控因子(Growth regulating factor,GRF)是植物中重要的转录因子,参与植物生长、发育和逆境胁迫响应等多种生物学过程。本研究从油棕(Elaeis guineensis)基因组中鉴定出15个EgGRF基因家族成员,并对其理化性质、染色体定位、基因结构、保守功能域、进化关系、启动子顺式作用元件、组织表达模式和果肉不同时期表达模式进行分析。结果表明:EgGRF基因家族成员编码的肽链平均为409个氨基酸,分子量为27.62~65.51 kDa,等电点为6.24~9.38,蛋白不稳定指数为47.24~68.37,脂溶指数为47.52~67.69,总平均亲水性为–0.945~–0.400。EgGRF基因家族成员含有3~5个外显子,均含有特征结构域QLQ(Gln、Leu、Gln)和WRC(Trp、Arg、Cys),基于系统进化关系将EgGRF家族分为5个亚族,油棕EgGRF的亲缘性与拟南芥较近。启动子上鉴定出大量植物激素响应、逆境胁迫响应、光响应和分生组织特异表达顺式作用元件。不同组织的转录组数据分析结果表明,EgGRF基因家族在茎尖和花中表达量较高,8个EgGRF在果肉的不同时期特异表达。本研究为进一步探索EgGRF调控油棕生长发育过程的机制奠定基础。
中图分类号:S565.9 文献标识码:A
Genome-wide Identification and Expression of EgGRF Gene Family in Oil Palm
JIN Longfei, YIN Xinxing, CAO Hongxing*
Coconut Research Institute, Chinese Academy of Tropical Agricultural Sciences / Hainan Key Laboratory of Tropical Oil Crops Biology, Wenchang, Hainan 571339, China
Abstract: Growth regulating factor (GRF) is an important transcriptional factor in plants which is involved in various biological processes, including regulating plant growth, development, and stress response. In this study, 15 EgGRF transcription factor family members were identified from the oil palm genome using bioinformatics methods, and the physicochemical properties, chromosomal location, gene structure, conserved functional domains, evolutionary relationships, promoter cis-acting elements, tissue expression patterns and mesocarp expression patterns at different stages were analyzed. The results showed that the EgGRF family members encoded an average of 409 aa in the peptide. The molecular weight was between 27.62 and 65.51 kDa, the isoelectric point was between 6.24 and 9.38, the instability index was between 47.24 and 68.37, the aliphatic index was between 47.52 and 67.69, and the gravy was between –0.945 and –0.400. Each EgGRF members contained 3-5 exons, and contained QLQ (Gln, Leu, Gln) and WRC (Trp, Arg, Cys) domain. EgGRF family was divided into 5 groups based on phylogenetic relationships, and was closely related to the Arabidopsis. Analysis of transcriptome data from different tissues showed that the EgGRF family was significantly high expressed in the shoot and flower. Eight EgGRFs were specifically expressed in different stages of mesocarp. The results would provide useful information and resource for the further investigation of EgGRF on oil palm growth and development.
Keywords: EgGRF; oil palm; bioinformatics; gene expression
DOI: 10.3969/j.issn.1000-2561.2021.07.002
转录因子是一类重要的调控基因,参与植物生长、发育、代谢、繁殖、分化、逆境響应等多种生物学过程[1-3]。目前在植物中已经发现了60多个转录因子家族,其中生长调控因子(Growth regulating factor,GRF)主要在植物生长发育中起重要的调控作用[4-5]。GRF转录因子的N端有2个保守结构域,分别是QLQ(Gln、Leu、Gln)和WRC(Trp、Arg、Cys)保守结构域[6]。QLQ结构域可通过与GRF互作因子(GRF-interacting factor1,GIF1)结合,形成转录共激活因子,激活下游的靶基因表达;WRC结构域包含一个核定位信号NLS区域和一个与DNA结合的锌指基序,均与GRF转录因子生物学功能密切相关[7]。植物中第一个编码GRF转录因子的基因OsGRF1是在水稻中发现的,该基因通过调控赤霉素代谢诱导茎伸长[8]。OsGRF4通过调控2个细胞分裂素脱氢酶前体基因(OsCKX5和OsCKX1)的表达,增加细胞分裂素的含量,进而促进稻穗的伸长[9]。拟南芥AtGRF5通过调控细胞增殖,刺激叶绿体分裂,增加叶绿素含量,促进叶片生长[10]。AtGRF1、AtGRF4、AtGRF8、AtGRF9通过调控PTL基因控
油棕(Elaeis guineensis)是世界上产油效率最高的油料作物,油量高达4.27 t/hm2,是花生的7~8倍、大豆的9~10倍[22]。油棕果压榨的棕榈油,广泛应用于食品加工、日用化工、机械润滑和生物柴油等领域[23]。近年来市场对棕榈油的需求逐年增加,油棕种植业的快速发展毁坏了大量的热带雨林。因此,提高油棕单产是维持热带雨林保护和食用油短缺平衡的重要途径,而挖掘控制油棕重要农艺性状的关键基因并采用分子育种加快高产油棕品种的选育是油棕育种研究的重要工
1 材料与方法
1.1 油棕EgGRF基因家族的挖掘与鉴定
油棕全基因组数据从NCBI数据库(https://www.ncbi.nlm.nih.gov/ ID:2669)中下载,拟南芥AtGRF蛋白质序列从TAIR数据库(https://www.arabidopsis.org/)中下载,水稻OsGRF蛋白序列从NCBI数据库中下载。以AtGRF和OsGRF蛋白质序列作为参考序列,通过Blsatp在油棕基因组数据库中进行比对。将获得的蛋白序列提交到NCBI的保守结构域数据库,利用Batch Web CD-search Tool软件[25]进行保守结构域分析。利用在线工具ExPAsy(http://www.expasy.org)分析油棕EgGRF基因家族的蛋白质分子量、等电点、蛋白不稳定指数、脂溶指数和总平均亲水性等理化性质。
1.2 油棕EgGRF基因家族的基因结构、保守结构域、染色体定位及进化分析
油棕EgGRF基因家族的基因结构、保守结构域和染色体定位均采用Tbtool软件[26]进行可视化分析。采用ClustalW软件[27]对油棕、拟南芥和水稻的GRF蛋白质序列进行多重比对,采用MEGA 6.0软件的Neighbor-joining法进行建树,分析进化关系,设置校验值Bootstrap为1000。
1.3 油棕EgGRF基因家族的启动子顺式作用元件分析
从NCBI数据库中下载油棕EgGRF基因CDS上游2000 bp的序列。利用Plant Care软件[28]进行顺式作用元件分析,采用Tbtool软件进行可视化分析[26]。
1. 4 油棕EgGRF基因家族的表达分析
2 结果与分析
2.1 油棕EgGRF基因家族的全基因组鉴定和理化性质分析
通过Blastp比对分析获得油棕EgGRF的候选蛋白质序列,预测保守结构域,去除不含QLQ和WRC保守结构域的序列,共获得15个EgGRF家族成员。根据其与拟南芥的同源性顺序进行命名,依次命名为EgGRF1~EgGRF15。油棕EgGRF多肽链氨基酸数目为260~611,平均为409;蛋白质分子量为27.62~65.51 kDa,平均为44.71 kDa;等电点为6.24~9.38,平均为7.86;蛋白不稳定指数为47.24~68.37,平均为59.48,表明EgGRF家族成员编码的均为不稳定蛋白;脂溶系数为47.52~67.69,平均为59.23,脂溶性一般;总平均亲水性为–0.945~–0.400,平均为–0.633,都为负值,表明EgGRF均为亲水性蛋白(表1)。
2.2 油棕EgGRF基因家族成员在染色体上的定位
对油棕EgGRF基因家族在染色体上位置进行分析(图1),发现15个EgGRF基因家族成员分布 在7条染色体和5个Scaffolds上。EgGRF10在Chr3上,EgGRF2、EgGRF7在Chr4上,EgGRF5在Chr10上,EgGRF4在Chr11上,EgGRF9、EgGRF11在Chr13上,EgGRF6、EgGRF12在Chr15上,EgGRF14在Chr16,EgGRF1、EgGRF3、EgGRF8、EgGRF13、EgGRF15分別在5个Scaffolds上。EgGRF4和EgGRF7,EgGRF6和EgGRF9存在基因共线性现象。
2.3 油棕EgGRF的基因结构、保守结构域和进化关系
2.4 油棕EgGRF基因家族的启动子顺式作用元件的鉴定
2.5 油棕EgGRF基因家族的表达分析
3 讨论
究的不断深入,大量植物完成了全基因组测序,这为植物基因家族的挖掘、鉴定和功能分析提供了有利条件。GRF转录因子是植物中特有的一类转录因子,在叶片生长、子叶生长、茎伸长、花发育、籽粒发育、胚胎发生等生长发育过程中起重要的调控作用[5, 8, 11, 14]。油棕作为世界上产油效率最高的油料作物,其GRF基因家族的研究尚未见报道,而在拟南芥和水稻等模式植物中研究较为深入,这些研究给油棕EgGRF的研究提供参考。
