APP下载

甜瓜GRAS家族全基因组的鉴定与表达分析

2023-07-10郑玲闫晓曼

江苏农业科学 2023年11期
关键词:生物信息学甜瓜

郑玲 闫晓曼

摘要:为了研究甜瓜(Cucumis melo L.)GRAS基因家族的结构特征、进化模式和生长发育过程中的表达模式,对甜瓜GRAS全基因组的基本信息、染色体位置、共线性、系统发育树、基因结构、表达模式、顺式元件进行了全面分析。结果表明,从甜瓜中鉴定出37个GRAS基因;这些基因在甜瓜的11条染色体上呈不均匀分布,并在6、7、8号染色体上出现串联重复;甜瓜GRAS家族可分为HAM、LS、SCR、SCL3、DELLA、LISCL、SHR、PAT1 8个亚族;基因结构分析显示,含有1~3个内含子的基因有8个,没有内含子的基因有29个;启动子分析,鉴定到生长素、脱落酸、赤霉素、低温、干旱、光信号响应作用元件以及参与分生组织和胚乳表达的元件;表达模式分析结果表明,HAM、DELLA亚族的基因几乎在所有组织中都有表达,LS亚族在根和茎中表达含量较高,PAT1亚族在甜瓜的整个生长发育过程中发挥着重要作用。得出结论,甜瓜全基因组共获得GRAS基因 37 个,共可分为8个亚族,不同的亚族具有不同的基因结构、蛋白质结构和表达模式;不同亚族在甜瓜生长发育的不同阶段具有差异性表达,它们共同参与调控甜瓜的发育过程。

关键词:甜瓜;GRAS家族;生物信息学;表达模式

中图分类号:S652.01文献标志码:A文章编号:1002-1302(2023)11-0053-07

GRAS转录因子可以调控基因的转录[1],其名称来自GAI、RGA、SCR[2]。GRAS蛋白由400~770个氨基酸残基组成[3-4],C端区域可以分为5个基序:LHRI、LHRII、VHIID、PFYRE、SAW,其中VHIID是GRAS蛋白的核心结构,含有非常保守的P-N-H-D-Q-L单位,以L-R-I-T-G结尾[5]。富亮氨酸基序LHRI、LHRII分列于VHIID的两侧,PFYRE基序由3对蛋白序列特征P、FY、RE组成,R-E、W-G、W-W这3个保守氨基酸组成SAW基序[6]。GRAS转录因子的氨基末端序列差异较大,决定了GRAS蛋白在植物体中可以发挥不同的作用[7]。

近年来的研究表明,拟南芥有34个GRAS基因[8],水稻有57个[9]、番茄有53个[10]、杨树有106个[11]、大白菜有48个[12]、葡萄有43个[13]、无油樟有34个[14]、苹果有127个[15]。GRAS转录因子在信号转导、根径向伸长、腋生枝分生组织、植物的应激反应过程中发挥着关键作用[13,16]。

甜瓜(Cucumis melo L.)又称香瓜,在我国广泛种植,具有药用价值和食用价值。甜瓜基因组数据在2012年已公布,但对甜瓜GRAS(CmGRAS)家族全基因组的研究还少之又少[17]。本研究对甜瓜GRAS转录因子家族在基本信息、染色体定位、共线性、基因结构、表达模式、顺式元件和系统进化树方面进行分析,旨在为研究甜瓜GRAS家族基因的功能提供重要参考。

1材料与方法

1.1甜瓜GRAS家族的鉴定

本试验的研究对象是甜瓜GRAS家族。于2021年3月到6月在洛阳师范学院生命科学学院生物信息学实验室(214)电脑上进行软件操作和信息处理。在PlantTFDB数据库(http://planttfdb.gao-lab.org/)和葫芦科数据库(http://cucurbitgenomics.org/)分别获得甜瓜GRAS家族的信息,将两者比对并删除重复序列,确定候选基因。利用InterPro(http://www.ebi.ac.uk/interpro/)在线验证候选基因,最终确定甜瓜GRAS家族成员。使用ExPASy(http//www.expasy.org/)网站获取甜瓜GRAS蛋白的等电点(PI)、长度、分子量等理化性质信息。利用Plant-PLo进行亚细胞定位。

1.2甜瓜GRAS家族基因在染色体上的分布

在Melonet DB网站(https://melonet-db.dna.affrc.g-o.jp/ap/top)获取甜瓜家族基因的染色体信息,制成模板,用MapInspect软件制图。

1.3甜瓜GRAS家族系统树的构建

利用 MEGA6.0软件里提供的 Clustal W 工具对拟南芥、甜瓜GRAS氨基酸序列进行多序列比对,然后采用邻接法构建系统进化树。

1.4甜瓜GRAS转录因子家族的共线性分析

在甜瓜数据库中下载甜瓜GRAS家族的蛋白质序列,在TBtools上做比对,再和甜瓜的GRAS基因文件进行比对,通过TBtools软件进行共线性分析。

1.5甜瓜GRAS家族的基因结构和保守基序分析

从甜瓜数据库获得甜瓜GRAS家族的CDS序列和GENE序列,通過GSDS 2.0网站(http://gsds.gao-lab.org/index.php)制图。利用MEME网站(http://meme-suite.org/tools/meme)对CmGRAS的保守基序进行分析。

1.6甜瓜GRAS家族的启动子分析

从甜瓜数据库(CuGenDB)中下载GRAS家族基因的启动子序列,通过PlantCARE网站(http://bioinformatics.psb.ugent.be/webtool-s/plantcare/html/)对其进行预测,得到制作甜瓜GRAS家族启动子的相关信息,手动操作去除重复值。在GSDS 20网站进行检索,制图。

1.7甜瓜GRAS家族基因表达模式分析

在 Melonet DB网站根据甜瓜的基因序列号检索出每个基因在甜瓜不同器官发育过程中的表达数据,选取甜瓜基因在根、茎、叶、雄花、雌花、果实、种子这7种器官中的表达数据,利用TBtools软件绘制基因表达热图。

2结果与分析

2.1甜瓜GRAS家族成员的鉴定

利用InterPro鉴定出37个GRAS候选基因,在ExPASy网站分析得出等电点、长度、蛋白质的分子量、亲水性平均值、脂溶指数、不稳定系数等数据,再利用 Plant-PLo网站对甜瓜GRAS转录因子进行亚细胞定位。CmGRAS蛋白长度为104(CmGRAS14)~846(CmGRAS33)aa;蛋白质分子量为11 950.08(CmGRAS14)~92 420.94(CmGRAS33) ku;等电点范围为4.78(CmGRAS7)~8.73(CmGRAS14),其中2个大于7,呈碱性,35个小于7,呈酸性;37个CmGRAS的氨基酸序列均为不稳定蛋白,不稳定系数大于40;仅CmGRAS14的平均亲水系数为正值,为疏水蛋白,其余均为亲水蛋白;亚细胞定位显示,甜瓜的37个GRAS基因全部在线粒体上。

2.2甜瓜GRAS家族基因的染色体定位与共线性分析

CmGRAS基因在11条染色体上分布不均,其中8号染色体上的基因数量最多,有6个;而10号、12号染色体上的基因数量最少,只有1个(图1)。在同一条染色体上的物理位置小于或等于100 kb的同源基因就被认为是串联重复的基因[18]。通过分析染色体定位图和共线性分析图(图1、图2),发现在6、7、8号染色体上存在串联重复的基因,总共发现了28对共线基因(CmGRAS25/CmGRAS31;CmGRAS31/CmGRAS17;CmGRAS10/CmGRAS30等),5个串联重复基因(CmGRAS4、CmGRAS5、CmGRAS20、CmGRAS21、CmGRAS22)。

2.3甜瓜GRAS家族系统进化树的分析

參照拟南芥GRAS家族的亚族分类标准[8],可将甜瓜的GRAS基因分为8个亚族(图3)。甜瓜GRAS基因在亚家族中分布不均匀。HAM亚族是最大的亚族,包括7个CmGRAS成员;其次是SHR、PAT1亚族,有6个成员;最少的是SCL3亚族,只有2个成员。甜瓜GRAS家族存在2对同源旁系基因,分别是CmGRAS6/CmGRAS22、CmGRAS21/CmGRAS20。还确定了15对姐妹基因,分别是PAT1亚族中的5对,例如AtGRAS30/CmGRAS36、AtGRAS6/CmGRAS16等;SHR亚族中的2对,AtGRAS27/CmGRAS5、AtGRAS17/CmGRAS32;LISCL亚族中的1对,AtGRAS14/CmGRAS9;DELLA亚族中的1对,AtGRAS9/CmGRAS30;SCL3亚族中的1对,AtGRAS5/CmGRAS17;SCR亚族中的1对,AtGRAS21/CmGRAS33;LS亚族中的1对,AtGRAS7/CmGRAS14;HAM亚族中的3对,例如AtGRAS8/CmGRAS15。

2.4甜瓜GRAS家族基因结构和保守基序分析

CmGRAS基因结构分析结果(图4)表明,甜瓜GRAS基因的最大内含子数为3个,29个GRAS基因没有内含子,5个基因(CmGRAS6、CmGRAS8、CmGRAS19、CmGRAS24、CmGRAS29)只包含1个内含子,CmGRAS14包含2个内含子,CmGRAS27、CmGRAS33包含3个内含子。保守基序分析结果(图4)表明,37个CmGRAS都有Motif5、Motif6,体现了GRAS转录因子的高度保守。CmGRAS14中所含保守基序最少,只有2个(Motif5、Motif6)。除了CmGRAS14,其他蛋白序列都有Motif1、Motif3、Motif4、Motif5、Motif6、Motif7。

2.5甜瓜GRAS家族基因表达模式分析

甜瓜GRAS家族基因在不同组织中都有表达(图5)。CmGRAS1、CmGRAS28、CmGRAS26、CmGRAS31、CmGRAS36在根中表达量较高,CmGRAS1、CmGRAS30、CmGRAS21、CmGRAS13在茎中表达量较高,CmGRAS1、CmGRAS30在叶中表达量较高,CmGRAS2在花中表达量较高,CmGRAS25、CmGRAS23、CmGRAS3在果实中表达量较高,CmGRAS3在种子中表达量较高。CmGRAS25、CmGRAS30、CmGRAS1、CmGRAS34都位于DELLA亚族,在根、茎、叶、花、果实、种子中都有明显表达,推测DELLA亚族调控了甜瓜多个器官的发育。PAT1亚族在花、果实、种子中表达量较高,推测它们可能参与了果实和种子的形成。LISCL亚族中的CmGRAS26和HAM亚族中的CmGRAS21、CmGRAS13、CmGRAS28在各个组织中都有表达,推测HAM亚族和SCL亚族广泛参与了甜瓜的生长发育过程。SCL3亚族中的CmGRAS17在茎中有少量表达,推测其可能参与了茎的生长发育过程。

2.6甜瓜GRAS家族基因顺式元件分析

甜瓜GRAS基因中的顺式元件可分为4组(图6):(1)与光反应有关的,包括ACE(参与光响应的顺式元件)、I-box(光响应元件的一部分);(2)与植物抗逆性有关的,包括TC-rich(与植物应激反应有关的元件)、LTR(与低温胁迫有关的响应元件)、ARE(应对缺氧环境做出反应的作用元件)、MBS(应对干旱极端环境做出响应的元件);(3)与植物激素反应有关的,包括ABRE(脱落酸传递和表达相关的作用元件)、TATC-box(赤霉素信号传导元件)、AUXRR-core(生长素传递和表达的响应元件);(4)与时空基因表达有关的,包括circadion(与昼夜规律有关的作用元件)、CAT-box(参与分生组织表达的元件)、GCN4-motif(与胚乳表达作用相关的元件)。

CmGRAS17、CmGRAS14、CmGRAS7、CmGRAS21、CmGRAS37、CmGRAS35、CmGRAS4、CmGRAS29、CmGRAS2、CmGRAS31、CmGRAS36这11个CmGRAS基因中同时出现了ABRE,ABRE分布在所有的亚族中;AUXRR-core存在于CmGRAS36、CmGRAS15、CmGRAS33、CmGRAS8中。11个CmGRAS基因都出现了MBS,该元件除了不在SCR亚族中分布,其余各亚族均有分布;TATC-box只在CmGRAS4、CmGRAS5、CmGRAS31中有分布;ARE分布在每个亚族中,在LS亚族的CmGRAS6中分布最多;LTR分布在DELLA、HAM、SCR、LISCL、SHR这5个亚族中,其中在CmGRAS30中分布最多;CAT-box只在CmGRAS6、CmGRAS18、CmGRAS13、CmGRAS24、CmGRAS36中分布。

3讨论

GRAS家族是一种重要的植物特异性转录调节剂,在植物的生长和发育过程中有非常重要的作用[8,19]。甜瓜GRAS基因中,78%的基因没有内含子,22%的基因含有1~3个内含子,可能是因为古老基因的水平已经下降或现存的基因中不存在内含子基因的复制现象[20],而水稻、扁豆的基因中无内含子基因的比例却很少,没有超過20%[21]。此外大多数的CmGRAS成员具有相似的外显子-内含子结构,表明CmGRAS基因的结构高度保守。甜瓜37个GRAS基因的等电点范围在4.78(CmGRAS7)~8.73(CmGRAS14)之间,其中2个大于7,呈碱性,35个小于7,呈酸性,与大麻GRAS基因等电点的性质[22]基本一致。这表明,不同种类的GRAS蛋白可能存在相似的理化性质。

甜瓜GRAS顺式作用元件分析结果表明,ABRE和TC-rich在每个亚族中都有分布,AUXRR-core只在PAT1、SCR、HAM、DELLA亚族中分布,TATC-box只在SHR、PAT1亚族中分布。在小麦GRAS家族的顺式作用元件中也发现参与了小麦光反应和干旱胁迫反应的元件,表明GRAS基因在植物光反应及抗胁迫反应中发挥着关键作用[23]。此外,甘薯中大多数GRAS基因(85.7%)含有与高温压力有关的响应元件,大约25%的基因具有LTR,推测它们可能对低温有较强的反应,27%的基因含有参与盐胁迫反应的GT1-motif元件[24]。

拟南芥的SHR亚族和SCR亚族调控根部辐射形态的建成[25],在甜瓜的SHR亚族中CmGRAS5是AtGRAS27的姐妹基因,SCR亚族中CmGRAS33/AtGRAS21是一对姐妹基因。基因表达分析结果表明,CmGRAS5、CmGRAS33在甜瓜的根部高度表达,推测其可能参与甜瓜根尖分生组织的生长,在维持根的生长中发挥关键作用。拟南芥的HAM亚族作用于植株顶部分生组织的发育[26]。甜瓜的HAM亚族中具有3对姐妹基因CmGRAS15/AtGRAS8、CmGRAS10/AtGRAS24、CmGRAS28/AtGRAS2。甜瓜GRAS家族基因的表达分析结果显示,CmGRAS10、CmGRAS7、CmGRAS21、CmGRAS20这4个基因在茎中表达量较高,表明甜瓜的HAM亚族可能与拟南芥的HAM亚族具有类似的功能,也作用于甜瓜顶部分生组织的生长发育。

拟南芥PAT1亚族在光信号的转导中起调控作用[27]。对甜瓜GRAS基因家族进行启动子分析发现,TATC-box光响应元件也在PAT1亚族有分布,推测甜瓜的PAT1亚族也作用于光信号的传导。拟南芥的DELLA亚族成员参与了赤霉素信号的传导[28],甜瓜GRAS家族基因的表达分析结果显示,甜瓜的DELLA亚族基因各组织中都有表达,推测其通过赤霉素的信号传导途径调控甜瓜的生长。

参考文献:

[1]Sun X L,Jones W T,Rikkerink E H A. GRAS proteins:the versatile roles of intrinsically disordered proteins in plant signalling[J]. The Biochemical Journal,2012,442(1):1-12.

[2]Pysh L D,Wysocka-Diller J W,Camilleri C,et al. The GRAS gene family in Arabidopsis:sequence characterization and basic expression analysis of the SCARECROW-LIKE genes[J]. The Plant Journal:for Cell and Molecular Biology,1999,18(1):111-119.

[3]Bolle C .The role of GRAS proteins in plant signal transduction and development[J]. Planta,2004,218(5):683-692.

[4]Chen Y,Zhu P P,Wu S Y,et al. Identification and expression analysis of GRAS transcription factors in the wild relative of sweet potato Ipomoea trifida[J]. BMC Genomics,2019,20(1):911.

[5]Tian C G,Wan P,Sun S H,et al. Genome-wide analysis of the GRAS gene family in rice and Arabidopsis[J]. Plant Molecular Biology,2004,54(4):519-532.

[6]Lee M H,Kim B,Song S K,et al. Large-scale analysis of the GRAS gene family in Arabidopsis thaliana[J]. Plant Molecular Biology,2008,67(6):659-670.

[7]Greb T,Clarenz O,Schfer E,et al. Molecular analysis of the LATERAL SUPPRESSOR gene in Arabidopsis reveals a conserved control mechanism for axillary meristem formation[J]. Genes & Development,2003,17(9):1175-1187.

[8]Liu X Y,Widmer A.Genome-wide comparative analysis of the GRAS gene family in Populus,Arabidopsis and rice[J]. Plant Molecular Biology Reporter,2014,32(6):1129-1145.

[9]Ma H S,Liang D,Shuai P,et al. The salt-and drought-inducible poplar GRAS protein SCL7 confers salt and drought tolerance in Arabidopsis thaliana[J]. Journal of Experimental Botany,2010,61(14):4011-4019.

[10]Abarca D,Pizarro A,Hernández I,et al. The GRAS gene family in pine:transcript expression patterns associated with the maturation-related decline of competence to form adventitious roots[J]. BMC Plant Biology,2014,14:354.

[11]Song X M,Liu T K,Duan W K,et al. Genome-wide analysis of the GRAS gene family in Chinese cabbage (Brassica rapa ssp. pekinensis)[J]. Genomics,2014,103(1):135-146.

[12]Huang W,Xian Z Q,Kang X,et al. Genome-wide identification,phylogeny and expression analysis of GRAS gene family in tomato[J]. BMC Plant Biology,2015,15:209.

[13]Lu J X,Wang T,Xu Z D,et al. Genome-wide analysis of the GRAS gene family in Prunus mume[J]. Molecular Genetics and Genomics,2015,290(1):303-317.

[14]Cenci A,Rouard M.Evolutionary analyses of GRAS transcription factors in angiosperms[J]. Frontiers in Plant Science,2017,8:273.

[15]Zhang H L,Cao Y P,Shang C,et al. Genome-wide characterization of GRAS family genes in Medicago truncatula reveals their evolutionary dynamics and functional diversification[J]. PLoS One,2017,12(9):e0185439.

[16]Zeng X,Ling H,Chen X M,et al. Genome-wide identification,phylogeny and function analysis of GRAS gene family in Dendrobium catenatum (Orchidaceae)[J]. Gene,2019,705:5-15.

[17]Garcia-Mas J,Benjak A,Sanseverino W,et al. The genome of melon (Cucumis melo L.)[J]. Proceedings of the National Academy of Sciences of the United States of America,2012,109(29):11872-11877.

[18]李晨,趙雪惠,王庆杰,等. 桃GRAS家族全基因组鉴定与响应UV-B的表达模式分析[J]. 中国农业科学,2019,52(24):4567-4581.

[19]张斌,陈丽娟,李其华,等. 栽培大豆GRAS转录因子家族基因鉴定及其盐胁迫下表达模式分析[J]. 江苏农业学报,2021,37(2):296-309.

[20]Sun X L,Xue B,Jones W T,et al. A functionally required unfoldome from the plant Kingdom:intrinsically disordered N-terminal domains of GRAS proteins are involved in molecular recognition during plant development[J]. Plant Molecular Biology,2011,77(3):205-223.

[21]Zou M,Guo B C,He S P.The roles and evolutionary patterns of intronless genes in deuterostomes[J]. Comparative and Functional Genomics,2011,2011:680673.

[22]Jain M,Khurana P,Tyagi A K,et al. Genome-wide analysis of intronless genes in rice and Arabidopsis[J]. Functional & Integrative Genomics,2008,8(1):69-78.

[23]李亚飞,阳文龙,顾晶晶,等. 小麦GRAS基因家族的全基因组鉴定与分析[J]. 麦类作物学报,2019,39(5):549-559.

[24]Liu M Y,Huang L,Ma Z T,et al. Genome-wide identification,expression analysis and functional study of the GRAS gene family in Tartary buckwheat (Fagopyrum tataricum)[J]. BMC Plant Biology,2019,19(1):342.

[25]Laura,Laurenzio D. The SCARECROW gene regulates an asymmetric cell division that is essential for generating the radial organization of the Arabidopsis root[J]. Cell,1996,86(3):423-433.

[26]Li X Y,Qian Q,Fu Z M,et al. Control of tillering in rice[J]. Nature,2003,422(6932):618-621.

[27]Bolle C,Koncz C,Chua N H. PAT1,a new member of the GRAS family,is involved in phytochrome A signal transduction[J]. Genes & Development,2000,14(10):1269-1278.

[28]Peng J,Carol P,Richards D E,et al. The Arabidopsis GAI gene defines a signaling pathway that negatively regulates gibberellin responses[J]. Genes & Development,1997,11(23):3194-3205.

猜你喜欢

生物信息学甜瓜
薄皮甜瓜新品种垦甜1号的选育
浅谈医学院校生物信息学专业青年教师规范培训模式的建立
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用
我喜欢吃甜瓜
中甜1号甜瓜
甜瓜有多重