大白菜GH3 基因家族全基因组鉴定及表达分析
2022-09-14李敬蕊解紫薇刘紫俊赵建军
李敬蕊,解紫薇,卢 银,李 娜,刘紫俊,赵建军
(河北农业大学 园艺学院/省部共建华北作物改良与调控国家重点实验室/河北省蔬菜种质创新与利用重点实验室/河北省蔬菜产业协同创新中心,河北 保定 071000)
GH3(GRETCHEN HAGEN 3)基因为植物中广泛存在的生长素(IAA)酰胺合成酶基因,该基因与AUX/IAA(auxin/indole-3-acetic acids)、SAUR(small auxin up regulated RNAs)均受生长素快速诱导,且该过程中不需新的蛋白质合成,因此将这3 类基因称为生长素早期响应基因[1]。生长素是1 种最基本的植物激素,作用于植物从胚胎发育到器官衰老的各个阶段,既可以直接影响植物细胞反应,也可以间接调控基因表达,进而影响植物生长发育[2]。植物对生长素的响应非常复杂,在识别生长素信号、启动下游相关基因表达,最终调控植物生长或产生生理生化反应的过程中,生长素早期响应基因具有重要作用。生长素在植物体内以自由态和束缚态2种形式存在,自由态具有活性,束缚态无活性,两者可在一定条件下相互转化。当植物体具有较高浓度的自由态IAA 时,GH3 催化自由态IAA 与氨基酸形成氨基轭合物IAA-amino,使IAA 形成束缚态;当植物需要IAA 时,IAA 酰胺水解酶水解IAAamino 释放出IAA,进而调节植株细胞内IAA 动态平衡,调控其生长发育[3]。 因此,GH3 可通过调节植物体内IAA 自由态和束缚态的比例,进而调控植物生长发育。
Hagen 和Guilfoyle,从大豆中克隆了第1 个GH3基因[4]。近年来,随着基因组测序以及生物技术的发展,越来越多不同植物特异的GH3基因被鉴定出来。在模式植物拟南芥中鉴定出20 个GH3基因[5],水稻中鉴定出13 个[6],番茄中17 个[7]。随着功能基因组学研究的深入,不同植物中GH3家族成员的具体功能被逐渐解析出来。如过量表达拟南芥GH3.15基因,拟南芥根长和侧根数增加[8];在柑橘中过表达GH3.1和GH3.1L基因,植株分枝增加,叶片变小、变薄且向上卷曲[9];与野生型相比,棉花GH3.5基因沉默植株对干旱和盐胁迫耐受能力显著降低[10]。多项研究均证实,GH3基因在调控植株生长发育、响应胁迫等方面具有重要作用。
目前,大白菜(Brassica rapaL. ssp.pekinensis)中的GH3家族成员基本信息尚不完善,不同文献中大白菜GH3家族成员命名不一致[11-12]。2011 年白菜基因组测序完成[13],为在全基因组水平上对白菜GH3基因家族进行挖掘和功能研究提供了可能。为充分挖掘大白菜GH3基因,研究GH3基因家族成员在大白菜叶球发育中的作用,本研究在大白菜全基因组水平对GH3基因家族成员进行鉴定,系统分析其基本特征、系统进化、基因结构、保守基序组成、染色体分布、共线性和启动子顺式作用元件,同时结合以实验室创制的大白菜不结球平塌突变体(fg-1)和其结球亲本(WT)结球前期球叶不同部位转录组数据,明确BrGH3基因家族成员在大白菜球叶不同部位的表达差异,为进一步研究该基因家族在大白菜叶球发育中的功能奠定基础。
1 材料与方法
1.1 大白菜全基因组GH3 家族成员鉴定
从Pfam 数据库(http://pfam.xfam.org/)下载结构域文件Pfam-A.hmm,采用TBtools 软件中的Simple HMM Search 功能,导入大白菜全部蛋白序列(http://brassicadb.org/brad/index.php) 和GH3家族结构域登录号(PF03321,Auxin-responsive promoter),E-value 设置为le-10, 鉴定大白菜GH3家族。为进一步验证大白菜GH3家族鉴定的准确性,从拟南芥数据库(http://www.arabidopsis.org/)下载GH3 蛋白家族序列,以拟南芥的GH3 蛋白序列作为查询序列,在初步筛选的BrGH3序列进行Blast 搜索,寻找最佳匹配序列,鉴定的GH3家族序列用于下一步分析。
1.2 BrGH3 家族成员的生物信息学分析
在大白菜数据库(http://brassicadb.cn/)中查询GH3家族成员的染色体位置信息。利用在线网站ExPASY(http://www.expasy.org/tools)中的ProtParam(http://web.expasy.org/protparam/) 分 析GH3 家族成员的氨基酸个数、分子量、理论等电点、不稳定系数等理化信息。利用在线工具PSORT(http://www.psort.org/)预测大白菜GH3家族成员的亚细胞定位。
1.3 BrGH3 家族进化分析
利用软件MEGA(http://www.megasoftware.net),采用邻接法(neighbor-joining,NJ)构建拟南芥GH3家族和大白菜GH3家族的系统进化树,Bootstrap重复设置为1 000,其它参数为系统默认值。使用iTOL(https://itol.embl.de/)工具对进化树进行美化。以拟南芥GH3 家族成员分组为依据,对大白菜GH3家族成员进行进化树分组。
1.4 BrGH3 家族成员基因结构和蛋白保守基序分析
在白菜数据库下载GH3家族成员CDS 序列及Genomic 序列,通过TBtools 软件对大白菜GH3成员的基因结构进行分析,并进行可视化绘图。
利用TBtools 中的Simple MEME Wrapper 功能分析大白菜GH3基因家族成员的蛋白保守基序(Motif),将Motif 个数最大值设为10,任意重复次数。利用TBtools 软件进行可视化作图。
1.5 BrGH3 家族成员染色体定位分析和共线性分析
利用从大白菜数据库下载的基因组注释文件(gff 1.5)和GH3家族成员的ID,在TBtools 的Gene Location Visualize from GTF/GFF 功能下绘制染色体位置示意图。
从大白菜数据库下载GH3家族成员的全基因组注释文件(gff 1.5)和基因组序列文件,提取大白菜染色体位置信息以及大白菜GH3家族基因在染色体上的位置信息,在PlantDGD 网站(http://pdgd.njau.edu.cn:8080/)下载大白菜GH3家族基因间的共线性关系,得到共线性分析结果文件。利用上面3 个文件在TBtools 进行大白菜内共线圈图绘制。
1.6 BrGH3 家族成员启动子分析
利用Tbtools 软件在大白菜全基因组数据库中提取BrGH3家族成员起始密码子ATG 上游的2 000 bp 序列,通过在线网站PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)预测大白菜BrGH3成员启动子的顺式作用元件,并进行统计。
1.7 BrGH3 基因表达模式分析
为了研究BrGH3基因家族成员在不同结球大白菜叶片不同部位的表达模式,利用课题组野生型(WT)结球大白菜和不结球平塌型突变体(fg-1)在结球初期的叶片不同部位(a、b、c、d)转录组数据,分析BrGH3基因家族成员表达模式。将BrGH3基因家族成员的FPKM 值进行均一化处理,利用Tbtools 软件绘制BrGH3基因家族表达量热图。
图1 大白菜野生型(A)、平塌突变体(B)和叶片不同部位示意图(C)Fig.1 Wild type (A), flat-growth mutant (B) and different parts (C) of Chinese cabbage leaves
2 结果与分析
2.1 BrGH3 家族成员序列鉴定及基本特征分析
在全基因组水平上对BrGH3家族成员进行鉴定,共获得45 个基因,根据在染色体上的位置,将其编号为BrGH3.1-BrGH3.45(表1)。GH3基因家族成员编码氨基酸数在286~826 之间,相对分子量在32.06~90.77 KD 之间,等电点在4.85~7.81 之间,其中BrGH3.2 和BrGH3.20 等电点大于7,偏碱性,其他BrGH3 蛋白均小于7,偏酸性;BrGH3 的不稳定系数范围为31.27~53.20,不稳定系数小于40 的稳定蛋白有17 个,大于40 的不稳定蛋白有28 个;亚细胞定位预测表明,21 个BrGH3 成员定位于细胞核;12 个位于细胞质;9 个定位于叶绿体;1 个定位于液泡膜,1 个定位于过氧化物酶体,1 个定位于细胞核或细胞质(表1)。
表 1 大白菜GH3 家族成员基本信息Table 1 Basic information of Chinese cabbage GH3 family members
2.2 BrGH3 家族成员进化分析
从phytozome 数据库下载拟南芥(Arabidopsis thalian)的GH3 蛋白序列。利用在线MEGA 软件构建拟南芥19 个AtGH3 和大白菜45 个BrGH3蛋白的进化树,利用在线软件Evolview 进行进化树美化(图2)。根据进化关系,45 个GH3 成员可分为4 类(Group Ⅰ、Group Ⅱ、Group Ⅲ和Group Ⅳ),Group Ⅰ中包含5 个BrGH3,2 个AtGH3;Group Ⅱ有10 个BrGH3,8 个AtGH3;Group Ⅲ中GH3 成员数最多,有29 个BrGH3,9个AtGH3;Group Ⅳ中只有1 个BrGH3(BrGH3.2)。
图 2 大白菜和拟南芥GH3 家族成员系统发育树Fig.2 Phylogenetic tree of Arabidopsis and Chinese cabbage GH3 family members
2.3 BrGH3 家族成员基因结构和保守Motif 分析
对BrGH3 家族成员的基因结构进行分析,并进行可视化作图(图3A)。BrGH3 家族成员由2~10个外显子组成,其中含有4 个外显子的成员最多为25 个,其次含有3 个外显子的基因为12 个,含有5个外显子的基因有4 个,含有2 个外显子的基因有2 个,含有6 个外显子和10 个外显子的基因各1 个。
为探究BrGH3 家族成员的蛋白保守Motif,利用在线软件MEME 预测了大白菜BrGH3 家族成员的保守Motif,设定最多检测10 个Motif(图3 B)。结果显示,43 个BrGH3 均含有10个保守Motif,且在N 端均为Motif 8,在C 端为Motif 4。BrGH3.18 只含有3 个Motif,分别为Motif 3、Motif 7 和Motif 4;BrGH3.2 只含有Motif 3和Motif 7。
图3 BrGH3 家族成员基因结构(A)和保守基序分析(B)Fig.3 Gene structure (A) and conserve motif (B) analysis of BrGH3 family members
2.4 BrGH3 基因家族成员染色体定位和亚基因组分析
从图4 中可以看出,41 个BrGH3基因分布在大白菜10 条染色体上,有4 个基因未定位到染色体上。3 号染色体上分布有11 个基因,数量最多,9 号染色体上有7 个基因,2 号和6 号染色体上各有5 个基因,10 号染色体上有3 个基因,4 号、5 号、7 号染色体上有2 个基因,1 号、8 号染色体上有1 个基因,数量最少。而BrGH3.42、BrGH3.43、BrGH3.44和BrGH3.45没有定位到染色体。41 个BrGH3基因中,17 个属于大白菜LF亚基因组,12 个属于MF1亚基因组,13 个属于MF2亚基因组。
图4 BrGH3 家族成员染色体定位Fig.4 Localization of BrGH3 family members on chromosome
2.5 BrGH3 家族成员共线性分析
由图5 可以看出,BrGH3家族成员存在片段重复和串联重复。共鉴定出29 个基因参与22 个片段性复制事件。6 号染色体片段性复制事件最多有9段,1 号染色体上的基因与其它基因不存在共线性。在45 个BrGH3家族成员中,BrGH3.31基因中存在的片段复制事件最多,为5 个片段存在复制事件,分别与3 号染色体上的BrGH3.8,6 号染色体上的BrGH3.23,BrGH3.24,BrGH3.25,10 号染色体BrGH3.41具有片段重复。进一步分析发现,BrGH3片段复制事件主要发生在组内,不存在组间复制事件。Group Ⅰ中3 个基因参与2 个片段复制事件,Group Ⅱ中2 个基因参与1 个片段复制事件,其它片段复制事件均发生在Group Ⅲ中。在2 号染色体上BrGH3.3,BrGH3.4和BrGH3.5为串联重复;在3 号染色体上BrGH3.16,BrGH3.17和BrGH3.18为串联重复;在6 号染色体上BrGH3.16,BrGH3.17和BrGH3.18为串联重复,BrGH3.23,BrGH3.24和BrGH3.25为串联重复,BrGH3.26,BrGH3.27和BrGH3.28为串联重复; 在9号染色体上,BrGH3.36,BrGH3.37和BrGH3.38为串联重复。
图 5 BrGH3 家族成员共线性分析Fig.5 Synteny analysis of the BrGH3 family members
2.6 BrGH3 家族成员顺式作用元件分析
提取BrGH3基因上游2 000 bp 的基因组序列为假定启动子序列进行顺式作用元件分析,结果表明45 个成员中含有4 类顺式作用元件,分别为光、植物生长发育、激素和胁迫响应元件(图6)。其中,光响应元件数量最多,在光响应元件中,86.77%的BrGH3基因均含有Box4 元件,88.89% 的BrGH3含有G-box 元件;在激素响应元件中,含有ABRE元件的BrGH3基因最多,占91.11%;在胁迫响应元件中,含有ARE 元件的BrGH3基因占93.33%。
图 6 BrGH3 家族成员启动子顺式作用元件分析Fig.6 Cis-acting element analysis of BrGH3 family members promoter
2.7 BrGH3 基因在不同叶球类型、叶片不同部位表达分析
对大白菜野生型和平塌突变体转录组数据中提取到的BrGH3基因FPKM 值进行分析。
45 个BrGH3基因家族成员中,8 个BrGH3基因在大白菜野生型和fg-1 突变体中差异表达,其它BrGH3基因在野生型和fg-1突变体不同部位无显著差异。将该8 个BrGH3基因在不同叶球大白菜叶片不同部位的FPKM 值进行均一化处理,利用TBtools 软件做成热图(图7)。其中BrGH3.28和BrGH3.41基因在大白菜突变体叶片不同部位的FPKM 值均高于野生型,为野生型的1.22 ~4.83倍。8 个BrGH3基因中,4 个属于大白菜LF 亚基因组,2 个属于MF1 亚基因组,2 个属于MF2 亚基因组,表明BrGH3基因在大白菜LF 亚基因组中优势表达。”
图7 BrGH3 基因家族成员在野生型和平塌突变体叶片不同部位中的FPKM 值Fig.7 Analysis of FPKM value of BrGH3 gene family of different part of leaf in wild type and fg-1 mutant
3 讨论与结论
3.1 大白菜GH3 基因家族的鉴定和分析
GH3作为生长素早期响应基因,在植物中广泛存在。但是不同植物种类中GH3家族成员数量不同,模式植物拟南芥中有20 个GH3基因,其中包含1 个不完整基因[5]、小麦中有36 个[14]、甜樱桃中只有8 个GH3基因[15]。本研究采用生物信息学方法在全基因组水平对大白菜GH3基因家族成员进行鉴定分析,鉴定到45 个BrGH3家族成员。对这45 个BrGH3成员进行特征分析,表明,BrGH3家族成员编码氨基酸数在286~826 之间,分子量在32.06~90.77 KD 之间。45 个BrGH3在大白菜的10 条染色体上呈不均匀分布,其中3 号染色体上的GH3基因数量最多。系统进化分析表明,GH3家族成员可分为2~4 类。大多数物种如拟南芥、小麦等物种的GH3家族成员均分为3 类[14]。水稻GH3家族成员虽然也分为3 类,但Group Ⅲ中没有水稻GH3成员,OsGH3-7单独为1 类[16];玉米GH3家族成员分为2 类,其中Group Ⅲ中没有玉米GH3成员[17];蒺藜苜蓿中的17 个GH3家族成员分为4 类,其中Group Ⅳ有3 个GH3家族成员[18]。植物GH3基因家族成员的主要功能是催化自由态IAA 与氨基酸形成束缚态的IAA,进一步研究发现GH3 也具有催化茉莉酸和水杨酸等植物激素与氨基酸结合从而调控其活性的功能。根据其功能和序列相似性,将拟南芥GH3 蛋白分为3 个亚族,其中Group Ⅰ蛋白催化异亮氨酸和茉莉酸,形成茉莉酸-异亮氨酸耦合物,从而激活茉莉酸信号传导途径[19];Group Ⅱ蛋白调控生长素活性,维持生长素稳态[5];Group Ⅲ蛋白调控水杨酸信号转导,GH3 可能是通过直接催化水杨酸与氨基酸结合、催化水杨酸竞争性抑制剂与氨基酸结合,或是通过与水杨酸合成上游基因作用,进而调控水杨酸信号转导[20]。其它成员的功能不确定。本研究通过进化分析表明,大白菜BrGH3家族成员分为4类,Group Ⅰ中包含5 个BrGH3,Group Ⅱ有10 个BrGH3,Group Ⅲ中有29 个BrGH3,BraGH3.2单独为一类。基因重复(片段重复和串联重复)是植物基因组中基因家族扩增的关键力量,且复制事件一般发生在组内[21-22]。本研究表明,大白菜的29个BrGH3参与22 个片段复制事件,存在5 个串联重复。进一步分析发现,BrGH3片段复制事件主要发生在组内,不存在组间复制事件。Group Ⅰ中3个基因参与2 个片段复制事件,Group Ⅱ中2 个基因参与1 个片段复制事件,其它片段复制事件均发生在Group Ⅲ中,这可能与Group Ⅲ中BrGH3 家族成员数最多有关。
3.2 BrGH3 可能通过激素响应调控大白菜叶球发育
GH3基因表达具有组织特异性。研究表明,GH3基因表达变化影响植物激素含量,从而影响植物生长发育和形态建成。过表达苹果MsGH3.5基因,游离IAA 含量降低,苹果全株的细胞分裂素含量显著增加,植株株高降低、分枝增加、不定根减少[23];SIGH3-15基因过量表达,番茄植株体内自由态IAA含量降低,番茄生长缓慢、叶片皱缩[24];水稻GH3s表达水平提高,IAA 含量降低,叶夹角增加[25],表明该基因可能与株型形成有关。进一步研究表明,GH3基因表达受激素调控。拟南芥GH3基因在生长素处理0.25~0.5 h 后显著上调表达,且在处理2~4 h 表达量达到最高值[4];棉花11 个GH3基因在不同激素(油菜素内酯、水杨酸、赤霉素和生长素)处理、不同组织(根和茎)中表达差异显著[26];利用外源细胞分裂素处理苹果组培苗,根系和茎中的MsGH3.5均显著上调,在根系中是对照的 4.5 倍,在茎中是对照的5.5 倍[23];利用茉莉酸甲酯处理丹参,丹参11 个GH3中的SmGH3.2、SmGH3.6和SmGH3.10在根系和叶片中均上调表达,SmGH3.1在叶片中上调表达,而在根系中没有显著差异,SmGH3.3在根系中上调表达,而在叶片中没有显著差异[27]。这些研究表明GH3基因的表达具有组织特异性,为BrGH3基因在大白菜叶球发育中的作用提供参考。在本研究中,结合大白菜转录组数据结果分析发现,45 个BrGH3基因家族成员中,只有15 个BrGH3基因在大白菜叶片中表达。且BrGH3.41,BrGH3.27和BrGH3.28基因在大白菜突变体叶片不同部位的FPKM 值均高于野生型,为野生型的1.02 ~4.43 倍。通过启动子顺式元件的预测分析发现BrGH3家族成员含有大量植物激素响应相关元件,结合课题组前期研究结果,平塌突变体叶片IAA 含量显著低于野生型[28],推测该家族成员通过激素响应元件接受激素信号,在平塌突变体叶片不同部位高表达导致平塌突变体叶夹角(叶片近轴面与中心生长点的角度)增加,叶片顶部平展。BoGH3.5在结球甘蓝卷曲程度更高的结球期叶片中的表达量比莲座期叶片高,表明该基因可能与结球甘蓝叶片卷曲有关[29]。本试验结果为进一步研究大白菜GH3基因家族的生物学功能提供了数据参考和理论依据。