巴西橡胶树GRAS基因家族鉴定及表达分析
2024-10-09李娟袁渊吴挺开邓治程汉
关键词:巴西橡胶树;GRAS 基因家族;生物信息学;基因表达;DELLA
中图分类号:S794.1 文献标志码:A
转录因子(transcription factor, TF)是功能基因组学的核心,它是一种能与特异DNA 序列结合的蛋白,可以单独或与其他蛋白形成复合体,提高或阻断特定基因RNA 聚合酶的招募,调控基因的表达[1]。转录因子在调控高等植物的生长发育和非生物胁迫响应中起重要作用[2]。已知的转录因子包括GRAS、WRKY、AP2/EREBP、bZIP、MYB、MADS 和bHLH 等。
GRAS家族是一类植物特有的转录因子,其命名来源于该家族最早鉴定的3 个功能特征基因GAI(gibberellic-acid insensitive)、RGA(repressorof GA1-3 mutant)、SCR(scarecrow)[3-5]。GRAS蛋白的长度为400~770 个氨基酸不等,具有1 个高度保守的C-端GRAS 结构域。GRAS 结构域约390 个氨基酸,由5 个不同基序按照特定顺序排列组成:LHR I(leucine heptad repeat I)、VHIID、LHR II(leucine heptad repeat II)、PFYRE 和SAW[6]。其中,VHIID 基序与2 个亮氨酸七肽重复区( LHR I 和LHR II ) 结合形成LHRI-VHIID-LHR II 复合体,该结构可能在蛋白-DNA或蛋白-蛋白互作中发挥关键功能[7]。PFYRE 和SAW 基序功能仍未阐明,但这2 个基序发生缺失或错义突变导致拟南芥(Arabidopsis thaliana)表型异常[4, 8]。GRAS 蛋白的N 端保守性较差,但一些GRAS 家族成员在N 端区域含有保守的序列,如DELLA 亚家族包含2 个保守的基序DELLA 和TVHYNP[9]。最初根据拟南芥和水稻的研究将GRAS 家族分为DELLA、HAM(hairy meristem)、PAT1(phytochrome a signal transduction 1)、LAS(lateral suppressor)、SHR(short root)、SCR、SCL3(SCR- like 3)、LISCL(lilium longiflorumSCR-like)等8 个亚家族。而其他植物物种,如番茄(Solanum lycopersicum)[10]、茶树(Camelliasinensis)[11]和葡萄(Vitis vinifera)[12]中有13 个亚家族,葫芦(Lagenaria siceraria)[13]中有16 个亚家族,CENCI 等[14]将被子植物GRAS 家族分为17 个亚家族。目前,GRAS 基因家族已在多个物种中被报道,其中拟南芥(Arabidopsis thaliana)[15]有33 个成员、水稻(Oryza sativa)[15]有60 个、玉米(Zea mays)[16]有86 个、大白菜(Brassica rapassp. pekinensis)[17]有48 个、毛果杨(Populustrichocarpa ) [18] 有106 个、中国蔷薇( Rosachinensis)[19]有56 个成员,大戟科的木薯(Manihotesculenta)[20]有77 个、麻风树(Jatropha curcas)[21]和蓖麻(Castor bean)[22]均有48 个成员。
GRAS基因家族在植物生长发育、激素信号传导、逆境响应等多个生物学过程中发挥着重要的调控作用。如GRAS 家族成员DELLA 蛋白作为赤霉素(gibberellin, GA)信号转导途径的负调控因子,通过与其他蛋白互作从而介导GA 调控植物生长[23]。此外,DELLA 还参与调控茉莉酸(jasmonic acid, JA)信号转导[24]及次生细胞壁形成[25-26];PAT1 作为光敏色素A 信号途径的正调控因子参与光信号途径调控[27];HAM 参与茎尖分生组织的生长发育[28];SCR 和SHR 通过形成复合体进而共同调控拟南芥根和芽的径向生长[29];SCL3 参与调控陆地棉根的伸长[30];在大豆中过表达GmGRAS37 基因可以增强植株的耐旱和耐盐能力[31]。近年来,随着对GRAS 基因的深入研究,越来越多的证据表明,GRAS 基因家族在植物的适应性进化和环境适应性方面起着关键的作用[32-34]。
巴西橡胶树(Hevea brasiliensis),简称橡胶树,原产于巴西亚马逊河流域马拉岳西部地区,是大戟科橡胶树属一种典型的热带雨林树种,也是我国及世界热区的一种重要经济作物。橡胶树所产生的胶乳是天然橡胶的主要原料。天然橡胶是重要的战略物资和工业原料,尽管世界上有2000 多种产胶植物,如银胶菊[35]、橡胶草[36]和杜仲[37]等,但目前所使用的天然橡胶约98%仍来源于橡胶树[38]。随着橡胶树全基因组测序工作的完成,为基因家族的全基因组分析提供了便利,也为橡胶树功能基因组学研究提供了可靠的基因组数据信息[39-41]。基于GRAS 基因家族在植物生长发育和逆境胁迫响应中的重要作用,本研究利用生物信息学方法,以橡胶树基因组为基础,鉴定橡胶树GRAS 基因家族成员,并对其系统进化、基因结构、染色体位置和启动子顺式作用元件等进行分析,利用转录组数据及qPCR 技术分析GRAS 基因表达模式,从而为橡胶树GRAS 基因功能的解析提供理论依据。
1 材料与方法
1.1 材料
本研究所采用的试验材料均来自于中国热带农业科学院试验场(海南省儋州市)种植的橡胶树(Hevea brasiliensis)热研73397 品种。采集橡胶树不同组织(雌花、雄花、木质部、叶片、树皮和胶乳),不同节间木质部(选取橡胶树顶端分生组织从上往下数第一、第三和第五节间木质部),以及150 mg/L 外源GA3 处理21周后(每周喷洒处理1次)的橡胶树幼苗的木质部(以H2O处理作为对照)样品,立即置于液氮中,带回实验室后于–80 ℃中保存备用。每5 株树为1 个生物学重复,每个样品3个生物学重复。
1.2 方法
1.2.1 橡胶树GRAS家族成员的鉴定及理化性质分析 从NCBI数据库(https://www.ncbi.nlm.nih.gov/)中下载橡胶树基因组序列、蛋白质序列和注释信息。利用Pfam 数据库(http://pfam-legacy.xfam.org/)下载的GRAS 结构域(PF03514)和隐马尔可夫模型(HMM)文件,通过hmmer 3.0软件筛选橡胶树基因组数据库中含有GRAS 结构域的全部蛋白序列,选取e 值小于1e–5 的候选蛋白序列。使用ClustalX 2.1 软件将候选蛋白序列进行一一比对去除冗余,并通过SMART(https://smart. embl.de/)和NCBI-CDD 数据库(https://www.ncbi. nlm.nih.gov/Structure/cdd/cdd.shtml)鉴定其保守结构域,去除不含GRAS 结构域的序列,得到橡胶树GRAS 家族成员。分别利用ExPASyProtParam( https://web.expasy.org/protparam/)和Plant-mPLoc ( http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/)在线软件进行氨基酸长度、分子量大小、等电点、疏水性等理化性质和亚细胞定位预测。
1.2.2 GRAS 的系统进化分析 通过PlantTFdb(http://planttfdb.gao-lab.org/index.php)数据库和NCBI 数据库下载拟南芥、毛果杨和水稻GRAS家族蛋白序列,并与橡胶树GRAS 蛋白序列进行多序列比对。利用MEGA 11 软件,采用邻接法(neighbor-joining method, NJ)构建系统进化树,bootstrap 设置为1000 以测试进化树的可靠性。利用Evolview(https://www.evolgenius.info/evolviewv2/#login)在线软件和AI 软件进行结果美化。
1.2.3 橡胶树GRAS基因结构分析 根据橡胶树基因组注释信息,利用在线网站MEME(https://meme-suite.org/meme/)与NCBI Batch CD-search( https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)在线软件进行motif 预测和保守结构域分析,其中motif 数量设置为10,其他参数均为默认值。通过使用TBtools 软件对橡胶树GRAS家族的外显子-内含子结构进行分析,并将系统进化树、蛋白保守基序、保守结构域和基因结构进行可视化展示。
1.2.4 橡胶树GRAS 基因染色体定位分析 利用TBtools软件在橡胶树基因组注释信息的基础上,将橡胶树GRAS 基因定位到染色体上,并作共线性分析,同时利用该软件计算其Ka/Ks 值。
1.2.5 橡胶树GRAS 基因启动子顺式作用元件分析 选取橡胶树GRAS 转录起始位点上游2000 bp的序列作为启动子分析区域,利用PlantCARE( https://bioinformatics.psb.ugent.be/webtools/plantcare/html/)在线软件进行启动子顺式作用元件预测,并通过TBtools 进行可视化展示。
1.2.6 基于RNA-Seq 数据的基因表达分析 利用课题组前期获得的RNA-Seq 数据,以及HeveaDB(http://hevea.catas.cn/home/index)数据库中公布的转录数据,获得不同组织(胶乳、树皮、叶片、雌花、雄花和木质部)及叶片不同发育时期(古铜期、变色期、淡绿期和稳定期)的橡胶树GRAS 家族成员的转录本FPKM(fragments perkilobase of exon per million reads mapped)值,并使用TBtools 软件对橡胶树GRAS 基因表达水平进行聚类及热图绘制。
1.2.7 qPCR 分析 对橡胶树DELLA 亚家族6个成员组织的转录组表达数据进行qPCR 验证,并分析其在不同节间木质部及GA3处理下的表达模式。利用天根生化科技(北京) 有限公司的RNAprep Pure 多糖多酚植物总RNA 提取试剂盒(TIANGEN, Beijing, China)提取样品总RNA。采用NanoDrop 2000分光光度计和凝胶电泳检测RNA 样品的浓度和完整性。将1 μg RNA 样品用PrimeScript™ RT reagent Kit with gDNA Eraser 试剂盒(Takara, Dalian, China)反转录为cDNA。采用Primer 3软件设计HbGRAS 基因的qPCR 引物(表1),以YLS8 为内参基因。将上述反转录得到的cDNA 作为模板,利用2×Q3 SYBR qPCRMaster Mix(Universal)(TOLOBIO, China)进行qPCR,反应体系与扩增程序按照说明书进行。采用2–ΔΔCT 法计算基因的相对表达水平。本实验包括3个生物学重复和3个技术重复。
2 结果与分析
2.1 橡胶树GRAS基因家族成员鉴定与理化性质分析
根据NCBI 数据库中下载的橡胶树蛋白质序列及隐马尔可夫模型,结合SMART 和NCBI-CDD数据库筛选和验证,最终得到91 个非冗余的橡胶树GRAS 基因家族成员,根据其在染色上的位置将其命名为HbGRAS1~HbGRAS91(表2)。理化性质分析结果显示,橡胶树GRAS 基因编码的蛋白长度在117~824 个氨基酸之间,其中HbGRAS91的氨基酸序列最短,HbGRAS9 最长。蛋白分子量在14.07~89.46 kDa 之间,等电点在4.72(HbGRAS70)~9.07(HbGRAS21)之间,平均值为6.90。蛋白总平均疏水性在–0.656~0.151 之间,其中,除HbGRAS12 、HbGRAS32 、HbGRAS59 和HbGRAS61 的总平均疏水性大于0 之外,其余皆小于0,说明橡胶树GRAS 家族成员大部分为亲水蛋白。蛋白亚细胞定位预测结果显示,有49 个HbGRAS 蛋白定位于细胞核,36 个定位于叶绿体,3 个定位于质膜,2 个定位于细胞质,1 个定位于过氧化物酶体。
2.2 橡胶树GRAS 基因家族系统进化分析
为解析橡胶树GRAS 蛋白的特征,分别从PlantTFdb 和NCBI 数据库中下载拟南芥、毛果杨和水稻GRAS 家族蛋白序列,与本研究鉴定得到的91 个橡胶树GRAS 家族成员的蛋白序列进行比对及系统进化分析。结果表明,GRAS 蛋白被划分为14 个亚家族,分别是Os19、HAM、SCL4/7、LAS、SCR、DLT、SCL3、Os4、Os43、DELLA、Pt20、LISCL、SHR 和PAT1(图1)。其中LISCL亚家族的成员数目最多有16 个,PAT1 亚家族有13 个,HAM 亚家族有11 个,SHR 亚家族有10个,Pt20 亚家族有8 个,Os4、SCR 和 DELLA亚家族各有6 个,SCL3 亚家族有5 个,Os19、Os43、SCL4/7、LAS 和DLT 各亚家族仅有2 个成员。比较不同植物之间GRAS 各亚家族的数量发现,橡胶树、拟南芥和水稻中LISCL 亚家族的数量最多,分别为16、7 和10 个。毛果杨中DELLA和HAM 亚家族成员数量最多,均为14 个。Pt20亚家族仅存在于橡胶树和毛果杨中,而拟南芥无Os4、Os43 和Os19 亚家族成员(表3,图2A)。
2.3 橡胶树GRAS家族保守结构域和基因结构分析
保守基序分析发现,大多数motifs 位于序列C 端,motif 6存在于全部HbGRAS 蛋白中,且始终在C 端。motif 1 大多与motif 4、motif 5 或者motif 10相邻。同一亚族的HbGRAS 成员通常具有相似的基序组成。例如, LISCL 亚族除HbGRAS91只含有motif 2 和motif 6 外,其余均包括motif 9、motif 7、motif 1、motif 8、motif 5、motif 3、motif 2、motif 6,DELLA 亚族均含有motif 9、motif 7、motif 4、motif 1、motif 10、motif3、motif 2、motif 6,HAM 亚家族成员仅含有4个保守的motifs(图2B)。
保守结构域分析结果显示,HbGRAS成员均含有GRAS 或GRAS superfamily 结构域,除HbGRAS91外其他均位于C端,而DELLA结构域仅存在于DELLA 亚家族中。同一亚家族的成员其基因结构相似,如PAT1 亚家族仅有GRAS结构域,Pt20 亚家族仅有GRAS superfamily 结构域。DELLA 亚家族中除HbGRAS62J1JlAwCy+K8obl18ie46cA==外,其余均含有DELLA 保守结构域(图2C)。
基因结构多样性是基因家族进化的重要组成部分[42]。橡胶树GRAS 基因具有0~7 个数量不等的内含子,其中63 个HbGRAS 无内含子,18 个HbGRAS 仅有1 个内含子,HbGRAS59 含有7 个内含子,数量最多。DELLA、LAS、Os19、HAM和DLT 亚家族无内含子,Os4/7、SCL3 和SHR亚家族含有0~1 个内含子,Os4 亚家族含有0~7个内含子(图2D)。总体来说,系统进化中同一亚家族的橡胶树GRAS 基因具有相似的外显子-内含子结构。
2.4橡胶树GRAS基因染色体定位和基因复制分析
橡胶树GRAS基因的染色体定位如图3所示,91个HbGRAS基因分布于除11号染色体外的其他17条染色体和2条Scaffold上,并且每个染色体上分布的数目不同。16号染色体上分布最多,有17个基因,约占总数的18.68%,其次是9号染色体分布有12个基因,而8和18号染色体,以及Scaffold402和Scaffold409分布最少,各自仅含1个HbGRAS基因。
串联重复事件是指200kb内包含2 个或更多基因的染色体区[43],在基因组进化、调控和稳定性等方面具有重要的作用[44]。在橡胶树4、9、15和16号等4条染色体上共发现17 个HbGRAS基因的10个串联重复事件(图3)。共线性分析显示,橡胶树GRAS 基因片段重复区域中发现了87个基因(图4),说明片段重复事件可能是橡胶树GRAS 基因家族成员进化的主要原因。HbGRAS家族的同源基因对的Ka/Ks 值在0.091~0.388 之间,说明这些基因经过片段复制后发生了纯化选择。
2.5橡胶树GRAS基因启动子顺式作用元件分析
启动子区顺式作用元件分析结果显示,橡胶树GRAS 家族主要包含植物激素应答顺式作用元件,如GA、茉莉酸甲酯(methyl jasmonate, MeJA)、脱落酸(abscisic acid, ABA)、生长素(auxin)和水杨酸(salicylic acid, SA)响应元件,胁迫应答顺式作用元件,如伤害、干旱和低温响应元件,以及参与分生组织、胚乳、种子等时空表达及光响应的顺式作用元件等。其中,光响应元件在全部91 个HbGRAS 基因中都存在且数量最多,有1111个。其次,是茉莉酸甲酯响应元件有178 个,厌氧诱导元件164 个,脱落酸响应元件129 个,GA 响应元件85 个,其中数量最少的元件是光敏色素互作因子、SEF1因子结合位点和参与栅栏叶肉细胞分化的顺式作用元件,各有2个(图5)。上述结果表明,HbGRAS 可能参与多种植物激素和环境胁迫应答,在植物生长发育和逆境胁迫响应中起着重要作用。
2.6 橡胶树GRAS基因家族成员表达分析
HbGRAS基因在橡胶树胶乳、树皮、叶片、雌花、雄花和木质部等不同组织的表达模式如图6所示,其中HbGRAS11、HbGRAS12、HbGRAS26、HbGRAS30、HbGRAS42、HbGRAS48、HbGRAS49、HbGRAS59 和HbGRAS69等9 个基因在所有检测组织中均不表达。HbGRAS45 和HbGRAS84 在胶乳中高表达,HbGRAS67 在树皮和木质部中表达量较高,HbGRAS82在叶片和木质部中的表达丰度较高。雄花中表达丰度最高的是HbGRAS60,其次是HbGRAS87。不同亚族中HbGRAS 的组织表达模式也不尽相同,比如LAS 和Pt20 亚家族成员在所有组织中的表达水平都低于其他亚家族,而PAT1、DELLA 和SCL4/7 亚家族的相对表达量较其他各亚族略高。
为进一步了解HbGRAS 在橡胶树叶片发育中的作用,从Hevea DB数据库下载HbGRAS基因在橡胶树叶片不同发育时期的转录组数据,表达模式分析结果显示,DELLA 亚家族中HbGRAS44 随着叶片的发育进程表达量逐渐上调,而HbGRAS58、HbGRAS64、HbGRAS82 和HbGRAS89 则逐渐下调表达;PAT1 亚家族中HbGRAS7和HbGRAS60,HAM亚家族中HbGRAS6 和HbGRAS36 均随着叶片的成熟表达量逐渐上调。HAM 亚族中HbGRAS84和HbGRAS54 在变色期和淡绿期的表达量相对较高(图7),说明HbGRAS 基因表达与叶片发育有关,但可能存在功能差异。
作为GRAS 家族的重要成员,DELLA 是GA信号传导途径的负调控因子,在植物生长发育过程中发挥重要作用[45]。因此,进一步利用qPCR技术分析橡胶树DELLA 亚家族成员的基因表达模式。结果显示HbGRAS62在树皮中表达量最高,木质部中表达量最低,而 RNA-Seq结果显示表达量最高和最低的组织分别为胶乳和雌花。其余5个DELLA基因表达量最高和最低的组织均与RNA-seq 结果一致,其中HbGRAS44分别为叶片和树皮、HbGRAS58 分别为叶片和胶乳、HbGRAS64分别为雌花和胶乳、HbGRAS82和HbGRAS89 均分别为木质部和胶乳(图8)。造成HbGRAS62 qPCR和RNA-Seq表达模式不一致的原因可能与2 种技术本身的差异(即转录组测序是对该基因的所有转录本定量,而qPCR则可能不能代表所有的转录本)有关。在不同节间木质部中,除HbGRAS62外,其余5 个橡胶树DELLA基因均随木质化程度加深上调表达(图9),说明橡胶树DELLA 基因可能参与橡胶树茎的次生细胞壁形成。外源GA3 处理抑制DELLA 亚家族成员表达(图10),说明DELLA基因表达受GA 调控。
3讨论
GRAS作为植物中特有的一类转录因子,在植物的生长发育以及非生物胁迫应答中具有重要的调控作用,但目前在橡胶树中尚无该转录因子家族分析相关的研究报道。本研究从橡胶树全基因组中筛选并鉴定到HbGRAS 基因家族成员91个,所有HbGRAS 蛋白在结构上存在显著差异,表明其高度复杂。其成员数量与拟南芥(33个)、水稻(60个)、玉米(86个)、葡萄(43个)、辣椒(50个)[46]、杨树(106个)、苹果(127 个)[47]等物种相比差异较大,较同科的木薯(77个)、蓖麻(48个)和麻风树(48 个)中GRAS 基因数量明显增加,且蛋白长度在117~824 个氨基酸之间变化,这种较大的差异可能与基因组大小或基因复制事件有关[20]。系统进化分析显示,HbGRAS蛋白可分为14 个亚家族,而在水稻的每个亚群中均鉴定到HbGRAS 蛋白,这表明GRAS 家族的分化可能早于单、双子叶植物的分化。橡胶树GRAS亚族数量与木薯一致[20],其中LISCL 成员最多(16个,17.58%),与拟南芥和水稻等植物相似[15],表明这些GRAS 基因家族在长期进化过程中可能具有较强的分化能力。基于系统进化关系和多序列比对结果,发现大多数HbGRAS 蛋白的N 端包含1 个高度无序的区域,这导致了GRAS 蛋白的多样化,并影响了其功能分化。DELLA 亚家族蛋白N 端相对保守。橡胶树DELLA 亚家族成员中除HbGRAS62 无DELLA 保守结构域外,其余5个均含有DELLA 结构域,这可能是HbGRAS62在进化过程中发生了DELLA 基因的丢失事件,或者该基因不包含典型的“DELLA”和“DXLLX”五肽结构而导致[48]。
分析91个HbGRAS 基因的内含子和外显子结构发现,无内含子的HbGRAS 基因比例(69.23%)与同科的木薯(53.25%)[20]、蓖麻(78.3%)[22]和麻风树(95.83%)[21]类似,均较高。内含子可以增加基因长度及重组频率,有利于物种进化[49]。虽然内含子较少的基因在物种进化或重组中没有优势,但它们往往对压力反应迅速[50]。因此,推测许多橡胶树GRAS 基因成员可能会对环境变化做出快速响应。
基因扩增是基因组进化的重要驱动力,可以导致新的功能基因的产生和新物种的分化,从而使植物在进化过程中更好地适应环境[17]。染色体定位结果显示,HbGRAS 基因位于除Chr11外的几乎所有染色体上,这可能是进化过程中发生片段丢失或染色体移位导致。同时,发现有17 个HbGRAS 基因(18.68%)发生串联重复事件,所有具有串联重复序列的HbGRAS 基因均来自同一亚家族,且主要集中在LISCL 亚家族中(58.82%)。这意味着,基因复制保留在全基因组复制后存在一定程度的偏倚,不同亚家族的保留和丢失也不同。另外,有研究发现,如果蛋白质与基因编码的其他产物存在相互作用,则在复制事件发生后,这类基因会发生偏置[51]。共线性分析显示,片段重复区域中有87 个HbGRAS 基因(95.6%),说明片段重复在橡胶树GRAS 基因进化中可能发挥主要作用。
GA促进植物次生细胞壁形成[52],DELLA通过与相关转录因子互作调控水稻次生细胞壁中纤维素合成[53]。外施GA3 抑制橡胶树木质部DELLA表达,DELLA亚家族成员HbGRAS82 和HbGRAS89在木质部中高表达,且随橡胶树木质化程度加深上调表达,故推测它们可能参与橡胶树次生细胞壁的形成。拟南芥DELLA 蛋白竞争性地阻止阻遏蛋白JAZ 与转录因子MYC2 结合,从而提高MYC2 对靶基因的调控能力[54];WILD等[55]证实拟南芥RGL3能分别与MYC2 和JAZ 蛋白互作,进而调控JA 介导的响应;MYC2是调控橡胶生物合成途径之一——JA 信号途径的关键因子。吴绍华等[56]发现割胶和MeJA调控橡胶树HbGAIPB基因的表达。本研究结果显示橡胶树DELLA亚族成员在胶乳中均有表达,且除HbGRAS44外其他成员都含有MeJA 响应元件。据此,推测橡胶树DELLA基因可能通过调控JA 信号途径参与橡胶生物合成。以上结果为进一步研究橡胶树GRAS基因的生物学功能、调控橡胶树生长发育与逆境响应的分子机制奠定了一定的理论基础。