苹果热激转录因子生物信息学及表达分析
2021-02-12王新亮
王新亮
(1.滨州学院学报编辑部,山东 滨州 256603; 2.滨州学院 山东省黄河三角洲生态环境重点实验室,山东 滨州 256603)
【研究意义】土壤盐碱化严重影响植物的生长,黄河三角洲是中国甚至世界增长最快的河口三角洲之一[1],也是我国沿海盐碱地高度集中的地区,约有50%的土地属于盐碱地[2]。苹果(Malus×domesticaBorkh.)是世界四大水果(苹果、葡萄、柑桔和香蕉)之一[3],也是我国种植面积和产量最多的水果,是果农重要的经济来源,但土壤盐碱化制约着苹果种植业的发展[4]。【前人研究进展】热激转录因子(Heat shock transcription factor,Hsf)对热、干旱、盐碱等多种非生物胁迫产生响应。研究表明Hsf在真核生物中高度保守[5],植物Hsf家族被分为A、B和C三个亚族[6-7]。植物中的Hsf至少含有 DNA 结合结构域(DBD)、寡聚化结构域(OD)两个结构域和一个核定位信号基序(NLS),C端激活基序(AHA)是A亚族特有的,大部分 Hsf还含有核输出信号(NES)结构域[7-8]。【本研究切入点】Hsf是一类广泛存在于植物体内的转录因子,研究发现在番茄、水稻、小麦、拟南芥和枣中分别至少存在26 个[9]、26 个[10-11]、56 个[12]、24 个[5]和21 个[7]Hsf。HsfA3可能在高温、干旱和盐胁迫的信号转导中发挥着重要作用[12-13]。HsfA2能调节番茄花药热胁迫保护机制的活性[14]。拟南芥HsfB1和HsfB2b能抑制热诱导型Hsf的表达,但在热胁迫条件下,他们同样能诱导热休克蛋白基因的表达,从而提高拟南芥的耐热性[15]。水稻中的OsHsfC1b在ABA介导的耐盐性中发挥着重要作用,而且它还参与渗透胁迫的响应[16]。【拟解决的关键问题】为了解苹果Hsf的生物信息、表达特性和功能信息,利用苹果基因组GDDH13 v1.1,通过Hsf结构域特异氨基酸序列检索和关键词搜索,筛选出36 个Hsf成员,并对其中33个含有完整结构域的成员进行了亚细胞定位、系统进化树、序列分析、表达分析与功能预测,旨在分析苹果Hsf的基本信息和生物功能,以期为进一步分析Hsf在调节苹果响应热、盐碱、干旱等非生物胁迫中的分子机制提供参考。
1 材料与方法
1.1 材料与处理
实验在滨州学院黄河三角洲生态环境重点实验室苗圃中进行。首先利用0.2% KMnO4浸泡平邑甜茶种子30 min,再用流水洗净,然后与细沙混和均匀放在 4 ℃的冰箱中层积 60 d左右。露白的种子被种在育苗盘,育苗盘装有种植土(土、蛭石、沙的体积比为 1︰2︰3),发芽后用1/2 Hoagland 营养液( pH = 6.8 ± 0.2)浇灌,每隔5 d 1次。6~8 片真叶时,平邑甜茶苗用1/2 Hoagland 营养液(含有100 mmol/L NaCl、50 mmol/L Na2SO4、 50 mmol/L NaHCO3,pH =8)处理,叶片和新根分别在第 0、1、3、6 天被收集,除根0 d为2个重复,其他样品均为3 个重复,经液氮处理后储存于-80 ℃中。
1.2 RNA 提取与测序
用TRIzol(Invitrogen)法提取样品总RNA。利用磁珠从总RNA中富集mRNA,再用打断buffer使mRNA片段化,然后用随机N6引物反转录合成第一条链,再形成双链,最后进行PCR扩增;利用热变性得到PCR产物的单链,然后环化形成环状DNA文库。用BGISEQ-500平台(华大基因,深圳)进行测序,原始数据经纯化得到高质量序列,用 HISAT 将序列比对到苹果参考基因组Malus×domesticaGDDH13 Whole Genome v1.1(https://www.rosaceae.org/species/malus/malus_x_domestica/genome_GDDH13_v1.1)[17]。
1.3 苹果Hsf转录因子筛选与鉴定
利用Hsf结构域特异氨基酸序列(Pfam登录号:PF00447),在苹果基因组 GDDH13 v1.1蛋白序列中进行BLAST并通过“Heat shock transcription factor”关键词搜索筛选苹果Hsf候选成员。候选Hsf蛋白通过 Pfam (http://pfam.xfam.org)[18]和NCBI Conserved Domain Database(CDD,https://www.ncbi.nlm.nih.gov/cdd)进行确认。
1.4 Hsf蛋白理化性质、染色体定位与共线性分析
Hsf的理化性质和亚细胞定位分别通过ExPASy(https://web.expasy.org/protparam/)[19]和WoLF PSORT(https://wolfpsort.hgc.jp/)进行分析。
Hsf基因的染色体定位用 TBtools 软件的 Amazing Gene Location From GTF/GFF 工具分析;共线性分析用 Quick Run MCScanX Wrapper 和Text Merge For MCScanX工具分析,然后使用 Circle Gene View工具可视化。
1.5 Hsf基因的系统进化树与序列分析
拟南芥Hsf的氨基酸序列从拟南芥信息数据库(TAIR https://www.arabidopsis.org/)获得。系统进化树利用MEGA-X采用Neighbor-Joining (NJ)法构建,bootstrap 设置为 1000。利用MEME 5.3.0版本(http://memesuite.org/tools/meme)分析保守基序(数目设为10,宽度为6~90 aa)[20],通过 TBtools 软件的Gene Structure View(Advanced)进行基因结构分析并可视化。
1.6 Hsf表达与功能预测
利用平邑甜茶的RNA-seq数据通过Excel绘制Hsf的表达热图,因为有些基因在根和叶片中的表达差异较大,所以先分别对根和叶片的Hsf表达量进行标准化后再绘制热图。利用AppleMDO数据库(http://bioinformatics.cau.edu.cn/AppleMDO/)[21]以GDDH13 v1.1 homology withArabidopsis为参考进行基因本体(Gene Ontology,GO)分析,显著水平设置为0.01。通过在线软件 STRING[22](https://string-db.org)分析蛋白相互作用网络,物种来源选择苹果(Malusdomestica)。
2 结果与分析
2.1 Hsf转录因子的筛选与鉴定
利用Hsf结构域氨基酸序列,在GDR数据库苹果基因组(MalusxdomesticaGDDH13 Whole Genome v1.1)进行BLAST并通过关键词共检索到37个苹果候选Hsf,然后通过Pfam和NCBI Conserved Domain Database确认36个含有显著Hsf结构域,其中有3个含有的Hsf结构域不完整,因此本文只对33个含有完整Hsf结构域的成员做了进一步分析。表1列出了这些Hsf基因的定位、编码蛋白的氨基酸数量、分子量、等电点等理化性质。这些含有完整结构域的Hsf基因在除9号外的各个染色体上均有分布,它们的编码蛋白的氨基酸数为189~530;分子量为21 703.71~58 972.96;等电点为4.55~8.58。通过亚细胞定位预测发现,除MD00G1095900和MD02G1171800可能定位于叶绿体/细胞核中,MD05G1313700 可能定位于细胞核/线粒体中;其他Hsf蛋白均定位于细胞核中。
表1 苹果 Hsf 基因及蛋白信息
2.2 Hsf基因的染色体定位与共线分析
串联重复(Tandem duplication)、片段重复(segmental duplication)和转位事件(transposition events)是基因家族表达的主要原因[23]。串联重复是同一染色体上,200 kb内的片段上存在 2 个或2 个以上同一家族基因[24];而片段重复是不同染色体之间发生的基因重复事件[25]。基因组染色体定位分析显示,不同染色体上的Hsf基因数量存在差异(图1-A)。15号染色体含有5个含有完整结构域的Hsf基因,而7条染色体(1、3、6、7、11、14和17号染色体)上各只含有1个Hsf基因。因此,图1-A显示苹果Hsf基因没有串联重复,但共线性分析(图1-B)显示有 16对共24个苹果Hsf基因存在片段重复。
2.3 Hsf蛋白系统进化树、基因结构和保守基序分析
利用MEGA-X软件构建了苹果与拟南芥Hsf家族成员的系统进化树(图2-A)。根据拟南芥的分组方法将这些Hsf家族成员分成11组,其中苹果Hsf家族成员在A1组有4 个,A2组有2 个,A3组有2 个,A4组有3 个,A5组有2 个,A6/A7组有4 个,A9组有4 个;B1/B3组有5 个,B2组有3 个,B4组有2 个;C1组有2 个。基因结构分析显示进化树同一分支上基因的结构也相似(图2-B),但成员较多的组中,基因结构差异较大。图2-C显示这33个Hsf蛋白均含基序1和基序3,进化树同一分支上的Hsf蛋白的保守基序的数量和序列相似度也较高。
2.4 平邑甜茶Hsf基因在盐碱胁迫下的表达分析
由图3显示,盐碱胁迫1、3、6 d后的平邑甜茶幼苗叶和根中Hsf的表达情况,除MD15G1209400在叶片中没有检测到外,其他Hsf基因在根和叶中均检测到一次及以上的表达。在盐碱胁迫下,多数Hsf基因的表达显著下调。只有MD05G1213800、MD10G1197700、MD15G1283700在根和叶中的表达同时上调。
2.5 苹果Hsf蛋白GO分析
为了进一步了解苹果Hsf的功能,利用AppleMDO数据库的对这33个Hsf进行了GO功能分析。由表2显示,共涉及到36个GO条目,其中生物过程25个、分子功能4个、细胞组成 6个。除生物过程中的6个条目(次生代谢过程、分解代谢过程、对内源性刺激的反应、对胁迫的反应、对非生物刺激的反应、对刺激的反应)参与的基因较少,其余条目均有33个Hsf参与。
表2 苹果Hsf蛋白GO分析
2.6 蛋白相互作用网络分析
挑选了表达量较高且差异较大的下调基因MD03G1258300和上调基因MD15G1283700,利用STRING 在线软件构建了蛋白相互作用网络(图4),MD03G1258300与热激蛋白(Hsp40)、超氧化物歧化酶铜分子伴侣(copper chaperone for superoxide dismutase,CCS)、蛋白磷酸酶2C(protein phosphatase 2C,PP2C)、 蔗糖非发酵-1-相关蛋白激酶γ调节亚基(SNF1-related protein kinase regulatory subunit gamma-like PV42a,SnRK1-PV42a)相互作用;MD15G1283700与热激蛋白(Hsp90、Hsp83)、IAA氨基酸水解酶(IAA-amino acid hydrolase ILRl-like,ILR1)、碱性亮氨酸拉链(Basic region/leucine zipper 60,bZIP60)相互作用。
3 讨 论
本研究利用Hsf保守结构域和关键词检索,鉴定了36 个苹果Hsf家族成员,这与张国俊等[26]鉴定的数目不同,这可能是由于所使用的基因组版本不同引起的。本文只对33 个含有完整Hsf结构域的成员做了进一步分析。这33 个Hsf基因编码的蛋白质含有189~530 个氨基酸,分子量为21 703.71~58 972.96,等电点为4.55~8.58,与枣和南瓜中Hsf类似[7,27]。
染色体定位和共线性分析显示苹果Hsf基因没有串联重复,但有16对共24 个苹果Hsf基因存在片段重复,表明片段重复可能在苹果的Hsf基因家族进化和扩增中发挥这重要作用。Velasco等[28]报道称苹果相对较近的一次基因组重复发生在至少5 千万年前,导致苹果染色体由9 条变成为17 条。苹果基因组重复可能在基因家族扩张中起了重要作用。
系统进化树可以为同源基因功能的预测提供参考。拟南芥65%以上的热胁迫上调基因受AtHSFA1(AtHSFA1a、b、d、e)的调控,这 4个基因不仅在热胁迫中起着重要作用,还调控拟南芥的生长和发育[29]。因此,与AtHSFA1a、b、d、e在同一分支上的MD05G1213800、 MD06G1037900、MD10G1197700和MD16G1271200可能也具有类似的功能。HsfB1和HsfB2b除了能提高拟南芥耐热能力还具有提高抗病的能力[30]。MD02G1171800、MD04G1064700和MD15G1283700与上述2个基因较近,那么它们可能参与调节苹果的抗病性。
研究表明Hsf不仅是热应激防御反应的核心调节因子[31],还能调控植物对干旱、盐碱等非生物胁迫的响应。本研究中除MD15G1209400在叶片中没有表达外,其他Hsf基因的表达均受到盐碱处理影响。盐碱胁迫下,平邑甜茶大部分Hsf基因的表达下调,只有MD05G1213800、MD10G1197700、MD15G1283700的表达上调。表明苹果Hsf家族成员可能在调控盐碱胁迫响应中发挥重要作用。
GO功能分析显示Hsf共涉及到36个GO条目,除DNA结合等GO条目外,还包括多种生物合成和代谢过程,以及对刺激和胁迫的反应生物过程,表明苹果Hsf可能不仅在调控胁迫响应中起重要作用,而且调节其生长和发育。对MD03G1258300和MD15G1283700构建了蛋白相互作用网络,MD03G1258300与Hsp40、CCS、PP2C、SnRK1-PV42a相互作用;MD15G1283700与Hsp90、Hsp83、ILR1、bZIP60相互作用。Hsf和Hsp是热应激防御反应中的两个重要成员。植物Hsf通过与‘nGAAnnTCCn’特别结合来调控Hsp基因的表达,Hsp能稳定染色质和膜,促进蛋白质修复,提高植物耐热性并促进植物热损伤的恢复[32]。Boyd 等[33]发现CCS1能通过提供一个铜离子及催化每个未成熟的铜—锌超氧化物歧化酶(copper-zinc superoxide dismutase,SOD1)内二硫键的氧化来激活SOD1。PP2C可以通过多种信号转导途径来参与植物非生物胁迫响应[34]。在植物中,SnRK1是一类保守的丝氨酸/苏氨酸激酶,由α-催化亚基和β、γ两个调节亚基组成,PV42a是SnRK1的γ亚基[35]。SnRK1可以通过蔗糖合成酶(SS)控制碳水化合物代谢,能调节如3-羟基-3-甲基戊二酰—辅酶A还原酶(HMG-CoA还原酶)、磷酸蔗糖合成酶 (SPS)、硝酸还原酶(NR),而且它还在碳和氨基酸信号转导中发挥重要作用[36]。有研究表明,在玉米原生质体中,HSFTF13(HsfA6b成员)的启动子是bZIP60的一个靶标。bzip60突变体中,HSFTF13的表达降低并且高温下的热应激反应钝化,Hsp基因在高温下的表达不能正常上调[37]。因此,Hsf可以通过调节热激蛋白,活性氧清除酶等多种功能基因来调节植物抗逆反应[38]。
4 结 论
本研究在苹果基因组GDDH13 v1.1中检索找到36个Hsf家族成员,然后对其中33个含有完整Hsf结构域的基因做了进一步分析。这些热激转录因子基因编码的蛋白质含有189~530个氨基酸数,分子量为21 703.71~58 972.96,等电点为4.55~8.58,它们多数定位于细胞核中。染色体定位和共线性分析显示苹果Hsf基因没有串联重复,但有16对共24个苹果Hsf基因存在片段重复。在盐碱胁迫下,多数Hsf基因的表达显著下调。苹果Hsf家族成员可能在调控盐碱胁迫响应中发挥重要作用。