APP下载

小麦TaNAC基因基于可变剪切和microRNA的转录后调控分析

2021-12-09吕士凯马小龙张敏邓平川陈春环张宏刘新伦吉万全

中国农业科学 2021年22期
关键词:外显子结构域剪切

吕士凯,马小龙,张敏,邓平川,陈春环,张宏,刘新伦,吉万全

西北农林科技大学农学院/旱区作物逆境生物学国家重点实验室,陕西杨凌 712100

小麦TaNAC基因基于可变剪切和microRNA的转录后调控分析

吕士凯,马小龙,张敏,邓平川,陈春环,张宏,刘新伦,吉万全

西北农林科技大学农学院/旱区作物逆境生物学国家重点实验室,陕西杨凌 712100

【目的】以条锈菌和白粉菌胁迫的普通小麦(Triticum aestivum L.)为研究对象,分析由可变剪切(alternative splicing,AS)形成的TaNAC 结构变异转录本,同时分析TaNAC 基因的microRNA 调控位点,为进一步解析TaNAC 基因通过转录后调控参与小麦响应真菌胁迫奠定基础。【方法】普通小麦兼抗种质N9134 在被白粉菌和条锈菌分别侵染后,各8 个时间点取样并混合,然后从混合样本中克隆得到大量TaNAC 转录本。参考中国春小麦基因组注释信息(IWGSC RefSeq v1.1)进行比对,选择由可变剪切形成的TaNAC 序列结构变异转录本 ,分析它们的序列结构特征。利用生物信息学软件和在线工具,对这些TaNAC 结构变异转录本编码产物的功能结构域、高级结构、理化性质、亚细胞定位等特征和变异情况进行比对分析。同时,利用洋葱表皮细胞瞬时表达系统验证其中1 对TaNAC 结构变异转录本的亚细胞定位预测结果,并选取5 组TaNAC基因的可变剪切序列结构变异转录本进行酵母转录自激活试验,研究序列结构变异对TaNAC 基因转录调控活性的影响。此外,利用miRBase 数据库收录的小麦中已报道的miRNAs 和TaNAC 基因,进行靶基因预测分析,建立小麦TaNAC 家族成员与miRNAs的靶向关系。【结果】以条锈菌和白粉菌侵染的普通小麦兼抗种质N9134 为材料,克隆得到的TaNAC 转录本中的35 条序列结构变异转录本由13 个TaNAC 基因可变剪切形成。通过分析发现,同一TaNAC 基因由可变剪切形成的不同结构变异转录本的核酸序列结构存在差异,而且其对应编码产物的功能结构域、高级结构、理化性质和亚细胞定位等方面均会存在差异,同时也会表现出不同的转录调控活性;不同TaNAC 基因的可变剪切方式存在差异,而且它们的结构变异转录本及其编码产物在结构特征、理化性质和转录调控活性等方面也均呈现出多样性的特征。通过分析TaNAC 基因与其在编码序列区域的靶标tae-miRNAs,发现具有可变剪切转录本的TaNAC 基因与tae-miRNA 的结合位点均在其非可变剪切区域。【结论】TaNAC 基因可以通过可变剪切这种转录后调控方式参与小麦对真菌胁迫的响应;同时发现,调控TaNAC 基因的tae-miRNA 可以独立于可变剪切这种转录后调控方式行使功能。

小麦;TaNAC 转录因子;microRNA;可变剪切;转录后调控;胁迫响应

0 引言

【研究意义】NAC(no apical meristem,NAM;Arabidopsistranscription activation factor,ATAF;cup-shaped cotyledon,CUC)转录因子基因家族几乎在植物的所有组织器官,以及包括形态发生、生长发育、衰老、对生物和非生物逆境胁迫响应等在内的生命过程各个阶段均发挥重要作用[1-5]。前期研究发现,在白粉菌(Powdery mildew,P,Blumeria graminisf.sp.tritici)和条锈菌(Stripe rust,S,Puccinia striiformis Westend.f.sp.Tritici Eriks.)胁迫下,普通小麦(Triticum aestivumL.)NAC 转录因子的编码基因会由可变剪切(alternative splicing,AS)等转录后调控形成大量的结构变异转录本[6]。此外,小麦NAC 转录因子的表达会受到microRNA(miRNA)的调控[7]。了解小麦中TaNAC 可变剪切事件,分析TaNAC 的miRNA 调控因子,对解析小麦通过可变剪切和miRNA 转录后调控方式响应真菌胁迫的机制具有重要作用。【前人研究进展】NAC 转录因子是植物特有且家族成员数量最多的一类转录因子基因家族[8]。NAC 转录因子得名于其保守的一致性序列,一般包括来自矮牵牛(Petunia hybrida)的 NAM 以及来自拟南芥(Arabidopsis thaliana)的转录激活因子ATAF1,2 和CUC2[9-10]。NAC转录因子的蛋白序列一般包括一个高度保守且具有DNA 结合结构域的N 末端,以及行使转录调控功能且结构多变的C 末端[11-12]。据报道,模式植物拟南芥和水稻(Oryza sativaL.)的转录因子家族分别有138和170 个成员[13-14],而普通小麦为异源六倍体,具有庞大的基因组,其NAC 转录因子家族成员众多,中国春小麦参考基因组(IWGSC RefSeq v1.1)有460个NAC 基因位点,注释的转录本数量更是多达559条[6,15]。目前,关于NAC 转录因子的功能研究已有很多报道,仅在普通小麦中就有涉及叶片衰老等生长发育相关的NAM-A1、TaNAC-S等[16-17],参与低温、干旱等非生物逆境胁迫响应的TaNAC69、TaNAC47等[18-19],参与条锈病、赤霉病抗性等生物逆境胁迫响应相关的TaNAC30、TaNACL-D1等[20-21],也有基于全基因组层面的对小麦NAC 转录因子家族成员的特性进行系统分析的报道[6,15]。NAC 转录因子在行使转录调控功能时,其自身一般也会受到转录调控、转录后调控、翻译后调控等多种不同层次的调控[22]。其中,NAC 转录因子的转录后调控一般与胁迫响应有关[22],其转录后调控包括miRNA 和可变剪切等调控方式。miRNA 是一类广泛存在于真核生物、长度为20—24个核苷酸的内源非编码单链RNA,在多种生物过程中发挥重要的转录后调控作用[8]。通过与基因的ORF 区结合,裂解靶标mRNA 和抑制其翻译,是miRNAs分子发挥转录后调控功能的一种重要方式[23]。据报道,一些NAC 转录因子会受到miR164 家族成员的调控,如tae-miR164 和TaNAC21/22 互作,调控小麦对条锈病菌的抗性[7]。可变剪接作为一种重要的转录后调控方式,可以改变mRNA 的序列结构,进而在植物抗病等压力胁迫响应过程中发挥调节作用[24]。【本研究切入点】普通小麦中含有数量众多的NAC 转录因子,但TaNAC 相关研究与其数量相比却相对不足[7,20,25]。植物NAC 基因含有大量可变剪切事件,但是关于它们的这种转录后调控方式研究有限[6,26],在小麦中关于TaNAC 基因可变剪切的研究更是少之又少[6]。可变剪切带来的序列结构变异可能会影响miRNA 与靶标基因在编码区结合[27],但是小麦TaNAC 基因相关的可变剪切和miRNA 这两种转录后调控的综合研究鲜见报道。【拟解决的关键问题】本研究通过分析病菌胁迫后克隆得到的TaNAC 结构变异转录本的特征,探究TaNAC 基因基于可变剪切在小麦胁迫响应中的转录后调控规律;分析已经鉴定的所有TaNAC 转录本的调控miRNA,完善调控小麦TaNAC 基因的miRNA 家族成员;通过分析TaNAC基因的可变剪切结构变异转录本的结构特征及其与miRNAs 在编码序列区域的结合位点,探究在TaNAC基因转录后调控中可变剪切与miRNA 的关系。

1 材料与方法

1.1 试验材料

冬小麦优异种质N9134 由西北农林科技大学通过染色体工程育种技术从阿勃5B 缺体和野生二粒小麦AS846 的杂交后代选育而来。N9134 对中国目前鉴定的所有白粉菌和多种条锈菌表现高抗到免疫,其在1B和5BL 染色体均含有1 个抗性基因位点[28]。条锈菌生理小种CYR31 和CYR32 由西北农林科技大学植物保护学院提供,白粉菌生理小种E09 由西北农林科技大学小麦远缘杂交与分子染色体工程育种实验室(本室)保存。高感白粉病的普通小麦品种陕优225 和高感条锈病的普通小麦地方品种辉县红的种子由本室保存,分别作为2 种病菌接种质量的对照材料。

1.2 材料处理

选取N9134、陕优225 和辉县红3 个小麦材料的等量种子,置于培养皿中,加入没过种子的无菌蒸馏水,于23℃恒温黑暗培养箱中培养约48 h,挑选芽和根发育良好且一致的幼苗移入装有育苗基质的瓦盆,转入光照培养箱培养。在18℃光照16 h/12℃黑暗8 h条件下培养5—7 d,待幼苗长至5—10 cm,利用抖粉的方式接种。白粉菌生理小种 E09 和条锈菌CYR31、CYR32 混合小种分别在陕优225 和辉县红上提前诱发培养。3 种小麦材料的培养条件、接种方式、接种量等均保持一致,通过陕优225 和辉县红的发病情况判断N9134 的接种质量。每个材料均设置3个生物学重复,在接种后0、12、24、36、48、72、96 和120 h 对分别接种白粉菌和条锈菌的N9134 进行取样,每个时间点的样本由3 个生物学重复的各1 株的叶片混样组成,取样后,立即液氮冷冻,然后-80℃保存备用。

1.3 基因克隆

2 种病菌分别侵染后的8 个时间点样本全部取样完毕后,利用Trizol(Invitrogen, Carlsbad, CA, USA)分别提取总计16 个样本的总RNA,后续利用DNaseⅠ消化样本中的DNA 并对提取的RNA 进行纯化。纯化后的RNA 用1%琼脂糖电泳进行质量检测,并用超微量分光光度计(Nanodrop ND-1000; Nanodrop Technologies, Wilmington, DE, USA)测定浓度。将16个样本(白粉菌和条锈菌2 种胁迫各8 个时间点的样本)的等量RNA 混合后反转录合成cDNA,反转录试剂选用PrimescriptTMII 1st Strand cDNA Synthesis Kit(TaKaRa,大连,中国)。

整合本室报道的白粉菌和条锈菌胁迫下N9134 苗期的转录组测序数据[6,29]和中国春小麦参考基因组(IWGSC RefSeq v1.1)数据,并参考在NCBI 中比对得到的山羊草等近缘物种的同源基因序列,利用Primer 5.0 软件设计引物(表1),以上述cDNA 为模板批量克隆TaNAC 基因。使用PrimeSTAR HS DNA Polymerase(TaKaRa,大连,中国)进行PCR 扩增,经电泳、目的片段回收、3′平末端加“A”尾、TA 克隆并蓝白斑筛选、菌落PCR 验证后,阳性克隆送至公司测序,最后分析测序结果。涉及的引物合成和测序均在北京奥科鼎盛生物科技有限公司进行。

表1 TaNAC 可变剪切结构变异转录本的克隆引物序列Table 1 The primer sequences of TaNAC structural variation transcripts with alternative splicing in the gene cloning experiment

1.4 洋葱表皮细胞瞬时表达分析亚细胞定位

选取1 对具有可变剪切结构变异的TaNAC 转录本构建融合表达GFP 载体,利用洋葱表皮细胞瞬时表达分析其亚细胞定位。

构建重组pYJ-GFP 载体时,由限制性内切酶SpeⅠ酶切完成载体线性化;TaNAC 编码区序列由特异引物从连接有相应目的片段的T 载体经过PCR 扩增、电泳、回收后获得。然后利用ClonExpress II One Step Cloning Kit(诺唯赞,南京,中国)同源重组定向克隆,完成各pYJ-GFP 重组载体的构建。PCR 扩增使用高保真酶,特异引物由pYJ-GFP 载体酶切位点同源臂的通用接头序列(F:5′-TAGCCATGGTAGATCTG-3′;R:5′-GCCTTACGTAACTAGT-3′)和各目标编码框的起始和终止内侧约20 bp 的特异序列组合成,其中,反向特异引物去除终止密码子。重组pYJ-GFP 载体经PCR 扩增检测和测序验证后使用。

将重组pYJ-GFP 载体和空白对照载体(pYJ-GFP)转化到农杆菌(GV3101),然后利用液体LB 培养基培养至OD600约1.0,侵染经过预处理的洋葱表皮,然后把侵染后的洋葱表皮置于MS 固体培养基中28℃暗培养16—24 h,利用激光共聚焦显微镜(Olympus,IX83-FV12003040101)观察并拍照。

1.5 转录调控活性分析

选取共计5 组TaNAC 可变剪切结构变异转录本(具有外显子跳跃或内含子保留的可变剪切方式)为代表,分组进行转录调控活性试验。共构建17 个重组pGBKT7 载体,构建重组pGBKT7 载体时,由限制性内切酶EcoRⅠ和BamHⅠ双酶切完成载体线性化;pGBKT7 同源臂的通用接头序列为F:5′-CAT GGAGGCCGAATTC-3′和R:5′-CTGCAGGTCGAC GGAT-3′,反向特异引物不需要去除终止密码子;其余过程和使用的试剂等同构建重组pYJ-GFP 载体过程类似。

以构建好的各TaNAC 转录本编码序列的重组pGBKT7 载体为试验组、以载体 pGBKT7-53+pGADT7-T 为阳性对照组、以pGBKT7 空载体为阴性对照组,同步分别转化至酵母菌株Y2H Gold 中,涂布于SD/-Trp 固体培养基平板,在30℃恒温条件下黑暗培养3—5 d,挑选阳性单克隆,于SD/-Trp 液体培养基中扩繁,在200 r/min,30℃震荡培养至OD600达到0.6 左右时,以100、10-1、10-2和10-3的相对浓度稀释菌液,各取2 μL 分别点涂于SD/-Trp、SD/-Trp/X-α-Gal、SD/-Trp/AbA、SD/-Trp/-His/-Ade 固体培养基,于30℃黑暗培养3—5 d,观察各培养基上菌株的生长情况,分组分析结果,每组包括同一TaNAC 基因不同转录本的试验组、阳性对照和阴性对照,以此判断各重组载体携带转录本的转录调控活性。

1.6 生物信息学分析

利用多序列比对软件Cluster X 和BioEdit 比对分析核酸序列结构;利用SMART 工具(http://smart.emblheidelberg.de/)和NCBI 数据库中的Conserved Domain Search Service(CD Search)程序(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)分析这些编码产物的保守结构,同时在NCBI 网站(https://www.ncbi.nlm.nih.gov/)利用BLASTP 程序确认了不含NAC 保守结构域的序列属性;利用ExPASy(https://web.expasy.org/protparam/)的ProtParam 工具分析克隆得到的TaNAC转录本编码肽链的理化性质;利用TMHMM server v.2.0(https://services.healthtech.dtu.dk/service.php?TMHMM-2.0)预测这些肽链的跨膜结构域;利用CELLO server v.2.5(http://cello.life.nctu.edu.tw/)预测它们的亚细胞定位信息;利用SOPMA(https://npsaprabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)和SWISS-MODEL(https://swissmodel.expasy.org/interactive)分别对这些肽链的二级和三级结构进行预测;上述操作没有特殊说明均以默认设置运行。

结合从中国春小麦参考基因组(IWGSC RefSeq v1.1)鉴定得到的高可信度的460 个基因位点的559条TaNAC 转录本[6],利用psRNATarget(https://www.zhaolab.org/psRNATarget/analysis?function=2)设置期望值(expectation)≤3.5 反向搜索小麦miRNA数据库,预测调控TaNAC 基因的miRNA 及其结合位点。

2 结果

2.1 TaNAC 结构变异转录本的克隆

RNA 质量检测结果(图1)表明,提取过程中DNaseⅠ处理效果理想,所有总RNA 样本均没有gDNA 残留,保证了克隆得到的TaNAC 转录本不存在基因组序列的污染。利用这些总RNA 的混合样本进行基因克隆,图2 展示了部分基因PCR 扩增产物的1.5%琼脂糖凝胶电泳结果。利用小麦参考基因组(IWGSC RefSeq v1.1)比对得到的TaNAC 转录本序列,并对相似度高的序列进行深入分析,根据序列差异与相似度进行分类,确定各自所属的部分同源染色体及对应的物理位置,据此排除部分同源染色体上同源基因可能带来的序列结构差异的干扰。从克隆得到的TaNAC 转录本中[6],筛选出13 个TaNAC 基因(表2)的35 条序列结构变异转录本进行转录后调控分析(转录本TaNAC017_5D.4提取自中国春参考基因组IWGSC RefSeq v1.1;其余转录本均已提交至GenBank数据库并获得了相应的登录号)。在进行基因克隆和序列分析时已经排除了其他可能的序列结构变异影响因素,因此,这些转录本中存在的序列结构变异应该都是由可变剪切形成的,具体包括外显子跳跃和内含子保留2 种方式。

分析这些TaNAC 结构变异转录本的序列特征,发现有些由外显子跳跃形成的新转录本仍可按照可变剪切前原转录本的编码顺序正常编码,如TaNAC_NTL5_7B.3;有些新转录本的编码框会发生移码导致相对原转录本分段编码,如TaNAC017_5A.4;有些新转录本的编码框会发生移码导致开放阅读框(Open reading frame,ORF)相对原转录本提前终止,如TaNAC013_3A.3。同样,内含子保留形成的新转录本也会出现上述3 种情况。同时存在外显子跳跃和内含子保留的转录本,变异情况相对复杂,但概括起来仍和上述情况一样,包括新转录本可以正常编码和不能正常编码。

表2 克隆得到的13 个基因可变剪切形成的35 条TaNAC 结构变异转录本Table 2 The 35 TaNAC structural variation transcripts cloned from 13 genes by alternative splicing

N:正常;S:分段;P:提前终止
N: Normal; S: Segmented; P: Premature termination

2.2 TaNAC 可变剪切转录本的序列结构分析

选取获得的4 个TaNAC 基因(外显子跳跃和内含子保留这两种可变剪切方式各2 个)进行序列结构分析(图 3)。外显子跳跃形成的新转录本TaNAC_NTL5_7B.3相对TaNAC_NTL5_7B.2,在其起始密码子88 bp 位置后,缺失1 053 bp 序列,涉及第1个外显子后端389 bp 序列,第2 个外显子全部210 bp序列和第3 个外显子前端454 bp 的序列,但是TaNAC_NTL5_7B.3的读码没有变化,只是相较TaNAC_NTL5_7B.2,其编码产物几乎缺失了NAM 保守结构域的全长(图3-a)。TaNAC013_3A.3因为外显子跳跃缺失了第3 个外显子中段偏前的43 bp 序列(位于原转录本ORF 起始密码子之后的770—812 bp的序列),其读码方式在其缺失处之后出现移码,导致在ORF 的第801 位即提前出现了终止密码子TGA;相应未出现外显子跳跃的2 条转录本TaNAC013_3A.1和TaNAC013_3A.2,在起始密码子后的第778 位有1 个碱基的差异,导致其编码产物在第260 位由丝氨酸(S)突变为甘氨酸(G)(S260G),而此碱基变异位点恰好位于TaNAC013_3A.3被跳跃的43 bp 序列区间(图3-b)。转录本TaNAC011_7D.1相对TaNAC011_7D.2在其第2 个外显子后插入了一段602 bp 的内含子(具有GT-AG 结构特征),保留了内含子的TaNAC011_7D.1可以正常编码,而无这一内含子的TaNAC011_7D.2则出现了分段编码的情况,其在ATG 之后的第387 位即出现了终止密码TAG,同时,在其第2 个外显子的第159 位又出现了一个可以按照TaNAC011_7D.1读码方式的起始密码子(图3-c)。转录本TaNAC024_3D.1和TaNAC024_3D.2均可顺利读码,它们仅在第3 个外显子末端存在3 bp 的有无差异;而TaNAC024_3D.3相对TaNAC024_3D.2在第2个外显子后保留了一段140 bp 的内含子(具有GT-AG结构特征),两者的其余序列完全一样;转录本TaNAC024_3D.3在ATG 之后第198 位即出现了终止密码子TAG,但其在插入的内含子序列区域另有一个起始密码子,形成总长1 233 bp 的编码序列,包括插入内含子序列后端的 30 bp 以及与TaNAC024_3D.2的ORF 后端完全一样的1 203 bp序列(图3-d)。

2.3 TaNAC 结构变异转录本编码产物的结构特征和理化性质分析

选取的35 条TaNAC 结构变异转录本中有24 条能够正常编码(TaNAC017_5D.4直接从中国春参考基因组IWGSC RefSeq v1.1 提取),本研究对它们编码产物的保守结构域、跨膜结构域等结构特征和氨基酸的总平均疏水性(grand average of hydropathicity,GRAVY)、理论等电点等理化性质进行分析或预测,发现在结构特征方面,不同剪切方式形成的结构变异转录本,其编码产物的保守结构域和跨膜结构域均可能存在有无的差异(表3),如:TaNAC_NTL5_7B.2编码具有NAM 保守结构域的肽链,而因外显子跳跃形成的新转录本TaNAC_NTL5_7B.3的编码产物缺失了NAM 保守域;转录本TaNAC008_3A.1编码的多肽在C 末端具有跨膜结构域,而外显子跳跃形成的新转录本TaNAC008_3A.2编码的多肽却丢失了这一结构。

在理化性质方面(表3),这些TaNAC 转录本的编码产物均表现亲水性(总平均疏水性负值是亲水蛋白,正值为疏水蛋白),可变剪切事件没有改变这一特性,且对应的脂肪系数变化也很小;而在蛋白质的稳定性(稳定蛋白系数<40,不稳定蛋白系数>40)、理论等电点方面,TaNAC 转录本却可能因可变剪切事件使其编码产物表现出性质上的改变,如TaNAC_NTL5_7B.2编码稳定蛋白而其外显子跳跃序列异构转录本TaNAC_NTL5_7B.3编码不稳定蛋白;TaNAC008_3A.1编码产物等电点为5.67(<7)为酸性蛋白,而其外显子跳跃序列异构转录本TaNAC008_3A.2编码的多肽链等电点为9.08(>7)为碱性蛋白。另外,TaNAC 可变剪切转录本的编码产物在功能域和理化性质方面的变化,可能会导致其亚细胞定位发生变化。

表3 克隆得到的13 组TaNAC 结构变异转录本中正常编码产物的结构特征和理化性质Table 3 Structural characteristics and physicochemical properties of the peptides encoded by the 13 groups of normal encoding transcripts selected from the cloned TaNAC transcripts

S:分段;o:外侧;i:内侧;Nu:细胞核;Ex:胞外;Cy:细胞质;Ch:叶绿体;Mi:线粒体。*:转录本从中国春小麦参考基因组(IWGSC RefSeq v1.1)中获得
S: Segmented; o: Outside; i: Inside; Nu: Nuclear; Ex: Extracellular; Cy: Cytoplasmic; Ch: Chloroplast; Mi: Mitochondrial.*: The transcript was obtained from the wheat reference genome of Chinese Spring (IWGSC RefSeq v1.1)

2.4 TaNAC 可变剪切结构变异转录本编码产物的高级结构分析

选取的13 组TaNAC 可变剪切转录本中有7 组均包含至少2 条可正常编码的转录本(提前终止视为正常编码),对这7 组转录本编码产物的二级和三级结构进行预测,并分组进行比较分析(表4)。结果表明,TaNAC008_3A和TaNAC092_2B可变剪切形成的结构变异转录本的编码产物,二级结构变化较大(表4,图4-a1—a4)。转录本TaNAC008_3A.2相对于TaNAC008_3A.1,其编码产物形成α 螺旋(alpha helix)的氨基酸比例降低约50%(从28.48%降至14.65%),而形成延伸链(extended strand)结构的氨基酸比例则从12.47%增至21.72%;而转录本TaNAC092_2B.1和TaNAC092_2B.3之间编码肽链的二级结构的变化主要体现在 α 螺旋(氨基酸的比例从 18.93%增加至37.02%)和无规则卷曲(random coil)(氨基酸的比例从63.84%降至42.98%)。

基于二级结构的差异,分别对转录本TaNAC008_3A.1、TaNAC008_3A.2、TaNAC092_2B.1和TaNAC092_2B.3编码产物的三级结构进行了预测(图4-b1—图4-b4),发现这4 条多肽序列在构建三级结构时均以水稻的压力响应转录因子NAC1 为模型,相似序列区间均在其肽段N 末端具有DNA 结合功能的NAM 保守结构域,且构建的三级结构相似,均为中间凹陷的结构,符合其功能特征。但是,预测得到的三级结构在相对于水稻NAC1 的整体和局部的质量评估等参数及结构本身等方面均存在差异(图4-b1—b4),其中TaNAC008_3A.2(图4-b2)相对于TaNAC008_3A.1(图4-b1),其编码产物除了图示的三级结构差异外,还缺失了一段位于C 末端的α 螺旋结构;而TaNAC092_2B.1(图4-b3)和TaNAC092_2B.3(图4-b4)编码产物之间在预测的图示三级结构本身即有较明显差异。

2.5 TaNAC 结构变异转录本的亚细胞定位的比对分析

根据表3 中的预测结果,选择亚细胞定位信息有差异的结构变异转录本TaNAC013_3A.2和TaNAC013_3A.3,利用洋葱表皮细胞瞬时表达系统进行了亚细胞定位分析(图5)。结果显示,对照组(pYJ-GFP)的洋葱表皮细胞中,荧光信号在细胞核、细胞质、细胞膜中都有分布。试验组中,转化TaNAC013_3A.2-pYJ-GFP 重组载体的洋葱表皮细胞中,融合绿色荧光蛋白在多个位置表达,细胞核、细胞质中均可观察到明显的绿色荧光信号;而转化TaNAC013_3A.3-pYJGFP 载体的洋葱表皮细胞中,只在细胞核的位置能够观察到绿色荧光信号。在分别瞬时表达2 个转录本的洋葱表皮细胞中,存在细胞核以外的绿色荧光信号差异,说明转录本TaNAC013_3A.2可以细胞核外(细胞质)表达,而TaNAC013_3A.3仅能在细胞核表达。结果和表3 中的预测结果基本吻合。

2.6 TaNAC 结构变异转录本的转录调控活性的比较分析

通过对选取的5 组TaNAC结构变异转录本进行酵母自激活检测,发现它们对于α 半乳糖苷酶编码基因MEL-1 的转录激活活性均有不同(图6-a 和表5)。其中,TaNAC013_3A.1-pGBKT7 重组载体的转化菌株有转录激活活性(B3),而代表TaNAC013_3A.2的菌株无转录激活活性(B4),这两条转录本仅在起始密码子之后第778 位有1 个碱基的差异,导致编码产物在第260 位存在丝氨酸(S)和甘氨酸(G)的变异;同时,这碱基变异位点位于转录本TaNAC013_3A.3外显子跳跃事件涉及的43 bp 序列区间,而代表TaNAC013_3A.3的菌株均具有转录激活活性(B1 和B2);这些结果表明,这一具有单碱基变异的外显子跳跃区间(770—812 bp)序列在其转录调控中具有关键作用。在营养缺陷型培养基(SD/-Trp/-His/-Ade)和金担子素A(aureobasidin A,AbA)筛选培养基(SD/-Trp/AbA)上,仅有TaNAC008_3A的2 个转录本重组pGBKT7 载体转化的阳性Y2H Gold 酵母菌株(A1 和A2)表现出生长状态的差异,即转录本TaNAC008_3A.1在上述2 种条件下均具有转录激活活性而TaNAC008_3A.2均不表现转录激活活性(图6-b 和表5);而其他4 组TaNAC 基因共计 15 条结构变异转录本的重组pGBKT7 载体转化的阳性Y2H Gold 酵母菌株在这两种培养基上均能够正常生长,且生长情况无差异,即这些转录本在这两种条件下均具有转录激活活性(表5)。

2.7 结合于小麦TaNAC 基因编码区的miRNA 的预测分析

根据miRNA 数据库miRBase(http://www.mirbase.org/)中的最新数据,目前报道的普通小麦中miRNA前体和成熟miRNA 的数量分别为122 和125 个,分为99 个miRNA 家族。利用psRNATarget 预测调控TaNAC 基因的miRNA 及其结合位点时,搜索设置的期望值(expectation≤3.5)比建议条件(expectation≤5)更严格,所以预测结果会有更高的可信度。根据预测结果,小麦中共有40 个TaNAC 基因通过可变剪切形成的45 条转录本在编码区具有miRNA 结合位点(表6)。这45 条TaNAC 转录本共受到miRBase 数据库中收录的小麦含有的8 个miRNA 家族的9 个成熟miRNA 的调控,其中tae-miR164 调控数量最多的TaNAC 基因(18 个)和转录本(21 条),其次为tae-miR1128 可以调控11 个TaNAC 基因编码的12 条转录本。tae-miRNA 对TaNAC 转录本编码区的调控方式主要为形成 RNA 诱导的沉默复合体(RNA inducing silencing complex,RISC)裂解靶标mRNA(41/46),另有5 组调控方式为miRNA 介导的翻译抑制。

表5 5 组TaNAC 基因的17 条结构变异转录本的转录调控活性分析结果Table 5 Results of transcriptional activation of 17 structural variant transcripts from five TaNAC genes

表6 小麦参考基因组(IWGSC RefSeq v1.1)注释的TaNAC 转录本与小麦tae-miRNA 的靶向关系预测结果Table 6 The predicted relationship of the TaNAC transcripts in IWGSC RefSeq v1.1 and the tae-miRNA

续表6 Continued table 6

分析tae-miRNA 靶标TaNAC 基因编码序列上的结合位点发现,tae-miR1128、tae-miR9677a 和tae-miR9780 与其各自对应的TaNAC 转录本(总计16条)在NAM 保守结构域编码区结合,调控它们的表达;其余miRNA 和TaNAC 转录本的结合位点靠近ORF 的3′端。本研究涉及的所有能够发生可变剪切的TaNAC 基因,其转录本与miRNA 的结合位点均位于非可变剪切区域。这些结果表明,调控TaNAC 基因表达的miRNA 和可变剪切是各自独立行使转录后调控功能的。

3 讨论

3.1 TaNAC 基因可以通过可变剪切的转录后调控方式参与胁迫响应

本研究通过对克隆得到的TaNAC 基因的可变剪切转录本序列分析发现,可变剪切可以导致TaNAC转录本编码序列结构变异,进而改变其编码产物的序列结构,即改变其对应蛋白的保守结构域和跨膜结构域等结构特征。对应地,编码序列结构变异会影响其编码产物的高级结构、理化性质和亚细胞定位等。进一步分析发现,由可变剪切导致的TaNAC转录本编码序列结构变异也会带来相应编码产物转录调控活性的功能变化。综上所述,可变剪切事件导致TaNAC 转录本编码序列变异,其编码产物的结构和理化性质等也会发生相应变化,进而可能影响其亚细胞定位,最终通过其各自编码产物对靶基因的识别、结合和转录调控等方面的变化,影响TaNAC 转录因子调控其下游靶基因的表达。另外,有报道表明,在小麦抗病[30-31]、籽粒发育[32]等过程中均有可变剪切这种转录后调控方式参与,因此,推断TaNAC 基因应该可以通过可变剪切这种转录后调控方式参与胁迫响应。

本文选取并分析的13 组TaNAC 可变剪切结构变异转录本是在条锈菌和白粉菌胁迫下,从普通小麦兼抗种质N9134 中克隆得到的,这些可变剪切形成的新TaNAC 转录本大多没有被中国春参考基因组(IWGSC RefSeq v1.1)注释到,但是,它们到底是由于材料差异而特异存在的,还是因为小麦为了响应条锈菌和白粉菌的胁迫由可变剪切形成的,这些还需要深入研究。另外,基于克隆得到的TaNAC可变剪切结构变异转录本在小麦参考基因组注释信息中不存在的事实,推断小麦TaNAC 基因在特定组织、不同生长阶段、或为了响应特定逆境,可能会通过可变剪切这种转录后调控方式,形成更多的转录本。本研究仅发现、比对了这些TaNAC 可变剪切结构变异转录本,并对它们进行了初步分析,然而TaNAC 基因可变剪切结构变异的影响因素、调控机制、引起的功能变化和对下游靶基因的影响等还需要进一步研究。

3.2 TaNAC 基因可变剪切和miRNA 耦联的转录后调控

从miRBase 数据库收录的miRNA 最新数据可知,在小麦、玉米(Zea maysL.)、水稻这三种最重要的粮食作物和两种常用的模式植物拟南芥和二穗短柄草(Brachypodium distachyon(L.) Beauv.)中,小麦中的miRNA 前体和成熟miRNA 的数量均是最少的(表7)[33]。比较这5 个物种中其他功能基因家族成员数量的差异[6,14],可以发现,基因组较小的物种所包含的基因家族成员数量一般不会比小麦、玉米等较大基因组的物种多。miRNA 作为功能基因的调控因子均有对应的靶基因,据此推断,小麦、玉米等大基因组的物种中,miRNA 家族的成员数量应该不会比基因组较小的模式植物少,至少不会像目前这样差距如此之大(表7)。

进一步对已报道的不同物种中miRNA 家族成员的存在情况进行比较分析(图7),发现仅有miR156、miR159、miR160 等14 个miRNA 家族在上述5 个物种中同时存在,其余miRNA 家族成员大多为单个物种独有。综合上述分析推断,基因组庞大且复杂的小麦中应该存在大量的miRNA 待继续挖掘。

目前,见诸报道的调控NAC 基因的miRNA 多为miR164 家族成员[7,34-35]。本研究利用已报道的小麦TaNAC 基因家族和tae-miRNAs 数据,预测到TaNAC基因除了tae-miR164 家族同样可以受到其他miRNA家族的转录后调控,如tae-miR1128 等。本研究丰富了靶向调控小麦TaNAC 基因表达的tae-miRNA,但具体它们之间的调控关系、共同发挥的生物学功能等还需深入研究;基于小麦中有大量miRNA 待挖掘,所以能够靶向调控TaNAC 基因的tae-miRNA 应该能够继续丰富。

表7 小麦、玉米、水稻、二穗短柄草和拟南芥中已报道miRNAs 的汇总分析Table 7 Summary and analysis of miRNAs reported in Triticum aestivum, Zea mays, Oryza sativa, Brachypodium distachyon and Arabidopsis thaliana

miRNA 可以通过和靶基因的ORF 区结合参与转录后调控[23],本研究分析结果显示,在小麦中,tae-miRNA 与TaNAC 基因ORF 区的结合位点均不涉及可变剪切事件,但因为小麦TaNAC 基因应该存在更多的可变剪切事件[6],同时推断小麦中应该存在更多的miRNA,所以可以考虑将可变剪切和miRNA 耦联的转录后调控方式作为它们各自单独对TaNAC 基因进行转录后调控的扩充进行研究。

4 结论

同一编码基因可变剪切形成的结构变异转录本可以具有不同的生物学功能,据此推断,TaNAC基因应该可以通过可变剪切这种转录后调控方式参与小麦真菌胁迫响应。另外发现,TaNAC 基因相关的miRNA 相对于可变剪切独立行使转录后调控功能。

References

[1] FUJITA M, FUJITA Y, MARUYAMA K, SEKI M, HIRATSU K,OHME-TAKAGI M, TRAN L S, YAMAGUCHI-SHINOZAKI K,SHINOZAKI K.A dehydration-induced NAC protein, RD26, is involved in a novel ABA-dependent stress-signaling pathway.The Plant Journal, 2004, 39(6): 863-876.

[2] TRAN L S, NAKASHIMA K, SAKUMA Y, SIMPSON S D, FUJITA Y, MARUYAMA K, FUJITA M, SEKI M, SHINOZAKI K,YAMAGUCHI-SHINOZAKI K.Isolation and functional analysis ofArabidopsisstress-inducible NAC transcription factors that bind to a drought-responsivecis-element in theearly responsive to dehydration stress 1promoter.The Plant Cell, 2004, 16(9): 2481-2498.

[3] GUO Y, GAN S.AtNAP, a NAC family transcription factor, has an important role in leaf senescence.The Plant Journal, 2006, 46(4):601-612.

[4] HU H, DAI M, YAO J, XIAO B, LI X, ZHANG Q, XIONG L.Overexpressing a NAM, ATAF, and CUC (NAC) transcription factor enhances drought resistance and salt tolerance in rice.Proceedings of the National Academy of Sciences of the United States of America,2006, 103(35): 12987-12992.

[5] XU B, OHTANI M, YAMAGUCHI M, TOYOOKA K, WAKAZAKI M, SATO M, KUBO M, NAKANO Y, SANO R, HIWATASHI Y,MURATA T, KURATA T, YONEDA A, KATO K, HASEBE M,DEMURA T.Contribution of NAC transcription factors to plant adaptation to land.Science, 2014, 343(6178): 1505-1508.

[6] LV S, GUO H, ZHANG M, WANG Q, ZHANG H, JI W.Large-scale cloning and comparative analysis of TaNAC genes in response to stripe rust and powdery mildew in wheat (Triticum aestivumL.).Genes (Basel), 2020, 11(9): 1073.

[7] FENG H, DUAN X, ZHANG Q, LI X, WANG B, HUANG L, WANG X, KANG Z.The target gene of tae-miR164, a novel NAC transcription factor from the NAM subfamily, negatively regulates resistance of wheat to stripe rust.Molecular Plant Pathology, 2014,15(3): 284-296.

[8] RIECHMANN J L, HEARD J, MARTIN G, REUBER L, JIANG C,KEDDIE J, ADAM L, PINEDA O, RATCLIFFE O J, SAMAHA R R,CREELMAN R, PILGRIM M, BROUN P, ZHANG J Z, GHANDEHARI D, SHERMAN B K, YU G.Arabidopsistranscription factors:Genome-wide comparative analysis among eukaryotes.Science, 2000,290(5499): 2105-2110.

[9] SOUER E, VANHOUWELINGEN A, KLOOS D, MOL J, KOES R.Theno apical meristemgene of petunia is required for pattern formation in embryos and flowers and is expressed at meristem and primordia boundaries.Cell, 1996, 85(2): 159-170.

[10] AIDA M, ISHIDA T, FUKAKI H, FUJISAWA H, TASAKA M.Genes involved in organ separation inArabidopsis: An analysis of thecup-shaped cotyledonmutant.The Plant Cell, 1997, 9(6): 841-857.

[11] OOKA H, SATOH K, DOI K, NAGATA T, OTOMO Y, MURAKAMI K, MATSUBARA K, OSATO N, KAWAI J, CARNINCI P,HAYASHIZAKI Y, SUZUKI K, KOJIMA K, TAKAHARA Y,YAMAMOTO K, KIKUCHI S.Comprehensive analysis of NAC family genes inOryza sativaandArabidopsis thaliana.DNA Research, 2003, 10(6): 239-247.

[12] OLSEN A N, ERNST H A, LEGGIO L L, SKRIVER K.NAC transcription factors: Structurally distinct, functionally diverse.Trends in Plant Science, 2005, 10(2): 79-87.

[13] MUROZUKA E, MASSANGE-SANCHEZ J A, NIELSEN K,GREGERSEN P L, BRAUMANN I.Genome wide characterization of barley NAC transcription factors enables the identification of grain-specific transcription factors exclusive for the Poaceae family of monocotyledonous plants.PLoS ONE, 2018, 13(12): e0209769.

[14] TIAN F, YANG D C, MENG Y Q, JIN J, GAO G.PlantRegMap:Charting functional regulatory maps in plants.Nucleic Acids Research,2020, 48(D1): D1104-D1113.

[15] GUERIN C, ROCHE J, ALLARD V, RAVEL C, MOUZEYAR S,BOUZIDI M F.Genome-wide analysis, expansion and expression of the NAC family under drought and heat stresses in bread wheat (T.aestivumL.).PLoS ONE, 2019, 14(3): e0213390.

[16] ZHAO D, DERKX A P, LIU D C, BUCHNER P, HAWKESFORD M J.Overexpression of a NAC transcription factor delays leaf senescence and increases grain nitrogen concentration in wheat.Plant Biology (Stuttgart), 2015, 17(4): 904-913.

[17] HARRINGTON S A, OVEREND L E, COBO N, BORRILL P, UAUY C.Conserved residues in the wheat (Triticum aestivum) NAM-A1 NAC domain are required for protein binding and when mutated lead to delayed peduncle and flag leaf senescence.BMC Plant Biology,2019, 19(1): 407.

[18] XUE G P, BOWER N I, MCINTYRE C L, RIDING G A, KAZAN K,SHORTER R.TaNAC69 from the NAC superfamily of transcription factors is up-regulated by abiotic stresses in wheat and recognises two consensus DNA-binding sequences.Functional Plant Biology, 2006,33(1): 43-57.

[19] ZHANG L, ZHANG L, XIA C, ZHAO G, JIA J, KONG X.The novel wheat transcription factor TaNAC47 enhances multiple abiotic stress tolerances in transgenic plants.Front Plant Science, 2015, 6: 1174.

[20] PEROCHON A, KAHLA A, VRANIC M, JIA J, MALLA K B,CRAZE M, WALLINGTON E, DOOHAN F M.A wheat NAC interacts with an orphan protein and enhances resistance to Fusarium head blight disease.Plant Biotechnology Journal, 2019, 17(10):1892-1904.

[21] WANG B, WEI J, SONG N, WANG N, ZHAO J, KANG Z.A novel wheat NAC transcription factor, TaNAC30, negatively regulates resistance of wheat to stripe rust.Journal of Integrative Plant Biology,2018, 60(5): 432-443.

[22] PURANIK S, SAHU P P, SRIVASTAVA P S, PRASAD M.NAC proteins: Regulation and role in stress tolerance.Trends in Plant Science, 2012, 17(6): 369-381.

[23] AMERES S L, ZAMORE P D.Diversifying microRNA sequence and function.Nature Reviews.Molecular Cell Biology, 2013, 14(8):475-488.

[24] ZHANG H, MAO R, WANG Y, ZHANG L, WANG C, LV S, LIU X,WANG Y, JI W.Transcriptome-wide alternative splicing modulation during plant-pathogen interactions in wheat.Plant Science, 2019, 288:110160.

[25] ZHANG X M, ZHANG Q, PEI C L, LI X, HUANG X L, CHANG C Y, WANG X J, HUANG L L, KANG Z S.TaNAC2 is a negative regulator in the wheat-stripe rust fungus interaction at the early stage.Physiological and Molecular Plant Pathology, 2018, 102: 144-153.

[26] WANG H-L, ZHANG Y, WANG T, YANG Q, YANG Y, LI Z, LI B,WEN X, LI W, YIN W, XIA X, GUO H, LI Z.An alternative splicing variant of PtRD26 delays leaf senescence by regulating multiple NAC transcription factors inPopulus.The Plant Cell, 2021,33: 1594-1614.

[27] REDDY A S, MARQUEZ Y, KALYNA M, BARTA A.Complexity of the alternative splicing landscape in plants.The Plant Cell, 2013,25(10): 3657-3683.

[28] XUE F, JI W, WANG C, ZHANG H, YANG B.High-density mapping and marker development for the powdery mildew resistance genePmAS846derived from wild emmer wheat (Triticum turgidumvar.dicoccoides).Theoretical and Applied Genetics, 2012, 124(8):1549-1560.

[29] ZHANG H, YANG Y, WANG C, LIU M, LI H, FU Y, WANG Y, NIE Y, LIU X, JI W.Large-scale transcriptome comparison reveals distinct gene activations in wheat responding to stripe rust and powdery mildew.BMC Genomics, 2014, 15(1): 898.

[30] ZHANG H, MAO R, WANG Y, ZHANG L, WANG C, LV S, LIU X,WANG Y, JI W.Transcriptome-wide alternative splicing modulation during plant-pathogen interactions in wheat.Plant Science, 2019, 288:110160.

[31] SANCHEZ-MARTIN J, WIDRIG V, HERREN G, WICKER T,ZBINDEN H, GRONNIER J, SPORRI L, PRAZ C R, HEUBERGER M, KOLODZIEJ M C, ISAKSSON J, STEUERNAGEL B,KARAFIATOVA M, DOLEZEL J, ZIPFEL C, KELLER B.WheatPm4resistance to powdery mildew is controlled by alternative splice variants encoding chimeric proteins.Nature Plants, 2021, 7(3):327-341.

[32] GAO P, QUILICHINI T D, ZHAI C, QIN L, NILSEN K T, LI Q,SHARPE A G, KOCHIAN L V, ZOU J, REDDY A S N, WEI Y,POZNIAK C, PATTERSON N, GILLMOR C S, DATLA R, XIANG D.Alternative splicing dynamics and evolutionary divergence during embryogenesis in wheat species.Plant Biotechnology Journal, 2021,19: 1624-1643.

[33] KOZOMARA A, BIRGAOANU M, GRIFFITHS-JONES S.miRBase:From microRNA sequences to function.Nucleic Acids Research, 2019,47(D1): D155-D162.

[34] FANG Y, XIE K, XIONG L.Conserved miR164-targeted NAC genes negatively regulate drought resistance in rice.Journal of Experimental Botany, 2014, 65(8): 2119-2135.

[35] KIM J H, WOO H R, KIM J, LIM P O, LEE I C, CHOI S H, HWANG D, NAM H G.Trifurcate feed-forward regulation of age-dependent cell death involvingmiR164inArabidopsis.Science, 2009, 323(5917):1053-1057.

Post-transcriptional Regulation of TaNAC Genes by Alternative Splicing and MicroRNA in Common Wheat (Triticum aestivum L.)

LÜ ShiKai, MA XiaoLong, ZHANG Min, DENG PingChuan, CHEN ChunHuan, ZHANG Hong, LIU XinLun,JI WanQuan
College of Agronomy, Northwest Aamp;F University/State Key Laboratory of Crop Stress Biology for Arid Areas, Yangling 712100,Shaanxi

【Objective】 In the present study, the common wheat (Triticum aestivum L.) was exposed to the stress of stripe rust and powdery mildew.Then the cloned TaNAC structural variation transcripts formed by alternative splicing were analyzed.And putative information of TaNAC genes regulated by miRNAs was annotated.It would shed light on the study of TaNAC genes in response to fungal stress of wheat at the post-transcriptional level.【Method】 After common wheat resistance germplasm N9134 being infected stripe rust and powdery mildew respectively , the leaves were sampled at eight time points.Then a large number of TaNAC transcripts were cloned from the mixed sample pool.Referring to the wheat genome annotation of Chinese Spring (IWGSC RefSeqv1.1), the sequence structure characteristics of TaNAC structural variation transcripts formed by alternative cutting were revealed.Using bioinformatics software and online tools, the coding products derived from these TaNAC transcripts were compared and analyzed, including the functional domain, advanced structure, physical and chemical properties, subcellular localization and other characteristics.And then, one pair of TaNAC structural variation transcripts were selected to further verify the predicted subcellular localizations by onion epidermis transient expression system.Meanwhile, five groups of TaNAC transcripts were conducted transcriptional self-activation experiments in yeast.It was aimed to analyze the effects of structural variation, which caused by alternative splicing on transcriptional regulation activity.Additionally, using the miRBase database, the targeting relationship between TaNAC genes and tae-miRNAs was forecasted and established in wheat.【Result】 In this study, 35 TaNAC structural variation transcripts were formed by alternative splicing form 13 TaNAC genes, and they all were cloned from common wheat N9134 after infecting by stripe rust and powdery mildew.After analyzing, it was found that there were differences in the nucleic acid sequence structure of different structural variation transcripts from the same TaNAC gene, as well as in the functional domain, advanced structure, physicochemical properties and subcellular localization of their corresponding coding products.And they might be with different transcriptional regulatory activities.Moreover, different TaNAC genes could be with different patterns of alternative splicing, and the coded products of the structural variation transcripts from different TaNAC genes showed diversity in characteristics of structure, physical and chemical properties, transcriptional regulatory activity and so on.By analysis of TaNAC genes and their target tae-miRNAs, which is in the coding region, the result showed that the binding sites of tae-miRNAs were all in the non-alternative splicing region.【Conclusion】 In conclusion, TaNAC genes might be involved in the response of wheat to fungal stress through the post-transcriptional regulation of alternative splicing.And the tae-miRNAs targeted to TaNAC genes could function post-transcriptional regulation independently of alternative splicing.

wheat; TaNAC transcription factor; microRNA; alternative splicing; post-transcriptional regulation; stress responses

2021-02-10;

2021-04-07

陕西省重点研发计划(2019DLNY04-06)

联系方式:吕士凯,E-mail:lvshikaiyd@163.com。通信作者吉万全,E-mail:jiwanquan2008@126.com。通信作者刘新伦,E-mail:liuxxlun@126.com。通信作者张宏,E-mail:zhangh1129@nwafu.edu.cn

(责任编辑 李莉)

猜你喜欢

外显子结构域剪切
剪切变稀
细菌四类胞外感觉结构域的概述
考虑剪切面积修正的土的剪应力−剪切位移及强度分析1)
连退飞剪剪切定位控制研究与改进
外显子组测序助力产前诊断胎儿骨骼发育不良
UBR5突变与淋巴瘤B细胞成熟
TC4钛合金扩散焊接头剪切疲劳性能研究
人类组成型和可变外显子的密码子偏性及聚类分析
DEP结构域的功能研究进展
水稻DnaJ蛋白的生物信息学分析