谷子OFP基因家族的鉴定及表达分析
2020-04-22韩渊怀马芳芳
郭 昱 ,李 娜 ,李 珊 ,韩渊怀 ,,段 明 ,马芳芳 ,
(1.山西农业大学农学院,山西太谷030801;2.山西农业大学生物工程研究所,山西太谷030801)
谷子(Setaria italica)为一年生草本植物,属于禾本科狗尾草属,大约公元前6 000 a,谷子从狗尾草驯化而来,成为我国北方主要的谷类作物[1]。谷子具有抗旱、耐贫瘠的特点,在炎热和干燥的月份,仅需要少量的水就可以快速成熟,对不利农业生态条件具有很强的适应性。谷子是生活在干旱、半干旱地区的贫困农民不可或缺的植物遗传资源,广泛分布于亚洲、北非和美洲其他地区的干旱和半干旱地区。自谷子参考基因组于2012年公布后,促进了谷子各结构特征、进化基因组学和生理特性的研究和谷子基因、基因组和功能资源的开发[2]。谷子基因组小(1 c~515 mb,2n=2x=18)、DNA重复序列少、近交性和短生命周期(一些种质42 d),是一种新型的模式研究植物[3]。
OFP(OVATE familyprotein)蛋白家族是一类调节植物生长和发育的特异性转录因子[4],Ovate基因首先在番茄中被克隆,其C末端具有约70个氨基酸的结构域,被命名为OVATE结构域,并且在番茄、拟南芥和水稻中保守[5-6]。在拟南芥中,有18个OFP基因,其中,AtOFP1具有抑制植物细胞伸长的转录活性因子的作用,过量表达AtOFP1的拟南芥植株表现出异常的形态学表型,因为AtOFP1抑制了赤霉素(GA)生物合成酶基因AtGA20ox1的表达[7]。AtOFP4可以通过与各种KNAT和BLH蛋白物理相互作用,形成TALE-OFP蛋白质相互作用网络,调节拟南芥束间纤维中的次生细胞壁形成[8]。由AtOFP5介导的BELL-KON XTALE蛋白复合体的异位活性抑制,对于拟南芥胚囊的正常发育和细胞形态的确定非常重要[9]。在水稻中,OsOFP2的过度表达改变了叶片形态和种子形状,并通过下调OsGA20ox7的表达来抑制赤霉素的水平。OsOFP8通过油菜素内酯信号通路调节水稻叶片倾斜,在该信号通路中,OsOFP8与OsGSK2相互作用并被OsGSK2磷酸化[10]。近年来发现,OFP基因家族除了调控植物的生长和发育外,其成员还参与了植物的逆境响应调节。在植物的生长和发育过程中,经常受到干旱等各种环境压力的影响,对植物的生长发育不利。许多植物基因已被证明在应对非生物胁迫中起着重要作用,前人研究发现,NAC、MYB等蛋白参与一种或多种抵抗非生物胁迫机制[11-12]。MA等[13]研究发现,OsOFP6不仅调控水稻的生长发育,而且调节植株对干旱和寒冷的响应。OsOFP6在水稻中的过度表达可增强抗旱性和抗寒性,而抑制表达会导致超敏反应,其在决定植物高度、粒径、侧根发育以及对非生物胁迫的反应中起着重要作用。
干旱是制约作物生产力和影响世界生态系统的主要因素。据预测,全球气候变化导致的长期和更严重的干旱事件将加剧其对农作物的负面影响,并危及全球粮食安全[14]。植物抗旱机制的研究、抗旱基因的挖掘、抗旱品种的培育,将有利于缓解由干旱造成的作物产量下降的危机。OFP基因家族在拟南芥、水稻中研究较多,且已经在水稻中发现OFP基因家族成员可调节植株对干旱的响应[13]。而OFP基因家族在抗旱性较强的谷子中的作用研究相对较少。
本研究结合谷子基因组信息,利用生物信息学方法,就谷子中所有OFP基因家族成员对蛋白理化性质、基因结构、保守基序、顺式作用元件、染色体定位、进化树及其表达模式进行分析,旨在为进一步研究该家族在谷子中的抗旱等功能,改良谷子的抗旱性提供数据基础。
1 材料和方法
1.1 材料
供试谷子品种为豫谷1号(YG)和安-04(AN),由山西农业大学杂粮育种团队提供。
1.2 方法
1.2.1 获取基因组序列 从Phytozome数据库(https://phytozome.jgi.doe.gov/pz/portal.html) 下载谷子(Setaria italica v2.2)、拟南芥(Arabidopsis thaliana TAIR10)和水稻(Oryza sativav7_JGI)的基因组序列。
1.2.2 谷子OFP家族基因的筛选及基因定位 下载OFP的OVATE保守域蛋白序列(Pfam数据库编号PF04844)。通过HMMER中的hmmsearch命令对谷子的OFP基因数据进行比对搜索[15],设置比对值E值<0.01。使用Pfam中的Batchsearch(http://pfam.xfam.org/search#searchBatchBlock)对检索到的蛋白序列结构域进行验证。使用TBtools[16]和谷子的基因组注释gff3文件对基因定位结果进行可视化。
1.2.3 谷子OFP家族基因的理化性质分析 利用ExPASY-ProtParam在线软件(https://web.expasy.org/protparam/)对谷子OFP家族基因蛋白的氨基酸数目、等电点和分子量进行分析。
1.2.4 谷子OFP家族基因的进化分析 使用MEGA软件[17]对OFP基因家族蛋白序列进行多序列比对,采用MaximumLikelihood算法构建进化树,BootStrap参数设置为1 000,其他参数选择默认。
1.2.5 谷子OFP家族基因的基因结构分析 在Phytozome数据库中下载谷子OFP家族基因的CDS序列,结合谷子基因组序列,利用GSDS在线软件(http://gsds.cbi.pku.edu.cn/)构建 OFP 基因的结构图。
1.2.6 谷子OFP家族基因的保守基序及保守结构域分析 谷子OFP家族的保守基序利用MEME进行分析[18],并使用TBtools对谷子OFP家族基因的motif进行可视化。
1.2.7 谷子OFP家族基因启动子分析 将谷子OFP家族基因的启动子序列上传至PlantCARE(http://bio informatics.psb.gent.e/eboolslantcare/html)数据库,对谷子OFP家族基因进行顺式作用元件分析。
1.2.8 谷子OFP家族基因共线性分析及选择压力分析 为了解谷子OFP家族与拟南芥、水稻种间基因的共线性,用MCScanX[19]软件对谷子OFP家族基因进行共线性分析,使用TBtools可视化谷子OFP家族基因与拟南芥、水稻的种间共线性关系。利用Dna SP6[20]软件对存在的共线性基因进行Ka、Ks以及Ka/Ks分析,分析OFP家族基因在进化过程中所受到的选择压力。
1.2.9 谷子OFP家族基因蛋白序列的亚细胞定位预测 通过 PSORT Prediction(http://psort1.hgc.jp/form.html)对谷子OFP家族基因的蛋白序列进行亚细胞定位预测。
1.2.10 谷子OFP家族基因的组织表达情况和干旱胁迫下的表达分析 谷子OFP基因在不同诱导下不同组织的表达数据来源于Phytozome数据库,谷子OFP基因响应干旱胁迫的表达数据来源于山西农业大学生物工程研究所实验室的转录组测序数据。具体信息为:抗旱谷子品种豫谷1号和干旱敏感谷子品种安-04于光照培养室种植,出苗7 d后,保持土壤相对含水量在65%。14 d后处理组停止浇水,进行自然干旱。干旱处理7 d后,大部分叶片出现萎蔫,分别于光照和黑暗时取样,选取植株最新完全展开叶片。利用FastQC[21-22]软件对原始测序数据进行质量评估,再利用Trimmonatic[23]软件去除接头、过滤低质量的reads,得到clean data。利用Hisat2[24]软件将clean data比对到谷子基因组中(Setaria italica v2.2),下载谷子基因组序列和注释信息,采用StringTie[25]进行表达水平定量,采用pheatmap包绘制表达热图。
2 结果与分析
2.1 谷子OFP家族基因的鉴定、理化性质和基因定位
通过Pfam数据库分析后,筛选得到谷子OFP家族基因共34个;蛋白质理化性质分析发现,谷子中 OFP蛋白的氨基酸序列长度在198(Seita.5G128600)~542个(Seita.5G211000),平均序列长度为304个,等电点在4.19(Seita.7G297300)~11.63(Seita.3G178000),不稳定指数为 42.74~90.41,谷子OFP家族蛋白都属于不稳定蛋白,脂溶指数为52.29~73.10,总平均疏水指数为-0.83~-0.01(表1),说明谷子中OFP蛋白都属于亲水性蛋白。基因定位可视化结果显示(图1),除了4号染色体不含有OFP基因外,其他8条染色体上均含有OFP基因,其中,5号染色体上分布的成员最多,有9个OFP基因,1、6号染色体上分布最少,均只有1个OFP基因。
表1 谷子OFP家族基因的序列特征
续表1
2.2 谷子OFP系统进化分析
为了进一步明确不同物种间OFP基因的亲缘进化关系,基于谷子的34条OFP家族的蛋白序列和拟南芥数据库中下载的18条OFP蛋白序列和水稻数据库中下载的6条水稻OFP蛋白序列构建系统进化树,结果显示,谷子中的OFP家族被分为三大亚类(图2)。其中,第I类(紫色分支)中只有13个谷子OFP家族成员,表明这些基因在谷子中较拟南芥和水稻相对保守;第II类(绿色分支)中有8个谷子OFP家族成员与5个拟南芥OFP家族成员同源性较高;第III类(红色分支)中有13个谷子OFP家族成员与7个拟南芥OFP家族成员和4个水稻OFP家族成员同源性较高。
2.3 谷子OFP基因家族的基因结构分析
基因结构分析显示(图3),34个谷子OFP基因可以分为三大类,仅基因Seita.7G115500和Seita.7G093000含有内含子结构,且编码序列被内含子分成2个部分,谷子OFP家族基因Seita.5G391700、Seita.3G130900、Seita.5G211000、Seita.9G245400、Seita.3G178000、Seita.3G205300、Seita.3G225700 只含有编码序列。
2.4 谷子OFP家族基因保守基序及保守结构域 分析
对谷子的OFP家族基因的蛋白序列进行保守基序分析,分别命名为motif1~motif 8(图4),结果表明,谷子中仅存在2个相对保守的基序motif1和motif2以及一个潜在的保守基序motif3。其中,10个OFP家族基因仅具有motif1和motif2,且保守基序排布顺序均为motif1、motif2;在剩余的24个基因被鉴定到 motif 1、motif 2、motif 3,除了基因 Seita.5G307100中保守基序排布顺序为motif 3、motif 1、motif2外,其余23个谷子基因中保守基序排布顺序均为motif1、motif2、motif3。说明OFP家族基因在谷子中比较保守。
2.5 谷子OFP家族基因启动子顺式作用元件
提取谷子的OFP家族基因的启动子序列,进行顺式作用元件预测,结果发现(图5),34个OFP家族基因共预测到14类顺式作用元件。其中,34个基因都被预测到的顺式作用元件与光响应相关,仅基因Seita.2G432400预测到与调控类黄酮生物合成相关;激素类相关的顺式作用元件预测到的有生长素、赤霉素、脱落酸、茉莉酸和水杨酸,表明OFP家族在谷子中可能参与激素调控代谢途径;谷子中的OFP家族基因预测到直接与胁迫相关的顺式作用元件有低温和干旱,表明OFP家族基因在谷子中可能直接参与寒冷和干旱2个非生物胁迫过程。
2.6 共线性分析及选择压力分析
对谷子OFP家族基因与拟南芥、水稻的种间共线性分析结果如图6所示。
从图6可以看出,谷子OFP家族基因中仅有5个基因与拟南芥5个基因存在共线性,其中,谷子 OFP家族基因 Seita.3G205300、Seita.5G363400和Seita.3G286300都与拟南芥的AT2G30400和AT5G01840存在共线性,表明这3个OFP家族基因在谷子中可能存在相似的功能;谷子与水稻共线性的基因数目较多,其中,34个OFP家族基因中有32个与水稻31个基因存在共线性,表明谷子OFP家族基因与水稻中的基因存在较近的亲缘性,仅Seita.2G184300和Seita.5G128600这2个OFP基因在谷子中较保守,既不与水稻存在基因共线性也不与拟南芥存在基因共线性。
对共线性基因进行选择压力分析可知(表2),谷子OFP家族基因与拟南芥的Ka/Ks值均小于1,表明谷子OFP家族基因在与拟南芥基因的进化中可能受到了纯化选择作用;在与水稻共线性基因的Ka/Ks分析中,基因Seita.9G412200与水稻中的LOC_Os05g39950、LOC_Os07g48150以及基因Seita.8G037300与LOC_Os01g64430的Ka/Ks值均大于1,表明这2个谷子OFP基因在进化选择过程中受到正选择作用。
表2 谷子OFP基因与水稻和拟南芥共线性基因的选择压力分析
2.7 谷子OFP家族基因亚细胞定位分析
对筛选到的34个谷子OFP家族基因进行亚细胞定位预测,结果显示(图7),预测定位到细胞核的基因数目最多,有18个基因被预测定位到了细胞核内,仅1个基因(Seita.5G128600)被预测定位到了叶绿体基质上,其余基因分别被定位到了细胞质、内质网、线粒体内膜、线粒体基质和质膜上。
2.8 谷子OFP家族基因的表达模式分析
从Phytozome数据库下载谷子OFP家族基因在各组织的表达量,将其制作成热图(图8-A),结果显示,谷子OFP家族基因在穗中表达量最多;蓝光、远红光诱导下的地上组织中表达量最少,基因Seita.9G245400、Seita.3G225700、Seita.5G233400 在红光诱导下的地上组织中表达量最大,基因Seita.5G211000只在强光诱导下生长2周的叶片中表达,基因Seita.3G130900只在强光诱导下生长1周的谷子幼苗中表达,在其他诱导下几乎不表达。
为了分析OFP家族基因在谷子干旱胁迫下的表达模式,利用谷子转录组数据OFP家族基因表达结果进行分析,结果显示(图8-B),干旱敏感品种安-04黑夜干旱处理组与黑夜对照组相比,OFP家族基因除了基因Seita.6G002800显著上调外;大多显著下调;白天干旱处理组与白天对照组相比,谷子OFP家族基因Seita.2G184300显著下调,基因Seita.7G093000显著上调,其他OFP家族基因在2组中表达量都很低;抗旱品种豫谷1号黑夜干旱处理组与黑夜对照组相比,OFP家族基因大多显著下调,白天干旱处理组与白天对照组相比,除基因Seita.3G008900显著上调外,其他基因大多表达下调或相似。可以看出,干旱敏感品种安-04和抗旱品种豫谷1号在黑夜干旱处理条件下于各自黑夜对照组相比,OFP家族基因大多表达下调。
3 结论与讨论
Ovate基因最初被发现是控制番茄和茄子果实梨形发育的一个主要的数量性状位点(QTL)[26]。LIU等[27]研究进一步证实,Ovate基因的过表达使番茄梨形果表型恢复成圆形果表型,Ovate蛋白可以抑制果实颈部的生长,是一类在植物发育中起着重要作用的负性调节蛋白。之后,研究者在拟南芥和水稻中相继发现,OFP家族基因广泛地参与了调节植物的生长和发育过程。除此之外,MA等[13]研究又发现,水稻中OsOFP6可以调节植株对干旱和寒冷的响应,证实OFP家族基因还参与了植物的逆境响应调节,关于OFP家族基因在谷子中的研究尚未见报道。所以,研究OFP家族基因在谷子中的特征和功能是非常有意义的。
本研究通过Pfam数据库分析筛选得到34个谷子OFP家族基因,基因定位显示,3、5、9号染色体拥有OFP家族基因最多,分别为8、9、6个。系统进化树分析表明,谷子OFP家族基因分成三大亚类,在进化上I类OFP家族基因较拟南芥和水稻在谷子中保守,仅含有13个谷子OFP家族基因。基因结构分析显示,谷子OFP基因基本不含有内含子结构,仅基因Seita.7G115500和Seita.7G093000具有内含子。谷子OFP家族基因蛋白序列均含有motif1和motif2这2种保守基序,且排布顺序都为motif1在前,motif2在后,谷子OFP基因家族成员具有高度的保守性。OFP家族基因启动子顺式作用元件预测到光响应、类黄酮生物合成、激素调控代谢途径、低温和干旱等,其中,22个谷子OFP家族基因的启动子顺式作用元件预测到与干旱诱导相关,表明谷子OFP家族基因可能参与谷子的干旱响应调节。谷子与水稻共线性的基因数目较多,表明谷子OFP家族基因与水稻中的基因存在较近的亲缘性。对共线性基因进行选择压力分析表明,谷子OFP家族基因与拟南芥的Ka/Ks值均小于1,表明谷子OFP家族基因在与拟南芥基因的进化中可能受到了纯化选择作用。亚细胞定位显示,超过1/2的OFP家族基因定位在细胞核内,符合转录因子的一般特征。
本研究还发现,谷子OFP基因在穗中表达量最多,在豫谷1号和安-04对照、处理各组中表达情况差异很大,表达具有时空特异性。豫谷1号干旱处理组与对照组相比以及安-04黑夜干旱处理组与黑夜对照组相比,OFP家族基因大多表现下调,这与苹果中OFP家族基因表现一致[28],可能是由于谷子在受到干旱胁迫时,作为调节植物生长和发育的转录因子OFP家族基因感受到胁迫信号而表现下调,从而抑制下游控制植物生长和发育的靶基因表达水平,使谷子植株生长发育受到抑制;安-04白天干旱处理组与白天对照组相比,只有OFP家族基因Seita.2G184300显著下调,基因Seita.7G093000显著上调,豫谷1号白天干旱处理组与白天对照组相比,只有基因Seita.3G008900显著上调,这些基因的表达差异可能是造成豫谷1号和安-04抗旱性差异较大的原因之一,但仍需进一步验证。本研究结果可为OFP基因家族在谷子中的功能研究提供基础。