APP下载

杜仲YABBY基因家族的全基因组鉴定及生物信息学分析

2021-12-20赵德刚杨仕梅赵懿琛

种子 2021年11期
关键词:杜仲结构域元件

李 彪,赵德刚,杨仕梅,赵懿琛

(1.贵州大学生命科学学院/茶学院/山地植物资源保护与种质创新省部共建教育部重点实验室/贵州省农业生物工程重点实验室,贵阳 550025;2.贵州省农作物品种资源研究所,贵阳 550006;3.贵州省农业科学院,贵阳 550006)

YABBY基因是存在于种子植物中特有的转录因子基因家族,在植物的生长发育侧生器官的建成中起关键调控作用[1],其家族成员在叶及叶的衍生器官如子叶和花的发育中起关键作用。在植物的生长发育过程中,从早期的胚胎发育至后期侧生器官的分化,极性的建立起着重要的作用。随着遗传学和分子生物学技术的发展,人们对植物极性建立分子机理的认识也深入到分子水平。背腹极性是植物侧生器官发育过程中建立的主要极性之一,YABBY基因能调控拟南芥(Arabidopsisthalian)花的发育[2],YABBY基因家族在背腹极性的建立中发挥关键作用[3]。YABBY家族具有的典型结构域:C端YABBY结构域和N端的C 2 C 2型锌指结构域[4]。在其他植物中已得到广泛的研究,在水稻(OryzasativaL.)中,YABBY6参与了水稻叶的发育调控,与泡状细胞的发育相关[5];在苹果(Malusdomestica)中,在花、果和叶中的表达量较高,部分成员在果实发育时期明显上调表达[6];在辣椒(CapsicumannuumL.)中,YABBY基因家族成员广泛表达于叶和花[1];在番茄(Solanumlycopersicum)中,YABBY家族对根、茎、叶、花、蜜腺、心皮、胚珠等部位起到重要的调控作用,番茄YABBY基因家族部分成员具有较强组织特异性[7]。

杜仲(EucommiaulmoidesOliv.)是多年生的杜仲科落叶乔木,是我国独特的第三纪孑遗植物,是极重要的药用植物,并且杜仲的胶在航天航空设备中也有广泛的应用[8]。研究表明,杜仲具有抗高血压[9]、减肥[10]、抗糖尿病[11]、抗骨质疏松[12]、抗病毒、抗菌[13]、抗氧化[14]、抗肿瘤、保肝等功效。杜仲EuYABBY基因相关的研究尚未见报道,对该基因的挖掘和分析,可以为后续杜仲花、果实、子叶的分子机理研究提供一定基础和理论支撑。对杜仲基因组中关键功能基因的挖掘和研究至关重要,可为杜仲品种和种质资源改良提供技术支持,为杜仲可持续产胶产药等提供技术支持,以期能提高杜仲产业经济效益。本研究以拟南芥的YABBY基因为检索序列,挖掘杜仲基因组中的EuYABBY基因序列,并进行基因鉴定、基因结构分析、蛋白理化性质分析、系统进化、基因定位以及系列功能等分析,为杜仲基因组中EuYABBY基因家族的功能研究奠定了理论基础。

1 材料与方法

1.1 研究材料

杜仲基因组来自BIG(https://bigd.big.ac.cn/)数据库;拟南芥基因组数据库来自TAIR(http://www.arabidopsis.org/index.jsp)网站[15];苹果基因组来自GDR (Genome Database for Rosaceae)(http://www.phytozome.net/apple)数据库[6];桃树(PrunuspersicaL.)基因组来自Phytozome(https://phytozome.jgi.doe.gov/pz/portal.html)数据库[16]。

1.2 杜仲EuYABBY基因家族成员的鉴定及系统进化分析

从数据库Pfam(http://pfam.xfam.org/)下载EuYABBY家族的Stockholm (PF 04690)文件,通过HMMER软件与BIG数据库下载的杜仲蛋白数据库做比对,识别和鉴定杜仲EuYABBY基因家族成员。通过Pfam(http://pfam.xfam.org/)鉴定家族成员的保守结构域。蛋白理化性质利用在线工具ExPASy(https://www.expasy.org/resources)进行分析[17-18]。利用MEGA 7.0软件[19]对鉴定的杜仲基因组中EuYABBY基因家族氨基酸序列与拟南芥中6条[15]、苹果13条[6]和桃树15条EuYABBY基因家族[16]的氨基酸序列进行多重序列比对,采用邻接(Neighbor-Joining,NJ)算法构建进化树,进行1 000次Boot strap抽样,再通过iTOL(https://itol.embl.de/)在线软件对进化树进行美化和修饰。

1.3 杜仲EuYABBY基因结构及基序分析

利用在线工具GSDS(http://gsds.cbi.pku.edu.cn/)对杜仲EuYABBY基因家族成员进行基因结构分析。通过在线工具MEME(http://meme-suite.org/tools/meme)分析和预测杜仲EuYABBY蛋白的基序(motif)[20]。

1.4 杜仲EuYABBY基因的染色体定位和三级结构预测

从Ensembl植物全基因组数据库(http://plants.ensembl.org/Solanum_lycopersicum/)获得EuYABBY基因在基因组上的位置信息,并用在线工具MG 2 C(http://mg2c.iask.in/mg2c_v2.0/)制作基因定位图。

1.5 杜仲EuYABBY基因启动子的顺式作用元件预测分析

利用工具TBtools[21]提取杜仲EuYABBY基因家族成员上游2 000 bp序列,用在线分析工具PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)[22]对杜仲EuYABBY基因家族成员的启动子顺式作用元件进行预测,然后利用TBtools软件对启动子元件批量可视化。

2 结果与分析

2.1 杜仲EuYABBY基因家族成员的鉴定及理化性质分析

在杜仲全基因组范围内共鉴定出10个EuYABBY基因。对杜仲EuYABBY基因家族和EuYABBY蛋白的理化性质进行分析,发现EuYABBY基因家族的CDS长度在228(EuYABBY2)~612 bp(EuYABBY4);EuYABBY蛋白有75(EuYABBY 2)~203(EuYABBY 4)个氨基酸;分子量为8 422.54(EuYABBY 2)~22 738.98 u(EuYABBY 4);等电点在6.58(EuYABBY 7)~10.24(EuYABBY 10)。所有预测的EuYABBY蛋白的GRAVY值均为负值,即EuYABBY蛋白均为亲水蛋白,只是亲水程度不同(表1)。对EuYAB基因家族的保守结构域分析,发现EuYABBY基因家族的10个成员中EuYABBY1、EuYABBY2、EuYABBY3、EuYABBY5、EuYABBY7只含有YABBY保守结构域;EuYABBY4、EuYABBY6、EuYABBY8、EuYABBY9除含有YABBY保守结构域外还含有HMG-box-2结构;EuYABBY9除含有YABBY保守结构域外还含有Ccdc 124结构(图1)。这些分析结果可以为EuYABBY基因的功能以及EuYABBY蛋白的提纯、活性和功能的研究提供参考和理论基础。

表1 杜仲EuYABBY基因家族Table 1 EuYABBY gene family of E. ulmoides

图1 杜仲EuYABBY基因家族保守结构域预测结果Fig.1 Prediction of conserved domains in EuYABBY gene family of E. ulmoides

2.2 杜仲EuYABBY基因结构及系统进化分析

为了解杜仲EuYABBY基因结构进化关系,运用GSDS软件绘制EuYABBY基因内含子-外显子结构图并比较其基因结构。EuYABBY基因家族成员内含子数量不定,EuYABBY9含6个内含子,EuYABBY10、EuYABBY4含有5个内含子,EuYABBY7、EuYABBY6以及EuYABBY1含有4个内含子,EuYABBY8和EuYABBY3含有3个内含子,EuYABBY2含有2个内含子,EuYABBY5只含有1个内含子。与模式植物拟南芥以及木本植物桃树和苹果建立系统发育树,发现杜仲EuYABBY可分为三个亚类,第一类EuYABBY1、EuYABBY9与苹果的INO亚类相近;第二类EuYABBY2、EuYABBY6、EuYABBY8和EuYABBY10与桃树的CRC亚类相近;第三类EuYABBY3、EuYABBY4、EuYABBY5和EuYABBY7与拟南芥的Ⅰ亚组和苹果YAB1/YAB 3亚组相近(图2)。

图2 杜仲EuYABBY基因家族结构预测结果Fig.2 Prediction of EuYABBY gene family structure in E. ulmoide

图3 杜仲EuYABBY基因家族系统发育树 Fig.3 Phylogenetic tree of EuYABBY gene family of E. ulmoides

2.3 杜仲EuYABBY基因基序分析及基因定位

利用MEME工具对杜仲EuYABBY家族的基序进行搜索鉴定,共鉴定出10个基序,其中Motif 2和Motif 3代表C 2 C 2型锌指结构域,Motif 1代表YABBY结构域。同一个亚家族的成员表现出类似的基因结构和蛋白基序分布,比如第二类亚家族的成员类似的Motif 1、Motif 3和Motif 4。上述结果表明,无论是基因结构还是蛋白保守基序,EuYABBY基因家族都有一定的保守性(图4)。对EuYABBY基因进行基因定位分析,结果显示,10条EuYABBY基因不均匀的分布在基因组的scaffold上。其中EuYABBY1在scaffold_61上,EuYABBY2和EuYABBY3分布在scaffold_91上,EuYABBY4分布在scaffold_116上等,其余基因组scaffold仅有1条EuYABBY基因(图5),为杜仲染色体组装后染色体定位提供理论依据。

图4 杜仲EuYABBY基因家族基因基序预测结果Fig.4 Prediction of gene motifs in EuYABBY gene family of E. ulmoides

图5 杜仲EuYABBY基因家族基因定位Fig.5 Gene mapping of EuYABBY gene family in E. ulmoides

2.4 杜仲EuYABBY蛋白的三级结构预测

分析蛋白质三级结构的方法一般有同源模建法、串线法和从头预测法,本研究采用同源建模法对EuYABBY蛋白质三级结构进行预测。将EuYABBY序列提交到在线网站(https://swissmodel.expasy.org)的SWISS-MODEL Workspace端口构建其三级结构模型。EuYABBY三级结构的分析结果显示,基因结构相似的EuYABBY蛋白三级结构相近,如EuYABBY 4和EuYABBY 6以及EuYABBY 8等;而EuYABBY 5片段短,生成的三维结构简单;EuYABBY 2和EuYABBY 3等更能清晰地体现EuYABBY的结构。EuYABBY结构的蛋白质模型,能清楚观察到EuYABBY 1、EuYABBY 2以及EuYABBY 9等C端YABBY结构域和N端的C 2 C 2型锌指结构域的空间分布(图6),EuYABBY三级结构的建模和预测为后续EuYABBY家族蛋白的研究提供理论参考。

图6 杜仲EuYABBY基因家族三级结构预测结果Fig.6 Prediction of tertiary structure of EuYABBY gene family in E. ulmoides

2.5 杜仲EuYABBY基因启动子的顺式作用元件预测分析

截取EuYABBY基因家族成员上游2 000 bp序列进行分析,通过PlantCARE软件预测基因启动子的顺式作用元件。EuYABBY基因家族除了存在大量的基本元件CAAT-box和TATA-box外,其他调控元件也极其丰富,例如可能参与光响应的调节元件ACE、AEbox、AT 1-motif、Box 4、GA-motif、GT 1-motif、G-box等,胚乳表达所需顺式作用调节元件GCN 4_motif。此外,EuYABBY基因家族的启动子中还含有茉莉酸甲酯(MeJA)响应的顺式作用元件CGTCA-motif、水杨酸(SA)响应的顺式作用元件TCA-element、低温响应顺式元件LTR、参与应激和防御反应的TC-rich repeats、干旱响应元件MBS、厌氧应答元件O 2-site、生长素反调控元件TGA-element、昼夜响应调控元件circadian以及赤霉素反应顺式作用元件TATC-box等。分析结果表明,EuYABBY基因家族可能受自然环境的光、温度、干旱非生物胁迫反应,以及外源激素如生长素、赤霉素、茉莉酸甲酯、水杨酸等调控,并可能通过这些顺式作用元件参与杜仲的防御机制,在杜仲的生长过程中从基因编码区或者转录区起到调控杜仲叶、花甚至果实等的生长发育的作用。

3 讨 论

YABBY基因家族是存在于种子植物中特有的转录因子基因,在植物的生长发育侧生器官的建成中起关键的调控作用[23]。研究发现,其家族成员在叶及叶的衍生器官如子叶和花等的发育中起关键作用[24]。本研究通过生物信息学,在杜仲基因组中筛选出了EuYABBY基因家族10个成员,并进行了基因结构、进化树分析,亚细胞定位、基因定位等较为全面的分析,旨在对该基因家族的研究提供理论支撑和基础。

YABBY家族具有两个典型的结构域:N端的C 2 C 2型锌指结构域和C端YABBY结构域[25]。通过保守结构域的分析发现,该基因家族10个成员均有YABBY保守结构域,将家族成员与拟南芥以及木本植物桃、苹果建立系统发育树,发现杜仲的EuYABBY基因家族成员可分为3个亚组,在前人的研究中发现,在拟南芥中该家族基因分为4个亚组,苹果为5个亚组,辣椒分为5个亚组,与这些植物相比,杜仲EuYABBY家族亚组较少,可能原因是杜仲中该基因家族成员较少。对EuYABBY基因家族蛋白进行三级结构预测,发现家族成员中多个成员结构相似,类似于番茄的YABBY蛋白结构[7]。通过对杜仲EuYABBY基因家族蛋白理化性质的分析,发现该家族蛋白全为亲水性蛋白,与前人其他植物的YABBY基因家族蛋白预测基本一致。

图7 杜仲EuYABBY基因家族顺式作用元件预测Fig.7 Prediction of cis-acting elements in EuYABBY gene family of E. ulmoides

杜仲基因组尚未组装到染色体水平,本研究通过目标基因的定位,发现EuYABBY基因家族定位到scaffold上,为杜仲染色体组装后的EuYABBY基因家族染色体定位以及其他功能研究提供理论依据。YABBY基因家族在其他植物的表达调控方面已有较多研究和报道,在水稻中,YABBY6参与了水稻叶的发育调控,与泡状细胞的发育相关[5];在苹果中,YABBY基因在花、果和叶中的表达量较高,部分YABBY基因家族成员在果实发育的明显上调表达[6];在辣椒中,YABBY基因家族成员在叶和花中广泛表达;番茄YABBY基因家族对根、茎、叶、花、蜜腺、心皮、胚珠等部位发育具有重要调控作用,且部分成员具有较强组织特异性[7]。通过分析发现,杜仲中EuYABBY基因含有大量的MBS、G-box以及LTR等非生物胁迫响应元件,以及茉莉酸甲酯(MeJA)、水杨酸(SA)等激素响应元件,即杜仲的EuYABBY基因家族表达调控方式可能受非生物和激素的调控和响应,与其他植物有类似的调控形式。

杜仲是重要的药用植物,并且杜仲胶在航天航空设备中也有广泛的应用。对杜仲基因组中关键功能基因的挖掘,可为杜仲品种和种质资源改良提供技术支持,提高杜仲产业经济效益。本研究以拟南芥YABBY基因为检索序列,挖掘杜仲基因组中的EuYABBY基因序列,并进行基因鉴定、基因结构、理化性质、系统进化及系列功能等分析,以期为杜仲基因组中EuYABBY基因家族的功能研究和验证等奠定理论基础。

猜你喜欢

杜仲结构域元件
一种智能磁条传感器
细菌四类胞外感觉结构域的概述
UBR5突变与淋巴瘤B细胞成熟
直流电机电枢绕组分布排列和连接解析
结核分枝杆菌蛋白Rv0089的生物信息学分析
如何读懂色环电阻
略阳杜仲
殃及池鱼
周末
作业