油棕C2H2基因家族鉴定及低温胁迫下的表达分析
2023-05-30程秋如刘子凡曾宪海
程秋如 刘子凡 曾宪海
关键词:油棕;C2H2 型锌指蛋白;基因家族;低温胁迫
中图分类号:S565.9 文献标识码:A
锌指蛋白(zink finger protein, ZFP)是一类广泛存在于植物中的转录因子,最早在非洲爪蟾的卵母细胞中发现,具有手指状结构,通过与Zn2+结合来稳定此结构[1]。根据锌指蛋白二级结构中组氨酸(H)和膀胱氨酸(C)的數目和位置,可将其划分为C2H2、C3H、C2C2、C4、C6、C8、C2HC、C2HC5 等类型[2]。C2H2 型锌指蛋白转录因子是目前研究最多的锌指蛋白,广泛存在于真核生物中, C2H2 型锌指蛋白中含有特殊的X2-Cys-X(2-4)-CysX12-His-X(3-5)-His 保守结构域,其中C 表示半胱氨酸,H 表示组氨酸,X 表示任意氨基酸,P 表示苯丙氨酸,L 表示亮氨酸[3-4]。多数C2H2 锌指蛋白含有植物特有的一段高度保守的QALGGH 基序,该基序对DNA 的结合活性至关重要,C2H2 型锌指蛋白不仅能与DNA、RNA结合还可以与蛋白质相互作用,在植物的转录调控、RNA 代谢等途径中发挥重要功能[5-8]。
C2H2型锌指蛋白最早在矮牵牛中发现[9],随后在其他植物的研究中逐渐增多,如拟南芥[10],水稻[11],杨树[12],烟草[13],小麦[14],番茄[15]、木薯[16],马铃薯[17],大麻[18]等,这些都证明C2H2型锌指蛋白参与了植物的营养生长、生殖发育及对逆境胁迫的响应。C2H2 型锌指蛋白在植物的抗寒中发挥重要作用。SAKAMOTO 等[7]研究发现拟南芥C2H2 家族的STZ、AZF1 和AZF3 基因在低温胁迫下被显著诱导表达。过表达ZAT12 基因可以有效的提高转基因拟南芥的耐低温能力[19]。ZHANG 等[20] 研究发现在拟南芥中过表达SlCZFP1 基因可以增强转基因拟南芥的耐低温能力。在枳中发现PtrZPT2-1 基因在低温胁迫下表达量显著升高,且过表达PtrZPT2-1 基因的转基因烟草表现出较强的抗寒性[21]。在大豆中发现C2H2 型锌指蛋白家族的SCOF-1 基因可以诱导下游COR 基因的表达,可以增强转基因拟南芥的抗寒能力[22]。矮牵牛中ZPT2-2 基因可以增强转基因植物的耐低温能力[23]。在烟草中转OSISAP1 基因可以提高转基因烟草的抗寒能力[24]。在水稻中ZFP245、ZFP18 基因在低温下被显著诱导表达[25],过表达OsZFP151 可以增强转基因水稻的耐低温能力[26],上述研究结果说明,C2H2 基因在响应植物的低温胁迫过程中发挥着积极作用,而油棕C2H2 型锌指蛋白家族是否参与低温胁迫的应答尚不明析。因此,在油棕基因组中鉴定C2H2 型锌指蛋白并明确其在低温胁迫中的功能对油棕抗寒研究是非常重要的。
油棕(Elaeis guineensis Jacq.)是一种重要的热带木本油料作物,也是世界上产油效率最高的油料作物,年均产油量高达4.27 t/hm2,被誉为“世界油王”[27]。油棕原产于热带非洲,喜高温多雨的气候,适宜在年均气温为25~28 ℃的地区生长[28],我国热区地处热带北缘,年平均气温19.0~25.4 ℃,极端最低温达0~5 ℃,热量低于油棕原产区,严重影响了油棕的生长发育和产量[29]。本研究以拟南芥C2H2 氨基酸序列作为探针,在油棕基因组数据库中进行本地BLASTP 比对,筛选出油棕C2H2 型锌指蛋白家族,对其进行生物信息学分析,并根据转录组数据和qRT-PCR 方法分析油棕C2H2 家族基因在低温胁迫下的表达情况,以期为后续油棕C2H2 家族基因的低温胁迫研究提供理论依据。
1 材料与方法
1.1 材料
供试材料为本课题组前期筛选的云南大理(东经100°72′,北纬25°50′,海拔1381 m,年均温14.9 ℃,极端最低温–3.3~2.3 ℃[30])抗寒高产油棕成龄树的自交子一代耐寒材料和冷敏感材料各3 株[31],苗龄约为3 年,现存叶片数为5~10片,株高100~150 cm。
将耐寒材料和冷敏感材料放置于中国热带农业科学院橡胶研究所冷库中进行4 ℃低温处理(每天光照时间12 h),分别在低温处理0、1、3、5 d 时进行取样。采集植株第2~3 片叶叶轴中部两边的小叶作为样品,将叶样用去离子水洗净后再用锡箔纸严密包裹然后放到液氮中速冻,最后转移到–80 ℃超低温冰箱保存,用于总RNA 提取,每个处理3 个重复。
本研究将耐寒材料命名为CT(cold tolerance),冷敏感材料命名为CS(cold sensitive),CT 低温处理0、1、3、5 d 的样品命名为CT0、CT1、CT3、CT5,CS 低温处理0、1、3、5 d 的样品命名为CS0、CS1、CS3、CS5,每个处理3个重复。
1.2 方法
1.2.1 油棕C2H2 家族成员鉴定及理化性质分析从 NCBI(https://www.ncbi.nlm.nih.gov/)网站下载油棕基因组序列和基因组蛋白质序列,从TAIR数据库中下载176 个拟南芥C2H2 型锌指蛋白家族氨基酸序列,以拟南芥C2H2 氨基酸序列作为探针,在油棕基因组数据库中进行本地BLASTP比对,阈值设置为1e–5,获得与拟南芥C2H2 型锌指蛋白相似度高的油棕蛋白质全长序列。将获得的油棕C2H2 基因序列在pfam(http://pfam.xfam.org/)、Batch Web CD-Search Tool(https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi ) 和SMART9.0(http://smart.embl-heidelberg.de/)等在线软件进行结构域验证,筛选含有C2H2 结构域的蛋白序列确定为油棕C2H2 型锌指蛋白家族成员。在ExPASy 网站( http://web.expasy.org/protparam/)对获得的油棕C2H2 型锌指蛋白家族成员进行氨基酸数、分子量(MW)、等电点(pI)、不稳定系数等理化性质分析。使用WOLFPSORT网站(http://www.genscript.com/wolf-psort.html)进行亚细胞定位。
1.2.2 系统进化树的构建及染色体定位 将获得的油棕和拟南芥的C2H2 型锌指蛋白序列使用MEGA7.0 软件基于NJ(Neighbor join)法构建系统进化树,bootstrap 值为1000 次。以油棕基因组注释信息为依据,使用TBtools 软件[33]进行油棕C2H2 锌指蛋白家族基因的染色体定位。
1.2.3 基因结构与保守基序分析 使用在线软件GSDS2.0(http://gsds.gao-lab.org/)进行基因结构分析,并使用TBtools 软件[32]进行可视化图片的输出。保守基序使用在线软件MEME(http://meme-suite.org/)分析,并使用TBtools 软件[32]进行可视化图片的输出。
1.2.4 启动子顺式元件分析 使用 TBtool 软件[32]提取油棕C2H2 型锌指蛋白家族成员的启动子序列, 使用PlantCARE ( http://bioinformatics.psb.ugent.be/webtools/plantcare/htm)在线网站进行顺式元件预测,并使用TBtools 软件[32]进行可视化图片的输出。
1.2.5 低温胁迫下EgC2H2 基因家族成员的表达分析 根据前期进行转录组测序(未发表数据)的结果,从转录组测序数据中提取油棕C2H2 型锌指蛋白家族成员的FPKM 值,利用TBtools 软件[32]绘制热图。
根据转录组数据分析筛选16 个显著差异表达的EgC2H2 基因进行qRT-PCR 分析。采用RNAprep Pure 多糖多酚植物总RNA 提取试剂盒提取RNA,用琼脂糖凝胶电泳检测RNA 质量,使用Agilent2100 对RNA 的浓度和A260/A280 进行检测。使用thermo scientific RevertAid First StrandcDNA Kit 试剂盒进行cDNA 反转录。使用CFX96Real-time PCR System(Bio-Rad, United States)仪器进行qRT-PCR 验证,每个样品3 个重复,反应体积为20 μL,包括ChamQ Universal SYBR qPCRMaster Mix 10.0 μL、正向及反向引物(10 umol/L)各0.4 μL、cDNA(10 ng/L)1.0 μL 以及ddH2O8.2 μL。qRT-PCR 反应程序:95 ℃预变性30 s,95 ℃变性5 s,60 ℃退火延伸30 s,40 个循环。Egβ-actin 为内参基因[33],利用NCBI 中的primer-BLAST 设计特异性引物,并由擎科生物科技有限公司海南分公司合成,引物序列见表1。采用2–CT 方法,计算基因的表达量,使用Originpro2018 软件进行绘图。
1.3 数据处理
使用DPS 软件进行数据分析,用Duncans法进行差异显著性分析。
2 结果与分析
2.1 油棕C2H2家族成员鉴定及理化性质分析
根据拟南芥C2H2 氨基酸序列在油棕基因组数据库中进行BLASTP 比对、筛选和验证,共获得73 个油棕C2H2 型锌指蛋白家族成员,并将其命名为EgC2H2-01~EgC2H2-73,如表2。在油棕C2H2 基因编码的蛋白质中,氨基酸的数目为128~556 个,分子量为14 176.73~58 983.30 Da,等电点为4.99~9.62,不稳定系数为38.84~86.01,除EgC2H2-67 属于稳定蛋白,其他均为不稳定蛋白,亲水性为-1.154~-0.226,亚细胞定位显示C2H2 基因家族所有成员均定位于细胞核。
2.2 C2H2 家族成员进化树分析
利用MEGA7.0 软件对油棕和拟南芥C2H2 氨基酸序列构建系统进化树,根据进化树分析结果(图1),可以将C2H2 基因分成4 个亚家族,分别命名为Ⅰ~Ⅳ。拟南芥和油棕C2H2 基因在4 个亚家族中均有分布,第Ⅰ亚家族C2H2 基因最多,有59 个成员,第Ⅱ亚家族有56 个成员,第Ⅲ亚家族有12 个成员,第Ⅳ亚家族最少,有9个成员。油棕C2H2 与拟南芥C2H2 发生明显聚类,表明C2H2 型锌指蛋白在进化上具有保守性。
2.3 油棕C2H2 基因家族染色体定位
根据油棕基因组注释文件,利用TBtools 软件对油棕C2H2 家族基因的染色体位置进行可视化图片的输出。如图2 所示,73 个油棕C2H2 家族中的55 个基因不均匀的分布于16 条染色体上,其中Chrom04、Chrom05 和Chrom11 染色体上分布的基因数目最多,均分布有6 个EgC2H2 基因,Chrom02 和Chrom15 染色体上均分布5 个EgC2H2基因,Chrom08、Chrom13 和Chrom16 染色体上均分布有4 个EgC2H2 基因,Chrom03 染色体上分布有3 个EgC2H2 基因,Chrom01、Chrom07、Chrom10、Chrom12 和Chrom14 染色体上均分布有2 个EgC2H2 基因,Chrom06 和Chrom09 染色体上基因数目最少,均分布有1 个EgC2H2 基因,18 个EgC2H2 基因未确定染色体位置。
2.4 油棕C2H2 基因家族基因結构分析
本研究对EgC2H2 家族基因结构进行了分析(图3),73 个EgC2H2 基因含有1~4 个外显子,EgC2H2-42 和EgC2H2-66 含有2 个外显子,EgC2H2-19 和EgC2H2-33 含有3 个外显子,EgC2H2-31 、EgC2H2-32 、EgC2H2-53 和EgC2H2-54 含有4 个外显子,其他EgC2H2 基因仅含有1 个外显子。此外,9 个EgC2H2 基因含有内含子,其他均无内含子。
2.5 油棕C2H2 基因家族保守基序分析
利用在线网站MEME 搜索获得了73 个EgC2H2 基因的10 个保守基序(图4),其中Motif1、Motif 2 和Motif 6 含有C2H2 型锌指蛋白保守结构域,都存在典型的QALGGH 基序,属于Q型C2H2 锌指蛋白;Motif 1 和Motif 2 含有21 个保守氨基酸,Motif 6 含有26 个保守氨基酸。EgC2H2 基因家族成员含有1 个或多个保守结构域,其中Motif 1 在EgC2H2 基因家族分布最广,62 个EgC2H2 基因含有Motif 1,说明Motif 1 在EgC2H2 基因家族发挥关键作用,7 个EgC2H2 基因同时具有Motif 1、Motif 2 和Motif 6。此外Motif7、Motif 9 和Motif 5 在EgC2H2 基因家族中也分布较多,说明EgC2H2 基因家族保守结构域的种类和数量比较丰富。Motif 10 和Motif 5 为第Ⅰ亚家族所特有,且每个成员均含1 个Motif 5,Motif8 为第Ⅲ亚家族特有,同一亚家族成员的保守结构域具有较高的一致性。
2.6 油棕C2H2 基因家族启动子顺式元件分析
对油棕C2H2 基因家族起始位点上游2000 bp的启动子序列进行顺式元件分析(图5),结果表明,油棕C2H2 基因家族含有多种启动子顺式元件,除EgC2H2-36 和EgC2H2-06 外,所有C2H2启动子均含有1 个或多个启动子顺式元件。光响应元件在EgC2H2 基因家族分布最广,除EgC2H2-36、EgC2H2-41、EgC2H2-21 和EgC2H2-06 外,其他EgC2H2 基因均含有光響应元件,此外,EgC2H2 基因家族还含有大量与植物激素和逆境胁迫有关的响应元件,如83.6%的EgC2H2 家族成员含有厌氧诱导响应元件,75.3%的EgC2H2家族成员含有脱落酸响应元件,47.9%的EgC2H2家族成员含有生长素响应元件,58.9%的EgC2H2家族成员含有赤霉素响应元件,69.9%的EgC2H2家族成员含有茉莉酸甲酯诱导响应元件,54.8%的EgC2H2 家族成员含有干旱响应元件,50.7%的EgC2H2 家族成员含有水杨酸响应元件,42.5%的EgC2H2 家族成员含有低温响应元件,此外,部分EgC2H2 家族成员还含有防御与胁迫响应元件。表明EgC2H2 家族在响应逆境胁迫中发挥重要作用。
2.7 油棕C2H2 基因家族表达分析
对耐寒材料和低温敏感材料低温胁迫0、1、3、5 d 的转录组数据进行分析,使用TBtools 软件绘制油棕C2H2 基因家族表达模式的热图(图6)。结果显示,低温胁迫下,EgC2H2 基因在不同材料之间和同一材料不同处理时间之间的表达量有明显差异,说明EgC2H2 家族基因能够被低温诱导。低温胁迫下,EgC2H2 基因家族中有10个基因未表达,其他基因均有表达,且在CT 的表达量变化较CS 显著,上调表达基因中大量基因在CT3 和CT5 中表达量相对较高,少量基因在CS3 和CS5 中表达量高,下调表达基因中大量基因在CT0 和CT1 中表达量高,少量基因在CS0和CS1 中表达量高。随低温胁迫时间的延长,EgC2H2-11、EgC2H2-07、EgC2H2-23、EgC2H2-17、EgC2H2-21、EgC2H2-33、EgC2H2-67、EgC2H2-16和EgC2H2-28 的表达量在CT 中持续升高,在CT5处理下表达量最高。EgC2H2-25、EgC2H2-26 和EgC2H2-30 的表达量在CS 中持续升高,在CS5处理下表达量最高。随低温胁迫时间的延长,EgC2H2-43、EgC2H2-39、EgC2H2-66、EgC2H2-69、EgC2H2-14 和EgC2H2-50 表达量持续降低,在低温处理5 d 时表达量最低。
2.8 油棕C2H2 基因家族成员在低温胁迫下qRT-PCR 分析
根据转录组数据分析筛选了16 个显著差异表达的EgC2H2 基因进行荧光定量PCR 分析(图7)。结果表明,低温胁迫处理后,16 个EgC2H2基因在同一材料不同处理时间下差异显著,且变化趋势与转录组数据基本一致,EgC2H2-20、EgC2H2-24、EgC2H2-71、EgC2H2-27 和EgC2H2-19 基因的表达量随胁迫时间的延长在CT 中呈先升高再降低的趋势,在低温处理3 d 时达到最高水平,且表达量明显高于CS,但在CS中则呈持续升高的趋势。EgC2H2-07、EgC2H2-26、EgC2H2-11、EgC2H2-73、EgC2H2-17、EgC2H2-16、EgC2H2-30、EgC2H2-21、和EgC2H2-23 基因的表达量随胁迫时间的延长呈升高的趋势,其中EgC2H2-26 和EgC2H2-30 基因低温胁迫后在CS 中的表达量高于CT,EgC2H2-11、EgC2H2-17、EgC2H2-16、EgC2H2-21 和EgC2H2-23 基因低温胁迫后在CT 中的表达量显著高于CS,且升高的幅度较大,低温胁迫5 d 时表达量分别是CS 的2.0、3.7、2.4、5.5 和1.4 倍。EgC2H2-11、EgC2H2-17、EgC2H2-21、EgC2H2-19 和EgC2H2-23 基因低温胁迫下表达量上升的幅度远远高于其他基因,可能与耐寒材料较强的抗寒能力有关。
3 讨论
锌指蛋白是植物中最大的转录因子家族之一,C2H2 型锌指蛋白转录因子是目前研究较多的锌指蛋白,在植物的生长发育以及高盐、低温、干旱等非生物胁迫响应中扮演重要作用[23, 34-35]。目前国内外关于C2H2 型锌指蛋白在其他植物中的报道越来越多,如矮牵牛、拟南芥、水稻、杨树、小麦、马铃薯等[9-12, 14, 17],然而油棕C2H2型锌指蛋白家族的研究还未见报道。本研究对油棕C2H2 型锌指蛋白家族的全基因组鉴定,共获得73 条含有C2H2 锌指蛋白保守结构域的油棕C2H2 基因,比拟南芥(176 个)[10]、烟草(116个)[13]、水稻(189 个)[11]、小麦(122 个)[14]、杨树(109 个)[12]、番茄(92)[15]和木薯(85)[16]的C2H2 基因家族成员数目少,说明不同物种间数量差异较大,C2H2 基因在进化过程中可能发生了基因复制。
构建系统进化树发现,油棕C2H2 基因家族可以分为4 个亚家族,每个亚家族的结构域类型存在高度的一致性,第Ⅲ、Ⅳ亚家族的EgC2H2基因均含有zf-C2H2 结构域,而第Ⅰ、Ⅱ亚家族的EgC2H2 基因均含有典型的zf-C2H2-6 结构域,且第Ⅰ和第Ⅱ亚家族成员数量占总数的85%,说明zf-C2H2-6 结构域是油棕C2H2 家族中发挥作用的重要结构域。保守基序分析发现,每个成员均至少含有1 个锌指蛋白保守结构域,不同亚家族motif 类型和数量存在明显差异,但同一亚家族C2H2 成员的保守基序和数量具有较高的一致性,推测同一亚家族基因功能接近或相同。Motif1、Motif 2 和Motif 6 结构域中均含有植物C2H2锌指蛋白特有的一段高度保守的QALGGH 基序,早期研究報道QALGGH 基序是与DNA 的结合的重要基序,在植物的生长发育中发挥重要作用[7-8]。基因结构分析发现,油棕C2H2 基因家族的基因结构简单,大部分成员含有1 个外显子,且数量差异较小,仅极少数成员含有内含子,属于内含子缺失型,说明油棕C2H2 基因家族在进化过程中可能发生了内含子丢失的现象,这与在大麻、木薯、小麦、烟草等植物中的研究结果类似[13-14, 16, 18]。C2H2 基因家族的外显子和内含子数目在不同物种间具有较高的保守性,有研究报道,内含子缺失型基因可以更快速地响应逆境胁迫[36]。启动子顺式元件预测分析发现油棕C2H2家族含有大量与植物激素和逆境胁迫有关的响应元件,这些结果与其他植物发现的顺式元件结果类似[12, 14, 35],进一步说明油棕C2H2 基因家族参与非生物胁迫过程。
大量研究表明,C2H2 型锌指蛋白在植物的抗寒中发挥重要作用。过表达C2H2 基因可以增强拟南芥、水稻、烟草等多种植物的抗寒性[19-21, 24-26]。本研究对不同低温处理时间的转录组数据分析显示,油棕C2H2 基因家族成员中63 个基因在不同处理时间之间的表达量有明显差异,说明油棕C2H2 基因家族响应低温胁迫,这些基因大多数在耐寒材料中高表达,而在冷敏感材料中低表达,这可能与耐寒材料较强的抗寒能力有关。qRT-PCR 结果显示,16 个EgC2H2 基因在低温胁迫下的表达量均发生了显著变化,除EgC2H2-26、EgC2H2-09 和EgC2H2-30 外,其他基因的表达量变化趋势均显著高于冷敏感材料,推测EgC2H2基因在耐寒材料中感受低温的速度快于冷敏感材料,耐寒材料可能通过增加EgC2H2 基因的快速表达加快了低温信号的传递,并诱导下游冷响应基因的表达,从而使植株表现出较强的抗寒能力。本研究还发现, EgC2H2-11 、EgC2H2-17 、EgC2H2-21、EgC2H2-19 和EgC2H2-23 显著上调表达与谷子中SiC2H2-78 的表达模式类似[37],且表达量显著高于冷敏感材料,表明耐寒材料可能通过提高这些基因的表达量来抵御低温伤害,预示着这些基因在低温胁迫中起正向调控作用,可以作为抗寒候选基因进一步深入研究。