APP下载

毛竹扩展蛋白基因的鉴定及其表达分析

2022-03-02王博雅胡尚连高志民

植物研究 2022年1期
关键词:毛竹蛋白家族

马 霜 王博雅 曹 颖 胡尚连 高志民

(1. 西南科技大学生命科学与工程学院,绵阳 621000;2. 国家林业和草原局∕北京竹藤科学与技术重点开放实验室,国际竹藤中心竹藤资源基因科学与基因产业化研究所,北京 100102)

扩展蛋白(Expansin)是一类参与细胞壁松弛功能的非酶类活性蛋白,其特异性为仅在酸性条件下作用于植物细胞壁,调控植物的生长发育。1992 年在黄瓜()中首次发现扩展蛋白之后,又鉴定出有多种扩展蛋白,根据结构将其分为EXPA(Expansin A)、EXPB(Expansin B)、EXLA(Expansin-like A)、EXLB(Expansin-like B)四个亚家族。双子叶和非禾本科单子叶植物的扩展蛋白大多为EXPA,禾本科单子叶植物中的多为EXPB,而EXLA 和EXLB 鲜有报道,且家族功能尚未清楚。扩展蛋白通常具有组织表达特异性,在与细胞壁修饰相关的各种生物学过程中发挥重要作用,如种子萌发、根系发育、叶片生长、花芽发育、茎和节间伸长以及生物和非生物胁迫响应等。近年来从转录组水平和全基因组水平对扩展蛋白进行的研究越来越多,如在拟南芥()、水稻()、玉米()、烟草()、甘蔗()、二穗短柄草()中分别鉴定出31、40、88、52、92和38个成员。然而,在分子层面上扩展蛋白是如何影响植物细胞壁和器官生长发育的研究甚少,尤其是有关竹子中的扩展蛋白功能相关的研究尚未见报道。

竹子因具有生长快、材性好等优点,在木材供给不足的情况下是优良的木材替代品。毛竹()是我国最具特色的木本竹资源,也是经济价值总量最高的竹种。人们已从解剖、生理生化、材料力学等多个方面对毛竹进行了大量研究,随着毛竹基因组草图的发布,从分子层面的研究工作已全面展开。如木质素是影响竹材材性的重要因素之一,其生物合成受到多种遗传因子的参与,在毛竹基因组中鉴定出15 个s 和12 个s,它们是与细胞壁生物合成和次生细胞壁沉积有关的关键转录因子;另外,鉴定出19 个同源异型盒基因参与木质部发育和木质部与韧皮部模式形成调控,其中3个属于KNOX 家族的成员作为核心调控因子与MYB、bHLH、OVATE 等转录因子共同发挥作用。然而,作为细胞壁蛋白,扩展蛋白对毛竹的生长发育、竹材性能等方面的功能尚为空白。本研究采用生物信息学方法对毛竹中扩展蛋白家族成员进行了系统分析,并用qRT-PCR 技术分析了各基因在不同组织中的表达模式,以期为进一步研究毛竹扩展蛋白的生物学功能提供参考依据。

1 材料与方法

1.1 实验材料

源自广西省桂林地区的毛竹种子,播种萌发后置于温度18 ℃∕22 ℃,光照200 μmol·m·s,光周期为光照16 h黑暗8 h的温室中生长。选取3个月健康的实生苗,采集其根、茎、未展开叶(卷曲的幼叶)、展开叶(成熟叶)、老叶(基部泛黄叶片)5个不同组织,立即在液氮中冷冻至少10 min,并保存在-80 ℃冰箱中。

1.2 扩展蛋白基因鉴定

利用PLAZA数据库(https:∕∕bioinformatics.psb.ugent.be∕plaza∕)和美国国立生物技术信息中心数据库(NCBI)(https:∕∕www.ncbi.nlm.nih.gov∕)分别下载毛竹和水稻扩展蛋白基因序列。通过和水稻扩展蛋白基因进行保守结构域比对,筛选毛竹编码扩展蛋白完整结构域的基因。利用MEGA 软件采用Neighbor-joining 算法构建基于毛竹和水稻扩展蛋白的氨基酸序列的系统进化树,对结果使用“Bootstrap method”(replications 为1 000)来检验进化树可靠性。在BambooGDB 上查找毛竹扩展蛋白基因所在的Scaffold位置,并利用TBtools软件作图。利用在线工具GSDS 基因结构分析软件(http:∕∕gsds.cbi.pku.edu.cn∕)展示毛竹扩展蛋白基因的基因结构。

1.3 扩展蛋白的特性与结构分析

根据氨基酸的同义密码子相对使用度(relative synonymous codon usage,RSCU),计算出相对同义密码子使用频率(relative frequency of synonymous codon,RFSC)。利用Codon W v1.4.4 密码子分析软件及EMBOSS(欧洲分子生物学开放软件系统)在线分析软件(http:∕∕www.bioinformatics.nl∕emboss-explorer∕)中的CHIPS 程序对毛竹扩展蛋白密码子偏好性进行统计分析。

利用在线工具ExPaSy 蛋白质性质分析软件(https:∕∕www.expasy.org∕)计算每个蛋白序列的分子量和等电点等参数。利用在线软件SOPMA(https:∕∕prabi.ibcp.fr∕htm∕site∕web∕home)和SWISSMODEL(https:∕∕swissmodel.expasy.org∕interactive)分析蛋白二级、三级结构。

1.4 扩展蛋白基因在不同组织的表达模式分析

利用Prime Primer 5.0 软件设计毛竹扩展蛋白基因的实时定量PCR(qRT-PCR)引物(见表1),用Trizol 试剂(Takara)从保存的样品(毛竹实生苗的根、茎、未展开叶、展开叶和老叶)中提取总RNA,用DNase Ⅰ(Takara)处理后用AMV逆转录酶(Promega)合成第一条cDNA 链,用于随后的实时定量PCR(qRT-PCR)检测表达模式。qRT-PCR 反应体系为10 μL,包括0.8 μL的cDNA样品,各0.2 μL的正反向引物,5 μL 的2×SYBR PCR mix,3.8 μL 的灭菌水,热循环为:94 ℃1 min;94 ℃10 s,62 ℃10 s,72 ℃10 s,45 次循环。以内参引物液泡膜内嵌蛋白41 基因()为对照,构建溶解曲线,使用2方法计算相对表达量,分析各基因的表达特异性。

表1 实时定量PCR引物序列Table 1 Primer sequences used in real-time quantitative PCR

2 结果与分析

2.1 毛竹扩展蛋白家族基因获得和Scaffold定位分析

从毛竹数据库中查找扩展蛋白同源基因47个。以水稻扩展蛋白序列作为查询序列,对候选基因进行tblastn,剔除4 个E 值不满足1×10的候选基因,最终获得毛竹扩展蛋白家族基因成员43个。

分别属于4 个亚家族,依次命名为~、~、~和。基因 组定 位分 析表明,43 个毛竹扩展蛋白基因分布在37 个Scaffold上,较为分散且分布不均匀,但也有同一亚家族成员定位在同一Scaffold 上的成簇现象,如PH01000397和PH01001155上分别包含4个EXPB基因成员(见图1),毛竹扩展蛋白的成簇现象和水稻扩展蛋白的成簇现象一致,成簇基因之间遗传距离较近,成簇现象可能与进化过程中的基因组复制有关。

图1 毛竹扩展蛋白基因在Scaffold上的分布Fig.1 Distribution of moso bamboo expansin genes on Scaffolds

2.2 毛竹扩展蛋白基因结构及其编码蛋白的进化分析

对毛竹扩展蛋白基因序列统计分析显示,43个扩展蛋白基因的CDS长度介于273~1 527 bp,编码氨基酸长度91~508 aa。基因结构分析显示,除外均含有内含子,大部分为1~3 个,最多的为11个()(见图2),显示出该家族基因成员的多样性。进一步分析发现,同一亚家族中的成员具有相似的基因结构,如EXPA亚家族成员的大多数成员有2 个内含子,EXPB 亚家族成员的大多数成员有3 个内含子,EXLA 亚家族成员更趋向于4 个内含子,表明它们进化上具有一定的保守性。

图2 毛竹扩展蛋白家族成员的系统进化树和基因结构Fig.2 Phylogenetic tree and gene structure of the expansin family members in moso bamboo

构建基于毛竹、水稻和拟南芥扩展蛋白氨基酸序列的系统进化树,分析发现它们被划分为EXPA、EXPB、EXLA 和EXLB 四个亚家族,其中分别含有毛竹扩展蛋白成员18个、17个、7个和1个,四个亚家族比例也与其它单子叶物种的比例相似,其中EXPA 和EXPB 亚家族成员所占比例较大,EXLA 亚家族成员较少,而毛竹、水稻和拟南芥中EXLB亚家族成员均只存在1个成员。

2.3 毛竹扩展蛋白的理化性质和密码子偏好性分析

对毛竹扩展蛋白的氨基酸序列统计分析表明,不同亚家族成员间序列长度存在着一定的差别,EXPA 亚家族成员蛋白的长度范围为125~275 aa,平均长度为218 aa;EXPB亚家族成员的蛋白质长度范围为91~307 aa,平均长度为245 aa。EXLA亚家族的蛋白质长度范围为251~303 aa,平均长度为275 aa,而PeEXLB1 的长度最长为508 aa;蛋白分子量最小为12.52 kDa(PeEXB3),最大为76.77 kDa(PeEXLB1);不稳定系数只有PeEXPB3低于10,脂肪系数为59~87.29,大部分蛋白为亲水性蛋白;有12 个扩展蛋白的理论等电点均<7,为酸性蛋白,而其它31个均为碱性蛋白(见表2)。

表2 毛竹扩展蛋白的基本理化性质分析Table 2 Analysis of basic physicochemical properties of expansins in moso bamboo

密码子偏好性对基因的转录和翻译过程具有重要调节作用,分析密码子对于理解基因表达是非常必要的。对毛竹43 个扩展蛋白家族成员的10 387 个密码子进行使用偏好性统计分析,筛选高频密码子,即某一个密码子的RFSC大于60%或某一个密码子的RFSC 超过其对应氨基酸的同义密码子平均频率的1.5 倍。例如编码苯丙氨酸(Phe)的UUU,其RFSC值为11%,而同为编码苯丙氨酸的UUC,其RFSC 值为89%,即对苯丙氨酸而言UUC 具有明显的偏好性。结果发现,所有氨基酸(包括终止密码子)都具有高频密码子,共计23个,其中亮氨酸(Leu)、缬氨酸(Val)、丝氨酸(Ser)、脯氨酸(Pro)均具有2个高频密码子(见表3)。

表3 毛竹扩展蛋白基因密码子的相对使用频率Table 3 Relative usage frequency of gene codons in the expansins of moso bamboo(%)

2.4 毛竹扩展蛋白结构预测

蛋白二级结构分析发现,43 个毛竹扩展蛋白均包含α螺旋、β折叠、β转角、无规卷曲4种结构,除PeEXPB14 和PeEXLB16 中 的β 转 角 比 例(11.25%和13.56%)略高于α 螺旋的比例外,其余40 个蛋白中β 转角所占比例均为最少(4.51%~13.56%),而β 折叠占比例最大(26.85%~58.55%),无规卷曲占比例次之(21.37%~53.7%)。由此表明,毛竹扩展蛋白的二级结构主要为β 折叠和无规卷曲组成为主。

以水稻的2hcz.1 为模板对毛竹扩展蛋白进行同源建模,结果表明PeEXPA1、PeEXPB2、PeEXPB3 和PeEXLA1 的三级结构和模板差异较大,其中PeEXPA1 比PeEXLA1 多了一段β 转角(序列:PNYGLPADAGGVCNPP),PeEXPA1 和PeEXLA1与模板的相似率分别为30.23%和28.24%。PeEXPB2 和PeEXPB3 较模板少了几段β 折叠(序列:KYPAGQKIVFHIEKGCNPNYLAVLVKYVADDGDI VLMEIQDKLSAEWKPMKLSWGAIWRMD -TAKALKGPFSIRLTS.. ESGKKVIAKDVIPANWRPDAVYTSNVQFY),PeEXPB2和PeEXPB3与模板的相似率分别为26.42%和32.10%;其余39 个家族成员的三级结构和模板较为相似,大部分相似率在30%以上。从蛋白序列的三级结构可以看出,相较于EXLA,EXPA 与EXPB 在结构上更为相似(见图3)。

图3 毛竹扩展蛋白的三级结构Fig.3 Tertiary structure of expansin proteins in moso bamboo

2.5 扩展蛋白在不同组织中的表达分析

结合转录组数据的表达谱热图分析结果,在毛竹扩展蛋白的所有亚家族中,EXPA 和EXPB这两个亚家族成员的基因表达量相对较高(图略),可能对毛竹生长发育起更大的影响作用。因此,本研究检测了EXPA亚家族基因在毛竹不同器官(根、茎、未展开叶、展开叶、老叶)中的表达水平(见图4)。结果表明,18 个EXPA 基因均在叶片中表达,除在根中高表达之外,其余的16 个扩展蛋白基因均在叶片中高表达,其中和等9 个基因在未展开叶中表达量最高,表明这9 个基因可能参与了叶的初始发育;5 个基因(和)在展开叶中表达量最高,推测这5个基因参与了叶片的成熟过程;和在老叶中表达量最高,推测可能参与毛竹叶片衰老过程。

图4 扩展蛋白基因在毛竹不同组织的qRT-PCR分析1.根;2.茎;3.未展开叶;4.展开叶;5.老叶Fig.4 qRT-PCR analysis of expansin genes in different tissues of moso bamboo1.Roots;2.Stems;3.Unexpanded leaves;4.Fully expanded leaves;5.Old leaves

3 讨论

扩展蛋白是是一种参与植物细胞壁舒张的蛋白质,全面了解其基本理化性质、结构特点、表达模式对于解析其在细胞壁发育中的功能至关重要。本研究鉴定并定位了43个毛竹的扩展蛋白基因,并根据其结构分成了EXPA、EXPB、EXLA 和EXLB 四个亚家族,其中EXPA 和EXPB 亚家族中基因所占比例分别42%和40%。在双子叶植物拟南芥和杨树中EXPA 和EXPB 亚家族中基因所占分别为72%、17%和75%、8%,单子叶植物水稻则为59%和33%。由此可见,毛竹EXPA 和EXPB 中成员的比例更倾向于单子叶植物相对均衡的比例趋势,且毛竹扩展蛋白亚家族的内含子占比、基因成簇等方面和水稻扩展蛋白结果类似。同时,毛竹扩展蛋白四个亚家族成员的差异特性表现在基因结构、蛋白质性质、蛋白质二级三级结构等方面,体现该家族成员的多样性。

密码子是分类学的重要指标之一,探索密码子的偏好性,既有助于揭示其进化规律,还可以优化外源基因的密码子,有利于提高外源基因表达效率。本研究发现毛竹扩展蛋白所有的氨基酸都具有高频密码子(共计23 个),这与水稻扩展蛋白的密码子偏好性分析一致,且数量相似(水稻26个)。同时,不同物种扩展蛋白的密码子使用频率表现不同,与杨树相比,毛竹和水稻的密码子偏好性规律较为接近,如毛竹的4 种氨基酸具有2个高频密码子,其中Leu、Val 和Ser 在水稻中也具有2个高频密码子。另外,毛竹和水稻的终止密码子更倾向于使用UGA,且UGA 在毛竹和水稻中均为高频密码子。不同物种间的密码子偏好性分析不仅显示了种属分类特征,更为之后的跨物种生物学研究奠定基础。

基因的表达模式是基因功能的表现形式之一。qRT-PCR 结果表明毛竹扩展蛋白基因在不同组织或不同发育阶段表现出明显的表达差异性,18 个EXPA 亚家族成员均在叶中有表达,且13 个基因在叶中高表达,其中9个在未展开叶中表达量最高,6个在展开叶中表达量最高,1个老叶中表达量最高。这些结果表明,EXPA 亚家族基因主要参与叶的生长发育过程。同时,分析发现与的同源性高达93.00%,与的同源性高达90.24%。能够提高水稻对褐飞虱和稻瘟病的抗性,但降低了株高和籽粒大小,而铝诱导的会参与水稻根细胞的伸长;参与水稻叶鞘基部的不对称生长。水稻中扩展蛋白的研究进展为毛竹扩展蛋白的功能提供了参考,我们今后的研究重点集中在毛竹扩展蛋白对叶片发育的调控与胁迫响应方面。

猜你喜欢

毛竹蛋白家族
RNA结合蛋白与恶性肿瘤发生发展关系的研究进展
细砂糖对法式蛋白糖的质量影响研究
节骨草和毛竹苗
寒 秋
敲竹杠
水通道蛋白的发现
皿字家族
走进植物家族
家族中的十大至尊宝
阿尔茨海默症研究进展