APP下载

亚麻纤维素合酶超基因家族的生物信息学及表达分析

2016-12-09袁红梅郭文栋赵丽娟吴建忠张利国程莉莉赵东升吴广文关凤芝

中国农业科学 2016年23期
关键词:合酶基序细胞壁

袁红梅,郭文栋,赵丽娟,于 莹,吴建忠,张利国,程莉莉,赵东升,吴广文,关凤芝



亚麻纤维素合酶超基因家族的生物信息学及表达分析

袁红梅1,郭文栋2,赵丽娟3,于 莹1,吴建忠1,张利国1,程莉莉1,赵东升1,吴广文1,关凤芝1

(1黑龙江省农业科学院经济作物研究所,哈尔滨 150086;2黑龙江省科学院自然与生态研究所,哈尔滨 150040;3黑龙江省农业科学院作物 育种研究所,哈尔滨 150086)

【目的】全基因组水平鉴定亚麻纤维素合酶超家族基因,并对基因的进化、基因结构及组织表达特性等进行分析,为亚麻纤维发育的机理研究奠定基础。【方法】利用Phytozome基因组数据库,通过生物信息学手段,鉴定亚麻纤维素合酶超基因家族成员,并进行蛋白理化特性分析;利用MEGA 5.0、GSDS、MEME等软件构建系统进化树,并进行基因结构、蛋白保守基序分析;根据RNA-Seq数据对进行表达分析。【结果】系统分析鉴定了45个亚麻超家族基因,该家族基因在scaffolds上是分散分布的,没有明显的成簇现象。CesA/Csls蛋白主要分布于质膜上,氨基酸数目为409—1 167,分子量为47 401.1—130 578.3,等电点分布在5.43—9.08。CesA/Csl蛋白均含有跨膜结构域,数目为2—8。根据系统进化分析将其分成CesA与Csl两类,细分为CesA、CslA、CslB、CslC、CslD、CslE、CslG共7组。基因结构分析显示,亚麻基因的长度在2.1—6.8 kb,外显子数量在2—14。保守基序分析表明,不同组间Motif组成有一定的差异,Motif 1、Motif 2、Motif 3、Motif 4、Motif 12在CesA、CslB、CslD、CslE、CslG组蛋白中均有分布,Motif 18、Motif 20在CslA、CslC组蛋白中均有分布,而Motif 13、Motif 14、Motif 15、Motif 19的分布则表现出一定的组间特异性。表达谱分析结果表明,家族成员在不同发育阶段表达模式不同,部分可被NaCl、BR和Brz诱导上调或下调表达,预示功能的多样性以及在植物发育过程中扮演着不同角色。【结论】鉴定出45个亚麻家族基因成员,分属于两类,7组,分布于scaffolds上,基因结构和蛋白基序具有组间多样性和组内保守性。不同的基因在不同发育阶段具有一定的时空特异性。中部分基因响应激素BR、Brz及NaCl胁迫。

亚麻;纤维素合酶;;基因家族;表达分析

0 引言

【研究意义】纤维素、半纤维素是地球上最丰富和重要的可再生资源。纤维素是由D-葡萄糖通过β-1,4糖苷键连接而成的一种线性葡聚糖,而半纤维素主要包含木聚糖、葡甘露聚糖和半乳葡甘露聚糖等,它们共同组成了细胞壁的主要骨架结构。深入研究纤维植物中纤维素的生物合成过程,挖掘控制纤维发育的重要基因,进而通过遗传操作改良植物的纤维品质和产量具有重要的理论和实践意义。【前人研究进展】纤维素、半纤维素作为细胞壁的重要组成部分,对其生物合成的研究具有重要意义。纤维素合酶超基因家族包括纤维素合酶(cellulose synthase,CesA)和纤维素合酶类蛋白(cellulose_synthase_like protein,Csl蛋白),是纤维形成的关键酶,分别参与纤维素和半纤维的合成[1-3]。目前已从40多种植物中克隆了1 400多个的相关序列[4-5]。在拟南芥()及毛果杨()中分别鉴定出10个和18个。在四倍体陆地棉()中共鉴定出37个,其中,19个来自At亚基因组,18个来自Dt亚基因组,而在二倍体雷蒙德氏棉()中鉴定出15个[6]。在拟南芥中,AtCesA1、AtCesA3、AtCesA6组成纤维素合酶复合体,参与初生细胞壁合成,AtCesA4、AtCesA7、AtCesA8则参与次生细胞壁合成[7-13]。AtCesA2、AtCesA5、AtCesA9被认为是AtCesA6的同源蛋白,这些蛋白彼此之间存在功能冗余。在棉花中,、、、、参与初生细胞壁合成,、、、参与次生细胞壁合成[14]。杨树木质部细胞膜上至少存在2种纤维素合酶复合体,复合体Ⅰ由PtCesA4、PtCesA7、PtCesA8、PtCesA17、PtCesA18组成,参与细胞次生壁的合成;复合体Ⅱ由PtCesA3、PtCesA10、PtCesA11、PtCesA13、PtCesA15、PtCesA16组成,参与细胞初生壁和次生壁的合成[15]。除CesA蛋白之外,植物体内还有Csl蛋白,该类酶则在高尔基体体腔中介导半纤维素的合成[16-17]。依据序列结构特征的不同,Csl蛋白被分为9个亚族,分别为CslA—CslH及CslJ,其中CslF、CslH和CslJ只存在于单子叶植物中[18-19]。CslA催化(1,4)-b-D-甘露聚糖的合成,CslC参与催化木葡聚糖骨架的形成,CslD则在多糖(木聚糖和半乳醛聚糖)的合成中起作用。但目前,CslB、CslE和CslG的生物学功能尚不清楚。亚麻(L.)是一种重要的韧皮纤维作物。其韧皮纤维细胞的发育主要经历2个阶段:细胞伸长和次生细胞壁加厚,这两个时期互不重叠,分别决定了韧皮纤维的长度和强度,次生细胞壁加厚与韧皮纤维的品质密切相关。韧皮纤维细胞发育是个复杂的过程,受很多基因表达调控影响,如、、等,其中,CesA是催化纤维素合成的关键酶之一,一直是植物纤维素合成研究领域中的一个热点。但亚麻纤维发育的分子生物学基础相对滞后。随着亚麻基因组测序计划的完成,生物信息学、生物化学、分子生物学和遗传学等研究方法的不断完善,亚麻纤维发育的分子生物学基础才得以不断推进。笔者前期研究发现,现蕾期喷施适当浓度的植物激素油菜素内酯(brassinosteroids,BR)及芸苔素吡咯(brassinazole,Brz)能够提高亚麻的纤维产量和耐盐性。为深入研究BR、Brz调控亚麻纤维发育和提高耐盐性的分子机制,利用Solexa技术,比较分析了BR、NaCl、Brz处理对亚麻现蕾期茎部组织基因转录表达谱的影响。结果发现,差异基因中存在大量细胞壁合成相关基因,这些基因涉及纤维素合成、木质素合成、细胞壁结构、细胞壁多糖合成代谢等。【本研究切入点】尽管对纤维素合酶超基因家族的研究有了较大进展,但大多局限于拟南芥、棉花、杨树等模式植物中,亚麻中大多成员尚未得到分离和鉴定。随着亚麻基因组序列的公布,有必要对亚麻纤维素合酶超家族基因进行全基因组挖掘和全面、系统分析。【拟解决的关键问题】本研究采用生物信息学方法,从基因组水平对亚麻纤维素合酶超家族基因的理化特性、定位、基因结构、进化等进行阐释,并根据Solexa表达谱数据对的表达特性进行分析,为亚麻纤维发育的机理研究奠定基础。

1 材料与方法

1.1 植物材料

材料为高纤亚麻品种Diana,在不同时期播种于黑龙江省农业科学院民主园区试验田,以期在同一时期获得不同发育阶段的亚麻植株。选择苗期植株喷施清水;同时,选择现蕾期植株,分别喷施清水(对照CK)、BR(0.2 mg·L-1)和Brz(1 mg·L-1)及根灌NaCl(300 mmol·L-1)等4种处理。处理12 h后分别选择生长一致的植株,取其茎中部1/3,每个处理分别取3株,3次生物学重复。取材后将样品置于液氮中迅速冷冻,-80℃保存,用于RNA的提取及Solexa数字表达谱分析。

1.2 亚麻的鉴定

根据拟南芥AtCesA及AtCsl蛋白氨基酸序列,在Phytozome数据库中进行BlastP比对,搜索亚麻同源序列。利用NCBI CDD(http://www.ncbi.nlm.nih. gov/Structure/cdd/)在线工具对获得的基因是否含有Cellulose-synt保守结构域进行确认。亚麻基因家族蛋白序列下载自phytozome数据库(http://phytozome.jgi.doe.gov/),拟南芥CesA/Csl蛋白序列下载自TAIR(http://www.arabiodpsis.org)。

1.3 亚麻的特性分析

通过phytozome数据库查询的Scaffold位点信息,利用ExPASy Proteomics Server(http://web. expasy.org/protparam/)预测蛋白氨基酸序列的基本信息,包括蛋白质的长度、分子量、等电点。利用TMHMM Server V2.0(http://www.cbs.dtu.dk/services/ TMHMM/)进行蛋白跨膜螺旋预测。通过在线软件WoLF PSORT(http://wolfpsort.or)进行亚细胞定位分析。

1.4 亚麻系统发育树的构建

使用Clustal X软件对鉴定出的45个亚麻CesA/Csl蛋白与分别来自于杨树、棉花和拟南芥的CesA/Csl蛋白进行氨基酸序列比对,比对结果通过MEGA5软件生成进化树,采用邻接法(Neighbor-Joining,NJ)构建进化树,矫正参数Bootstrap重复1 000次。

1.5 亚麻基因家族的基因结构分析及蛋白基序分析

利用Gene Structure Display Server(http://gsds1.cbi. pku.edu.cn/)在线分析基因家族的基因结构;通过MEME网站(http://meme-suite.org/tools/meme)在线分析基因家族蛋白的保守基序,参数设置:基序宽度为6×50,鉴定最大基序数量为20。

1.6 亚麻表达分析

对高通量测序表达谱数据进行背景扣除、均一化,提取亚麻45个在苗期、现蕾期以及BR、NaCl及Brz不同处理的表达量(RPKM值),利用Excel软件绘制柱形图。运用SPSS 16.0软件进行数据分析,一维方差分析(One-way ANOVA)进行组间比较,多重比较使用最小差数比较法(LSD),<0.05代表差异显著。

2 结果

2.1 亚麻的鉴定

从亚麻全基因组中共筛选到51个拟南芥AtCesA/ Csl的同源蛋白,利用NCBI CDD(http://www.ncbi.nlm. nih.gov/Structure/cdd/)在线工具对其进一步鉴定,获得45个在CDD软件上预测含有CesA保守结构域的蛋白,其中,35个蛋白含有CESA_CelA_like(cd06421)结构域,10个含有CESA_CaSu_A2(cd06437)结构域。因此,该45个蛋白被确认为亚麻CesA/Csl家族蛋白。

2.2 亚麻的基因组定位及特性分析

CesA/Csl蛋白理化特性分析表明,氨基酸长度为409—1 167,分子量为47 401.1—130 578.3,等电点分布在5.43—9.08。根据WoLF PSORT预测显示(表1),35个CesA/Csl蛋白定位于质膜上,是亚麻CesA/Csl蛋白定位最多的细胞部位。4个CesA/Csl蛋白(Lus10023056、Lus10032415、Lus10025046、Lus10022982)属于叶绿体蛋白,1个CesA/Csl蛋白(Lus10030035)位于细胞核内,还有5个CesA/Csl蛋白(Lus10003525、Lus10013851、Lus10026568、Lus10020539、Lus10039475)暂不能确定其亚细胞位置。大多数CesA/Csl蛋白都含有跨膜结构域,跨膜区是β-1,4-葡萄糖苷链穿过质膜进入细胞壁的重要通道,在亚麻中,除Lus10003525蛋白可能是截短的不完整蛋白序列,未预测到跨膜结构域外,其余CesA/Csl蛋白均含有跨膜结构域,数目为2—8。

尽管亚麻全基因测序已完成,但并未公布测序亚麻品种的染色体物理图谱,所以目前亚麻家族基因仅能定位于scaffolds上,尚无法定位到染色体上。亚麻家族基因在scaffolds上是分散分布的,无明显的成簇现象。在Scaffold 617中含有3个,在Scaffold 33、Scaffold144、Scaffold 325、Scaffold 917、Scaffold 1060、Scaffold 1186中均各含有2个,其他Scaffold上仅含有1个。

2.3 亚麻与杨树、棉花及拟南芥的进化关系

对已鉴定含有纤维素合酶保守结构域的45个亚麻纤维素合酶CesA/Csl蛋白与杨树、棉花、拟南芥的CesA/Csl蛋白构建系统进化树(图1),主要聚为7个明显的分支。根据氨基酸序列比对和进化关系远近,将CesA/Csl蛋白分为CesA、Csl两类,而Csl蛋白被细分为6组,分别命名为CslA、CslB、CslC、CslD、CslE与CslG。不同组间的之间直向相似度(ortholog)远大于平行(paralog)进化相似度,表明纤维素合酶在进化中产生分化的时期很早,在这4个物种分化之前,不同的纤维素合酶就已进化产生了不同的类型和组型。

表1 亚麻CesA/Csl基因家族信息

“—”:不明确unknown

在基因进化过程中,突变积累的数量和时间成正比,从进化树可以看出,亚麻和毛果杨的遗传距离相对较近,与棉花次之,而与拟南芥的遗传距离相对较远,与物种间的生物进化关系趋于一致。进一步分析发现,在这4个物种中数目分布基本一致,但在不同物种中数量分布具有较大差异,如亚麻CslD组基因数目较多,CslB、CslE组基因数目较少;拟南芥CslA组基因数目较多,CslE组基因数目较少;棉花CslE、CslG组基因数目较多,CslB、CslC组基因数目较少;而杨树各组基因数目分布较为均匀。推测在这4个物种的祖先中可能只存在少量的,在物种分离之后,通过基因重复的方式进行了扩增,但不同物种在不同组基因中扩张程度并不一致。

进化树上,CesA组与CslD组位于相邻的2个分支,进化关系最近。亚麻CesA组有13个基因成员,其中11个基因与杨树、棉花、拟南芥的、、、、、、聚在一起,在功能上可能参与初生细胞壁的合成;2个基因与聚在一起,在功能上可能参与次生细胞壁的合成,但没有发现和的亚麻同源基因。亚麻CslD组有15个基因,为基因成员最多的一组。Richmond等[16]推测为纤维素合酶超家族中最为古老的一个,可能在进化时间上早于。4个基因与聚为一组(CslG组),CslB与CslE组各有1个基因成员,2个基因与聚为一组(CslA组),CslC组有8个基因成员。、组基因在进化树上位于最远的分支,与组基因遗传距离最远,分化最大。

2.4 亚麻家族的基因结构分析

拟南芥中已克隆了10个,通过比较分析发现,拟南芥的10个最大的差异在于某些区域中内含子的有无,内含子的位置是确定纤维素合成酶功能的关键因素之一[20]。基因结构分析显示,亚麻的长度为2.1—6.8 kb,外显子数量为2—14。外显子数量在不同组间有较大变化(图2),CesA组成员外显子数目较多,在11—14,CslD组外显子数目较少(外显子数目为2—5)。不同组中,各组内部成员之间外显子数目相近,其中CesA组、CslC组及CslD组内部成员的基因结构保守性较高。

2.5 亚麻CesA/Csl家族的蛋白基序分析

利用MEME在线工具对亚麻CesA/Csl蛋白序列进行了保守基序分析,预测出20个Motif(图3)。在同一组内,大多数成员的Motif组成基本相同,不同组间Motif组成有一定的差异。在进化上,CesA组与CslD组亲缘关系最近,Motif组成相对保守,但也存在分化,Motif13、Motif15特异分布于CesA组中,Motif14、Motif 19则特异分布于CslD组中。Motif13是CesA蛋白N末端特有的锌指结构域,是维持纤维素合成酶复合体稳定结构的重要功能区。亚麻CesA和Csl之间存在的最大区别是Csl蛋白(除5个CslD蛋白)缺少该锌指结构域(Motif 13)。与CslD相比,CslE、CslB、CslG、CslA、CslC组蛋白序列相对较短,保守基序数目显著减少。在进化上,CslE、B、G三组蛋白亲缘关系较近,Motif组成相对保守;CslA、CslC组蛋白则分支较远,序列保守程度低,保守基序数目较少。

CesA组及CslD、CslE、CslB、CslG组成员均具有CESA_CelA_like(cd06421)保守结构域,与具有CESA_CaSu_A2(cd06437)保守结构域的CslA、CslC组成员在Motif组成上具有明显的差异。Motif 12、Motif 4、Motif 1、Motif 3、Motif 2特异分布于CesA及CslD、CslE、CslB、CslG组蛋白中,这些Motif主要分布于酶的中央结构域中,酶的中央结构域通常包含2个保守区(A区和B区),Motif 12、Motif 4、Motif 1、Motif 3位于A区中,该区域可结合纤维素合成的底物;Motif 2位于B区中,含有保守序列QxxRW, 与纤维素合酶的催化活性有关。Motif 20、Motif 18特异分布于CslA、C组蛋白中,Motif 20与Motif 3、Motif 18与Motif 2在功能上具有相似性,但经过长期的进化,除保守结构域D、QxxRW外,序列已发生明显改变。

图3 亚麻CesA/Csl基因家族蛋白的保守基序

2.6 亚麻的表达分析

亚麻不同发育时期、不同处理的RNA-Seq数据进行预处理和统计分析后,获得45个CesA/Csl基因家族成员对应表达量的RPKM值(图4),其中6个基因RPKM值都小于1,说明这些基因在5个样品中的表达量极低或不表达。通过分析发现亚麻CesA组基因中大多数基因在亚麻的苗期和现蕾期中均有较强表达,并且存在明显的共表达,表明这些基因是植株生长发育所必需的基因。Lus10039607、Lus10002939、Lus10007296、Lus10029245则表现为苗期低丰度表达,现蕾期高丰度表达,差异达到显著水平(<0.05)。其中,Lus10007296、Lus10029245是的同源基因。笔者通过荧光定量PCR分析不同发育阶段亚麻Lus10007296、Lus10029245基因的表达特性,发现这2个基因表达模式相似,在快速生长期,基因的表达量达到最高;进入花期和绿熟期时基因的表达量再次上调。快速生长期是亚麻纤维细胞启动次生细胞壁加厚阶段,至花期、绿熟期亚麻次生细胞壁进一步加厚,纤维素沉积,纤维逐渐成熟,由此推测Lus10007296、Lus10029245基因与亚麻次生细胞壁加厚密切相关。

亚麻Csl蛋白被分为CslA、CslB、CslC、CslD、CslE、CslG共6个亚组。CslA催化(1,4)-b-D-甘露聚糖的合成,亚麻中2个基因在苗期、现蕾期表现出相似的表达丰度,但它们均可被NaCl诱导上调表达,差异达到显著水平(<0.05)。亚麻中有1个(Lus10030035),该基因在不同发育时期、不同处理下均低丰度表达。CslC参与催化木葡聚糖骨架的形成,CslD则在多糖(木聚糖和半乳醛聚糖)的合成中起作用,亚麻中有8个和15个,其中Lus10039440、Lus10039475、Lus10007715、Lus10030453、Lus10009248的RPKM值为10—20,其他基因在不同发育时期、不同处理下均低丰度表达或无表达(RPKM<10)。其中,Lus10039475、Lus10007715 2个基因可被NaCl诱导上调表达,被Brz抑制表达,但差异未达到显著水平(>0.05)。亚麻CslE组只有1个基因(Lus10016625),该基因在苗期高丰度表达,现蕾期低丰度表达,且可被Brz诱导上调表达。亚麻CslG组有4个基因,该组基因在不同发育时期均表现出明显的不同,其中3个基因Lus10023056、Lus10003196、Lus10023057 现蕾期与苗期相比较上调表达,1个基因(Lus10032415)现蕾期与苗期相比较下调表达。Lus10023056可被BR、NaCl、Brz诱导下调表达;Lus10003196可被NaCl诱导下调表达,差异均达到显著水平(<0.05)。与其他Csl组比较,CslE、CslG组基因的表达量相对较高,而且在苗期和现蕾期,CslE、CslG组基因的表达丰度发生显著变化,由此推测CslE、CslG组基因可能在纤维发育中起重要作用。

3 讨论

本研究通过对亚麻全基因组生物信息学分析,共鉴定出2类,7组共45个亚麻CesA/Csl 蛋白超家族成员,该基因家族与拟南芥、杨树同源性较高,是一类植物进化中保守的家族。在亚麻中发现的编码的蛋白质与杨树、拟南芥具有相似的结构,在N末端都有1个环形锌指结构或LIM结构域(Motif 13),此种结构域具有保守序列CxxC(半胱氨酸-xx-半胱氨酸)。Kurek等[21]通过酵母双杂交发现,GhCesA1和GhCesA2通过此锌指结构可以形成为同源或异源的二聚体。除草剂(CGA325’615)能够通过阻止各蛋白锌指结构域之间的相互作用从而破坏纤维素合成酶复合体的稳定结构[21]。由此推测,纤维素合成酶基因的锌指结构域与蛋白间的相互作用有关,是维持纤维素合成酶复合体稳定结构的重要功能区。CesA和Csl之间存在的最大区别是大多数Csl蛋白(除5个CslD蛋白)缺少锌指结构[22]。纤维素的合成必须在CesA蛋白复合体的作用下完成,相比而言Csl蛋白中大多数都没有锌指结构,因此,目前学者认为类纤维素的合成很可能不需要Csl蛋白复合体结构,单一的Csl蛋白也具有催化类纤维素主链合成的活性[23]。Richmond和Somerville根据内含子与外显子排列组合的进化趋势,曾推测CslD基因家族为纤维素合酶超家族中最为古老的一个,可能在进化时间上早于CesA[16]。同时,本研究发现15个CslD蛋白中有5个成员与CesA相同,具有锌指结构,而且在进化上CslD蛋白与CesA蛋白亲缘关系最近,由此推测在进化上很可能由CslD蛋白分支出CesA和Csl类其他蛋白。

大多数亚麻CesA蛋白含有8个跨膜结构域,N-端有2个预测的跨膜区在第250个氨基酸残基附近,C-末端有6个预测的跨膜区,跨膜区是β-1,4-葡萄糖苷链穿过质膜进入细胞壁的重要通道[24]。锌指结构域和N端跨膜结构域之间有一个蛋白序列的高变区Ⅰ(HVRI),富含酸性氨基酸,功能尚不清楚。在第2和第3跨膜结构域之间是酶的中央结构域,其间有一个蛋白序列高变区Ⅱ(HVRII)。通过高变区可以区分不同的CesA蛋白,在功能上,高变区可能参与调控不同发育时期纤维素的合成[25]。高变区Ⅱ两边各有一个保守基序A区和B区,A区含有保守基序Motif 12、Motif 4、Motif 8、Motif 15、Motif 1、Motif 17和Motif 3,该区域可结合纤维素合成的底物,B区除含有一个保守的D-天冬氨酸残基外(Motif 9),还有保守序列QxxRW(Motif 2),该保守区与纤维素合成酶的催化活性有关[25]。除了蛋白序列高变区Ⅱ外,不同CesA蛋白之间中央结构域高度保守。CesA、CslD组蛋白相比保守基序数目极多,序列更加保守,而CslA、CslB、CslC、CslE和CslG组蛋白相对序列较短,保守基序数目极少,序列保守程度低,由此产生的遗传多样性对于植物更好地调控自身纤维素合成具有重要意义。

不同的CesA/Csl基因家族成员在时空上具有不同的表达模式,预示不同的CesA/Csl基因家族成员存在着功能特异性[26-28]。Suzuki等[17]对杨树中的48个的表达特性进行分析,通常在叶片组织中表达量较低,和在发育的木质部中高丰度表达,、、和在木质部中特异表达,但表达量相对较低。与拟南芥类似,的表达量明显低于,30个中只有21个基因被检测出表达量。、、和在发育的木质部中高丰度表达,和在茎尖中组织特异性表达,其他15个的表达不表现出组织特异性。Li等[29]研究发现,在陆地棉和海岛棉中在纤维素大量积累时期发挥重要作用。在非纤维组织中大量表达,则类似持家基因,在不同组织中组成型表达。同时,他们发现果胶质的积累与木葡聚糖的减少促进细胞壁的转化。本文通过对RNA-seq分析发现,亚麻大部分的表达丰度都低于,如CslB、CslC及CslD中的部分成员在不同发育时期表达丰度都极低,这与杨树、拟南芥的表达特性相同,推测基因表达量可能与纤维素、半纤维素在次生木质部中所占组分相关。苗期为亚麻纤维细胞分化,初生细胞壁形成阶段;现蕾期亚麻纤维细胞数快速增加,次生细胞壁迅速加厚。亚麻中,部分及全部CslE、CslG组基因在苗期、现蕾期表达丰度表现出明显的不同,暗示这些基因可能在参与纤维发育及初生、次生细胞壁合成中担任不同的角色。目前,Csl蛋白的生物学功能尚不清楚,有待于深入研究。

对亚麻上游启动子区域进行预测,发现多个逆境响应的顺式调控元件。RNA-seq结果表明,家族基因中个别基因可被NaCl诱导上调或下调表达,推测这些基因参与逆境胁迫信号通路。BR是植物中的甾醇类生长促进激素,参与调控纤维发育。SUn等[30]研究发现,BR受体基因抑制表达的转基因棉花,棉纤维的伸长受影响较小,但次生细胞壁的发育受到明显抑制;相反,过量表达的转基因棉花纤维素沉积显著增加。笔者前期研究发现,在亚麻现蕾期喷施适当浓度的外源BR及BR特异性合成抑制剂Brz能够影响亚麻纤维发育,提高亚麻的纤维产量。本研究中,BR、Brz处理与对照相比,部分被BR、Brz诱导上调或下调表达,这些基因可能是植物激素BR信号调控通路的下游基因。

植物纤维素生物合成机制的研究对纤维作物改良、木材定向培育以及纺织业、造纸等化工业都具有积极的科学意义,因此,通过了解植物纤维素的生物合成机制,进而改善植物纤维的品质与产量就显得十分必要。纤维素生物合成的调节涉及的表达调控、CesA蛋白修饰、CesA蛋白在高尔基体中的分泌、胞质中纤维素合酶复合体的装配、纤维素的沉积等多个方面[31],但由于纤维素合酶的生化研究难度大,该领域研究一直停滞不前。近年来,随着基因组学研究的进展及植物细胞壁突变体的发现使植物的功能研究成为可能[32],但是总体来说人们对Csl蛋白的功能尚不十分清楚,尤其的表达调控及CesA/Csl的运输、复合体的装配等问题更有待于深入研究。

4 结论

鉴定出45个亚麻家族基因成员,分属于2类、7组,分散分布于scaffolds上,基因结构和蛋白基序具有组间多样性和组内保守性。不同的基因在不同发育阶段具有一定的时空特异性,中部分基因响应激素BR、Brz及NaCl胁迫。

References

[1] CHANDRASHEKHAR P J, SHAWN D M. The cellulose paradoxsimple molecule, complex biosynthesis., 2007, 10(3): 220-226.

[2] 魏建华, 宋艳茹. 植物纤维素合酶基因研究进展. 植物学通报, 2002, 19(6): 641-649.

WEI J H, SONG Y R. Advances of studies on plant cellulose synthase., 2002, 19(6): 641-649. (in Chinese)

[3] 刘长斌, 薛永常, 聂会忠. 高等植物纤维素合酶超家族. 生命的化学, 2007, 27(6): 533-535.

LIU C B, XUE Y C, NIE H Z. The cellulose synthase supergene family in flax., 2007, 27(6): 533-535. (in Chinese)

[4] DOBLIN M S, KUREK I, JACOB-WILK D, DELMER D P. Cellulose biosynthesis in plants: from genes to rosettes., 2002, 43( 12): 1407-1420.

[5] HOLLAND N, HOLLAND D, HELENTJARIS T, DHUGGA K S, XOCONOSTLE-CAZARES B, DELMER D P. A comparative analysis of the plant cellulose synthase (CesA) gene family., 2000, 123(4): 1313-1323.

[6] YUAN D, TANG Z, WANG M, GAO W, TU L, JIN X, ChEN L, HE Y, ZhANG L, ZhU L, LI Y, LIANG Q, LIN Z, YANG X, LIU N, JIN S, LEI Y, DING Y, LI G, RUAN X, RUAN Y, ZhANG X. The genome sequence of Sea-Island cotton () provides insights into the allopolyploidization and development of superior spinnable fibres.,2015, 5:17662.

[7] LI S, LEI L, GU Y. Functional analysis of complexes with mixed primary and secondary cellulose synthases., 2013, 8(3): e23179.

[8] TAYLOR N G, LAURIE S, TURNER S R. Multiple cellulose synthase catalytic subunits are required for cellulose synthesis in., 2000, 12(12): 2529-2540.

[9] PERSSON S, PAREDEZ A, CARROLL A, PALSDOTTIR H, DOBLIN M, POINDEXTER P, KHITROV N, AUER M, SOMERVILLE C R. Genetic evidence for three unique components in primary cell-wall cellulose synthase complexes in., 2007, 104(39): 15566-15571.

[10] KIM H J, TRIPLETT B A, ZHANG H B, LEE M K, HINCHLIFFE D J, LI P, FANG D D. Cloning and characterization of homeologous cellulose synthase catalytic subunit 2 genes from allotetraploid cotton (L.).,2012, 494(2): 181-189.

[11] KOTAKE T, AOHARA T, HIRANO K, SATO A, KANEKO Y, TSUMURAYA Y, TAKATSUJI H, KAWASAKI S. Rice Brittle culm 6 encodes a dominant-negative form of CesA protein that perturbs cellulose synthesis in secondary cell walls., 2011, 62(6): 2053-2062.

[12] SONG D L, SHEN J H, LI L. Characterization of cellulose synthase complexes in Populus xylem differentiation.2010, 187(3): 777-790.

[13] CREUX N M, RANIK M, BERGER D K, MYBURG A A. Comparative analysis of orthologous cellulose synthase promoters from, Populus and Eucalyptus: evidence of conserved regulatory elements in angiosperms., 2008, 179(3): 722-737.

[14] LI A, WANG R, LI X, LIU M, FAN J, GUO K, LUO B, CHEN T, FENG S, WANG Y, WANG B, PENG L, XIA T. Proteomic profiling of cellulase-aidextracted membrane proteins for functional identification of cellulose synthase complexes and their potential associated- components in cotton fibers.,2016, 6: 26356.

[15] SONG D L, SHEN J H, LI L G. Characterization of cellulose synthase complexes in Populus xylem differentiation., 2010, 187(3): 777-790.

[16] RICHMOND T A, SOMERVILLE C R. The cellulose synthase superfamily., 2000, 124(2): 495-498.

[17] SUZUKI S, LI L, SUN Y H, Chiang V L. The cellulose synthase gene superfamily and biochemical functions of xylem-specific cellulose synthase-like genes in., 2006, 142(3): 1233-1245.

[18] HAMANN T, OSBORNE E, YOUNGS H L, MISSON J, NUSSAUME L, SOMERVILLE C. Global expression analysis of CESA and CSL genes in., 2004, 11(3/4): 279-286.

[19] FARROKHI N, BURTON R A, BROWNFIELD L, HRMOVA M, WILSON S M, BACIC A, FINCHER G B. Plant cell wall biosynthesis: genetic, biochemical and functional genomics approaches to the identification of key genes., 2006, 4(2): 145-167.

[20] RICHMOND T. Higher plant cellulose synthases., 2000, 1(4): 3001-3006.

[21] KUREK I, KAWAGOE Y, JACOB-WILK D, DOBLIN M, DELMER D. Dimerization of cotton fiber cellulose synthase catalytic subunits occurs via oxidation of the zinc-binding domains., 2002, 99(17): 11109-11114.

[22] SAXENA I M, LIN F C, BROWN RM J R. Cloning and sequencing of the cellulose synthase catalytic subunit gene of., 1990, 15(5): 673-683.

[23] RICHMOND T A, SOMERVILLE C R. Integrative approaches to determining Csl function., 2001, 47(1/2): 131-143.

[24] PEAR J R, KAWAGOE Y, SCHRECKENGOST W E, DELMER D P,STALKER D M. Higher plants contain homologs of the bacterialgenes encoding the catalytic subunit of cellulose synthase., 1996, 93(22): 12637-12642.

[25] KAUR S, DHUGGA K S, GILL K, SINGH J. Novel structural and functional motifs in cellulose synthase (CesA) genes of bread wheat (L.)., 2016, 11(1): e0147046.

[26] SUN Y, ALLEN R D. Functional analysis of the BIN2 genes of cotton., 2005, 274(1): 51-59.

[27] TAKATA N, TANIGUCHI T. Expression divergence of cellulose synthase () genes after a recent whole genome duplication event in Polulus., 2015, 241: 29-42.

[28] 朱煜, 谭梦月, 邹爱兰, 张文举, 戚金亮, 杨永华. 拟南芥、水稻和毛果杨中基因的进化和表达分析. 南京林业大学学报(自然科学版), 2013, 37(3): 11-16.

ZHU Y, TAN M Y, ZOU A L, ZHANG W J, QI J L, YANG Y H. Phylogenetic and expression analysis ofgenes in,and., 2013, 37(3): 11-16. (in Chinese)

[29] LI A, XIA T, XU W, CHEN T, LI X, FAN J, WANG R, FENG S, WANG Y, WANG B, PENG L. An integrative analysis of four CESA isoforms specific for fiber cellulose production betweenand., 2013, 237(6): 1585-1597.

[30] SUN Y, FOKAR M, ASAMI T, YOSHIDA S, ALLEN R D. Characterization of the brassinosteroid insensitive 1 genes of cotton., 2004, 54(2): 221-232.

[31] ROACH M J, MOKSHINA N Y, BADHAN A, SNEGIREVA A V, HOBSON N, DEYHOLOS M K, GORSHKOVA T A. Development of cellulosic secondary walls in flax fibers requires beta-galactosidase., 2011, 156(3): 1351-1363.

[32] DESPREZ T, VERNHETTES S, FAGARD M, REFRÉGIER G, DESNOS T, ALETTI E, PY N, PELLETIER S, HÖFTE H. Resistance against herbicideisoxaben and cellulose deficiency caused by distinct mutations in same cellulose synthase isoform CESA6., 2002, 128(2): 482-490.

(责任编辑 李莉)

Bioinformatics and Expression Analysis of the Cellulose Synthase Supergene Family in Flax

YUAN Hong-mei1, GUO Wen-dong2, ZHAO Li-juan3, YU Ying1, WU Jian-zhong1, ZHANG Li-guo1, CHENG Li-li1, ZHAO Dong-sheng1, WU Guang-wen1, GUAN Feng-zhi1

(1Industrial Crops Institute of Heilongjiang Academy of Agricultural Sciences, Harbin 150086;2Nature and Ecology Institute of Heilongjiang Academy of Sciences, Harbin 150040;3Crop Breeding Institute of Heilongjiang Academy of Agricultural Sciences, Harbin 150086)

【Objective】 Thegenes were identified in flax. Then the phylogeny, gene structure and tissue expression pattern were analyzed in order to provide a theoretical basis for studying the mechanism of flax fiber development.【Method】Based on flax genome database and bioinformatics method,genes were identified and the physico-chemical characteristics were analyzed. The phylogenetic tree was constructed by MEGA 5.0 software. The gene structure and conservative motifs were analyzed by the bioinformatics softwares GSDS and MEME. Finally, the expression ofgenes was analyzed by using the RNA-seq data. 【Result】A total of 45genes were systematically identified in flax. The genes appeared to be dispersed within the chromosome and were not clustered. The CesA/Csl proteins were mainly located on the plasma membrane. The number of amino acid of the proteins ranged from 409 to 1 167. The isoelectric point distributed from 5.43 to 9.08. All of the 45 CesA/Csl proteins possessed the transmembrane domains, the number of which was from 2 to 8. The genes were classified into 2 classes (CesA and Csl) and seven groups (CesA, CslA, CslB, CslC, CslD, CslE, CslG) according to the phylogetic relationship. Gene structure prediction indicated thatgenes ranged from 2.1 to 6.8 kb in size and most of them consist of 2 to 14 exons.The gene structure was conserved within a group. Obvious differences were observed in motif composition in genes from different groups. motif 1 to motif 4, motif 12 were observed in most of CesA, CslB, CslD, CslE, and CslG group proteins,and motif 18, and motif 20 were observed in most of CslA, CslC group proteins. Motif 13, motif 14, motif 15, and motif 19 as the spectific motifs were observed in different groups. Futhermore, somegenes could be upregulated or downregulated by BR, Brz and NaCl stress. The results of digital gene expression profile showed thatwere expressed differently at different development stages. It indicated thathad various functions and played different roles in the process of plant development. 【Conclusion】A total of 45genes in flax were systematically identified by genome-wide screening. The genes were classified into 2 classes and seven groups. The genes appeared to be dispersed within the scaffolds. The analysis of gene structure and conservative motifs indicated that there were obvious differences between groups, but the genes within a group varied slightly. RNA-seq expression profiling of thegenes revealed unique, homoeolog-specific expression patterns at different development stages. Some of them could be induced by BR, Brz or NaCl stress.

flax; cellulose synthase;; gene family; expression analysis

2016-03-21;接受日期:2016-08-30

国家博士后面上项目(2014M560275)、黑龙江省博士后项目(LBH-Z13181)、哈尔滨市科技局创新人才项目(2013RFQYJ162)、国家麻类产业技术体系(CARS-19-S03)

袁红梅,E-mail:yuanhm1979@163.com

猜你喜欢

合酶基序细胞壁
EPIYA 基序与幽门螺杆菌感染相关胃病关系的研究进展
带TRS基序突变的新型冠状病毒威胁更大
芥蓝Aux/IAA家族基因生物信息学与表达分析
四种中药单体选择性抑制环氧合酶-2活性的评价
红花醇提物特异性抑制酿酒酵母细胞壁合成研究
茄科尖孢镰刀菌3 个专化型细胞壁降解酶的比较
酶法破碎乳酸菌细胞壁提取菌体蛋白的研究
过量表达URO基因抑制拟南芥次生细胞壁开关基因表达
寻常型银屑病皮损组织环氧合酶2(COX-2)的表达研究
同型半胱氨酸、胱硫醚β合酶与脑卒中