APP下载

陆地棉膜结合脂肪酸去饱和酶基因家族的全基因组鉴定及表达分析

2023-05-27陈义珍李浩傅明川王立国刘任重柳展基

山东农业科学 2023年4期
关键词:生物信息学分析基因表达

陈义珍 李浩 傅明川 王立国 刘任重 柳展基

关键词:陆地棉;膜结合脂肪酸去饱和酶;全基因组鉴定;生物信息学分析;基因表达;干旱和盐胁迫;褪黑素

脂肪酸去饱和酶(fatty acid desaturase,FAD)能够在脂肪酸链的特定位置引入双键,是产生不饱和脂肪酸的关键酶。植物中的不饱和脂肪酸主要包括油酸、亚油酸、亚麻酸和花生四烯酸等,不仅是储藏油脂的重要组分,还是植物细胞膜脂的主要成分。FAD包括FAD2、FAD3、FAD4、FAD5、FAD6、FAD7禾口FAD8,其中FAD2和FAD6为-6(也称A12)去饱和酶,能够在油酸脂肪酸链的A12处引入第二个氢键,催化油酸转变为亚油酸;FAD3、FAD7和FAD8为(-3(A15)去饱和酶,能够在亚油酸脂肪酸链的A15处添加第三个氢键,进而产生亚麻酸;FAD4、FAD5和FAD6的催化底物为棕榈酸。1992年,Arondel等从拟南芥中图位克隆了FAD3基因.其后FAD基因相继在油菜、水稻、大豆、玉米等作物中被分离。

棉花是世界上最重要的天然纤维作物,同时也是重要的食用油和蛋白来源。棉仁中油分含量高达30%~40%,棉籽油富含多种不饱和脂肪酸,其中油酸和亚油酸含量约占80%。FAD2是脂肪酸去饱和反应的限速酶,决定了油脂中油酸和亚油酸的比例和油脂品质,抑制FAD2基因的表达,能够降低A12-脂肪酸去饱和酶的活性,致使种子中油酸含量增加。利用TALENs技术靶向敲除大豆FAD2-1A和FAD2-1B基因,纯合双基因突变体的油酸含量显著上升,由20%提高到80%,而亚油酸含量大幅下降,由50%降至4%。Liu等利用RNAi技术抑制棉花FAD2-基因的表达,获得的棉花高油酸品系High-Ole-lC和Mono-Cott的油酸含量分别达到77%和81%。近年来,棉花基因组研究进展迅速,二倍体棉种雷蒙德氏棉(Ds)和亚洲棉(A2)以及四倍体棉种陆地棉(AD1)和海岛棉(AD2)的基因组相继被破译,为利用生物信息学在全基因组范围内进行重要基因家族的鉴定和分析提供了可能。目前,已知拟南芥基因组中含有17个FAD基因,水稻中有10个,油菜中多达84个。在雷蒙德氏棉基因组中,Liu等鉴定了19个FAD基因。然而,陆地棉中FAD基因家族的系统分析尚未见报道。本研究利用最新发布的陆地棉标准系TM-I的基因组数据,对膜结合FAD基因家族进行全基因组鉴定,分析其基因结构、染色体定位、保守基序、基因复制和顺式作用元件,并分析其在干旱胁迫、盐胁迫及施加外源褪黑素下基因的表达模式,为进一步研究棉花FAD基因家族各成员的功能奠定基础。

1材料与方法

1.1供试材料

供试陆地棉(Gossypium hirsutum L.)品种为K836,种子由本实验室保存。采用1/2Hoagland营养液水培法将棉花幼苗培养至两叶一心。用100umol/L褪黑素进行处理,分别于处理后0、3、6、12h对棉花叶片进行取样,每个样品3次生物学重复,置于液氮中冻存备用。

1.2陆地棉FAD基因鉴定与注释

陆地棉标准系TM-1的基因组序列数据来自于CottonFGD數据库(http://www.

cottonfgd.org/)。利用拟南芥的17个FAD基因的氨基酸序列作为查询序列,检索棉花基因组蛋白数据库(Blastp,E≤e-10)。同时,从Pfam数据库(http://pfam.xfam. org/)下载FAD蛋白保守结构域FA—desaturase(PF00487)的隐马尔可夫模型文件,利用HMMER 3.0软件搜索陆地棉的蛋白数据库。将获得的候选序列提交Pfam和SMART(http://smart.embl- heidelberg. de/)数据库,确认是否具有FAD蛋白保守结构域。利用ExPASy(https://web. expasy. org/compute—pi/)分析棉花FAD基因家族成员的分子量和等电点。利用CELLO(http://cello. life. nctu. edu. tw/)对棉花FAD基因家族成员进行亚细胞定位预测。

1.3陆地棉FAD的系统进化和染色体定位分析

利用ClustalW软件对拟南芥和陆地棉FAD蛋白序列进行多重序列比对,利用MEGA-X软件中的邻接法(neighbor-joining,NJ)构建系统进化树,Bootstrap值设置为1000。根据陆地棉基因组提供的基因注释信息,获得FAD基因在各染色体上的位置,利用MapChart 2.32软件绘制其染色体分布图。

1.4陆地棉FAD基因结构、保守基序和上游顺式作用元件分析

首先从棉花基因组注释文件(gff文件)获得FAD基因的DNA和cDNA信息,利用GSDS 2.0软件(http://gsds.cbi.pku.edu. cn/)绘制棉花FAD基因家族成员的基因结构图23]:利用在线软件MEME(http://meme - suite. org/tools/meme)分析FAD蛋白的保守基序,基序数值设定为10。利用陆地棉基因组数据,提取FAD基因转录起始位点上游1500bp序列,在PlantCARE数据库(http://bioinformatics. psb. ugent. be/webtools/plantcare/html/)中检索,鉴定上游启动子区域可能存在的顺式作用元件。

1.5陆地棉FAD基因复制分析

利用MCScanX软件分析陆地棉基因组内的同源基因,如比对上的序列长度超过长序列长度的75%且序列的相似性超过75%,则认为此同源基因为复制基因,并利用可视化工具Circos(ht-tp://circos.ca/)展示复制的同源关系。采用KaKs_Calculator2.0计算复制基因的K(非同义替换率)和K(同义替换率)值,通过K/K值分析环境选择压力。

1.6RNA-seq分析

利用前期试验得到的陆地棉干旱(PEG)和盐胁迫(NaCl)处理3、6、12、24h后的转录组数据(未发表),筛选得到FAD基因表达量数据。利用FPKM(fragments per kilobase of million mappedreads)对原始表达数据进行标准化处理,并利用TBtools软件绘制表达量热图。以log2(FC)绝对值大于1为差异基因的筛选标准。

1.7基因表达分析

采用北京艾德莱生物科技(Aidlab)有限公司植物RNA快速提取试剂盒(RN3802)提取叶片总RNA,分别取1ptg总RNA进行反转录,反应体系和操作程序参照TRUE script RT Master Mix( On-eStep gDNA Removal) -步法基因组清除反转录试剂盒(PC70)说明。将反转录产物稀释10倍,选择Ubiquitin(GenBankNo.

AY189972)基因作为内参基因,进行定量RT-PCR,所用引物见表1,由北京六合华大基因科技有限公司合成。选用Aidlab公司的2xSybr Green qPCR Mix试剂盒,反应体系为20uL:2xSYBR qPCR Mix10uL,基因特异性上下游引物各0.4uL(10umol/L),模板cDNA0.8uL,补ddH20至20uL。使用Ther-mo Fisher Scientific QuantStudio 5荧光定量PCR仪,反应程序:95℃预变性3min;95℃15 s,60℃15 s,40个循环;熔点曲线程序为95℃15 s,60℃1min,95℃15s。每个样品进行3次重复试验,采用2-△△法计算基因的表达量。利用Graphpad进行差异显著性分析。

2结果与分析

2.1陆地棉FAD基因家族成员的鉴定

在陆地棉基因组中共鉴定出37个FAD基因(表2),均含有保守的FA—desaturase结构域(PF00487)。FAD蛋白的氨基酸序列长度差异较大,GH_A13G0678最短,为308个氨基酸,而GH—A10G2629和GH_D10G2734最长,均为450个氨基酸;GH_A13G0678的分子量最小,为35. 41kDa,GH_A12G1258的分子量最大,为51.87kDa;FAD蛋白的等电点差异较大,GH_D06G1474的等电点最小,为6.95,其余FAD蛋白的等电点均在7.29及以上,为碱性,以GH_D05G1245的等电点最大(9.37)。大多数FAD蛋白定位在内质网和质膜上,少数FAD蛋白位于叶绿体中,仅GH_D12G1274位于溶酶体中(表2)。

2.2陆地棉FAD基因的系统进化和染色体定位分析

为了研究陆地棉FAD基因家族成员之间的进化关系,我们利用陆地棉和拟南芥FAD蛋白序列构建了系统进化树。按照亲缘关系的远近,将陆地棉FAD基因家族分为4个亚家族,分别为First、Sphingolipid、Front-end和Omega亚家族(图1)。4个亚家族中的FAD成员数量差异较大,其中,First亚家族中陆地棉FAD成员最少,仅有2个,而拟南芥FAD成员多达9个;Sphingolipid亚家族中仅含有1个拟南芥FAD成员,却含有4个陆地棉成员:Front-end亚家族中陆地棉和拟南芥的FAD成员分别为10个和2个;Omega亚家族中陆地棉FAD成员数量最多,为21个,拟南芥FAD成员为5个。

根据陆地棉标准系TM-1的基因组注释信息,将37个FAD基因定位在22条染色体上,其中AO1、A13和D01染色体上分别含有3个FAD基因;A05、A07、A10、A11、D05、D07、D10、D11和D13染色体上分别含有2个FAD基因:其余10条染色体上分别含有1个FAD基因(图2)。

2.3陆地棉FAD基因结构和保守基序分析

陆地棉FAD基因4个亚家族呈现不同的结构特征(图3)。First亚家族的FAD成员具有相同的基因结构,均含有5个外显子;Sphingolipid亚家族的FAD基因亦具有相同的基因结构,均含有2个外显子;Front-end亚家族的基因结构也比较保守,10个FAD成员中,8个FAD基因含有1个外显子,其余2個FAD成员含有2个或3个外显子;Omega亚家族的基因结构存在3种方式,11个FAD成员含有8个外显子,2个成员含有10个外显子,剩余的8个成员含有1个外显子。

利用MEME分析陆地棉FAD蛋白的保守基序,共发现3个保守组氨酸基序(Histidine-box 1、Histidine-box 2和Histidine-box 3),但不同亚家族成员的组氨酸基序的序列不同(图4)。Omega亚家族的Histidine-box 1为H[D/ElC[G/A]H,His-tidine-box 2为H[R/D][R/T/I] HH, Histidine-box3为H[V/I][I/A/P] HH,尽管中间的氨基酸残基不同,但两侧均为保守的组氨酸残基。Front-end亚家族的Histidine-box 1和Histidine-box 2序列十分保守;Histidine-box 3为Q[L/I/V] EHH,其起始氨基酸为谷酰胺。Sphingolipid亚家族成员的3个组氨酸基序都十分保守,且基序两侧皆为保守的组氨酸。First亚家族Histidine-box 3为典型的组氨酸基序,Histidine-box 1的最后一个氨基酸残基为亮氨酸,而Histidine-box 2不具有典型的组氨酸基序特征。

2.4陆地棉FAD基因复制分析

基因复制在基因家族扩张过程中发挥重要作用。利用MCScanX对陆地棉基因组中的基因复制事件进行分析,发现FAD基因家族共存在28对片段复制基因,无串联复制基因。其中,21对基因复制发生在A和D亚基因组之间,4对发生在A亚基因组之内,剩余3对发生在D亚基因组之内(图5),表明片段复制是棉花FAD基因家族扩张的主要方式。随后,利用KaKs_Calculator分析复制基因的K1/K2值,结果显示所有复制基因的K1/K2值均小于0.55(表3)。

2.5陆地棉FAD基因上游顺式作用元件分析

利用陆地棉FAD基因转录起始位点上游1500bp序列分析顺式作用元件,结果发现棉花FAD基因的上游序列除了存在启动子核心元件TATA-box和CAAT-box外,还存在许多激素和逆境胁迫响应元件(图6)。其中,植物激素响应元件有9种,分别是ABRE、AuxRE、CGTCA-mo-tif、TGA-element、ERE、GARE-motif、P-box、TCA-element和TGACG-motif; ABRE、ERE和TCA-ele-ment分别响应脱落酸、乙烯和水杨酸,TGACG -motif和CGTCA-motif为茉莉酸甲酯响应元件,AuxRE和TGA-element为生长素响应元件,GARE-motif和P-box为赤霉素响应元件。逆境胁迫响应元件有6种,包括ARE、DRE、LTR、MBS、WUN-motif和TC-rich,分别是缺氧胁迫、冷害、低温、干旱、损伤和防御响应元件。

2.6陆地棉FAD家族基因在盐胁迫和干旱胁迫下的表达特征

为明确FAD基因在盐胁迫和干旱胁迫下的表达模式,基于转录组数据对37个FAD基因在两种胁迫处理不同时间点陆地棉叶片中的表达量进行聚类分析,结果如图7所示。

盐胁迫下,37个FAD基因呈现不同的表达模式,其中有28个FAD基因在不同处理时间均有表达,7个FAD基因未检测到表达信号,而GH一A06G1435基因仅在处理后6h检测到表达量增加,GH一DOIG2529仅在处理后24h检测到表达量增加。另外,28个FAD基因呈现不同的表达模式,17个FAD基因表达量降低,7个FAD基因表达量增加[log2(FC》1],4个基因的表达量先增后降,2个基因的表达量先降后增(GH一D08G2811和GH_D11G0999)。

干旱胁迫下,37个FAD基因中有27个在不同处理时间均有表达,有6个未检测到表达量变化,有4个仅在两个处理时间点下表达量增加。另外,27个FAD基因中仅GH_D04G1454表达量增加,17个基因在干旱胁迫下表达量降低,9个基因仅在一个或两个处理时间(6h或12h)点下表达量增加,其他时间点的表达量降低。

褪黑素作为一种重要的多效性抗氧化分子,能帮助植物抵御不利环境的危害,而且外源褪黑素能显著缓解逆境胁迫引起的伤害。因此,本研究基于干旱胁迫和盐胁迫下FAD基因的转录组结果,选出25个FAD基因(包括Front-end亚家族的8个,Omega亚家族的15个,First亚家族的1个,Sphingolipid亚家族的1个),通过在棉花苗期施加外源褪黑素,进一步探究FAD基因在外源褪黑素下的表达特征。定量分析结果显示,在褪黑素处理后,1个FAD基因(GH_AOIG1380)未检测到表达量的变化,另外24个FAD基因与对照相比,有7个基因表达量增加,17个基因表达量降低,且上调表达的FAD基因均在处理后6h表达量增加最多。Front-end亚家族8个FAD基因中有6个基因在褪黑素处理后表达量增加,2个基因表达量降低;Omega亚家族表达的14个FAD基因中仅有1个在处理后表达量增加,其他基因都呈现表达量降低趋势;First、Sphingolipid亚家族的各1个基因则均在处理后表现为表达量降低(图8)。

3讨论与结论

植物脂肪酸作为储藏油脂和细胞膜脂的重要组分,既为植物的生长发育提供能量,也在响应多种逆境胁迫中发挥重要作用。FAD是植物脂肪酸进一步去饱和反应中的关键酶,目前已在拟南芥、水稻、花生、大豆和油菜等物种中相继完成了全基因组水平上的鉴定和分析。本研究从陆地棉基因组中鉴定出37个FAD基因,而二倍体雷蒙德氏棉仅含有19个FAD成员,是其1.95倍,造成这种差异的原因可能是棉花进化过程中的异源多倍化现象。棉属植物进化分析表明,在170万~190万年前,陆地棉由A基因组供体亚洲棉和D基因组供体雷蒙德氏棉种间杂交加倍而成。另外,陆地棉FAD基因数量远多于模式植物拟南芥和水稻,分别是其2.18倍和3.70倍。

进化分析将陆地棉和拟南芥的FAD基因分为4个亚家族,且每个物种的FAD基因在4个亚家族中均有分布,表明FAD基因的分化可能早于棉花和拟南芥的物种分化。除了First亚家族,其他3个亚家族中陆地棉FAD基因的数量远多于拟南芥,预示Omega、Front-end和Sphingolipid亚家族中的陆地棉FAD基因可能在进化过程中发生了物种特异性扩张。这一结果与之前二倍体雷蒙德氏棉中的报道一致。

基因复制是植物进化的主要动力,主要包括串联复制、片段复制和全基因组复制。本研究在陆地棉FAD基因家族中发现了28对复制基因,来源于4个亚家族,且全为片段复制,表明在陆地棉进化过程中FAD基因由于片段复制发生了基因家族扩张。。值常用来检验同源基因是否经历了选择作用,K/K>1,认为有正选择作用,为纯化或负选择作用;K/K=1,则认为存在中性选择作用。本研究中所有复制基因的K/K值均小于1,表明陆地棉FAD基因在进化过程中经历了纯化选择作用。

顺式作用元件分析发现,陆地棉FAD基因的启动子区含有植物激素和逆境胁迫响应元件,预示其可能在激素信号响应和防御逆境胁迫中起作用。目前,已知雷蒙德氏棉中有7个FAD基因受低温诱导表达.5个FAD基因受低温抑制表达。部分FAD基因呈现组织特异性表达,如FAD2-1在发育的种子中特异表达,FAD2-2和FAD2-3在种子发育过程中组成型表达,在叶片中少量表达。

植物中位于质膜上的脂肪酸大部分是不饱和脂肪酸,而植物对环境胁迫的抗性与质膜上脂肪酸的不饱和程度密切相关,膜结合基因对维持植株在多种胁迫下的正常生长起着非常重要的作用。在拟南中,FAD2和FAD6是提高幼苗早期生长耐盐性的重要基因,FAD7基因的反义表达则降低了对盐胁迫和干旱胁迫的耐性。在番茄中超表达LeFAD3基因增强幼苗早期生长的耐盐性。为探究陆地棉FAD基因在逆境胁迫下的表达模式,利用盐胁迫和干旱胁迫的转录组数据对陆地棉37个FAD基因进行分析,发现70%以上的FAD基因对两种胁迫均有应答,其中下调表达的FAD基因分别占54%和63%。值得注意的是,本研究Front-end亚家族包含的10个基因中除了亚细胞定位预测在溶酶体的GH一D12G1274基因外,其余9个基因全部定位于质膜,干旱胁迫后7个基因都是下调表达,GH_A12G1258和GHD11G0999基因也仅在6h或24h表达量增加,说明干旱胁迫可能会抑制质膜上FAD基因的表达。

褪黑素在植物非生物胁迫防御系统中发挥重要作用,且几乎所有非生物胁迫引起的过氧化伤害都能被褪黑素缓解。褪黑素提高植物对环境胁迫抗性机制主要是通过提高抗氧化物质含量和抗氧化酶活性,改善光合系统,调控激素合成和代谢,调控植物细胞中初级和次级代谢,刺激细胞合成更多的保护物质等方式。通过定量PCR,进一步分析了25个FAD基因在施加外源褪黑素后的表达特征,发现17个基因下调表达.7个基因上调表达,1个基因没有表达变化。值得注意的是,Front-end亚家族中的5个基因在干旱胁迫后下调表达而在褪黑素處理后上调表达,且在处理后6h表达量显著增加,它们可作为候选基因用于后续基因功能的进一步探究。本研究结果可为进一步揭示陆地棉FAD基因逆境响应机理提供参考。

猜你喜欢

生物信息学分析基因表达
斑节对虾金属硫蛋白全基因DNA克隆及生物学信息分析
雷公藤贝壳杉烯酸氧化酶基因的全长cDNA克隆与表达分析
低温处理对斑马鱼CNSS系统应激相关基因的影响
基因芯片在胃癌及肿瘤球细胞差异表达基因筛选中的应用
西瓜食酸菌CusB蛋白的生物信息学分析
非生物胁迫对拟南芥IQM4基因表达的影响
羊种布氏杆菌3型Omp25基因序列及其表达蛋白生物信息学分析
西藏牦牛NGB基因克隆及生物信息学分析
地黄纤维素合酶基因的克隆与生物信息学分析