APP下载

高产油绿球藻GIEC-38转录本和基因表达谱分析

2019-04-17朱顺妮王忠铭袁振宏

生物质化学工程 2019年2期
关键词:油脂测序通路

冯 佳, 朱顺妮, 许 瑾, 王忠铭, 袁振宏,2*

(1.中国科学院 广州能源研究所;中国科学院可再生能源重点实验室;广东省新能源和可再生能源研究开发与应用重点实验室, 广东 广州 510640; 2.生物质能源河南省协同创新中心, 河南 郑州 450002)

化石能源的大量消耗以及所造成的环境污染,使得大力推进生物质能等可再生能源技术的开发利用以及多元化、规模化应用成为重要发展思路[1-2],其中开发应用生物固碳工程和技术配合CO2零排放的能源新技术是重要的发展方向[3]。微藻以其生长快、适应性强、属非粮食资源以及CO2零排放等优势成为一种优质生物燃料的原料[4-5]。目前高产油藻株筛选方法主要有天然筛选、细胞工程以及宏观生长因素调控。Zaslavskaia等[6]通过基因工程技术将编码葡萄糖转运体的基因引入一种无法进行异养生长的微藻(Phaeodactylumtricomutum)细胞中,使其能在黑暗中利用外源葡萄糖进行异养生长并达到100 g/L的细胞密度。美国有研究机构[7-8]培育多种富含油脂的绿藻,其在培养基缺氮条件下含油脂达40%~66%,是自然条件下油脂含量的3~12倍。但是微藻生长速率与油脂富集之间存在很大的相互抑制,当微藻达到最佳生长速率时,其细胞中油脂含量较低;而人为控制生长条件使微藻单位干质量的油脂含量增加时,微藻的生长速率和太阳能转化效率则明显降低[9]。因而在选用天然条件下高产油藻种的基础上,结合宏观调控和细胞工程如何获取高油脂富集力藻株和开发高产油工艺是关键所在。Illumina高通量测序克服了以往研究方法的不足,RNA-Seq方法具有更高的检测通量和精确度,可对任意物种的转录组进行检测,是转录组研究的强大工具[10],如Boyle等[11]用RNA-Seq方法分析出三酰基转移酶有助于衣藻Chlamydomonas中TAG的累积。Rismani-Yazdi等[12]运用关键酶的编码基因成功识别出绿藻Dunaliellatertiolecta中参与生物合成的代谢途径。Cheng等[13]也通过Illumina高通量测序鉴别了菱板藻系统分支以及转录本功能分类等,从微观层面分析研究了油脂富集优势突变藻株的代谢机理。国内外关于绿球藻的研究分析非常少,因此很有必要对绿球藻进行微观层面的剖析。本研究选用天然条件下生长好且含油高的绿球藻GIEC-38作为研究对象,利用Illumina高通量测序RNA-Seq方法对细胞内转录本进行测定,分析了转录本的功能并对代谢通路和基因表达谱进行注释。同时通过缺N培养提高细胞油脂含量并对比细胞表达谱分析基因表达差异,以期探索发现N胁迫对于细胞微观代谢的影响。

1 材料和方法

1.1 藻株及培养基

绿球藻GIEC-38(Chlorococcumsp.),中国科学院广州能源研究所生物质能生化转化实验室分离纯化所得。BG-11培养基:1 500 mg NaNO3、40 mg K2HPO4·3H2O、75 mg MgSO4·7H2O、3 mg 柠檬酸、3 mg 柠檬酸铁铵、36 mg CaCl2·2H2O、200 mg NaHCO3、1 mg MgNa2EDTA·H2O、1 mL微量元素和999 mL去离子水。微量元素溶液的主要成分为100 mL蒸馏水中含286 mg H3BO3、181 mg MnCl2·4H2O、22 mg ZnSO4·7H2O、8 mg CuSO4·5H2O、39 mg Na2MoO4·2H2O和5 mg Co(NO3)2·6H2O。所有用于测量的藻细胞培养时均通入1% CO2,放置在恒温(25±2)℃、光照强度5 000 lx、光暗比24 h∶0 h的柱状气升光生物反应器中。

1.2 Bligh-Dyer改进方法测定细胞油脂

取适量干藻粉(0.1 g)于10 mL离心管中,加入1 mL氯仿、2 mL甲醇和0.8 mL去离子水,在35 ℃摇床上反应30 min后将样品在7 000 r/min下离心5 min,然后将液相部分移至50 mL离心管中,再次加入1 mL氯仿、2 mL甲醇和0.8 mL去离子水至固相残渣中,重复上述反应步骤直至萃取液澄清无色后收集所有离心后的液体,加入一定体积氯仿和一定体积水,静置分层,取下层部分利用离心浓缩仪或者烘箱烘至质量恒定,即得生物油,计算藻体的油脂含量,计算公式为w(油脂)=m(油脂)/m(藻粉)×100%。

1.3 转录组的测定、拼接和注释

离心收集对数期生长的藻细胞提取总核糖核酸(RNA)[13],逆转录酶反转合成互补碱基序列的脱氧核糖核酸(cDNA)并补平,扩增后回收进而用TBS380定量后在cBot上桥式扩增,生成簇,利用Illumina Hiseq4000测序平台进行2×151 bp测序实验。原始测序数据经过过滤,去冗杂后得到高质量的测序数据。采用Trinity de novo assembler[14]进行序列拼接。使用BLAST程序进行非冗余蛋白数据库(nr)比对相似度可靠性(E值<10-5)并选取最佳注释。使用Blast2Go软件按分子功能、细胞组分、生物过程对序列基因本体(GO)信息进行分类。根据KEGG基因组、生物通路、疾病、药物和化学物质之间联系的集成数据库注释的基因功能信息对基因参与的代谢通路进行分析。

1.4 差异表达谱测定

表达统计软件RSEM得到基因的表达量后通过edgeR软件对统计出的片段进行均一化并计算表达差异,其判断标准为表达量变化大于2倍,错误发现率(FDR)小于1%。采用goatools 软件[15]的GO功能对基因和蛋白的功能进行限定和描述、KOBAS软件[16]对代谢通路的显著性富集进行分析,使用Fisher精确检验进行计算、采用BH方法进行多重检验以控制计算的假阳性率,当经过校正的P值≤0.05时认为此功能显著富集。

2 结果与讨论

2.1 绿球藻GIEC-38富集油脂能力

将GIEC-38分别于完全缺氮的BG-11培养基(不含NaNO3)和缺氮的BG-11培养基(NaNO3质量浓度0和0.5 g/L)中培养12天,原始藻株的油脂质量分数为29.67%,在完全缺N的条件下菌种油脂质量分数大幅提高,可以达到50.29%,而在相对缺N的条件下,NaNO3质量浓度0.5 g/L时,藻株不仅生长较快同时细胞富集油脂的能力也有大幅提高,其油脂产量每天可以达到105.50 mg/L,这说明在N缺乏条件下GIEC-38可以大量富集油脂。为了深入探索和解释GIEC-38油脂产量高的原因,将GIEC-38进行转录组测序以及基因表达谱的测定,从微观层面探究细胞内部的代谢机理,同时对比原始藻株和完全缺N培养下的藻株两者基因表达和代谢通路的差异,从分子生物角度出发对N源的改变对细胞造成的影响进行分析和解释。

2.2 转录组测序、拼接和注释的对比

将GIEC-38进行Illumina测序共产生84 234 706条序列数,经过除杂和去冗余后,进行拼接共得到74 605条转录本,长度201~31 026 bp不等,平均长度为841.25 bp;获得65 984个基因,平均长度为743.79 bp。为了获得这些基因的注释,采用NCBI_NR非冗余蛋白库为综合数据库进行对比,查看本物种转录本序列的同源序列以及其功能信息,采用E值为10-5作为筛选比对结果的阈值,其中20 952条得到注释,最相似序列统计结果见表1,由表1可知GIEC-38基因与藻类、细菌以及动植物相关等多种物种存在相关性,这表明GIEC-38可能包含了多种来源的基因[17],其中与团藻Volvoxcarteri相似度最高为16.97%,其次与莱茵衣藻Chlamydomonasreinhardtii相似度为15.04%。

表1 GIEC-38转录本NCBI非冗余蛋白库BLAST最相似分析

为了进一步获得转录组基因的功能,利用Blast2GO软件中GO数据库对于一个或一组基因按照其参与的生物过程、细胞成分以及分子功能3个方面进行分类注释,结果如表2所示,通过GO注释可以获得基因背后所代表的生物学意义进而了解GIEC-38全部基因产物的分类情况。

表2 GIEC-38转录本GO功能分类统计

续表2

功能分类functional classification序列条数sequence numberGO生物过程biologicalprocess生长growth840040007信号signaling2300023052生物过程的负调控negative regulation of biological process1150048519代谢过程metabolic process46860008152生物调节biological regulation8700065007免疫系统过程immune system process650002376生殖过程reproductive process1280022414生物过程调节regulation of biological process8160050789建立定位establishment of localization8170051234细胞成分组织或生物合成cellular component organization or biogenesis7940071840节律过程rhythmic process190048511细胞死亡cell killing10001906刺激反应response to stimulus11860050896生物粘附biological adhesion70022610运动locomotion260040011定位localization8430051179

在生物体内,基因并不是独立存在独立作用的,不同基因产物之间是通过有序的相互协调来进行生物学功能的,为了获得GIEC-38细胞内基因的生物功能,利用KEGG数据库进行代谢通路的富集分析,共得到344条代谢途径,分布在细胞代谢、遗传信息处理、环境信息处理、细胞过程和有机系统这5个分支,其中包含基因和转录本数目最多的前20个通路如表3所示,核糖体、蛋白质、核苷酸、RNA、碳固定、光合作用以及脂代谢等通路都非常活跃。

表3 GIEC-38细胞中包含基因和转录本最多的前20个代谢通路

2.3 缺氮条件下GIEC-38基因差异表达

为了确定没有氮源的培养基对GIEC-38生长的影响,分别提取对数期原始藻株和完全缺氮培养藻株的RNA进行Illumina测序,过滤低质量的转录本后分别获得91 657 172条和80 363 364条序列,采用对比软件Bowtie通过与转录组对比获得注释的分别有79 593 640和69 176 164条序列,占比86.84%和86.08%。

通过软件edgeR对RSEM得到的数据进行差异表达计算,以原始藻株作为对照发现在缺N培养基中培养的藻细胞内有14 817个基因表达上调、15 282个基因表达下调,其中有868个基因显著上调、1 157个基因显著下调,采用显著性阈值标准为FDR≤0.05并且log2|FC|≥1。对差异表达基因按照生物学过程、构成细胞的组分以及实现的分子功能进行GO注释,结果表明GO的注释遍布41个分支,可能影响着细胞碳水化合物、蛋白质和脂质的合成中酶的表达,使得在缺氮的条件下细胞朝着脂质合成的方向进行。

对表达量有差异的基因进行KEGG pathway富集分析发现71条代谢通路发生变化,分布在环境信息处理、遗传信息处理、细胞过程、有机系统和代谢过程这5个分支。其中具有显著性差异的22条代谢通路如表4所示,可以看出,这些代谢通路与碳水化合物、蛋白质的合成、细胞的生长密切相关。

表4 缺N培养条件下GIEC-38细胞中差异表达基因KEGG显著富集前22代谢通路

从变化显著的代谢通路中分析其基因表达量的变化发现,细胞中参与光合作用的多种基因发生了明显的变化,而其光合作用碳反应中重要的羧化酶核酮糖-1,5-二磷酸羧化酶/加氧酶(rubisco)表达量下调2倍,这直接导致GIEC-38在缺N时细胞生物质积累有所减少。三羧酸循环是机体将糖或其他物质氧化而获得能量的最有效方式,同时也是糖、脂和蛋白质三大类物质代谢与转化的枢纽。三羧酸循环的中间产物,如草酰乙酸、α-酮戊二酸、丙酮酸、乙酰CoA等是合成糖、氨基酸、脂肪等的原料。氧化磷酸化位于糖酵解和三羧酸循环之后,是产生能量来源ATP的主要步骤。这些代谢通路中发现一些与中间产物合成相关基因表达量增加,这些产生的中间产物为脂肪酸的合成提供了大量原料,有利于细胞油脂的积累。另外,在和脂类代谢相关的几个通路中基因的表达也发生了一些变化。经研究表明催化脂肪酸链合成的限速酶乙酰辅酶A羧化酶表达量上升了约3 倍、催化还原反应的β-酮脂酰-ACP还原酶和烯脂酰-ACP还原酶I表达量分别是原来的3.5和1.8倍、催化第一步缩合反应的β-酮脂酰-ACP合酶I表达量上调了4.4倍、催化酶β-酮脂酰-ACP合酶表达量上调2倍以上以及中性脂TAG合成过程中1-酰基甘油-3-磷酸-O-酰基转移酶等蛋白酶的表达量是原来的8倍以上,这些基因表达的变化都推动反应朝着油脂合成的方向进行,使得GIEC-38在缺N条件下油脂质量分数大幅增加。

3 结 论

通过对绿球藻GIEC-38细胞内转录本的测定发现,参与核糖体、蛋白质、核苷酸、RNA、碳固定、光合作用以及脂代谢等通路都非常活跃。通过缺N培养GIEC-38油脂质量分数可达50%以上,细胞中有868个基因显著上调、1 157个基因显著下调,分布在41个生物学功能、71条代谢途径中。其中,与脂类代谢相关酶表达量都有明显上调,这些促使了细胞脂类的合成,提高了细胞的油脂产量。

猜你喜欢

油脂测序通路
外显子组测序助力产前诊断胎儿骨骼发育不良
A taste of Peking duck
Al-Zr-CeO2固体酸催化剂的制备及其油脂环氧化性能
中草药DNA条形码高通量基因测序一体机验收会在京召开
基因测序技术研究进展
外显子组测序助力产前诊断胎儿骨骼发育不良
欢迎订阅2019年《中国油脂》
Kisspeptin/GPR54信号通路促使性早熟形成的作用观察
proBDNF-p75NTR通路抑制C6细胞增殖
HGF/c—Met信号转导通路在结直肠癌肝转移中的作用