硅藻基因组学研究进展※
2023-12-12宋汶轩王振东李亚堃罗智慧蔡春雨
●宋汶轩 王振东 李亚堃 罗智慧 蔡春雨 陈 卓
(山东师范大学生命科学学院 山东 济南 250358)
硅藻是一类单细胞光合自养的真核生物,起源于次级内共生过程,属于Stramenopile谱系,绝大多数硅藻可以进行光合放氧作用[1-3]。硅藻的显著特征之一是具有硅质化的细胞壁,其主要成分由不定形二氧化硅组成。不同硅藻硅质化细胞壁纹理和形态各不相同,早期用于硅藻的分类研究[4]。硅藻种类繁多,几乎在所有水生栖息地包括淡水、海水及潮湿的土壤中均有发现。据估计,硅藻贡献了大约50%的海洋初级生产力和25%的全球初级生产力,并参与全球生物地球化学循环[5-6]。硅藻在实际生产中也具有广泛的应用价值,包括生物医药和生物能源等方面[7]。其中,生物医药方面,硅藻富含多不饱和脂肪酸、类胡萝卜素、多糖、维生素和甾醇等活性物质[8],目前已经被用于疫苗及其佐剂和抗体合成等医药分子的开发[9]。生物能源方面,硅藻细胞积累的中性脂可以提取后转化为生物柴油等[10]。
迄今为止,硅藻已有多个物种完成了基因组测序。早在2004年和2008年,即应用第一代测序技术,分别完成了中心纲伪矮海链藻(Thalassiosira pseudonana)[1]和羽纹纲三角褐指藻(Phaeodactylum tricornutum)[2]的基因组测序。目前,硅藻基因组测序主要借助第二代测序技术,完成了具有异源二倍体基因组结构的Fistulifera solaris[11]、具有高度杂合基因组的冷适应圆柱拟脆杆藻(Fragilariopsis cylindrus)[12]、具有较大基因组的硅藻Thalassiosira oceanica[13]和Fragilaria radians[14]等的基因组测序。研究发现硅藻具有“嵌合式基因组”的特点,显示它们经历了复杂的进化历程[1-2]。
硅藻基因组学的研究推动了其在生态、进化、环境适应及生产应用等方面的科研成果。本文主要概述硅藻结构基因组学及功能基因组学等相关研究进展。
1 硅藻结构基因组学研究
硅藻基因组的全面分析揭示了其来自藻类和异养祖先的内共生起源,以及来自细菌等其他物种的水平基因转移等重要的生物学过程。此外,硅藻的嵌合式基因组还受到表观遗传等过程的影响[4]。硅藻结构基因组主要包括染色体基因组、质体基因组及线粒体基因组。
1.1 染色体基因组研究
伪矮海链藻是第一个完成基因组测序的硅藻。Armbrust等[1]报告了该藻株34 Mb碱基对的核基因组草图,及其129 kb 碱基对质体基因组和4·4 kb 碱基对线粒体基因组。伪矮海链藻核基因组包含24个二倍体核染色体。测序结果鉴定了一系列基因,包括硅酸转运和硅质化细胞壁的形成基因、高亲和力铁吸收基因和一些多不饱和脂肪酸的生物合成酶基因,以及完整的尿素循环基因等。
三角褐指藻基因组测序分析揭示了硅藻中基因的多样化来源。该模式硅藻中包含数百个来自细菌的基因,它们可能借助基因水平转移获得,并在硅藻感知环境信号方面发挥作用。此外,该研究重点探讨了三角褐指藻营养代谢机制,尤其是细胞中的尿素循环。研究人员利用RNA干扰沉默了细胞中尿素循环的关键酶,发现尿素循环是维持硅藻碳氮平衡的重要原因[2]。Rastogi等[15]在不同空间和时间尺度上进行三角褐指藻采样,然后借助全基因组重测序绘制了该模式藻种内基因组多样性的图谱。该藻株至少存在10个不同的生态型藻株,它们分为四个遗传进化分枝,并在形态比例、油脂含量及环境适应性等方面存在差异。同时,无性繁殖在所有三角褐指藻种群中占主导地位。此外,这些生态型藻株展现了遗传和功能的趋同特征,导致很多基因和代谢途径的选择压力发生变化。该发现对理解自然界中硅藻种群的遗传结构具有重要意义,并为后续开发此藻株功能基因组学研究以及生物技术的应用等提供了宝贵的资源。
海洋硅藻T. oceanica显示出对低铁条件的显著耐受性。借助基因组、转录组及蛋白组等组学的联合分析,揭示了T. oceanica进化出多种复杂的策略来吸收利用铁。比如,细胞通过降低铁的需求、提高铁的吸收及重塑生物能量的通路等适应低铁环境。该藻株还可以借助光能利用的重塑和整体光合电子转移复合体的减少应对铁缺乏。此外,铁调节三种含金属的二磷酸果糖醛缩酶取代不含金属的酶系参与碳水化合物代谢转化。该研究鉴定了高亲和力的铁吸收系统,推测该系统中一些基因是由于复制事件产生。此外,T. oceanica基因组高度可塑性还反应在存在很多基因水平转移事件上。以上策略为硅藻T. oceanica适应低铁环境提供了前提[13]。
产油硅藻F. solarisJPCC DA0580基因组分析数据提供了异源二倍体基因组结构的证据,显示出该藻株特殊的分子进化过程和遗传调控系统。F. solaris主要代谢途径与非产油硅藻相同,但转录组分析揭示了油脂合成中一些基因独特的表达模式变化,如伴随ATP的产生,细胞会同步上调脂肪酸/三酰基甘油生物的合成和脂肪酸的β-氧化降解。这种特殊的基因表达模式可能同时刺激了细胞的生长和油脂的积累,因此,这种新型的产油微藻将来有望应用于生产生物能源[11]。
Galachyants等[14]应用高通量测序方法确定了从贝加尔湖中分离出的F. radians(早先命名为Synedra acussubsp·)的完整基因组序列,组装后的基因组总长度为98 Mb,平均覆盖率为33 x。随后,转录组数据包含27 446个转录本,可能编码21 996个预测蛋白质。借助测序组装和注释与定量实验相结合的方法,鉴定到指数生长期和暗适应细胞培养物之间的差异表达转录物,以及在暗适应下细胞对光处理的早期响应时基因的表达水平变化。F. radians基因组和转录组测序结果为解析该物种适应环境的分子调控网络提供了研究基础[17]。
海洋硅藻Cyclotella cryptica是一种可用于大规模生产生物燃料和生物产品的微藻。对此种硅藻核基因组和甲基化组进行测序,发现基因组由高度甲基化的重复序列组成。在硅饥饿条件下甲基化水平不会发生显著变化,进一步分析表明DNA甲基化的主要作用是抑制DNA转座。糖酵解、脂质代谢和碳水化合物降解等过程有助于促使C. cryptica积累三酰基甘油。该研究还鉴定了参与碳转运和几丁质代谢等基因,同时还开发了新的遗传操作工具,为遗传改造该物种并应用于大规模的生产生物燃料等提供便利[18]。
4.进一步放大我省水稻水产“两水”资源优势,大力发展稻渔综合种养,全省大面积推广“双水双绿”技术规范,利用国家财政政策性支持资金大面积改造适宜稻田,鼓励农业龙头企业流转抛荒的稻田,大面积示范“双水双绿”技术,建立公司+农户的农业合作社模式,打造绿色水稻、绿色水产的新模式。
寒冷适应型硅藻(F. cylindrus)基因组测序显示其总基因组大小为 61·1 Mb。作为二倍体生物,研究人员发现F. cylindrus基因组中大约24·7%的基因组由具有高度不同的等位基因位点组成。细胞中很多此类等位基因在不同环境条件下,包括黑暗、低铁、冷冻、高温和二氧化碳增加,存在差异表达。该项研究为开展硅藻响应及适应逆境(尤其是低温环境)的分子机制提供了借鉴[12]。
Basu等[19]研究了海洋浮游硅藻Pseudonitzschia multistriata细胞有性生殖过程,该过程对种群会产生动态的影响并且需要精确的调控。对P. multistriata基因组测序,系统基因组学及转录组学的分析,研究了基因获得及丢失、水平基因转移、性相关基因的保存及其进化速率。研究发现G蛋白偶联受体和环磷酸鸟苷与对有性生殖过程相关,它们可调节细胞周期、减数分裂相关和营养转运等基因。P. multistriata细胞周期和基因组研究可以重建硅藻在其生命周期关键阶段发生的变化,为探究基因的进化和其功能的鉴定提供线索,并为有性生殖的研究提供支持。
Ogura等[20]对日本海域主要的赤潮藻Skeletonema costatum进行了基因组及RNA测序的分析。进化基因组学和比较转录组学研究结果揭示了氧化胁迫及细胞分裂素应激响应的基因是该硅藻增殖的关键。研究结果同时表明S.costatum参与氧化应激和细胞分裂素反应相关的基因为多拷贝,爆发赤潮时此类基因的表达增强。
Sato等[21]借助超微结构和分子信息来重新分类硅藻Plagiostriatasp· CCMP470(之前被注释为Leptocylindrus danicus),同时还提供了该藻株的基因组草图。在Plagiostriata基因组中发现270个结构域家族数据库(19%)在其他硅藻基因组中是未知的。值得注意的是,Plagiostriata的DNA文库还包含一种α-变形菌的基因组。该研究对已经发表的藻类基因组和转录组数据进行分析发现了共生的α-变形菌序列,这表明藻类及α-变形菌可能存在广泛的共存关系。
海洋生物膜形成硅藻Seminavis robusta基因组分析结果表明,基因家族扩展占该物种所有预测蛋白质编码基因(36254)的1/4。串联重复事件在扩展特定基因功能(包括光和氧感应)方面发挥着关键作用,这可能是S. robusta适应底栖环境的关键原因之一。该物种与细菌相互作用差异表达的基因在其他底栖硅藻中高度保守,而许多物种特异性基因在有性生殖阶段显著上调。同时,来自48个株系的重新测序数据分析为底栖硅藻的遗传多样性和基因功能的提供了见解[22]。
非光合硅藻Nitzschia Nitz4基因组测序分析了碳代谢在异养型硅藻中营养方式的转变。分析结果显示,该硅藻整个细胞范围都进行了异养型转变。N. Nitz4细胞保留了质体及质体基因组,但是细胞核和质体基因组中光合作用相关基因的丢失。硅藻质体中不合成类异戊二烯,线粒体糖酵解发生重塑,以便于最大限度地提高ATP产量。N.Nitz4基因组包含一个β-己二酸酮途径,该途径可能允许N. Nitz4能够代谢木质素衍生化合物。该硅藻质体缺乏氧化磷酸戊糖途径,使得非光合质体中NADPH的来源受到限制。该基因组研究揭示了非光合硅藻和顶复门原虫之间在质体中提供NADPH的相似性,并强调了质体氧化磷酸戊糖途的缺失是导致光合作用丧失潜在的重要因素[23]。
全基因组复制事件与物种形成、增加谱系多样化有关,并被确定为被子植物进化的主要驱动力。Parks等首次使用基因计数、基因进化树和同义分歧分布对 37 种不同的硅藻物种进行全基因组复制的系统发育分析,并搜集了大量证据表明多倍体在硅藻中可能很常见。研究结果支持在Thalassiosiroid和羽纹纲硅藻进化分枝中存在古老的异源多倍体事件,并且异源多倍体作为多倍体形成的主要模式。该项研究证实了全基因组复制在硅藻基因组的进化中发挥了重要作用[24]。
1.2 质体基因组及线粒体基因组研究
蓝藻是真核藻类及高等植物质体的祖先。通过内共生过程产生质体是真核生命史上最重要的事件之一。在此过程中,蓝藻与宿主真核生物在遗传、生化和细胞等生物过程整合,为藻类在复杂水生环境中的适应及进化铺平了道路。部分真核藻类,包括硅藻,进化过程中质体也发生多次内共生事件[3]。
Moustafa等[25]早期研究发现硅藻核基因组中包含红藻和绿藻基因,大约70%来自绿藻,并提出硅藻中可能隐藏着绿藻次级质体的假设。对硅藻基因组进行重新分析,结合红藻基因组数据,发现其中约13%水平基因转移事件可以从蓝藻到绿藻再到硅藻进行追踪,约66%ne内共生基因转移事件可以追溯到红藻[26]。Morozov等[27]研究发现,硅藻核基因组中红藻和绿藻水平基因转移事件发生相对次数大致相等,这导致他们质疑硅藻祖先中是否存在完全整合绿藻的衍生质体。一些研究学者认为硅藻绿藻来源的基因更有可能是在固定红藻的衍生质体之前涉及至少两个不同的绿藻内共生体。
菱形硅藻(Epithemia turgida)属于Rhopalodiaceae家族的硅藻,其内共生体为非光合蓝细菌(即“球体”,简称EtSB)。完整基因组测序结果显示,与该共生体的近亲相比,EtSB基因组大小和基因库有所减少。同时,研究还发现其基因组中存在大量的假基因,表明基因组仍在继续减少过程中。此外,测序数据显示EtSB已经失去了光合作用的能力,并在代谢上依赖于其宿主细胞。因此,EtSB作为一个独特内共生体,可以用于研究蓝细菌内共生体整合到真核细胞中的过程[28]。
Nitzschia palea是一种常见的淡水硅藻,因其对受污染水道的耐受性而被用作生物指示剂。有证据表明它可能是“dinotom”甲藻(Durinskia baltica)内的第三内共生体。来自N. palea基因组DNA 被深度测序,并组装了叶绿体和线粒体基因组。单基因系统发育将N. palea-Wise分组在一个明确定义的N. palea进化枝中,并显示它与株系“SpainA3”最密切相关。N. palea的叶绿体基因组为119 447 bp,具有135个蛋白质编码、28个tRNA和3个rRNA基因。线粒体基因组为37 754 bp,具有37个蛋白质编码、23个tRNA和2个rRNA 基因。N. palea和D. baltica的叶绿体基因组具有相同的基因含量、同线性和92·7%的成对序列相似性,并且大多数差异发生在基因间区域。N. palea线粒体基因组和D. baltica的内共生线粒体基因组也具有相同的基因含量和顺序,序列相似性为 90·7%。基于基因组的系统发育,表明D. baltica与N. palea比目前可用的任何其他硅藻序列更相似。这些数据表明它们与D.baltica的内共生体非常相似[29]。
Górecka等[30]完成了Schizostauron trachyderma完整质体和线粒体基因组的测序分析。该物种线粒体基因组大小为41 957 bp,并在cox1基因中显示两个II组内含子。质体基因组大小为187 029 bp,具有典型的硅藻质体基因组结构。它在petB基因中包含一个II类内含子,该内含子与大单拷贝和反向重复区域重叠。在rnl基因中还有一组IB4内含子预测可以编码LAGLIDADG归巢核酸内切酶。多基因的系统发育提供了更多证据表明S.trachyderma接近fistula-bearing的双壳硅藻。
2 硅藻功能基因组学研究
2.1 多组学研究
基因组注释结合转录本分析构建了三角褐指藻(PtDB)和伪矮海链藻(TpDB)的结构化EST数据库。三角褐指藻中生成了超过12 000个表达序列标签(EST),对该物种基因进行功能注释,并创建可通过 Internet 访问的可查询硅藻EST数据库[31]。早期报道涉及多种模式硅藻比如三角褐指藻和伪矮海链藻的转录组及蛋白组学等研究[32]。此外,研究人员还开展了包括代谢组学、脂质组学及糖组学等相关研究。
Popko等[33]分析了氮限制条件下PhaeodactylumPt4(UTEX 646)藻株脂质组分的变化。数据显示在氮耗殆尽时,中性脂质增加,主要是16∶0和16∶1(n-7)在甘油三酯中积累。脂质分子种类组成表明甘油三酯主要来自1,2-二酰基甘油-O-4'-(N,N,N-三甲基)高丝氨酸的重塑,但不排除来自质体单半乳糖基二酰基甘油的贡献。有趣的是,酰基辅酶A池富含的20∶5(n-3)和22∶6(n-3)脂肪酸几乎不在甘油三酯中。此外,在氮饥饿下,最明显消耗代谢物是氨基酸、溶血磷脂和三羧酸循环的中间体,而含硫代谢物以及肉碱增加。这些数据现在共同为改善三角褐指藻株Pt4中脂质的储存和生产提供了基础。
通过整合基因组、转录组、蛋白组及蛋白修饰组等多组学数据,Yang等[34]构建了三角褐指藻蛋白质基因组精细图谱。该研究校正了506个注释的编码基因和73个注释基因的可变剪切位点。此外,研究鉴定了606个新的蛋白质编码基因,268个小肽及21个新的可变剪切体。同时,研究人员还在三角褐指藻细胞中鉴定了20多种不同种类的蛋白质翻译后修饰,它们可能参与调控细胞逆境胁迫下的多种生物学过程。
Feijão等[35]研究调查了温度升高对三角褐指藻中脂质类别和编码与脂质代谢相关酶的基因表达的影响。海洋温度升高导致质体脂质相对量的增加,如糖脂单半乳糖基二酰基甘油、二半乳糖基二酰基甘油和硫代异鼠李糖基二酰基甘油,同时中性脂质减少,其中包括三酰基甘油。与脂质含量增加一致的是,编码单半乳糖基二酰基甘油合成酶基因的上调及甘油三酯合成中的关键酶二酰基甘油酰基转移酶的下调。研究还表明,海水温度升高会对不饱和脂肪酸的丰度产生负面影响,例如二十碳五烯酸(20∶5 n-3)和十六碳三烯酸(16∶3 n-4),同时也诱导不同膜脂质的相对量以及膜/储存脂质的比例发生变化。脂质代谢关键基因的表达在转录或转录后水平受到调节。
Jin等[36]以三角褐指藻为材料,针对其在长期海洋酸化后进行了脂质组分析。该研究共鉴定长期高CO2(即海洋酸化条件)和低CO2(即环境条件)下476种脂质代谢物。进一步研究表明,细胞在长期高CO2环境下通过下调33种和上调42种脂质代谢物来适应环境。单半乳糖基二酰基甘油在长期高CO2选择条件下显著下调,但大多数(~80%)磷脂酰甘油(PG)上调。揭示了脂质重塑是海洋硅藻应对正在进行的海洋酸化适应策略。
蛋白质翻译后修饰在硅藻中已经开展相关研究[32,34],包括磷酸化[37]、乙酰化[38]及N-糖基化等。Xie等[39]鉴定三角褐指藻中的639种N-糖蛋白及863种不同的N-糖肽。其中,参与N-糖基化途径的12种蛋白质被鉴定为N-糖蛋白。同时,该项研究分析了N-聚糖结构,更新了微藻中的N-聚糖数据库。Behnke等[40]研究了T.oceanica中蛋白的 N-连接糖基化途径,鉴定参与N-连接糖基化途径必需的代谢酶。研究还鉴定了118个N-连接糖基化肽段,81%肽段具有NXT型基序(X是除脯氨酸以外的任何氨基酸)。
2.2 基因编辑研究
基因组测序完成后,通常借助缺失、过表达及亚细胞定位等相关技术探究基因功能[41]。相比随机诱变方法,近年来,TALENs(Transcription activator-like (TAL) effector nucleases)和CRISPR/Cas9(Clustered regularly interspaced short palindromic repeats)系统被广泛用于硅藻目的基因进行定点修饰和靶向敲除[42-43]。由于TALEN技术的复杂性限制了其在硅藻分子遗传学中的应用,而CRISPR/Cas9技术越来越多被研究人员选用。Cas9(D10 A)核酸酶是Cas9核酸酶的突变形式,可以用于引入目标 DNA并进行精确的双切割,因而抑制了天然Cas9核酸酶的脱靶效应。该项研究用于伪矮海链藻预测的θ型碳酸酐酶基因,实现了在硅藻基因组引入精确且相对较短的双等位基因插入缺失,且脱靶效应最小[44]。目前,CRISPR/Cas9技术在硅藻细胞中精准编辑及优化正在进行中。
3 总结与展望
硅藻是食物链底层中最多样化和最成功的浮游植物之一,调节地球的生物地球化学循环。近年来,为了探索硅藻的进化过程,多种模式物种也在陆续开展功能基因组学的研究。针对已经完成的硅藻基因组进行了综合比较分析,概述了其次级内共生起源、基因水平转移、特殊代谢途径及环境适应机制等多个生物学现象的研究进展。此类研究极大扩展人们对硅藻基因组复杂性的认识。同时展望了硅藻基因组学的发展方向,以及在全基因组水平上开展重要功能基因验证等科学问题。未来硅藻物种测序将借助多组学联合分析,采用更多新的技术手段,包括单细胞基因组、单细胞转录组、单细胞蛋白组及亚细胞定位组学等前沿技术,优化基因编辑技术,同时利用基因工程及合成生物学等技术手段来开发利用硅藻资源。基因组学的深入研究将有助于进一步揭示硅藻重要的生物学特性及环境适应性等。