化学家能否破解糖的编码?
2020-02-24编译莫庄非
编译 莫庄非
在我们体内,简单的糖(例如葡萄糖、甘露糖和岩藻糖)连接在一起,形成了复杂的多糖(或者说聚糖),这些多糖修饰着细胞的表面,形成了一层厚厚的“糖衣”,但与基因组和蛋白质组不同,那些“糖衣”中的糖组目前对我们来说仍是待解之谜,部分原因是聚糖的化学结构太过复杂。我们的身体合成了数千种独特的聚糖,但是很少有分析方法可以有效地阐明其结构。与线性组装的DNA和蛋白质不同,聚糖高度支化,使其难以合成。当然,智慧的化学科学家正帮助我们更趋近于破解糖的编码。
寡糖主要附着在蛋白质和脂质上,这一事实过去一直被生物学研究忽略。但美国佐治亚大学的吉尔特-简·布恩斯(Geert-Jan Boons)表示寡糖应该引起研究者的重视:“我认为在过去的十年中,寡糖几乎参与了机体的每一个健康与疾病的过程。”细胞的糖衣可以提供独特的细胞条形码使免疫系统能够识别其他细胞(包括外来入侵者)。一个公认的事实是,异常的糖基化似乎会推动癌症发展,特别是高度唾液酸化作用——因为唾液酸糖含量过高。唾液酸糖连接于聚糖链的最外层,主链上有9个碳原子。
对于专业研究者来说,长期研究目标是完整定义糖组学这一概念。所谓糖组学,是研究在细胞或生物体中产生的整套聚糖的结构和功能。但是,英国曼彻斯特大学的碳水化合物化学家萨宾·弗利奇(Sabine Flitsch)认为这项工作比定义基因组或蛋白质组更复杂一些,她解释说道:“糖组不是由基因组直接编码的,你无法将糖的结构与一种特定的蛋白质(或基因)联系起来。糖基化(即聚糖的添加)是一个转录后修饰的过程,组装糖的200多种酶不提供模板。酶与糖核苷酸的可利用性决定了生物合成的结构类型。”
除了不由基因组直接编码,聚糖数量过多也是研究的障碍。用10种常见的单糖去组合聚糖,可能的组合结构数量要比DNA或蛋白质的结构数量多得多。由6个糖分子组成的六糖可以有1 930亿个可能的结构。另外,聚糖的种类很多,包括与氨基酸天冬酰胺连接的N-连接寡糖,与苏氨酸或丝氨酸连接的O-连接寡糖,以及糖胺聚糖——长链的高极性多糖,可作为生物润滑剂(例如肝素和血液,以及防止血凝块的血液稀释剂)。
合成挑战
从自然界中提取纯的聚糖通常是不可能的,因此化学家们需要合成大量可能的聚糖。这并不容易,因为它们有多种异构形式。聚糖有非常多的单糖排列方式和支化结构。异构体可以是基于不同的环尺寸和不同的取代位置(区域异构体)的。弗利奇说道:“你还必须正确理解连接的立体化学——是α连接还是β连接,这可能是最大的挑战之一。”在糖基化中,碳水化合物(糖基供体)与另一个糖(糖基受体)的羟基相连,形成异头碳,从而允许在两种可能的构型之间转化。最终产物可以是α或β构型。弗利奇解释说:“只有进行大量的保护基化学反应,才能获得化学选择性。每个偶联步骤需要大约7个化学步骤。”
一种提升速度的方法是使用坚固的支撑架来实现自动化。彼得·西伯格(Peter Seeberger)来自德国波茨坦的马克斯·普朗克胶体与界面研究所,他于2013年创立了糖宇宙(GlycoUniverse)公司。该公司开发了一种全自动寡糖合成仪Glyconeer,目前在全球范围内已有8台投入使用。糖宇宙的科学负责人马里奥·萨尔维切克(Mario Salwiczek)解释说道:“Glyconeer能固态合成寡糖,其中诀窍在于第一个结构单元连接到不溶的聚合物上——在大多数情况下,是聚苯乙烯微珠。好处在于你可以除掉所有尚未反应的反应物或已形成的所有副产物,而不必在每个偶联之间进行纯化步骤。”
西伯格用这种方法制成的最长糖链是线型的50糖寡糖(50-sugar oligosaccharide),更典型的寡糖是6~10个单糖分子脱水缩合而成的。“很明显,这项技术本身无法解决我们面对的化学问题,”西伯格指出,“一种策略是开发多种糖的通用结构单元。”布恩斯说:“我们想出的解决方案是巧妙地选择结构单元。寡糖在结构上非常复杂,但是如果仔细观察,就会发现它们以不同的方式组合在一起形成某些特定构型。”
布恩斯和其他人已经合成出了此类构型的聚糖,它们能通过多种方式进行组装。他用这种方法合成了由20种二糖制成的合成肝素,而这20种二糖仅仅由6种不同的单糖组装而成。
生物催化
另一个重要进步是使用了糖基转移酶,它能将单糖从活化的糖单磷核苷酸或糖二磷核苷酸转移到寡糖链。20世纪80年代,该方法被证明可用于合成复杂的聚糖,其中每个键由不同的酶合成。
弗利奇表示:“糖基转移酶的优势在于,它们可以完全照顾到所有区域及立体选择性。它们要用2个通用的结构单元,并以非常特定的方式发挥组合作用。建构出α-或β-端基异构体取决于核苷酸受体是什么。机器内部的化学合成需要7个步骤,而这个操作其实一步就够了。化学家可以通过碳水化合物活性酶(CAZy酶)的数据库来辅助设计合成方法。对于这些生物合成所需要的酶,我们已经有了很深入的了解。”
布恩斯说:“五六年前,这类合成工作基本要靠博士来完成,而现在,我们大家在周末就可以做。不过缺点是,如果你想建构一个非自然的结构,或者具有更多类药性的结构是存在困难的,因为酶并不擅长。”布恩斯一直努力通过一些化学方法与酶的协同工作来解决这个问题。例如,他仅用10个化学和酶促步骤就合成了具有多达4个不同分支的N-聚糖。
他采用从蛋黄粉中分离出来的对称双触角糖基衍生物作为结构单元;然后,他向其中添加了一个非天然的糖核苷酸供体——5'-二磷酸-N-三氟乙酰基葡萄糖胺,得到一个中间态结构;当使用酶进一步延长聚糖分支时,非天然分子对酶的作用呈惰性,因此进一步的反应选择性地发生在了其他支链上;接着,非天然葡萄糖胺被转化成了其天然对应物,从而允许进一步的酶促反应。布恩斯称该策略为“打打停停”。他说道:“我们真的相信酶和化学的结合正在革新创造这些分子的过程。”
怎样分析合成物?
合成聚糖只是故事的一部分——对其进行分析也至关重要,这不仅有助于定义人类糖组,对于生物制药也很重要。许多生物药物是糖基化的,例如促红细胞生成素(EPO)这一臭名昭著的性能增强药物。弗利奇说:“如果不对它进行糖基化,它就不会在人类体内活跃。”但分析聚糖结构并不简单,而且很难复制生物药物。她补充说:“非专利药公司非常渴望获得更好的分析方法。”
大多数现有的针对聚糖的分析技术都存在问题。当前的方法通常涉及与质谱联用的分离技术,但是色谱法设计时要考虑到肽。德国柏林自由大学的有机化学家凯文·佩吉尔(Kevin Pagel)表示:“糖比肽极性更大,结果,成熟的反相分离技术实际上对糖不起作用。”在单糖本身及其组成的结构中发现的异构现象(葡萄糖、半乳糖和果糖都通用),有时无法通过质荷比进行质谱分析,NMR也无法区分立体化学细节。佩吉尔补充道:“分析简单的三糖可能非常具有挑战性。”
N-聚糖更易于表征,但O-连接聚糖问题很大。粘蛋白(mucins)是一种存在于黏液中的,具有很长聚糖链的蛋白质,经过了密集糖基化且体积很大,它在表征方面也面对着巨大的挑战。糖胺聚糖也很难表征,这也解释了肝素分析遇到的问题——2008年,受污染的肝素在全球造成200多人死亡,这是制造商使用了非活性化合物作为替代所导致的,而在常规测试中,这两种物质无法被区分。
弗利奇说:“我们真正想要,也正在努力研发的是一种可以用于所有聚糖分析的通用技术。一种可能有用的技术是离子迁移谱(IMS)——机场安全部门用它来筛查爆炸物。将它与质谱组合,可以根据物质的质量、电荷、大小和形状来区分气相离子。佩吉尔解释说:“不同的异构体通常具有不同的大小和形状,这使该方法成为表征聚糖的理想选择。”
离子在弱电场的作用下被引导通过氦气或氮气,它们的碰撞速率会发生变化,较大的横截面分子会更频繁地碰撞且漂移时间会更长。IMS与质谱联用,可以区分较小的完整聚糖的不同异构体。
在执行离子迁移率测量之前,使用一组有限的标准片段指纹图谱,对大的聚糖进行片段化可以提供一种与通用测序方法相近的方法。弗利奇说道:“这有点像霰弹枪定序法。”至关重要的是,碳水化合物片段似乎保留了其立体化学的记忆。她补充说:“它看起来会有所不同,具体取决于它是来自α还是β连接——这是测序规程的又一关键步骤。”
另一个重要的进步是红外多光子离解(IRMPD)光谱。使用高强度激光,通过观察键解离时吸收光子的过程,间接测量红外光谱。使用质谱测量碎裂产率(fragmentation yield)随波长的变化,可以得到振动光谱。不过佩吉尔也指出了一个缺点:“在室温下,所得光谱特征的可诊断性通常很差,因为它们通常很宽泛。”
他接着说道:“我们第一次是在超冷温度下用糖做实验。我们获得了振动指纹,其分辨率非常好,这也使我们能够弄清聚糖中的每一个结构细节。”通过冷却超流体氦液滴中的离子,佩吉尔等人将物质的温度降至-272.75℃,并使其处于一个极低的能态。他们明确地区分出了一系列三糖异构体——在某些情况下,它们的区别仅在于单个羟基的立体化学性质的不同。
那么结合这些新方法,聚糖测序会成为现实吗?布恩斯说:“我认为我们已经开始具备实现这一目标的综合能力。”不过佩吉尔依然认为,对完整的人类糖原进行测序可能在20年后还会是一个挑战。因为与DNA和蛋白质不同,糖组是高度动态的。弗利奇指出:“人体的糖组之间存在巨大的个体差异。”虽然DNA的差异仅仅是每千个残基出现一次,但糖组的差异是高度依赖于环境的。
微阵列
加拿大艾伯塔大学的拉拉·玛哈尔(Lara Mahal)是聚糖微阵列研究领域的先驱,她对糖组的看法有所不同。玛哈尔不确定我们是否真的需要它。她说道:“很长一段时间以来,同行们一直觉得我们需要明确离散结构以及这些结构的每一个细节,但是如果你关注自然,就知道它不在乎是否有一个离散的结构,它在乎的是一组可以实现特定功能的结构。问题在于,我们需要每个单独的结构吗?或者我们能够了解子结构的变化吗?”
为此,玛哈尔等人致力于开发可使用高通量自动化研究糖蛋白相互作用的微阵列。这种阵列将各种聚糖排列在固定于支撑物上的微小斑点中,与聚糖结合蛋白、细胞甚至整个病毒群一起培育。他们使用荧光标签观察结合过程。
19世纪初期,英国帝国理工学院的滕·菲兹(Ten Feizi)开发了第一种固定聚糖的方法。她将脂质接头连接到聚糖上,形成了“新糖脂”,然后可以将其固定在硝酸纤维素表面上。帝国理工学院糖类微阵列设备负责人刘燕(Yan Liu)说:“采用共价阵列控制载玻片上的聚糖浓度并不容易。”如果聚糖太密集,或聚集方式不对,则结合的条件可能就有问题。借助“新糖脂”,可以使聚糖以非共价键结合到基质表面,而且这些聚糖似乎是能够移动和聚集的——这更好地模仿了细胞表面的聚糖排列。刘燕接着说道:“这种形式对许多类型的内源性和病毒性聚糖结合蛋白非常有用,对抗体也非常敏感。”
连接脂质的第一种方法是伯胺基和聚糖之间的缩合反应,但这会导致核心单糖的开环,对短链聚糖是不利的。2007年,刘燕设计了另一种肟连接法。他们对脂质进行了修饰,使其包含一个氨基-氧基基团,该基团经偶联形成了一个稳定的肟键(RHC =NOR')。刘燕表示:“基于这种方法,我们通过提供短寡糖和核心支链聚糖来进行配体结合研究,从而大大拓宽了基于‘新糖脂’的微阵列系统的范围。”
帝国理工学院的聚糖库是欧洲最大的,大约有1 000个序列,可供所有研究人员进行测试,但人类可识别的聚糖可能有7 000种(实际数量尚不清楚)。刘燕说道:“我认为我们漏掉了很多。另一方面,我们拥有那些在许多识别系统中起着重要作用的聚糖的主要封端基团。”
玛哈尔采取的方法是使用微阵列查找疾病(包括癌症)的生物标记。19世纪中期,她开始研发外源凝集素——结合糖类的植物蛋白——的高通量阵列。玛哈尔解释说:“自然界已经进化出具有非常特殊的分子识别表面的蛋白质。它们确实擅长识别一些相似的分子结构间的区别。例如α-2,6键与半乳糖键接的,与α-2,3键与半乳糖键接的唾液酸结构间的差异就可被那些蛋白质识别,而且是能够立即分辨出来,可质谱分析就无法轻易做到这一点。当然,使用这种方法并不能确定精准的结构,但它为我们提供了一条确定糖的变化方式的快捷途径。”
玛哈尔的研究小组也一直在尝试了解糖基化在生物学层面是如何被控制的。他们将其与微RNA(miRNA)联系在一起。玛哈尔认为,这种机制控制着引发糖基化的转移酶。她说道:“我们试图找出糖基化酶的完整miRNA调控过程,作为解决其中某些问题的第一步。”
显然,无论是要弄清糖组,还是搞明白基础生物学,都还有很长的路要走。弗利奇说道:“我认为碳水化合物化学确实将有机化学推到了极限。”不过玛哈尔也指出,不要把糖组学看成一座不可逾越的高山:“我认为糖组学一直存在的问题之一是,人们觉得它很难,而我会挑战它……实际上,在生物学中又有什么是不复杂的呢?”