SUMO化蛋白质组的富集策略研究进展
2022-11-23单亦初张丽华张玉奎
李 洋,单亦初,梁 振*,张丽华,张玉奎
(1.中国科学院分离分析化学重点实验室 中国科学院大连化学物理研究所,辽宁 大连 116023;2.中国科学院大学,北京 100049;3.宁波大学 新药技术研究院,浙江 宁波 315211)
小泛素相关修饰物(Small ubiquitin-like modifier,SUMO)是一类分子量约为11 kDa,高度保守的类泛素蛋白[1-3]。在哺乳动物中,SUMO 存在5 种旁系同源物[4-6],研究较多的是SUMO1、SUMO2 和SUMO3。其中,SUMO2 与SUMO3 的氨基酸序列有97%的相似性,而与SUMO1 只有50%的相似性,因此通常将其合并为SUMO2/3来进行研究[7]。SUMO与底物蛋白的结合依赖于E1活化酶、E2结合酶和E3连接酶的多步催化反应,而生物体内多种SUMO特异性蛋白酶(SUMO/sentrin-specific proteases,SENPs)的存在使SUMO化修饰处于高度动态变化的可逆过程[8-10]。许多被SUMO修饰的底物蛋白都具有一致性序列(Consensus motif)ΨKxD/E(Ψ 代表疏水性氨基酸,K 代表赖氨酸,D/E 代表天冬氨酸/谷氨酸,x 代表任何氨基酸)[11],还有些修饰位点遵循反向的motif(E/D-x-K)[12]。蛋白质的SUMO 化修饰影响了诸多生理和病理过程,包括转录调控、DNA 损伤修复、自身免疫性疾病以及肿瘤的发生发展等[13-16],因此,参与SUMO化过程的相关底物和蛋白酶是临床治疗疾病和癌症的重要药物靶标[17-19]。
为了更全面地揭示SUMO 化修饰发挥的生理和病理功能,在蛋白质组水平对SUMO 化蛋白及其位点进行深度覆盖分析至关重要[20]。然而,规模化分析哺乳动物细胞中的SUMO化位点仍存在巨大挑战。一方面是由于SUMO 化蛋白质在生物体内的存在丰度较低,且高活性的去SUMO 化酶使SUMO 化修饰极不稳定;另一方面是在采用自下而上(Bottom-up)的蛋白质组策略时,SUMO1 和SUMO2/3 的C 端由于缺少精氨酸和赖氨酸,当被胰蛋白酶酶切后,残留在底物肽段上的SUMO1和SUMO2/3修饰分别含有19和32个氨基酸,如此冗长的序列会导致其修饰位点难以被质谱检测分析,从而影响SUMO 化蛋白质组的分析覆盖度。因此,发展高效的富集方法对SUMO 化蛋白质组的深度覆盖分析至关重要。本文针对外源性和内源性的SUMO化蛋白质组富集方法的原理、特点及最新进展进行了综述。
1 外源性SUMO化蛋白质组的富集方法
为了提高对低丰度SUMO 化蛋白质的富集效率,最有效的方法是发展针对外源性SUMO 化蛋白质组的富集方法,即构建可以稳定表达带亲和富集标签的外源性SUMO 蛋白的细胞系。常用的富集标签有组氨酸(His)[12,21-24]、血球凝集素(HA)[25]和Flag 标签[26]。其中,His 标签因为分子量小,在SUMO 上表达几乎不影响SUMO与底物蛋白的结合特异性,且在变性环境下,携带His标签的SUMO化蛋白仍能被Ni2+亲和材料高效捕获,因而被广泛使用。
1.1 蛋白质水平的富集
Galisson 等[21]利用Ni2+亲和色谱富集HEK293 细胞中表达的外源性His6-SUMO1/2/3 修饰的底物蛋白。同时,为了使胰蛋白酶酶解后SUMO 化肽段的长度更利于质谱检测,分别对His6-SUMO1Q92R、His6-SUMO2Q88R和His6-SUMO3Q87R/Q88N的特定位点进行突变,使酶解后残留在底物肽段上的氨基酸分别减少为EQTGG-、QQTGG-、NQTGG-,再结合无标定量蛋白质组分析技术,在经As2O3处理的细胞中共鉴定到17个精确的SUMO化位点,对应于12个SUMO修饰的底物蛋白质。
为了避免对氨基酸进行突变,Hendriks等[27]发展了一种基于去SUMO化酶的外源性SUMO化位点鉴定方法(简称PRISM)。该方法在封闭其余非SUMO 化赖氨酸侧链氨基的前提下,利用去SUMO 化酶(SENP2)选择性切除底物蛋白质上的SUMO 修饰,使去SUMO 化的赖氨酸位点暴露特征性的氨基基团,实现对SUMO 化位点的准确鉴定。作者首先在蛋白质水平利用Ni2+亲和色谱对His10-SUMO2 修饰的蛋白质进行纯化,再对富集所得蛋白质进行乙酰化封闭、去SUMO 化、胰蛋白酶酶解和质谱鉴定,最终从HeLa 细胞中鉴定到751 个SUMO 化位点。该方法避免了冗长的SUMO 修饰给质谱鉴定造成的困难,但被乙酰化封闭后的赖氨酸无法被胰蛋白酶酶切将导致肽段最终长度较长,并且需要严格控制蛋白质水平的乙酰化反应不完全给SUMO位点鉴定带来的假阳性。
1.2 肽段水平的富集
在蛋白质水平进行富集,当蛋白质被酶解成肽段后会产生大量非SUMO 化肽段,对SUMO 化肽段的分析造成干扰,从而影响SUMO 化位点的鉴定覆盖度。因此,研究人员进一步开发了可以特异性识别酶切后留在底物肽段上的SUMO 残基序列的抗体,以实现对SUMO 化位点在肽段水平的二次富集。例如,Impensa 等[28]将SUMO1 和SUMO2 的基因分别改造为His6-SUMO1T95R和His6-SUMO2T91R,先在蛋白水平富集His6-SUMO 修饰底物,再使胰蛋白酶酶切后的SUMO 位点产生双甘氨酸残基GG-,接着利用泛素化抗体(antiK-ε-GG)对其进行特异性富集,最终鉴定到295 个SUMO1位点和167 个SUMO2位点。但是胰蛋白酶酶切后的泛素化位点也有GG-修饰,给鉴定结果带来了假阳性。Lamoliatte 等[22]开发了一种可以特异性识别His6-SUMO3Q87R/Q88N被胰蛋白酶酶切后留在底物肽段上的氨基酸残基(NQTGG-)的抗体,通过蛋白和肽段水平的两次富集在HEK293 细胞中鉴定到了954 个SUMO3 位点,有效避免了泛素化位点带来的假阳性问题。随后作者在此基础上进一步优化了免疫沉淀的孵育和洗脱条件,采用更灵敏的高分辨率质谱并优化了质谱参数,结合SCX/RP二维色谱分级策略,从HEK293细胞中鉴定到一万个SUMO3 位点[29]。类似的方法还有将SUMO2 基因改造为His6-SUMO2T90K,分别利用Ni-NTA 和K-ε-GG 抗体对Lys-C或Lys-C+Glu-C酶切前后的SUMO 修饰底物进行两次富集,鉴定到1 000 个SUMO 位点[24],该方法用Glu-C 取代胰蛋白酶,避免了胰蛋白酶酶切后泛素化位点造成的假阳性。
除了上述方法,Vertegaal 课题组还开发了基于K0 方法的His-SUMO2 位点富集方法,主要原理是将SUMO 分子上的所有赖氨酸(K)突变为精氨酸(R),由此经过Lys-C酶切后的SUMO分子依然具有完整序列且携带His 标签,利用Ni 柱分别在蛋白和肽段水平对His-SUMO2 修饰底物进行两次富集,即可提高对SUMO 位点的富集效率。该课题组最初将SUMO2 基因改造为His6-SUMO2K0T90R,利用Ni 柱对Lys-C 酶切前后的SUMO 化蛋白/肽段进行二次富集,再用胰蛋白酶将SUMO 从底物肽段上切除,只留下GG-残基,质谱分析后共鉴定到103 个SUMO2 位点[12]。然而,该方法同样存在泛素化位点造成的假阳性问题。因此,该课题组进一步将SUMO2基因改造为His10-SUMO2K0Q87R,同样利用Ni柱对Lys-C酶切前后的His10-SUMO 修饰底物进行两次富集,再利用胰蛋白酶酶切后留在底物肽段上的SUMO 残基序列(QQTGG-)对SUMO位点进行质谱鉴定和数据库检索,从人源细胞中鉴定到了4 300个SUMO化位点[23],优化后的方法不仅避免了泛素化位点带来的假阳性干扰,而且表达的His10-标签进一步提高了富集效率。在此之后,该课题组进一步将K0方法用于对多种人源细胞系多个细胞刺激条件下His10-SUMO2K0Q87R修饰位点的大规模富集,并结合高pH C18反相分级策略,共鉴定到40 765 个SUMO2 位点,对应6 747 个蛋白质,实现了对人源细胞中外源性SUMO2 位点的深度覆盖和全面分析[30]。但是,基于K0的富集方法也存在弊端,将SUMO2上的所有K突变为R后,突变前K位点上的各种翻译后修饰信息将被丢失,包括重要的多聚SUMO化链的形成。
2 内源性SUMO化蛋白质组的富集方法
尽管针对外源性SUMO 化蛋白质组目前已经报道了上万个SUMO 化位点,但是将含有富集标签且氨基酸突变的外源性SUMO 引入生物体内,不仅无法准确反映SUMO 化修饰在生物体内的真实表达水平,而且不能用于实际的临床和组织样品的分析。因此,发展可以特异性富集内源性SUMO 化修饰底物并对内源性SUMO化肽段进行有效鉴定的蛋白质组样品预处理方法是当前该领域的研究热点和难点。
2.1 蛋白质水平的富集
受限于抗体技术的发展,研究人员最初仅针对SUMO 蛋白研发相应的抗体,并在蛋白质水平对SUMO 修饰底物进行富集。Matafora 等[31]将经过蛋白酶抑制剂MG132 处理的HeLa 细胞进行细胞核蛋白提取,再利用SUMO1抗体对其进行免疫共沉淀(IP),酶解后进行质谱分析,从中鉴定到193个SUMO1化蛋白质。此后,Becker 等[32]利用两个已知的SUMO1 和SUMO2/3 的单克隆抗体(SUMO1 21C7 和SUMO2 8A2),在对IP 的洗脱条件进行优化后,将富集的蛋白进行胰蛋白酶酶解和质谱鉴定,从HeLa细胞中共富集到1 000多个蛋白质,通过严格的数据筛选去除其中的非特异吸附蛋白,最终得到232个高可信的SUMO候选蛋白。然而以上研究均未对富集到的SUMO化蛋白的具体位点信息进行报道。
2.2 肽段水平的富集
仅在蛋白质水平富集内源性SUMO 化修饰底物无法对内源性SUMO 位点进行深度覆盖,一方面,抗体富集后的蛋白样品中仍然存在很多非特异性吸附蛋白的干扰,另一方面,酶解后产生的大量非SUMO化肽段会显著抑制SUMO化肽段的质谱响应。基于此,针对内源性SUMO化肽段的抗体富集策略在最近几年受到广泛关注。
2017 年,Lumpkin 等[33]利用α-溶菌酶(WaLP)能够特异性酶切苏氨酸(T)残基[34],使经过WaLP 酶切后留在底物肽段上的SUMO1/2/3 修饰只有GG-,并利用泛素化抗体(anti K-ε-GG)实现了对内源性SUMO1/2/3化肽段的同时富集,从人源细胞中鉴定到1 209个内源性SUMO 化位点。然而,该方法也存在一些不足,如WaLP 的酶切特异性不高,泛素化位点上的精氨酸被WaLP 酶切后产生的GG-残基将对鉴定结果产生假阳性干扰;且该方法无法区分鉴定到的SUMO化修饰的类别。同年,Cai等[35]开发了一种特异性识别SUMO1 被胰蛋白酶酶切后留在底物肽段上的氨基酸残基的泛-SUMO1 抗体,并在肽段水平对SUMO1 修饰底物进行富集,再利用Glu-C 对SUMO1 化肽段进行二次酶切以降低肽段长度,最后从小鼠睾丸中鉴定到了53个高可信的SUMO1位点。2018年,Hendriks等[36]发展了利用抗体在肽段水平富集内源性SUMO2/3 修饰位点的策略。他们利用可以特异性识别SUMO2/3 被Lys-C 酶切后留在底物肽段上的氨基酸残基的SUMO2/3 抗体(SUMO2/3 8A2)富集SUMO2/3 化肽段,并进一步采用Asp-N二次酶切和高pH C18反相分级策略提高内源性SUMO2/3位点的鉴定覆盖度,从正常生长、热休克和MG132 刺激的人源HEK293 细胞中鉴定到14 869 个SUMO2/3 位点和3 870 个内源性SUMO 化蛋白,是目前报道的内源性SUMO2/3化位点的最大数据集。
目前采用免疫沉淀的抗体富集策略已覆盖到哺乳动物中一万多个SUMO 化位点,3 000多个底物蛋白。然而,抗体方法由于自身特性往往只局限于一类SUMO 化修饰的富集,难以实现样品中所有SUMO 化修饰的同时富集和分析。针对上述问题,本课题组[37]利用胰蛋白酶酶切后的SUMO 化肽段与非SUMO 化肽段在碱性条件下带电性质的差异,发展了一种基于强阴离子交换(SAX)色谱分离的内源性SUMO 化肽段富集方法,实现了对人源细胞中多种类型SUMO 化修饰的同时富集。此外,还通过采用Asp-N/Glu-C 二次酶切降低SUMO 化肽段长度,提高了质谱对SUMO 化肽段的鉴定效率;进一步结合二维高低pH RPLC-ESI-MS/MS 分析技术,从HeLa 细胞的酶解产物中富集到了177 个内源性SUMO1位点和74个内源性SUMO2/3位点。
3 展 望
随着基因工程和抗体等富集技术的不断发展,针对外源性SUMO 化修饰位点的规模化鉴定已经日趋完善。然而,只有内源性的SUMO 化修饰才能真实反映实际细胞/组织样品中SUMO 的表达水平和动态变化。相比于其他翻译后修饰,内源性SUMO 化修饰的覆盖深度远未达到研究的需要。因此,发展针对内源性SUMO 化位点的高通量富集方法仍是当前SUMO 化蛋白质组学的首要任务。此外,目前亟需开发专门针对SUMO 化位点鉴定的数据库检索软件。随着富集方法的不断创新、高灵敏质谱和生物信息学技术的不断发展,人们对SUMO 化修饰的认识会更加深入,SUMO 化蛋白质组学也将会为发现更多关键的疾病标志物和新的治疗靶标提供新的方向。