磷酸化蛋白质组学在乳腺癌中的研究进展
2020-02-16邓玉皎朱文革代志军
邓玉皎,李 娜,朱文革,代志军,3*
1.西安交通大学第二附属医院肿瘤病医院(西安 710004)
2.乔治华盛顿大学生化与分子生物学系(华盛顿 20052)
3.浙江大学医学院附属第一医院乳腺外科(杭州 310003)
乳腺癌是女性发病率第一、死亡率第二的癌症[1],其疾病负担在全球范围内均较重[2]。它的发生是遗传、环境等多因素协同作用的结果[3]。从基因到蛋白质存在转录、翻译及翻译后水平的调控过程,研究表明组织中mRNA丰度与蛋白质丰度并不完全符合[4]。据报道,基因与翻译后蛋白质的表达水平之间的相关性仅为0.4-0.5,基因无法解释一切表型。蛋白质翻译后修饰(Posttranslational modifications,PTM)是指对翻译后的蛋白质进行共价加工的过程,通过在一个或多个氨基酸残基加上修饰基团,可以改变蛋白质的理化性质,进而影响蛋白质的空间构象和活性状态,亚细胞定位及蛋白相互作用。目前已知的PTM有300多种,但只有少数被研究,包括磷酸化、乙酰化、泛素化、N-糖基化、琥珀酰化、丙酰化等[5]。PTM是增加蛋白质多样性的关键机制,其复杂性和动态性是蛋白质研究的难点[6]。蛋白质磷酸化是生物界最普遍、最重要的一种PTM,约30%的人类蛋白质组被磷酸化,几乎参与细胞所有的生命活动过程,如细胞分裂、蛋白分解、信号传导、基因表达调控和蛋白相互作用等[7]。与其他PTM相似,磷酸化是一个可逆的生物化学过程,激酶和磷酸酶在磷酸化位点水平上竞争以调节磷酸化状态。然而,磷酸化蛋白质的丰度低,通常低至1%,而且同一个蛋白质中也可能存在不同的磷酸化类型,其精准分析困难大。磷酸化蛋白组学是蛋白组学的一个分支,其核心挑战是蛋白质组中低丰度磷酸化多肽的富集和高灵敏的检测手段。现对近年来磷酸化蛋白质组学技术在乳腺癌诊断及治疗研究中的进展作一综述。
1 磷酸化蛋白组学技术的研究现状
1.1 磷酸化多肽样本的前处理
蛋白质组学的研究需要高分离效率、高灵敏度、高通量、宽动态范围分析技术的支持[8]。一般由三大技术所支撑:蛋白质提取与纯化、质谱(Mass spectrometry,MS)技术鉴定蛋白、以及利用生物信息学技术进行蛋白质相关数据的比对分析[9]。提取磷酸化蛋白的组织样本及细胞均需用蛋白酶抑制剂及磷酸酶抑制剂进行保存及处理,避免反复冻融,严格冰上操作,采用剧烈变性条件,尽量加快处理速度,以减少磷酸化多肽的降解及损失。蛋白提取后需用适当的蛋白酶(胰蛋白酶最常用)消化,酶切之后的肽段由于在C末端携带了碱性氨基酸,生成的多肽混合物中的磷酸化多肽进行特异性富集,之后进行质谱分析。将质谱信息与选定的蛋白数据库相匹配,可以确定肽段序列和结合的磷酸化位点[10]。
1.2 定量蛋白质组技术概况
蛋白定量技术和修饰富集技术相结合,可以一次性实现对复杂样品中的全部蛋白质进行大规模修饰定性和定量分析[11]。定量蛋白质组学技术包括靶向定量和非靶向定量技术。靶向定量蛋白质组学技术包括多重反应监测技术(Multiple reaction monitoring,MRM)和平行反应监测。定量蛋白质组学的主要方法可分为无标记法、代谢标记法、等压标记法和靶向法,例如氨基酸代谢结合稳定同位素标记、串联质量标记(Tandem mass tags,TMT)、等压标记法(Isobaric tags for relative and absolute quantitation,iTRAQ)等[12]。TMT和iTRAQ定量准确度高、重复性好,可实现分组分析;样品混合上机,节省机时成本;但需要标记试剂,有样本数的限制。Lable-free定量技术无需昂贵的标记试剂,操作简单;无样品数限制,适合大样本量的定量分析;可以实现有或无的比较;对实验、质谱平台的技术稳定性要求高,否则定量结果不够准确。
1.3 磷酸化多肽富集技术进展
基于MS的磷酸化蛋白质组学技术可以一次识别数千条磷酸化多肽[13],间接包含关于蛋白激酶活性的全面信息[14]。虽然母离子扫描等串联质谱技术可以直接从多肽混合物中选择性地分析磷酸化肽段并进行序列分析,但是实际生物样本中磷酸化蛋白的化学计量值低且含量少,淹没在大量非磷酸化的肽段中。同时磷酸化多肽本身所具的负电性又使其在正离子模式的质谱分析中信号受到抑制,磷酸化多肽的信号丰度会比其相应未磷酸化肽段的丰度要低很多,在复杂样本中磷酸化多肽的检测非常困难[15]。因此,复杂的蛋白质混合物样本必须在分析前能够对磷酸化多肽进行选择性分离或富集。目前磷酸化多肽的富集手段包括固定化金属亲和层析(Immobilized metal ion affinity chromatography,IMAC)、金属氧化物亲和层析(Metal oxide affinity chromatography,MOAC),免疫亲和纯化抗体富集法,离子交换层析(B Ion Exchange and Mixed Mode Chromatography Ion exchange, IEX)和亲水相互作用色谱法(Hydrophilic interaction chromatography, HILIC)[16-17]。
许多基于化学的层析方法已经被用来富集含有丝氨酸(Ser)和苏氨酸(Thr)的磷酸化多肽。IMAC 是利用固定在树脂上的金属离子,例如Fe3+、 Zr4+或Ga3+,最新的有Gd3+、La3+、Ho3+、Ce4+和 Er3+,它们可以高选择性地螯合带负电的磷酸化多肽。Fe3+-IMAC可以优先富集酸性磷酸肽,而Ti4+-IMAC更适合富集碱性磷酸肽。IMAC的弱点是不能很好地结合含有多个碱性氨基酸残基的磷酸肽;另一个限制是单磷酸化多肽的回收率相对较低,这是由于与多磷酸化肽相比,单磷酸化肽与金属阳离子的相互作用较弱。除了IMAC,MOAC也利用了金属阳离子,以金属氧化物的形式作为磷酸盐的结合位点。相对于IMAC,MOAC中的金属阳离子与邻近的氧阴离子形成稳定的键,因此对低pH值和洗涤剂更有耐受性。金属阳离子和实验条件对MOAC的选择性都有影响,包括肽珠负载率,以及负载缓冲、 洗涤缓冲和洗脱缓冲液。基于二氧化钛(TiO2)的MOAC也被广泛用于磷酸化多肽的富集,其与IMAC方法分别富集不同范围的磷酸化多肽,两者结合可以提高磷酸化蛋白的覆盖率。与固相IMAC相比,新提出的PolyMAC可以在均匀的水环境中与磷酸肽结合,避免了固相的不均匀性,具有螯合时间快,重现性高,选择性从复杂混合物回收磷酸肽,有报道称其比TiO2法产量更高。
IEX方法,包括强阳离子交换法,强阴离子交换法,静电排斥液相相互作用色谱,可以同时富集和分离磷酸化多肽。HILIC法利用磷酸化多肽强烈的亲水性在色谱图的中间部分进行洗脱,随后使用IMAC或TiO2进行富集。虽然细胞磷酸化蛋白质组中丝氨酸和苏氨酸残基的磷酸化是主要的修饰,但由于修饰残基的尺寸较小,因此抗原性较低,无法获得针对丝氨酸或苏氨酸残基的选择性抗体。基于免疫亲和的方法主要用于富集酪氨酸磷酸化肽,主要通过抗体富集。与占磷酸化蛋白99%以上的丝、苏氨酸修饰不同,酪氨酸磷酸化(pTyr)的蛋白所占比例较小,占比不到0.5%。抗pTyr抗体由于其在纯化pTyr上的特殊特异性,一直是一种不可替代的工具,与pSer和pThr相比,pTyr肽的丰度极低,但是,抗体应用非常昂贵。酪氨酸磷酸化多肽富集难度较大,新型富集方法有pTyr100抗体与蛋白G琼脂糖非共价偶联,从胰蛋白酶化蛋白提取物中直接免疫沉淀含有pTyr的多肽等。除了pTyr-特异性抗体外,磷酸蛋白结合元件(尤其是Src同源性(SH2)结构域)也被用于富集含有pTyr-的蛋白和肽段。使用IMAC或TiO2对免疫沉淀组分进一步分离,可以去除非特异性磷酸化多肽。化学富集法和磷酸化酪氨酸多肽免疫沉淀法的联合使用可以实现磷酸化蛋白组较全的覆盖率[11]。还有一些新兴的富集技术,例如分子印迹聚合物, 羟基磷灰石色谱等。
1.4 磷酸化蛋白质组学数据采集方法
用于获取磷酸化蛋白质组的数据采集方法是影响MS实验中生成数据类型的关键因素。迄今为止,大多数磷酸化蛋白质组学研究都是在数据依赖采集(DDA)模式下进行的,但其检测偏向于高丰度多肽且具有相当大的不可再生性。而选择反应监测/多重反应监测(SRM/MRM),只检测具有已知裂解谱的预先指定肽段的存在和丰度。这种靶向方法部分克服了DDA的缺点,但不适合大规模研究。目前,数据非依赖采集技术(DIA)的应用被逐渐推广,其不限制于目标肽段,数据采集无偏向性,全景式扫描,数据可回溯,结果准确性和重复性较好,可以用于未知蛋白的探索和大样本量的研究[18-19]。单针分析由于其吞吐量和周转时间,以及可重复性、可扩展性和对并行处理和自动化的适应性,更适合临床分析。
2 磷酸化蛋白质组学与乳腺癌发生发展的研究进展
磷酸化蛋白质组学技术在乳腺癌发生发展研究过程中的应用越来越广泛。体外和细胞磷酸化蛋白水平的测定识别出CDK5的活性底物,发现CDK5介导细胞核内CRMP2A的磷酸化引起癌变[20]。多蛋白靶标的高通量化学筛选和质谱分析提示,CDK1可以通过磷酸化直接调控FOXA1,是BT474细胞系中与FOXA1相互作用的因子[21]。线粒体蛋白组学为蛋白定位分析提供了可能。通过2D-DIGE分析并比较乳腺癌细胞的线粒体蛋白质组学谱,质谱鉴定差异表达蛋白,发现BRCA1突变状态与定位于线粒体的特定区域的HIF-1α有关[22]。基于磷酸化蛋白组学质谱分析的酪氨酸激酶磷酸化位点的研究揭示CK2结合位点的磷酸化对PGRMC1的激活至关重要,对乳腺癌的发生发展具有重要作用[23]。研究者利用亲和纯化的蛋白质组学方法,结合MS与人293T细胞鉴定出与A3B相互作用的细胞蛋白,提示DNA脱氨酶APOBEC3B干扰CDK4介导的Cyclin D1的核导入,促进癌变[24]。通过iTRAQ标记和串联质谱测定四种乳腺癌细胞系与正常对照细胞系的差异蛋白表达谱,确定了肿瘤生物标记物,并在每种乳腺癌细胞系提出了一套独特的多肽,可以对不同亚型的乳腺癌进行分类[25],从而做到精准诊疗。TNBC是一种异质性较大,临床侵袭性较强的疾病,目前缺乏有效的靶向治疗手段。Wu等使用定量高分辨率傅里叶变换质谱分析了26个TNBC细胞系的磷酸化酪氨酸蛋白质组。从969个蛋白中鉴定出1 789个酪氨酸磷酸化肽段,为TNBC中酪氨酸激酶通路激活状态的异质性提供了新的见解[26]。
蛋白激酶调控异常导致下游相关信号通路异常激活或失活,介导乳腺癌细胞的侵袭迁移。采用蛋白质组学、磷酸激酶阵列、mRNA测定、免疫组织化学等方法,研究者发现在三阴性乳腺癌细胞中,DeltaNp63激活EGFR信号诱导黏附丧失[27]。还有研究者通过多组学分析识别出DNA损伤反应蛋白ATM是细胞因子产生的驱动因素,可以增加免疫浸润,发现了不同的驱动因素导致免疫细胞浸润的癌症谱系,促进免疫疗法在不同肿瘤的临床应用[28]。为了阐明控制肿瘤细胞粘附到内皮细胞和随后的跨内皮细胞迁移的信号,Locard-Paulet等进行了磷酸化蛋白组学分析,绘制转移MDA-MB-231乳腺癌细胞和内皮细胞接触时触发的细胞特异性蛋白磷酸化水平变化。细胞特异性磷酸化蛋白质组分析提供了肿瘤和内皮细胞之间接触启动信号的双向图谱,进一步阐明了癌细胞跨内皮细胞迁移的机制[29]。Koh等对表达活性H-Ras的侵袭性MCF10A人乳腺上皮细胞和表达活性N-Ras的非侵袭性细胞的脂质筏蛋白进行了蛋白质组学比较分析,鉴定出脂筏蛋白flotillin-1是H-Ras激活和乳腺癌细胞侵袭的重要调控因子[30]。Law等使用磷酸化突变体细胞株进行免疫印迹分析、亲和纯化,以评估CDCP1蛋白磷酸化和/或蛋白复合物的形成。通过蛋白条带切除和质谱联用技术发现CDCP1通过促进EGFR和Src在细胞间和细胞-基质接触部位的活化而促进黏附的丧失[31]。基于质谱的磷酸化蛋白质组学技术有助于乳腺癌侵袭转移相关激酶谱动态变化的追踪和深入研究。
3 磷酸化蛋白质组学与乳腺癌标志物的研究进展
目前,磷酸化蛋白质组学技术可以用于乳腺癌生物标志物的发现[32]。Urasaki等在乳腺癌细胞系中检测了MEK1、MEK2和ERK1/2的PTM谱,然后用纳米流控蛋白质组学技术分析发现pMEK1(Thr286)磷酸化亚型,它是乳腺癌细胞周期调控负反馈磷酸化的生物标志物[33]。研究表明,组蛋白H1磷酸化可能作为乳腺和其他癌症的临床生物标志物。Chen等使用了自上而下的质谱分析工作流程来识别和定量与乳腺细胞在细胞周期中的进展相关的H1蛋白形态。他们发现组蛋白H1.2多个位点磷酸化在M期相对于S期显著增加,表明磷酸化是细胞周期依赖的,可以作为细胞增殖的标志物[34]。Chen等提出了一种从人血浆中分离和识别胞外囊泡中的磷酸化蛋白作为区分疾病和健康状态的潜在标记的策略。利用无标记定量磷酸化蛋白组学,可以从人类血浆中分离的胞外囊泡的磷酸化蛋白中筛选乳腺癌的候选标志物[35]。Roth等对在表皮生长因子培养中刺激的未转化乳腺上皮细胞(MCF10A)进行了磷酸化蛋白组学SILAC分析,进一步通过酵母双杂交和共免疫沉淀试验发现LAD1是响应EGF的肌动蛋白动力学的丝状蛋白结合调节剂,是侵袭性乳腺肿瘤的标志物[36]。
4 磷酸化蛋白质组学与乳腺癌治疗及耐药的研究进展
磷酸化蛋白质组学在乳腺癌预后、治疗靶点以及治疗效果预测等方面应用前景广泛。利用反相蛋白阵列技术对6个不同表型乳腺癌细胞系的MAPKs蛋白表达进行定量分析后,研究者发现MAPKs水平与预后相关[37]。ER阳性乳腺肿瘤占所有乳腺癌病例的70%。虽然内分泌治疗在辅助治疗或复发的情况下是有效的,但耐药性使得药物疗效削弱。Cuesta等对ER阳性MCF7乳腺癌细胞进行了磷酸化蛋白质组分析,发现ER通过DEPTOR调控mTOR活性。该研究为双PI3K/mTOR抑制剂联合内分泌治疗作为ER阳性晚期乳腺癌患者的一线治疗提供了支持[38]。他莫昔芬是一种ER拮抗剂,是治疗乳腺癌的重要药物。然而,大量的病人表现出新生或获得性耐药性。为了研究耐药机制,Wu等对三苯氧胺耐药的细胞系进行了定量磷酸化蛋白质组学分析。随后的基因集富集分析显示FAK2不仅在他莫西芬耐药细胞中被过度磷酸化,而且转录上调。通过特异性siRNA敲低或小分子抑制剂抑制FAK2,可以抑制体外细胞增殖和体内肿瘤的形成,提示FAK2是激素难治性乳腺癌的潜在治疗靶点[39]。Cheng等通过整合肿瘤基因组图谱中的mRNA转录数据和反相蛋白阵列中的蛋白质组数据,阐明了PIK3CA在乳腺癌发生及耐药性产生过程中的功能[40]。目前,获得性的曲妥珠单抗耐药仍然是HER2阳性患者的治疗难题。Nunes等使用SILAC的定量蛋白质组学比较曲妥珠单抗敏感与耐药细胞的蛋白质组谱图,发现在曲妥珠单抗耐药细胞(BT474-TR)中,自噬相关蛋白9A(ATG9A)是一个下调蛋白,其缺失可使HER2从溶酶体靶向降解中逃逸[41]。Chang等使用SILAC细胞中的氨基酸,对拉帕替尼敏感和耐药细胞株(SKBR3和SKBR3-lr)进行了磷酸化蛋白组学分析,并进一步分析了信号通路和蛋白互作网络后,确定PAK2作为治疗靶点,并验证PAK2敲除和PAK抑制剂治疗具备使拉帕替尼耐药细胞再敏化的作用[42]。
磷酸化蛋白质组学在癌症化疗耐药及放疗抵抗等机制的研究应用中具备很大潜力。电离辐射广泛应用于癌症治疗,然而,癌细胞往往会产生辐射抵抗,这就削弱了癌症放射治疗的效果。定量评估抗辐射肿瘤细胞相对于辐射敏感性肿瘤细胞的整个激酶组的变化,可能为明确肿瘤适应性辐射耐药性的机制和发现有效预防和治疗肿瘤辐射耐药性的新靶点提供重要支持。基于MRM的靶向蛋白质组学分析耐辐射MCF-7/C6乳腺癌细胞的激酶组特征,发现CHK1、CDK1、CDK2和DNA依赖性蛋白激酶过表达,为放疗抵抗性癌细胞的再敏化和抵消电离辐射的有害影响提供潜在靶点[43]。通过定量蛋白质组学方法,Heerma等发现在RK-33或DDX3敲除后,参与线粒体翻译和呼吸电子传输通路的蛋白显著下调。DDX3与RK-33通过抑制线粒体翻译导致乳腺癌的放疗增敏,从而导致细胞的氧化磷酸化能力降低和ROS水平增加[44]。
5 展望
磷酸化蛋白质组学技术为蛋白活性功能及其动态变化机制研究提供支持,但其仍面临着一些挑战。首先,磷酸化蛋白组学的复杂性高,多肽浓度动态范围广,由于理化性质和技术限制,其高度动态和短暂性质的磷酸化多肽难以准确捕捉。由于每种富集方法都有其自身的优势和局限性,因此将互补的方法组合成多维混合策略是有益的。其次,磷酸化蛋白的丰度通常很低,而且磷酸化位点的化学计量数很低,被高丰度的非磷酸化的异构体所掩盖,其分析核心是专用的富集程序,高选择性地分离磷酸肽。另一个挑战是样本管理,样本收集或处理任何延迟可能导致磷酸化蛋白的变化。同一瘤体不同区域的蛋白水平是一致的,但蛋白酶抑制剂及磷酸酶抑制剂的加入对样品中磷酸化多肽的水平有一定影响,样品前处理很大程度决定了结果的质量。磷酸化蛋白水平存在显著差异,反映了细胞信号的空间异质性,对来自多个活组织切片的磷酸化蛋白组数据集的解释提出了重大挑战。
磷酸化蛋白组学质谱会产生海量数据,开发更好的分析计算方法是必须的。处理大量磷酸蛋白质组数据集的一个主要挑战是找到有效的方法来提取关键磷酸化多肽的相互作用。目前,大多数磷酸化蛋白组学数据来源于组织和较高的细胞数量,单细胞蛋白质组学的技术为单细胞分辨率的蛋白分析提供了可能,但其技术难度大,单细胞蛋白质翻译后修饰富集相关技术还十分不成熟。磷酸化蛋白质的空间分布,包括组织中异质受体的表达和激活,以及细胞内磷酸化蛋白的分区化还需要进一步研究。此外,一个蛋白可能在一个给定的时间内以多个磷酸异构体存在。这些异构体它们的磷酸化位点的排列和占用都不同。因此,对这些磷酸化异构体的整体表征是一项复杂的工作。同时,还需结合多组学及免疫沉淀等实验方法,进一步分析目标蛋白及其相关蛋白相互作用功能,为蛋白质动态变化提供有力支持。