生物质谱技术在腺相关病毒(AAV)载体制剂质量控制中的应用
2023-12-30李孟效李惠琳
李孟效,李惠琳
(中山大学药学院,广州 510006)
1 腺相关病毒(AAV)概述
基因治疗是指为了治疗目的而修改操纵基因表达或改变活细胞的基因,基因治疗的方式可以划分基因补充和基因编辑,基因补充是指将遗传物质导入需要治疗的靶细胞,基因编辑是指对细胞已有的缺陷基因进行修改和调控,但无论哪种方式都需要依赖特定的递送载体才能完成[1]。常用的基因治疗载体可以分为病毒载体和非病毒载体,而非病毒载体的转导效力远低于病毒载体,尤其是在体内[2-3]。病毒载体利用了病毒可以感染细胞的特性,其主要功能是保护被包裹的RNA 或DNA 和参与细胞定位和贩运。临床前和临床研究中常用的病毒载体包括腺相关病毒(adeno-associated virus, AAV)、逆转录病毒、疱疹病毒、慢病毒和腺病毒[4-5]。其中,由于AAV 的非整合性和低免疫原性,能够感染分裂期和非分裂期的细胞,在人体中的风险较低,且在多种靶器官和靶细胞中可有效转导,因此得到了较多研究[6-7]。
AAV 是一种非包膜单链DNA 病毒,属于细小病毒科的细小病毒属。AAV 需要辅助病毒(例如:腺病毒和疱疹病毒)的共同感染才能复制,因此其致病性较低[8]。AAV 在自然界中有许多野生类型,目前已分离到13 种血清型:AAV1~ AAV13,并被划分为6个进化枝:A ~ F(图1)。不同的血清型之间的同源性的程度不同(57% ~ 99%),其氨基酸序列的差异导致了不同的组织趋向性、受体亲和性和免疫原性,这会影响最终的转导功效[9-10]。
Figure1 Types of adeno-associated virus (AAV) serotypes[8] (A) and clades of adeno-associated virus serotypes[10] (B)
野生型的AAV基因大小约为4 700 bp,AAV基因组主要由反向重复序列(inverted terminal repeats,ITRs)和2 个ITR 之间的2 个开放阅读框(open reading frame, ORF)组成,左侧的为编码非结构蛋白的Rep 阅读框,右侧的为编码结构蛋白(VP1、VP2、VP3)的Cap阅读框编码,这3种基因的主要功能是完成AAV 的复制与组装[8]。Rep 基因编码Rep78、Rep68、Rep52 和 Rep40蛋白,两种较大的Rep蛋白Rep78 和Rep68 主要参与基因组的复制,而两个较小的Rep 蛋白Rep52 和Rep40 在病毒粒子的包衣中起重要作用[3]。其中ITRs 对于AAV 的组装是必须的,因此在保留AAV 两端ITRs 的前提下,可以利用基因工程的方式用目的基因替换Rep 和Cap基因,只保留Rep 和Cap 蛋白的反式作用元件,重组的AAV 病毒粒子就能成功组装[11-12]。此外,在Cap 基因中还包含了一段与AAV 组装相关的AAP(组装激活蛋白)基因,由嵌入Cap基因内的重叠阅读框的非规范CTG 起始密码子表达[13]。对于AAV2,在 AAP 中引入终止密码子而不影响VP2/3的编码可防止衣壳组装和病毒/载体的产生。虽然衣壳组装可以通过提供反式AAP 来恢复,但野生型(wt)AAP的过表达不会增加载体产量,这都说明AAP 的表达是完成最大滴度病毒组装的重要条件之一[14]。不过新的研究发现,某些AAV 的血清型(AAV3、AAV9)不需要全长的AAP 基因来组装病毒颗粒[15]。此外AAP 也被证明与AAV 的核仁定位、VP的稳定性有关[14-15]。
Ogden 等[16]在建立AAV2 Cap 阅读框的单密码子突变病毒库的过程中发现了嵌套在VP1 独特结构域中的一个ORF,编码一种新的病毒蛋白。蛋白质与绿色荧光蛋白(GFP)或Flag-tag 的C 端融合揭示了与细胞膜的关联,于是作者将其命名为“膜相关辅助蛋白”(MAAP)。用灭活MAAP产生的重组病毒是可行的,并且产生的滴度与编码wt-MAAP的AAV 相似。然而,除非MAAP 以反式形式提供,否则MAAP 突变的AAV 编码wt-Cap 的病毒在表达水平上会更低。Ogden 和合作者提出MAAP 可能参与不同血清型AAV 基因组之间的竞争性排斥。Galibert 等[17]的研究也证实了上述观点,并认为MAAP 是AAV 感染的加速因素。rAAV 的转导过程极其复杂,首先以rAAV2 为例:它通过受体依赖性内吞作用在细胞中摄取,并通过内体途径运输。内体中完整的rAAV 经历一系列依赖pH 的结构转化,这对于内体逃逸、通过细胞骨架网络和通过细胞质运输至关重要。在核内体逃逸后,rAAV 通过核孔复合物进入细胞核,然后进行衣壳脱包,释放基因组并表达转基因[18]。
传统的rAAV 生产通常涉及“三重转染”方法。三联转染组件由一个编码转基因的质粒、一个含有腺病毒5 型(Ad5)辅助基因(即E1a/b、E2a、E4 和VA RNA)或其等同物的辅助质粒和另一个编码rAAV Rep和Cap蛋白的质粒组成[7](图2)。然而传统的生产方法不适合rAAV 大规模生产,主要是因为转染所用的细胞系HEK293是贴壁生长的,导致了容器的限制,还有3个质粒瞬时转染本身的操作复杂性。此外,转染试剂(PEI)也可能会产生毒性[3]。因此后来开发了替代杆状病毒表达载体(BEV)介导的rAAV 生产系统(Bac 系统)。高效的BEV 感染比传统的质粒转染具有优势,此外,昆虫Sf9 细胞比HEK293 细胞更适合大规模高密度无血清悬浮培养[12]。现在基于重组病毒和稳定细胞系的平台开发,仍面临着许多需要改进的地方,例如辅助/感染病毒过程都将是rAAV生产的潜在风险,并且需要在下游过程中消除辅助/感染病毒,以避免与最终产品相关的安全问题。此外,在AAV 衣壳生产过程中,AAV 衣壳可能会包封宿主细胞DNA,如癌症的基因序列(HeLa 的HPV 序列,HEK293的E1序列)[3]。
Figure2 Schematic diagram of AAV gene structure and rAAV production [3]
在衣壳结构方面,AAV 是由60 个衣壳蛋白(VP)单体排列成五聚亚结构组装而成的直径为20~26 nm的二十面体衣壳,每个衣壳含有3个高度同源的VP (VP1、VP2 和VP3),比例为1∶1∶10,3 种VP 具有相同的C 端,其中VP2(约65 kD)包括VP3(约60 kD)的整个氨基酸序列,是VP3 的N 端延伸,VP1(约80 kD)则是VP2 的N 端延伸[10]。VP1 和VP2的N 端区域含有AAV 感染所需的元件,如磷脂酶A2(PLA2)结构域、钙结合结构域和核定位信号[10]。细小病毒结构的主要特征包括近端3倍突起,其突出程度各不相同,5 倍轴周围有一个大而浅的凹陷,两个3 倍突起之间的2 倍轴中心有一个小凹陷[7](图3)。3倍区和2/5倍壁(2倍轴和5倍轴之间突起的区域)已被确定为许多AAV 血清型的受体结合位点,并作为细胞和组织向性的决定因素。细胞受体包括唾液酸、硫酸肝素蛋白多糖(HSPG)、末端半乳糖、硫酸N-乙酰乳胺、AAVR、层粘连蛋白、αvβ1 整合素、αvβ5 整合素、肝细胞生长因子受体、成纤维细胞生长因子受体和血小板源性生长因子受体。除了受体结合外,衣壳的表面,包括5 倍区,显示了宿主免疫反应引起的抗体的抗原位点[10]。
Figure3 Schematic diagram of the 20-hedron structure of parvovirus [7]
目前rAAV 载体在基因治疗方面得到了较多的研究和应用。基于rAAV 的基因治疗药物Glybera 用于治疗脂蛋白脂肪酶缺乏症、Luxturna用于治疗遗传性视网膜营养不良症和Zolgensma用于治疗致命性脊髓性肌萎缩症,分别于2012年、2017 年和2019 年获批上市[12]。使用腺相关病毒进行基因转移的疗法正在快速获得视网膜疾病、充血性心力衰竭、血友病A 和B、X 连锁肌管性肌病、胶质母细胞瘤、胶质瘤和脊髓性肌萎缩症、肌肉系统疾病(肌营养不良症)、关节炎、糖尿病的临床批准[8-9]。不过FDA 也召开会议提出了rAAV 载体的可能出现整合性和肝脏毒性的风险,以及潜在的致瘤性、血栓性微血管病和神经毒性风险[2]。此外载体脱落、空衣壳的免疫原性、中和抗体也对AAV载体的质量控制提出了更多的要求[9,19]。
2 AAV的关键质量属性
2.1 不同类型衣壳蛋白的比率
据报道,VP1、VP2 和VP3 的相对表达水平可以受到生产方法的影响,并可能偏离1∶1∶10 的比例,在某些情况下可能会导致传染性降低[20-22]。VP1 的N 端含有一个磷脂酶A2 (PLA2)结构域,该结构域在病毒的内体逃逸中起重要作用[23]。此外,在衣壳VP1 和VP2 的N 端有几个核定位信号(NLS)被细胞转运机制识别,以促进核转运[24]。因此VP1比率的降低可能会导致转导效率的降低。Arriaga等[21]将AAV3B 的VP1/VP2 分别进行了基因敲除,虽然其衣壳能够组装,但是感染的效率与野生型AAV 相比显著降低。Bosma 等[22]对重组AAV5 的Cap 阅读框中的VP1 的起始密码子和上下游序列重新编码和修饰,得到了不同VP 比率的rAAV5,并由此发现当VP1 的比率偏低时其效价出现降低,过高的VP3占比也会使转导效率下降,而11号构建体实现了与野生型类似的VP 比率和感染效率。此外,漏扫描导致的VP3 不完整片段也会在生产的过程中产生,VPs的过程或产品相关降解可能降低载体效力并具有免疫原性风险[25-26]。此外,有关衣壳组装的随机性导致的AAV 异质性已被报道,即AAV 不同病毒粒子之间的VP 比率会有波动,1∶1∶10 只是一个总体的平均值,因此对于批次的AAV衣壳比率的检查是有必要的[27]。
2.2 翻译后修饰(PTMs)
蛋白质翻译后修饰是一个或者多个氨基酸残基在酶的作用下,被修饰上了不同的基团,蛋白质的生化性质也会因此变化。对于病毒来说,衣壳蛋白的翻译后修饰可能会改变病毒感染特性和生命周期[28]。病毒蛋白也会因为生产所用的细胞系不同而产生独特的翻译后修饰。宿主细胞中病毒蛋白合成过程中的PTMs 是产生结构和功能多样性/复杂性的重要来源,使病毒能够适应和共同进化各种宿主细胞屏障,如腺病毒、痘苗病毒和多瘤病毒[29]。Mary 等[29]的研究证明AAV1-rh10 存在广泛的PTMs,包括泛素化、磷酸化、糖基化、乙酰化、SUMO 化。此外,关于AAV8、AAV9 的脱酰胺修饰也引起了很多的关注[28]。
而且随着PTMs 位点的研究不断开展,各种PTMs对于AAV载体用于基因治疗的影响也逐渐被实验阐明。如磷酸化、脱酰胺化、泛素化和SUMO化,被报道会影响转导效率[28-30]。Zhong 等[30]发现了,衣壳蛋白酪氨酸残基的磷酸化会对AAV2的转导效率产生负面影响,这与AAV 衣壳蛋白后续的泛素化有关;Giles 等[28]指出多种血清型的AAV 载体存在Asn 和Gln 的脱酰胺化,并对AAV8 的脱酰胺化的影响做了研究,发现脱酰胺化后的转导效率下降,下降的程度与不同的位点有关,其中N57,N94,N263,N305,Q467,N479 和N653 的转导效率下降为不到原先的10%。Weger 等[31]证明AAV 的Rep 蛋白Rep68 和Rep78 通过SUMO 化过程修饰,有助于其稳定性; AAV2 的K544 已经被证实为泛素化的一个位点,而在密码子K544 的目标位点从赖氨酸突变为谷氨酸导致蛋白体介导的衣壳降解减少,会导致更高的转导效率[32]。考虑到K258 是一个SUMO 化的位点,一项研究通过将AAV2-K258位点修饰为AAV2-K258Q,不仅发现了SUMO化的程度明显减少,而且AAV2-K258Q 体外转导实验在玻璃体注射两周后的荧光强度相对于野生型可以忽略不计,表明了其转导效率的下降[29]。
2.3 不同的AAV血清型
尽管不同AAV 血清型之间的VP 序列比较相似,但是不同血清型对组织的趋向性有所不同,清除的半衰期也不同,此外引起的免疫反应、转导效率也有差异[9,19]。因此对AAV 血清型鉴定至关重要。目前已经批准的关于AAV 载体的基因治疗有用于视网膜疾病、充血性心力衰竭、血友病A 和B、X 连锁肌管性肌病、胶质母细胞瘤、胶质瘤和脊髓性肌萎缩。而疗效和安全性有赖于对不同的AAV血清型的选择[9]。
组织倾向性反映了不同血清型和糖基受体之间特定相互作用。例如,AAV1 的α2,3 和α2,6 N-linked 唾液酸(SIA);HSPG 用于AAV2、AAV3 和AAV13 等[33]。更深层次的原因是,不同血清型之间的结构蛋白的序列在同源性上的差异导致了其对宿主细胞的表面受体有了不同的亲和力。许多AAV 血清型的初始结合是通过主要受体,包括聚糖和蛋白聚糖,例如,在AAV2 中,由带正电荷的R585、R588和R487残基形成的肝素结合位点使病毒粒子与硫酸肝素蛋白聚糖细胞表面受体结合并启动转导过程[29]。而在NHP 的动物实验中,有研究报道了AAV 在小鼠肝脏的转导效率,以AAV7和AAV8为基础的载体比以AAV2或AAV5为基础的载体效率高10~100 倍[9]。AAV2/8 相较于AAV2/2、AAV2/5 和AAV2/9 在小鼠视网膜转导的特异性更高[34]。在大鼠DRG 神经元中,AAV9的转导效率明显高于AAV5、AAV6、AAV8[35]。
AAV 在被机体清除后仍有活性,且不同血清型清除所需要的时间不同,例如AAV2/8 在2 周后就无法在精液中检测到,而AAV5 在22 周时仍可以在精液中被检测到[9,36]。
虽然rAAV 的免疫原性较低,但是目前关于AAV 导致的免疫反应却时常有报道,据报道rAAV给药期间的宿主免疫反应限制了人类长期的转基因表达,而产生的免疫反应与AAV 的血清型有着直接关联[37]。在体液反应方面,通过自然感染暴露于野生型AAV 或通过体内基因治疗暴露于rAAV会导致血清中的中和抗体产生并有效地阻断靶细胞转导。自然感染很常见,70%的人类血清含有抗rAAV1 和rAAV2 的抗体,45% 抗rAAV6 和rAAV9的抗体,38%抗rAAV8的抗体[38]。并且抗体已被证明在rAAV 血清型之间发生交叉反应[39]。因此在选择基因治疗所用的AAV 血清型时就需要尽可能地避免交叉反应,使用抗体滴度少免疫反应更低的治疗方案,这就对AAV 血清型的准确、高效鉴定提出了要求。
2.4 产品中的空壳率
在AAV 载体生产的过程中还会产生未包裹目标DNA 的空衣壳病毒颗粒和包裹部分截断或者非目标基因的病毒颗粒,通过透射电子显微镜(TEM)可以看到,空衣壳的水平可以在10% ~ 90%之间变化,这可能是由衣壳组装的随机性导致的[40]。不含基因组的AAV 衣壳被视为AAV 载体生产过程中的一个主要副产物[41]。因为空衣壳和那些含有截断基因或非转基因序列的衣壳会引发不必要的免疫反应,降低转导效率和效果[42]。未包裹治疗基因的空衣壳会导致所需要的治疗剂量增加。研究发现,随着载体剂量的增加,观察到明显的炎症毒性,包括补体活化、细胞减少和严重的肝毒性[19]。据推测,空AAV 病毒粒子增加衣壳剂量可以增加衣壳抗原在主要组织相容性复合体Ⅰ类上的呈递,从而触发衣壳特异性CD8+T 细胞反应[43]。例如,Gao 等[44]合成了部分空的和完全空的AAV8 病毒粒子,完全包装的rAAV8,以及空的和完全包装的病毒粒子可变比例的混合物。将上述注射到两种不同的小鼠品系中,然后分析不同时间点的转基因表达和血清丙氨酸转氨酶(ALT)水平。结果发现,空衣壳比例的增加不仅导致了目标蛋白表达的抑制,而且增加了肝转氨酶水平,这表明其产生了不良反应,因此有必要对AAV 产品的空壳率实施质量控制。
3 不同质谱检测方法在AAV 质量属性检测上的应用
目前,MS(质谱)法在生物制药和蛋白质等大分子分析上已经得到了广泛的应用[45]。在生物制剂检测方面主要涉及在氨基酸序列、糖基化、二硫键和翻译后修饰(PTMs)的表征,以及蛋白质鉴定、表位定位、高阶结构测定、宿主细胞蛋白(HCP)监测及蛋白质定量质量控制测试[46-49]。MS 法在获取蛋白质序列、3D 结构和相互作用之间的信息越来越重要。在蛋白质结构分析上,MS 已经成为经典的核磁共振光谱和X 射线晶体学蛋白质结构方法的补充方法,而且克服了核磁共振光谱需要的蛋白质浓度较高和X 射线衍射结晶法在一些柔性蛋白质无法结晶方面上的局限[50]。此外,MS 技术也在得到不断的发展,目前MS 与多种技术的联用使得质谱在表征蛋白质的结构和相互作用之间有了更加进一步的发展,例如MS 联用于化学交联(XL)[51-52]、氢/氘交换(HDX)[53]、羟基自由基蛋白质足迹(HRPF)[54-55]、限制性蛋白酶解[56]和细胞热转移(CETSA)[57-58]。XL-MS 可以用于研究近端残基的相互作用,推断或者验证蛋白质的3D 结构。质谱结合HDX、HRPF或有限蛋白水解技术可用于识别在复合物形成时表面可及性发生改变的残基,从而提供分子间互作界面和复合物构象动力学的信息。而细胞热转移技术可以用于研究小分子配体的结合程度。
本文侧重于现有质谱方法在AAV 载体制剂的衣壳比率、翻译后修饰、AAV 血清型表征和空白衣壳比率上的应用。目前用于检测衣壳比率的常用方法为凝胶电泳法,但是固有的伪影、染色差异以及染色的条带强度与衣壳蛋白之间关系尚未阐明限制了该方法的准确性[59-60]。AAV 血清型的表征主要采用酶联免疫吸附实验ELISA,但是应用上受到不同血清型特异性抗体开发的限制[61]。空白衣壳比率的检测目前已经有qPCR 法、光密度法、分析型超速离心(AUC)法和TEM 法,但是这些方法中qPCR 法会受到部分包封的衣壳的影响导致结果出现偏差;光密度法较为简便但是准确性不高;AUC 法的操作较为复杂,检测耗时久;TEM 法也无法区分部分包封的衣壳[62]。而MS由于其较高的质量分辨率和质量检测范围,可以实现对AAV 载体的完整衣壳蛋白、不同类型的VP 蛋白、肽段和氨基酸序列的表征,使得MS 在分析VP 蛋白及其片段、PTMs 和AAV 载体血清型中有着独特的优势,并且检测需要的样品数量少、检测时间短,可以与不同的分离技术联用。此外,非变性质谱和电荷检测质谱(CDMS)的应用有望克服现有方法在衣壳蛋白比率和空白衣壳比率不够准确的难题。
3.1 衣壳比率(衣壳的化学计量)
目前对VP 化学计量学的评价主要采用电泳方法,尤其是十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE),采用SYPRO Ruby 染料进行银染或荧光染色可提高VP 条带检测的灵敏度[59-60]。虽然用染料染色和条带强度与实际蛋白质量之间的关系是阐明化学计量学所必需的,但与VPs的关系尚未确定。毛细管凝胶电泳(CGE)对VP 具有良好的灵敏度和分离能力,已成为生物制药质量控制的主要方法[63-64]。分离出的蛋白质是通过肽键或芳香族氨基酸残基的吸收来检测的,无需染色,因此可以实现对VP的直接定量。
MS 在估计AAV 中VP 比率方面的效用已被证明与基于LC 的分离和基于CGE 的技术相结合[25,65]。Oyama等[25]报道了基于SDS-PAGE、CGE 以及LC-UV-MS 的检测VP3 变体的结果。通过SDSPAGE 中条带的亮度密度、CGE 中电泳图谱的峰面积、LC-UV 色谱图谱的峰面积计算AAV 衣壳的VP比值。其中,CGE 与LC-UV-MS的检测结果基本一致,SDS-PAGE 中对于VP2 的检测值偏低,这可能是由于染料与VP 结合的定量关系不同导致的。此外,LC-UV-MS 的检测过程中会产生的VP3 片段,这也应该计算到VP3 的定量中,除了VP 的定量外,LC-UV-MS 还可以明确地鉴定所有VP 成分的氨基酸长度。对于AAV1、AAV2、AAV6,在SDSPAGE 图中VP1、VP2、VP3 蛋白都被清晰地检测出来,但是相较于SDS-PAGE,CGE 具有更好的分辨率和灵敏度,在CGE 中VP3 的一个小峰也被检测出来。经过LC-UV-MS 在完整蛋白和MS/MS 在肽段水平的分析,确认了该小峰属于VP3 基因漏扫描产生的不完整片段而该片段会导致在LC-UVMS中对VP3成分的检测结果偏高。
亲水作用色谱(HILIC)是反相色谱(RPLC)的一种补充方法,已经被广泛应用于极性物质的分析[66]。HILIC 可以有效地分离极性较大的物质,克服了RPLC 对于强极性物质的分离弱和正相色谱(NPLC)在流动相溶解量不足的问题[67]。在生物制药实验室中,基于HILIC的分离经常被应用于研究糖蛋白生物制药中释放的聚糖或糖肽。近年来,越来越多的报道表明,使用宽孔酰胺基柱的HILIC分离也可以成功应用于完整的蛋白质[68-70]。Liu等[71]利用亲水作用色谱与质谱联用的方法,通过增大进样量到20 µL 或者在启动洗脱之前重复给样增大了柱子的装载量,再通过脱溶性气体改善TFA 的离子抑制提高了分辨率。该检测在完整蛋白水平上成功实现了对于VP1、VP2 和VP3 的分离,质谱的质量偏差2 D 以内。此外,利用色氨酸自带的荧光可以实现对于VP 的化学计量,但这也导致了化学计量会偏向于色氨酸偏多的VP。此外,由于HILIC 分离可以进一步分离出不同VP 的蛋白形态,不同VP 的蛋白形态可能发生共洗脱,导致峰整合不准确。最后,尚不清楚不同VP 的回收率是否会因HILIC柱上吸附的不同而有所不同。尽管如此,该方法仍可用于半定量比较不同批次或工艺中3 个VP 的相对表达量,并且可以用于AAV不同批次间的比较。
非变性质谱(native MS)是研究大分子和蛋白质及其配体复合物的重要手段,因为它保留了相互作用之间的非共价作用力[72]。使用非变性质谱可以确定完整大分子复合物的质量、化学计量、组分之间的直接相互作用,并且在多亚基组装的情况下,识别稳定的亚配合物并分配亚基的相对位置[73-74]。Snijder 等[75]利用Orbitrap 质谱仪获得了不同病毒组装体的高分辨率非变性质谱图,能分析相对分子质量高达4.5 MD 病毒颗粒,并且由此对AAV1的3种VP的化学计量学做了检测,得到了共8个匹配的化学计量(图4),由此提出VP的组装是随机的。Wörner 等[27]通过使用Orbitrap UHMR 提高了有效转移和检测高质量离子的能力,提高了非变性质谱的分辨率。使用模拟的非变性质谱与样品的非变性质谱做了比较,可以计算化学计量。为了模拟非变性质谱,开发了一个python 类的程序,能够创建复杂样品的理论质谱,对1 891(基于n= 3 个不同的VP,总共k= 60 个子单位,给出唯一的组合/质量[3])可能存在的理论质谱做了模拟。分析的结果与LC-UV-MS 检测的结果基本一致。并且提出了VP 在不同的血清型和批次之间存在异质性,即使是同一批次内的样品,其VP 的组装也具有随机性,说明了VP 的比率1∶1∶10 只是一个总体分布的平均值,在实际生产中部分VP 的拷贝数可能会偏离这个比例,而这对于VP1 与VP2 来说变化程度较大,例如:AAV8_2中VP1的产生量是AAV8_1的2倍。
Figure4 Simulated mass spectra for AAV9, showing the convoluted ion signals of the 69 967 different ion species shown in a) at resolutions, corresponding to transient times of 32 ms and 128 ms. Each plot shows (top to bottom) the simulated mass spectra before and after baseline correction with their experimental counterpart. Experimental data was recorded by transient averaging, thereby removing the unresolved regions presented in the non-baseline corrected[27]
3.2 翻译后修饰(PTMs)
MS 对于完整蛋白和肽段水平的分析都可以用于分析AAV 衣壳蛋白的翻译后修饰[65]。Zhang等[65]利用优化过后的RPLC-MS对AAV的衣壳蛋白进行了分析,利用二氟乙酸(DFA)作为流动相,很好地改善了之前氟乙酸(FA)无法分离VP 蛋白的问题。精准的质量检测使得在完整蛋白水平可以分析潜在的PTMs,例如,VP1和VP3的实测质量与理论质量相差89 D,说明N 端蛋氨酸截断,加入了N 端乙酰化为潜在的分子形式;VP1 和VP2 的反卷积谱中检测到80 D 的质量位移,并确定为磷酸化。并且开发了一种新的酶解方法,对于AAV5的序列覆盖率达到了98%,检测到了包括N-乙酰化、脱酰胺化、氧化、甲基化和磷酸化在内的多种PTMs。Jin 等[45]用LC-MS 直接分析AAV 衣壳蛋白,完整质谱测量结合肽图谱结果显示,VP1和VP3中N 端蛋氨酸残基被裂解,下一个丙氨酸残基被乙酰化,而多种AAV 血清型(AAV1、AAV2、AAV5、AAV7、AAV9和AAVrh10)的VP2中没有乙酰化。
利用CE(毛细管电泳)分离技术,Zhang 等[76]报道了一种基于微流体的CE-MS 鉴定AAV2 衣壳蛋白的方法。其中3 个VP 在MS 检测之前几乎已经基线分离,VP1 与VP2 的分离优于之前报道的RPLC-MS 法[45]。最后,完整蛋白质量分析也可以潜在地识别由PTMs 形成引起的衣壳蛋白变异,如乙酰化的+42 D。上文提到的Oyama 等[25]和Liu等[71]也实现了对PTMs 的鉴定。作者等基于CGE和LC的分离后,在肽段水平的分析上检测出了VP上的N-乙酰化,VP1、VP2 的磷酸化和VP 上天冬酰胺的脱酰胺。作者利用亲水作用色谱与质谱耦合的方法,质谱分析证实了在所有血清型中VP1 和VP3中N端蛋氨酸的去除和后续丙氨酸的乙酰化,以及VP2中N端苏氨酸的去除。此外,还有氧化和磷酸化的变体也被检测到(图5)。
Figure5 PTMs between different batches of AAV8[71]
除此之外,基于PTMs 的研究结果,通过蛋白质工程来设计改善AAV 衣壳蛋白,可以使得AAV的转导效率得到提高,半衰期得到延长。Giles等[28]对AAV 的脱酰胺进行了研究,影响脱酰胺率的最重要因素之一是N+1氨基酸(天冬酰胺后的氨基酸残基)的主酰胺作为亲核试剂攻击天冬酰胺残基侧链羰基碳形成琥珀酰亚胺的能力,以及肽主链的柔韧性。N+1 残基对肽骨架的局部柔韧性至关重要,因此严重影响天冬酰胺的脱酰胺率。甘氨酸(G)在N+1位置形成一个NG 基序,对脱酰胺的影响最大,其次是组氨酸(H)和丝氨酸(S)[77]。该研究为AAV8 NG 位点突变体制作了小规模的载体,分别将每个N+1 残基转化为丙氨酸或丝氨酸。在丝氨酸的方案中,涉及N263 的两种配对组合(G264A/G515A 和G264A/G541A)都提高了体外转导效率(分别是wt AAV8 的2.0 倍和2.6 倍),而滴度没有损失。
3.3 血清型的鉴定
AAV 血清型鉴定通常通过酶联免疫吸附试验(ELISA)或Western blot 方法进行。然而,这些方法受到血清型特异性抗体可用性的限制,可能不足以区分具有高序列同源性的血清型,这一问题将不可避免地因工程化AAV 血清型数量的迅速增长而复杂化[61]。最近,Bennett 等[78]报道了基于AAV1到AAV9 和AAVrh 特异融化温度的差示扫描荧光法(DSF)在AAV 血清型鉴别中的应用,可以确定AAV 不同血清型的熔化温度,但是该方法的分辨率不高。
基于质谱(MS)的方法在AAV 血清型鉴定中的应用越来越多,它们可用于分析完整蛋白或VP 的肽图谱。后者能够明确区分衣壳蛋白氨基酸序列,它在氨基酸序列水平上提供了高可信度的衣壳鉴别。这是目前区分VPs 相对分子质量差异小于10 D 的血清型所必需的。例如,AAV1 和AAV6的VP2 和VP3 氨基酸序列高度相似,相对分子质量差仅为2 D[79]。在胶上酶切或溶液酶切后进行的基于LC-MS 的肽图谱分析,不仅可以提供每个衣壳蛋白的识别,而且还可以检索位点特异性PTMs的信息[45,80]。相比之下,完整蛋白质量分析通常是在色谱或电泳分离后在高分辨率精确的质谱(HRAM)质谱系统上进行,是一种基于精确质量测量和最小样本处理的直接快速识别AAV 血清型特异性衣壳蛋白的技术。Lam 等[81]基于LC-MS/MS的肽图分析对AAV 的VP序列实现了高效的鉴定,其中尽管VP1、VP2 的含量偏低,序列覆盖率也能达到93%,由此对AAV2、AAV5、AAV8、AAV9 实现了鉴别。Jin 等[45]使用反相液相色谱(RPLC)耦合质谱法对AAV2 衣壳蛋白进行了鉴定。此外,Liu 等[71]报道了一种基于亲水相互作用液相色谱(HILIC)-MS 的完整VP 分析方法。在具有高分离效率的同时也能够检测不同PTMs 后的VP。2D 液相色谱(2DLC)和毛细管电泳(CE),也已为此目的而开发,并展示了不同的方法,通过这些方法可以在MS 分析之前有效地分离VP成分,表征VP的序列[76,82]。
3.4 空壳率
有多种方法可以确定满AAV 衣壳和空AAV衣壳之间的比率。其中一种方法是通过用现有qPCR数据得到的基因组载体数除以ELISA数据得到的总衣壳数来确定完整衣壳在总衣壳中的百分比但是,这种方法缺乏足够的数据准确性和精密度[41]。另一种方法是利用AAV 样品在260 和280 nm 的吸收度,用分光光度法测定样品中的蛋白质和DNA 含量。该方法简单、快速、易于操作。但AAV 样品纯度要求高,才能最大限度地减少杂质对260 和280 nm 紫外光吸收度的干扰。AUC 可以完整分离不同的衣壳蛋白,但是操作上复杂、分析时间长、成本高,需要大量的样本量,数据解释需要专业知识[62]。利用TEM 也可以实现对于AAV 空衣壳和满衣壳的区分,但是操作时间长,且无法分辨部分装载的衣壳。
电荷检测质谱(CDMS)是一种单粒子方法,它同时测量单个离子的m/z和电荷(z),以直接确定其相对分子质量。带电粒子的通过会产生一个信号,然后由电荷敏感放大器检测到。典型的分析包括对数千个粒子的单独测量,然后绘制成质量直方图,显示样品的相对分子质量分布和各自的丰度[83]。质谱法测量DNA和RNA的相对分子质量分布时,由于反离子的存在而导致异质性。非均质性反过来又限制了传统MS 可以测量的寡核苷酸的大小,CDMS 通过直接测量每个离子的质量电荷比(m/z)和电荷克服了这一限制[84]。Barnes等[84]利用CDMS 对AAV8 的空满衣壳进行了测定(图6),空衣壳为3.7 MD,满衣壳为5.4 MD,成功测量了其比率。并且能够检测到部分DNA 被截断,从而可以用于筛查这部分包裹了不完整DNA的衣壳。
Figure6 Representative mass distribution and charge-to-mass scatter plots recorded after incubation at 80 °C for 15 min [84]
4 总结与展望
正如前文所述,质谱正在成为生物制药行业分析AAV 基因治疗产品的关键表征技术之一。MS 在分析AAV 载体的衣壳比率、翻译后修饰、血清型、空壳率方面展现出了其独特的优势,不仅能在完整蛋白的水平上分析AAV 载体,也能在肽段水平上分析AAV 的衣壳。随着新的质谱电离技术和上游分离技术的发展,CDMS 等先进技术将在AAV 分析中发挥越来越重要的作用。MS 仪器和数据分析软件的性能的增强,也能实现对于AAV组装规律的揭示、批次间的快速比较和高通量的载体质量检测。而将MS 技术和众多的分离技术正交可以实现对于AAV 蛋白质氨基酸序列的高分辨表征。未来随着AAV 生产工艺和应用的发展,MS 技术有望在生产过程的各个阶段实现对于AAV 载体质量的实时监控。同时作为一种表征技术,可以用于指导AAV 载体的设计过程。AAV 载体在转导过程中面临着适应性免疫的限制,其免疫原性也会增加治疗过程中的不良反应[9,19]。PTMs 也会AAV 的转导效率产生影响。因此如何设计更加具有优势的AAV 载体也得到了较多的关注[16,85]。而通过MS 技术对VP 序列和相关蛋白的表征可以很好地指导AAV 载体的设计。例如,通过对于PTMs 的研究,确认不同血清型的不同位点氨基酸序列的变化对于AAV 载体质量有何影响,从而可以通过蛋白质工程对AAV 进行改良,提高治疗过程中的安全性[77]。