重组胶原蛋白表达体系研究进展
2023-09-16潘家豪潘炜松邱健谢东玲邹奇吴川
潘家豪,潘炜松,邱健,谢东玲,邹奇,吴川
(1 中南大学冶金与环境学院,湖南 长沙 410083; 2 湖南诺合新生物科技有限公司,湖南 长沙 410001; 3 中南大学湘雅医院,湖南 长沙 410008; 4 华南师范大学生命科学学院,广东 广州 510631)
胶原蛋白是人体细胞外基质的主要蛋白质,在人体中含量丰富,占人体蛋白质三分之一,占皮肤干重四分之三,对于骨骼、皮肤、关节起关键的连接作用[1‑3]。除了结构上的作用外,胶原蛋白还可以与各种大分子如整合素、装饰蛋白、纤维连接蛋白、肝素和基质金属蛋白酶(MMP)发生相互作用,在调节组织再生过程中十分重要[4]。
作为哺乳动物含量最丰富的蛋白质,胶原蛋白为哺乳动物组织提供主要的结构与机械支持,是一种结构特殊、功能多样的蛋白质,基于其开发的产品已经广泛应用于生物医药、化妆品、皮革、生物科技等行业。比如,空气干燥浇注形成厚度为0.01~0.015 mm 的胶原蛋白膜可以作为伤口愈合材料和屏蔽膜[5]。胶原蛋白作为一种生物聚合物,还可以与其他亲水性聚合物混合形成高质量水凝胶和可生物降解的支架,其中胶原蛋白与壳聚糖共混物的制备已经成为科学界重点关注的课题[6]。胶原蛋白作为皮肤的重要组分,具有维护皮肤外观和状况的作用。虽然胶原蛋白本身具有水不溶性,但胶原蛋白水解后产生的小肽与短肽易溶于水,可更好地添加到化妆品中。胶原蛋白成膜特性使其成为一种有效的保湿剂[6‑7],能覆盖皮肤保持水分,避免表面活性剂损失。目前,胶原蛋白最具有商业价值的用途是作为可溶性蛋白,皮下注射修复损伤性皮肤[8]。此外,通过鞣制等化学过程使生皮中的胶原蛋白交联,可生产更坚硬、更耐用和防腐蚀的皮革[9]。通过设计与天然细胞外基质环境相似的胶原蛋白支架,能有效揭示细胞行为和相关疾病的发病机制[10‑13]。
现阶段胶原蛋白大体分为动物源胶原蛋白和重组胶原蛋白。动物源胶原蛋白虽然是胶原蛋白主要来源,但大多来源于陆生动物与海洋动物,陆生动物胶原蛋白已交联嵌入到原生组织上,对提取与纯化技术要求比较严苛[14]。此外,病原体污染以及过敏性风险也成为陆生动物胶原蛋白不可回避的问题[15‑16]。海洋胶原蛋白能有效避免陆生动物胶原蛋白病原体污染以及过敏性风险的问题,但具有提取难和纯化成本较高等劣势[17]。重组胶原蛋白是将人胶原蛋白基因克隆到选定的表达载体并转化到表达细胞内,最后通过纯化技术所获得的蛋白质。由于重组胶原蛋白分子单一、结构清晰、易于控制,已成为生物医学以及组织工程代替动物源胶原蛋白的最佳替代物[18]。此外,重组胶原蛋白技术还可用于其他动物(鸟类和海洋物种等)特异性胶原蛋白的生产。
根据2021 年3 月15 日国家药监局对外发布的《重组胶原蛋白生物材料命名指导原则》[19],可将重组胶原蛋白分为3 类:①重组人胶原蛋白,由DNA 重组技术制备的人胶原蛋白特定型别基因编码的全长氨基酸序列,为三螺旋结构;②重组人源胶原蛋白,由DNA 重组技术制备的人胶原蛋白特定型别基因编码的全长或部分氨基酸序列片段,或是含人胶原蛋白功能片段的组合;③重组类胶原蛋白,由DNA 重组技术制备的经设计、修饰后的特定基因编码的氨基酸序列或其片段,或是这类功能性氨基酸序列片段的组合,这种基因编码序列或氨基酸序列与人胶原蛋白的基因编码序列或氨基酸序列同源性低。本文首先对胶原蛋白的结构、分布、形成过程进行阐述,再对重组胶原蛋白表达体系以及应用领域进行详细说明,最后对胶原蛋白前景进行展望。
1 胶原蛋白
1.1 胶原蛋白结构
胶原蛋白是含有三螺旋结构(图1)的纤维状胶原蛋白,约占蛋白总质量的三分之一,其中哺乳动物中胶原蛋白含量最高的是肌腱(80%),其次是皮肤(70%)、骨骼(25%)以及主动脉(20%)[21‑22]。胶原蛋白的基本组成单位是由3 条α链组成的原胶原。正是由于原胶原分子中3个平行α 链以一个接一个残基交错形成的聚脯氨酸Ⅱ型(PPⅡ)左手螺旋构象决定了胶原蛋白结构[23]。拥有正确折叠的三螺旋结构对于胶原蛋白在细胞外基质实现细胞与细胞之间相互作用至关重要[24]。在三螺旋结构中每一个α 链都由重复肽三联体(Gly‑Xaa‑Yaa)组成,其中Xaa 和Yaa 通常是脯氨酸和羟脯氨酸[25]。由于高度螺旋化,三联体中的3 个氨基酸残基在螺旋内部占据不同的位置。其中,甘氨酸残基埋藏在中心,溶剂不容易进入;Xaa 位置的氨基酸残基高度暴露于溶剂中;Yaa 位置由于靠近相邻链,因此被溶剂接触的可能性较低[26]。对Gly‑Xaa‑Yaa的大量研究揭示了影响胶原蛋白三螺旋结构稳定的多重因素[27],这些因素包括3条链条的紧密包装、链之间形成的氢键、广泛的水合网络以及高含量的脯氨酸和羟脯氨酸形成。由于三螺旋结构在225 nm 与198 nm 附近具有典型的圆二色光谱,通过观察胶原蛋白圆二色光谱在225 nm 处平均残余椭圆率随温度升高的变化,可以测定其热稳定性,求出的熔融温度是决定三螺旋结构稳定性的关键指标[28]。
图1 胶原蛋白结构[20](胶原蛋白一级结构展示了胶原蛋白主要由脯氨酸、甘氨酸以及羟脯氨酸等氨基酸构成;二级结构则展示了脯氨酸、甘氨酸以及羟脯氨酸等氨基酸通过α螺旋使胶原蛋白二级结构趋于稳定;三级结构展示了3条α链经过左手螺旋构象形成原胶原)Fig. 1 Structure of collagen[20](The primary structure of collagen shows that collagen is mainly composed of amino acids such as proline, glycine and hydroxyproline. The secondary structure shows that amino acids such as proline, glycine and hydroxyproline stabilize the secondary structure of collagen through α‑helix. The tertiary structure shows that three α‑chains passing through the left‑hand helical conformation form procollagen.)
1.2 胶原蛋白类别
胶原蛋白作为最丰富的动物蛋白,至今已发现28 种类型[23,29‑30](表1),而根据胶原蛋白所形成具有不同活性的形态结构可将胶原蛋白类型大致分为纤维性胶原蛋白(Ⅰ、Ⅱ、Ⅲ、Ⅴ、Ⅺ、ⅩⅪ、ⅩⅩⅦ型)与非纤维性胶原蛋白(Ⅳ、Ⅵ、Ⅶ、Ⅷ、Ⅸ、Ⅻ、ⅩⅢ、ⅩⅣ、ⅩⅤ、ⅩⅥ、ⅩⅦ、ⅩⅧ、ⅩⅨ、ⅩⅩ、ⅩⅪ、ⅩⅫ、ⅩⅩⅢ、ⅩⅩⅣ、ⅩⅩⅤ、ⅩⅩⅥ、ⅩⅩⅦ、ⅩⅩⅧ型)。其中非纤维性胶原蛋白可分为网状胶原蛋白、珠状丝状胶原蛋白、锚定纤维蛋白、膜蛋白以及multiplexins 胶原蛋白[30‑32]。纤维性胶原蛋白中Ⅰ型、Ⅱ型、Ⅲ型胶原蛋白占人体胶原蛋白的80%~90%[15,29]。Ⅰ型胶原蛋白作为人体中最常见的胶原蛋白,主要分布在皮肤、肌腱和骨骼中,Ⅱ型主要分布在软骨中,Ⅲ型主要分布在皮肤和血管系统中[33]。同时,纤维性胶原蛋白(Ⅰ、Ⅱ、Ⅲ型等)中Gly‑Xaa‑Yaa 结构不间断重复形成稳定而又紧密的结构,而所有非纤维型胶原蛋白如Ⅳ型、Ⅶ型和Ⅸ型中Gly‑Xaa‑Yaa均含有一个或多个中断[34],在这些中断的序列中常常形成灵活的链条,使非纤维性胶原蛋白完成特定功能[30]。虽然驱动胶原蛋白空间的组织机制可能涉及细胞结构与组织机械架构,但胶原蛋白链的氨基酸序列存储了胶原蛋白组装成原纤维和网络的基本信息[35‑38]。
表1 胶原蛋白类型、分布及功能[23,29‑30]Table 1 Collagen type, distribution and function[23,29‑30]
部分胶原蛋白三螺旋结构是由3条相同的α链组成,称为同源三聚体型,如Ⅱ型胶原蛋白与Ⅲ型胶原蛋白均属于同源三聚体型。而动物含量最丰富的Ⅰ型胶原蛋白是由两条不同的α链形成异源三聚体(α1[Ⅰ]2α2[Ⅰ])。胶原蛋白的合成总是伴随着与三螺旋结构密切联系的非胶原蛋白结构域,这可能对于胶原蛋白三聚体化、链配位或生物相互作用具有重要作用[39]。胶原蛋白合成过程中,这些非胶原蛋白结构域一部分沉积保留在细胞外基质中,另一部分则可能被水解切割并表达功能[40]。
1.3 胶原蛋白生物合成机制
胶原蛋白的形成始于胶原蛋白编码基因通过转录、翻译等作用形成新生胶原蛋白α链(称为前α 链)(图2)[26,41],胶原蛋白前α 链在内质网中先后经历脯氨酸‑4‑羟化酶(P4H)与赖氨酸羟化酶(LH)的修饰作用,使Gly‑Xaa‑Yaa 中Yaa 位上的脯氨酸残基与赖氨酸残基分别羟基化,而一部分羟基化赖氨酸残基则进一步糖基化[1,41]。脯氨酸羟基化和赖氨酸羟基化分别是实现三螺旋结构的稳定性和细胞外成熟胶原交联的必需步骤。若新生胶原蛋白 α 链羟基化出现畸形,形成的不良胶原蛋白三螺旋结构将在细胞内堆积,导致蛋白质折叠和内质网应激反应[42‑45]。除了P4H 与LH 作用外,前胶原蛋白α 链还需要脯氨酸‑3‑羟化酶(P3H)进行修饰。随后,3 条胶原蛋白前α 链的C端前肽在内质网膜凝集素样分子伴侣、钙联蛋白和内质网氧化还原酶PDI的协同作用下形成的二硫键[46‑49],并将胶原蛋白α 单链三聚体化,形成三螺旋构象,这种构象从C 端一直持续到N 端[43]。同时,胶原蛋白特异性分子伴侣HSP47 与三螺旋前胶原蛋白相互作用,防止前胶原蛋白局部展开和聚集[26]。经胶原蛋白特异性分子伴侣HSP47 作用后,前胶原蛋白被内质网出口TANGO1 识别,运输到高尔基体中。在高尔基体中,HSP47 从前胶原蛋白解离,并通过KDEL(REDL)受体返回内质网中。同时,高尔基体将前胶原蛋白运送分泌到细胞外基质,通过N端酶与C端酶的共同作用将前胶原蛋白多余N端与C端前肽进行切除,形成完整的胶原蛋白分子[50]。
图2 胶原蛋白合成机制图[26,41]P-脯氨酸残基;K-赖氨酸残基;P4H-脯氨酰4‑羟化酶;LH-赖氨酰羟化酶;P3H1-脯氨酰3‑羟化酶;HSP47-热休克蛋白47;PDI-二硫异构酶;FKPB65-免疫亲蛋白;PNP-原胶原N端酶;PCP-原胶原C端酶(首先胶原蛋白 α 链经内质网中P4H 酶以及LH 酶的作用下实现羟基化,随后,3 条胶原蛋白α 单链的C 端前肽在内质网膜凝集素样分子伴侣、钙联蛋白和内质网氧化还原酶PDI的协同作用下形成二硫键。HSP47能有效防止前胶原蛋白局部展开和聚集形成。最后,前胶原蛋白经高尔基体运送至细胞质基质利用N端酶与C端酶将多余N端与C端进行切除,形成完整的胶原蛋白结构)Fig. 2 Mechanism of collagen synthesis[26,41]P-proline residue; K-lysine residue; P4H-prolyl 4‑hydroxylase; LH-lysyl hydroxylase; P3H1-prolyl 3‑hydroxylase; HSP47-heat shock protein 47; PDI-disulfide isomerase; FKPB65-immunophilic proteins; PNP-procollagen N protease; PCP-procollagen C protease(Firstly, collagen genes form collagen α‑chains through transcription and translation, and secondly, under the action of P4H enzymes and LH enzymes in the endoplasmic reticulum, collagen α‑chain is hydroxylated. Subsequently, three collagen α single‑stranded C‑terminal propeptides form disulfide bonds under the synergistic action of endoplasmic reticulum lectin‑like chaperones, calcepiprotein, and endoplasmic reticulum oxidoreductase PDI. HSP47 effectively prevents the formation of local expansion and aggregation of pre‑collagen. Finally, the cytoplasmic matrix of the procollagen is transported by the Golgi apparatus and the excess N‑terminal and C‑terminus of the precollagen are excised by N‑terminal enzymes and C‑terminal enzymes to form a complete collagen structure.)
2 重组胶原蛋白表达体系
随着分子生物技术的迅猛发展,蛋白表达技术越来越成熟与规范,科学研究者逐渐将重心从研究动物源性胶原蛋白转移到重组胶原蛋白表达上[51‑52]。重组胶原蛋白的表达体系主要包括原核生物(主要为大肠杆菌)、酵母、植物、杆状病毒、哺乳动物细胞表达体系[53‑57]。现阶段表达体系中以大肠杆菌、酵母为主,但高效的大肠杆菌、酵母等表达体系缺乏动物细胞中胶原蛋白翻译后修饰,需要添加相对应的重组酶。而植物、杆状病毒、哺乳动物细胞表达体系所产生胶原蛋白含量虽然远低于大肠杆菌、酵母体系,但具有完整的三螺旋结构和较好的热稳定性(表2)。
表2 不同表达体系产生胶原蛋白含量及种类Table 2 Content and types of collagen produced by different expression systems
不同重组胶原蛋白表达体系表达胶原蛋白所需成本仍有比较大的区别(表3),植物表达体系因其具备光合作用自生产能力,其表达胶原蛋白成本相对较低;大肠杆菌以及酵母虽然具备一定发酵成本,但由于其表达产量较高,表达单位胶原蛋白所需成本也较低,但表达的胶原蛋白缺乏羟基化及相应活性;昆虫杆状病毒表达体系由于其表达量少,生产周期长,因此其表达单位胶原蛋白成本较高;哺乳动物细胞表达体系属于高级重组表达体系,由于其表达体系复杂,培养要求高,因此其表达单位胶原蛋白的成本也较高。
表3 不同表达体系生产胶原蛋白成本及优缺点Table 3 Costs, advantages and disadvantages of collagen production in different expression systems
2.1 大肠杆菌表达体系
大肠杆菌表达体系由于其遗传背景清晰、发酵成本较低、生产周期短、效率高等优点,已被用来大规模制造外源蛋白,但大肠杆菌表达体系同样具有产生胶原蛋白缺乏羟基化过程的缺点。大肠杆菌表达体系具备细菌胶原蛋白的出现为利用大肠杆菌生产重组胶原蛋白提供了新的机遇。常见的载体主要包括pGE、pET 系列[79]。虽然大肠杆菌在表达重组胶原蛋白过程中通常缺少羟基化过程,但仍然能产生较为稳定的三螺旋胶原蛋白结构[80]。
起初,Yin等[58]研究了52个重复肽(GAPGAP GSQGAPGLQ)组成的胶原蛋白样聚合物CLP3.1‑his在大肠杆菌表达情况,同时比较了不同启动子(热诱导启动子、T7 启动子和T7lac 启动子)和不同抑制强度基础转录的大肠杆菌菌株(BL21、BL21(DE3)和BL21(DE3)[pLysS])对聚合物CLP3.1‑his 产量的影响,结果表明,含T7 启动子的BL21(DE3)[pLysS]菌株与含T7lac 启动子的BL21(DE3)菌株产生的CLP3.1‑his 含量大于细胞总蛋白的40%,表达量在100~200 mg/L。这项研究为后续重组胶原蛋白的大肠杆菌表达体系提供了宝贵的理论与实践基础,发现的这两种菌株有望用于大规模的重组胶原蛋白生产。随后,常海燕[59]通过将人源性Ⅱ型胶原蛋白cDNA 重组到大肠杆菌内,考察发酵因素对分批‑补料培养生产类人源性Ⅱ型胶原蛋白的影响,研究发现当培养温度为34 ℃、pH 为6.5、溶氧浓度为20%、比生长速率为0.20~0.25 h-1以及诱导时间控制在细胞对数生长中后期时,大肠杆菌发酵产生类人胶原蛋白Ⅱ型含量最多,细胞密度最大,最高可产生13.2 g/L 类胶原蛋白Ⅱ型,重组类人胶原蛋Ⅱ型实现了产业化,为医药领域提供了更优质胶原蛋白产品。近几年来,重组胶原蛋白已经逐步应用到化妆品行业,公众对重组胶原蛋白生物安全性要求越来越高。杨晶等[60]构建了重组类人Ⅰ型胶原蛋白基因的原核表达载体pET28a‑rhC,将其转入大肠杆菌BL21(DE3)进行诱导表达,获得分子量约为40 kDa、表达量为520 mg/L 的重组蛋白。DPPH 与MTT 试验表明该重组胶原蛋白具有一定抗氧化性,能有效促进小鼠纤维细胞3T3细胞的增殖。该重组蛋白虽然不具备完整的三螺旋结构,但可作为护肤品添加剂应用于化妆品行业,也可作为促进伤口愈合止血材料应用于医疗行业。
由于大肠杆菌表达体系缺乏使胶原蛋白三螺旋结构稳定的羟基化酶,因此胶原蛋白在大肠杆菌大规模化生产遇到了挑战[41]。此外,未羟基化胶原蛋白相较于天然羟基化胶原蛋白的Tm值低10 ℃,对于使用大肠杆菌等表达体系高效表达存在重大障碍[40]。这种挑战可以通过添加P4H 基因以及相应胶原蛋白基因来解决。Rutschman 等[61]利用人Ⅲ型部分胶原蛋白编码基因(COL3A1)与病毒源的赖氨酰羟化酶L230 基因和脯氨酸羟化酶L593 基因在大肠杆菌中共表达,获得了与人体胶原蛋白羟基化相似的胶原蛋白,该胶原蛋白具有一定的三螺旋结构和较好的热稳定性。同时,Liu等[62]利用炭疽杆菌P4H 基因与大肠杆菌中的胶原蛋白基因共表达,并对其在5L 发酵罐中进行分批补料发酵,获得了产量为0.8 g/L 的羟基化胶原蛋白,并提高了重组胶原蛋白的生物相容性,为生物材料工程应用提供了一种富有前景的材料。
2.2 酵母表达体系
酵母作为真核生物,可对分泌重组蛋白进行修饰。与动物表达体系不同的是,酵母产生重组蛋白不含病原体、病毒包涵体或者热源,具有较高的安全性,发酵成本较低。同时以酵母为基础的生产工艺能满足重组蛋白质高效批量生产的要求,产量多在克/升BMM 培养基范围之内[64,81]。但是利用酵母表达体系产生胶原蛋白大多为同源性胶原蛋白,生产异源性胶原蛋白较为困难。至今为止,研究者已开发了多种酵母为宿主的表达体系,如毕赤酵母、汉逊酵母以及啤酒酵母等[10],其中毕赤酵母作为应用最广泛的酵母种类,与其他酵母相比,所翻译加工的重组胶原蛋白具有二硫键、糖基化、蛋白水解过程等优势特征[82‑84]。
起初,Vuorela等[63]研究了胶原蛋白脯氨酸‑4‑羟化酶在毕赤酵母表达载体PAO815 与PARG815中的表达,通过将胶原蛋白多肽链引入表达载体与脯氨酸‑4‑羟化酶共表达,结果发现脯氨酸‑4‑羟化酶表达量增加,生产的羟基化Ⅲ型胶原蛋白含量高达2.15 g/kg,这表明稳定的脯氨酰基4‑羟化酶的产生需要胶原蛋白的表达,而稳定的胶原蛋白的组装也需要酶的表达,研究结果为毕赤酵母高产量表达提供了新的路径。高力虎[64]从工艺优化的角度出发,通过甲醇诱导毕赤酵母菌株GS115高效表达了分子量为112 kDa 的重组类人胶原蛋白Ⅲ型,发现了最佳诱导酵母菌株GS115 表达的条件,即甲醇添加量为1.5%、初始菌浓度为3.0 OD6oo/mL、收获时间为60 h、初始pH 为6.6 时,所获得重组类人胶原蛋白Ⅲ型表达量可达60.1 mg/L。虽然重组类人胶原蛋白Ⅲ型不具备三螺旋结构,活性较差,但该工艺为实现酵母工程发酵法制备类胶原蛋白作了有益的探索。随后几年,Wang 等[65]利用酿酒酵母α‑交配因子prepro信号分泌表达了重组人全长成熟胶原蛋白α1[Ⅲ](rhCOL3A1)链,其理论分子量可达95.344 kDa,发现当混合碳在0.8(甘油/甲醇)比例下,诱导rhCOL3A1 达到最高产率(1.27 g/L)的时间可大幅缩短50%。该研究建立了一种有效的混合发酵策略,为大规模生产全长成熟rhCOL3A1 提供一种省时有效的新策略。到2017年,西北大学范代娣团队[66]通过对毕赤酵母生长阶段的BMGY 培养基进行优化,发现当酵母提取物为1.13%、蛋白胨为1.61%、甘油为0.86%比例时,在BMGY 培养基条件下培养12 h,生长阶段中毕赤酵母的菌重量增加26%,所得重组类Ⅲ型胶原蛋白含量增至4.7 g/L,该胶原蛋白对因乙酸灼伤的大鼠胃黏膜有较好的修复作用。
虽然酵母工程菌能实现重组胶原蛋白羟基化的过程,但产生的重组胶原蛋白多为同源三聚体(Ⅱ、Ⅲ型),对于异源三聚体(如Ⅰ型)的生产较为困难。而Ⅰ型胶原蛋白作为身体中分布最广的胶原蛋白,其生产具有重要意义。因此,实现异源型胶原蛋白在酵母工程菌中的表达成为一项重要技术。2019 年,侯增淼等[67]成功利用人Ⅰ型胶原蛋白Gly‑Xaa‑Yaa 序列搭建了pPIC9K‑COL 表达载体,并通过毕赤酵母工程菌发酵,最终获得纯度大于95%、表达量高达4.5 g/L 的重组人Ⅰ型胶原蛋白,扫描电镜和小鼠成纤维细胞毒性试验表明确定,该蛋白具有良好的多孔纤维结构与细胞相容性。同时,该重组人Ⅰ型胶原蛋白的高发酵产量表达说明酵母工程菌具备生产异源三聚体的条件,这为实现重组人Ⅰ型胶原蛋白工业化以及胶原蛋白生物医药材料产业化提供了可能。
2.3 植物表达体系
植物表达体系已经成为分子医药的核心部分,由于所生产的抗体、疫苗可规模化、生产周期短、成本低、安全性高的优点,植物表达体系越来越受到大众的喜爱[85]。植物表达体系在蛋白提取和纯化技术及工艺的持续进步,下游加工成本大幅度降低的背景下,所产生的蛋白质含量与微生物和动物表达体系所产生的蛋白相比不再呈现数量级的差异[83]。但是,利用植物表达体系生产胶原蛋白与其他体系相比,仍具有产量较低、产能不足的缺点。
起初,Ruggiero 等[68]在2000 年利用烟草植物作为一种新的表达方式生产人类同型三聚体Ⅰ型胶原蛋白,通过将编码人Ⅰ型胶原蛋白proα1[Ⅰ]链连接到二元质粒pBIOC21,使烟草中重组人Ⅰ型胶原蛋白链以二硫键合的形式表达,表达量最高可达100 mg/kg 鲜叶,并具有稳定的同型三聚体三螺旋结构。该研究虽然没有实现胶原蛋白羟基化,但为实现重组胶原蛋白在烟草中的表达提供了可能性,也为该团队后续研究提供了丰富的经验与理论基础。随后两年,团队人员Merle 等[69]在此基础上,改进了烟草表达系统,利用瞬时表达技术成功将烟草植物与人Ⅰ型胶原蛋白和P4H 酶共同转化,成功生产了重组羟基化同型三聚体胶原蛋白,表达量稳定在50~100 mg/kg 鲜叶。该研究证明了通过向烟草嵌合动物外源P4H 酶,能使生产的重组人Ⅰ型胶原蛋白热稳定性提高到37 ℃,提高产生胶原蛋白的质量。同时,该实验首次在烟草中实现了农杆菌介导的瞬时表达体系,为植物瞬时表达系统的发展和广泛应用提供了宝贵的经验。
此后,重组胶原蛋白生产的植物表达体系发展迅速,2009 年以色列再生医学公司CollPlant[70]成功将编码人Ⅰ型胶原蛋白α1 链、α2 链基因、P4H 基因、LH 基因以及靶向液泡蛋白基因在烟草体内实现共表达,生成的重组人Ⅰ型胶原蛋白表达量高达200 mg/kg 鲜叶,占烟草植物总可溶性蛋白的2%。与植物细胞核中靶向蛋白质表达占总可溶性蛋白的0.1%~1%相比,产量得到显著提高,该公司也成为第一家成功开发出有效表达人体胶原蛋白植物平台的公司,拓宽了重组人胶原蛋白在再生医药中的潜在应用。与此同时,Xu等[71]研发了单独表达人Ⅰ型胶原蛋白基因的玉米种子与同时表达人Ⅰ型胶原蛋白基因和P4H 基因的玉米种子,虽然同时表达人Ⅰ型胶原蛋白基因和P4H基因玉米种子中重组胶原蛋白含量(4 mg/kg)比单独表达Ⅰ型胶原蛋白基因的玉米种子重组胶原蛋白含量(12 mg/kg)低,但高分辨率质谱(HRMS)分析表明,同时表达玉米源性重组Ⅰ型胶原蛋白的羟脯氨酸含量为18.11%,与酵母性重组Ⅰ型胶原蛋白的羟脯氨酸含量的17.47%和人类原生Ⅰ型胶原蛋白的羟脯氨酸含量14.59%相当。与单独表达Ⅰ型胶原蛋白基因的玉米种子与相比,同时表达人Ⅰ型胶原蛋白基因和P4H 基因玉米种子热稳定性显著增强,充分显示了玉米具有生产充分修饰的外源蛋白的潜力。
2.4 昆虫杆状病毒表达体系
杆状病毒表达体系通常由杆状病毒作为表达载体感染昆虫、幼虫来获得重组真核蛋白,已经被证实可用于重组糖蛋白的生产[75]。杆状病毒表达体系与酵母表达体系相比,其背景干扰更低,进行翻译后处理能力更强,生产的外源蛋白具有较好的三螺旋结构[86‑87]。同时,蚕后腺细胞合成的特定蛋白质具有显著活性:每个腺体中的大约1000 个细胞在4 d 内可生产高达300 mg 的蛋白质[88],相当于每个细胞约80 μg/d 的蛋白质特定生产力。但是,利用昆虫杆状病毒产生胶原蛋白仍具有周期较长、产量较低的缺点。
Lambeig 等[72]通过构建杆状病毒载体并生成重组蛋白病毒,利用BaculoGold 转染试剂盒(Pharmingen)将重组pVL 构建物与改良的加州蜂核多角体病毒DNA 共转染到Sf9 昆虫细胞中,使Sf9 昆虫细胞表达包含大量4‑羟脯氨酸的具有三螺旋结构的人Ⅲ型前胶原蛋白α1 链。此外,在培养基加入抗坏血酸,将人Ⅲ型前胶原蛋白α1 链与人脯氨酰4‑羟化酶的α 和β 亚基共表达,可使胶原蛋白热稳定性从原先的32~34 ℃提高到40 ℃,并且在昆虫细胞体内可表达出具有三螺旋结构Ⅲ型前胶原蛋白(60 mg/L)和Ⅲ型胶原蛋白(40 mg/L)。该研究为表达不同用途与结构的胶原蛋白提供了一种可行的方法。1997年,Myllyharju等[89]研究结果表明,无论是野生型还是重组型飞蛾细胞,人Ⅰ型前胶原蛋白α链的表达均以稳定的α1[Ⅰ]2α2[Ⅰ]前胶原异型三聚体和α1[Ⅰ]3同型三聚体存在,其表达量大约在10~20 mg/L,热稳定性温度在42~43 ℃之间,但不能形成α2[Ⅰ]3同型三聚体。同时,若将proa1[Ⅰ]链的信号肽和N 端前肽的编码序列替换为前胶原蛋白α1[Ⅲ]链的编码序列,可以提高前胶原蛋白α1[Ⅰ]链的表达水平;若将前胶原蛋白α2[Ⅰ]链上的C 端前肽替换为前胶原蛋白α1[Ⅰ]链或Ⅲ型前胶原的α1[Ⅰ]链,可形成同型三聚体,但该分子中的α2[Ⅰ]链在22 ℃下1 h后被胃蛋白酶完全消化。
2003 年,Tomita 等[74]尝试通过转基因蚕来实现重组胶原蛋白的表达。首先,通过构建包含删除了C端前肽的人Ⅲ型前胶原蛋白迷你链、丝素轻链(L‑chain)和增强型绿色荧光蛋白(EGFP)的融合蛋白cDNA,并将该cDNA 整合到piggyBac 载体中,随后利用粒子枪将其转染蚕丝腺,使Ⅲ型前胶原蛋白分泌表达,每个蚕可以表达约70 mg融合蛋白质(纯度达95%),蛋白组分简单,便于后续重组胶原蛋白的纯化。该实验证明了蚕在工业大规模生产重组人胶原蛋白方面的可能性,证实转基因蚕是生产重组人胶原蛋白的可靠工具。随后经过13 年的努力,以蚕为宿主的重组胶原蛋白表达体系有了实质性发展。Qi 等[75]通过将含有人类Ⅱ型胶原蛋白cDNA 全部基因(4257 bp)的BmNPV‑pFBDM‑IM‑colII杆状病毒以注射的方式转染到五龄蚕幼虫背侧血腔。结果发现家蚕所表达出来的Ⅱ型胶原蛋白存在着单螺旋α 链与三螺旋α链结构,蛋白分子量分别为130 kDa 和300 kDa。每个幼虫蚕皮经镍柱色谱纯化可获得大约1 mg 的具有一定活性的人Ⅱ型胶原蛋白,显示出杆状病毒‑家蚕多基因表达系统可作为大规模生产表达活性人Ⅱ型胶原蛋白和其他复杂真核蛋白的方法。
2.5 哺乳动物细胞表达体系
哺乳动物细胞表达体系是利用哺乳动物细胞进行瞬时或稳定表达,或将重组蛋白基因整合到寄主基因组中构建的转基因动物反应器[18]。应用最广的细胞包括小鼠乳腺细胞、纤细肉瘤细胞和胚胎肾细胞[51,90‑91]。而转基因被誉为最有前途的动物细胞表达体系方法,该体系通过将cDNA转基因序列与乳腺特异性启动子结合,驱动牛乳腺中胶原蛋白的表达,重组胶原蛋白产量高达1 mg/mL[92]。转基因哺乳动物细胞表达出的重组胶原蛋白或许能通过转换等手段,弥补细胞表达体系产生的胶原蛋白不足的缺点,提高胶原蛋白产量。但哺乳动物细胞表达体系利用动物细胞直接产生蛋白质,对培养体系要求高,易受病毒感染。
Frischholz 等[76]通过人胚肾细胞系HEK293 和纤维肉瘤细胞系HT1080 稳定表达人α1[Ⅹ]全长cDNA,获得表观分子量为75 kDa、表达量为50 g/L的重组人Ⅹ型胶原蛋白,圆二色谱和胰蛋白酶/糜凝蛋白酶消化实验表明,重组人Ⅹ型胶原蛋白存在部分羟基化,热稳定性温度低至32 ℃,证明了该表达体系具有产生三螺旋结构重组Ⅹ型胶原的潜力。随后,Toman 等[77]构建了α s1 酪蛋白乳腺特异性启动子的转基因小鼠,该启动子与37 kb 的人α1[Ⅰ]前胶原结构基因,在乳汁中检测到高水平可溶性三聚体(高达8 g/L),并具有三螺旋结构。实验证实,小鼠乳腺能表达出较大分子的前胶原蛋白结构,能作为重组胶原蛋白大规模生产的高效表达体系。HEK293 作为良好的瞬时表达体系,近年来由于重组蛋白药物以及病毒的需要被研究学者广泛应用。曾斐鸿[78]通过研究重组Ⅳ‑α胶原蛋白在HEK293 细胞中的瞬时表达与稳定表达,发现HEK293细胞能通过瞬时表达体系稳定表达重组Ⅳ‑α 胶原蛋白,产量可高达6.28 mg/L。此外,HEK293 细胞在培养过程中存在铜离子效应与乳酸代谢因素影响,这为工艺优化提供了依据。
3 胶原蛋白应用及研究展望
在国际上通常以专利数来衡量国家或企业的创新程度,截至2021 年,美国已公开的胶原蛋白相关专利拥有量为24 846件,授权专利量6452件,全球排名第一;欧洲与日本分别以专利量9317 件和5046 件分列全球胶原蛋白专利数二、三位。由此可知,各国胶原蛋白市场竞争激烈,美国具备巨大的专利优势[93]。此外,胶原蛋白在国外已应用到人们生活的各个方面,如日本DHC、FANCL、UTU 等将胶原蛋白多肽应用到营养保健品以及美容上,其中光胶原营养保健品营业额可达15 亿美元[93]。法国罗赛洛公司在欧洲、南美、北美以及亚洲开设了胶原蛋白生产和研发中心,先后开发了糖果、口服液、胶囊剂、粉末冲剂等一系列高端产品。在国内以“创新”为国家战略,大力支持发展“生物基新材料”的大背景下,胶原蛋白吸引了越来越多参与者。国家食品药物监管总局数据显示,胶原蛋白相关的保健品已发展到191种,主要以胶囊、蛋白粉、片剂为主,含胶原蛋白的保健产品越来越受到大众的喜爱与欢迎。同时,胶原蛋白相关产品也将在医疗、护肤等领域迎来巨大的发展,预计未来市场规模将达到5000亿元。近几年我国胶原蛋白尤其是重组胶原蛋白产业得到飞速发展,2022 年更是被誉为重组胶原蛋白爆发元年。重组胶原蛋白在我国不仅得到国家政策的支持与相关资金的帮助,还有强大的技术支撑。我国在重组胶原蛋白技术方面,已经在世界上处于非常领先的地位。我国胶原蛋白产品种类丰富,但与此同时,我国胶原蛋白技术研发领域仍然存在安全风险高和生物活性低等问题。我国市场监督体系仍然需要进一步完善,以避免宣传效果与实际效果不符等现象。
重组胶原蛋白相较于传统动物提取胶原蛋白,具有更高亲水性、更高生物活性区域、更优异的抗氧化性能以及止血与促伤口愈合能力[18]。重组胶原蛋白自研发以来,在生物医药工程中得到广泛的应用[52,94‑96]。但是,由于机械强度有限,重组胶原蛋白主要应用于皮肤、眼科修复与心软骨工程修复等方面[97‑101]。
在皮肤治疗上,Zhao 等[102]发明的MTGase 交联重组类人胶原蛋白水凝胶具有良好的生物相容性,在动物实验中也证实该材料具备较低的毒性,有望作为水凝胶注射材料修复皮肤损伤。Pan等[103]通过反复冻融聚乙烯醇、重组人类胶原蛋白与羧甲基壳聚糖的混合液得到水凝胶敷料,该敷料与商业敷料相比,能显著促进全层皮肤伤口愈合,显示了其作为皮肤创面愈合创面敷料的巨大潜力。Woodly 等[98]通过获得重组人Ⅶ型胶原蛋白,将其迁移到隐性营养不良大疱性表皮松解症患者的真皮‑表皮交界处,有效预防皮肤起泡与糜烂的形成;Dong 等[104]在近年来证实将重组类人胶原蛋白与重组类人纤连蛋白联合治疗C57BL/6小鼠的急性伤口的效果高于两者单独治疗效果,为重组胶原在皮肤治疗修复方面开辟了崭新道路。McLaughlin等[105]通过将重组人Ⅰ型胶原蛋白与重组人Ⅲ型胶原蛋白制成可注射生物材料,将二者注入到心肌梗死增殖后期的小鼠身上,发现使用重组人Ⅰ型胶原蛋作为注射材料可以有效促进愈合环境、心肌细胞存活以及减少心肌病理性重塑,有利于实现心肌梗死后重塑。
在眼科治疗上,Fagerholm 等[106]利用重组胶原蛋白植入10 名圆锥角膜或角膜瘢痕患者,结果发现,所有患者泪膜得到恢复,基质细胞被招募到植入物中。还观察到患者神经再生和触摸敏感性恢复,与人类供体组织相比,两者都达到更高的程度。通过进一步优化,生物合成角膜植入物可以提供一种安全有效的替代人体组织植入的方法,帮助解决目前供体角膜短缺的问题。随后两年,Fagerholm 团队[107]开发了一种由碳二亚胺交联重组人胶原蛋白组成的无细胞植入物,通过植入眼角膜细胞实现了角膜再生,在4 年多的时间里,再生的新角膜稳定整合在一起,无排斥反应,也没有发生供体角膜患者所需的长期免疫抑制机制。实验证明,由碳二亚胺交联重组人胶原蛋白组成的无细胞植入物可以实现角膜的再生。因此,重组人胶原蛋白可作为良好的角膜修复植入物。
重组胶原蛋白与天然材料、合成材料、纳米材料相结合的方式,能有效增强机械强度,控制生物降解,有利于骨修复。Song等[108]基于类人胶原蛋白制备海绵状多孔水凝胶支架,该水凝胶可促进软骨细胞的增殖与黏附,增强软骨的修复,可作为软骨组织工程的支架;Li 等[73]将重组类人胶原蛋白与纳米羟基磷灰石相结合制备三维可降解多孔支架,可以承受(2.67±0.37)MPa 的压缩应力,该支架能够促进细胞黏附、均匀分布和丰富的GAG 合成,并保持天然软骨细胞形态。Chen等[109]利用重组类人胶原蛋白与骨诱导剂(BMP)的结合,能有效促进大面积骨缺损后大鼠的全面康复,同时还发现重组类胶原蛋白能有效维持成骨诱导和骨形成的骨诱导剂剂量的微小变化。同时,Fan 等[110]制备了重组类人胶原蛋白与纳米羟基磷灰石相结合的多孔复合支架,能有效提高骨组织工程的抗压程度,该支架的抗压强度和杨氏模量最大值分别为(2.97±0.19)MPa 和(43.03±6.17)MPa。
目前,重组胶原蛋白由于具有较好的生物相容性、更高的安全性以及对皮肤保湿修复明显的特点,在胶原蛋白家族中占有重要地位。但目前重组胶原蛋白发展仍存在一些问题。为此,本文对重组胶原蛋白未来的发展有几点展望:①现阶段重组胶原蛋白的表达体系主要以大肠杆菌和酵母为主,利用大肠杆菌以及酵母所产生重组胶原蛋白虽然产量高,但大多数不具备三螺旋结构,研究高等动植物的重组胶原蛋白表达体系的相关报道较少,未来可以考虑利用动植物等生产高产的具有三螺旋结构的重组人源性胶原蛋白;②国内研究重组胶原蛋白大多数以工业生产为主,表达机制基础研究较少,未来可深入研究重组胶原蛋白的不同表达机制,以期优化表达体系,提高表达产量和质量;③当前重组胶原蛋白纯化工艺与技术仍有较大的提升空间。随着分子生物学、蛋白质工程等的学科发展,重组胶原蛋白的研究将进一步深入,最终为生物医药领域提供更优质、更安全、更廉价的重组胶原蛋白原料。