外源蛋白在CHO细胞染色体上一个新位点的定点整合和稳定表达
2021-09-14胡湾湾丁学峰蔡燕飞段作营李华钟
胡湾湾,丁学峰,蔡燕飞,陈 蕴,段作营,金 坚,李华钟*
(1江南大学生物工程学院,无锡214122;2江南大学药学院,无锡214122)
中国仓鼠卵巢(Chinese hamster ovary,CHO)细胞是当前生物制药领域广泛使用的宿主细胞,生产了超过70%的治疗性蛋白质[1-2]。构建CHO工程细胞的传统方法是将外源基因随机整合至细胞基因组内,经过多轮筛选获得重组细胞系。此方法耗时费力,并且重组CHO细胞在生产过程中易丢失目的基因,导致非生产性细胞克隆逐渐增多,不利于生产及监管[3]。寻找稳定的整合位点,将外源基因定点整合至CHO细胞基因组的稳定位点,可有效缩短工程细胞株的构建周期并解决表达不稳定问题[4]。
初始位点的选择对后期的稳定表达起着决定性作用,经过多年的研究发现了一些潜在热点,如人纤维肉瘤细胞HT1080中14号染色体上的Ighg2基因、21号染色体上Gr ik1基因中第12个外显子—第13个内含子区域[5];CHO-S和HEK293T细胞的Hi pp11基因[6]等。虽然有许多关于稳定位点的研究,但是目前CHO细胞还未有稳定性高、产量理想的整合位点成功应用于工业生产[6]。因此,CHO细胞基因组稳定位点的寻找发现,并探索构建定点整合的稳定高产细胞株,对生物药的研发生产有着重大意义。
本研究团队前期敲除了Bcl-2家族中促凋亡Bak和Bax基因获得了抗凋亡特性明显提升的Bak-/Bax-CHO-K1细胞株(Ie3),应用慢病毒转染和染色体步移技术,发现了该细胞基因组内可表达示踪基因Zs green1的多个位点[7]。其中一个位点位于染色体NW_003614241.1上,在LOC103162683基因和Cob l l1基因之间,富含AT碱基。Cob ll1基因编码蛋白质cordon-bleu WH2 repeat protein like 1,主要与人慢性淋巴细胞白血病和形成胰岛素抵抗相关[8-11],而在CHO细胞中的功能尚不明确。
为探究NW_003614241.1位点稳定表达外源蛋白的能力,本研究首先观察了于NW_003614241.1第148 118 bp处随机整合Zsgreen1的细胞株(1g11)Zs green1基因表达情况。接着同样应用研究团队构建的抗凋亡Ie3细胞株[7,12-13],采用CRISPR/Cas9技术,在Ie3细胞染色体NW_003614241.1上148 052~148 157 bp区域定点整合增强绿色荧光蛋白EGFP,考察该位点的可编辑性和基因表达的稳定性;随后采用同样的整合方法在该位点定点整合了一个分泌蛋白——人血清白蛋白(HSA),检验此位点表达分泌性外源蛋白的稳定性,旨在探索CHO细胞染色体基因组中可定点整合稳定表达外源蛋白的新的位点。
1 材料
1.1试剂
无内毒素质粒小提中量试剂盒(北京天根生化科技有限公司);BbsⅠ-HF外切酶、T7核酸内切酶Ⅰ(美国NEB公司);T4 DNA连接酶(美国Pro‐mega公司);DMEM/F12培养基、胎牛血清(美国Gibco公司);1×无菌磷酸盐缓冲液(美国HyClone公司);CD CHO培养基粉末(美国Irvine公司);基因组DNA小量抽提试剂盒(碧云天生物技术研究所);L-谷氨酰胺、嘌呤霉素、SanPrep柱式PCR产物纯化试剂盒(上海生工生物工程有限公司);高保真DNA聚合酶(南京诺唯赞生物科技有限公司);蛋白酶K(北京索莱宝科技有限公司);Lipo‐fectamineTM3000试剂(美国Invitrogen公司);HSA抗体、山羊抗小鼠IgG(美国Abcam公司)。
1.2仪器
C1000 PCR仪、Mini-Protean核酸电泳仪(美国伯乐公司);倒置荧光显微镜(日本Nikon公司);FACSAria™Ⅲ流式分选仪(美国BD公司)。
1.3 质粒、菌株及细胞
密码子优化Cas9表达质粒(丹麦科技大学Dr.Kildegaard馈赠);CD513B-Cas9质粒、Psk-U6-gRNA表达质粒(复旦大学卢大儒课题组馈赠);大肠埃希菌E.coli DH5α感受态(北京天根生化科技有限公司);中国仓鼠卵巢细胞亚株CHO-K1(美国ATCC细胞库);Bak-/Bax-CHO-K1细胞株Ie3(本课题组前期构建[5]);表达绿色荧光报告基因Zs green1的Bak-/Bax-CHO-K1细胞株1g11(本课题组前期构建[5])。
2 方法
2.1 靶向质粒的构建和位点可编辑性验证
靶向识别序列sgRNA位于NW_003614241.1中148 052~148 157 bp范围内。首先构建sgRNA质粒,设计引物sgRNA-F和sgRNA-R在以下体系进行退火:sgRNA-F 4µL、sgRNA-R 4µL、NEBuf‐fer2 2µL、ddH2O 10µL,水浴95℃5 min,水浴锅中自然降至室温。Psk-U6-gRNA质粒载体37℃水浴经BbsⅠ-HF酶切4 h后,使用SanPrep柱式PCR产物纯化试剂盒回收载体酶切片段。最后,将退火后的sgRNA片段通过T4 DNA连接酶在16℃过夜条件下连接至Psk-U6-gRNA载体上。
将构建好的sgRNA质粒和CD513B-Cas9质粒按物质的量比1.8∶1用LipofectamineTM3000试剂转染进Ie3细胞。72 h后收集细胞,提取基因组用edit-F和edit-R进行PCR扩增,扩增产物用T7核酸内切酶Ⅰ酶切。将PCR扩增产物送苏州金唯智生物科技有限公司进一步测序验证。引物序列如表1所示。
Table 1 Primers sequence related to sgRNA
2.2 供体质粒构建和重组单克隆筛选
sgRNA 5′-ACCCTTGTGCCCCAAAGACAGGG-3′引导Cas9复合物切割位置在染色体NW_003614241.1第148 097 bp处,上下游的两段长度为600 bp的DNA序列分别为5′同源臂和3′同源臂。EGFP供体质粒和HSA供体质粒由苏州金唯智生物科技有限公司化学合成。EGFP供体质粒在5′同源臂和3′同源臂之间设计绿色荧光基因表达盒(hPGK-EGFP-SV40 polyA)和嘌呤霉素基因表达盒(EF1α-PuroR-SV40 polyA),在5′同源臂上游有红色荧光基因表达盒(CMV-mCherry-SV40 polyA)。HSA供体质粒在5′同源臂和3′同源臂之间设计包括人血清白蛋白表达盒(CMV-HSASV40 polyA)、绿色荧光基因表达盒(hPGK-EGFPSV40 polyA)和嘌呤霉素基因表达盒(EF1α-PuroRSV40 polyA),在5′同源臂上游有红色荧光基因表达盒(CMV-mCherry-SV40 polyA)。质粒图谱如图1所示。
Figure 1 Map of donor plasmidA:Map of EGFP donor plasmid;B:Map of HSA donor plasmid
基因敲入体系主要包括sgRNA质粒、Cas9质粒和供体质粒(EGFP质粒/HSA供体质粒)。sgRNA靶向识别位点,在Cas9复合物的作用下通过同源修复将供体质粒5′同源臂和3′同源臂之间的元件整合至细胞基因组内,红色荧光基因设计在5′同源臂外侧,用于排除随机整合事件,定点整合成功的目的细胞株会表达HSA蛋白、绿色荧光蛋白及嘌呤霉素,且不表达红色荧光蛋白,外源基因定点整合示意图见图2。
将构建好的sgRNA质粒、CD513B-Cas9质粒和供体质粒(EGFP质粒/HSA供体质粒)按物质的量比1.8∶1∶1.8,用LipofectamineTM3000试剂转染进Ie3细胞。培养48 h后,4µg/mL的嘌呤霉素压筛,对照组细胞全部死亡后,收集稳转细胞池,利用流式细胞仪进行单克隆分选,筛选只表达绿色荧光不表达红色荧光的单克隆。分选出的单克隆细胞培养6~7 d后,将能观察到细胞团的单克隆扩大培养。使用基因组DNA小量抽提试剂盒收集基因组作为后续PCR反应的模板DNA。5′同源臂侧PCR和3′同源臂侧PCR中间包含部分重叠片段,通过5′同源臂侧PCR和3′同源臂侧PCR鉴定目的基因的定点整合,通过全长PCR鉴定所获单克隆细胞是纯合子还是杂合子。
Figure 2 Schematic of exogenous gene site-specific integration into Bak-/Bax-CHO-K1 genomeA:Schematic of EGFP gene site-specific integration into Ie3 genome;B:Schematic of HSA gene site-specific integration into Ie3 genome
在重组细胞中PCR扩增验证5′同源臂侧靶位点定点整合外源蛋白EGFP或HSA的正反向引物分别为5′同源臂-F和5′同源臂-R;在重组细胞中PCR扩增验证3′同源臂侧靶位点定点整合外源基因EGFP的正反向引物分别为3′同源臂-EF和3′同源臂-R;在重组细胞中PCR扩增验证3′同源臂侧靶位点定点整合外源基因HSA的正反向引物分别为3′同源臂-HF和3′同源臂-R。引物所在位置如图2所示,引物序列如表2所示。
Table 2 Primers used for PCR
2.3 目的蛋白质检测
绿色荧光报告蛋白(ZsGreen1)和增强型绿色荧光蛋白(EGFP)组合使用倒置荧光显微镜和流式细胞仪检测,倒置荧光显微镜拍摄条件为曝光时间1 s,增益为2×,拍摄多个视野,使用Image J软件分析细胞平均荧光强度;流式细胞仪检测以Ie3为阴性对照,消化后的细胞用磷酸盐缓冲液重悬,上样量为1×104个,使用FlowJo软件分析细胞荧光强度。
人血清白蛋白(HSA)是血浆中含量最丰富的蛋白,约占血浆总蛋白的60%,作为血浆扩容剂用途广泛,且基于其无免疫原性、相对分子质量大及半衰期长等优点,多用于白蛋白融合技术延长其他激素、抗体等的半衰期[14]。本研究中HSA的检测使用Dot blot和Western blot方法,在细胞生长状态良好时接种2×105个细胞至6孔板内培养,培养24 h后待细胞汇合度至80%左右时换无血清培养基培养,48 h后收集细胞培养液上清,检测上清中HSA含量。Dot blot和Western blot所使用的一抗均为HSA抗体,二抗均为山羊抗小鼠IgG。
2.4 细胞培养
CHO细胞有贴壁和悬浮两种生长状态。贴壁培养使用完全培养基(DMEM/F12+10%胎牛血清)在T75培养瓶中置于37℃、5%CO2细胞培养箱静置培养。悬浮培养使用无血清的CD CHO培养基(L-谷氨酰胺8 mmol/L)在37℃、5%CO2、100 r/min恒温摇床振荡培养。
3 结 果
3.1 1g11细胞表达绿色荧光报告蛋白ZsGreen1的稳定性
为了验证NW_003614241.1位点的稳定性,首先检测慢病毒随机整合示踪基因Zsgreen1的Bak-/Bax-CHO-K1(1g11)细胞株在贴壁传代培养过程中的平均绿色荧光强度。重组细胞株的稳定性包括传代稳定性和冻存稳定性,传代稳定性为细胞连续传代培养过程中产物表达量的稳定性,冻存稳定性是指定期检查经液氮深低温冷冻的细胞复苏后产物表达量的稳定性[15]。本实验1g11细胞连续传代60代,其间每隔10代,使用倒置荧光显微镜观察、Image J软件分析细胞的平均荧光强度评价传代稳定性,同时进行细胞冻存。复苏第10、20、30、40、50和60代的细胞,使用流式细胞仪定量分析各代细胞的绿色荧光蛋白表达情况评价冻存稳定性。
图3-A为1g11细胞连续传代过程中荧光显微镜拍照结果,可以看出100%的细胞均发绿色荧光,图3-B为Image J软件分析荧光场照片中细胞的平均荧光亮度结果,显示不同代次的1g11细胞平均荧光强度虽有小幅度降低,但表达绿色荧光蛋白的水平基本一致,图3-C为FlowJo软件分析后的流式细胞仪检测结果,显示不同代次的1g11细胞荧光强度保持在45 000±2 200,与荧光显微镜结果基本一致,证明了1g11贴壁细胞的传代稳定性和冻存稳定性,初步证明NW_003614241.1位点的稳定性。
Figure 3 Expression of green fluorescent protein stability in 1g11 adherent cellsA:Bright field and fluorescence field photos of 1g11 adherent cells of different generations;B:Image J analyzes the average fluorescence mean intensity of cells in bright field photos;C:Green fluorescence intensity of 1g11 adherent cells of different generations
3.2 sgRNA编辑效率验证
检测sgRNA在Ie3细胞内的实际编辑情况,PCR扩增转染后细胞池的Cas9切割位点上下游的序列,用T7核酸内切酶Ⅰ对PCR产物酶切验证,如果细胞内发生了基因编辑事件,DNA会同源定向修复在切开缺口处发生错配,T7核酸内切酶Ⅰ可以识别并切割发生错配的DNA双链。PCR扩增片段大小为850 bp,切割后理论上会出现302 bp和547 bp两条条带,琼脂糖凝胶电泳图结果如图4-A所示,与理论结果相符,说明sgRNA可以在目标靶点有效编辑。使用Image J软件分析图4-A凝胶中条带的灰度值[14],得到sgRNA在Ie3细胞内的编辑效率为69.5%。
测序结果(图4-B)显示:在PAM序列上游的第4个碱基之后发生了明显的套峰,Cas9复合物识别的位置正是PAM序列上游的3,4碱基之间,这也证明了有细胞在目标靶点发生了基因编辑事件。
3.3 NW_003614241.1定点整合EGFP基因单克隆细胞株的筛选
根据所设计的敲入整合策略,成功发生定点整合事件的细胞株表达EGFP,表现为只发绿色荧光;发生随机整合事件的细胞株可能既表达EGFP也表达mCherry或只表达mCherry,表现为既发绿色荧光也发红色荧光或只发红光;未发生整合事件的细胞株不发荧光。收集转染后细胞用流式细胞仪进行分选的结果如图5所示,以Ie3细胞为阴性对照,只发绿色荧光的细胞为24.1%,分选只发绿色荧光的单克隆细胞。
提取单克隆细胞基因组进行PCR验证,如PCR产物的电泳图(图6-A,6-B)所示,5′同源臂和3′同源臂PCR产物分别在1 800 bp和3 200 bp附近,与预期相符,经5′同源臂侧PCR、3′同源臂侧PCR筛选出3株阳性单克隆株(EGFP-Ie3-19、EGFPIe3-48、EGFP-Ie3-51),PCR产物测序结果表明在NW_003614241.1上的第148 097 bp处敲入了完整EGFP。全长PCR结果(图6-C)表明获得的阳性单克隆细胞为杂合子,测序结果显示4 800 bp大小的条带包含定点整合完整的EGFP,2 200 bp大小的条带为未整合的染色体DNA,与预期相符。
Figure 4 Results of sgRNA editing efficiency verificationA:Agarose gel electrophoresis of T7E1 digests of PCR products of cell pool genome transfected with plasmid sgRNA and CD513B-Cas9,M:DL2000 marker,1:PCR products of Ie3 cell pool transfected with plasmid sgRNA and CD513B-Cas9,2:T7E1 digests PCR products of Ie3 cell pool transfected with plasmid sgRNA and CD513B-Cas9;B:Sequencing of genomic PCR products of Ie3 cells transfected with sgRNA and CD513B-Cas9 plasmid
3.4 定点整合EGFP基因单克隆细胞株的表达水平
对悬浮驯化成功的EGFP-Ie3-19、EGFP-Ie3-48、EGFP-Ie3-51 3株细胞,每隔15代用流式细胞仪检测绿色荧光蛋白表达情况,如图7所示3株单克隆均表达EGFP,荧光强度保持在10 000左右。3株单克隆之间绿色荧光强度也基本保持一致,细胞间个体差异较小。表明此位点可以定点整合稳定表达绿色荧光蛋白EGFP。
Figure 5 B ak-/Bax-CHO-K1 cell pool sorting results with targeted integration of EGFP
Figure 6 PCR verification results of B ak-/Bax-CHO-K1 cells with targeted integration of EGFP geneA:Results of 5′junction PCR(M:DL 2000 DNA Marker,1:EGFP-Ie3-19,2:EGFP-Ie3-48,3:EGFP-Ie3-51);B:Results of 3′junction PCR(M:DL 5000 DNA Marker,1:EGFP-Ie3-19,2:EGFP-Ie3-48,3:EGFP-Ie3-51);C:Results of out-out PCR(M:DL 5000 DNA Marker,1:EGFP-Ie3-19,2:EGFP-Ie3-48,3:EGFP-Ie3-51,4:Ie3(negative control))
Figure 7 Flow cytometric analysis results of Bak-/B ax-CHO-K1 cells with targeted integration of EGFP geneA:Green fluorescence intensity of EGFP-Ie3-19 cells of different generations;B:Green fluorescence intensity of EGFP-Ie3-48 cells of different gener‐ations;C:Green fluorescence intensity of EGFP-Ie3-51 cells of different generations;D:Comparison result of green fluorescence intensity among EGFP-Ie3-19,EGFP-Ie3-48 and EGFP-Ie3-51
3.5 NW_003614241.1定点整合表达人血清白蛋白HSA
利用CRISPR/Cas9技术将可分泌表达的人血清白蛋白HSA基因整合到Ie3细胞染色体的NW_003614241.1上的第148 097 bp处,经Dot blot筛选最终得到3株阳性克隆HSA-Ie3-4、HSA-Ie3-52和HSA-Ie3-61。通过PCR验证外源基因的整合情况,通过Western blot检测培养上清液中HSA的分泌表达情况,结果如图8所示。PCR产物的电泳图(图8-A,8-B,8-C)显示,5′同源臂和3′同源臂PCR产物分别在4 100 bp和5 500 bp附近,与预期相符;全长PCR产物在7 000 bp和2 200 bp附近均有条带,7 000 bp大小的条带包含定点整合的HSA基因,2 200 bp大小的条带则是Ie3染色体DNA,回收条带进行测序,结果与预期一致。Western blot实验结果(图8-D)显示在70 kD左右出现了目标条带,与HSA蛋白的68 kD一致,说明在HSA-Ie3-4、HSA-Ie3-52、HSA-Ie3-61 3个单克隆株中HSA基因得以定点整合和表达。
4 讨 论
Figure 8 PCR and Western blot detection of HSA gene expression on adherent cellsA:Results of 5′junction PCR(M:DL 5 000 DNA Marker,1:HSA-Ie3-4,2:HSA-Ie3-52,3:HSA-Ie3-61);B:Results of 3′junction PCR(M:DL 10 000 DNA Marker,1:HSA-Ie3-4,2:HSA-Ie3-52,3:HSA-Ie3-61);C:Results of out-out PCR(M:DL 10 000 DNA Marker,1:HSA-Ie3-4,2:HSAIe3-52,3:HSA-Ie3-61,4:Ie3(negative control));D:Western blot results of HSA gene expression in adherent cells(M:Molecular mass marker,1:HSA-Ie3-4,2:HSA-Ie3-52,3:HSA-Ie3-61,Exposure time 30 s)
近年来,关于如何解决CHO细胞表达外源蛋白的不稳定这一问题,研究人员已经进行了多方面的尝试。传统的随机整合方法,不能从根本上消除基因组的固有不稳定性及整合位点不稳定这两个因素,而寻找CHO细胞基因组内的稳定位点,将外源基因通过定点整合的方式整合至位置已知的位点[17],可以有效避免这一问题。初始位点的选择对后期的稳定表达起着决定性作用,理想的位点应具备稳定性强、适用度宽、表达量高等特性。
本课题组前期利用慢病毒转染及染色体步移技术发现的多个潜在稳定表达位点中,有的位点,Zsgreen1报告基因的表达受培养条件的制约,无血清培养条件下Zsgreen1表达水平大大降低;有的位点,序列中含有较多的未知碱基无法进行编辑[7],所以需要对每一潜在位点的可编辑性和表达外源蛋白的稳定性进行研究。
染色体NW_003614241.1上148 052~148 157 bp区域也是本课题组利用慢病毒转染及染色体步移技术发现的CHO细胞基因组内新的表达位点之一[7],经60代传代实验证明慢病毒整合的绿色荧光示踪基因Zsgreen1在贴壁1g11细胞中可以稳定表达。将EGFP基因用CRISPR/Cas9技术定点整合到抗凋亡Ie3细胞的上述位点的第148 097 bp处,在悬浮培养传代60代过程中EGFP可以稳定表达,说明该位点可以定点整合并稳定表达EGFP蛋白。将HSA基因用同样的方法定点整合到该位置,经检测HSA基因也可以稳定表达,说明该位点可以定点整合并稳定表达分泌蛋白。上述结果表明该位点有望是一个可定点整合表达外源蛋白的理想位点。
本研究所获得的成功定点整合到此位点的6株阳性单克隆均为杂合子,单拷贝的外源基因会影响表达水平。通过联合利用其他位点进行在多个位点定点整合同一外源基因,或者通过在该位点插入着陆垫,利用Bxb1重组酶系统在着陆垫上插入多拷贝,或者利用IRES序列将外源基因串连整合表达,都可能通过增加目的基因的拷贝数,有效提高外源基因的表达水平[18]。