APP下载

基于全基因组重测序策略对谷氨酸棒杆菌外源蛋白高产菌株相关基因的挖掘及初步验证

2022-01-13孟丽虹刘秀霞杨艳坤白仲虎

食品与发酵工业 2021年24期
关键词:谷氨酸外源质粒

孟丽虹,刘秀霞*,杨艳坤,白仲虎

1(江南大学,工业生物技术教育部重点实验室,江苏 无锡,214122)2(江南大学,粮食发酵工艺与技术国家工程实验室,江苏 无锡,214122)3(江南大学 生物工程学院,江苏 无锡,214122)

谷氨酸棒杆菌(Corynebacteriumglutamicum)是食品安全级菌株,被广泛用于生产许多有价值的氨基酸和副产物[1]。由于其具有完整的分泌途径,无内毒素且可高密度发酵等特性,近年来已发展成为能够生成多种外源蛋白的卓越表达系统。然而,由于原始菌株的自然局限性,仍然存在一些缺点,如产量低,可用遗传操作工具匮乏等[2]。随着基因工程技术以及合成生物学技术的广泛应用,人们有了更多改造宿主的方法,从而提高目标产物的产量,此系统已成为实验室研究及商业生产重组蛋白的热点[3-4]。

目前,随着基因组学和蛋白质组学的深入研究,为挖掘相关目标信息提供了分析手段。目前大多数外源蛋白都依赖微生物表达系统进行生产[5]。然而,由于底盘细胞代谢机制的复杂性,使理性改造存在一定的困难。因此从表型差异入手,结合全基因组重测序,可以进一步分析差异表型相关的候选基因[6],为高效宿主的开发提供方向。目前,分析基因组区域和区域内变化的基因已成为一种挖掘表型差异相关候选基因的有效方法[7]。例如,ZHANG等[8]在全基因组水平筛选并鉴定了15种梨火疫菌的Sec依赖分泌蛋白酶。外源蛋白表达是一个复杂的耗能过程,涉及转录、翻译、运输、分泌等多个过程,受多基因调控,路径复杂。因此基于表型差异,采用组学的方法挖掘不同菌株之间的差异基因,有望为底盘细胞的优化改造找到潜在的靶点,最终达到提升宿主蛋白表达能力的目的。

该研究基于全基因组重测序策略,对谷氨酸棒杆菌外源蛋白高产突变菌株进行单核苷酸多态性(single-nucleotide polymorphisms, SNP)挖掘,并结合生物信息学分析SNP基因的结构极其功能。进一步通过构建SNP基因过表达和敲除菌株,评估这些基因表达变化对菌株生长以及外源蛋白增强型绿色荧光蛋白(enhanced green fluorescence protein, EGFP)和人重组特立帕肽(recombinant human teriparatide, rtPTH)表达的影响。最后利用SWISS-MODEL软件对基因GL002370编码的蛋白进行建模,并分析了蛋白的功能。

1 材料与方法

1.1 菌株与培养条件

在该研究所用的菌株见表1。大肠杆菌JM109,谷氨酸棒杆菌原始菌株和谷氨酸棒杆菌高产蛋白突变菌株(经常温室压等离子体诱变所得)均由本实验室保存。大肠杆菌JM109用于质粒构建,谷氨酸棒杆菌是宿主改造和表达重组蛋白的底盘细胞。在LB培养基中于37 ℃、200 r/min条件下培养大肠杆菌,谷氨酸棒杆菌菌株在LBB培养基(色氨酸10 g/L,酵母提取物5 g/L,NaCl 10 g/L,脑心浸出液10 g/L)中于30 ℃、220 r/min培养。大肠杆菌和谷氨酸棒杆菌培养物中使用的卡那霉素和氯霉素质量浓度分别为30、15 μg/mL。

表1 本研究所用菌株Table 1 Strains used in this study

1.2 全基因组重测序分析

将诱变筛选得到的菌株进行全基因组重测序。分别准备50 mL 菌液离心样品(OD600= 10)送至华大基因公司测序。其在北京基因组研究所分别使用PacBio RS Ⅱ平台和Illumina HiSeq 4000平台对突变菌株进行了重测序,以检测潜在的SNP位点。

1.3 蛋白结构分析

利用NCBI数据库,进行Protein BLAST分析,查找相似性最高的同源序列,获得FASTA文件。利用CD-search查找蛋白保守结构域。

1.4 质粒

在该研究所用的质粒见表2。组成型质粒con-pEC-XK99E,用作谷氨酸棒杆菌中基因过表达载体;质粒pK18 mobsacB为谷氨酸棒杆菌基因敲除载体;质粒pXMJ19为谷氨酸棒杆菌中外源蛋白表达载体。上述3个质粒均由实验室保存。

表2 本研究所用质粒Table 2 Plasmids used in this study

1.4.1 过表达质粒构建

根据全基因组重测序数据,分析突变位点。根据谷氨酸棒杆菌基因组序列设计扩增突变基因片段的引物。分别扩增基因片段,同时用EcoR Ⅰ和PstⅠ对质粒con-pEC-XK99E进行酶切。用ABclonal同源同组连接基因片段和酶切载体,连接产物转化大肠杆菌感受态。培养出的转化子采用PCR方法验证。正确的转化子于LB液体培养中培养以提取阳性克隆质粒并测序,测序正确的过表达质粒命名为con-pEC-gene。

1.4.2 敲除质粒构建

以谷氨酸棒杆菌CGMCC1.15647基因组中待敲除的突变基因上下游750 bp为模板设计引物。用引物Ko-gene-LF和Ko-gene-LR扩增上游同源臂,Ko-gene-RF和Ko-gene-RR扩增下游同源臂,引物Ko-gene-LF和Ko-gene-RR分别引入同源序列,便于和pK18 mobsacB载体进行同源重组。用EcoRⅠ和Hind Ⅲ对质粒pK18 mobsacB进行酶切。后续操作同1.3.1,构建的敲除质粒命名为pK18-gene。

1.5 过表达和敲除菌株构建

1.5.1 过表达菌株构建

测序正确的过表达质粒con-pEC-gene分别通过电转化的方法导入谷氨酸棒杆菌感受态,30 ℃培养24 h。培养的单菌落进行PCR验证,构建SNP基因过表达重组菌株。

1.5.2 敲除菌株构建

敲除载体pK18-gene分别电转化导入谷氨酸棒杆菌中。阴性对照为野生型菌株。30 ℃培养24 h后进行蔗糖敏感性筛选,长出的单菌落同时点在LBB+K和LBB+K+蔗糖的固体平板上。12 h后挑选在LBB+K上生长而LBB+K+蔗糖不长的单菌落,用LBB液体培养基过夜培养后转接到LBB+蔗糖液体培养基中培养12 h。取1 μL菌液在LBB+蔗糖固体平板上划线,长出的单菌落分别点在LBB和LBB+K固体平板上,挑选LBB板上长而LBB+K不长的单菌落进行PCR验证或测序,构建SNP基因敲除菌株。

1.6 生长曲线测定

分别将SNP重组菌株接种于10 mL的LBB培养基中于30 ℃、220 r/min培养,12 h后转接至100 mL的LBB培养基中,使初始OD600值为0.3。在30 ℃、220 r/min条件下培养36 h,一定时间取1次样,测定OD600值。

1.7 荧光强度测定

将诱导型质粒pbtac-HT-11-EGFP转化至构建的SNP重组菌株中,挑选单菌落于24孔板中(每孔含2 mL LBB培养基)。在30 ℃、220 r/min条件下培养12 h后,将20 μL菌液转接至新的24孔板中并在每孔加入2 μL IPTG(24 mg/mL),培养 24 h后测量荧光强度和OD600吸光值,计算单位荧光强度(FI/OD600)。

1.8 rtPTH外源蛋白表达和分析

选择有价值的外源蛋白rtPTH进行SNP过表达和敲除重组菌株的进一步分析。将质粒pXMJ19-rtPTH电转至over-2370和ko-973-974,后续操作同1.6。将rtPTH的发酵产物在12 000 r/min下离心1 min,并将上清液制成蛋白样品,进行SDS-PAGE分析。

1.9 SWISS-MODEL预测分析

利用SWISS-MODEL软件,输入蛋白序列,搜索以匹配相关模板,选择匹配性最高的模板,建立蛋白模型,并利用NCBI数据库分析蛋白功能。

2 结果与分析

2.1 突变菌株的全基因组重测序分析

将诱变菌株的全基因组重测序结果进行整理分析后,结果显示突变菌株中共有33个SNP和7个InDel。SNP包括位于编码序列(CDS)中的22个非同义突变和位于基因间区域中的11个其他突变。其中编码序列主要涉及5个基因(表3),除GL002370编码1种预测蛋白以外,GL000353,GL000477和GL002063编码的蛋白质分别具有氧化还原酶,核酸内切酶和酪氨酸重组酶活性,GL002761编码ATP依赖性Clp蛋白酶[9]。在位于GL000349~GL000350,GL000476~GL000477,GL000973~GL000974,GL002062~GL002063,GL002369~GL002370,GL002760~GL002761的基因间区域检测到突变。因此,这些突变可能是增加外源蛋白质产量的相关靶基因,但其具体功能仍不清楚,需要进一步研究以探索这些基因与其表型变化之间的关系。

表3 全基因组重测序突变位点分析Table 3 The analysis for genome resequencing mutation site

2.2 SNP基因编码蛋白的结构分析

从分析结果可知,SNP主要集中在GL000353,GL000477,GL002063,GL002370和GL002761这5个基因中,因此,该研究主要分析验证这5个基因对于外源蛋白表达量的影响。首先通过NCBI数据库分析了5个基因编码的蛋白的结构,结果如图1所示。GL000353编码的蛋白共311个氨基酸,是短链型脱氢酶/还原酶。它包含1个NADB结构域,该结构域存在于许多代谢途径的脱氢酶中,例如糖酵解和许多其他氧化还原酶[10]。GL000477编码5-甲基胞嘧啶特异性限制性核酸内切酶McrA,共340个氨基酸,它是典型的限制性修饰(RM)系统中的一种酶,该系统可保护宿主免受外源DNA的侵害[11]。McrA包含1个His-Asn-His (HNH)基序,这个基序的第1个氨基酸在HNH核酸酶中的重要催化功能[12]。GL002063编码特异性酪氨酸重组酶XerC,共315个氨基酸。Xer位点特异性重组系统可以把通过同源重组形成的二聚体染色体转化为单体,它的C末端结构域在核心位点结合,切割和重新连接DNA链,而N末端结构域在很大程度上负责与同源臂结合[13]。GL002370编码1个含有93个氨基酸的蛋白。GL002761编码具有分子伴侣活性和ATP结合亚基的ClpC蛋白酶,由925个氨基酸构成。此蛋白酶有2个Clp-N结构域,1个ClpB-D2-small结构域以及1个UVR结构域[14]。

图1 SNP基因编码的蛋白结构示意图Fig.1 Schematic diagram of the protein structures encoded by the SNP genes

2.3 SNP基因过表达和敲除重组菌株的构建

为了验证SNP基因对于外源蛋白表达的影响,首先构建了SNP基因的过表达和敲除重组菌株。将SNP基因过表达质粒con-pEC-gene电转入谷氨酸棒杆菌中,培养出的转化子进行PCR验证,结果如图2-a所示,成功构建SNP基因过表达菌株:over-353,over-477,over-2063,over-2370,over-2761。将最后培养的敲除菌株进行PCR验证,定点突变菌株进行测序。结果如图2-b和图2-c所示,成功敲除GL000353和GL002370,并且定点突变菌株测序正确。因此,成功构建了SNP基因敲除菌株:ko-353,ko-2370,ko-349-350,ko-476-477,ko-974-973。

a-SNP过表达菌株PCR验证(M:2 000 marker,1~5:over-353,over-477,over-2063,over-2370,over-2761菌株PCR验证);b-敲除GL000353菌株PCR验证(M:2 000 marker,1:阴性对照,2~4:GL000353敲除菌株);c-敲除GL002370菌株PCR验证(M:2 000 marker,1:阴性对照,2~7:GL002370敲除菌株)图2 SNP基因过表达和敲除菌株PCR验证Fig.2 The PCR verification of SNP genes overexpression and knockout strains

2.4 SNP基因过表达和敲除重组菌株生长曲线的测定

为了观察SNP基因的过表达和敲除是否对菌株的生长有影响,进行了生长曲线的测定。结果如图3所示,除了over-353,over-2761和ko-2370前期生长较为缓慢外,其余SNP基因的过表达和敲除对菌株的生长没有太大影响。

a-SNP基因过表达菌株生长曲线;b-SNP基因敲除菌株生长曲线图3 SNP基因过表达菌株和敲除菌株生长曲线Fig.3 Growth curve of SNP genes overexpression and knockout strains注:WT表示野生型(wild type)(下同)

2.5 SNP重组菌株对EGFP外源蛋白表达的影响

为了探究SNP基因重组菌株对于外源蛋白表达的影响,将EGFP作为报告蛋白以观察荧光蛋白表达量的变化。将质粒pbtac-HT-11-EGFP分别电转入SNP基因重组菌株,在多孔板中培养24 h后检测荧光值。结果如图4所示,在SNP过表达菌株中,除over-2761-EGFP的荧光值明显降低以外,其余菌株SNP过表达菌株的荧光值都增加,且over-2370-EGFP的荧光值最高。在SNP敲除菌株中,ko-2370-EGFP和ko-349-350-EGFP荧光值明显降低,而ko-973-974-EGFP的荧光值最高,其次是ko-353-EGFP,ko-476-477-EGFP。其中,over-2761-EGFP荧光值降低可能是GL002761编码的Clp蛋白酶将EGFP外源蛋白降解所致。ko-353-EGFP和over-353-EGFP荧光强度均比野生型(wild type,WT)的高,且前者比后者的提升幅度更明显,可能是由于过表达GL000353编码的脱氢酶/还原酶加快了整个菌株的能量代谢流,使荧光蛋白的表达增加,而敲除该脱氢酶/还原酶可能改变能量代谢的流向,使能量更多的用于外源蛋白的合成。over-477-EGFP,ko-476-477-EGFP和ko-973-974-EGFP均使荧光值增强,而GL000477和GL000974都编码5-甲基胞嘧啶特异性限制性核酸内切酶McrA,该蛋白与外源DNA的导入有关,对增强外源蛋白产量的机制还需要进一步研究。同样over-2370-EGFP显著增强了EGFP的表达,但其编码的蛋白未知,还需要进一步探究。因此,基因GL002370以及GL000974确实与提高蛋白表达产量密切相关。

a-SNP过表达菌株荧光值;b-SNP敲除菌株荧光值图4 SNP基因过表达和敲除菌株单位荧光强度Fig.4 Unit fluorescence intensity of SNP genes overexpression and knockout strains

2.6 SNP基因重组菌株对其他外源蛋白表达的影响

为了观察SNP基因重组菌株对其他外源蛋白是否具有同样的效果。分别选择上述研究中对EGFP表达量最具影响的2株重组菌,over-2370和ko-973-974。在这2株SNP重组菌株中表达有价值的外源蛋白rtPTH,以验证它们对其他外源蛋白表达量的影响。rhPTH是一种肽药物,包含1~34个N末端氨基酸,已用于治疗骨质疏松症[15]。该研究使用了新的融合标签Spy来促进rtPTH的稳定表达[16]。将质粒pXMJ19-rtPTH分别电导入over-2370和ko-973-974,构建over-2370-rtPTH和ko-973-974-rtPTH重组菌株。重组菌株分别诱导表达24 h后,结果如图5所示。Spy-rtPTH蛋白分子质量为20.8 kDa,over-2370-rtPTH和ko-973-974-rtPTH均具有比WT有更高的产量。因此,在分析的SNP中,GL002370以及GL000974编码的蛋白确实能够使外源蛋白表达量明显增加。

M-26610 marker,1-WT-rtPTH,2-ko-973-974-rtPTH,3-over-2370-rtPTH图5 rtPTH外源蛋白表达验证Fig.5 The verification for rtPTH heterologous protein expression

2.7 基因GL002370编码的蛋白预测分析

基于以上蛋白表达结果的分析,基因GL000974和GL002370编码的蛋白对提高外源蛋白产量影响较大,其中基因GL000974编码的蛋白功能已知,而GL002370编码的蛋白功能未知。因此分析了GL002370编码蛋白的结构和功能。结果如图6所示,经SWISS-MODEL分析,预测基因GL002370编码的蛋白与谷氨酸棒杆菌的硫氧还蛋白依赖性砷酸还原酶最为相似,为α-螺旋的同源二聚体结构。硫氧还蛋白依赖性砷酸还原酶(ArsC)属于砷酸盐还原酶的第二家族,该家族使用硫氧还蛋白作为电子供体,在生物砷解毒途径中起重要作用[17]。该家族在结构和功能上与低分子量蛋白质酪氨酸磷酸酶接近,并且具有磷酸酶活性。磷酸酶和激酶共同构成去磷酸化和磷酸化的调控系统,处于能量代谢的关键位置。而外源蛋白表达本身就是一个消耗大量能量的过程,因此推测这个基因可能影响蛋白生成的能量代谢,从而导致了外源蛋白产量的增加,但要明确over-2370影响蛋白产量的作用机理还需要进一步探究。

图6 SWISS-MODEL预测基因GL002370编码的蛋白结构图Fig.6 The GL002370 protein structure predicted by SWISS-MODEL

3 结论与讨论

在这项研究中,为了挖掘与蛋白表达相关的具体基因并获得高产外源蛋白的谷氨酸棒杆菌菌株。首先基于全基因组重测序策略,分析出与蛋白表达相关的靶基因,并利用NCBI数据库分析了蛋白的结构。其次构建了SNP基因过表达和敲除菌株,评价生长曲线以及SNP重组菌株中EGFP的表达水平。其中,SNP过表达菌株over-2370和ko-973-974使蛋白表达水平显著增强。此外,我们选择了有价值的外源蛋白rtPTH以验证SNP基因重组菌株对其他外源蛋白的适用性。最后利用SWISS-MODEL软件进行了基因GL002370编码的蛋白的建模,并分析了蛋白的功能。

但是,在研究过程中存在一些需要进一步研究的问题。首先,目前只研究了单基因过表达和一些基因敲除对于蛋白表达的影响,其他基因的敲除和多基因的组合情况有待进一步研究。其次,基因GL002370编码的具体蛋白以及导致蛋白产量增加的具体机制尚不明确,需要进一步深入研究。最后,提高外源蛋白产量除了宿主改造还有多个方面,例如优良的表达载体,表达元件等,可以探究不同组合之间的相互关系,以及对蛋白产量的影响[18-19]。这些研究都具有重要意义,要求研究人员进一步探索和发现新的目标。

猜你喜欢

谷氨酸外源质粒
全基因组测序后质粒的组装与鉴定研究进展*
具有外源输入的船舶横摇运动NARX神经网络预测
外源污染物对硬骨鱼甲状腺干扰作用机制的研究进展
中国环境科学研究院外源污染过程与控制研究室
mcr-1阳性类噬菌体质粒与F33∶A-∶B-质粒共整合形成的融合质粒的生物学特性分析
开发新方法追踪植物病害的全球传播(2020.6.7 iPlants)
外源钙对干旱胁迫下火棘种子萌发的影响
淫羊藿总黄酮对谷氨酸和咖啡因损伤PC12细胞的保护作用
N-月桂酰基谷氨酸盐性能的pH依赖性
问:如何鉴定谷氨酸能神经元