结核分枝杆菌FabG4的生物信息学分析及功能初探
2020-03-13杨赛丽谢婉莹刘仪牛宏红曹旭东袁俐
杨赛丽,谢婉莹,刘仪,牛宏红,曹旭东,袁俐
(石河子大学医学院病原生物学与免疫学教研室,新疆 石河子832000)
结核病是由结核分枝杆菌感染引起的慢性传染病,是导致死亡的十大原因之一。WHO发布的2019全球结核病报告中2018年全球有1000万人新感染结核病,据估计,全世界有 17 亿人(约全世界人口的 25%)存在潜伏性结核病感染面临发展为活动性结核病的风险。中国结核病死亡人数为3.7万,结核病死亡率为2.6/10万[1]。目前,新疆、西藏等医疗欠发达地区是我国结核病发病率最高的省份,发病率达到430人/10万人[2]。
结核分枝杆菌细胞壁具有独特的结构,含大量脂质,占细胞壁干重的60%以上,对于维持细胞的生存和繁殖有非常重要的作用,与细菌的抗药性及毒力密切相关。其细胞壁的核心结构由3种大分子组成,由外至内分别为分枝菌酸、聚阿拉伯半乳糖和肽聚糖。分枝菌酸是带有α-烷基侧链的β-羟基长链高分子疏水脂肪酸,是细胞壁的主要成分。FabG4属于FabGs家族(β-酮酰辅酶A还原酶),是结核分枝杆菌分枝菌酸合成反应中的关键酶,并且十分保守,能将氧代酰基ACP转化为羟基酰基ACP[3],推测 FabG4蛋白可能通过影响细胞壁分枝菌酸的合成而影响细胞壁对药物的渗透性,有望成为候选药物靶点。
在本实验中,作者利用生物信息学分析手段对结核分枝杆菌标准有毒株(H37Rv)的FabG4基因编码蛋白进行分析,预测FabG4蛋白的理化性质、二级和三级结构、T、B细胞优势抗原表位及与其相互作用的蛋白。构建耻垢分枝杆菌FabG4基因过表达菌株,绘制生长曲线。为进一步研究FabG4蛋白的功能、结核分枝杆菌靶向治疗和疫苗的研究提供理论依据。
1 材料与方法
1.1 实验材料
1.1.1 质粒和菌株
大肠杆菌(escherichiacoli,E.coli)DH5α、大肠埃希菌-分枝杆菌穿梭表达质粒PMV361由本实验室保存,野生型耻垢分枝杆菌mc2155,则由中国疾病预防控制中心传染病预防控制所万康林教授馈赠。
1.1.2 试剂
限制性内切酶EcorⅠ、HindⅢ购自TaKaRa公司;细菌基因组DNA提取试剂盒、质粒小提试剂盒、普通琼脂糖凝胶DNA回收试剂盒、2 XTaq PCR Master Mix购自北京 TIANGEN生物公司,7H9粉末、OADC购于美国BD公司,无缝克隆试剂盒购自诺唯赞生物公司。
1.2 实验方法
1.2.1 FabG4蛋白的生物信息学分析
从GenBank上获取H37Rv的FabG4基因序列及其编码FabG4蛋白的氨基酸序列。通过ExPASY在线软件预测H37Rv的 FabG4蛋白的理化性质、IEDB在线软件预测FabG4蛋白的柔韧性、表面可及性及亲水性、TMHMM Server v.2.0 在线软件预测分析FabG4蛋白的跨膜结构、SignalP 4.1 Server在线软件预测分析FabG4蛋白的信号肽、SOPMA在线软件预测FabG4蛋白的二级结构、Phyre2在线软件预测FabG4蛋白的三维结构;用IEDB、ABCpred、SYFPEITHI在线软件预测分析FabG4蛋白的B细胞和T细胞抗原表位,用STRING10.5在线软件预测与FabG4相互作用的蛋白。
1.2.2FabG4基因的扩增
根据GenBank公布的H37Rv的FabG4基因序列(GenBank登录号:NC_000962.3),应用在线引物设计工具EasyGeno设计1对引物,扩增FabG4基因。引物序列如表1所示,反应条件:95 ℃预变性5 min,95 ℃变性1 min,67 ℃退火90 s,72 ℃延伸2 min,30个循环,72 ℃延伸10 min,4℃保存。将得到的PCR产物使用琼脂糖凝胶电泳进行检测,并用胶回收试剂盒回收目的片段。
表1 引物序列
注:大写字母是与插入DNA片段互补的部分,小写字母为与载体重叠的序列
1.2.3 重组质粒的构建
EcorⅠ、HindⅢ双酶切穿梭质粒PMV361,并用琼脂糖凝胶回收试剂盒回收线性化载体,酶切体系如表2所示,将双酶切后的线性化载体和目的片段进行同源重组反应,反应体系如表3所示。连接产物转化至E.coliDH5α感受态细胞,在卡那霉素抗性的LB固体培养基上进行抗性筛选,菌液PCR验证并测序。
表2 双酶切反应体系
表3 重组质粒反应体系
注:“-”加双蒸水的量随质粒和基因片段的浓度不同而变化,加ddH2O补足10 μL体系即可
1.2.4 耻垢分枝杆菌FabG4过表达菌株的构建
耻垢分枝杆菌感受态细胞90 μL加入10 μL重组穿梭质粒PMV361-FabG4混匀,冰浴10 min,将混合物加入电击杯中,进行电转化。电击完成后加入900 μL7H9液体培养基,37 ℃ 220 r/min振荡培养过夜,在7H10卡那霉素抗性平板上筛选阳性菌落,进行PCR验证并测序,该PCR使用的引物是质粒通用引物。
1.2.5 耻垢分枝杆菌野生株mc2155及其FabG4过表达菌株生长曲线测定
挑取7H10固体培养基上的阳性菌落,接种到含0.05%的吐温80的7H9培养液中,37 ℃,220 r/min振荡培养至OD600值为0.6,终止培养。吸取200 μL菌液加入到含有不同培养条件的培养管(30 mL规格)中,其中空气与培养基体积比为1∶2。正常培养环境0、6、12、18、24、30、36、48 h测定浓度;缺氧培养环境于0、12、24、36、48、60、72 h测定浓度,观察其生长情况。标准条件下培养:按1∶100的比例接种到20 mL的7H9液体培养基中,配以透气软胶塞;低氧培养条件配以不透气硬胶塞,封口膜严密封口。
按上述方法将野生型耻垢分枝杆菌(mc2155)、过表达FabG4基因的重组耻垢分枝杆菌(PMV361-FabG4)调节一致浊度分别接种不同的生长条件,37 ℃ 220 r/min振荡培养,测定不同时间段的OD600值,以吸光度OD600值为纵坐标,时间为横坐标,绘制生长曲线。
1.2.6 耻垢分枝杆菌野生株mc2155及其FabG4过表达菌株抗酸染色观察细菌形态
取对数生长期的野生型mc2155和mc2155 FabG4过表达菌株菌液各10 μL于清洁的载玻片中央涂成一薄层,自然干燥。在酒精灯的火焰外侧快速来回移动3次,固定。取适量的石炭酸复红染液滴加至涂片上,夹住玻片,酒精灯加温染色5 min(不可沸腾,不可干涸),待玻片冷却后流水清洗,然后用3%盐酸酒精脱水1 min,流水清洗,用适量碱性美兰溶液复染1 min,流水清洗,用滤纸吸干多余水分后油镜观察、拍照。
1.3 统计学分析
实验数据通过 GraphPad Prism8分析软件,采用 Two-way ANOVA 方法进行分析。
2 实验结果
2.1 FabG4蛋白的生物信息学分析
2.1.1 FabG4蛋白理化性质预测
从GenBank上获得H37Rv的FabG4基因序列及其编码FabG4蛋白的氨基酸序列。H37Rv的FabG4基因全长1365 bp,编码454个氨基酸。通过ExPASY在线软件预测得知,FabG4蛋白的等电点(PI)为6.04,不稳定指数为28.36,属于稳定蛋白。通过Expasy PortParam在线分析FabG4蛋白的脂肪系数为96.59,平均亲水系数为0.069,为疏水性蛋白。
2.1.2 FabG4蛋白柔韧性、表面可及性及亲水性参数预测
通过Karplus&Schulz柔韧性、Emini表面可及性、Parker亲水性3种方案的综合运用,柔韧性、表面可及性和亲水性都获得较高的分值(图1)。
一般情况下,机体内蛋白质的氨基酸疏水性残基位于蛋白质内部,与构成酶的活性中心相关,而亲水性残基位于表面,蛋白质的亲水部位与蛋白抗原表位有密切的联系,FabG4蛋白第197~213与第253~366氨基酸位点具有较高的亲水参数值(图1A)。柔韧性参数,用来衡量蛋白质的多肽骨架自由伸展卷曲的程度,柔韧性越强越有利与抗体结合,以基线1.0为参照,高于1.0的氨基酸区段柔韧性强,是易形成抗原表位的区域(图1B)。可及性参数是指脂蛋白抗原中氨基酸残基与溶剂分子接触的难易度,反映了该抗原残基在蛋白分子内、外的分布情况,是判断天然蛋白质亚序列能否成为B细胞抗原表位的重要参数之一,可及性高于基线1.0的区段易形成B细胞表位(图1C)。
注:横轴为氨基酸区段,纵轴分别为A:亲水性参数值、B:柔韧度值、C:可及性参数值图1 FabG4蛋白疏水性、柔韧性、表面可及性参数的预测
2.1.3 FabG4蛋白跨膜结构和信号肽预测
使用TMHMM Server v.2.0软件进行预测,结果显示FabG4蛋白无跨膜区,为外膜蛋白,如图2A所示。信号肽的有无,则使用SIgnaIP 4.0 Server软件分析,结果显示FabG4蛋白的C-max在第24位氨基酸,为0.112,提示FabG4蛋白可能的信号肽切割位点位于第24位氨基酸处;D值为0.117(<0.5),提示该蛋白不是分泌蛋白而是膜蛋白(图2B)。
图2 FabG4蛋白的跨膜结构及信号肽预测
2.1.4 FabG4蛋白结构域分析
结构域是蛋白质的结构和功能单位。在Prosite数据库中预测FabG4蛋白的结构域。
结果显示,FabG4蛋白的活性位点(即结构域或功能单位)位于347-375,360位氨基酸是酪氨酸,为质子受体(图3)。
图3 FabG4蛋白的结构域预测
2.1.5 FabG4蛋白二级和三级结构预测
利用SOPMA在线软件,对FabG4蛋白的二级结构进行预测,结果显示,198个氨基酸参与α-螺旋结构的形成,41个氨基酸参与β-转角结构的形成,147个氨基酸参与构成无规卷曲结构,68个氨基酸参与构成β-折叠结构,它们分别占该蛋白所有氨基酸总数的百分比依次为43.61%、9.03%、32.38%、14.98%(图4)。使用Phyre2在线软件,对FabG4蛋白的三级结构进行预测,发现构建的该蛋白质三级结构模型中,氨基酸序列覆盖率为89%,可信度达到100%。RasMol软件预测FabG4蛋白结构的稳定性,结果显示,FabG4蛋白结构稳定(图5)。
图4 FabG4蛋白的二级结构预测
注:FabG4蛋白的三级结构由Phyre软件构建,其中红色为α-螺旋, 占43.61%;黄色为β-折叠,占14.98%;蓝色为β-转角, 占9.03%;白色为无规则卷曲结构,占32.38%图5 FabG4蛋白的三维结构预测
2.1.6 FabG4蛋白B细胞和T细胞抗原表位预测
2.1.6.1 B细胞表位预测
利用IEDB在线表位预测软件,采用Kolaskar &Tongaokar法对B细胞抗原表位进行预测(图6);利用ABCpred预测分析B细胞表位,寻找共同预测的表位,结合亲水性、柔韧性、可及性筛选B细胞线性表位,结果获得6个优势B细胞表位(表4)。
图6 B细胞抗原表位趋势预测
表4 FabG4蛋白的B细胞抗原表位预测
2.1.6.2 T细胞表位预测
利用SYFPEITHI和IEDB在线表位预测软件,HLA等位基因选择HLA-A*02:01预测分析CTL细胞表位,选择HLA-DRB1*0401挑选重叠预测的Th表位,结果获得CTL和Th细胞均为8个优势表位(表5)。
表5 T细胞抗原表位预测
2.1.7 FabG4蛋白互作预测
经STRING10.5在线软件预测,FabG4蛋白可与结核分枝杆菌中fas(脂肪酸合酶)、htdX(羟酰基CoA脱水酶)和fadA2(乙酰辅酶A酰基转移酶)等脂肪酸合成途径相关蛋白相互作用(图7)。
图7 FabG4蛋白互作预测
2.2 基因克隆
以耻垢分枝杆菌的DNA为模板,用表1中的引物,通过PCR扩增FabG4基因,再用琼脂糖凝胶电泳验证目的基因片段长度,基因的长度为1 353 bp(图8A)。
2.3 重组质粒的构建
将PMV361-FabG4重组质粒质粒送测序,一致性100%,经EcorⅠ和HindⅢ限制性内切酶双酶切后经1%琼脂糖凝胶电泳进行检测,得到片段大小与预期结果相符的基因条带(图8B),表明FabG4基因已成功插入PMV361穿梭质粒中。
2.4 耻垢分支杆菌FabG4过表达菌株的构建
挑取7H10卡那霉素抗性平板上的阳性菌落,进行过表达菌株菌液PCR验证,扩增的基因片段大小与FabG4基因片段一致(图8C)。扩增的基因片段送公司测序,测序结果与GenBank上公布的碱基序列一致,表明耻垢分枝杆菌FabG4过表达菌株构建成功。
注:M:DNA marker;A:1-3表示mc2155基因组PCR;B:1表示重组穿梭质粒PMV361-FabG4双酶切; C:1-5表示mc2155过表达菌株菌液PCR图8 PCR及双酶切结果琼脂糖凝胶电泳
2.5 重组耻垢分枝杆菌生长曲线测定
通过检测不同培养条件下重组耻垢分枝杆菌、野生型耻垢分枝杆菌在不同时间点的细菌光密度OD600值,绘制生长曲线。
结果显示,FabG4过表达菌株和野生型mc2155生长曲线总体趋势都是标准培养条件下的OD600值高于缺氧条件,说明耻垢分枝杆菌适合在氧气充足、营养充分的条件下生长繁殖;FabG4过表达菌株在正常和缺氧条件下OD600值在均高于野生型mc2155,差异有统计学意义(P<0.01),说明其对低氧条件耐受性较好,在压力环境下生存能力强(图9)。
注:g:PMV361-FabG4过表达菌株;z:mc2155野生株;**:过表达菌株与野生株OD值之比P<0.01图9 PMV361-FabG4过表达菌株和mc2155野生株生长曲线
2.5 镜下观察耻垢分枝杆菌野生株mc2155及其FabG4过表达菌株形态
对耻垢分枝杆菌野生株mc2155及其FabG4过表达菌株进行抗酸染色后,在油镜下(10×100)观察野生型mc2155细菌菌体较细小,菌体多呈分枝状排列,mc2155 FabG4过表达菌株菌体较粗、长,呈杆状,与野生株相比抗酸染色着色深(图10)。
图10 耻垢分枝杆菌野生株mc2155及其 FabG4过表达菌株形态
3 讨论
结核病主要是经呼吸道传播的传染病,传播广泛,严重危害全球的人类健康。引起结核病的病原体是结核分枝杆菌。近年来,随着多药耐药和广泛耐药结核分枝杆菌以及合并HIV感染的问题出现,导致抗结核药物的疗效急剧降低,结核病发病趋势日益严重,针对全新靶点的抗结核药物研发迫在眉睫。卡介苗(BCG)是减毒株的牛型结核分枝杆菌,是目前唯一被批准用于人体接种、预防结核病的疫苗,但是卡介苗的保护效果有限,保护范围在0~80%。因此,急需深入研究结核分枝杆菌的生物学特性,寻找免疫原性强的菌体蛋白、或分泌蛋白,开发新型结核病疫苗来降低结核病的感染率和发病率,达到有效控制结核病的发生。
结核分枝杆菌细胞壁的分枝菌酸与结核分枝杆菌致病、毒力和免疫逃避都有关,在抗结核研究中有着极其重要的地位。结核分枝杆菌基因组中存在5个FabG基因,但只有FabG1和FabG4是保守的,FabG4是β-酮酰基辅酶A还原酶,参与脂肪酸合成II型途径。Singh等[4]研究发现FabG4为膜蛋白,与我们预测的结果一致。本实验通过生物信息学对FabG4蛋白的理化性质进行预测,该蛋白为疏水性蛋白,没有跨膜结构域,对FabG4蛋白进行亚细胞定位分析,发现其有活性位点位于第347-375位氨基酸,360位氨基酸是酪氨酸,为质子受体,而酪氨酸在细胞外膜中含量较高[5]。
本研究使用多个软件对FabG4蛋白的二级和三级结构、T、B细胞优势抗原表位及其相互作用的蛋白进行预测分析,结果显示FabG4蛋白是一个结构稳定的疏水性蛋白,该蛋白二级结构中α-螺旋(Th)结构198个,占43.61%;β-折叠(Ee)结构68个,占14.98%;β-转角(Tt)结构41个,占9.03%;无规则卷曲结构(Cc)147个,占32.38%,其中无规则卷曲和β转角区域易于形成抗原表位,抗原表位的优势区域符合亲水性强,可及性和可塑性好的特点[6]。FabG4的蛋白结构预测显示其具有很好的应用价值。
本研究预测的B细胞抗原表位是联合IEDB和ABCpred软件预测的高分区域,同时结合预测所获得的蛋白的亲水性、表面可及性、柔韧性等参数,最终确定9-16、23-29、313-325、371-378、105-113、158-166这6个表位为B细胞优势抗原表位。
T细胞主要包括两类细胞,分别是细胞毒性T淋巴细胞(CTL)和辅助性T细胞(Th)。与MHC I类分子结合的内源性抗原肽由CTL识别,与MHCII类分子结合的外源性抗原肽则由Th细胞识别。结核分枝杆菌是胞内寄生菌,清除胞内寄生菌主要靠细胞免疫。因此,预测CTL和Th细胞表位对结核分枝杆菌清除具有重要意义。本研究联合SYFPEITHI和IEDB软件进行了T细胞表位的分析和比较[7-8],HLA等位基因选择HLA-A*02∶01和HLA-DRB1*0401进行预测[9],最终筛选出CTL和Th细胞优势抗原表位各8个。
本实验还预测FabG4互作蛋白,结果显示FabG4蛋白可与结核分枝杆菌中脂肪酸合酶、羟酰基CoA脱水酶和乙酰辅酶A酰基转移酶等脂肪酸合成的相关蛋白相互作用,这也说明FabG4蛋白是酶,主要与脂肪酸合成相关。Dutta等[10]研究表明结核分枝杆菌在生物膜形成期间高表达的FabG4蛋白被敲除后,在其最适生长条件下对其生长无影响,但在抗生素应激和营养缺乏条件下对结核分枝杆菌生存非常重要,故FabG4可能参与结合分枝杆菌的抗逆性或耐药性的重要过程。蛋白质组学研究确定FabG4是抗生素应急源诱导表达的主要蛋白之一,耻垢分枝杆菌是研究结核分枝杆菌基因或蛋白的理想宿主[11],本实验成功构建了耻垢分枝杆菌FabG4过表达菌株,FabG4过表达菌株和野生型mc2155生长曲线总体趋势都是标准培养环境下的OD600值高于缺氧培养环境,说明耻垢分枝杆菌适合在氧气充足、营养充分的条件下生长繁殖;FabG4过表达菌株在正常和缺氧条件下OD600值均高于野生型mc2155,说明其对低氧条件耐受性较好,在压力环境下生存能力强,据报道FabG4在亚抑菌浓度的链霉素中过量表达[12],还在耐药菌株中检测到该蛋白质过表达[13]。
通过抗酸染色法对耻垢分枝杆菌野生株mc2155及其FabG4过表达菌株进行形态观察,发现过表达FabG4基因后菌体粗长,呈杆状,着色较深,仍需进一步做扫描电镜和透射电镜以精确的观察FabG4过表达菌株形态。
本研究预测的FabG4蛋白的理化性质,一级、二级、三级结构和T、B细胞表位,均采用多种方式在多个角度进行了分析和预测,有效地规避了单一软件预测的缺陷,为进一步研究FabG4蛋白的结构、功能和开发靶向新药、抗结核疫苗提供了理论依据。