噬菌体仲裁通讯系统的研究进展
2021-12-15焦文豪徐冰红刘培源严汉池
焦文豪,徐冰红,刘 静,刘培源,严汉池
(天津大学生命科学学院,天津 300072)
细胞决策指导生物体的发育,研究细胞命运选择发生的具体机制至关重要[1]。目前在不同噬菌体中发现了复杂的决策行为,包括细菌及噬菌体的特异性相互作用[2]、噬菌体子代之间的小分子通讯[3]等行为。其中温和噬菌体在裂解循环中产生大量噬菌体颗粒释放到环境中[4],而在溶原循环中,噬菌体将其DNA 整合到宿主基因组中,与宿主建立潜在的有益关系[5],使宿主不受同一噬菌体的感染[6]。近年来,在感染枯草芽孢杆菌的SPbeta 噬菌体中发现一种新的通讯系统,称为仲裁通讯系统[7]。仲裁系统本质上代表了噬菌体编码的群体感应系统[8],该系统由3 个噬菌体基因组成:aimP,编码43 个氨基酸的前体仲裁(arbitrium)肽,分泌到胞外加工成6 个氨基酸的成熟信号肽,再次转运进细胞与AimR 蛋白结合,解除AimR 蛋白对aimX基因的调控作用,使噬菌体进入溶原周期;aimR,编码的AimR 蛋白结构上类似于RRNPP 蛋白(革兰氏阳性菌群体感应系统的关键蛋白)结构,是AimP 编码肽的胞内受体,同时作为转录调控因子调控aimX基因的表达;aimX编码一个非编码RNA 作为溶原性的负调控蛋白。在整个仲裁系统中,AimR 作为最关键的蛋白对决定噬菌体进入溶原裂解周期有重要影响。噬菌体的通讯系统对其自身和与细菌整体进化都起到了重要作用[9],因此对噬菌体通讯系统的研究受到广泛关注。本研究对AimR 蛋白的结构特征、肽作用原理进行综述,希望为进一步研究这种蛋白结构和功能以及利用通讯系统进行病害防治提供参考。
1 AimR 蛋白及其复合物的结构特征
1.1 AimR 蛋白的结构特征
AimR 蛋白全长386 个氨基酸,由N-末端螺旋-转角-螺旋(Helix-turn-helix,HTH)DNA 结合结构域(DNA-binding domain,DBD,残基1-73)和专门识别仲裁肽的C-末端的三十四肽重复序列域(Tet⁃ratricopeptide repeat,TPR,残基 79-386)组成,中间由短连接器(残基 74-78)连接[10]。全长AimR 蛋白由24 个螺旋二级结构组成(图1)。其中前5 个螺旋形成 DBD 域,其余 α-螺旋分为 8 个 TPR 域和 C 端帽状限制螺旋。AimR 蛋白在溶液中以具有活性的二聚体形式存在,其二聚作用由C 端限制螺旋介导,其中 L383、L380、L384 和 L386 通过与其他单元的匹配残基形成范德华相互作用而导致二聚作用。同时AimR 单体通过其N-末端和C-末端之间的相对排列而产生咀嚼状运动[11]。对AimR 蛋白表面静电势分析发现,DBD 表面有一个较大的具有DNA 结合活性的正电荷区,可与DNA 结合介导裂解过程。同时每个AimR 蛋白单体的构象略有不同,为AimR 蛋白质带来一定的可塑性[12]。
1.2 AimR-AimP 复合物的结构特征
细菌表面寡肽通透酶转运体(Oligopeptide per⁃mease transporter,OPP)将仲裁肽转运进胞内并提高浓度后AimR 受体与肽结合,介导噬菌体进入溶原周期[13]。在AimR-AimP复合物结构中(图1),2个AimR蛋白分子同样由C端限制螺旋介导形成同型二聚体,TPR 域形成一个深凹的口袋,氨基部分稍微打开,小内腔宽度增加,以使每个AimR分子结合一个AimP六肽(GMPRGA)[14]。同时AimP 结合引起 AimR N 端构象的细微变化,使AimR 分子形成了一个扩展但更严格的DBD域,阻止了AimR蛋白与aimX启动子区的结合,降低了AimR的DNA结合能力。
在 AimR-AimP 复合物中,AimP 六肽的 C 端丙氨酸面向口袋内部,N 端甘氨酸位于入口点。这些肽与受体的结合主要通过极性相互作用来协调,特别是通过AimR 蛋白家族中保守的Arg、Asp、Gln、Asn 和 Glu 来实现。在 phi3T 噬菌体中,phAimR 的Asn195、Arg 221、Gln291 和 Asp352 通过盐桥和氢键与SAIRGA 六肽结合。而在SPbeta 噬菌体中,AimR和AimP 之间的相互作用是由广泛的氢键和疏水接触网络来实现,AimR 肽主链上的氧原子与4 个AimP 残基形成了氢键[12]:Q299AimR 、E300AimR 与G1AimP 氮部分相互作用,N239AimR 与 P3AimP 形成氢键,N202AimR 与 G5AimP 相互作用,R228AimR与A6AimP 的氧基接触,而AimR 的5 个疏水残基(L205、L242、F276、F362、L363)与 M2AimP 的侧链发生范德华相互作用。此外利用单点突变,证实了AimR 的 N202、N206、N239、N299、N329 和 D360 残基对与AimP 结合有重要作用,这些残基可能形成噬菌体在溶原裂解之间转换的开关。
1.3 AimR-DNA 复合物的结构特征
在肽浓度低的时候,AimR 特异性靶向aimP基因下游的51 bp DNA 序列,该序列包含一个31 bp 的回文序列(5ACTTAAATATTAGGTTTTAATAACATC⁃TAGT3),AimR 与回文序列结合,激活aimX转录,介导噬菌体进入裂解途径[14]。回文序列中,A、C 碱基是AimR 与DNA 识别的关键,仲裁肽的存在和核苷酸的缺失都会导致回文序列与受体结合能力明显降低[15]。在 AimR- DNA 复合物(图1)中,整体结构和二聚体排列与AimR 相似,AimR-DNA 复合物通过典型的HTH 结构域进行DNA 识别,而来自TPR 结构域的残基与间隔DNA 主链相互作用。DNA 结合型的AimR 二聚体有2 个相互作用面:一个与单独AimR 及AimR-肽结合形式相同,由C 端限制螺旋介导;另一个由每个原体的螺旋6、螺旋7 和loop 7 的残基 Glu132、Tyr161 和 Asn166 生成,这些残基彼此形成氢键[14]。
AimR 与DNA 的相互作用主要由N 端区介导,包括广泛的氢键和离子相互作用,产生2 个作用界面[14]。首先,AimR 二聚体的每个原体通过其 DBD 区域对称地与DNA 片段的主要沟槽结合。每个DBD域的识别螺旋α3 面向DNA 轴,并通过残基Asn30 和Asn32 的侧链与主沟的碱基特异性地相互作用。其次,N 端正电荷斑块中的 10 个残基(Lys29、Lys43、Thr44、Asn46、Lys77、Thr78、Lys79、Arg82、Asn109、Lys145)参与了 A9、T10、T11、A20、T28、A29、G30、T7′、G8′、T9′、T26、T27′和 A29′的骨架磷酸盐的配位,构成了第二个DNA结合界面。与肽结合型AimR相比,DNA 结合型AimR 组装的二聚体更为封闭,并且肽结合引起的构想改变缩短了AimR 的DNA 识别螺旋之间的间距,使AimR 不能与DNA 结合。
2 仲裁通讯系统的作用机制
2.1 仲裁肽调控模型
大肠杆菌噬菌体的裂解-溶源决定已被广泛研究,其主要受感染细胞的代谢状态和感染噬菌体数量的影响[16]。在λ 噬菌体中,其裂解-溶源决定受噬菌体编码转录调节因子CⅠ、CⅡ和Cro 之间的相互作用以及宿主编码许多因子的影响[17]。溶原状态的主调控因子是CⅠ阻遏蛋白,它与裂解基因的启动子结合并抑制其表达[18]。当噬菌体大量存在时,CⅠ阻遏蛋白抑制噬菌体裂解基因,使噬菌体进入溶源状态。
在仲裁系统中,aimX基因编码一个短的(51 个氨基酸)开放阅读框,其后是一个62 个碱基的非编码 RNA 区域,在一个茎环结构处终止[15]。aimX 基因与CⅠ基因重叠,可以转录形成顺式反义RNA,这种顺式反义转录本可以通过抑制翻译或刺激RNA降解来沉默重叠的基因[19]。在裂解条件下,aimX通过反式调控抑制了CⅠ阻遏蛋白的表达。这种沉默反过来在仲裁肽的存在下得到缓解,从而导致aimX表达受到抑制。这些结果为仲裁肽介导的溶源决策提供了一个完整的模型:SPbeta 噬菌体感染细菌初期,噬菌体表达aimR和aimP基因。二聚体AimR 蛋白与特定的DNA 结合,激活aimX编码一个非编码RNA 作为溶原周期的负调控蛋白,进而抑制CⅠ阻遏蛋白表达,阻断溶原的发生。AimP 被释放到胞外后,被胞外蛋白酶加工成成熟的仲裁肽,经过几个感染周期后,仲裁肽会在环境中积累。通过OPP 通道内化到邻近细胞中。在后期阶段,噬菌体会感染胞内肽浓度较高的细胞,这种情况下,AimR 与仲裁肽结合,阻止了aimX的表达。随后,噬菌体CⅠ阻遏蛋白表达并与裂解基因的启动子结合,抑制其表达并进入稳定的溶原状态(图2)。
2.2 仲裁肽的特异性结合影响决定
仲裁系统已经在100 多种噬菌体中被发现,仲裁肽多为6 肽,在个别噬菌体中也可长达10 个氨基酸[20]。仲裁肽的序列不尽相同,其中80%的仲裁肽分布在6个大家族中(GMPRGA、GVVRGA、GFGRGA、SASRGA、GFTVGA、SAIRGA),其高度保守的 RGA C-端区域和可变的N 端区域解释了肽受体的特异性,保守的RGA 基序和主链与受体蛋白的结合通过AimR 中完全保守的 N202、R228 和 T236 残基来实现[15]。其中Ala 侧链夹在2 个保守的疏水残基之间,Arg 与严格保守的D360 形成盐桥。肽的N 端部分赋予了肽的可变性,AimR 残基(SPbeta 中的 A273 和M296)与肽的第三位相互作用是高度可变的。并且肽的N 端部分通过与受体中高度保守的残基相互作用进行锚定,确保了受体可读出肽的正确构象。
由于肽的可变性,仲裁肽只与来自同一噬菌体的相应AimR 受体特异性结合,触发裂解-溶原转化。成熟的SPbeta AimP 仲裁肽为GMPRGA,其序列与phi3T 的SAIRGA 肽不同。GMPRGA 肽没有显示出与phi3T AimR 受体的特异性结合,GMPRGA 肽也只促进SPbeta 的溶原,不影响phi3T 的溶原。这些结果表明,序列特异性肽指导噬菌体溶原发生在特异性噬菌体中。虽然仲裁肽的存在对噬菌体的溶原作用有显著影响,但这种影响不是绝对的[21]。即使肽浓度高的情况下,溶原发生的概率只是明显升高,并不是全部溶原化;同样,在缺乏肽的情况下,噬菌体也不会发生专性裂解。因此,噬菌体有一个随机、独立溶菌化的趋势。
2.3 仲裁肽影响AimR 受体的构象改变
AimR 的结构具有内在的灵活性,影响了HTH结构域在二聚体中的相对分布,当与AimP 结合后AimR 表现出更紧密的构象,引起超螺旋螺距的减小。AimP 结合引起的闭合运动减少了TPR 域N 端和C 端之间的距离,允许2 个子域残基之间形成新的相互作用,从而稳定肽结合构象[15]。同单独AimR 和 DNA 结合形式比较,AimR-AimP 二聚体中2 个单体几乎完全相同,表明肽与TPR 域相互作用引起的封闭结构使AimP 稳定蛋白构象,迫使TPR 域N 端C 端的接近来实现这些交互。此外,AimR 蛋白的N 端和C 端在不同的构象中几乎是相同的,而连接区域起着铰链的作用,表明AimR 闭合更像是一种刚体运动,同时序列分析也表明,该连接子在AimR 受体中高度保守,因此连接区域一定是AimP诱导的信号转导机制中的关键结构元件。
在没有仲裁肽的情况下,二聚体AimR 表现出动态的开放和封闭构象,分别有利于与肽和DNA 结合。肽结合后,AimR 处于开放状态,很难过渡到封闭状态。然后,肽抑制AimR 与目标DNA 结合。同样,这种构象转变抑制机制在不同的噬菌体中也存在差异[22]。在phi3T 噬菌体中,肽结合可以完全破坏AimR 蛋白的二聚体状态,导致其向单体状态转移,降低其DNA 结合活性。在SPbeta 噬菌体中,AimR 与AimP 结合后,发生构象改变进而失去DNA结合活性,但其二聚体状态并未改变,肽实际上通过锁定AimR 二聚体的形式来促进溶源。这意味着在SPbeta 噬菌体的仲裁系统中,AimP 通过一种不同于phi3T 噬菌体中相应机制的机制来灭活AimR,说明噬菌体中至少存在2 种不同的寡聚化调控机制。
2.4 仲裁肽影响AimR 受体与DNA 的结合
AimR 在无肽状态下是一种转录激活子,AimR的N 端部分对DNA 靶向至关重要,同时二聚体的形成对其DNA 结合特性也十分重要。AimR 的DNA结合活性,实际是由仲裁肽调节。肽施加的刚性阻止了AimR 与DNA 的结合,也证实了AimR 的可塑性对DNA 结合至关重要,AimR 是调节转录激活的DNA 结合蛋白,它们在与肽结合后失去活性,对SP⁃beta 噬菌体的裂解溶原决策是至关重要的。
在仲裁系统中,AimR 在不存在仲裁肽的情况下作为二聚体与噬菌体DNA 结合,是aimX 的转录激活体,激活aimX 转录aimX 通过顺反义机制直接抑制CI 抑制因子,阻断溶原的发生;反过来aimX 的沉默会导致溶原增加。AimR 与仲裁肽结合后,失去其DNA 结合活性,进而调控基因表达,以确定噬菌体溶原裂解过程的转变[15]。仲裁肽影响AimR 受体与DNA 的结合是通过改变AimR 受体的构想来实现的,噬菌体phi3T 的AimR 受体在结合了仲裁肽SAIRGA 后,其低聚物状态从二聚物变为非活性单体,抑制aimX 转录并导致溶原性。而添加SPbeta GMPRGA 肽并没有导致SPbeta AimR 寡聚状态的改变,AimR 蛋白仍为二聚体状态,但AimP 结合引起AimR N 端构象的变化,使 AimR 蛋白不能与 aimX 启动子区结合,aimX 沉默进入溶原途径。不同构象改变也说明了肽与其受体在仲裁系统中的高度特异性,都导致2 个菌株偏向溶原。
3 AimR 蛋白属于 RRNPP 家族
群体感应现象是细菌调节自身密度的重要方法,其中起重要作用的是RRNPP 蛋白家族[23]。RRNPP蛋白家族是重要的胞质肽感应调节因子,包括5 个代表性成员,即Rap、Rgg、NprR、PICR 和PrgX,它们在控制细菌群体感应中有重要作用[24]。通过群体感应,细菌能够产生和响应小信号分子参与细胞间交流,可通过细菌毒力因子表达、细菌结合、生物膜形成、孢子形成、抗生素合成等多种生理过程来调节种群密度,对维持细菌的菌群数量有重要作用[25]。
与在仲裁系统中一样,RRNPP 家族由一个细胞质受体和一个短的(5~10 个氨基酸)信号肽组成[26]。RRNPP 家族调节因子与信号肽结合激活后,肽段通过调节RRNPP 受体的低聚物状态或构象的改变来发挥作用[27]。例如,NprX 与对应肽的结合促进了二聚体NprR 向四聚体的转化,四聚体专门针对DNA调节基因表达[28]。除了Rap亚家族外,所有的RRNPP成员都有一个N 端HTH 基序与DBD 域的双域结构和一个 C 端的肽结合域[29]。RRNPP 家族成员的结构特征表明肽结合域是由TPR 域组成,该重复序列采用超螺旋折叠,内凹槽为肽结合处。与仲裁系统类似,肽与TPR 域的结合调节RRNPP 受体的转录活性。这些相似性表明,仲裁系统是RRNPP 家族的成员,具有相似的作用机制。结构上也显示短肽结合在AimR 的螺旋空腔里面,表明AimR 属于RRNPP蛋白家族。虽然AimR 属于RRNPP 蛋白家族,AimR对GMRPGA 肽的调节方式与经典的RRNPP 转录因子相似,但与不包括侧链特异性接触的RRNPP 与信号肽的相互作用不同,它们之间的调节机制也存在一定差异。
4 小结与展望
仲裁系统的研究说明肽通讯对噬菌体和细菌的协同进化有重要作用,表明噬菌体群体感应是生物学中值得研究的重要方面。仲裁系统中,3 个基因各司其职,保障了噬菌体高效合理的生存。其中胞内肽浓度是噬菌体进入溶原或裂解途径的关键,而肽序列具有多样性,不同的噬菌体之间通过不同的分子语言向同类传递信息,表明了噬菌体特异性的进化驱动力,为深入了解病毒和微生物社会网络的分子通信机制提供了思路。目前具备仲裁系统的噬菌体依赖特定细菌,只侵染具有OPP 通道和胞外蛋白酶的芽孢杆菌,表明仲裁系统只是噬菌体通讯系统的一部分,可能只存在于感染特定细菌的噬菌体中。同时噬菌体构成了很大的社会网络,有关仲裁系统的研究对了解整个噬菌体的群体感应有重要借鉴意义,也为其他方面的研究打开一些思路。例如,仲裁系统为噬菌体提供了一定机制来估计感染的数量,而这种策略是否存在于感染真核生物的病毒中来介导休眠或裂解,其他基因是否参与了噬菌体的群体感应等,还有待考证;噬菌体中是否存在串扰现象等也有待研究。相信随着仲裁系统的深入研究,这些问题会得到解答。