插入序列IS6100介导DNA序列转移的机制研究
2019-08-20聂璐吴奎海陈文静李炜煊
聂璐,吴奎海,陈文静,李炜煊
插入序列IS6100介导DNA序列转移的机制研究
聂璐,吴奎海,陈文静,李炜煊
528000 广东,佛山市第一人民医院检验科
插入序列 IS6100 与耐药基因转移密切相关,本研究旨在初步探究 IS6100 转移 DNA 序列的机制。
以 Genbank 库中已有序列中含两个及两个以上拷贝 IS6100 序列的质粒或者染色体为研究对象,通过生物信息分析的方法分析各 IS6100 侧翼的靶位点重复序列(TSD),推测该元件转座酶可能的工作机制。
共检索到 22 条序列,含 5 条染色体、16 条质粒以及 1 条定位未知的转座子序列。其中有 13 条序列(59%)来自鞘脂菌属细菌,余下均来自条件致病菌的染色体或质粒。在鞘脂菌属细菌 TKS 中,IS6100 拷贝数可多达 29 个,且 IS6100 和鞘脂菌属细菌基因组的 GC% 均接近 60%。共有 35 条不同的 8 bp TSD 在这些菌株中出现的频率为 2 ~ 8 次。TSD 的 GC% 含量在 13% ~ 100%,有 87%(30/35)的 TSD 序列 GC% 含量均≥ 50%。这些 TSD 可同时出现在同一菌株的染色体或质粒内部、同一菌株的染色体和质粒之间、不同菌株的染色体和质粒间。
IS6100 的产生菌可能为鞘脂菌属细菌。IS6100 的作用靶位点没有高度选择性,但仍倾向作用于高GC% 含量位点。两个 IS6100 可以形成复合转座子,转移其间的 DNA 序列,这些转座事件可以发生在分子间和分子内。
DNA 转座子; 基因转移,水平; IS6100; 耐药机制
耐药基因的转移总是与各种可转移元件相关(mobile genomic elements,MGEs),这其中包括质粒、复合转座子、单元转座子、可整合可接合元件和插入序列(insertion sequence,IS)等[1]。插入序列本身不含耐药基因,但是它编码一个或多个转座酶。绝大多数插入序列末端都有反向重复序列(terminal inverted repeats,TIRs),大小为10 ~40 bp。依据TIRs 在转座酶的上游还是下游细分为 IRL(inverted repeat left)和 IRR(inverted repeatright)。TIRs 提供了插入序列转座酶的识别和结合位点,参与序列剪切和转移的过程[2]。
随着越来越多细菌基因组被解析,插入序列与耐药基因的关系也逐渐明晰。有些耐药基因一般位于插入序列的下游,如NDM-1(B 组碳青霉烯酶基因)一般位于 IS下游[3],CTX-M(超广谱 β 内酰胺酶基因)一般位于 IS的下游,耐药基因和插入序列一起转移,并且耐药基因上游的插入序列可能提供耐药基因表达的启动子序列[4]。有些耐药基因位于两个相同的插入序列形成的复合转座子内部,随复合转座子的转座进行转移。典型的如 Tn6020,是两个 IS26之间定位有一个(氨基糖苷类磷酸化酶基因)[5]。目前发现的有 4000 多个IS 序列,分属于 30 个 IS 家族,一般而言,同家族的插入序列成员其作用机制是类似的[6]。
IS26是 IS6家族成员,被公认为是目前为止革兰氏阴性菌尤其肠杆菌科细菌中最为活跃的插入序列之一,其参与耐药基因的募集、重排和流动的事实有大量基因组数据和实验证据证实。在 2014 – 2016 年分别有 4 篇文献报道阐明了 IS26在耐药基因转移中的作用和可能的机制[7-10]。文献介绍了一个和多个拷贝 IS26如何在分子间或者分子内介导 DNA 序列的移动,以及移动后会在 IS26两侧留下分子印记,即靶位点重复(target site duplications,TSD)。TSD 是 DDE 转座酶催化转座事件发生的分子标识,它的长度反映的是转座子的特征之一[8]。基于 IS26的复合转座子介导的转座事件经常在两个 IS26侧翼有 5 bp 或者 8 bp 的 TSD。
IS6100也是与耐药基因密切相关的插入序列之一,它们的共性在于 IS6100和 IS26同属于 IS6家族成员,这两个插入序列的TIRs 都是14 bp,且序列相似度高。但是 IS6100在其基因环境上有与 IS26相区别的特点,主要表现在:① IS6100经常出现在In4 型 I 型整合子的末端[1];②相比 IS26 经常有多个拷贝出现在同一个菌的基因组中,形成一个或多个复合转座子,IS6100极少有形成复合转座子的情况,大多数都是单个出现在质粒或染色体的耐药基因附近。
本文以 Genbank 库中提交的基因组数据为检索背景,以含有两个(一个完整一个截短)IS6100拷贝的基因组数据(质粒或者染色体)为研究对象,通过生物信息学分析手段,调查研究 IS6100侧翼 8 bp 序列的特征,以期为阐明其确切的作用机制提供一些线索。
1 材料与方法
1.1 材料序列检索及纳入研究
用完整的 IS6100参考序列,长度为 880 bp(accession 号:X53635),来自 ISfinder(https:// www-is.biotoul.fr/),比对检索 NCBI Genbank 库(https://blast.ncbi.nlm.nih.gov/Blast.cgi),当细菌染色体或者质粒上同时出现两个拷贝的IS6100时(包含一个是完整的 IS6100,另一个截短IS6100的情况),即纳入为我们的研究对象,检索 Genbank 库时间为 2018 年 6 月。
1.2 方法
1.2.1 生物信息分析 从 Genbank 下载上述纳入研究序列的所有 Fasta 文件,导入 CLC Genomics workbench 软件(版本号 8.5),逐条分析。记录每个 IS6100在基因组中的位置(质粒或者染色体),每个拷贝的方向(正向或者反向),序列起点和终点,以及每个 IS6100 两侧的 8 bp 碱基的情况。对于 IS6100为反向的情况,用在线序列转换软件 Reverse Complement(http://www.bioinformatics.org/ sms/rev_comp.html)将其侧翼8 bp 碱基调整为正向,记录在表格中。GC% 含量采用在线网站提交序列进行计算(https://www.sciencebuddies.org/)。
1.2.2 汇总分析 分析 IS6100 侧翼 8 bp 序列特征,出现的频率。推测 IS6100 作用的靶位点特征,分子间(质粒与染色体之间、不同质粒间,不同染色体间)、分子内(同一条染色体和质粒序列内部)是否可能有 IS6100 介导的转座事件发生。
2 结果
2.1 序列检索概况
总体上讲,多拷贝 IS6100出现在同一个菌中的情况明显少于同家族成员 IS26。一共检索到22 条序列,含 5 条染色体、16 条质粒以及 1 条转座子序列(accession No.KT897470),没有提供具体的定位信息。检索具体信息如 Genbank 编号、菌株名称及序列定位信息、每条序列中出现的拷贝数等信息详见表 1。这其中有 13 条序列(59%)出现在鞘脂菌属(),其中含2 条鞘脂菌属的染色体,余下 11 条为鞘脂菌属质粒。表 1 中质粒 pTK1、pTK3、pTK4、pTK6 来自鞘脂菌属细菌 TKS。质粒 pMI1、pMI2、pMI3、pMI4 来自鞘脂菌属细菌 MI1205。
除鞘脂菌属外,多个拷贝的 IS6100还出现在一些条件致病菌中,如铜绿假单胞菌染色体、阴沟肠杆菌染色体、大肠杆菌质粒、肺炎克雷伯杆菌质粒、解聚乙二醇鞘氨醇盒菌质粒和基因组中。
2.2 IS6100 的产生菌
IS6100首次提交 ISfinder(https://www-is. biotoul.fr/)是出现在偶发分枝杆菌()中,但关于IS6100来自哪个种属,目前尚未有定论。IS6100的 GC% 含量为 60.6%。而 Genbank 中两条鞘脂菌属染色体的 GC% 含量分别为63.4%(accession 号:CP005083)和 62.4%(accession 号:CP013264),略高于 IS6100,但十分接近。所以单从 GC% 含量上判定,仍无法给出明确结论。
一个非常显著的特点是 IS6100出现在鞘脂菌属染色体和质粒上的拷贝数非常多。在表 1 所列的情况里,通过文献检索我们发现质粒 pTK1、pTK3、pTK4、pTK6 以及染色体序列(accession 号:CP005083)来自同一株鞘脂菌属细菌 TKS,质粒 pMI1、pMI2、pMI3、pMI4 均来自鞘脂菌属细菌 MI1205。这样算来,鞘脂菌 TKS 和 MI1205 里,一共分别有多达 29 和 27 个拷贝 IS6100,这种情况实属少见。鞘脂菌属细菌极有可能是 IS6100 的产生菌,但无法确定是哪个具体的种。
表 1 Genbank 库中检索到的 IS6100概况以及侧翼 8 bp 序列分析
续表 1
注:*表示该 IS6100 拷贝与参考序列 IS6100 相比有碱基缺失或增加,导致 IS6100 全长不是 880 bp;Δ表示该 IS6100 拷贝有截短,不是完整拷贝;a ~ z,aa ~ ai 标注的是在这些质粒和染色体序列中出现次数大于 2 次的 8 bp 侧翼序列,一共有 35 种情况;#表示目前该种属没有合适的中文名称。
Notes:*Indicates that the IS6100 copy has base deletion or increase compared with the reference IS6100 sequence, resulting in the length of IS6100 is not 880 bp;ΔIndicates that IS6100 copy has been truncated, not full copy; a - z, aa - ai labeled was the 8 bp flanking sequence that appeared more than 2 times in these plasmids and chromosome sequences, with a total of 35 situations;#Indicates that there is no suitable Chinese name for this species.
表 2 IS6100 作用的靶位点序列特征
2.3 象征转座事件发生的 8 bp TSD 分析
每个 IS6100 末端 8 bp 的序列见表 1。我们发现重复出现 2 次及以上的 8 bp 序列一共有35 种不同情况,说明 IS6100 对其作用的靶位点并没有高度选择性,但这 35 种情况中仅有 5 种是GC% 含量低于 50%,说明 IS6100选择作用的靶点具备高 GC% 含量的特征。对这些重复出现的8 bp 序列在表 1 中进行标注,相同的序列标示同样的颜色,并在右上角标注同样的字母。表 2 统计了每种重复出现 TSD 的频次和 GC% 含量。
8 bp TSD 出现的情况一共有如下几种:①仅出现在同一株菌的染色体序列中,比如 a:CCA CTTTG,d:GGGCGGGC 等;②仅出现在同一株菌的质粒中,比如 f:TCATAGAT,g:GGCCTGCG 等;③同一菌株染色体内部,不同菌株染色体和质粒间,同一菌株的不同质粒间,比如 b:GCAG CGCG;④不同菌株的质粒间和同一质粒内部,比如 j:CGCGCGCC;⑤不同菌株的质粒间、同一质粒内部、同一菌株质粒间,比如i:AAAAATGT;⑥不同菌株染色体和质粒间,比如ab:CTCGTG TG。这些证据都强烈地提示 IS6100参与了基因序列在同一菌株染色体内部、质粒内部和不同菌株染色体间、质粒间的交换,并留下了转座事件发生的分子印迹。
3 结论
基于 IS6100在鞘脂菌属细菌基因组中有多达 29 个拷贝以及 IS6100 和鞘脂菌属细菌 GC% 接近的事实,可以推测 IS6100 可能来源于该属的细菌,但具体的种仍不明确。IS6100 识别的靶位点大多具有高 GC% 含量。IS6100 可以介导不同细菌染色体间、质粒间、同一个细菌内部染色体和质粒间以及同一序列内部的序列转移,并且是通过 DDE 转座酶介导,留下转座事件发生的分子标识,即 8 bp 靶位点重复序列。详细的 IS6100 介导上述 22 条序列中哪些 DNA 序列的募集、重排和流动,需要进一步详尽地解析本文中提到的染色体和质粒序列。
[1] Partridge SR, Kwong SM, Firth N, et al. Mobile genetic elements associated with antimicrobial resistance. Clin Microbiol Rev, 2018, 31(4):e00088-17.
[2] Lee H, Doak TG, Popodi E, et al. Insertion sequence-caused large-scale rearrangements in the genome of Escherichia coli. Nucleic Acids Res, 2016, 44(15):7109-7119.
[3] Chatterjee S, Datta S, Roy S, et al. Carbapenem resistance in acinetobacter baumannii and other acinetobacter spp. causing neonatal sepsis: focus on NDM-1 and its linkage to ISAba125. Front Microbiol, 2016, 7:1126.
[4] Wang Y, Song C, Duan G, et al. Transposition of ISEcp1 modulates blaCTX-M-55-mediated Shigella flexneri resistance to cefalothin. Int J Antimicrob Agents, 2013, 42(6):507-512.
[5] Blackwell GA, Hamidian M, Hall RM. IncM plasmid R1215 is the source of chromosomally located regions containing multiple antibiotic resistance genes in the globally disseminated acinetobacter baumannii GC1 and GC2 clones. mSphere, 2016, 1(3):e00117-16.
[6] Siguier P, Gourbeyre E, Chandler M. Bacterial insertion sequences: their genomic impact and diversity. FEMS Microbiol Rev, 2014, 38(5): 865-891.
[7]Harmer CJ, Moran RA, Hall RM. Movement of IS26-associated antibiotic resistance genes occurs via a translocatable unit that includes a single IS26 and preferentially inserts adjacent to another IS26. MBio, 2014, 5(5):e01801-14.
[8] He S, Hickman AB, Varani AM, et al. Insertion sequence IS26 reorganizes plasmids in clinically isolated multidrug-resistant bacteria by replicative transposition. MBio, 2015, 6(3):e00762.
[9] Harmer CJ, Hall RM. IS26-Mediated precise excision of the IS26-aphA1a translocatable unit. MBio, 2015, 6(6):e01866-15.
[10] Harmer CJ, Hall RM. IS26-Mediated formation of transposons carrying antibiotic resistance genes. mSphere, 2016, 1(2):e00038-16.
[11] Gillings MR. Integrons: past, present, and future. Microbiol Mol Biol Rev, 2014, 78(2):257-277.
The mechanism of insertion sequence IS6100 mediated transfer of DNA sequences
NIE Lu, WU Kui-hai, CHEN Wen-jing, LI Wei-xuan
Medical Laboratory, The First People’s Hospital of Foshan, Guangdong 528000, China
The insertion element IS6100 is closely related to antibiotic resistance transfer in bacteria. Here we aim to explore the possible origin of IS6100 and its mechanism of horizontal transfer of DNA fragments.
Taking the plasmid or chromosome DNA containing two or more copies of the IS6100 element in the GenBank library as the research object, the target site duplication (TSD) flanking each IS6100 was analyzed by bioinformatics tools, and the potential mechanism of the transposase encoded by IS6100 is speculated.
A total of 22 DNA sequences including 5 chromosome, 16 plasmid sequences, and a transposon sequence of unknown location were founded. Among them, 13 sequences (59%) were from DNA ofand the rest were from chromosomes or plasmids of conditional pathogens. Instrain TKS, the copy number of IS6100 was as many as 29, and the GC% content of the IS6100 or genome was close to 60%. Thirty-five different 8 bp TSDs were present in these strains with a frequency of 2-8. The GC% content of TSD was between 13% and 100%, and the GC% content in 87% (30/35) TSD sequences was ≥ 50%. These TSDs occurred simultaneously in the chromosome and/or plasmid of the same strain or different strains.
IS6100 may originated from strains of. IS6100 has no high selectivity for its target site, but still tends to act on high GC% sites. Two IS6100s can form a composite transposon and transfer a DNA sequence between them, and these transposition events can occur intermolecularly and intramolecularly.
DNA transposable elements; Gene transfer, horizental; IS6100; Resistance mechanism
LI Wei-xuan, Email:lwx21cn@163.com
10.3969/j.issn.1673-713X.2019.04.009
李炜煊,Email:lwx21cn@163.com
2019-05-02