全球副溶血弧菌环境菌株的基于碱基序列和肽链序列的多位点序列分型
2015-12-26徐嘉良杜小莉
徐嘉良,杜小莉,卢 昕,*
(1.北京工商大学食品学院,食品添加剂与配料北京高校工程研究中心,北京 100048;2.中国疾病预防控制中心传染病预防控制所,传染病预防控制国家重点实验室,北京 102206)
全球副溶血弧菌环境菌株的基于碱基序列和肽链序列的多位点序列分型
徐嘉良1,杜小莉2,卢 昕2,*
(1.北京工商大学食品学院,食品添加剂与配料北京高校工程研究中心,北京 100048;2.中国疾病预防控制中心传染病预防控制所,传染病预防控制国家重点实验室,北京 102206)
为了了解来自全球的副溶血弧菌环境菌株的群组结构和克隆复合体构成,利用PubMLST公共数据的数据,筛选其中具有完整序列分型(sequence type,ST)及肽序列型(peptide sequence type,pST)的来自全球的副溶血弧菌环境菌株数据,进行亚群分析和克隆复合体分析,并分别构建了基于ST型和pST型的最小生成树。结果表明,从数据库中共筛选到具有ST型及pST型的来自全球的副溶血弧菌环境菌株数据886 条,共含有663 个ST型,以ST3型为最多,但也仅含27 条菌株信息。其中,有436 条菌株数据来自中国(包括大陆、香港和台湾),覆盖了410 个ST型,每个ST型含1~4 条菌株数据,这436 条菌株数据又可分为128 个pST型,其中pST1型为最多,达116 条菌株数据。利用eBURST软件对数据进行分析,共发现了73 个组,483 个单体。STRUCTURE软件分析显示来自全球的副溶血弧菌环境菌株的适宜亚群数为4,各亚群内的样品平均距离为0.981 7。综上结果表明,来自全球的副溶血弧菌环境菌株具有高度多态性,可更细分为4 个亚群,MLST分型时以ST3型为多,AA-MLST分型时以pST1型为主。
副溶血弧菌;基于碱基序列的多位点序列分型;基于肽链的多位点序列分型;克隆复合体
副溶血弧菌(Vibrio parahaemolyticus)属于弧菌科弧菌属,菌体呈弧状、杆状等形态,革兰染色呈阴性。1950年,Fujino在日本的一次食物中毒中首次发现并成功分离培养到副溶血弧菌[1]。食用含有副溶血弧菌的食物可能引发食源性胃肠道炎症,少数情况下还可引发败血症,危及患者生命。该菌主要来自于海产品,常见者为蟹类、乌贼、海蜇、鱼、黄泥螺等,其次为蛋品、肉类或蔬菜,已在全球频繁引起食物中毒事件[2]。从遗传角度和血清型角度看,副溶血弧菌都存在高度多态性。目前,副溶血弧菌包括13 种不同的O抗原和71 个不同的K抗原[3-4],但与霍乱弧菌(Vibrio cholera)不同,目前的研究显示副溶血弧菌的致病性并不与特定的血清型相关,目前有71 种血清型的副溶血弧菌均可以引起胃肠炎[5]。自1996年起,副溶血弧菌在全球地区开始暴发,其中以O3:K6血清型的副溶血弧菌为主要的暴发菌株。之后,开始在全球迅速传播。
近年来,随着分子生物学和基因组学的发展,一些分子分型技术,如扩增片段长度多态性分析技术(amplified fragment length polymorphism,AFLP)[6]、随机扩增多态性DNA片段(random amplified polymorphic DNA,RAPD)[7]、核糖体基因分型[8]、脉冲场凝胶电泳(pulsed-field gel electrophoresis,PFGE)[9]、多位点序列分型(multilocus sequence typing,MLST)[10]和多位点可变数目串联重复序列分析(multilocus variable number tandem repeat analysis,MLVA)[11]等,已广泛应用于细菌鉴定、分型溯源、种群结构、遗传进化分析及分子流行病学[12-13]的调查和食品安全溯源等方面研究[14]。MLST方法因其丰富的数据库可研究不同地域不同来源的菌株遗传变异情况,已被用于区分副溶血弧菌[15]。副溶血弧菌的MLST在2008年由González-Escalona等[16]提出,由7 个基因片段获得菌株的序列分型(sequence type,ST)。随后2014年,Urmersbach等[17]在副溶血弧菌的群体结构分析中又提出了基于肽链序列的多位点分型(amino acid multilocus sequence typing,AA-MLST)方案。由于副溶血弧菌遗传上的多态性,尤其是环境菌株呈现出高度多态性,因此应用AA-MLST进行菌株遗传关系研究可能会得到更为可信的结果[17]。本研究将采用MLST方案和AA-MLST方案分别研究来自PubMLST数据库中的来自全球地区的副溶血弧菌环境菌株的群体结构,为我国副溶血弧菌的预防控制提供参考,通过采取针对性的手段,减少致病性的环境菌株对食品的污染,为保障我国的食品安全提供理论依据。
1 材料与方法
1.1 数据
全部数据均来自于截止到2015年2月10日之前的PubMLST公共数据库(http://pubmlst.org/ vparahaemolyticus/),共有来自于全球副溶血弧菌的1 689 条数据,其中包括临床菌株(分离自病人)和环境菌株(分离自外环境水体和水产品中)。筛选其中的环境菌株,且具备ST型信息及肽序列型(peptide suquence type,pST)的数据条目,共筛选出886 条,用于后续分析。
1.2 克隆群结构分析
采用eBURST version 3(http://eburst/mlst.net)对数据进行克隆复合体的分析,分析中采用了1 000次Bootstrap重排。本研究中,限定7 个管家基因中必须有6 个及以上相同的归为同分型组,若该组中含4 个及以上的ST型,该组即为一个克隆复合体(clonal complex,CC),并确定其中一个ST型在进化关系上可能是祖先ST型,定为起源。不属于任何1 个克隆复合体的ST型被称为单体。
1.3 STRUCTURE软件分群
应用STRUCTURE2.3.4软件,计算来自全球的副溶血弧菌环境菌株归属第k亚群的概率Q值。在确定亚群数时,选择独立等位基因频率模型,依次设定亚群数目K为1~11,将马尔科夫链蒙特卡洛(Markov chain Monte Carlo,MCMC)迭代设为110 000 次,去掉前10 000 次,每个K重复独立运行4 次。
1.4 Bionumerics分析
采用Bionumerics软件分别对MLST数据及AA-MLST数据进行分析,构建最小生成树,以菌株来源国家或菌株来源地区(亚洲、拉丁美洲、欧洲、美洲)为颜色区分,圆圈大小代表菌株数量,研究不同国家来源菌株群体结构和遗传进化关系,比较MLST方案及AA-MLST方案对数据的分析结果。
2 结果与分析
2.1 MLST数据基本分析
从数据库中共筛选到具有ST型及pST型的来自全球的副溶血弧菌环境菌株数据886 条,用于后续分析,国别(菌株数据量)分别为:孟加拉(7)、智利(19)、中国(包括大陆、香港和台湾)(436)、丹麦(8)、厄瓜多尔(30)、德国(27)、洪都拉斯(2)、印度(3)、印度尼西亚(1)、日本(1)、韩国(1)、马来西亚(1)、墨西哥(1)、荷兰(3)、挪威(17)、西班牙(4)、斯里兰卡(43)、泰国(116)、英国(1)、美国(161)、越南(4)。在886条数据中,共含有663 个ST型,其中ST3型(3、4、19、4、29、4、22)所含数据数最多,但也仅为27 条。在886 条菌株数据中,有436 条菌株数据来自中国(包括大陆、香港和台湾),覆盖了410 个ST型,每个ST型含1~4 条菌株数据,这436 条菌株数据又可分为128 个pST型,其中pST1型为最多,达116 条菌株数据。
2.2 eBURST克隆复合体分析
采用eBURST分析,886 条菌株数据中,可以分为663 个ST型,包含了73 个组,483 个单体。其中CC34群为含ST型别最多的克隆复合体,包括了来自7 个ST型(ST34、ST334、ST35、ST77、ST324、ST95、ST33)的24 株菌株数据,这其中ST34型被认为是CC34群的祖先型。CC3群为含菌株数最多的克隆复合体,包括了来自4 个ST型(ST3、ST266、ST220、ST2)的30 株菌株数据,其中ST3型被认为是CC3群的祖先型。
2.3 STRUCTURE对亚群的划分
STRUCTURE软件分析结果显示,LnP(D)和α1在亚群数为4时有明显的拐点,因而确定来自全球的副溶血弧菌环境菌株群体的适宜亚群数为4(图1)。各亚群之间的F值变化范围是0.010 1~0.012 2,平均值为0.011 1。STRUCTURE软件分群各亚群内样品的平均距离为0.980 6~0.984 0,均值为0.981 7。
图1 全球副溶血弧菌环境菌株群体归属于4 个亚群的后验概率图Fig.1 A posteriori probability graph of worldwide environmental Vibrio parahaemolyticus strains belonging to 4 subgroups
2.4 AA-MLST数据基本分析
从数据库中共筛选到具有pST型的来自全球的副溶血弧菌环境菌株数据886 条,共含有187 个pST型,其中pST1型(1、1、1、1、1、1、1)所含数据数最多,可达228 条。pST2型(2、1、1、1、1、1、1)所含数据数次之,可达188 条。根据pST型分析克隆群结构,显示pST75、pST92、pST221、pST178、pST153、pST79、pST148、pST125、pST142、pST147和pST175与其他pST型有多于1 个等位基因的差异。
2.5 最小生成树的构建
Bionumerics软件应用Prim算法,根据各等位基因型之间的差异对不同ST型进行分组聚类,找到各ST型进化关系上共同的祖先,最终生成最小生成树(minimum spanning tree,MST)。在MST图中(图2、3),每个圆代表一种ST型,圆圈大小与菌株数目成正比。比较eBURST软件与Bionumerics软件的分析结果发现,两种算法对克隆复合体及祖先ST型的认定存在一定差异,而且Bionumerics软件对基于MLST数据和AA-MLST数据的克隆复合体分析也存在差异。并不是同属于一个ST型克隆复合体的菌株也会划归于同一pST型克隆复合体中。世界各地报道的副溶血弧菌环境菌株呈现出高度多态性,并没有特别优势的克隆群存在,且副溶血弧菌的血清型分型与MLST分型及AA-MLST分型结果均表现出不同,基于ST型的分析找到比基于pST型数据分析更多的克隆复合体。
图2 全球副溶血弧菌886 株环境菌株基于MLST分型方案数据的最小生成树Fig.2 Minimum spanning tree based on MLST of 886 worldwide environmental Vibrio parahaemolyticus strains
由图3可知,有些ST型的分布比较局限,仅分布于一个国家或一个大洲,而有些ST型则广泛分布于多地,如ST3型在美洲、拉丁美洲、亚洲均有分布;ST711型分布于拉丁美洲和亚洲;ST539型分布于拉丁美洲和美洲;ST471型分布于欧洲和亚洲;ST424型分布于亚洲和拉丁美洲;ST246分布于拉丁美洲和亚洲;ST141型也欧洲和美洲均被发现;ST121型目前在欧洲和亚洲均被检测到;ST114型为美洲和亚洲分布;ST56型为拉丁美洲和亚洲分布;ST28型分布于拉丁美洲和欧洲;ST12型分布于美洲和亚洲;ST6型分布于拉丁美洲和欧洲。亚洲有507 个ST型,欧洲有38 个ST型,美洲有94 个ST型别,拉丁美洲有36 个ST型别。由此可见,亚洲的副溶血弧菌环境分离株的型别和多样性要显著高于其他洲。
图3 全球副溶血弧菌886 株环境菌株基于AA-MLST分型方案数据的最小生成树Fig.3 Minimum spanning tree based on AA-MLST of 886 worldwide environmental Vibrio parahaemolyticus strains
3 讨 论
国内外副溶血弧菌食物中毒暴发主要原因与生食海鲜和海产品污染有关[18]。也包括肉制品、腌制品和一些凉菜等[19],由副溶血弧菌引起的食物中毒事件居细菌性食物中毒的首位[20-21],开展全球副溶血弧菌环境菌株的群体遗传学特征研究对中国的副溶血弧菌的预防控制具有重要意义。在副溶血弧菌中,血清学在追溯流行性克隆复合体传播上是不可靠的[16]。而MLST是以选定的管家基因序列分析为基础的,可更好地揭示同一个属中菌株间的遗传亲缘关系[22]。2014年,有研究者对来自国际上17 个沿海城市的副溶血弧菌临床菌株进行了MLST分析,发现490 株菌可分为161 个ST型,8 个克隆群复合体,其中以CC3型为主[23]。本研究采用来自PubMLST公共数据库中的来自全球地区的副溶血弧菌环境菌株,进行了MLST及AA-MLST分型方案分析,研究全球副溶血弧菌环境菌株的群体结构和克隆群复合体组成。从数据库中共筛选到具有ST型及pST型的来自全球的副溶血弧菌环境菌株数据886 条,共含有663 个ST型,这说明来自全球地区的副溶血弧菌环境菌株的高度多态性。其中有436 条菌株数据来自中国(包括大陆、香港和台湾),覆盖了410 个ST型。由此可以看出,副溶血弧菌的环境菌株比临床菌株体现出更高的遗传多样性。因为副溶血弧菌环境菌株的遗传高度多态性,因此确定菌株之间遗传相关可能缺乏可信度,因此基于肽链顺序的AA-MLST方案可能更适合副溶血弧菌的群组结构分析[24],于是在本研究中也采用了基于pST型的分析。从结果中,可以发现有些型别是跨洲分布的,这提示这些型别可能更适合外界坏境,有着更广泛的分布,人们在外环境监测时需格外注意这些型别的发现。亚洲的副溶血弧菌环境分离株的型别和多样性要显著高于其他洲,这提示作为亚洲国家,应该密切关注副溶血弧菌在环境中的进化变异。与其他研究结果一致[21],本结果也显示副溶血弧菌的血清型分型对其流行病学研究价值有限。因此,本研究认为在副溶血弧菌的监测中,应将分子分型纳入到菌株分型中,在全球副溶血弧菌环境菌株整体呈现高度多态性的大环境下,也应该引起我国专业技术人员和食品安全监督部门的警示,对于环境中的副溶血弧菌可能引起的养殖和食品加工过程中的污染,尤其是海产品,比如副溶血弧菌传播的主要媒介:虾、蟹、牡蛎等海产品污染食品中的副溶血弧菌要加大监测力度,此外,在监测工作中的重点是关注不同克隆群的副溶血弧菌,加强对环境污染的监测和管理,这样可及时掌控分离自环境中的副溶血弧菌的群体遗传构成、优势菌群变化,预警致病类似菌株在海产品中的分布变化以及可能的危险食品,为暴发疫情和人群中流行菌株的溯源提供基础数据,采取必要的措施减少食源性疾病暴发和流行[25]。
[1] FUJINO K. Discovery of Vibrio parahaemolyticus[J]. Nihon Saikingaku Zasshi, 1951, 21(8): 373-388.
[2] ALAM M, ChOwDhURy w B, BhUIyAN N A, et al. Serogroup, virulence, and genetic traits of Vibrio parahaemolyticus in the estuarine ecosystem of Bangladesh[J]. Applied and Environmental Microbiology, 2009, 75(19): 6268-6274.
[3] 李维彬, 郭辰虹, 王玉炳. 病原微生物快速检测方法及研究进展[J].生物技术通报, 2006(2): 67-70.
[4] hARAKUDO y, DEPAOLA A. Pathogenic vibrios and food safety[M]. New York: Nova Science Publishers Inc., 2012: 179-210.
[5] NAIR G B, HORMAZáBAL J C. The Vibrio parahaemolyticus pandemic[J]. Revista Chilena de Infectologia, 2005, 22(2): 125-130.
[6] VANDENBERGHE J, VERDONCK L, ROBLES-AROZARENA R, et al. Vibrios associated with Litopenaeusvannamei larvae, postlarvae, broodstock, and hatchery probionts[J]. Applied and Environmental Microbiology, 1999, 65(6): 2592-2597.
[7] SADOK K, MEJDI S, NOURhEN S, et al. Phenotypic characterization and RAPD fingerprinting of Vibrio parahaemolyticus and Vibrio alginolyticus isolated during Tunisian fish farm outbreaks[J]. Folia Microbiology (Praha), 2013, 58(1): 17-26.
[8] CHEN Wanyi, XIE Yanping, XU Jingye, et al. Molecular typing of Vibrio parahaemolyticus isolates from the middle-east coastline of China[J]. International Journal of Food Microbiology, 2012, 153(3): 402-412.
[9] hAENDIGES J, ROCK M, MyERS R A, et al. Pandemic Vibrio parahaemolyticus, Maryland, USA, 2012[J]. Emerging Infectious Diseases, 2014, 20(4): 718-720.
[10] HAN Dongsheng, TANG Hui, REN Chuanli, et al. Prevalence and genetic diversity of clinical Vibrio parahaemolyticus isolates from China, revealed by multilocus sequence typing scheme[J]. Front Microbiology, 2015, 6: 291. doi:10.3389/fmicb.2015.00291.
[11] KIMURA B, SEKINE y, TAKAhAShI h, et al. Multiplelocus variable-number of tandem-repeats analysis distinguishes Vibrio parahaemolyticuspandemic O3:K6 strains[J]. Journal of Microbiological Methods, 2008, 72(3): 313-320.
[12] 张蔚, 潘劲草, 陈坤. 副溶血性弧菌的分子流行病学研究进展[J]. 国外医学: 流行病学传染病学分册, 2004, 31(3): 182-184.
[13] 鲁开国, 史英辉. 副溶血弧菌的分子生物学研究进展[J]. 中国卫生检验杂志, 1994, 4(5): 314-316.
[14] 刘丁. 细菌基因分型技术方法及其评价[J]. 国外医学: 临床生物化学与检验学分册, 2002(4): 220-222.
[15] TURNER J, PARANJPyE R N, LANDIS E D, et al. Population structure of clinical and environmental Vibrio parahaemolyticus from the Pacific Northwest coast of the United States[J]. PLoS ONE, 2013, 8(2): e55726. doi: 10.1371/journal.pone.0055726.
[16] GONZáLEZ-ESCALONA N, MARTINEZ-URTAZA J, ROMERO J, et al. Determination of molecular phylogenetics of Vibrio parahaemolyticus strains by multilocus sequence typing[J]. Journal of Bacteriology, 2008, 190(8): 2831-2840.
[17] URMERSBACh S, ALTER T, KORALAGE M S, et al. Population analysis of Vibrio parahaemolyticus originating from different geographical regions demonstrates a high genetic diversity[J]. BMC Microbiology, 2014, 14(3): 106-111.
[18] 刘秀梅, 陈艳, 郭云昌, 等. 2005年中国食源性疾病暴发事件监测资料分析[J]. 中国食品卫生杂志, 2008, 20(6): 506-509.
[19] 林祥田. 94起副溶血弧菌食物中毒流行病学特征分析[J]. 上海预防医学, 2006, 18(3): 141-143.
[20] 李薇薇, 梅玲玲, 唐震, 等. 2007—2009年中国副溶血性弧菌临床分离株分子特征分析[J]. 中华预防医学杂志, 2014, 48(1): 44-52.
[21] 李婧, 邱少富, 宋宏彬, 等. 沈阳地区副溶血弧菌毒力基因检测及脉冲场凝胶电泳分析[J]. 中国公共卫生, 2012, 28(5): 696-698.
[22] ELLIS C N, SChUSTER B M, STRIPLIN M J, et al. Influence of seasonality on the genetic diversity of Vibrio parahaemolyticus in New Hampshire shellfish waters as determined by multilocus sequence analysis[J]. Applied and Environmental Microbiology, 2012, 78(10): 3778-3782.
[23] HAN Dongsheng, TANG Hui, LU Jingye, et al. Population structure of clinical Vibrio parahaemolyticus from 17 coastal countries, determined through multilocus sequence analysis[J]. PLoS ONE, 2014, 9(9): e107371. doi:10.1371/journal.pone.0107371.
[24] YAN Yanfeng, CUI Yujun, HAN Haihong, et al. Extended MLST-based population genetics and phylogeny of Vibrio parahaemolyticus with high levels of recombination[J]. International Journal of Food Microbiology, 2011, 145(1): 106-112.
[25] 樊晓琳, 张德福, 付绪磊, 等. 锦州笔架山海域海产品中副溶血弧菌的分子流行病学调查[J]. 食品工业科技, 2014, 35(16): 49-51.
Multilocus Sequence Typing of Global Environmental Strains of Vibrio parahaemolyticus Based on Nucleotide and Peptide Sequences
XU Jialiang1, DU Xiaoli2, LU Xin2,*
(1. Beijing Higher Institution Engineering Research Center of Food Additives and Ingredients, School of Food and Chemical Engineering, Beijing Technology and Business University, Beijing 100048, China; 2. State Key Laboratory for Infectious Disease Prevention and Control, National Institute for Communicable Disease Control and Prevention, Chinese Center for Disease Control and Prevention, Beijing 102206, China)
Objective: To understand the group structure and clonal complex of worldwide environmental Vibrio parahaemolyticus strains. Methods: Worldwide environmental V. parahaemolyticus strains with complete sequence types (ST) and peptide sequence types (pST) were screened from the PubMLST public database, the subgroup analysis and complex analysis was conducted, and the minimum spanning tree was established based on ST and pST types. Results: From the database, 886 items were screened for analyzing the ST and pST types of worldwide environmental V. parahaemolyticus strains, which belonged to 663 ST types with ST3 type being the most dominant, but only containing information on 27 strains. Out of these, 436 items came from China (including mainland, Hong Kong and Taiwan), including 410 ST types, each of which contained information on 1-4 strains and these 436 strains could be divided into 128 pST types, with pST1 type being the most dominant type, containing information on 116 strains. The eBURST software was used to analyze the data and 73 groups and 483 singletons were observed. Analysis with the software STRUCTURE showed that appropriate subset number of global V. parahaemolyticus strains was 4, and the average distance between samples in each subgroup was 0.981 7. Conclusion: Worldwide environmental V. parahaemolyticus strains in Asia are characterized by high polymorphism and can be subdivided into 4 subgroups. ST3 type is the most dominant strain when MLST typing is used while pST1 type is the most dominant strain by AA-MLST typing.
Vibrio parahaemolyticus; multilocus sequence typing; peptide based multilocus sequence typing; clonal complex
Q939.99
A
1002-6630(2015)21-0095-05
10.7506/spkx1002-6630-201521019
2015-05-18
国家自然科学基金青年科学基金项目(31400161);北京工商大学青年教师科研启动基金项目(QNJJ2014-25)
徐嘉良(1984—),男,讲师,博士,研究方向为食品质量安全控制。E-mail:xujialiang@btbu.edu.cn
*通信作者:卢昕(1981—),女,副研究员,博士,研究方向为肠道致病微生物的进化分析。E-mail:luxin@icdc.cn