良恶性胆道梗阻患者胆汁16S rRNA测序及菌群差异分析
2022-09-21唐睿漪钟源葛贤秀张春梅朱汉龙刘嘉宁缪林
唐睿漪,钟源,葛贤秀,张春梅,朱汉龙,刘嘉宁,缪林
胆道梗阻(obstruction of biliary tract,OBT)为胆道急腹症患者中的死亡率相对较高的另一个常见病症,导致了胆管的堵塞,胆汁郁积,并且容易继发感染。导致急性胆道梗阻发生的器质性病变可大致上分为以下二种,即为良性的病变与为恶性疾病。良性胆道病变中以原发性胆道结石黄疸为临床最为常见,其次才是慢性胆管的炎症性的狭窄症(如十二指肠乳头狭窄、急慢性胆管炎等)黄疸,胆道的良性肿瘤黄疸(如胆总管囊肿等)黄疸,一些胆道良性疾病黄疸症的反复发生,其最明显的黄疸伴随的表现症状是左上腹有隐痛,发寒发热,腹部性质通常为胀痛绞疼为重,有时候绞疼为明显表现,既往有多次多次发作的病史,通常发病呈急性或亚急性[1]。恶性胆道阻塞(malignant biliary obstruction,MBO)是由于恶性肿瘤的挤压或直接转移造成胆管狭窄,胆汁排泄受阻,其恶性疾病常见的病因包括胆管癌、肝门内段胆管癌、肝门部胆管癌、胰头占位性的病变、壶盂腹癌变及其他一些不常见原因所致的肝胆管及其旁系组织上的癌肿、其他癌肿导致的胆管周围肿大淋巴结压迫单管等。有研究表明,由于胆汁排泄障碍,引起肠道菌群转移,继而引起病毒感染进而发生脓毒血症而危及生存[2-3]。了解胆道梗阻患者菌群分布特点及良恶性病变的差异有助于提高术前抗感染水平,降低术后并发症风险,改善患者术后生命质量。本文通过前瞻性研究,收集了胆管梗阻患者的胆汁样本,对初发、复发与恶性胆道梗阻患者胆汁进行16S rRNA测序,分析其菌群组成差异性。
1 资料与方法
1.1 研究对象
选取南京医科大学第二附属医院2017年3月至2018年11月因胆道梗阻行ERCP手术的36例患者,将其分成三组:A组为15例首次行ERCP手术的胆道良性梗阻病人,年龄段47~91岁,男8例,女7例;B组为13例良性胆道梗阻复发行ERCP手术的病人,年龄段67~92岁,男7例,女6例;C组为8例因恶性胆道梗阻行ERCP手术的病人,年龄55~87岁,男6例,女2例。三组性别、年龄差异无统计学意义。
1.2 纳入及排除标准
纳入标准:①年龄18~92岁;②胆道梗阻并成功施行ERCP的患者;③自愿参加研究,由患者或家属签订知情同意书。
排除标准:①ERCP时有全身感染迹象的患者;②伴随心、肺、肾等功能障碍、其他恶性肿瘤的患者;③孕妇等特殊人群;④根据指南需术前使用抗生素者;⑤一周内因任何原因接受光谱抗生素治疗的患者。
本研究经南京医科大学第二附属医院伦理委员会批准。
1.3 样品采集流程
对入组的病人在ERCP术前与其谈话,取得患者及其家属同意。进行治疗性ERCP时,十二指肠镜插镜到十二指肠乳头,经乳头插管至胆总管,灌注造影剂前,利用无菌灌注器抽出6~7 mL胆汁,密封后-80 ℃冰箱分装保存。以上过程均执行严格的无菌操作。
1.4 16S rRNA基因扩增及测序
取得DNA样品后,对样品进行检测[4];检验合格的样本建立文库:回收目的扩增子片断,用T4 DNA Polymerase、Klenow DNA Polymerase和T4 PNK将打断产生的粘性部分恢复成平末端,再透过3′端加碱基“A”,可使DNA片断能与3′端具有“T”碱基的特异接头相连;或者设计组合具有测序链接头的双Index融合引物,以基因组DNA为模版,经过融入引物PCR,磁珠检测目的扩增子切片,最后一步用合格的文库完成cluster复制和测序。
下机数据经过数据过滤,滤除低质量的数据,剩余高质量的有效数据(clean data)方可用于后期分析;通过数据之间的叠加关系将数据连接成Tags;在给定的类同度下将Tags聚成OTU( Operational Taxonomic Units),然后通过OTU与数据库比对,对OTU进行物种注释,每个OTU被认为代表不同的微生物物种[5];根据OTU和物种注释结果开展样本种类复杂性数据分析及其组间种类差异性数据分析。
1.5 统计学方法
本技术研究的测序和生物学信息由华大基因股份有限公司负责。
1.5.1 OTU分布情况
拼接的Tags经过优化后,全部样本选择样本中最小的Tags条数,在97%相似度下将其聚合为用作生物类别的OTU,计算各个样本在各个OTU中的丰度数据信息。各组之间的OUT数量也不同,Venn图用于统计组间差异OTUs的交并集情况[6],不考虑OUT丰度,只考虑OUT有无。
1.5.2 物种累积曲线分析
物种累积曲线(species accumulation curves)常用于表述不断增大取样量后种类增长趋势的情形。该曲线的含义是指,随着样品量的增多,OTU数量不断增多,曲线逐渐趋于平缓,表明肠道菌群的数量已达到平衡,即使再加大样品量,菌群的种类及数量也不会有变化[7]。如果曲线反而越来越陡峭,这就表明目前的样本量还不够,OTU 数量太少,所以需要再加大样本量。
1.5.3 PCA分析
主成分分析(PCA)是一种将多元数据集线性转换为一组不相关变量的方法,按解释的方差降序排列。通过这种方法,我们可以解释前几个常常解释大量变异的成分,来确定相似要求的样本组合是不是存在相似性[8]。
1.5.4 PLS-DA分析
偏最小二乘判别分析(Partial least squares Discriminant Analysis, PLS-DA)可以构建体内代谢物表达量与样本类型相互之间的关系模型,来进行对样本类型的估计。
1.5.5 α多样性分析
α多样性(Alpha diversity)主要用于分析样本内部的物种组成群落多样性[9]。型图可以直观反映三组样品菌群组成多样性的最大值、最小值、中位数及离散程度。根据未经过滤的OTU计数,计算每组的阿尔法多样性指数包括:测序深度指数、丰度-覆盖率估计器(ACE)、Chao1、Shannon、Simpson。测序深度指数包括观察到的物种(observed Species)和物品覆盖(Good′s coverage):观测到的生物指标代表该样本中包含的生物总量,数值越高说明样本生物富集度越高[10],ACE和Chao1指数用于评估组间富集度的差异,而Simpson和Shannon指数用于衡量均匀度。从一组样品统计中随意取二个OTU,它们归属于不同物种的几率,这一几率越大代表样品的生物复杂性越高,反之越低,该指标用于评价优势种在群落中的地位和作用。运用Wilcox秩和检验对三组患者胆汁菌群之间的差异进行分析。P<0.05为差异有统计学意义。
1.5.6 β多样性分析
为了评估Beta多样性,我们使用Bray-Curtis距离,Unweighted Unifrac距离和weighted UniFrac距离测度方法分析评估[11]。Unifrac 分析得到的距离矩阵可用于多种分析方法,可通过多变量统计学方法PCoA 分析,直观显示不同环境样品中微生物进化上的相似性及差异性[12]。PCoA(principal co-ordinates analysis)是一种研究数据相似性或差异性的可视化方法,通过PCoA 可以观测个体或群体间的差异[13]。β-多样性在0.05水平上具有统计学意义。
1.5.7 LEfse分析
LEfse(LDA Effect Size)分析方法,能够完成多种分类之间的对比,还通过分类对比的内部进行亚组比较分析方法,进而找出各组间在丰度上有明显差别的物种。LDA 分数绝对值≥2.0被认为是显著差异。
2 结果
2.1 物种组成和丰度差异
2.1.1 OTU分布情况分析
如图1所示,A组有473个OTU,B组有258个OTU,A组与B组交叉181个;C组有491个OTU,与A组交叉261个。花瓣图可显示各样本间共有和特有的OTUs,从花瓣图可知,36例患者共有OTU个数为2。
图1 OUT Venn图及花瓣图
2.1.2 物种累积曲线分析
图2为本次研究中三组胆道梗阻患者的胆汁的物种累积曲线图,从中可以看出,随着样本量不断增加,曲线逐渐平缓,样本中包含的菌群种类及数量也趋于平衡,这表明选取的样本量是合格的,可以进行后续的试验。
图2 物种累积曲线
2.1.3 PCA分析
基于OTUs水平,得到36例样品的PCA分析结果(图3),良性初发组与良性复发组比较PC1贡献值为31.8%,PC2贡献值为23.13%(图3A),良性初发组与恶性组比较PC1贡献值29.34%,PC2贡献值20.54%(图3B),三组一起比较可见PC1贡献值为30.34%,PC2贡献值为20.91%(图3C),这说明三组样品在菌群组成差异性上没有很好的区分开,其统计学差别不显著。
2.1.4 PLS-DA分析
基于OTUs水平,得到36例样品的PLS-DA分析结果(图4)。可以发现良性复发组包含在了良性初发组和恶性组里,但是良性初发组和恶性组的差异较大。
2.2 样品复杂度分析
2.2.1 α多样性分析
如图5所示,恶性胆管梗阻组的患者对比两组良性胆管梗阻患者的菌群,在观察到的物种指数分析、Chao1指数分析、ace指数分析和Shannon指数上明显升高(P<0.05),而Simpson指数明显降低,在物品覆盖分析指数上无明显差异(P>0.05)。但良性初发和良性复发胆管梗阻患者的菌群无明显差异。这表明恶性胆管患者胆汁中菌群的丰度和多样性明显高于良性患者,胆汁菌群的组成收到了恶性肿瘤的影响,而复发的患者胆汁菌群的丰度和多样性无明显改变。
图3 主要成分分析图 A:良性初发组与良性复发组的PCA分析;B:良性初发组与恶性组的PCA分析;C:良性初发组、良性复发组与恶性组的PCA分析
图4 PLS-DA分析
2.1.2 β多样性分析
如图6所示,三组样本基于Bray-Curtis距离的PCoA第一主成分、第二主成分与第三主成分分别30.93%、19.94%与14.41%,如图7、8所示基于Unweighted UniFrac、weighted UniFrac的三种主成分分别为18.28%、9.27%、7.18%和42.50%、25.91%、9.27%。我们发现这些样品没有明显的分离趋势,通过β多样性分析,表明这三个群体的物种组成没有统计学差异。
2.1.3 LEfse分析
LDA评分绝对值≥2.0时,两组良性组间有15个种之间存在明显差别,其中10个富集于良性初发组,即氏菌属(Roseburia)、代尔夫特菌(Delftia)、寡养单胞菌(Stenotrophomonas)、生丝微菌科(Hyphomicrobiaceae)、红游动菌属(Rhodoplanes)、副球菌属(Paracoccus)、红杆菌科(Rhodobacteraceae)、黄单胞菌科(Xanthomonadaceae)、黄单胞菌目(Xanthomonadales ),红细菌目(Rhodobacterales)有5个富集于良性复发组,即互养菌门(Synergistetes)、Pyramidobacter、Dethiosulfovibrionaceae、Synergistia、Synergistates。恶性组间有13个种之间存在显著差异,即链球菌属(Streptococcus)、Stretococcaceae、Pyramidobacter、互养菌门(Synergistetes)、Synergiatia、Dethiosulfovibrionaceae、Synergistales、假单胞菌科(Pseudomonadaceae)、(假单胞菌)Pseudomonas、Weeksellaceae、Flavobacteriia、Flavobacteriales、Chryseobactrium。
图5 α多样性分析箱型图 A:观察到的物种指数分析;B:Chao1指数分析;C:ACE分析;D:Shannon指数分析;E:Simpson指数分析;F:物品覆盖分析
图6 Bray-Curtis距离 A:A组和B组的Bray-Curtis距离;B:A组和C组的Bray-Curtis距离;C:B组和C组的Bray-Curtis距离
图7 Unweighted UniFrac距离 A组和B组的 Unweighted UniFrac距离;B:A组和C组的 Unweighted UniFrac距离;C:B组和C组的 Unweighted UniFrac距离
图8 Weighted UniFrac距离 A组和B组的Weighted UniFrac距离;B:A组和C组的 Weighted UniFrac距离;C:B组和C组的Weighted UniFrac距离
图9 LEfse分析 A:良性组间的差异种;B:恶性组间的差异种
3 讨论
胆管梗阻是十分常见的肝胆疾病,导致的一般类型可分成良性胆管梗阻和恶性胆管梗阻,导致良性胆管梗阻的一般病因有胆道结石、胆管炎性狭窄和先天生胆道生长发育异常等,而恶性胆管梗阻临床诊断上也极为普遍,导致的病因多是中晚期恶性肿瘤,一般包含胆管细胞癌、壶腹部肿瘤、胆囊癌、肝细胞肝癌、胰腺癌和胃癌、结肠癌、卵巢癌及子宫癌等转移或侵犯胆管[14]。目前认为结石的复发与结石大小、体脂指数、结石成分有关[15],但现阶段关于菌群组成对复发性胆道疾病的影响报道少之又少。在人体健康的情况下胆道和胆汁都是无菌的[16],而有些胆系病变患儿的胆汁病菌培育结果显示却为阳性,且国外尸检报道患有胆系病变患者中胆囊壁细菌检出约占23%,胆汁样品中监测到的菌株占8%左右[17]。通常状况下肝细胞分泌胆汁的最高排出压是30 cm H2O,而且无胆汁反流,患者不会出现感染症状。而胆在胆道梗阻时,胆汁反流的压力会升高,最大分泌压为20 cm H2O,会出现胆汁分泌被抑制和引流不畅,胆汁会逆流入血液,加重患者的感染症状,而且肿瘤患者免疫力低下导致条件致病菌入侵、胃肠功能紊乱和胆盐缺乏影响胆汁的肝肠循环,这些因素都会导致肠道菌群失调,致病菌经小肠移位至十二指肠增加胆系感染的几率[18]。大量研究表明,恶性胆管梗阻常见的致病菌分别是大肠埃希菌、肺炎克雷伯杆菌、肠杆菌属和肠球菌属,良性胆管梗阻的主要致病菌分别是大肠埃希杆菌、肠球菌属、铜绿假单胞菌等,胆系感染的细菌和肠道菌群存在着一致性,表明胆系感染多为肠源性感染[19]。胆总管下部开放于十二指肠大乳头,当病人出现胆道梗阻时,胆总管扩张,肝胰壶腹括约肌功能收到损害,小肠病菌逆行入侵胆总管定植和增殖,导致胆总管内菌群失调[20,21]。
近年来,随着分子生物学领域的快速发展,基于细菌16SrDNA基因的高通量测序技术已成为细菌群落和物种鉴定的首选方法,成本较低,数据库更新迭代。越来越多的证据表明,疾病不是由病原体单独决定的,而是由病原体、常驻微生物群和宿主免疫反应之间的复杂平衡决定的。本研究采用16srDNA技术对良性初发组、良性复发组和恶性组胆道梗阻的患者的胆汁标本进行检测,初步探讨三组间的差异。良性初发组有473个OTU,良性复发组有258个OTU ,恶性组有491个OTU。从OTU的积累曲线和稀释曲线来看,随着样本量的增加,曲线逐渐变平,样本菌群的OTU趋于稳定,说明36例的样本量足够,测量数据量合理,测序深度基本达到。通过多角度比较胆道微生物区系,阿尔法多样性分析表明,恶性胆道梗阻的患者胆汁微生物区系丰度增加,而两组良性患者胆汁菌群多样性差异不显著。各组间PCoA和Beta差异分析显示,良恶性胆管梗阻的患者胆汁细菌组成无显著差异。这些结果说明恶性胆道梗阻患者胆管内微生物种类较多,但良恶性胆管梗阻的患者个体没有明显变化。在组间,三组差异最大的分别为氏菌属、互养菌门和链球菌属。以上提示胆道梗阻患者ERCP后胆道菌群的变化不一定与复发性胆道梗阻相关,但对恶性胆道梗阻的形成有一定的影响。