APP下载

常见医学真菌DNA条形码BLAST数据库的建立

2015-12-13刘沐桑张莉莉吕桂霞沈永年胡素泉刘维达

中国麻风皮肤病杂志 2015年7期
关键词:条形码真菌检索

刘沐桑 张莉莉 吕桂霞 沈永年 胡素泉 刘维达

常见医学真菌DNA条形码BLAST数据库的建立

刘沐桑 张莉莉 吕桂霞 沈永年 胡素泉 刘维达∗

目的: 构建我国重要医学真菌DNA条形码BLAST数据库。方法: 对28种医学真菌的ITS-rDNA序列(DNA条形码)进行测定和汇总,并使用NCBI提供的数据库工具将汇总的序列构建成DNA条形码数据库。结果: 构建的医学真菌DNA条形码数据库包括28种中国常见医学真菌的DNA条形码序列,利用数据库对待测真菌标本的DNA条形码序列进行检索,能进一步确定真菌类型。结论: 本实验构建的医学真菌DNA条形码数据库可以用于医学真菌的分子鉴别。

医学真菌; DNA条形码; BLAST检索; 数据库

DNA条形码(DNA barcode)是一种统一的DNA标志序列,通常来源于某个基因或者它的部分序列,能提供对某一大类生物物种适用的分子鉴定标志。1能够在人体致病的真菌已近400种,人的深部以及浅表真菌感染都有增多趋势,2且还不断出现新的真菌物种感染人体的报道。3由于不同医学真菌的侵袭定植性质、毒力和药敏谱以及相关疾病的预后常有很大不同,因此准确地鉴定菌种对临床成功诊治有重要意义。建立医学真菌的DNA条形码系统可以实现对真菌分子鉴别的统一化,是一项有意义的科学实践。

目前真菌界最通用的DNA条形码序列是核糖体DNA的内转录间区(internal transcribed spacer,ITS)序列,不同于动植物常用的细胞色素基因序列。4ITS基因作为分子标记的优点是拷贝数多,而且扩增过程简便,需要引物组合的数目也比较少。52012年发表的一项真菌DNA条形码综合研究表明,ITS序列基本适合用于真菌条形码编制。6在此前的一项研究中,对我国临床上最常见的8种医学真菌做了DNA条形码的初步研究,发现基于ITS区序列的条形码对真菌种内保守,而在种间具有显著差异,条形码可以用于鉴别我国常见真菌的种类。7

基本局域连配检索工具(basic local alignment search tool,BLAST)是由美国国家生物信息中心(National Center for Biotechnology Information,NCBI)开发的序列查找和对比工具,BLAST及其相关数据库是快速进行数据查找匹配的有力工具。8目前BLAST工具及其数据库可以通过自行构建的方法脱机运行,即通过本地数据库进行查找,而无需连接到美国NCBI的中央数据库。本地数据库可以由研究者自己提供的序列构建,使得查找更具针对性,速度更快,结果更准确。

本研究中,我们测定常见的28种医学真菌的ITS序列,用于医学真菌的物种鉴别,从而覆盖临床大多

数常见真菌感染病例。在此基础上,我们构建了我国常见真菌感染的医学真菌DNA条形码数据库。该数据库整合了BLAST检索服务工具,临床标本测序结果可通过该服务对数据库进行检索和比对,从而起到快速诊断的作用。

1 材料与方法

1.1 菌株 本研究使用菌株取自中国微生物菌种保藏委员会医学真菌保藏中心标准菌株,具体如下:断发毛癣菌(Trichophyton tonsurans)、克柔念珠菌(Issatchenkia orientalis)、季也蒙念珠菌(Pichia guilliermondii)、新生隐球菌(Cryptococcus neoformans)、阿萨西毛孢子菌(Trichosporon asahii)、糠秕马拉色菌(Malassezia furfur)、球形马拉色菌(Malassezia globosa)、合轴马拉色菌 (Malassezia sympodialis)、黄曲霉(Aspergillus flavus)、黑曲霉(Aspergillus niger)、烟曲霉(Aspergillus fumigatus)、多变根毛霉 (Rhizomucor variabilis)、茄病镰刀菌(Fusarium solani)、串珠镰刀菌(Fusarium verticillioides)、链格孢霉(Alternaria alternata)、出芽短梗霉(Aureobasidium pullulans)、卡氏枝孢瓶霉(Cladophialophora carrionii)、新月弯孢霉(Curvularia lunata)、膝状弯孢霉(Cochliobolus geniculatus)、皮炎外瓶霉(Exophiala dermatitidis)、甄氏外瓶霉(Exophiala jeanselmei)、须癣毛癣菌(Trichophyton mentagrophytes)、近平滑念珠菌(Candida parapsilosis)、石膏样小孢子菌(Microsporium gypseum)、热带念珠菌(Candida tropicalis)、红色毛癣菌株(Trichophyton rubrum)、光滑念珠菌(Candida glabrata)、白念珠菌(Candida albicans)。

1.2 试剂与仪器 DNA提取使用Fast DNA®SPIN试剂盒(美国MP Bio公司)。PCR实验用TaKaRa TaqTM聚合酶、dNTP、PCR缓冲液、100 bp电泳分子量Marker均来源于宝生物工程(大连)有限公司。PCR和测序所用引物由上海生工公司合成。核酸提取使用FastDNA SPN试剂盒及其配套的Bio 101 Fastprep-24核酸提取仪都是购自MP Bio公司(美国)。培养基为实验室自行配制的马铃薯葡萄糖琼脂培养基(PDA)。

1.3 DNA提取和纯化 样品真菌接种于PDA培养基,28℃培养7~10 d,收取上层真菌约100mg放置到5 mL玻璃组织研磨器中进行研磨,并按照FastDNA SPN试剂盒说明书进行真菌DNA的提取。详细如下:先加入1 mL CLS-Y缓冲液振荡混匀,然后孵育20 min(室温),放到Fastprep核酸提取仪上以5.0/s的速度振荡30 s,再孵育30 min;然后用14 000 r/min离心5 min,上清移至新管中;加入600μL Binding matrix混匀后进行5 min孵育;然后在12 000 r/min离心1 min,取沉淀加入500μL SEWS-M吹打混匀,再次离心取沉淀干燥30 min;加入100μL DES吹打混匀,12 000 r/min过柱离心洗脱1min。洗脱下来的核酸放-20℃保存备用。

1.4 PCR扩增与测序 根据文献,采用了真菌通用引物ITS1(正向:5′-TCCGTAGGTGAACCTGCGG-3′)和ITS4(反向:5′-TCCTCCGCTTATTGATATGC-3′)扩增ITS基因。PCR反应体系如下:2.5 mmol/L dNTPs 4μL,10×缓冲液5μL,10 mmol/L MgCl23μL,10 μmol/L引物各1μL,Taq DNA聚合酶2 U,模板DNA 2μL,双蒸水将余下体积补至总体积50μL。反应条件:预变性95℃ 5 min;变性95℃ 45 s;退火53℃ 45 s;延伸 72℃ 75s,共30个循环,最末延伸72℃ 7 min。PCR产物送至上海生工生物公司纯化并测序。测序结果使用SeqMan软件(DNA Star软件包)进行拼装,并根据测序峰图对序列进行手工核对,形成完整ITS区核酸序列,存为FASTA格式文本文件,即医学真菌的DNA条形码序列。

1.5 整合BLAST检索服务数据库的构建 在我单位工作站计算机上安装美国国家生物信息中心(NCBI)提供的BLAST-2.2.29软件工具包。首先将28株医学真菌的ITS区核酸序列存为单一的FASTA格式文件ITS_barcode_db.fas,然后使用BLAST-2.2.29工具包的makeblastdb命令对上述序列文件进行数据格式化和索引化(参数:-in ITS_barcode_db.fas-db type nucl),形成可供BLAST检索的本地数据库。

1.6 数据库的检索使用 取我中心保藏的经过鉴定的烟曲霉临床株,标记为h 47号真菌标本。按1.3~1.4中描述方法提取DNA扩增ITS区DNA条形码并进行单侧测序,测序结果取中段峰图清晰308 bp保存为test1.txt文件。使用本地数据库的blastn命令将待检索测序结果对数据库进行检索(参数:-query test1.txt-db ITS_barcode_db.fas-out result1.txt),结果自动存于result1.txt文件。

2 结果

2.1 真菌DNA条形码序列 所得28株医学真菌的条形码序列(ITS rDNA序列)最短的是链格孢霉(301 bp),最长的是糠秕马拉色菌(806 bp)。序列间差异最小的是断发毛癣菌和须癣毛癣菌(7 bp),差异最大的是季也蒙念珠菌和糠秕马拉色菌(349 bp)。

2.2 BLAST检索服务的数据库的建立 序列数据经过BLAST-2.2.29工具包格式化后生成数据库由以下三个文件构成,分别为ITS_barcod_db.fas.nhr、ITS_ barcod_db.fas.nin和ITS_barcod_db.fas.nsq。上述三个文件分别是数据库的库索引(indices),序列(sequences)和头(headers)文件,三者共同构成完整数据库。根据Makeblastdb命令运行结果判断数据库构建成功。数据库包含共28条核酸序列,总容量14 337

字节。

2.3 数据库的检索应用实例(待测标本h 47号的ITS-rDNA测序结果) 对数据库进行Blast检索,结果见图1和图2。Blast检索的相似显著性E值(EValue)的阈值默认为10-10。数据库中检索到的与提交序列具有显著相似性的医学真菌DNA条形码序列(E值<10-10)共有20条。与提交序列最为相似的三条数据库记录均为曲霉菌,分别是烟曲霉,黑曲霉和黄曲霉。相似性最显著的烟曲霉序列,其相似度打分为569,相似显著性E值为10-165。图2为数据库的blast工具(核酸序列检索)对提交序列与烟曲霉序列进行联配比对的结果。两条序列完全相同(identtities=100%),而且提交序列与数据库中存储的烟曲霉序列反向互补(Strand=Plus/Minus)。根据标本的DNA条形码对医学真菌DNA条形码数据库进行检索和比对的结果,我们判定h 47号标本为烟曲霉。此结论与我中心根据h 47号临床分离株的菌落形态学和显微形态学进行的标准鉴定结果一致。

图1 h 47号标本的ITS-rDNA序列在本数据库的检索结果

图2 h 47号标本的ITS-rDNA序列与烟曲霉序列联配比对结果(部分)

3 讨论

真菌是在人体引起感染的常见病原体之一,常引起浅部真菌病。此外,近年来由于移植手术和免疫抑制剂的广泛应用,深部真菌病对人类健康的威胁也日渐增加。因此,对医学真菌进行分类鉴别工作的重要性也尤其凸显出来。分子鉴别是目前除宏观形态学和显微形态学外的最有效手段,具有操作简便、速度快和无需专门培训技术人员等许多优越性。而DNA条形码作为统一鉴别生物物种的分子生物学技术,在真菌鉴别上也得到了广泛应用。9

真菌的ITS和核糖体RNA编码DNA(ITS-rDNA)是最早制定的真菌DNA条形码序列;在论证过程,也有人尝试使用线粒体COX1基因序列作为DNA条形码来实现真菌在物种水平的鉴别和分类。10但是,最近一项较大规模的研究指出,作为真菌DNA条形码的标记分子,ITS-rDNA序列相对其他真菌基因具有较大优点。6因此,在本研究中,我们基于ITS-rDNA序列的真菌DNA条形码的测定和汇总,并使用美国生物信息中心提供的数据库工具,最终使我们的数据形成医学真菌DNA条形码数据库。与原始的FASTA格式的序列文件不同,构建成功的数据库文件为二进制执行代码,不可进行文本阅读和编辑,但是可使用BLAST检索工具将未知序列提交数据库进行匹配查找,并将提交序列与数据库中的序列做联配比对。经过试验,通过我们的医学真菌DNA条形码数据库的比对鉴别结果与传统形态学鉴定的结果一致,数据库可有效辅助医学真菌的鉴别。而且检索和比对分析过程完全在本地计算机进行,无需连接网络,更无需连接到美国生物信息中心(NCBI)的生物序列数据库。

为便于推广数据库的应用,在本数据库中我们尝试使用中文字符标注真菌名称,但是由于目前NCBI提供的BLAST工具包(2.2.29版)尚不支持多语言功能,格式化数据库时出错。因此,我们在序列名称后使用竖括号(‖)间隔标注汉语拼音名称,顺利通过数据库格式化。这样,我们对数据库进行检索和比对操作时,结果可以同时显示拉丁文学名和汉语拼音标注,更加方便了使用。

本研究在对28株我国常见医学真菌的条形码序列(即ITS-rDNA序列)的测定和汇总的基础上,构建了我国医学真菌DNA条形码数据库。该数据库可用于对未知医学真菌标本的条形码测序结果进行检索和比对,从而实现基于DNA条形码的医学真菌分子鉴别。在以后的工作中,我们将继续增加医学真菌DNA条形码数据库的菌种数量,并计划建立相应网站加以推广和应用。

1 Hebert PD,Ratnasingham S,deWaard JR.Barcoding animal life:cytochrome c oxidase subunit 1 divergences among closely related species.Proc Biol Sci,2003,270(Suppl 1):S96-99.

2HofH.Developments in the epidemiolgy of invasive fungal infec-

tions-implications for the empiric and targeted antifungal therapy.Mycoses,2008,51(Suppl 1):1-6.

3Wang JL,Chang CH,Young-XY,et al.Systematic review and meta-analysis of the tolerability and hepatotoxicity of antifungals in empirical and definitive therapy for invasive fungal infection. Antimicrob Agents Chemother,2010,54(6):2409-2419.

4 Seifert KA,Crous PW.The all-fungi DNA barcoding campaign (FunBOL).Persoonia,2008,20:106.

5 Taylor JW,Geiser DM,Burt A,et al.The evolut ionary biology and population genetics underlying fungal strain typing.Clin Microbiol Rev,1999,2(1):126-146.

6 Schoch CL,Seifert KA,Huhndorf S,et al.Nuclear ribosomal internal transcribed spacer(ITS)region as a universal DNA barcode marker for Fungi.Proc Natl Acad Sci USA,2012,17 (16):6241-6246.

7刘沐桑,梅缳,吕桂霞,等.8种病原真菌DNA条形码的构建和应用评价.中国麻风皮肤病杂志,2012,(5):311-313.

8 Zhang Z,Schwartz S,Wagner L,et al.A greedy algorithm for aligning DNA sequences.JComput Biol,2000,7(1-2):203-214.

9Begerow D,Nilsson H,Unterseher M,et al.Current state and perspectives of fungal DNA barcoding and rapid identification procedures.App l Microbiol Biotechnol,2010,87(1):99-108.

10 Seifert KA,Samson RA,Dewaard JR,et al.Prospects for fungus identification using CO1 DNA barcodes,with Penicillium as a test case.Proc Natl Acad Sci USA,2007,104(10):3901-3906.

(收稿:2014-10-09 修回:2014-11-16)

Construction of BLAST database ofmedical fungiDNA barcode

LIU Mu-sang,ZHANG Li-li,LVGui-xia,etal.Institute ofDermatology,Chinese Academy ofMedical Sciences and Peking Union Medical College,Nanjing,210042

Objective:To construct BLAST database ofmedical fungi DNA barcode.M ethods:ITS-rDNA regions(DNA barcode)of 28 species of themedical fungiweremeasured and the DNA barcode data base was constructed by using database tools provided by National Center for Biotechnology Information(NCBI).Results:Twenty-eighty DNA barcode sequences of medical fungi DNA barcode database were established.The specie of fungi could be confirmed by BLAST database ofmedical fungi DNA barcode.Conclusion:BLAST database ofmedical fungiDNA barcodewere constructed successfully and can be used formolecular identification ofmedical fungi.

medical fungi;DNA barcode;BLAST search;database

人力资源和社会保障部留学人员科技活动项目择优资助项目协和青年基金和中央高校基本科研业务费专项资金(编号: 33320140189)江苏省临床医学科技专项(编号:BL2012003)科技部科技基础性工作专项(编号:2013FY113700)

中国医学科学院北京协和医学院皮肤病研究所,南京,210042∗通信作者

猜你喜欢

条形码真菌检索
创意条形码
LC-MS在真菌毒素检测中的研究进展
高等大型真菌与人类
中国高等大型真菌的主要代表物种
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
从条形码到二维码
有趣的条形码
真菌病害怎样正确选择杀菌剂?
条形码也有春天