阿萨希毛孢子菌的全基因组测序
2013-04-08李海涛摘译杨蓉娅
李海涛 摘译 杨蓉娅 校
阿萨希毛孢子菌(Trichosporon asahii, T. asahii)是一种重要的酵母样真菌,广泛存在于自然环境和定植于人体的部分组织器官中。在医学上,T. asahii 作为一种条件致病性真菌,可通过吸入、破损皮肤、污染食物或水源等途径进入人体内或在人体内易位而使人类致病,特别是肿瘤和人免疫缺陷病毒(HIV)感染晚期患者、器官移植、免疫抑制、免疫缺陷或免疫低下宿主更易感。在人类主要引起皮肤浅表感染、夏季超敏性肺炎以及内脏器官的深部感染。近年来在免疫正常人群也开始不断有该菌播散性感染的报道。目前的体外药敏试验和临床治疗显示,除了唑类药物外,该菌对大多数一线抗真菌药均耐药,一旦在机体造成了播散性、系统性的深部感染,治疗难度大,病死率较高。
在农业上,T. asahii 是一些发酵食物发酵过程中的重要酵母菌,如乌干达酥油、中国大曲酒、非洲和巴西的一些木薯发酵食物、西非的可可豆、加纳的可可粉、意大利奶酪等。在工业上,由T. asahii 产生或从T. asahii 分离的一些酶可作为工业用酶、工业废水的处理、清洗油渍的洗涤剂、烟草香气的产生等多个方面。
本课题组从2010 年8 月~2012 年5 月,历时22 个月,解开了T. asahii 标准株(CBS 2479)与环境株(CBS 8904)的全基因组序列,包括核染色体基因组测序和线粒体基因组测序;测序采用的是第2 代测序技术Solexa+454联合应用的策略,结果如下:
CBS 2479 的核染色体基因组共包含了24271268bp 碱基(24.27Mb),线粒体基因组包含了32568bp 碱基;核染色体GC 含量平均56%,线粒体28.9%;核基因组共包括8300 个蛋白编码基因,509 个tRNA 编码基因;线粒体基因组包括11 个蛋白编码基因,14 个tRNA 编码基因。COG 分析预测并将3131 个蛋白编码基因归为23 个功能分类中,其中722 个基因具有一般的功能,713 个基因功能未知。该菌株的基因组数据已提交美国国立生物技术信息中心(NCBI),并获得序列号:ALBS00000000。
CBS 8904 的核染色体基因组共包含了25015122bp 碱基(24.27 Mb),线粒体基因组包含了32568bp 碱基;核染色体GC 含量平均59%,线粒体29%;核基因组共包括8507 个蛋白编码基因,530 个tRNA 编码基因;线粒体基因组包括22 个蛋白编码基因,25 个tRNA 编码基因。COG 分析预测并将3307 个蛋白编码基因归为23 个功能分类中,其中703 个基因具有一般的功能,709 个基因功能未知。该菌株的基因组数据已提交NCBI,并获得序列号:AMBO 00000000。
对这两株菌的基因组进行了初步比较发现:核基因组的相似度为99.59%,线粒体基因组的相似度为99.99%。CBS2479 和CBS8904 有8161 个同源编码序列,CBS8904有368 个特异基因,但绝大多数功能未知。