APP下载

生物信息学资源及其在医学微生物学教学中应用的体会

2020-06-06陈艳炯

医学教育研究与实践 2020年3期
关键词:信息学微生物学基因组

陈艳炯,杨 娥,寻 萌,韩 蕾,王 彪

(西安交通大学基础医学院病原生物学与免疫学系,陕西 西安 710061)

世界上的生物千姿百态、变化万千,长期以来对生物个体从孕育、出生、发育、成熟到死亡经历的过程很难用可量化的数据描述。DNA双螺旋结构的发现使人们意识到决定生命遗传性改变(变异和生命的多样性)的所有信息,都蕴藏在DNA的核苷酸序列之中。对不同物种基因组序列的解读,使人们发现代代相传的生命指令不是模拟的,而是数据的,碱基的精确序列是携带遗传信息的密码,所以产生了生命是序列的、生命是数字的概念[1]。也因此生命科学与信息科学通过数据化连接形成了生物信息学。以不同物种核酸和蛋白质序列为代表的生物学信息持续以指数形式增长,加之单细胞水平的基因和表达产物数据不断产生,在对计算机存储空间和运算能力提出新的挑战的同时,也为医学研究和医学教育增添了新的工具。医学微生物学是医学生的专业基础课程,研究对象是导致人类疾病的微生物被称为病原微生物。关于病原微生物的文献及致病基因序列及相关功能的数据非常丰富,为医学微生物学的教学和科研提供了良好的条件。

1 医学生物信息学课程可以提高医学生的信息素质[2]

医学是研究、治疗人类疾病与损伤的学科,虽然我们在感染性疾病的诊疗方面已经取得了丰硕成果,但由微生物导致的感染性疾病在过去及在将来依然是危害人类健康的重要因素。随着很多模式生物,各类微生物,包括环境中的微生物的基因和基因组序列数据大量产生,尤其是人类的基因组序列测定完成,我们已经要进入人人基因组时代,生物信息学数据库和工具在医学相关领域研究中的应用与日俱增。基因组、转录组、蛋白质组、代谢组和结构生物学研究的进步正在借助生物信息学的手段建立起人类基因与生理、病理之间关系的知识图谱,促进了从基因、蛋白质及小分子代谢产物等分子水平研究疾病的发病机理。各种新的高通量检测技术越来越成熟,分子水平生物信息检测设备应运而生并应用于临床,新一代测序技术、生物芯片技术、质谱技术及相应的专业分析系统已逐渐成为临床应用的常规工具。高通量分子生物技术的变革引导着疾病诊疗和药物应用方式的变化,原来依赖培养方法才能鉴定的微生物物种由于新技术的应用得到了极大的丰富。生物信息学的计算工具由于具备处理和分析基因组学、转录组学、蛋白质组学和表型组学等高通量技术获取数据的能力,为在分子和临床水平研究复杂和感染性疾病的发病机制提供了新的方向。这些高通量技术获取的数据已被用于疾病生物标志物发现和信号通路分析。生物计算在生物和临床医学研究中的重要性吸引了数学家、工程师、统计学家、生物学家和临床医生,并促进了他们之间的协作,这些也提升了生物信息学的发展。而这种合作提供了最快和最可靠的方式来处理、分析、存储和可视化大量数据集合并且可以评估其临床意义,也因此genomic medicine[3]、translational bioinformatics[4]以及biomedical informatics[5-6]等概念应运而生,其中biomedical informatics作为学科被较广泛应用。Biomedical informatics可以翻译为生物医学信息学或医学生物信息学,定义为研究和探索生物医学数据、信息和知识在基础科学、问题解决和决策制定中如何有效应用的跨学科领域,其目的在于通过努力改善人类健康。医学生物信息学的研究内容包括发展生物医学数据、信息和知识的产生、存储、检索、使用和共享的理论、方法,最终服务于应用;其实质是计算机、通信和信息科学技术在生物医学研究中的应用;它通过推理、建模、仿真、试验和转换可以实现各种生物系统中从分子到种群的跨越,加强了基础和临床、研究和实践、患者与医疗机构之间的联系。由于人是生物医学信息的最终使用者,医学生物信息学还试图借鉴社会和行为科学来介绍技术解决方案的设计和评估方法,以及复杂的经济、伦理、社会、教育和组织系统的演变规律。越来越多生物学领域的新技术、新方法在临床诊疗中的应用,使疾病的预防、诊断和治疗整体朝向特异性诊断、个体化治疗方向发展。基于遗传信息的决策支持系统、辅助临床医师解释分子标记数据的专家系统、智能化临床决策支持系统等将成为临床医生必不可少的工具。因此,由生物信息学、影像信息学、医学信息学和公共卫生信息学等交叉形成的医学生物信息学,将加强基础研究与临床应用的联系,为实现精准医疗奠定基础。

由于意识到医学生物信息学对医学生的重要性,我校医学部自2002年即开设了医用生物信息基础课程,目前,本科生作为选修课有《生物信息学》课,研究生专业基础课有《医用生物信息基础》课和《生物信息学》课,一直由医学微生物学教学团队担任教学任务。课程虽然受众不同,但教学目的不变,遵循医学生物信息学学科特点同时结合医学教学和科研的实际,该课程的安排始终坚持理论和实践相结合的教学理念。经过多年的发展,目前理论部分教学内容包括:①生物信息学和医学生物信息学的概念、发展历史、研究内容和方法;②生物信息学的分子生物学基础和医学生物信息学数据库;③序列比对、分子进化分析、核酸与蛋白质的序列特征分析;④高通量实验技术所产生的数据的生物信息学分析方法;⑤生物医学文献检索的基本理论和方法。旨在使医学生了解医学生物信息学基本知识,掌握生物信息学的基本理论与方法。实验部分教学内容包括:①利用文献检索工具查阅文献获取要研究的基因,在数据库中查找该基因的核酸和蛋白质序列;②利用引物设计和验证的工具,设计引物扩增该基因的靶序列;③利用BLASTN定位该基因在基因组中的位置;④分析得出该基因的蛋白质产物的理化性质、二级结构、验证其结构和功能;⑤通过分子互作分析工具研究该分子所参与的信号通路和分子互作关系。实验教学主要让每个学生通过在线操作来体验复杂的生物学数据及其相关的分析手段,深化学生理解和使用由高通量技术所产生的大量生物信息的生物学背景及其分析方法;同时与所学专业的需求紧密结合,使学生能够快速检索网上信息,了解生物医学领域的前沿知识;使医学生能够与生物信息学大型数据库建立连接,更好地为自己的医学基础课学习及临床医学实践或者生物医学研究服务。

2 生物信息学资源在医学微生物学教学中的应用

生物信息学的资源包括生物信息学数据库和在线的或者商品化的分析工具(软件或者程序)。目前生物信息学数据库呈现以下特点:①数据种类丰富、数据库复杂程度不断增加。生物信息学数据库几乎涵盖了生命科学的各个领域,既可以按照分子种类分为核酸、蛋白质等数据库,还可以按照数据特征分为序列数据库、结构数据库、分子互作数据库及系统生物学数据库等;②数据量呈指数增长趋势、数据库更新速度快。以GENBANK的统计为例,1982年12月~2016年10月,碱基数由6.80×105bp增加至3.30×1011bp,序列数已由6.06×102增加至2.13×108〔https://www.ncbi.nlm.nih.gov/genbank/statistics/(2019年6月)〕,国际核酸序列数据库协作组织(International Nucleotide Sequence Database Collaboration,INSDC)每日交换数据;③数据应用广泛、数据库使用频率不断增长。了解和掌握生物信息学方法和工具对于涉及生命科学研究的人员至关重要,有一种说法“No biology could be done without Genbank”,Genbank可作为生物信息学数据库的代表;④数据库内容形式不断优化、数据库查询网络化。美国国立生物技术信息中心(National Center for Biotechnology Information,NCBI)、欧洲生物信息学研究所(European Bioinformatics Institute,EBI)和瑞士生物信息学研究所(Swiss Institute of Bioinformatics,SIB)等生物信息学研究中心提供了大量的生物信息学资源,内容和形式不断更新,可以通过互联网查询,简单方便。

2.1 医学微生物学相关的生物信息学资源

由于感染性疾病的危害依然严重,关于病原体致病机制、变异研究的文献资源丰富,病原微生物基因组和基因的数据增长速度非常迅速。以常见的及影响比较严重的几种病原微生物如金黄色葡萄球菌、结核分枝杆菌、炭疽芽孢杆菌、梅毒螺旋体、乙型肝炎病毒、丙型肝炎病毒和人类免疫缺陷病毒(HIV)为例,我们可以从NCBI提供的pubmed和genome数据库中分别以Staphylococcus aureus、Mycobacterium tuberculosis、Bacillus anthracis、Treponema pallidum、Hepatitis B virus、Hepatitis C virus和Human immunodeficiency virus查询所获得的文献数量、基因数目和基因组大小和基因组参考序列登录号等信息,如表1。

表1 几种病原微生物在NCBI查询的相关文献和基因组信息(截至2019年7月16日)

注:数据来源于https://www.ncbi.nlm.nih.gov/pubmed和https://www.ncbi.nlm.nih.gov/genome/。

由于丙型肝炎病毒和人类免疫缺陷病毒在刚开始被发现的时候与现在使用的名称不同,所以在查询早期的文献时,要对检索词和检索结果进行选择。为了查询丙型肝炎病毒的最早记录,我们使用了“Hepatitis C”为检索词,为了查询人类免疫缺陷病毒的最早记录我们使用了因研究HIV而获得2008诺贝尔生理学或医学奖的“Barré-Sinoussi F”为检索词。虽然对人类免疫缺陷病毒的认识比较晚,但由于他在致病性和变异方面的特点以及作为逆转录病毒在揭示细胞增殖、分化和肿瘤发生方面的意义,相关报道的文献增长速度快且一直处于较高的水平,所以关于像人类免疫缺陷病毒的教学内容更新的就比较多。炭疽芽孢杆菌是最早被认识的人类致病微生物,报道的出现也最早。2000年及以前均已两位数的文献数目出现,2001年则从2000年的62篇增长为165篇,之后一直以三位数的文献数目存在,近年来有所下降,这可能与2001年911事件后的炭疽事件有关[14],也因此成为教学过程中涉及生物武器和生物恐怖相关的内容。金黄色葡萄球菌引起的感染常见,对人类的影响深远,作为病原性微生物的模式菌已经做了大量的研究,由于多重耐药的金黄色葡萄球菌尤其是社区获得性多重耐药的金黄色葡萄球菌危害严重,关于金黄色葡萄球菌的文献数量处于较高水平的状态,这也对金黄色葡萄球菌的教学内容提出了新的要求。教科书中包含的是该领域相对成熟且获得较多一致认同的内容,虽然也在不断更新,但在教学过程中跟踪文献可以了解相关领域的最新研究进展,在教学内容中要有适当的体现。

图1 2000年至今几种微生物相关的文献统计(截至2019年7月16日)

图1是几种微生物2000年至今的年文献数量的变化趋势,可以看出人们对几种微生物的研究热情不同,但不论是对古老的结核病的病原体还是相对较新的艾滋病(Acquired Immune Deficiency Syndrome,AIDS)的病原体的研究都有其相对恒定发展进程。也体现出人类与病原微生物的斗争是长期和持久的过程及人类与微生物相生相克的关系。值得关注的是从文献的数量以及从疾控中心(https://www.cdc.gov/std/stats17/default.htm)的统计来看,近年来梅毒的发病情况有所加剧,需要引起人们的重视。

2.2 医学微生物学相关的生物信息学资源的应用

基因组数据库中不同完成阶段的菌株/毒株数既反映出对不同病原微生物研究的热度,也和测序难度和变异程度有关。截至2019年7月16日从NCBI的基因组数据库(https://www.ncbi.nlm.nih.gov/genome/)获取的处于不同完成水平的金黄色葡萄球菌以10 513个菌株,已完成的430株,和其他所列出的微生物相比遥遥领先。在细菌和病毒的遗传和变异章节中我们对细菌和病毒的基因组、遗传变异特点和机制会做比较详细的讨论,但如果能结合基因和基因组数据库的内容无疑会增进对细菌和病毒的遗传和变异的进一步理解。介绍病原微生物的致病因子是医学微生物学的重要内容,尤其对像金黄色葡萄球菌、乙型肝炎病毒等,在教学过程中在重点介绍教科书中所列出的致病因子的同时,给学生介绍细菌和病毒编码基因相关的生物信息学资源,对学生深入全面了解病原体的致病机制具有重要的意义。

医学微生物学是研究病原微生物的生物学性状、致病性、免疫性、微生物学检测方法及防治原则的学科,是重要的医学专业基础科目,为临床医学、预防医学、口腔医学、护理学和法医学专业必修课。不仅教师,学生也可以利用在线的生物信息学的资源掌握几乎所有病原微生物在生物学性状、致病机制、诊断和防治原则等方面的研究进展。下面以乙型肝炎病毒(hepatitis B virus,HBV)为例,说明教师在教学过程中如何应用生物信息学资源更好地帮助学生掌握重点、简化难点了解进展、增加兴趣点。

关于HBV的教学,重点是要求学生掌握HBV的形态、结构与抗原组成;HBV的传染源和传播途径;微生物学检查。难点是HBV的基因组结构与复制方式和HBV抗原抗体系统的检测结果及临床意义。表2列出的HBV的基因信息,使我们可以进一步理解乙肝病毒基因组双链未闭合环状DNA分子的结构及其编码蛋白的功能和位置特点,加深对乙肝病毒基因编码区重叠及在复制过程中首先形成共价、闭合、环状DNA分子(covalently closed circularDNA,cccDNA)的理解。

表2 乙肝病毒的基因信息

注:基因位置以基因组参考序列NC_003977.2为基础。

HBV的危害严重但致病机制迄今尚未完全明了,乙肝慢性化的机制及HBV感染与原发性肝癌的关系研究备受关注。疫苗预防取得了良好的效果,但目前的治疗方法很少能达到功能治愈即乙肝表面抗原(HBsAg)清除或使cccDNA失活的目的,更不用说消除cccDNA。即使取得HBsAg清除的效果,免疫抑制后也可能复发。其中的关键障碍是感染细胞的细胞核中持续存在的复制中间体cccDNA,可以作为质粒样分子用作病毒RNAs合成的模板,cccDNA检测方法及应用还有待研究。对整合在宿主基因组中的HBVDNA的失活研究也受到人们重视[15-16]。

在课程教学过程中首先参考教材,同时注重最新的关于每一种病原体的相关文献及其基因和基因组数据查询,借助更丰富和更新的网络资源,帮助学生更好地掌握医学微生物学的重点和难点问题,了解最新的研究进展,为培养学生的创新能力奠定基础。

3 结语

18世纪英国著名作家、评论家、词典编纂人Samuel Johnson(1709-1784)说过:知识分为两种,一种是我们自己掌握的知识,另一种是我们知道在哪里可以找到有关它的信息[17]。医学生对于医学知识的学习又何尝不是如此,生物信息学资源不仅在医学微生物学的教学过程中有重要的应用价值,丰富的在线信息资源也为师生其他课程的教学提供了很好的帮助。借助生物信息学教学可以培养学生不仅对于信息有敏锐的感受力、持久的注意力和对信息价值的判断力、洞察力,而且具备确定信息需求的时机、选择信息源、高效获取信息、处理评估信息、有效利用信息的能力;同时注重知识产权的保护、医学信息使用的伦理和法律规范;使学生最终获得终身学习的能力,在拥有更好的职业生涯的同时为人类健康事业做出更大的贡献。

猜你喜欢

信息学微生物学基因组
路易斯·巴斯德:微生物学之父
微生物学实验引入“项目式”分组模式的应用探讨
牛参考基因组中发现被忽视基因
鸡NRF1基因启动子区生物信息学分析
科学家找到母爱改变基因组的证据
血清HBV前基因组RNA的研究进展
食品科学与工程专业开展微生物学双语教学实践
初论博物馆信息学的形成
紫花白及基因组DNA提取方法的比较
中欧医学信息学教学对比研究