科研导向的农学类专业生物信息学教学内容改革
2018-05-14陈志雄王少奎李亚娟
陈志雄 王少奎 李亚娟
摘要 生物信息学是一门生命科学与计算机科学、统计学等学科相互渗透而形成的综合性学科,广泛应用于生命领域科学研究。针对农学类专业课程设置、学生知识背景及农业科学研究热点需要,提出生物信息学课程教学过程在必要理论基础知识学习的基础上,针对农学专业的研究目的,设置功能模块化教学内容,将分布各章节的知识点融汇贯通,提高农学类专业学生分析问题和解决问题的能力,适应后基因组时代农业科学研究,满足现代社会对农业创新型人才的需求。
关键词 科研导向;生物信息学;教学内容;农学
中图分类号 S-01 文献标识码 A 文章编号 0517-6611(2018)32-0234-03
Teaching Contents Reform of Bioinformatics in Agricultural Science Specialty from Scientific Research Orientation
CHEN Zhixiong1, WANG Shaokui1, LI Yajuan2
(1.College of Agriculture, South China Agricultural University, Guangzhou, Guangdong 510642;2.Center of Experimental Teaching for Commom Basic Courses, South China Agricultureal University, Guangzhou, Guangdong 510642)
Abstract Bioinformatics is a comprehensive discipline formed by life sciences, computer science and statistics, which is widely used in scientific research in the life field. This paper summarized the curriculum of agronomy majors, the background of students knowledge and the hotspots of agricultural science research. The setting of functional modular teaching content was proposed on the basis of the necessary theoretical basic knowledge during the teaching process of bioinformatics course. The knowledge points of each chapter would be redistributed, reorganized and integrated in different functional modular teaching content. The setting of functional modular teaching content aimed to improve the ability of agronomy students to analyze and solve problems, adapt to the agricultural science research in the postgenome era, and meet the needs of modern society for innovative agricultural talents.
Key words Research orientation;Bioinformatics;Teaching content;Agronomy
基金項目 国家自然科学基金项目(31271688);广东省自然科学基金项目(2018A030313090);广东省省级教改课题(201619);2016年华南农业大学校级教改课题。
作者简介 陈志雄(1975—),男,福建莆田人,副研究员,博士,从事作物遗传育种和生物信息学研究。*通讯作者,高级实验师,博士,从事作物遗传育种研究和遗传学实验教学与研究。
收稿日期 2018-09-11
生物信息学是随着人类基因组计划的实施而兴起的一门新学科,综合运用了信息学、数学、计算机和生物学的的方法和技术,管理和利用DNA、RNA和蛋白质等生物分子数据,揭示数据所蕴含的生物学意义。生物信息学已融合到生命科学各个领域,成为生命科学不可分割的重要组成部分[1]。近年来,随着第二代测序技术和PacBio RS单分子实时测序系统的推出,测序成本大幅下降,大大促进了作物基因组测序工作的开展。2017年启动的“万种植物基因组计划,将在5年内对10 000种植物的基因组进行测序。面对已经产生或即将产生的海量基因组数据,亟需强有力的工具挖掘有用的信息、发现农作物的重要基因、加快基因克隆等,以推进生物多样性、生态保护及各种重要基础科研和农业应用转化问题的研究。生物信息学已成为农业科学家开展科研工作的重要工具,同时也是农学相关专业本科生必须掌握的基本知识和技能。因此,各农业院校应大力开展生物信息学课程教学,培养大量了解农业知识的生物信息学人才。笔者结合农业院校的专业特点和生物信息学教学过程中遇到的实际问题,制定科研导向的农学类专业生物信息学教学内容,以激发作物学专业本科生对生物信息学的学习兴趣,提高农业院校生物信息学课程的教学效果。
1 农学类专业生物信息学教学面临的主要难题
1.1 学生专业基础较差
农学类专业学生在知识面及综合技能上相对较窄,对信息学知识接触得不多,对信息学的认识仅限于使用电脑编辑文本和上网等基础应用,未深入学习计算机语言、编程等。大多数农业院校学生的英语基础不好,难以适应生物信息学数据库、分析软件、文献资料的英文环境,在学习生物信息学时感觉难度较大,学习的积极性受到打击,从而导致学生学习生物信息学的兴趣下降。同时,本科生深入接触科学研究的机会较少,其学习的目的主要是通过考试和拿到学分,很难意识到生物信息学知识对将来学习和工作的重要性。
1.2 课程安排学时不充裕
农业院校以培养农业人材为目的,开设的课程主要是农业生产相关的课程,而对计算机语言、编程等课程未深入学习,未意识到生物信息学对未来农业科研和发展的重要性,一般将生物信息学视为一门普通的选修课。近年来,随着各种新技术和新理论的发展,人类获得生物数据的能力越来越强,大量数据的积累进一步推动了生物信息分析技术的开发,而生物信息学涉及的学科越来越多,教学内容涉及生物化学、分子生物学、遗传学、基因工程、计算机语言及数据库等相关知识等相关知识以及不断更新的数据库和软件,需要学生花费更多时间去理解与运用。丰富多样的课程内容与较少学时之间的冲突,为完整系统授课带来一定难度。
1.3 缺乏适合教材
生物信息学涉及到的学科越来越多,各种生物信息学专著及教材种类不断涌现。以“生物信息学”为题名检索本校图书馆馆藏书目,有62种与生物信息学相关的教材或专著。各种专著侧重点不同,内容繁杂,涉及人类医学、疾病研究、药物设计等领域的教材较多,而涉及农学的内容几乎没有。部分教材专业性过强,难度较大,不适于农学专业学生使用。各教材内容丰富,但缺少连贯性,在解决农业院校学生所遇到的专业问题时实用性差。因此,很难选到合适的教材是农学专业生物信息学教学的一大难题。
2 针对农学专业特点,设置模块化的生物信息学教学内容
针对农学类专业生物信息学教学学时少、缺乏合适教材、学生知识基础与结构差异大等问题,借鉴各兄弟院校的经验[2-5],在突出生物信息学的应用性和系统性的基础上[6],从农业院校人才培养的目的和专业特色出发[7],选择和设置实用、易学、有一定深度的教学内容,围绕生物学知识、农业研究热点展开生物信息学课程教学,使学生愿意接受生物信息学课程,从而轻松学习、掌握与运用生物信息学知识。
农学以谷类、豆类等农作物的生理生化、栽培育种等为研究对象,围绕农作物的优质、高产、抗逆等性状进行表型、遗传等方面研究。农学类专业课程设置特点使学生对基因的复制、转录和翻译、基因功能较熟悉。农学类专业生物信息学课程主要围绕基因功能、基因表达和系统进化三方面内容(表1),在必要的理论基础学习的基础上,以功能模块为中心的理论与实践融合的教学模式,在有限的学时内,寓教于科研实践,教学内容简单实用,提高了生物信息学的教学强度和教学效果,为学生将来从事科研实践奠定坚实的基础。
2.1 必要的基础知识学习
2.1.1 基础理论知识。生物信息学的学科基础分为生物学基础知识、数学基础知识和计算机及网络基础知识。农学类本科生学习完生物化学、植物学和遗传学等专业基础课程,对染色体、基因、中心法则有较深的理解,对生物学知识较为熟悉,已积累了必需的生物学基础知识。因此,绪论部分简要介绍数学、计算机及网络基础知识,着重介绍生物信息学的狭义定义以及数据库、序列分析和基因表达等生物信息在科研实践中的应用,让学生意识到生物信息学在农业科研中的重要性,并且强调生物信息学的实践应用特点。
2.1.2 基础数据库。生物信息学相关数据库有一级数据库、二级数据库,贮存了生物大分子(DNA、蛋白质)序列、结构、表达、相关文献等海量信息。NCBI是当今世界上最大的分子生物学研究的综合性数据库,为生物医学及生命科学研究提供了大量的数据和众多的分析工具与平台,因此NCBI成为生物信息学数据库的教学重点之一。科研中常用的数据库有核苷酸数据库(GenBank、EMBL和DDBJ)、蛋白质序列、结构数据库(UniProt、PIR、PDB、PFAM、SMART、Prosite等)、基因表达数据库(GEO)、代谢通路数据库(KEGG)、基因本体数据库(GO)等生命科学相关数据库,在农业科学研究中发挥着重要的作用。作为农学类专业的生物信息学课程,应着重介绍2种模式植物拟南芥基因组数据库(TAIR)和水稻基因组数据库(RAP-DB、RGAP),了解并熟悉作物和模式植物比较基因组数据库(Gramene)、植物基因组资源(Phytozome)、基于基因芯片的植物表达数据库(PLEXdb)、水稻表达数据库(RiceXPro)等,它们是农业分子生物学研究最基础的批量数据来源,为农学类学生需要了解甚至可运用到科研活动中的资源。
2.1.3 序列联配工具。生物信息学计算的核心是序列联配,BLAST是最常用的核酸和蛋白质同源性比较工具。教学内容包括序列比较算法(Needle-man-Wunsch、Smith-Waterman、Karlin-Altchul)、得分矩阵(PAM、BLOSUM、DNA替换矩阵)、BLAST种类及使用、在线BLAST使用方法和参数设置及结果解读。这些基础知识的学习有助于学生了解生物信息所涉及的问题、掌握解决问题的基本方法,并将知识融会贯通。
2.2 基于基因功能研究方向的生物信息学教学内容设置
随着越来越多物种的基因组测序工作完成,生命科学研究已迈入功能基因组时代。基因功能验证技术包括过表达、RNA干扰和反义RNA技术、基因敲除等技术[8],这些技术核心环节是载体设计与构建。因此,该部分内容重点讲解和分析基因的结构(外显子和内含子)、启动子序列、编码区,掌握蛋白质预测表达部位、跨膜结构和信号肽等理论知识。实践课内容设置选用作物基因家族为研究对象,从数据库搜索并下载序列,利用生物信息学常用的EditSeq、引物设计软件、限制性内切酶识别软件等,设计过表达、RNA干扰和载体构建,指导分子生物学试验,达到研究基因功能的目的。根据基因表达水平和部位的概念和原理,介绍多种载体构建所涉及的基础理论知识、实验过程采用的软件及注意事项,减轻学生对基因序列的陌生感,增加学生的兴趣和解决问题的能力。
2.3 基于基因表达谱研究方向的生物信息学教学内容设置
基因表达是基因功能研究的重要内容之一。单个基因表达的常用试验方法有半定量RT-PCR、定量RT-PCR和Northern雜交等。基因芯片技术可以高通量分析生物全基因组的表达模式,筛选特定组织、特定阶段或特定生理过程中表达的功能基因。这部分内容简要介绍基因芯片的种类、制备和信号检测过程,重点讲解芯片数据处理与分析以及数据反映出的生物学意义。然后,选择一种作物的基因家族,利用PLEXdb检索基因家族的表达模式,通过PLEXdb提供的Blast工具找到对应的探针号,利用探针号查找不同生育时期、不同器官、不同生物胁迫或非生物胁迫下的基因表达值,通过MEV、Clustal和Treevies软件图形化显示各个基因的表达量,从复杂的数据凝炼出生物学意义。在学时保证的情况下,可安排或参考《DNA和蛋白质数据分析工具》(第3版)中的“基因芯片数据处理和分析”从全基因组水平进行基因表达聚类分析和差异表达基因筛选。