APP下载

单细胞转录组测序教学中的实践研究

2022-12-02林长松邵娇芳汪强虎

科教导刊 2022年30期
关键词:单细胞容器测序

林长松,邵娇芳,武 剑,汪强虎

(南京医科大学 江苏 南京 211166)

近些年兴起的单细胞转录组测序技术已经成为生物医药研究中的一把利剑,在研究肿瘤异质性,发育等方面起着重要的作用,是生物信息学本科生教学中不可或缺的一块内容。然而单细胞转录组测序产生的数据量巨大,从下机数据处理到后续分析也是异常复杂,并且分析环境也多种多样,极大地增加了教学难度,因此需要老师对整块教学内容进行有效编排。

1 单细胞转录组测序教学所面临的问题

单细胞转录组测序是一门新兴学科,不单单是转录组测序的延续,目前国内很少学校开设该课程[1-3]。教学中面临的两大问题:①单细胞转录组分析环境复杂,涉及众多R 包和python 软件包,分析环境难以配置,学生需要耗费大量时间用以配置分析环境,是学习单细胞转录组过程中主要的障碍;②涉及众多知识点,学生容易掌握单个知识点,但难以融会贯通,串成一根主线,分析完整的案例时显得力不从心;如果老师继续使用传统的讲授方式,学生无法产生学习兴趣,对单细胞转录组测序内容难以理解,并且学生不能理解单细胞转录组测序这门课设置的目的与意义,无法激发学好一门学科应该有的积极性,因此恰当的教学方式就显得尤为重要。于是,在此情形下,突破传统的大课堂,导入其他教学模式是极为必要的。为了解决配置环境方面的问题,引入容器化技术,基于singularity 构建单细胞分析的R 环境容器文件以及shell 环境下的容器文件,彻底解决单细胞转录组分析环境的软件配置难题。在教学方法上,采用问题导向式学习(problem-based learning,PBL)教学方法,将完整的案例穿插在单个知识点的教学中,引导学生运用单细胞转录组测序分析方法对科学问题进行探索[4]。

2 基容器化技术在单细胞转录组测序中的应用

当前部署生物信息分析平台常借助于容器化技术:

①借助于conda 软件安装生物信息分析软件,可以将单个的生物信息分析软件安装在独立的虚拟环境中,也可以将多生物信息分析软件安装在一个conda环境,但conda软件会安装额外的环境所需软件,环境臃肿,安装时受网速影响很大,另外不便于跨平台移植使用[5-6];②docker 是一种轻量级的虚拟化技术,在生物信息学中使用广泛[7]。docker 可为单一的生物信息学分析流程建立一个可移植的容器,并且在该容器内可以放置分析代码,配置文件,而当前在很多生信公司中使用成熟的代码进行规范化分析时多使用docker 技术[8-9]。docker hub 网站中也有单细胞分析所需的docker镜像,但在教学中,有一致命性缺陷,即运行时需要服务器的root 权限,增加了服务器的不安全性,而且不好修改,不便于实际中使用;③近些年随着超算兴起的singularity 软件,和docker 软件的功能很类似,却不需要root 权限,在生信领域具有很广阔的使用前景。相较于docker,singularity 有独特的优势:容易对分析环境进行打包迁徙,和现有系统无缝整合,无须运行daemon 进程,支持多种镜像和容器文件格式,易于和现有的超算系统整合,国内多个超算平台已部署singularity 软件,并且可以使用singularity pull 命令获取docker 资源。另外,在教学中融入构建singularity 容器的内容,使学生从底层掌握容器构建过程,提高他们的科研技能。

3 基于容器化技术构建单细胞转录组测序分析软件

稳定的生物信息学分析软件环境不仅是教学的需要,同样也是科研之必需。在教学中采用的策略是:linux 基础一般的学生掌握容器化软件的使用,了解容器化软件的构建流程,而学有余力的学生可以掌握容器化软件的构建过程,图1 所示搭建单细胞转录组测序分析软件,具体构建过程如下:①下载纯净版的Ubuntu(版本18.0.6),构建沙盒,设置沙盒的读写属性,安装常见的库文件,将linux shell环境中使用的软件Sratools(sra 文件下载及转换),Samtools(sam/bam 文件操作),Cellranger(单细胞测序文件比对),cellphonedb(python 环境下的细胞通讯分析软件),velocyto(python 环境下的RNA 速率分析软件),pySCENIC(python 环境下的单细胞转录调控软件)软件安装在纯净的Ubuntu 操作系统中,打包封装成是以sif 结尾的singularity 容器文件。②R 包分析环境的构建:在纯净的ubuntu环境中装R 所需的库文件,然后装R-base 软件(版本4.0.6),接着将单细胞分析的R 包都安装在该环境下,安装过程中需要安装众多依赖的库文件,安装完成后封装成是以sif 结尾的singularity 文件。该R 包分析环境主要涉及以下R 包软件:数据读入整合R 包(Seurat,harmony);双细胞鉴别R 包(DoubletFinder);细胞亚群识别(scMCA,scHCL,singleR);细胞通讯(iTALK,Nichenet,CellChat);CNV的推断(inferCNV,copyKAT);轨迹分化(velocyto.R,Monocle2,Monocle3);转录调控(SCENIC);功能化分析(clusterprofiler,org.Hs.eg.db,GSVA),以上R 包能够满足本科生单细胞转录组测序课程的教学。

图1 单细胞转录组测序分析环境的容器化软件

4 PBL 教学法与单细胞转录组测序

4.1 PBL 教学法的特征及优势

从教育心理学的定义来看,问题本身可分为结构良好问题和结构不良问题。单细胞转录组教学中的案例教学内容问题就属于后者,适用于PBL 中的案例教学,其被解决的过程和可能的答案常常不具有规律性和稳定性,即新的问题不能按部就班照着旧的问题的解决方法去处理,因此这种教学方式不是枯燥且一成不变地学,而是基于真实情景的问题,以解决问题为起点,从问题出发延伸,从而对知识进行探索、掌握中心分析与理解运用,是一种“高水平学习”[10]。单细胞转录组测序技术分析这门课要求学生理清并掌握概念间的各式复杂联系,学以致用,且因事制宜,运用到具体的科学问题(肺腺癌的异质性)中去。而逐渐掌握的过程也是从案例问题中学习的过程;运用的过程则对应着加强理解的过程,并能检验掌握程度。正如实践是认识的唯一来源,也是目的和归宿。因此,问题的发现者即学生,是PBL 教学的主体与核心[11]。因此,PBL 教学对于生物信息学专业本科学生将来的学习和工作的能力塑造至关重要。

4.2 学生的主体地位

传统的教学方法更倾向于授人以“鱼”,虽一直提倡学习是学生自己的事,但在现当代的填鸭式教育模式下,老师在教学中处于主体地位,通常是学生学了什么取决于老师教了什么,PBL 教学法则倾向于授人以“渔”,其差别便在于将从教为中心翻转为了以学生自主学为中心[12]。本课程中老师的作用相当于其中的“根节点”,给学生提供一个综合的框架或者一个问题,学生根据老师提供的框架和问题,通过自身对资料的查阅来解决问题,其过程本身则更倾向于对问题的探寻,而不是拘泥于那“正确”的答案。由此不难看出,学生在这种学习模式当中占据了主体地位,问题导向式学习的过程也极大地增加了学生学习的自主性和去盲从性,脱离了无意义的“死记硬背”,激发学生的求知欲,活跃其思维,迸发出更多的“头脑风暴”。

4.3 教师的指导者角色

传统的教学模式中,教师是“灌输式教育”的主导者,而在PBL 教育模式当中,教师是学生获得知识的教练,即“教”学生如何自主达到“练”的目的。教师和学生之间构成了一种新型的关系,从只教与学转变为协作关系。所谓“协作”,即教师与学生的关系是平等的,其通过共同的合作达到所设定的目标。传统教学当中,教师的身份大多数“替代”了学生一职,鼓励学生提出问题无错之有,不恰当的是鼓励学生提出问题之后,并未鼓励其自己解决,教师反倒成了“学生”,钻研出成果之后直接告诉学生,学生只知其结果而不知探求的过程之乐[13]。单细胞转录组测序课程中教师应当发挥“教”的长处,渗透了“一叶黄而知天下秋”的教育理念,给学生提供一“点”供其发展为一“面”,并在学生毫无头绪或与所达目的有所偏差的情况下参与讨论,提点其一二,充当学生获得知识的教练和指导者的同时,给学生最大的发挥空间。至此,一贯盛行的教师应当讲满课程、充分利用好一节课的每一分钟的观点则不攻自破,一幅好的画须“留白”,教学亦如此,在本课程中教师的身份很好地诠释了“留白”的作用,留白才可供学生发挥。诚然,新的教育模式也需要教师具备更高水平的、多学科的专业知识、专业技能,才能有足够的能力给予学生帮助,所谓教学相长,应是如此。

5 PBL 教学法在单细胞转录组测序教学中的实施

5.1 单个知识点的内容讲解

采用理论课和实验课相结合的方式介绍单细胞转录组测序的基本知识,让学生从宏观角度对单细胞转录组测序技术有初步的认识,以及每个细小问题的分析方法。主要涉及数据读入,整合、双细胞鉴别;细胞亚群识别;细胞通讯;CNV 的推断;轨迹分化;转录调控;功能化分析。

5.2 教师根据学习大纲设计并提出问题

完整的案例是以Oncogene 杂志中Single-cell RNA sequencing reveals distinct tumor microenvironmental patterns in lung adenocarcinoma 这一文章为基础,提出的问题为:如何用单细胞转录组测序技术探索肺腺癌的异质性。围绕这一主要问题衍生出子问题:①肿瘤的异质性是什么,如何用分析结果展示;②多样本数据怎么整合;③如何注释肺腺癌微环境中多种细胞;④肺腺癌微环境中多种细胞的细胞间通讯如何;⑤如何鉴定肺腺癌肿瘤细胞;⑥细胞内的调控网络中核心的转录因子是哪些?⑦肺腺癌微环境中多种细胞的分化轨迹是什么。立足于原文,但又不限于原文,根据这些子问题对原始数据进行重新分析。

5.3 以小组为单位的讨论与分析

我们将学生分成不同小组,由小组长牵头,讨论以上的子问题,确定分析思路,并将上课时学到的零碎知识点串联起来,组织代码,加以分析。在实际运行中遇到的困难在小组群中加以讨论。

5.4 集中讨论

对于实际分析过程中遇到的学生迷惑的知识点采用集中讨论的方式,其中重点突出的问题有“如何鉴定肺腺癌肿瘤细胞”及“分析轨迹分化的多个软件比较”。通过集中讨论的方法有效地解决了学生的困惑,第一个问题是“如何鉴定肺腺癌肿瘤细胞”,经过讨论给出的解决方案:鉴定肿瘤细胞类型的方法是借助inferCNV 和标记基因两种方法。第二个问题是“分析轨迹分化的多个软件比较”,经过大家讨论给出的解决方案:Monocle2,SlingShot 及PAGA等软件结果需同RNA 速率软件结果结合,软件的选择取决于数据及真实的生物学意义。

5.5 课程考核

以小组为单位展示本小组的分析结果,采用PPT 展示和小论文形式,PPT 展示分析的过程及思路,论文中展示详细的代码及处理过程。熟悉该领域的3 位老师对每一小组的汇报结果进行打分,取平均分,该部分占总成绩的40%。

6 总结

单细胞转录组测序技术课程中使用基于容器化技术部署生物信息学软件和问题导向式学习在单细胞转录组测序课程教学中的应用案例,从基础、理论、实践三方面的学习,提高实际科学问题中的数据分析能力,激发了学生的学习潜能,为他们的数据分析及科研奠定良好的基础。

猜你喜欢

单细胞容器测序
两种高通量测序平台应用于不同SARS-CoV-2变异株的对比研究
单细胞转录组测序技术在骨关节炎发病机制中的研究进展
容器倒置后压力压强如何变
生物测序走在前
外显子组测序助力产前诊断胎儿骨骼发育不良
核心素养背景下生物重要概念课例
难以置信的事情
基因测序技术研究进展
一种快速分离苹果果肉单细胞的方法
基于可开启微流控芯片的循环肿瘤细胞捕获及单个细胞的提取