APP下载

单细胞测序技术研究进展及其法医学应用展望

2019-03-24陈曼杨雅冉武会娟严江伟

法医学杂志 2019年5期
关键词:单细胞检材法医学

陈曼 ,杨雅冉 ,武会娟 ,严江伟

(1.中国科学院北京基因组研究所,北京 100101;2.中国科学院大学,北京 100049;3.北京市理化分析测试中心,北京 100094;4.北京市基因测序与功能分析工程技术研究中心,北京 100094)

在法庭科学实践中,现场环境和案情的复杂性往往使得法医DNA检验面对各种疑难生物检材,如模板DNA含量低、降解程度高、混合分型以及含有抑制物等。如何提高疑难检材的法医DNA分型成功率也一直是法医学亟待解决的问题。随着测序技术的进步,从聚丙烯酰胺胶和毛细管电泳平台的一代测序到现今发展迅猛的高通量二代测序技术,再到超长读长的单分子三代测序,能够对包括最小生命单元单细胞的DNA和RNA序列进行检测也越来越成为一种主流趋势。单细胞测序技术的不断成熟,给法医疑难检材的检测提供了一些新的研究思路,本文就相关方面进行综述。

1 单细胞测序

单细胞测序是对生物体单个细胞进行DNA和RNA序列测定的一种技术手段,主要包括单细胞分离、全基因组扩增、新一代测序和数据分析4个步骤。

1.1 单细胞分离

单个细胞的分离制备对下游实验至关重要。按照是否需要制备细胞悬浮液,可将单细胞分离技术分为两大类:第一类是通过机械研磨或者酶解的方法制备悬浊液,细胞由于不同的动力学参数被初步分离。主要有梯度稀释[1]、机械化的显微操控法[2]、荧光激活细胞分选(fluorescence activated cell sorting,FACS)技术[3]和微流体技术[4]4种。其中梯度稀释是最简便的方法,但是精确度和可重复性比较差。自动的微滴显微操控技术则比较精确、实验误差小、重复度高,缺点是需要较大的起始细胞数目、产率低、对细胞有损伤。FACS是目前最经济快捷的分离单细胞的方法,可以通过荧光标记的方法选择特异的细胞,对细胞进行分选,但是起始细胞数量大,快速流动的液体和荧光标记对细胞的损伤仍然是流式细胞术进行单细胞分离存在的问题。而微流体技术的优势是只需要纳升级的微滴,分辨率灵敏度高。第二类是根据细胞不同的形态和内容物利用荧光标记或者发光抗体直接从组织切片中分离,保留了细胞原始生活状态下的空间位置环境信息。激光捕获显微切割法(laser capture microdissection,LCM)[5]是这类方法的代表,但这个技术也存在一些缺陷,如效率较低、破坏细胞结构以及激光的损伤等。

1.2 全基因组扩增

单细胞测序的另外一个关键步骤是无偏好的全基因组扩增,忠实地放大细胞中单个拷贝或者双拷贝的基因组信号。近些年涌现的各种低拷贝模板全基因组扩增技术,极大地降低了传统聚合酶链反应(polymerase chain reaction,PCR)过程中由于特殊序列以及结构差异导致的扩增片段偏好性而带来的误差。

目前,常用的全基因组扩增的方法主要有4种。第一种是完全依赖于简并寡核苷酸引物PCR法(degenerate oligonucleotide primed PCR,DOP-PCR),这种方法在PCR热启动酶的催化下,连接一段通用序列或者利用简并引物进行单纯的热循环PCR实现对基因组DNA的剪切修补,最终用于建库[6-7];第二种是基于多重置换扩增(multiple displacement amplification,MDA)技术,在高保真聚合酶Φ29的作用下,利用温度相同的一组随机引物进行多重置换扩增[8-9];第三种是结合PCR和等温置换的方法,有PicoPLEX[10]和更简洁的多次退火环状循环扩增(multiple annealing and looping-based amplification cycles,MALBAC)[11]2种;第四种方法是通过转座子插入的线性放大(linear amplification via transposon insertion,LIANTI)技术[12],利用转座子随机将DNA切碎,使DNA样本得以线性放大。MALBAC和LIANTI技术在常规的PCR之前,通过设计起始等温扩增子成环及转座子在基因组中广泛分布的特点,有效抑制了扩增偏好性的问题,提高了扩增时全基因组覆盖程度和对单核苷酸变异(single nucleotide variant,SNV)及拷贝数变异(copy number variant,CNV)的检测准确度。

1.3 新一代测序

新一代测序技术的高速发展,无论是在样本准备、测序通量还是测序成本方面的进步,使得基于单个细胞基因组的测序成为可能。目前,单细胞测序技术中常用的新一代测序根据读长的不同主要分为两大类:第一类是短读长的二代测序平台,包括MiSeq FGx®法医基因组测序平台(美国Illumina公司)和Ion S5TMXL测序平台(美国Thermo Fisher Scientific公司)。二代测序平台的优势主要是通量大、成本低,但是检测片段较短,富含重复结构的序列拼接较困难。目前单细胞测序的相关研究均是基于二代测序平台进行的转录组、蛋白质组或者表观遗传组[13]。第二类是长读长的单分子三代测序平台,如美国PacBio公司的单分子实时(single-molecule real-time,SMRT)荧光测序技术[14]和英国Oxford Nanopore Technologies公司最新的牛津纳米孔MinION[15]测序仪,三代测序的读长可以达到10kb以上,测序结果易于拼接,类似线粒体大小的片段能直接测通,适用于含有重复序列的片段和小基因组的测定。最新的牛津纳米孔MinION测序仪体积只有口风琴大小,在极大程度减少测序时间的同时,也大大降低了测序成本,给未来新一代测序技术的普及提供了基础。

1.4 数据分析

测序技术的进步产生了大量的基础数据,对数据分析提出了新的要求,能够高效分析大规模数据的分析算法被开发,使得单细胞测序技术迅猛发展。不同的分析算法在测序深度、特殊位置偏好性以及每一个细胞的结果上进行权衡,综合考虑在全基因组扩增过程中较难避免的偏好性带来的误差。单细胞测序结果分析的主要难点是消除不同步骤中实验人员和仪器带来的误差和背景信号。目前有一些新的研究和分析方法已被开发用于单细胞测序数据分析,如通过单个细胞中变异与原始大样本中的变异等位基因频率的百分比比较和多个细胞单独结果的相互矫正的策略来减小单细胞分离时产生的偏差[16]。例如:在GAWAD等[16]的研究中,他们分别应用Picard、Samtools、VarScan2、Annovar 4种不同的软件程序进行原始测序数据的细胞分选、序列的比对、单核苷酸多态性(single nucleotide polymorphism,SNP)或者插入/缺失(insertion/deletion,InDel)的读取以及命名,从而解读单细胞测序结果;基因组的重头组装算法SPAdes[17]和IDBA-UD[18]降低了全基因组扩增过程中由于高度重复的片段带来的扩增不均衡,这两种算法的相关软件均可以免费下载安装包使用;基于最大简约性、最大似然或基于距离的方法来进行克隆细胞遗传物质构建,通过比对单个细胞之间遗传信息的异同点,比对减少单细胞测序过程中的错误,提高测序结果的准确度[19]。如多重系统发育分析的软件[20]和代码开源的癌症细胞系统发育模型[21]的建立,均是利用不同细胞间遗传差异建立进化关系达到解析测序数据的目的。

1.5 单细胞测序的应用现状

单细胞测序技术以独特的研究视角给生命科学带来了新的思潮,目前基于该技术的研究层出不穷,主要应用于生命科学领域的3个方向。(1)肿瘤相关研究。增殖时的分化和突变的积累是肿瘤组织高度异质性的形成原因,这也是肿瘤细胞可以逃离机体免疫细胞存活和干扰肿瘤治疗的主要因素。基于单细胞测序技术的各种不同肿瘤组织异质性的相关研究层出不穷,如乳腺癌、肺癌、脑癌、直肠癌、膀胱癌、白血病和黑色素瘤等[22]。通过将单个细胞基因组信息和关键功能信号通路进行联合解析,找到引起肿瘤组织形成、生长和转移的突变相关关键因子,这些关键因子将极大地提高肿瘤化学疗法的效能[22]。(2)微生物学相关研究。大量存在的不能培养的微生物是阻碍我们理解微生物致病性、微生物分类和生物多样性的关键因素[23],单细胞测序技术解决了这个难题,众多微生物的基因组均可被测定。其中与人类疾病(如炎症性肠病、2型糖尿病)密切相关的肠道菌群谱系研究有较直接的应用价值[24]。另外,基于微生物的生活习性对于特殊生理代谢途径的研究可能给新的化学反应模式探索提供了途径[13]。(3)多细胞生物遗传镶嵌现象研究。最新的研究结果[19]表明,包括人在内的多细胞生物体遗传镶嵌性可能是生物体行使复杂功能的结构基础,这给疾病发生发展的研究提供了思路。除上述三个主要方向外,单细胞测序近年来在免疫系统、试管婴儿、产前诊断和神经细胞发育方面也有相关应用[13]。

2 法医学未来应用方向及面临的挑战

相较于在生命科学领域的广泛应用,单细胞测序在法医学领域的应用尚未被开发。本文根据单细胞测序的特点,预测其在法医学微量、混合和降解等疑难检材方面应用的可能性,并简单分析其在法医学应用过程中可能面临的挑战。

2.1 单细胞测序于微量检材

在真实案件中,微量检材的检测一直困扰着法医工作者。检材中DNA含量低给检案工作者带来一系列的难题,其中较为突出的是提取工作。工作人员往往通过增加检材量、多次富集的方法提高DNA的绝对量或者通过增加PCR循环数放大初始的遗传信息,而这些方法随之而来的是难以避免的在多次提取过程中由于提取工具的置换导致的污染问题[25]以及PCR循环数过多导致的扩增不均衡、大片段丢失。另一方面的瓶颈是多数案件需要多种遗传标记的联合分析而不仅仅是单一一种遗传标记,这对于痕量样本更是难以实现。因此,目前应用于微量样本的解决方案往往难以获得较理想的分型结果。

单细胞测序技术应用全基因组扩增体系,可将单个细胞中极低拷贝数的遗传物质进行真实完整的放大,再结合新一代测序技术,对DNA序列进行解析,而不需要通过对检材多次处理或者提高PCR扩增循环数来扩大DNA信息。HANSON等[26]工作者早年将全基因组扩增与传统毛细管电泳检测相结合进行微量(单个或者少数几个细胞)基因组DNA的短串联重复(short tandem repeat,STR)分型检验,但受限于不成熟的全基因组扩增技术以及检测手段,大片段丢失,仅能获得部分STR分型结果,不能较好地应用于法医学实践。现今较成熟的全基因组扩增技术和发展迅猛的测序技术,可以对单个细胞进行检测,回避了DNA量的问题,使其在合适的扩增循环数目下操作。另外,最新的全基因组扩增方法通过设计环化起始扩增产物这一巧妙的扩增方案,极大程度地降低了扩增的不均衡性[11]。此外,高通量测序的策略可以整合多种遗传信息,在一个反应体系中进行多种遗传标记的检测,减少了检材DNA的消耗。总之,单细胞测序技术最大程度地解决了微量样本的检验问题。

2.2 单细胞测序与混合检材

混合检材分型拆分也是一个难以攻克的问题。目前应用一代STR检测方法进行混合检材解析时,混合个体数目的确定和分型的拆分是其中的难点。对于单一的STR遗传标记来说,不同的混合个体不可避免地拥有相同的分型,尤其是在混合个体间有亲缘关系的情况下,这样的干扰会更加明显;另一方面,重复序列扩增过程中不可避免地复制滑脱峰是混合样本分型认定困难的主要因素,尤其是混合比例较大的样本。目前,一些没有复制滑脱峰的遗传标记,如利用微单倍型和InDel进行混合分型的解析,在一定程度上增加了混合样本拆分的成功率。最新的研究结果[27]表明,结合分析1204个遗传标记(包括常染色体的964个SNP和23个InDel、X染色体的27个SNP、Y染色体的56个SNP、5个InDel和129个线粒体SNP)的检测方法可以进行1%的混合比例的拆分。但是无论哪种方法均是基于混合样本,对于混合比例相差甚远的样本仍然无法解决。

单细胞测序技术可以发挥新一代测序技术的优势,复合一些新的遗传标记(如微单倍型、InDel),可避免产生复制滑脱峰而干扰结果,利于结果的拆分。更重要的是,单细胞测序基于最小生命单元(细胞)进行检测的精度,把混合检材在起始阶段进行分离,使混合检材不再“混合”。

2.3 单细胞测序与降解检材

降解检材也是一种疑难检材。案件现场的样本大多存在不同程度的降解,对于降解检材而言,DNA片段的碎片化是阻碍其完整扩增的主要原因,在一代STR的检测分型结果上往往表现为大片段丢失而不能获得足够的嫌疑人信息。目前用来增加降解样本检出率的主要方法是选择短片段的遗传标记(如SNP、miniSTR),以及最新发展的转座子遗传标记,扩增子为100 bp左右,在50 pg的起始DNA状态下能获得95%以上的分型,对于毛干和指甲等高度角质化的检材检测效果较好[28]。但是这些策略仍然只是在改善检出率,而不能从根本上解决降解检材存在的DNA分子碎片化的问题。

单细胞测序不仅在检测灵敏度上有较大的提升,其在检测广度上也有较大的突破。不同于传统的STR与毛细管电泳检测结合的方法,单细胞与新一代测序技术的结合,在单个细胞的层面上充分发挥新一代测序技术检测片段设计灵活的优势,复合目标片段小的遗传标记(如SNP、转座子),减少由于基因组片段降解导致大片段扩增失败的现象。另外,从检测精度上,只要检材中存有一个完好的细胞就可以得到完整分型,使降解检材不再“降解”。

2.4 单细胞测序应用于法医学研究面临的挑战

首先,相对于目前最常使用的毛细管电泳平台,单细胞测序策略的精确度相对欠缺,主要检测环节(全基因组扩增阶段和序列测定阶段)仍存在不完善的地方。全基因组扩增阶段,MALBAC技术在全基因组平均测序深度达到25×时仍然只能覆盖93%的基因组区域[11],LIANTI技术在平均测序深度30×时可以达到97%的覆盖度,且每一种技术均有一定的等位基因丢失和假阴性概率[12]。序列测定阶段多用二代测序技术和单分子的三代测序技术。法医学中二代测序平台使用最多的是MiSeq FGx®法医基因组测序平台和Ion S5TMXL测序平台两个测序平台,其中MiSeq FGx测序平台的正向测序有0.64%的错误率,而反向测序的错误率稍高为1.07%[29],产生错误的主要原因是由于A和C以及G和T分别相同的激发光,彼此强烈的相关性给荧光信号的分离带来障碍而导致错读;簇内测序的不同步产生的干扰,随着测序的循环增加而增加[30]。对于Ion S5TMXL测序平台而言,GC含量不均衡或者碱基连续出现时也容易发生读取错误[31]。三代单分子测序中,PacBio公司的SMRT技术,由于含有不同遗传信息的相邻纳米孔信号干扰,应用该技术对150bp片段进行单次检测只有83%的准确度,当测序深度加大到15×,通过不同测序结果直接的相互矫正,准确度可以达到99%[32]。而牛津纳米孔MinION测序仪的精确度则可以达到99.9%[33]。

其次,单细胞样本处理问题。伴随单细胞超高精度而来的必然是待检测样本数目的急剧增加,虽然新一代测序成本降幅明显,但是人类复杂的细胞结构体系和超大基因组仍然需要庞大的测序花费,得到适量且足够用于分析的数据,平衡好待测序的细胞数目和基因组测序的深度和广度至关重要。另外,相比实验室超净间里培养的组织细胞,复杂的环境因素常使得法医学检材中含有多种微生物的污染。一个细胞单拷贝或者双拷贝基因组进行扩增信号放大时,无处不在的细菌和霉菌无疑会对目标细胞基因组扩增产生较大干扰。目前,大多数单细胞分离技术均是通过对组织培养细胞进行细胞稀释液获得,这给常见的法医接触样本细胞的有效获取带来较大挑战。

最后,实验操作和数据分析方面的挑战。在单细胞测序实验操作方面,目前常规的法医学实验室,无论是相关的实验操作流程还是防污染、各类仪器相匹配的硬件方面都需要完善。在数据分析方面,目前应用的分析方法大多在测试阶段,缺乏有效的检验和比较方法来判断分析方法的优劣。没有基于单细胞的大人群数据积累,尤其是基于中国人群的数据,以及需要使用人员有较深厚的生物信息学背景才能使用的复杂分析方法,这些也都给法医学应用带来阻碍。

3 展 望

单细胞测序技术正在迅猛发展,终将为法医学服务,给法医学带来革命性的变化。但在法医学领域使用时,需要:开发针对法医学案件检材的精准目标细胞分选技术,防止微生物污染,降低待检测数目;筛选适用于单细胞低拷贝模板检测并且可以达到法医学效力的遗传标记;组合人与微生物特异性的遗传标记,甚至非法医学的参数(如疾病诊断、健康状态等);在分析方面,开发可视化简洁的操作方法,让更多人掌握并熟练使用。相信随着单细胞测序技术自身的进步以及其在法医学应用中相关行业规范的建立,定会在法医学领域发挥不可替代的作用。

猜你喜欢

单细胞检材法医学
单细胞转录组测序技术在骨关节炎发病机制中的研究进展
人工智能助力微生物单细胞鉴定
54例鼻骨骨折诊断的法医学鉴定分析
听觉诱发电位在法医学上的应用价值
核心素养背景下生物重要概念课例
指印形成方式鉴定1例
疑难生物检材DNA的检验探究
接触性生物检材DNA提取方法的比较
腰椎外伤并椎体血管瘤法医学鉴定1例
个体年龄推断的法医学研究进展