常染色体STR基因座三等位基因在法医DNA鉴定及临床实践中的意义
2018-07-16周单华陈鹏宇余丽梅
周单华,陈鹏宇,余丽梅
(1.遵义医学院附属医院 贵州省细胞工程重点实验室,贵州 遵义 563099; 2.遵义医学院附属医院司法鉴定中心,贵州 遵义 563099; 3.遵义医学院 法医学院,贵州 遵义 563099)
短串联重复系列(short tandem repeat,STR)因其遗传多态性高、检测灵敏性强、种属特异性强、可复合检测和自动化分析等特点,已经成为了国内外法医DNA鉴定应用最为广泛的遗传标记。常染色体STR分析具有符合二倍体遗传标记及孟德尔遗传规律的特征,是进行法医学个人识别和亲子鉴定的常规分析方法。通常情况下,常染色体STR两个等位基因相同时称为纯合子,在DNA分型图谱上呈现出一个峰或一条带;当两个等位基因不同时,称为杂合子,其分型图谱表现为两个不同的峰或两条带。在极少数情况下会检测到三个峰或者三条带,这种情况称之为三等位基因(tri-alleles)或三带型。
自STR三等位基因于1999年第一次被 Crouse等[1]人报道迄今,已经在大量的STR上发现有三等位基因的存在。常染色体STR三等位基因对法医DNA分析中案件的检测带来一定影响,同时在某些疾病的辅助诊断分析中有特殊应用价值。
1 三等位基因形成机制和峰型表现模式
常染色体STR三等位基因是个体STR分型时检测到的一种异常分型现象,一般认为是发生于染色体异常所致基因数目异常改变的一种表现。其确切的形成机制尚不完全明确,国内外主要存有以下几4种观点,而其峰型表现模式常见的有两种。
1.1同源染色体不分离(nondisjunction NDJ)二倍体生物在减数分裂期形成配子时,分布于同源染色体上的两个等位基因分别随机分配到两个配子中并遗传给子代[2]但当染色体运动异时,常会导致其不分离[3]。同源染色体间着丝粒DNA含量差异,会引起姐妹染色单体连接程度和纺锤丝微管的数量的不同,进而导致MⅠ期中二价体向二极运动的拉力不均衡和MⅡ期中着丝粒分离时间的不一致。其可能的机制是:当着丝粒中 DNA及其不对称,会导致减数分裂时二价体向两极运动的拉力将非常不均衡以及 MⅡ期中同源染色体之间着丝粒分开变得不同步,二极体同时移向某一极,这就直接导致了同源染色体在减数分裂时不分离,两个等位基因进入同一个配子,与来自父方或母方的另一个配子结合,在此基因座上就形成了三等位基因,最终在DNA分型图谱上表现出三个等位基因。
1.2同源染色体不等价交换同源染色体非姐妹染色单体之间的不等价交换,使交换后的两条姐妹染色单体中的其中一条上有一缺失片段,属于染色体结构缺失;另一姐妹染色单体上添加了相应的片段,属于染色体结构的重复[4]。两条同源染色单体之间进行不等价交换后,在一条染色单体上出现了2个等位基因,这条含有2个的等位基因的染色单体与另一正常个体来源的染色单体组成的子代的基因分型图谱上会出现三个峰,即三等位基因。
1.3嵌合体因为自发或者人为诱导因素导致人体的遗传物质不仅是来源于同一个细胞体系,而是源于两个或两个以上个体的细胞体系,形成由不同的基因型的细胞所构成的生物体,生物学上称之为嵌合体。可以分为两类,一类为同源嵌合体(mosaic),另一类为异源嵌合体 (chimera)[5,6]。同源嵌合体者的细胞只来自于单个合子,自发或诱发导致的基因突变(肿瘤)以及染色体畸变(21-三体综合症)均可导致同源嵌合体的产生。同源嵌合体又分为一般性嵌合体(general mosaicism) 和限制性嵌合体(confined mosaicism)。异源嵌合体则是指某一个体的细胞来自二种或其他不同的合子系(Zygotelineage ) ,可分为三种类型:在STR分型上表现为三等位基因的人造异源嵌合体(artificial chimerism)和孪生子异源嵌合体(tiwn chimerism)以及表现为四等位基因的四配子异源嵌合体(tetragametic chimerism)[7,8]。如异基因个体来源的干细胞移植等外源性基因移植后,就可出现多等位基因,也可能是由于在异卵双胞胎中发生子宫内胚胎间血液交换等,在STR分型图谱上均可出现为三等位基因形式。
1.4非特异性扩增当某个基因座有额外的引物结合位点时,在PCR扩增时,除了扩增正常的二等位基因位点,额外的引物结合位点也同时扩增,导致STR图谱出现三等位基因。曾有文献报道家族六位成员TPOX基因座上出现额外等位基因10,产生三等位基因的原因与其X染色长体臂某段基因座有潜在的关联[9]。
1.5三等位基因的峰型模式三等位基因由于其形成机制不同,其峰型模式常见有以下两种不同表现。一类为三个等位基因中其中两个峰的峰高总和与第三个峰高接近(见图1),另一类为三个等位基因峰高较为一致[10-11](见图2)。研究发现,前一峰型大概由于在减数分裂期分布于染色体上的某杂合子基因座上发生了重排,而后一峰型是由于某些体细胞杂合子基因座产生了突变,其发生率相对更高些[10]。
图1 两个峰的峰高总和与第三个峰高接近
图2 三个峰的峰高一致
2 三等位基因对法医鉴定DNA分型结果的影响
法医DNA分型中,个体常染色体STR三等位基因的检出增加了案件分析的不确定和复杂性,为法医工作者带来了新的挑战。如单一样本来源的不确定性、检测方法的可靠性、法医学参数计算原理与常规案件处理的不一致性等。同时对不同STR基因座三等位基因发生规律的认识,也可为法医DNA实践提供一定的指导。
2.1存在三等位基因的STR基因座从首次报道STR三等位基因到目前为止,在 STR Base 数据库(http://strbase.nist.gov/tri_tab.htm)收录了检测到 13个CODIS基因座和14个非 CODIS基因座上产生三等位基因的情况[12](见表1~2)。
表1CODIS基因座三等位基因模式统计
基因座例数染色体位置Gene bank系列号基序汉族人群中PIC值[13]FGA404q28M64982CTTT0.8479CSF1PO95q33.1X14720TAGA0.6894TH01511p15.5D00269TCAT0.6108TPOX192p25.3M68651GAAT0.5577VWA2612p13.31M25858[TCTG][TCTA]0.7696D3S1358113p21.31AC099539[TCTG][TCTA]0.6691D5S81885q23.2G08446,AC008512AGAT0.7748D7S820227q21.11G08616, AC004848GATA0.7369D8S1179228q24.13G08710[TCTA][TCTG]0.8271D13S3171613q31.1G09017,AL353628.2TATC0.7718D16S5391316q24.1G07925,AC024591.3GATA0.7502D18S514418q21.33X91254,AP001534AGAA0.8459D21S112721q21.1M84567Complex[TCTA][TCTG]0.7948合计262
由表1中CODIS基因座的结果可见,重复序列较长、基序结构较为复杂、具有更高的遗传多态性的基因座可以检测到更多的三等位基因。如三等位基因次数最多的基因座依次是D18S51(44次)、FGA(40次)和D21S11(27次)[14]。而遗传多态性较差的基因座则不太容易观察到三等位基因的出现,如D5S818(8次)和TH01(5次)基因座的STR重复系列AGAT和TCAT就比较简单、多态性程度也低[15-17]。
表2非CODIS-STR基因座三等位基因模式统计
基因座例数染色体位置Gene bank系列号基序汉族人群中的PIC值[13]D2S1338102q35AC010136 ; G08202[TGCC]n[TTCC]n0.8473D19S4331219q12G08036 ; AC008507.6[AAGG][AAAG][AAGG][TAGG][AAGG]n0.7917Penta D1221q22.3AP001752[AAAGA]0.7862Penta E1615q26.2AC027004[AAAGA]0.9114F13A0116P24-P25M21986AAAG-FES/FPS115q25X06292AAAT-F13B11q31-q32M64554AAAT-LPL18p22D83550AAAT-SE3366q14V00481AAAG0.9402D10S1248210q26.3AL391869GGAA0.7095D12S391212p13.2 G08921[AGAT]8-17[AGAC]6-10[AGAT]0-10.8237D22S1045122q12.3 AL022314ATT0.7324D1S165631q42G07820[TAGA]n[TGA]0-1[TAGA]n[TAGG]0-1[TG]50.8093D2S44112p14AC079112TCTA0.7426合计69
“-”表示暂无相关数据。
表2中非CODIS基因座观察到三等位基因次数最多的基因座依次为:Penta E(16次)、Penta D(12次)、D19S433(12次)和D1S1338( 10次)。同CODIS基因座表现出三等位基因的规律一致,这几个基因座在人群中的遗传多态性较高。观察到三等位基因比较少的基因座则是F13A01、FES/FPS、F13B、LPL、D2S441、D22S1045,都仅有一次报道。例如D2S1045是ATT的重复系列,还有一个原因是这些基因座与CODIS基因座比较起来,开发利用相对较晚,所以目前发现的三等位基因的例数不多。
2.2三等位基因的判定三等位基因现象在法医 DNA 日常案件检测中比较少见。但如若在实际工作中检测到某个基因座呈三等位基因,需要对该基因是否为真实的三等位基因进行确认。首先应通过重复实验排除模板污染以及操作过程中人员自身 DNA 污染问题;其次还必须针对同一个基因座使用引物序列不同的其他扩增体系进一步验证,不同试剂盒捡测结果一致,才可认定为三等位基因,得到可靠和准确的检测结果[18]。
2.3三等位基因的亲权指数计算方式三等位基因的出现涉及到父权指数计算,也涉及到鉴定结果的准确性和规范性,目前的计算方式主要有以下几种。第1种方法:在亲子鉴定和个体识别实践检案中,如果子代的三等位基因确定是父亲或母亲遗传时,可将其中的两个当作为一个稀有等位基因去计算亲权指数值[19],如果采用遗传频率进行计算,可以用两个等位基因频率的乘积估计在群体中遗传的频率。对于不能确定子代中等位基因亲本来源的,可将其中任意两个等位基因频率相乘后取最小值用以计算[20]。第2种方法:即按照 Brenner 等采用的方法,根据母亲是否参与亲权鉴定,采用对应的公式进行计算,若子代三等位基因是遗传过程中产生的突变,则参照平常亲子鉴定案件中突变等位基因处理的方法,将等位基因频率与平均突变系数相乘后进行亲权指数的计算。第3种方法:参照刘芳等人的计算方式,根据三联体亲子鉴定案例中常染色体STR 三等位基因情况的不同,将父权指数的计算公式归纳为5类[21],其中第一类孩子三等位基因中用成对遗传的等位基因 R 和 S不分离(Nondisjunction,NRS)表示,又分为四种亚类。以上3种方法以刘芳等人的计算方式更为具体化,日常工作中可根据案件实际情况选择合适的计算公式。
3 三等位基因的临床应用价值
3.1遗传性疾病辅助诊断临床比较常见的三体综合症包括以下3种:13-三体综合征、18-三体综合征、21-三体综合征。目前,有文献报道,用分别位于21号染色体的基因座 PentaD 和 D21S11、18 号染色体上的基因座 D18S51等分别快速辅助诊断或筛查21-三体综合症和18-三体综合征[22-27]。
此外,同 STR 基因分型用于亲子鉴定的原理一样,可将妊娠期胎儿的绒毛组织和其的母体组织的SRT多态性进行对比分析,用以鉴别葡萄胎中双亲的遗传成分,STR 基因分型可以明确区分一个双雌非葡萄胎妊娠三倍体和真正的双雄PHM 三倍体,也有助于确定如三体或单体病等孤立的染色体异,常以达到鉴别诊断的目的[28];STR 图谱基因分型分析在部分性葡萄胎(partial hydatidiform mole,PHM)与完全性葡萄胎(complete hydatidiform mole,CHM) 的鉴别诊断中具有重要作用[29]。
3.2异基因干细胞移植后移植物存活状态的判断利用STR基因座分型技术对异基因干细胞移植的造血干细胞、间充质干细胞在受者的植入、存活情况进行动态监测,已成为异基因细胞移植术后常用的植入证据检测手段。因此,除了用于法医亲子鉴定和个体识别的三等位基因检测,在血液病救治等临床疗效和不良反应监测中具有更为广阔的应用前景,不仅可早期灵敏的判断移植后造血干细胞的植活状态,而且为研究和探讨嵌合体形成、移植排斥以及移植后复发提供了一种很好的评价方法[30-34]。病人在进行了异基因造血干细胞移植后,当移植物存活或形成嵌合体时,在受者体内可检查到来自供者细胞的与受者基因分型不同的等位基因,在图谱上可表现为三等位基因峰型;移植物成活后,慢性移植物抗宿主病与完全嵌合体的发生率有高度的一致性。由此推测,随着异基因干细胞治疗转化应用的逐渐增多,利用STR分型技术进行三等位基因检测可能成为干细胞制剂体内分布和代谢动力学研究的较好方法之一。
3.3判断脐血中的母血污染随着分子生物学技术的不断进步和发展,采取在孕早期绒毛穿刺或孕中期羊水穿刺,使得更多的单基因遗传病能够实现产前筛查和确诊。目前,单基因遗传病诊断和胎儿染色体检查仍采用介入性产前诊断。虽然不同单基因病诊断采取的相关实验室技术相差较大,但绝大部分依然是通过采取的胎儿组织,进行基因扩增后对产物进行STR分型及分析。因为基因扩增具有高度灵敏的特性,即使混入极微量母体组织也会影响到基因诊断的准确性,导致结果的误判。若脐血中存在母血污染,则在某些基因座上会检测到三等位基因(胎儿和母体基因座基因分型为非纯合子时)。因此,根据抽取的胎儿脐带血细胞是否检测到STR 三等位基因,可以作为判断母血是否污染脐血有效的检测方法[35],此种检测方法具有其他方法不可比拟的灵敏度高、特异性强和操作简捷的优势。
4 展望
随着DNA检测技术的不断进步,将有越来越多的三等位基因被发现报道。伴随着三等位基因研究的不断深入,既有助于进一步加深法医物证案件中异常DNA分型的理解和应用,同时三等位基因的特殊分型也可以良好地应用于临床特定疾病的筛查、诊断以及疗效和预后的评估。