1989—2019年SCIE收录的法医物证学文献计量学分析
2021-06-17张星茹贺永锋张蕴盈刘裕哲朱波峰
张星茹,贺永锋,张蕴盈,刘裕哲,朱波峰,
1.西安交通大学口腔医院 陕西省颅颌面精准医学研究重点实验室,陕西 西安 710004;2.西安交通大学口腔医院口腔医学研究中心,陕西 西安 710004;3.陕西省公安司法鉴定中心,陕西 西安 710016;4.南方医科大学法医学院,广东 广州 510515;5.西安市公安局交警支队,陕西 西安710065
法医物证学是以法医物证为研究对象,以提供科学证据为目的,研究应用生命科学技术解决案件中与人体有关的生物检材鉴定的一门学科,主要运用分子遗传标记解决司法案件中的个体识别和亲子鉴定问题。该学科的发展不仅为案件的审判提供证据,也为侦破案件提供线索和有力的科学依据。
近年来,在国家自然科学基金和中华人民共和国科学技术部等的支持下,相关院校及公安部、司法部鉴定研究机构在物证学领域取得了丰厚的成果,包括短串联重复(short tandem repeat,STR)分型试剂盒国产化[1-5]、DNA 芯片技术[6-8]、同卵双生子鉴定[9-13]、复杂亲缘关系鉴定[14-16]以及新型遗传标记[17-20]和检测技术研发[21-24]等方面。
文献计量多用统计学计量方法,通过对文献分布结构、数量关系、变化规律和定量管理等进行研究分析,从而得出相关研究对象的部分特征和规律。虽已有学者将文献计量应用于法医学领域[25-26],但法医物证学领域却未被涉及。本研究采用文献计量学方法分析1989—2019 年中国大陆学者发表的、由科学引文索引(Science Citation Index-Expanded,SCIE)数据库收录的法医物证学文献,并对其进行剖析解读,归纳总结法医物证学领域的研究团队、研究热点和相关基金资助,以预测未来的研究领域和方向。
1 对象与方法
1.1 研究对象
本研究的文献均来自Web of Science 核心合集SCIE 数据库。检索步骤如下:2020 年6 月22 日登录http://apps.webofknowledege.com;在“基本检索”界面选择“Web of Science 核心合集”;在检索栏选择“所有字段”,在检索框中键入“forensic”;添加行,将布尔逻辑运算符设定为“And”,在检索栏选择“地址”,在检索框中键入“China”;添加行,将布尔逻辑运算符设定为“Not”,在检索框中键入“Hongkong Taiwan Macau”;时间跨度选择“自定义年份范围”,设定“1989”至“2019”;点击“检索”,获得所需数据。在分支学科检索中排除法医病理学、法医毒理学等分支学科文献后,人工筛选出1 126 篇法医物证学文献,以制表分隔符(Win,UTF-8)导出全部记录。
1.2 研究方法
1.2.1 数据清洗
对作者、研究机构、基金资助、作者关键词(简称为“关键词”)等,检查数据一致性,处理无效值和缺失值。
作者和研究机构数据清洗原则:(1)名字相同但格式不一致的,对格式进行统一,如“Hou,Yiping”和“Hou,YP”统一使用“Hou,YP”;(2)同一机构不同名称的,选择较规范的名称和(或)现用名称进行修改,如“Zhongshan Univ”和“zhongshan univ”均使用“Sun Yet Sen Univ”,“Minist Justice,Inst Forens Sci,Shanghai Key Lab Forens Sci”和“Minist Justice,Acad Forens Sci”均使用“Minist Justice,Acad Forens Sci”。
基金数据清洗原则:(1)1 篇文献中若含同一基金同一资助项目的多项授权,不重复计入,该项目资助篇数仅记为1 篇;(2)1 篇文献中同一资助机构下的各项项目均并入该机构内,如“国家自然科学基金青年科学基金项目”和“国家自然科学基金面上项目”均归入“国家自然科学基金委员会”,“国家重点研发计划项目”和“国家科技支撑计划项目”均归入“中华人民共和国科学技术部”,且该机构资助篇数记为1 篇。
关键词数据清洗原则:(1)同一含义但写法不同的关键词,均按规范词书写,如“short tandem repeats”、“STR”和“STRs”统一使用“STR”;(2)同一关键词但格式不一致的,统一格式,如“Haplotypes”、“haplotypes”和“haplotype”统一使用“haplotype”。
1.2.2 数据分析
使用Microsoft Office Excel 2019 软件对文献总体情况、研究机构、作者、基金资助、关键词等进行统计分析,并对部分字段做共现矩阵转化。使用视觉化图表制作平台PlotDB(https://plotdb.com/)对文献类型和期刊分区绘制环形图和玫瑰图。以中国大陆学者1989—2019 年被SCIE 收录文献不少于3 篇为标准,共筛选出27 本期刊。期刊分区信息参考2019 版期刊引证报告(Journal Citation Report,JCR;除Forensic Science International-Genetics的分区信息来自2018 版JCR),若期刊在JCR中有不同类别且分区不同,采用与物证相关的分区与类别。运用Microsoft Office Excel 2019 软件对2009—2019 年中国大陆学者发表的法医物证学领域SCIE 文献的关键词绘制堆积面积图。为便于统计,对部分关键词进行数据整合,如“群体遗传学”包括“Han population”、“population genetics”、“population data”、“Uygur”和“Yi ethnic minority”等,“技术应用”包括“next generation sequencing”、“Ion Torrent PGM”、“PCR”和“quantitative RT-PCR”等,“亲权鉴定”包括“Y-STR”、“X-STR”、“phylogenetic analysis”、“sibship test”、“kinship reference”和“AIMs”等,“体液识别和年龄推断”包括“age prediction”、“body fluid identification”、“microRNA”和“semen identification”等,所有关键词无重复计数。应用Gephi 0.9.2 软件的模块化统计和“ForceAtlas2”、“Fruchterman Reingold”布局对作者和研究机构间的合作关系进行分析;用模块化统计和“ForceAtlas2”布局对关键词进行分析。其中,以词频≥5 对研究机构做共现矩阵转化,并将转化结果导入Gephi 0.9.2软件,通过“过滤-属性-范围-Integer”选择“7~59”对机构合作网络图进行修剪;以词频≥5对作者做共现矩阵转化,将转化结果导入Gephi 0.9.2软件后,通过“过滤-属性-范围-Integer”选择“19~124”对作者合作网络图进行修剪;以词频≥3 对关键词做共现矩阵转化,将转化结果导入Gephi 0.9.2 软件后,通过“过滤-属性-范围-Integer”选择“5~119”对关键词共现网络进行修剪。
运用SPSS 18.0 软件进行统计学分析。经统计,被引频次不符合正态分布,因此采用中位数和四分位距表示。采用χ2检验比较有无基金资助的文献被引率的差异(被引率=被引频次≥1 的文献数/文献总数),采用Wlicoxon 秩和检验比较有无基金资助的文献被引频次的差异(双侧检验水准α=0.05)。
2 结果与讨论
2.1 总体情况
本研究对象为中国大陆学者1989—2019 年发表的SCIE 收录的法医物证学文献,共1 126 篇。文献来源于108 本期刊(图1),文献发表量在10 篇以上的期刊共11 本,按学者文献发表量从多到少依次为Forensic Science International-Genetics(2018 年影响因子为4.884,Legal Medicine Q1,Genetics &Heredity Q1),Journal of Forensic Sciences(2019 年影响因子为1.441,Legal Medicine Q2),Forensic Science International(2019 年影响 因子为2.108,Legal Medicine Q1),International Journal of Legal Medicine(2019 年 影 响因子为2.222,Legal Medicine Q1),Forensic Science International:Genetics Supplement Series(影响因子未查到),Electrophoresis(2019 年影响因子为3.081,Biochemical Research Methods Q2;Analytical Chemistry Q2),Scientific Reports(2019 年影响因子为3.998,Multidisciplinary Sciences Q1),Legal Medicine(2019 年影响 因子为1.195,Legal Medicine Q3),Molecular Biology Reports(2019 年影响因子为1.402,Biochemistry &Molecular Biology Q4),PLoS One(2019 年 影响因子为2.740,Multidisciplinary Sciences Q2),Journal of Forensic and Legal Medicine(2019年影响因子为1.302,Legal Medicine Q3)。法医物证学的研究涉及领域众多,与遗传学、生物化学、分子生物学、免疫学、现代医学、微生物学等学科均有紧密联系,期刊来源较为分散,其中有69 本期刊发表文献仅为1 篇。
图1 文献来源分布Fig.1 The distributions of literature sources
中国大陆学者1989—2019 年发表的SCIE 收录的法医物证学文献数量总体呈上升趋势(图2A),其中1989—1998 年发文数量较少,1999 年开始迅速增加,2005 年发文数量达到第1 个高峰(62 篇),之后有所回落,2009 年起再次呈上升趋势,2019 年达到185 篇,这可能与各种先进技术手段的发展和应用密切相关。20 世纪80 年代中期以来,DNA 技术取得了革命性进展,21 世纪初,以高通量为显著特征的下一代测序(next generation sequencing,NGS)技术诞生并逐步成熟,这些科学技术的重大突破为法医物证学的发展注入了新活力。Web of Science 收录的文献类型包括论文(article)、会议录论文(proceedings paper)、社论(editorial material)、书信(letter)、会议摘要(meeting abstract)、新闻(news item)、注释(note)、综述(review)等。在计入本研究的文献中,论文的数量远高于其他文献类型,书信次之(图2B)。从附表1 中还可看出,近30 年来中国大陆学者发文除数量呈总体上升趋势外,论文的发表仍占据主导。参考各期刊相应年份的JCR 分区信息,对26 本期刊(因Forensic Science Inter-national:Genetics Supplement Series无分区信息,故排除)的912 篇文献进行分区和时间统计,结果见图2C。较之2000 年以前,近5 年来中国大陆学者发表在Q1分区期刊中的文献数量显著提升,表明我国法医物证学科的整体水平不断提高,受到国际学术界的高度重视和认可。
图2 1989—2019年SCIE收录中国大陆法医物证学领域文献的总体情况Fig.2 General situations of SCIE-included literatures in forensic genetics in Chinese mainland from 1989 to 2019
2.2 研究机构
中国大陆学者1989—2019 年发表的SCIE 收录的法医物证学文献的研究机构合作网络图见图3。排名前10 位的研究机构分别是四川大学、西安交通大学、中国科学院昆明分院、复旦大学、司法鉴定科学研究院(原司法部司法鉴定科学技术研究所)、公安部物证鉴定中心、中山大学、中国医科大学、南方医科大学、苏州大学,其中四川大学发文数量位居第一(381篇)。总被引频次超过100 次的第一作者单位共有14 所,共被引用5 744 次,占全部被引频次的67.20%(5 744/8 547,表1)。从图3 可以看出,西安交通大学和中国科学院、南方医科大学合作紧密,复旦大学与司法鉴定科学研究院因共享诸多实验和技术资源而合作密切。
表1 1989—2019年SCIE收录中国大陆法医物证学领域文献总被引频次超过100次的第一作者单位Tab.1 First author affiliations of SCIE-included literatures with a total of more than 100 citations in forensic genetics in Chinese mainland from 1989 to 2019
图3 1989—2019年SCIE收录中国大陆法医物证学领域文献的机构合作网络图Fig.3 Network diagram of institutional collaboration of SCIE-included literatures in forensic genetics in Chinese mainland from 1989 to 2019
2.3 作者
1 126 篇SCIE 收录的法医物证学文献中,共有作者7 402 人次,合计2 426 位作者,平均每篇文献署名6.57 人,平均每人次发文0.15 篇,平均每位作者发表0.46 篇。发文数量在50 篇以上的作者(含发文所有作者)有10 人,分别为侯一平(Hou,YP)、张林(Zhang,L)、吴瑾(Wu,J)、张霁(Zhang,J)、李成涛(Li,CT)、朱波峰(Zhu,BF)、李英碧(Li,YB)、王正(Wang,Z)、梁伟波(Liang,WB)、严江伟(Yan,JW)。发文数量在15 篇以上的通信作者有9 人,分别为侯一平、李成涛、朱波峰、梁伟波、张林、黄代新(Huang,DX)、刘超(Liu,C)、吕德坚(Lu,DJ)、孙宏钰(Sun,HY)。作者合作网络图见图4,可反映法医物证学领域的研究团队。
图4 1989—2019年SCIE收录中国大陆法医物证学领域文献的作者合作网络图Fig.4 Network diagram of author collaboration of SCIE-included literatures in forensic genetics in Chinese mainland from 1989 to 2019
2.4 基金资助
1 126篇SCIE收录的法医物证学文献中,有685篇得到基金资助,资助率达60.83%。近11 年来我国法医物证学领域得到的资助呈现逐步上升趋势,主要为国家级基金资助项目。2009—2019年中国大陆法医物证学领域SCIE 收录文献的基金资助数量排名前5 的资助机构情况见图5。基金资助数量排名前5 的所属机构是国家自然科学基金委员会(498 篇)、中华人民共和国科学技术部(129 篇)、中央高校基本科研业务费专项资金(59 篇)、上海市科学技术委员会(55 篇)和中华人民共和国公安部(54 篇)。排名前5 的基金资助数量占74.65%(795/1 065,部分文章受多个基金资助,故重复计数),其他还包括中华人民共和国教育部、中国科学院、中华人民共和国财政部等机构。国家自然科学基金作为我国法医物证学科研经费的主要来源,充分反映了我国对法医物证学科建设的重视,极大推进了国内法医物证学的蓬勃发展。
图5 2009—2019年SCIE收录中国大陆法医物证学领域文献的基金资助数量排名前5的资助机构情况Fig.5 Top 5 funding agencies of SCIE-included literatures in forensic genetics in Chinese mainland from 2009 to 2019
2.5 文献被引情况
2.5.1 有无基金资助的文献被引情况比较
无基金资助文献的被引率和被引频次中位数,与有基金资助文献的被引率、被引频次中位数相比,差异均具有统计学意义(χ2=29.70,Z=-3.765,P<0.05,表2)。
表2 1989—2019年SCIE收录中国大陆法医物证学领域文献基金资助和被引情况比较Tab.2 Funding support and citations of SCIE-included literatures in forensic genetics in Chinese mainland from 1989 to 2019
2.5.2 高被引文献特征分析
根据所得数据及学科特点,将被引频次超过15次的文献定义为高被引文献。通过分析发现,高被引文献多具有以下特征:(1)发表于高影响因子的期刊。如四川大学与加州大学圣地亚哥分校于2012 年合作在Molecular Cell发表的“Genome-wide Methylation Profiles Reveal Quantitative Views of Human Aging Rates”,率先建立了使用甲基化与年龄的定量模型,该文献在Web of Science 核心合集中被引用904 次,该期刊2019 年的影响因子为15.584,属生物化学与分子生物学Q1 分区。(2)文献优先报道研究热点或学术前沿。学术会议中专家的学术报告常反映该学科的研究热点。侯一平等在2000 年第2 届Forensic Y Chromosome User Workshop 会议上报告的“Allele sequences of six new Y-STR loci and haplotypes in the Chinese Han population”在Web of Science 核心合集中被引用91 次(相关文献于次年发表在Forensic Science International)。(3)文献由多个机构共同完成,样本量大,结论通用性强。如由中国政法大学、四川大学、汕头大学、昆明医科大学等机构于2014 年共同参与发表的“A global analysis of Y-chromosomal haplotype diversity for 23 STR loci”,是一项使用Power-Plex Y23 系统测定全球129 个人群Y 染色体样本中部分STR 基因座的全球合作性研究,该文献在Web of Science 核心合集中被引用131 次。(4)文献紧密结合国内情况,结论实用性强。如中国科学院昆明分院与德国汉堡大学等于2002 年发表的“Phylogeographic differentiation of mitochondrial DNA in Han Chinese”在Web of Science 核心合集中被引用410 次。
2.6 关键词共现和研究热点分析
关键词共现指两个或更多关键词同时出现在同一篇文献中,关键词与关键词之间的共现关系可用于描述某一学术领域内部的组成关系和结构,揭示学科发展动态和发展趋势,发现新的学科增长点和突破口[27]。为了更好地体现国内法医物证学领域不同时期的研究热点和前沿,本研究将1989—2019 年分为3 个时间段(1989—1999 年、2000—2009 年、2010—2019 年),对关键词进行共现分析(图6),并结合关键词共现结果和堆积面积图(图7),通过对发表文献深度解读,归纳出STR、单核苷酸多态性(single nucleotide polymorphism,SNP)、插入/缺失(insertion/deletion,InDel)多态性、连锁遗传标记、线粒体DNA(mitochondrial DNA,mtDNA)遗传标记、表观遗传标记、RNA 遗传标记、芯片技术和组学研究方法9 大类。
图7 2009—2019年SCIE收录中国大陆法医物证学领域文献的关键词堆积面积图Fig.7 Keywords stacked area chart of SCIE-included literatures in forensic genetics in Chinese mainland from 2009 to 2019
图6 1989—2019年SCIE收录中国大陆法医物证学领域文献的关键词共现网络图Fig.6 Keywords co-occurrence network diagrams of SCIE-included literatures in forensic genetics in Chinese mainland from 1989 to 2019
2.6.1 STR
STR 因具有高灵敏度、强种属特异性、结果高度准确且易于标准化的特点,在过去20 余年中成为个体识别和亲子鉴定的金标准[28-29],也成为物证学领域的研究热点。该研究主题下,中国大陆学者发表的SCIE 收录的文献共743 篇。司法鉴定科学研究院因与多所院校(如四川大学、复旦大学等)合作研究而有较多文献,除此之外,四川大学、西安交通大学、中国科学院、南方医科大学等在此领域均有丰硕成果。许多学者对国内外研发的STR 试剂盒进行了系统验证,评价其在亲子鉴定和个体识别中的应用效能[1,30-31];还有学者使用常染色体STR 对我国不同地区的汉族群体(如西北汉族[32]、西南汉族[33]等)和少数民族群体(如藏族[34]、撒拉族[35]等)进行基因检测,所得结果不仅适用于相应地区的个体识别、亲子鉴定以及群体遗传学和人类遗传学研究,还丰富了我国少数民族的遗传信息资源。
Y 染色体STR(Y chromosome STR,Y-STR)呈父系遗传的独特遗传方式,使得Y-STR 分型在法医学中具有特殊意义。2001年,HOU 等[36]在SCIE上发表了第一篇用Y-STR 位点信息分析中国汉族人群的文献,拉开了Y-STR 在国内应用的序幕。四川大学[37]、昆明医科大学[38]等参与的全球性合作研究,其研究成果在系谱研究(如依据特定Y-STR 单倍型推断种族来源)、群体遗传学(如判断全球人群的迁徙情况)、法医学应用等方面具有重要意义。复旦大学、四川大学、汕头大学等的一项合作研究[39]通过分析37 994 条Y 染色体在行政区域划分和民族区域划分上的变异分布,完善了国内族群分化的基本信息。许多学者通过研发不同的Y-STR 检测系统,对国内不同群体(如广东汉族[40]、山东汉族[41]、彝族[42]、黎族[43]等)进行分析,解析了不同人群的遗传多态性,为不同人群的父权鉴定、个体识别提供了有力的参考。X 染色体STR(X chromosome STR,X-STR)的性连锁特征,使其在一些特殊案件和复杂亲缘关系鉴定中具有重要意义。诸多研究者通过设计不同的X-STR 检测体系[44-46],验证了X-STR 连锁不平衡在男女性和不同群体之间存在差异,为个体识别、复杂亲缘关系鉴定提供了可靠依据。
短片段STR 分型又称miniSTR 分型,在检测微量或严重降解生物检材时具有极大优势[47]。在该领域,河北医科大学法医学院丛斌团队的成果显著,该团队建立的两套miniSTR 复合体系[48],解决了困扰法医学界的降解DNA 分型及溯源等难点问题;发现的核小体保护的STR(nucleosome protected STR,NPSTR)[49],与其他STR 相比,无论是在人工制备的降解DNA 样品还是实际样品中,都具有更强的分型能力,极大地推动了我国法医物证学的发展。
2.6.2 SNP
SNP 是指基因组中特定部位单个碱基序列的变异引起的DNA 序列多态性,相较于STR,SNP 扩增片段长度小、突变率低、检测方法多样、分型无stutter 峰等人工伪峰,因此在法医学应用中受到越来越多的关注。该研究主题下,中国大陆学者发表的SCIE 收录的文献共119 篇。公安部物证鉴定中心的李彩霞团队[50-51]参与设计的祖先信息SNP(ancestry informative SNP,AISNP)体系可在全球范围内区分至少10 个族群。西安交通大学的朱波峰团队使用不同的AISNP体系对维吾尔族[52]、哈萨克族[53]、回族[54]等少数民族进行始祖分析,为少数民族的祖先推断提供了参考。河北医科大学的丛斌团队[55]筛选了44 个杂合性高、遗传分化指数(FST)低的SNP,构建的个体识别SNP(individual identification SNP,IISNP)系统可作为STR分析的有力补充。四川大学的侯一平团队[56]结合NGS 技术、毛细管电泳技术、焦磷酸测序技术,利用Y-SNP构建了系谱信息SNP(lineage informative SNP,LISNP)系统,对混合人群和一些少数民族的识别大有裨益。中国科学院北京基因组研究所与印第安纳普渡大学等[57]合作验证了HIrisPlex-S 系统利用微量DNA 预测眼睛、毛发及皮肤的颜色的效能,为人体生物特征的刻画和案件的侦查提供了线索。然而,SNP 二等位基因的性质使多态性程度大大降低,若想获得与多等位基因STR 标记相当的识别率,则需更多的SNP 遗传标记。YE等[58]、GUO等[59]分别运用熔解曲线SNP(melting curve SNP,McSNP)方法和NGS 技术,同时复合扩增大量的SNP 标记,为SNP 在法医物证学领域的广泛应用奠定了基础。
2.6.3 InDel多态性
InDel 突变率低,分型结果可用多重荧光PCR 联合毛细管电泳技术进行检测,且无stutter 峰等人工伪峰,近年来逐渐成为物证学领域的研究热点。该研究主题下,中国大陆学者发表的SCIE 收录的文献共71 篇。现有的InDel 群体遗传学数据包含很多民族,如畲族[60]、回族[61]、哈萨克族[62]等,同时也建立了相应的InDel 分型系统。也有学者[14-15]利用X 染色体的InDel 遗传标记进行复杂亲权鉴定,为复杂亲缘关系的鉴定提供了新思路。
2.6.4 连锁遗传标记
连锁遗传标记是指紧密连锁的两个或多个遗传标记组成的复合标记,包括SNP-STR、微单倍型、multi-InDel、InDel-STR 等,具有多态性高、扩增片段短、突变率低等特点,可以作为主流遗传标记的有效补充,近年来逐渐成为法医遗传学研究热点。该研究主题下,中国大陆学者发表的SCIE 收录的文献共30 篇。新型连锁遗传标记在不平衡混合斑检验中具有常染色体STR 不可比拟的优势。研究[63-64]结果表明,将一组SNP-STR 标志物与基于扩增受阻突变系统(amplification refractory mutation system,ARMS)的PCR 技术相结合,可有效检测出不平衡混合物中的次要DNA成分。在人群结构分析和族源推断方面,微单倍型和multi-InDel 较SNP、InDel 更具优势。四川大学CHEN等[65]调查了中国汉族、藏族、壮族、侗族、维吾尔族5 个民族,发现微单倍型平均杂合度为0.61,相较SNP 的0.41 呈现出优势,并进一步显示维吾尔族与其他族群之间存在显著差异。四川大学FAN 等[18]研究发现,10 个X-multi-InDel 足以区分欧洲、东亚和非洲人群,其效能几乎与21 个祖先信息InDel 相同。连锁遗传标记在亲缘关系鉴定及个体识别中同样具有应用价值,四川大学HUANG 等[16]构建了包含20 个multi-InDel 的复合体系,其累积非父排除率和累积个体识别率分别为0.998 9 和0.999 999 999 999 4。四川大学FAN 等[14]研究了位于X 染色体上的multi-InDel 标记,为复杂亲缘关系的鉴定提供了新的支持信息。
2.6.5 mtDNA遗传标记
相比于细胞核DNA,mtDNA 具有母系遗传、多拷贝数、异质性、多态性和耐降解等特点,因此具备独特的法医学应用价值。该研究主题下,中国大陆学者发表的SCIE 收录的文献共45 篇。中国科学院/云南省动物模型与人类疾病机理重点实验室FAN 等[66]对MitoTool(www.mitotool.org)进行更新,加入一种新的评分系统,用于mtDNA 单倍型测定,实现了mtDNA 单倍型的自动化分型。YAO 等[67]比较了3 种不同测序策略检测到的mtDNA 突变模式,并进一步总结单细胞测序方法检测不同人血细胞中mtDNA 的突变模式。中国医科大学ZHOU 等[68]利用Ion Torrent PGMTM平台完成了线粒体基因组测序。上海市刑事科学技术研究院MA 等[69]同样使用Ion Torrent PGMTM平台,对母子对线粒体基因组进行大规模平行测序,展示了母子对之间mtDNA 各位点的突变水平。浙江大学YANG 等[70]提出了鉴别mtDNA 单倍群的实时定量聚合酶链反应(quantitative real-time polymerase chain reaction,qRT-PCR)策略,该策略准确性高、重复性好、灵敏度高,尤其可以快速、经济地进行大规模筛选。基于上述技术的发展,许多学者对我国汉族及少数民族人群的mtDNA 进行分析,如河南汉族[71]、土族[72]、白族[73]、彝族[74]、锡伯族[75]、哈萨克族[76]等,进一步丰富了我国各民族的基因信息。西安交通大学CHEN 等[77]通过对中国8 个民族919 名无关个体进行线粒体高变区C-stretch 序列变异研究,结果表明,C-stretch 可作为群体遗传的可靠遗传标记。中国科学院与德国汉堡大学在该领域合作较多,YAO 等[78]提出对mtDNA 数据库进行严格质量控制,以提高数据质量;BANDELT等[79]通过对mtDNA 非母体遗传案例的研究得出,法医学实践中若出现混合或镶嵌型mtDNA 现象,可以归因于污染和样本混杂。
2.6.6 表观遗传标记
表观遗传学是指不改变DNA 序列的、可遗传的基因表达改变,包括DNA 甲基化、染色质重塑、基因组印记、X 染色体失活以及非编码RNA 调控等。在某些特殊情况下,如同卵双生子甄别、组织体液来源鉴定、年龄推断等,表观遗传标记能提供STR 或SNP 不能提供的信息。该研究主题下,中国大陆学者发表的SCIE 收录的文献共28 篇,其中DNA 甲基化是最热门的研究方向。许多学者利用甲基化随年龄变化的特点,筛选出年龄相关的CpG(age related-CpG,ARCpG)位点,并构建模型用于法医学年龄推断[80-83]。近年来,许多研究结果表明,同卵双生子在表观遗传水平上存在差异,四川大学LI 等[9]、河北医科大学DU等[10]、河北医科大学XU 等[11]从全基因组中鉴定出区分同卵双生子的潜在DNA 甲基化标志物,为同卵双生子甄别提供了新思路。司法鉴定科学研究院李成涛团队[12]基于全基因组阵列的方法揭示了整个基因组中成年同卵双生子在约45 万个CpG 位点上存在甲基化差异,还探讨了同一成年个体在短时间内基因组甲基化模式的变异性,有助于理解成年同卵双生子之间以及同一个体随时间的表观遗传差异。亲子鉴定中,特别是在无母亲参与的情况下,往往不能确定从父亲处遗传的等位基因,此时遗传标记的非父排除率大大降低,为此,华中科技大学同济医学院ZHAO等[84]提出利用亲本特异性DNA 甲基化标记确定等位基因的亲本来源。
2.6.7 RNA遗传标记
RNA 分析作为体液鉴定的一种潜在方法,已成为法医学领域的研究热点,许多学者对包含微RNA(microRNA,miRNA)、环状RNA(circular RNA,circRNA)、信使RNA(messenger RNA,mRNA)和Piwi相互作用RNA(Piwi-interacting RNA,piRNA)在内的几种RNA 分子进行探索,并发现了一系列法医体液相关的RNA 标志物。该研究主题下,中国大陆学者发表的SCIE 收录的文献共38 篇。四川大学在该领域的研究成果颇多。WANG 等[19]建立了miRNA 表达的数据分析模型,以计算miRNA 在法医相关体液中的相对表达量,并于次年提出了5 种体液特异性miRNA用于静脉血、精液和月经血的法医学鉴定[85],后又提出有效区分唾液和其他体液的miRNA 组合策略[86]。SONG 等[20]开发了一种包含19 个标志物的新型多重mRNA分析体系(multiplex mRNA profiling system)用于中国汉族人群体液鉴定。近年来,除miRNA 外,其他RNA 标志物也备受学者关注。复旦大学ZHANG等[87]提出在mRNA 表达谱分析中纳入circRNA 有助于法医学体液鉴定中mRNA 标志物的检测。四川大学WANG 等[88]通过对4 种piRNA进行研究,结果表明,piRNA 的表达模式可用于识别体液,且piRNA(piR-55521)在精液中特异性表达,该团队在后续研究中进一步扩展了潜在piRNA 生物标志物的数量[89]。
2.6.8 芯片技术
20 世纪90 年代逐渐兴起的微流控芯片技术具有液体流动可控、样品和试剂消耗少、分析速度快、易于实现集成化和自动化等特点,以微流控芯片为主导的DNA 分析系统使法医DNA 快速分析成为可能。该研究主题下,中国大陆学者发表的SCIE 收录的文献共12 篇,主要研究方向为芯片PCR 扩增、芯片毛细管电泳及集成式芯片等。中国科学院过程工程研究所XU等[6]开发了一种抗气泡的一次性微流控聚合酶链反应(microfluidic polymerase chain reaction,microPCR)芯片,与自行研发的便携式可编程PCR 装置相结合,适用于各种DNA 片段及STR 的扩增,为便携式法医检测提供了可能。北京理工大学QIN 等[7]开发了一种带有牛血清白蛋白(bovine serum albumin,BSA)涂层的Norland 紫外固化光学胶NOA81 PCR 芯片[Norland Optical Adhesive 81(NOA81)PCR chip,NP-chip],能够实现单引物和多引物基因扩增。北京市公安局HAN 等[8]对基于玻璃微流控芯片的毛细管电泳系统进行了优化,并开发了用于法医STR 自动分析的全集成微芯片系统,该系统成功对口腔拭子和全血样本进行了分型。
2.6.9 组学研究方法
法医物证学领域的组学研究主要有基因组学(genomics)、转录组学(transcriptomics)、微生物组学(microbiome)、宏基因组学(metagenomics)、蛋白质组学(proteomics)等。该研究主题下,中国大陆学者发表的SCIE 收录的文献共38 篇。基因组学中的NGS技术自2005 年出现后,迅速被应用于生命科学研究的各个领域。相较于Sanger 双脱氧核苷酸链终止法测序,NGS 边合成边测序的原理使其可兼测长度多态性和序列多态性,除此之外,其通量高、灵敏度高、准确性高、总体成本低的特点,也使得越来越多的学者将其应用于法医物证学领域,如运用该技术进行线粒体基因组测序[13,68]、STR 分型[90]、SNP 分型[59]等。四川大学WANG 等[21]于2015 年首次使用NGS 分析微单倍型位点,提示了微单倍型的应用潜力。中国医科大学法医学院GUO 等[59,90]于2016 年用Ion Torrent 测序平台评估了Early Access STR Kit v1 的性能,并使用该测序平台对HID-Ion AmpliSeqTMIdentity Panel 进行了评估,为NGS 在STR 分型、SNP 分型上的应用提供了参考。中南大学的GUO 等[22]使用NGS 分析细菌群落,奠定了微生物在法医物证学领域应用的基础。宏基因组DNA 测序技术的发展同样促进了微生物群落的研究进展。南昌大学的徐振江团队[91]与檀香山夏明纳大学合作,将死亡现场物体上的微生物群落与个体进行匹配,从而开辟了一种新的关联和识别方法。四川大学的罗海波团队[23]发现,基于16S rRNA 的高分辨率熔解(high-resolution melting,HRM)分析可区分不同人群的口腔微生物群落,为法医学个体识别提供了新的标志物。公安部物证鉴定中心的李彩霞团队[92]对毛干蛋白质组中的非同义单核苷酸多态性(nonsynonymous single nucleotide polymorphism,nsSNP)测序验证,发现可用其区分东亚、欧洲、非洲三大洲际人群。清华大学的邓海腾团队[24]使用质谱法成功区分出血液、唾液和精液,为体液鉴定提供了新的思路。组学技术的出现大大促进了法医物证学领域的发展,随之而来的数据分析也成为诸多学者关注的重点。四川大学的ZHU 等[93]设计的Forensic-Loci-finder(FLfinder)可从NGS数据中检测SNP并对微单倍型位点分型。中国科学院的ZHAO 等[94]研发的AIM-SNPtag,通过特殊算法,可有效地从全基因组范围的SNP 数据中构建适用于祖先推断的SNP 复合体系。
2.7 小结
本研究采用文献计量学方法,以共现分析为基础,将中国大陆学者发表的SCIE 收录的法医物证学文献信息转化为可视化图谱,并对图谱和文献进行深度解读,通过作者、研究机构、关键词共现分析等展现法医物证学领域的研究团队和研究热点。未来法医物证学研究热点除了丰富现有遗传标记的群体遗传学数据外,开发更多的遗传标记、对现有技术的推广以及新技术在法医学实践中的应用都可能成为关注的焦点。在遗传标记领域,以分子表型为研究重点,开发新的分子表型遗传标记,通过物证检材推测个体表型特征;以非编码RNA(non-coding RNA,ncRNA)为研究重点,分析ncRNA 在人类不同组织体液、不同年龄阶段及不同损伤中的表达分布规律,通过生物检材溯源体液、推断年龄及个体识别;以16S rRNA 为研究代表,结合组学技术开发微生物菌群遗传标记在生物检材鉴定、个体识别、死亡时间推断等方面的应用。在分析技术领域,高速化、精准化、微量化、高通量化将持续成为追寻的目标。利用等位基因特异性聚合酶链反应(allele specific-polymerase chain reaction,AS-PCR)技术检测mtDNA,可为高度腐败降解检材的分析提供可能;利用激光捕获显微切割(laser capture microdissection,LCM)技术可快速得到单一DNA 的分型数据,从而应用于微量混合生物样本的检测。现有技术的有机结合也将是未来技术领域的关注重点,如将NGS 技术与LCM 技术结合,可用于微量混合生物样本的检测;将NGS 技术与单细胞测序(single cell sequencing,SCS)技术结合,可为法医微量、降解及混合检材提供新的分析思路。逐步完善技术方法的标准化、规范化、流程化和结果的质量控制都将成为今后法医物证学的研究方向。
致谢:感谢南京医科大学的陈峰教授,华中科技大学同济医学院的黄代新教授,司法鉴定科学研究院的李成涛教授、黄平研究员,以及山西医科大学的严江伟教授等对本文提出修改、补充意见。