APP下载

基于Web of Science的新生儿遗传代谢病筛查引文分析

2020-05-22杜佳月张治国沈丽宁谢立春

医学与社会 2020年3期
关键词:质谱法串联排序

荆 丽 徐 娟 杜佳月 张治国 沈丽宁 谢立春

1 华中科技大学同济医学院医药卫生管理学院,武汉,430030;2 深圳市卫生健康发展研究中心,深圳,518028;3湖北省卫生技术评估研究中心,武汉,430030

引文分析,即对各文献之间的相互引证关系进行分析,可以从众多文献中快速找出更有价值的文献,提升研究效率。由美国科学信息研究所(Institute for Scientific Information, ISI)创始人尤金·加菲尔德博士设计研发的HistCite是一款高效的引文分析可视化软件,能快速收集文献信息并进行有效的管理,使得科学研究评估更加量化[1]。HistCite软件通过对导入的文献进行整合,根据整合的结果找出文献之间的引证关系,并能依据不同指标对文献进行排序,从而找出更有质量的经典论文、贡献卓著的权威机构、研究人员及杂志期刊等[2]。

本文采用HistCite软件,对新生儿遗传代谢病筛查领域的相关文献进行引文分析,找出本领域的重要文献,生成引文编年图,并对本领域研究的发展历程进行呈现[3],进而分析新生儿遗传代谢病的筛查意义、筛查方法和筛查效果,为今后的新生儿筛查工作提供参考。

1 资料来源及方法

1.1 资料来源

本文进行引文分析所收集的文献均源自Web of Science(下文简称WOS)核心合集数据库(包括SCIE、SSCI、CPCI-S、CPCI-SSH、ESCI等)。检索式主题为“新生儿筛查”和“遗传代谢性”,英文表达形式为:TS= (“neonatal screening” OR “newborn screening”) AND TS=(“metabolic disease” OR “metabolic disorders” OR “metabolism”);时间限定为“所有年份”;文献类型限定为“全部文献”;语言限定为“所有语言”。第一个主题检索到的文献数量为7339篇,第二个主题检索到的文献数量为583132篇文献,对两个检索式进行逻辑组配后检索到的文献数量为1040篇(检索截止时间为2019年7月17日)。

1.2 研究方法

将检索到的1040篇文献导入HistCite软件中并进行以下指标的分析。LCS(Local Citation Score),本地引用次数,指某篇文献在本地数据集中的被引用次数或同行引用次数。GCS(Global Citation Score),总被引频次,表示这篇文献被整个WOS数据库中所有文献引用的次数。LCR(Local Cited References),本地参考文献数,表示该篇文献引用到的所有参考文献中,有多少篇文献在本地数据集中。CR(Cited References),参考文献数,指该文章的参考文献数量。本地总被引次数(Total Local Citation Score, TLCS),是指在当前数据集中该文献的被引次数之和。总被引次数(Total Global Citation Score, TGCS),指的是在WOS数据库中的所有文献被引次数的和。引用频次(Records,Recs),指的是相关记录数。

2 结果

导入HistCite软件后,共得到1040条有效记录,涉及4385位作者、347种期刊、20639条参考文献、2125个关键词,采用前述指标进行文献引证分析。

2.1 文献引用频次分析

将导入的所有文献按照LCS和LCR两个指标进行排序,分别得到引用频次排名前30的文献列表。进行初步整理后发现,第139篇(LCS=103,LCR=20)、87篇(LCS=43,LCR=18)、388篇(LCS=39,LCR=15)、161篇(LCS=31,LCR=15)这四篇文献在两次指标排序中均有名次,说明这4篇文献的参考价值较大。

第139篇是Chace DH(2003)等人关于用串联质谱法进行代谢性紊乱筛查的发展历史的记录以及对串联质谱技术的分析,研究结论为:串联质谱法等分析技术具有更高的灵敏度和特异度,因此适用于新生儿筛查和其他大规模筛查项目;第87篇是Chace DH(2002)等人关于串联质谱技术应用于新生儿代谢病筛查的实用指南,旨在帮助遗传病学专家更深入全面地了解新生儿串联质谱筛查;第388篇是Wilcken B(2009)等人采用队列研究的方法,分析接受筛查和未接受筛查的两组6岁儿童患者的临床结果,结论显示:采用串联质谱法进行筛查为患者提供了更好的临床结果,能够有效降低儿童死亡率等;第161篇是Pandor A(2004)等人对使用串联质谱法进行新生儿先天性代谢异常筛查的临床效果和成本效果的综述分析,该综述结果肯定了串联质谱法具有成本和效果优势。

2.2 发文作者分析

采用HistCite软件对涉及到的4385名作者进行分析,采用Recs、TLCS和TGCS三个指标进行统计。通过对比发现有5位著者都出现在了三个指标的排名中,说明这些学者的研究结果具有更高认可度。他们分别是:Wilcken B(澳大利亚)、Hoffmann GF(德国)、Matern D(美国)、Rinaldo P(美国)和Chace DH(美国)。

2.3 文献数量的年份趋势

按照检索到的文献,将各年份的发文数量进行收集并整理(2019年只截至7月),分别采用Recs和TLCS两个指标进行分析,绘制成图1。

图1 1997-2019年发文情况

从折线图可以看出,1997-2019年间的发文数量总体是波动上升的,其中2018年的相关文献数量最多(88篇),各年份中文献总被引次数最高的是2003年(605次)。

2.4 引文编年图分析

将全部文献按照LCS排序,筛选出前30篇权威文献,并绘制相应的引文编年图(图2)。图中的圆圈代表结点,其大小与分析时所采用的指标LCS值相对应,若某文献结点越大,则被本领域其他研究者引用的频次越高[4]。圆圈中的数字是文献在本地数据库中的编号,图中的箭头方向表示文献之间的相互引证关系。被指向的箭头越多,说明该文献的引用频次越高,则研究价值越大。

从图中可以看出,检索到的文献中最早的发文是1997年的第7篇和第8篇,被箭头指向较多且圆圈较大的文献是第81篇、第127篇和第128篇,均是对新生儿筛查采用串联质谱法的研究。

第81篇文献是Zytkovicz TH(2001)等[5]发表在《CLINICAL CHEMISTRY》上的“Tandem mass spectrometric analysis for amino, organic, and fatty acid disorders in newborn dried blood spots: A two-year summary from the New England newborn screening program”(LCS=107;GCS=335),该文是对新英格兰地区新生儿代谢病筛查计划的两年总结。结论为:使用串联质谱法筛查23种代谢性紊乱疾病时,其阳性预测值优于其他方法检测的报告值。

第127篇文献是Schulze A(2003)等[6]发表在《PEDIATRICS》上的“Expanded newborn screening for inborn errors of metabolism by electrospray ionization-tandem mass spectrometry: Results, outcome, and implications”(LCS=135;GCS=294),该文献主要是研究采用串联质谱法进行新生儿代谢病筛查对德国先天性代谢病总体检出率的影响,并评估被诊断患者的临床结果。结论为:与常规筛查相比,串联质谱对多达23种代谢病的筛查使检出率提高了大概一倍。

第128篇文献是Wilcken B(2003)等[7]发表在《NEW ENGLAND JOURNAL OF MEDICINE》上的“Screening newborns for inborn errors of metabolism by tandem mass spectrometry”(LCS=160;GCS=385),该文献研究了串联质谱法对新生儿31种疾病筛查诊断率的影响。结论为:通过串联质谱法进行筛查能够更快诊断出更多的先天性代谢紊乱患者。

从图中可以看出第45篇文献是一个独立的结点,确认文献信息后发现该篇文献是Applegarth DA(2000)等[8]发表在《PEDIATRICS》上的“Incidence of inborn errors of metabolism in British Columbia, 1969-1996”,仅是对不列颠哥伦比亚省新生儿遗传代谢病的流行病学研究,因此在相关文献中的引用频次不多,表现为一个独立的点。

图2 引文分析编年图

2.5 文献的期刊、类型、机构及国家分布

采用Recs和TLCS两个指标对期刊的分布进行前十排序,汇总如表1,排名靠前的期刊与分子生物学、遗传病学、临床医学、儿科学等相关。

对数据集中收录的文献进行文献类型分析,结果显示,无论是按照Recs还是TLCS进行排序,文献类型数量均为Article>Review>Others,即本领域的文献以研究型的文章为主(占比72%以上)。

对收录的文献的所属机构和所属国家采用Recs、TLCS以及TGCS三个指标进行排序,排名前十的所属机构主要是儿童医院,其次是大学机构。所属国家中,美国和德国稳居前两位,其次是加拿大、澳大利亚和英国等。而中国只有在Recs排序中进入过前十名,其他指标排序均未见。即美国和德国等国家的研究数量多、认可度较高,而中国的研究虽多,但被同行认可的高质量文章有待增加。

表1 发文排名前十的期刊统计表

2.6 文献关键词词频分析

对收录的1040篇文献进行Words排序,选出Recs值≥90的关键字,绘制条形图如图3所示。接着对根据LCS排序后选出的30篇权威文献,即图2引文编年图中的30篇文献进行关键词词频分析,摘录出每篇文献的关键词,筛选出排名前十的关键词(表2)。通过对关键字和关键词进行整合分析,快速定位出本领域研究热点和话题的关键词为:先天性缺陷、串联质谱、新生儿筛查等。

图3 关键字Recs排序分布图

表2 排名前十的关键词汇总表

3 讨论

进行引文分析,可以帮助研究者快速确定哪些是值得研读的文献,从而将研究者从复杂的文献分析工作中解放出来,实现文献阅读的高效性。并且研究显示一般跨国家(地区)的大型人群研究较易在高水平的国际期刊上发表,并被多次引用[9]。因此,做好引文分析有利于我们找准高水平期刊和高引用文献,为以后的科研成果发表做准备。

3.1 热点文献都关注串联质谱技术在新生儿遗传代谢病筛查中的应用

四项引文分析指标都靠前的热点文献均显示与筛查技术相关。结合热点词分析并查看LCS和LCR指标靠前的文章,我们发现,介绍串联质谱技术和串联质谱技术在新生儿遗传代谢病筛查中的应用的相关文献较多,在同行引用次数中有些甚至达到了百位数以上,说明这些文献得到了同行的高度认可,也说明串联质谱技术在新生儿疾病筛查中已经得到了从业人员的认可,在以后的筛查项目中可考虑使用。

3.2 相关文献在2000年后逐步增多,2018年到达峰值

相关文献数量的年份趋势分析显示,2000年后新生儿筛查相关文献量逐步上升, 2018年相关文献数量最多(88篇),但总被引次数TLCS最高的是2003年(605次),说明2003年左右是在新生儿遗传代谢病筛查中引入串联质谱技术关键的一年,就同行引用的情况来说,2003年和2006年发表的文献TLCS值较高,说明这两年发表的文献参考价值较高。

3.3 热点文献主要为国外医疗机构的研究

热点文献的作者、机构和国家分析显示,串联质谱技术在本领域的应用和拓展主要是国外学者在做。文献分析结果显示美国和德国等国家的研究认可度较高,而中国的研究虽多,但被同行认可的高质量文章不多。相较其他研究,串联质谱技术的研究主要分布于儿童医院等医疗机构,其次才是各类研究所,这可能和该技术着重于应用性有关。

3.4 热点文献肯定了串联质谱的检测效果

本文通过研究发现,在本领域关注度较高的文献分别是:Chace DH (2003)等人的“使用串联质谱法对新生儿血斑样本进行多分析物筛选”、Chace DH (2002)“串联质谱技术在筛查新生儿遗传代谢病中的应用”、Wilcken B (2009)“扩大新生儿筛查:筛查和未筛查的6岁患者临床结果”以及Pandor A(2004)“使用串联质谱法对新生儿进行先天性代谢病筛查的临床效果和成本效果:系统评价”,这4篇文献均为研究串联质谱法在新生儿筛查中的应用,并肯定了串联质谱法的优势和效果。

3.5 文献证明应用串联质谱法比传统方法检测效益更高

由引文编年图可知有3篇文献的同行被引频次较高,其主要内容是对串联质谱法在新生儿遗传代谢病筛查中的效果进行分析评价,并均肯定了此法相对于其他常规筛查法的优势:Zytkovicz TH(2001)[5]等人发表的“对新生儿干血斑中氨基酸、有机酸和脂肪酸疾病进行分析”一文中,串联质谱筛查极大地扩大了筛查病种;Schulze A(2003)[6]等人发表的“通过电喷雾电离--串联质谱法扩展新生儿先天性代谢病筛查”中的研究显示串联质谱法相比于其他传统方法对多达23种其他疾病的筛查使检出率提高了大概一倍;Wilcken B(2003)[7]等人发表的“通过串联质谱法对新生儿先天性代谢病进行筛查”中认为通过串联质谱法能够更快诊断疾病。

综上,早期新生儿筛查采用细菌抑制法以及放射免疫法等,但是随着科学技术的进步,串联质谱法被逐渐推崇,它能同时更快检测多种有机酸代谢紊乱、氨基酸和脂肪酸氧化缺陷病等,进而提升新生儿筛查的检出率。并且串联质谱法对样本要求与传统筛查方法无异,但灵敏度和特异度却显著提高,具有较好的筛查效果和收益[10]。因此,在今后的新生儿遗传代谢病筛查项目中,建议有条件的地区采用串联质谱法进行筛查。

猜你喜欢

质谱法串联排序
液相色谱-串联质谱法测定蔬菜中多菌灵的不确定度评定
QuEChERS-气相色谱-质谱法测定植物油中16种邻苯二甲酸酯
作者简介
恐怖排序
节日排序
串联法写记叙文的概括
气相色谱-质谱法检测食品中的丙烯酰胺
审批由“串联”改“并联”好在哪里?
我曾经去北京串联
串联攻坚弹后级引信自适应起爆方法