生存资料的二次研究系列之四:预后相关系统评价/ Meta分析的文献计量学研究
2016-08-26孟详喻方程李妙竹田国祥曾宪涛
孟详喻,方程,李妙竹,田国祥,曾宪涛
· 循证理论与实践 ·
生存资料的二次研究系列之四:预后相关系统评价/ Meta分析的文献计量学研究
孟详喻1,2,方程1,2,李妙竹3,田国祥4,曾宪涛1,2
预后指标在医学研究及临床实践中都具有重要意义。预后相关的系统评价/Meta分析对预后方面的研究资料进行评价、汇总以形成能用于指导临床实践的高质量证据。为了探索预后相关系统评价/Meta分析当前在全球范围的研究现状,本文通过检索Scopus数据库获得2006~2015年间发表的预后相关的系统评价/Meta分析文献,利用R软件、tm程序包、ggplot2程序包以及VOSviewer软件进行文献计量学分析、简单的文本挖掘及相关可视化展示。
预后;系统评价/Meta分析;文献计量学;文本挖掘;可视化
系统评价/Meta分析是目前最为活跃的医学二次研究类型[1]。预后指标在医学研究及临床实践中都具有重要意义,预后相关的系统评价/Meta分析对预后方面的研究资料进行评价、汇总以形成能用于指导临床实践的高质量证据[2]。
通过文献计量学研究对某一研究领域既往发表文献的文献分布、被引情况及合著情况等方面进行分析,有助于帮助研究者进一步了解相关领域的研究现状,为后续研究提供思路与借鉴。为了探索预后相关系统评价/Meta分析目前在全球范围的研究现状,本文通过检索Scopus数据库获得2006~2015年间发表的预后相关的系统评价/Meta分析文献,利用R软件、tm程序包、ggplot2程序包以及VOSviewer软件进行文献计量学分析、标题信息的文本挖掘及相关可视化展示。
1 材料与方法
1.1数据收集 本研究选用Elsevier旗下的Scopus数据库作为文献来源。该数据库为目前全球最大的同行评审文献数据库。将检索时间范围限定为2006至2015年,即目标文献为过去10年间发表的相关文献。为了获得预后相关的系统评价/Meta分析,在检索策略中限定文章标题包含“meta-analysis”或“systematic review”并且在标题或摘要中出现以“prognos”开头的英文单词(如prognosis、prognostic等)或“survival”,文献类型设定为“article”或“review”即论著或综述。研究领域限定为生命科学、医学与健康科学等相关领域。使用的检索式如下:((TITLE(meta-analysis) OR (TITLE(systematic) AND TITLE(review) ) AND (TITLE-ABS(prognos*) OR TITLE-ABS(survival)) AND DOCTYPE(ar OR re)AND SUBJAREA(BIOC OR IMMU OR NEUR OR PHAR OR PSYC OR MEDI OR NURS OR DENT OR HEAL) AND (PUBYEAR > 2005 AND PUBYEAR <2016)。
2 结果
2.1总览 经检索,在2006~2015年的10年间,共有6,918篇预后相关的系统评价/Meta分析为Scopus收录。其中有3,831篇(55.4%)文献作为论著(Article)发表,3,087篇(44.6%)文献作为综述(Review)发表。在同一时期,为Scopus收录的各类系统评价/Meta分析则有71,144篇,其中论著37,172篇(52.2%),综述33,972篇(47.8%)。预后相关系统评价/Meta分析占各类系统评价/Meta的比例为9.7%。以英文和中文发表的文献占绝大多数,分别为6,471篇(93.5%)与343篇(5.0%)。
2.2时间分布 预后相关系统评价/Meta分析以及全部类型系统评价/Meta分析的文献发表数量在2006~2015年期间的时间分布如图1所示。可以看出,二者的文献数量均呈上升趋势,且在2011~2014年期间增长最为迅速,而2015年则增速明显放缓。预后相关系统评价/Meta分析文献占各类文献百分比随时间的变化情况如表1所示。可以看出,2006~2013年间其百分比基本上以9%为中心波动(均值9.06%,标准差0.47%),而2014年则迅速增加至10.7%并在2015年轻微上升至10.9%。
2.3国家与机构分布 发文数量前十的国家依次为中国(2,106篇,30.4%)、美国(1,417篇,20.5%)、英国(950篇,13.7%)、加拿大(596篇,8.6%)、意大利(514篇,7.4%)、荷兰(490篇,7.1%)、澳大利亚(386篇,5.6%)、德国(383篇,5.5%)、法国(244篇,3.5%)与西班牙(179篇,2.6%)。排名前十的国家总发文量为5,751篇,占文献总量的83.1%。可以发现,除发文量排名第一的中国外,排名前十的其他国家均为欧美国家。
发文数量排名前十的一级机构及其发文量如表2所示,其中中国的研究机构占一半,四川大学发文量排名居首。发文数量不少于20篇的机构共有160个,这些机构共参与发表了4,299篇(62.1%)文献。
2.4期刊分布 检索获得的文献共涉及1,633种期刊,平均每种期刊发文4.2篇。发文量排名前十的期刊发文量如图2所示,在这些期刊中共发表相关文献1,052篇,占全部文献的15.2%。发文量最大的期刊为《PLoS ONE》(360篇,5.2%),其发文量明显高于位居第二的《中国循证医学杂志》(98篇,1.4%)。在这十种期刊中,有5种期刊为肿瘤学专业期刊,1种胃肠病专业期刊,其余4种为综合性期刊。绝大多数期刊(1,499种,91.8%)的发文量不超过10篇,超过半数的期刊(829种,50.8%)仅发表了1篇相关文献。
表2 预后相关系统评价/Meta分析的机构分布
2.5被引情况 检索获取的6,918篇文献被引用次数总计为162,088次,篇均被引次数为23.4次。其中1,391篇(20.1%)文献至今无被引记录,有1,307篇(18.9%)文献的被引次数≤3次。5,571篇有被引记录的文献的年均被引次数的均值为5.7次/年。被引次数排名前十的文献[8-17]与年平均被引数排名前十的文献[8,10,12,13,15,16,18-21]分别列于表3与表4中。可以发现,总被引次数与年均被引次数前十的文献均为国外学者发表的研究。肿瘤相关研究的数目在二者中均居首,均为4篇[8,10,14,16,21]。此外,上述高被引文献均发表于国际一流医学期刊而无一发表于图2中发文量前十的期刊。
图2 预后相关系统评价/Meta分析发文量前十的杂志
对中国学者发表的2,106篇文献进行被引分析后发现,这些文献被引用次数总计为14,035次,篇均被引次数为6.7次。有738篇文献尚无被引记录,占比35.0%;有487篇文献的被引次数≤3次,占比23.1%。1,368篇有被引记录的文献的年均被引次数的均值为3.1次/年。中国学者发表的文献中年均被引次数前十者列于表5中[22-31]。可以发现,这些文献研究主题均与肿瘤相关,且大多数涉及生物标记与肿瘤患者预后的关系[23-27,29-31]。
2.6参考文献 在纳入的6,918篇预后相关的系统评价/Meta分析文献中共引用了289,757篇次的参考文献,篇均参考文献数量为41.9篇。被引量排名前五的参考文献的基本信息列于表6中[32-36]。可以看出,这些高被引的参考文献中有3篇经典的Meta分析方法学文献,涉及随机效应模型[32]、异质性评价[33]和发表偏倚检验[35];而另外两篇则为介绍如何提取原始数据尤其是时间-事件资料以用于后续Meta分析的方法学文献[37,38]。
2.7研究者及合著网络 共有25,123名研究者参与了全部6,918篇文献的研究工作,篇均作者数为3.6名。发文最多的学者为兰州大学的杨克虎教授,共发文45篇。将发文数量不低于10篇的135名作者所构成的合著网络进行聚类与可视化展示(图3)。图3中的每一个节点代表一名研究者,两节点之间的连线代表两名研究者间的合著关系。节点的大小与相应研究者的发文数量成正比,连线宽度与合著次数呈正比。根据135名作者的合著情况,聚类分析将其划分为24个亚组,基本上每一个亚组对应一个合作紧密的研究团队,在图3中以不同的颜色进行标示。可以看出,在中国学者内部,即便不同的研究团队间基本上都有着较为紧密的合作,但中国学者与国外学者的合作则很少。而国外学者的合著关系仅限于研究团队内部,不同团队之间的联系则很少。
表3 总被引次数排名前十文献的基本信息
表4 年均被引次数排名前十文献的基本信息
表5 中国学者发表的文献中年均被引次数排名前十文献的基本信息
2.8标题信息的文本挖掘 对6198篇纳入文献的标题所构成的语料库进行文本挖掘。基于预处理后的语料库构建得到文本数量6,918个、词条数7,916条、稀疏度99.87%、最大词条长度43字节的文本-词条矩阵。出现频率前五的词条依次为“meta-analysis”(4,135次)、“systematic review”(3,894次)、“cancer”(2,305次)、“patients”(1,389次)和“prognostic”(840次)。出现频率不超过20次的词条总计7,406条,占全部词条的93.6%。50.7%的词条仅出现一次。经关联分析确定与“cancer”相关程度最高的词条为“lung”(相关系数r=0.35),相关度靠前的词条还有“breast”(r=0.32)、“non-smallcell”(r=0.32)、“advanced”(r=0.24)、“colorectal”(r=0.23)、“gastric”(r=0.22)、“chemotherapy”(r=0.20)、“prostate”(r=0.17)及“expression (r=0.16)”等。对出现频率前100的词条绘制术语云(图4)。为了方便展示,在术语云中将“meta-analysis”与“systematic review”分别简化为“meta”与“sysrev”。术语云中词条的字体大小与其出现频率成正比。对出现频率前100的词条进行分层聚类分析并绘制树状图(图5)。综合图4与图5的内容,读者能够对该领域的热点研究主题分布有快速和初步的认识。
表6 被引数排名前五的参考文献的基本信息
图3 发文量不低于10篇的作者的合著网络及聚类图
图4 纳入文献标题中出现频率前100词条的术语云
3 讨论
预后指标在医学研究及临床实践中都具有重要意义,预后相关的系统评价/Meta分析对预后方面的研究资料进行评价、汇总以形成能用于指导临床实践的高质量证据。在本系列的前几篇文章中,介绍了预后相关二次研究的基本概念[2]以及生存曲线合并[33]与时间-事件IPD重构[34]等基础方法学内容。本文首次以预后相关系统评价/Meta分析为主题进行了文献计量学分析,并进行了文本挖掘与相关可视化展示。
根据本研究的分析结果,预后相关系统评价/Meta分析的发文数量在过去10年间呈上升趋势,其增长情况与全部系统评价/Meta分析的增长情况基本一致,其在全部系统评价/Meta分析中所占的比例在过去两年有较为显著的上升。我国学者发表的预后相关系统评价/Meta分析的发文量位居各国榜首,占比近1/3。排名前十的其他国家则全部为欧美国家。发文量排名前十的研究机构中超过半数的机构来自我国。可见我国学者在该领域的研究发表数量上具有较大的优势。就期刊分布而言,我们可以明显地看出,预后相关系统评价/Meta分析文献集中发表于少数特定杂志的现象非常明显。其中我国期刊《中国循证医学杂志》发文量近百篇,仅次于《PLoS ONE》位居第二。就单个学者发文量而言,我国学者杨克虎教授位居榜首。
文献的被引情况是反映其学术影响力最为直接和重要的指标。通过对比我们可以发现,我国学者发表文献的篇均被引次数及有被引记录文献的年均被引次数均值均明显低于所有预后相关系统评价/Meta分析的相关指标,可见我国在该领域虽然研究发表数量大但研究成果的影响力较小。
的分析结果提示在该领域最有影响力的文献为Meta分析方法学经典文献以及介绍如何提取生存资料用于Meta分析的方法学文献。
发文量10篇及以上学者所构成的合著网络提示中国不同的研究团队之间存在着紧密的合作关系,而国外的不同团队间联系很少;中国学者与国外学者之间的联系也非常少。我们推测造成这一现象的原因在于,系统评价/Meta分析引入我国的时间相对较晚,率先掌握了系统评价/Meta分析理念与方法学的循证医学专家是开展系统评价/Meta分析的主力军,这部分人具有相似的学术背景,虽然就职于不同的研究机构但其相互之间的联系却是十分紧密的;而欧美国家的情况与我国存在较大差异,循证医学在欧美已经有了数十年的发展,其理念与方法学已经十分普及,不同学术背景的研究者与研究机构均有能力独立完成系统评价/Meta分析研究。
图5 出现频率前100的词条的分层聚类树状图
标题信息文本挖掘的结果显示,该领域内最热门的研究方向为恶性肿瘤,其中肺癌(尤其是非小细胞肺癌)、乳腺癌、晚期癌症、结直肠癌、胃癌及化疗等主题最受关注。发文量前十的期刊中半数是肿瘤学专业期刊以及高被引文献中有许多肿瘤学相关文献[8,10,14,16,21]也从侧面印证了这一发现。
综上所述,预后相关系统评价/Meta分析是系统评价/Meta分析中具有一定地位的重要类型,其发文数量在过去十年呈持续上升趋势。我国学者在该领域的文献发表数量位居世界前列,但影响力相对欠缺,需要在今后的研究工作中提升研究质量,加强与国际一流研究机构之间的合作,力争发表于国际一流期刊以增强学术影响。就研究主题而言,该领域内最热门的研究方向为恶性肿瘤,这印证了预后分析在肿瘤学临床研究中的重要地位。
参 考 文 献
[1] 曾宪涛,田国祥,张超,等. Meta分析系列之十五:Meta分析的进展与思考[J]. 中国循证心血管医学杂志,2013,5(6):561-3.
[2] 孟详喻,田国祥,仇成凤,等. 生存资料的二次研究系列之三:预后相关的二次研究的基本概念介绍[J]. 中国循证心血管医学杂志,2016,18(3):in press.
[3] R Core Team. R: A language and environment for statistical computing [Internet]. R Foundation for Statistical Computing, Vienna, Austria, 2015.2016-02-05. Available from: https://www.R-project.org/
[4] FeinererI,HornikK. tm: Text Mining Package[Internet]. R package version 0.6-2. 2016-02-05. Available from: http://CRAN.R-project. org/package=tm/
[5] Wickham H. ggplot2: Elegant Graphics for Data Analysis [M]. New York: Springer-Verlag, 2009.
[6] Van Eck NJ,Waltman L. Text mining and visualization using VOSviewer[J]. ISSI Newsletter, 2011,7(3):50-4.
[7] Torgo L. Data Mining with R: Learning with Case Studies[M]. London:CRC press,2010.
[8] PignonJP,le Maître A,MaillardE,et al. Meta-analysis of chemotherapy in head and neck cancer (MACH-NC): an update on 93 randomised trials and 17,346 patients[J].Radiother Oncol,2009,92(1):4-14.
[9] Gianni M,DentaliF,GrandiAM,et al. Apical ballooning syndrome or takotsubo cardiomyopathy: a systematic review[J]. Eur Heart J,2006,27(13):1523-9.
[10] GebskiV,BurmeisterB,SmithersBM,et al. Survival benefits from neoad juvantchemoradiotherapy or chemotherapy in oesophageal carcinoma:a meta-analysis[J]. Lancet Oncol,2007,8(3):226-34.
[11] D'Amico G,Garcia-TsaoG,Pagliaro L. Natural history and prognostic indicators of survival in cirrhosis: a systematic review of 118 studies[J]. J Hepatol,2006,44(1):217-31.
[12] MottilloS,FilionKB,GenestJ,et al. The metabolic syndrome and cardiovascular risk a systematic review and meta-analysis[J]. J Am CollCardiol,2010,56(14):1113-32.
[13] vanOsJ,LinscottRJ,Myin-GermeysI,et al. A systematic review and meta-analysis of the psychosis continuum: evidence for a psychosis proneness-persistence-impairment model of psychotic disorder[J]. Psychol Med,2009,39(2):179-95.
[14] Wagner AD,GrotheW,HaertingJ,et al. Chemotherapy in advanced gastric cancer: a systematic review and meta-analysis based on aggregate data[J]. J ClinOncol, 2006,24(18):2903-9.
[15] GriesdaleDE,deSouza RJ,van Dam RM,et al. Intensive insulin therapy and mortality among critically ill patients: a meta-analysis including NICE-SUGAR study data[J].CMAJ,2009,180(8):821-7.
[16] Early Breast Cancer Trialists' Collaborative Group (EBCTCG),Darby S,McGale P,et al. Effect of radiotherapy after breast-conserving surgery on 10-year recurrence and 15-year breast cancer death:meta-analysis of individual patient data for 10,801 women in 17 randomisedtrials[J]. Lancet,2011,378(9804):1707-16.
[17] BroekmansFJ,KweeJ,HendriksDJ,et al. A systematic review of tests predicting ovarian reserve and IVF outcome[J]. Hum Reprod Update,2006,12(6):685-718.
[18] Prince M,BryceR,AlbaneseE,et al. The global prevalence of dementia: a systematic review and meta-analysis[J]. Alzheimers Dement,2013,9(1):63-75.
[19] AutierP,BoniolM,PizotC,et al. Vitamin D status and ill health: a systematic review[J]. Lancet Diabetes Endocrinol,2014,2(1):76-89.
[20] SassonC,RogersMA,DahlJ,et al. Predictors of survival from out-ofhospital cardiac arrest: a systematic review and meta-analysis[J]. CircCardiovascQual Outcomes,2010,3(1):63-81.
[21] Bach PB,MirkinJN,OliverTK,et al. Benefits and harms of CT screening for lung cancer: a systematic review[J]. JAMA,2012,307(22):2418-29.
[22] Lee CK,BrownC,GrallaRJ,et al. Impact of EGFR inhibitor in nonsmall cell lung cancer on progression-free and overall survival: a meta-analysis[J]. J Natl Cancer Inst,2013,105(9):595-605.
[23] Zhang L,RiethdorfS,WuG,et al. Meta-analysis of the prognostic value of circulating tumor cells in breast cancer[J]. Clin Cancer Res,2012,18(20):5701-10.
[24] Mao C,QiuLX,LiaoRY,et al. KRAS mutations and resistance to EGFR-TKIs treatment in patients with non-small cell lung cancer: a meta-analysis of 22 studies[J]. Lung Cancer, 2010,69(3):272-8.
[25] Wang Y,GaoX,WeiF,et al. Diagnostic and prognostic value of circulating miR-21 for cancer: a systematic review and metaanalysis[J]. Gene,2014,533(1):389-97.
[26] Zhang QW,LiuL,GongCY,et al. Prognostic significance of tumorassociated macrophages in solid tumor: a meta-analysis of the literature[J]. PLoS One,2012,7(12):e50946.
[27] Li MX,LiuXM,ZhangXF,et al. Prognostic role of neutrophil-tolymphocyte ratio in colorectal cancer: a systematic review and metaanalysis[J]. Int J Cancer,2014,134(10):2403-13.
[28] Zhang Y,ShiJ,ShiB,et al. Self-expanding metallic stent as a bridge to surgery versus emergency surgery for obstructive colorectal cancer: a meta-analysis[J]. SurgEndosc,2012,26(1):110-9.
[29] Guan P,YinZ,LiX,et al. Meta-analysis of human lung cancer microRNA expression profiling studies comparing cancer tissues with normal tissues[J].J ExpClin Cancer Res,2012,31(1):54.
[30] Mao C,YangZY,HuXF,et al. PIK3CA exon 20 mutations as a potential biomarker for resistance to anti-EGFR monoclonal antibodies in KRAS wild-type metastatic colorectal cancer: a systematic review and meta-analysis[J].Ann Oncol,2012,23(6):1518-25.
[31] Fu X,HanY,WuY,et al. Prognostic role of microRNA-21 in various carcinomas: a systematic review and meta-analysis[J].Eur J Clin Invest,2011,41(11):1245-53.
[32] DerSimonianR,Laird N. Meta-analysis in clinical trials[J].Control Clin Trials,1986,7(3):177-88.
[33] Higgins JP,ThompsonSG,DeeksJJ,et al. Measuring inconsistency in meta-analyses[J].BMJ,2003,327(7414):557-60.
[34] ParmarMK,TorriV,Stewart L. Extracting summary statistics to perform meta-analyses of the published literature for survival endpoints[J]. Stat Med,1998,17(24):2815-34.
[35] Egger M,Davey Smith G,SchneiderM,et al. Bias in meta-analysis detected by a simple, graphical test[J]. BMJ,1997,315(7109):629-34.
[36] Tierney JF,StewartLA,GhersiD,et al. Practical methods for incorporating summary time-to-event data into meta-analysis[J]. Trials,2007,8(1):16.
[37] 孟详喻,靳英辉,程小珂,等. 生存资料的二次研究系列之一:应用R软件实现生存曲线中数据提取与生存曲线的合并[J]. 中国循证心血管医学杂志,2016,18(1):2-6.
[38] 孟详喻,田国祥,拜争刚,等. 生存资料的二次研究系列之二:R软件重建time-to-event结局的单个患者数据[J]. 中国循证心血管医学杂志,2016,18(2):135-7.
本文编辑:姚雪莉
Bibliometric analysis on prognosis-related systematic reviews/Meta-analyses
MENG Xiang-yu*, FANG Cheng, LI Miao-zhu, TIAN Guo-xiang, ZENG Xian-tao.*Center for Evidence-Based and Translational Medicine,Zhongnan Hospital, Wuhan University, Wuhan 430071, China.
ZENG Xian-tao, E-mail: zengxiantao1128@163.com
Prognostic indices are of major importance and significance in medical research and clinical practice. Prognosis-related systematic reviews/Meta-analyses evaluate and summarize relevant study findings,generating high quality clinically applicable evidence. In order to examine the current scientific landscape of prognosis-related systematic reviews/Meta-analyses worldwide, we performed this bibliometric analysis with text mining and visualization. Relevant literature published during 2006-2015 was used as the source material, which was obtained by searching the Scopus database. The R software, tm package, ggplot2 package and VOSviewer were used as software tools.
Prognosis; Systematic reviews/Meta-analyses; Bibliometrics; Text mining; Visualization
· 循证理论与实践 ·
R4
A
1674-4055(2016)04-0386-06
1430071 武汉,武汉大学中南医院循证与转化医学中心;2430071 武汉,武汉大学循证与转化医学中心;3北卡罗来纳州,美国杜克大学人群健康衰老研究中心;4100700 北京,北京军区总医院干四科
曾宪涛,E-mail:zengxiantao1128@163.com
10.3969/j.issn.1674-4055.2016.04.02
此外,检索该数据库收录的同一时间段内发表的全部系统评价/Meta分析,检索式为((TITLE(meta-analysis) OR (TITLE(systematic)AND TITLE(review)) AND DOCTYPE(ar OR re)AND SUBJAREA(BIOC OR IMMU OR NEUR ORPHAR OR PSYC OR MEDI OR NURS OR DENT OR HEAL) AND (PUBYEAR > 2005 AND PUBYEAR <2016),将其作为后续时间分布的参照。检索日期为2016年1月31日。
1.2文献计量学分析 对检索获取的预后相关系统评价/Meta分析文献数量与全部类型的系统评价/Meta分析文献数量绘制时间分布图。对预后相关系统评价/Meta分析文献的国家、机构与期刊分布进行描述。计算纳入文献的总被引次数及篇均被引次数。对高被引文献计算年均被引次数,即总被引数除以自发表以来经历的年数,将其作为评价文献影响力的指标,并根据这一指标确定影响力排名前十的文献。对纳入文献的参考文献进行分析,找出被引量排名前五的参考文献。对发表文献不低于10篇的作者所构成的合著网络进行可视化展示。合著关系的定义为某文献的作者间两两互为合著关系。使用R软件3.2.1[3]、tm程序包[4]、ggplot2程序包[5]与VOSviewer1.6.3软件[6]进行文献计量学分析与相关可视化展示。
1.3文本挖掘 以全部纳入文献的标题信息作为语料库进行文本挖掘分析。对频率较高的词条绘制术语云,进行分层聚类分析并绘制树状图[7]。所用软件为R软件3.2.1[3]、tm程序包[4]及ggplot2程序包[5]。
图1发文量的时间分布图
表1预后相关系统评价/Meta分析在全部系统评价/Meta分析中占比随时间变化情况
年份百分比(%)20069.0 20079.8 20088.2 20099.2 20108.7 20119.2 20129.1 20139.3 201410.7 201510.9