应用CiteSpace对生态学科meta分析的文献计量学和可视化分析
2019-03-16丁陆彬何思源闵庆文
丁陆彬, 何思源, 闵庆文,*
1 中国科学院地理科学与资源研究所, 北京 100101 2 中国科学院大学, 北京 100049
Meta分析(meta-analysis)最早由英国教育心理学家Glass G V于1976年命名的[1],它是一种运用定量方法对某一研究主题的多个已有研究结果进行系统性评价的统计方法。这一方法最初被应用于社会科学领域,后来扩展到医学、生物学等领域。截至2018年11月,Web of Science(WoS) 数据库中使用meta方法发表的SCI论文达到164000余篇,其中2017年发表了20000多篇。该方法在1991年应用于生态学领域[2]。早期的meta分析方法主要被应用于生态学野外试验的评价和分析中,近些年来,随着生态学科的发展,meta分析方法在全球变化生态学以及应用生态学领域取得了长足的发展[3]。Meta分析方法在20世纪80年代末传入我国,也被翻译成荟萃分析、集成分析等,起初主要应用于医学领域。1998年,彭少麟首次将meta分析方法应用于国内的生态学研究[4]。
随着全球环境变化和人类活动影响的加剧,以及生态系统本身的复杂性,生态学研究逐渐呈现大尺度、多层次、多学科交叉的特点。在生态学领域,针对同一个问题常常伴随很多类似的研究。然而,由于研究本身的或然性或者复杂环境因子的作用,相似研究的结论可能不同或者相反,典型的例子如取样的尺度效应对物种多样性分布格局的影响[5]。Meta分析方法通过对相似研究结果的综合分析和再评价,推动了生态学领域一些争议性问题的解决,受到越来越多的重视[6]。但是,前人将meta分析引入生态学领域并改进此方法之后,多数文献对此领域的综述多为方法学的讨论,偏向于定性归纳,具有主观性,缺乏挖掘数据潜在的意义[7-9]。因此,本文从宏观角度,对生态学学科分类下采用meta分析的文献进行定量与定性的可视化分析,旨在直观、清晰地展示该领域的研究概况,热点趋势,以期为未来相关研究提供有益的参考和启示。
1 分析方法与数据来源
文献计量法是通过数学和统计学的方法,研究文献的数量特征,继而对学科的现状和发展趋势进行评价和预测[10]。在文献计量和可视化分析的背景下,一系列文献计量学的可视化软件被开发出来。CiteSpace是陈超美博士开发,被广泛应用于文献题录数据库的文本分析、挖掘和可视化的常用软件[11]。通过共被引分析、合作网络分析、共现分析和文献耦合分析,该软件能够展示特定学科领域的知识结构,直观的表达知识热点及演化过程。本文利用WoS数据库中自带的“创建引文报告和分析检索结果”功能初步分析文献来源,利用Histcite软件提取的引证网络关系中的关键文献为学科基础知识文献,并利用CiteSpace 5.3.R4软件对文献数据进行可视化分析,追踪研究热点和前沿。知识图谱的网络结构及聚类结果的清晰度用模块值(Modularity Q)和轮廓值(Mean Silhouette)来表示。模块值在0.4—0.8视为网络结构比较显著,轮廓值在0—1之间,越接近于1说明同一聚类的内部相似程度越大[12]。
本研究的数据来源于美国科学信息研究所(Institute for Scientific Information,ISI)Web of Science核心合集数据库。检索时间为2018年11月9日,时间段为1992—2018,检索条件为主题检索meta-analysis 或 meta analysis,根据WoS的学科分类选择生态学科,共检索文献2311篇。
2 研究结果与分析
2.1 发文量和引文量分析
基于WoS自带的统计分析功能,1992年至2018年之间,共有文献2311篇,总被引频次153158,去除自引的引用频次为146211,每篇平均被引次数为66.27,h-index(h指数)为195。从1993到2017年,生态学领域使用meta分析的论文数量稍有波动,但总体呈现稳步上升的趋势(图1)。1994年全年的发文量只有3篇,1995和1996年分别为5篇和7篇,到2016年论文数量为212篇,2017年数量稍有降低,为208篇。
图1 每年发表总论文数(1994—2017)Fig.1 Annual number of publications from 1994 to 2017
2.2 国家发文量排名
WoS自带的文献分析工具对国家发文量的计算方式为:文章中所有作者的国家,且同一篇文章中相同国家只计算一次,累加同一国家出现的频次。发文量较多的国家前10名依次为:美国、英国、加拿大、澳大利亚、德国、法国、西班牙、瑞士、中国和芬兰(表1)。其中美国发文量为967篇,远超其他国家,占到世界发文总量的41.8%,美国同时具有较高的h指数(h指数是指至多有h篇论文分别被引用了至少h次)和单篇被引用次数,表明美国在该领域的研究水平处于世界领先地位。中国的发文量为144篇,排名第9。但是与其他国家相比,中国的h指数和单篇被引次数较低,说明论文质量有待提高。排名前10的国家发文总量为1959篇,占世界发文总量的85%。论文发表排名前20的国家中,除了中国和巴西(64篇),均为发达国家,发文总量占该领域世界发文总量的94%。
2.3 中国的发文状况
中国使用meta分析方法的起步相较于国际晚了将近10年。中国从2004年开始发表相关的SCI论文,2012年以后发表的论文数量增长较快,2015年为12篇,2016年为27篇,2017年为32篇。中国人在以下杂志发表的文章数量较多:Global Change Biology(34篇),Agriculture Ecosystems Environment(18篇),Global Ecology & Biogeography(11篇),Biogeosciences (7篇),Ecology(7篇),这些期刊属于生态学领域的顶级期刊。中国发文较多的前5名机构分别是:中国科学科学院(103篇)、南京农业大学(14篇)、复旦大学(12篇)、中国农业科学院(11篇)、北京大学(11篇)。中国科学院的发文总数最多,在该领域有很强的科研实力。中国发文量前五位的,除骆亦其外还有周旭辉(华东师范大学)、刘玲莉(中科院植物研究所)、李博(复旦大学)和陈骥(中科院地球环境研究所)。
表1 发文量前10的国家
2.4 发文期刊排名
迄今为止,发表meta分析的生态学领域期刊为173种,发文量排名前10的期刊如表2所示。发文量排名前10的期刊发文量占总发文量的40%,发表在这些期刊的论文平均单篇引用次数97.27,说明生态学领域meta分析的文章普遍具有较高的学术影响力。其中发文量第一的Global Change Biology 和排名三的Ecology Letters被中科院SCI期刊分区列为一区期刊,其他几个杂志均为二区或三区期刊。
表2 1992—2018年使用meta分析方法进行研究载文量前10名的期刊
2.5 高被引作者分析
发表SCI论文数量排名前10的作者,分别来自于7个国家,其中美国人4名(表3)。来自德国科隆大学的Hillebrand H和来自新西兰奥塔哥大学的Nakagawa S发表论文数相同为30篇,来自美国纽约州立大学石溪分校的Gurevitch J发表了17篇论文排名第五,但总引用次数达到5467次。中国的骆亦其发表了17篇相关论文,排名第5,这是我国在该领域被引用数和发表篇数最多的科学家。
表3 生态学领域前10位基于meta分析文献作者
2.6 高被引论文简析
从高被引论文的分布来看,它们都发表于相关论文发文量排名前十位的期刊(表4)。从高被引论文的内容上来看,被引用最高的三篇文章均涉及全球变化生态学的内容,包括土壤碳库与土地利用变化的meta分析,初级生产力氮磷限制的分析以及物候对全球变暖响应的meta分析。除此之外,生物多样性与生态系统功能和服务关系、土壤呼吸和净氮矿化对植被生长的响应等的研究成果也被高频引用。
2.7 学科基础知识
利用汤森路透公司开发的Histcite软件对下载的数据进行本地被引得分(LCS, Local Citation Score)和全球被引得分(GCS, Global Citation Score)指标的分析。LCS为论文被本地数据集(通过检索后导出的所有文献)所有论文引用的次数,LCS高则意味着该论文在本研究领域具有较高的影响力;而GCS是指论文在WoS数据库中的总被引次数,但施引论文不一定属于该领域的文章。因此,高被引文献并不一定属于本领域的基础性文献。基于这个原因,本文使用Histcite对下载的文献进行引文关系分析,得到基于LCS排名,在完整引文关系知识网络中排名前10的文献。
表4 基于meta分析的生态学领域高被引论文
根据时间排序,1992年Gurevitch J发表在The American Naturalist上的文章,首次运用meta分析方法分析了基于野外试验的不同生境条件下种间竞争和种内竞争对生物量的影响。该论文重要贡献之一是把meta分析方法引入经典生态学的研究范式之中,产生了较大的学术影响力。Arnqvist G在1995年发表在Trends In Ecology and Evolution上的文章讨论了meta分析方法在生态和进化领域使用的现状,讨论了meta分析方法的优缺点及未来潜力。Adams在1997年为了确定meta分析方法的稳健性,对meta分析方法和重新取样方法得到的结果进行比较,最后作者建议重新取样方法应该纳入meta分析方法中,以确保正确评估生态研究中的主要影响。1999年,Gurevitch J发表于Ecology中的文章中概述了对生态数据进行meta分析应当考虑的因素,包括参数与重新采样方法的选择,可能进行加权分析的原因,分类数据中的固定效应模型、随机效应模型与回归分析方法的比较。1999年,Hedges LV发表在Ecology中的文章中引入的对数响应比这一参数,优化了meta分析的方法。这一篇文章的LCS也是本领域最高的,足见其学术价值。Palmer AR在1999年的文章中,采用波动不对称性理论和性比的案例,介绍了meta分析方法中的发表偏倚问题(也被称为文件抽屉问题)。发表偏倚是进行meta分析研究的重要问题,发表偏倚的存在会影响最终分析结果的可信度。类似地,Rosenberg MS在2005年的文章中应用失安全数(fail-safe number)来判断发表偏倚的效果。Nakagawa S则在2012年系统综述了meta分析在生态和进化研究中的方法学问题,该文章可以为meta分析研究者提供重要参考。
从内容上来看,这些位于引文关系知识网络中重要节点上的文献是探寻学科发展历史,了解学科研究进展最为重要的文献。它们通常属于高被引文献,但在内容上更加侧重于对meta分析方法的改进和对meta分析方法应用进展进行的综述。
2.8 研究热点分析
对学科或主题研究的内部结构进行解析的手段主要有共引分析和共词分析。由于本文研究的是meta方法在生态学中的应用,属于方法学研究的综述。共引分析不能很好的突出引文之间在学科方向上的关联,综合考虑,本文采用共词分析,即通过构建共词网络分析学科和主题的结构变化,进而分析本领域的研究热点和前沿。对所得文献进行共词分析,软件时区选择为生态学领域首次引入meta分析方法的1991年到2018年,时间跨度(Slice length)为1a,节点类型选择“keyword”。经过参数筛选,图谱中共出现关键词398个,形成2265条连线。本文中的轮廓值为0.5319,模块值为0.4072,表明形成聚类的结构层次比较清晰,方法的置信度较高且有意义。此外,本文采用潜在语义索引算法(LSI)从施引文献的关键词(Keyword list)中提取名词性术语对聚类进行命名(图2),其“十字架”的大小表示出现的频率,高频率出现的关键词反映该领域的研究热点[13]。
表5 基于引文关系知识网络的前10名关键文献
图2 关键词聚类知识图谱Fig.2 Keyword clustering knowledge map
图3 文献共被引聚类时间线图Fig.3 The time-line view of co-cited literature cluster
时间线图谱主要侧重于勾画聚类之间时间的关系,同一聚类的节点按照时间顺序被排布在同一水平线上,展示该聚类的历史成果,研究的活跃程度。为本研究对象的研究前沿按时间演进的特征,绘制了术语共现时间线图谱,共形成9个术语聚类。参考每个聚类的聚类标签以及聚类中的施引文献,大致可以了解到每个聚类所代表的研究前沿。图2、图3、表6显示了被分成9类的研究热点问题:聚类0主要关注生物的波动不对称性,这类研究多关注植物性状、资源投入对环境压力以及遗传压力的响应,且该类型的研究出现的平均时间较早为2002年;聚类1的研究主要和恢复生态学有关,该类型的文献在2012年前后就开始逐渐减少;聚类2主要关注全球变化背景下植物光合作用的响应,其中涉及到光合作用的营养限制,碳循环等内容,另外本研究特别关注海洋环境的变化与植物光合作用的关系,尤其是在海洋变暖和海洋酸化等条件下,目前这一聚类是meta分析研究的热点领域之一;聚类3主要关注生活史和生活策略;聚类4关注种间关系的研究,研究的对象既包括植物、动物,也包括动物和植物的相互作用,研究涉及性状介导的相互作用、性选择以及累积压力假说的验证等方面;聚类5关注全球变化中氮循环,以及模拟氮循环过程对物候和植被生产力的影响等;聚类6关注生态生物地理学的研究,但是,聚类的内部结构不是很清晰;聚类7关注物种入侵,此聚类涉及到的内容比较清晰,主要关注物种入侵的机理,全球变化背景下的物种入侵的变化等;聚类8关注污染生态学,但此处的污染比较集中于对水体氮污染的研究,以及水质量的评估以及政策效应的研究。另外,全球变化背景下温室气体(氧化亚氮)的排放的研究也是此聚类研究的热点。
以上便是生态学领域应用meta分析方法进行研究的热点领域。使用meta分析方法进行研究,依赖于前人对同一主题的多次研究,是对前人研究的整合,因此在方法上,meta分析更加注重研究结果的可靠性,比如每个研究都强调是否有发表偏倚,鉴别发表偏倚的影响等。另外,从研究热点上看,对植被生理生态试验的meta分析以及对全球变化中氮循环及其驱动因素研究的meta分析依然是目前meta分析方法使用的热点领域。
表6 关键词聚类标签
Size:聚类内节点数量;Sihouette:聚类的同质性指标;Mean year:聚类内节点代表文献的平均年份
3 结论与讨论
本文运用了文献计量学的方法,利用WoS、Histcite和CiteSpace对生态学领域运用meta分析方法发表的论文及引文情况做了分析。从发表论文的数量和质量来看,中国与美国、英国等国家在该领域上还有较大的差距。一方面因为我国的生态学基础研究起步较晚,试验数据的积累和分享不够;另一方面在于研究人员对meta分析方法的重视度不够,对原创性的技术改进贡献较少。从该领域文章发表的期刊来看,meta分析方法通常具有较高的学术影响力,Global change biology 、Ecology等高质量期刊出版了最多的相关文章。通过引文分析和科学图谱绘制发现:全球变化背景下水体氮污染以及相应的价值评估研究、植物光合作用对全球变化的响应的研究以及全球变化背景下物种入侵机理的研究是该领域最新的和最热门的研究前沿。
Meta分析从1991年被引入生态学领域以来,生态学研究的重点已经发生了很多的变化。Meta分析方法被越来越多的应用于生态环境问题的基础研究和应用研究中,提供实际的预测和解决方案,如生物多样性丧失,物种入侵以及生态系统及物种对全球变化的响应,相应的保护策略和管理方法的有效性的评估等[14-16]。在本文的研究中,出现了诸如性选择和动物社会行为的研究,这些关键词的出现表明宏观进化研究被包含在生态学meta分析之中,并成为重要的方向。Meta分析成为测试生物进化假说的有效的工具[17]。
Meta分析在分析方法上越来越走向成熟。从1999年,Gurevithc 发表的题为“Statistical issues in ecological meta-analyses”文章以来,文章中列出的许多统计学问题都已经被解决了[18-19]。不同于医学和社会科学,生态学研究通常关注多物种的,更为复杂的系统,并由此导致分析结果的非独立性。这些非独立性结果的来源是很多研究关注的重点,也被认为是meta分析方法被批评的原因[20]。实际上,生态学的meta分析往往关注的是研究结果异质性的关键共性因素。meta分析方法作为一种被医学和社会学科广泛使用的方法,其方法学问题的讨论和计算机实现已广泛出现在其他领域的文献中。Meta分析方法被认为是跨学科交流思想和方法的有效催化剂[21]。在科学研究越来越倾向于大尺度和广泛合作的趋势下,我们的生态学研究人员应当保持开放的态度,借鉴其他学科meta分析的经验,拓展meta分析方法研究的范围。