基于文献计量学的马瑟兰(Vitis vinifera L.)研究现状与发展趋势可视化分析
2024-01-03王悦李彩虹许容郡丁欣李亚汶房玉林葛谦孙翔宇
王悦,李彩虹,许容郡,丁欣,李亚汶,房玉林,葛谦*,孙翔宇*
(1.西北农林科技大学 葡萄酒学院,陕西 杨凌 712100;2.宁夏农产品质量标准与检测技术研究所,宁夏 银川 750002)
马瑟兰(Vitis vinifera L.)是以赤霞珠和歌海娜为亲本杂交育成的红色酿酒葡萄品种,原产于法国。2001 年被河北省引种后,中国已成为继原产地法国后马瑟兰种植面积最大的国家[1]。马瑟兰具有较佳的抗病虫害能力[2-4]和抗旱性[5],其果实富含花色苷、白藜芦醇[6-7]等多种酚类物质。有关于马瑟兰研究涉及栽培特性[8-12]、生理特性[13-17]和酿酒特性[18-24]等多个方面。文献计量研究是将文献数据和统计分析相结合的一种研究手段[25-26]。鉴于文献计量学的客观和全面的优点[27-28],利用文献计量学可对不同领域研究的演变进行总结并捕捉新的趋势[29]。Citespace 是利用渐进式的知识领域可视化来研究文献趋势的方法[30],被广泛应用于科学主题领域定量和定性研究[31]。随着近年来马瑟兰在国内的扩大种植,马瑟兰相关研究正处于持续发展阶段。为了解目前国内外马瑟兰研究热点及发展的时空规律,基于中国知网(China National Knowledge Infrastructure,CNKI)和Web of Science(WOS)核心合集数据库,采用Citespace 软件对筛选数据进行可视化分析。通过国内外比较分析,以期总结马瑟兰研究现状,为马瑟兰研究提供参考及思路。
1 数据来源与研究方法
1.1 数据来源
以CNKI 学术期刊数据库作为中文文献数据库,按照检索式进行关键词高级检索(检索式=“马瑟兰”或“玛瑟兰”),未设置时间限制检索共得到125 篇中文文献。以WOS 核心合集数据库作为外文文献数据库,以“Marselan”为主题词,未设置时间限制检索得到共65 篇外文文献。
1.2 研究工具方法
使用Citespace 6.1.R4 软件进行作者、关键词、国家、机构关系网络可视化分析,参数设置如下。时间跨度(timespan)参数设置为2006~2022 年,阈值(selection criteria)参数设置为g-index(k =25),Link Retaining Factor(LRF)=3.0,L/N=10,Look Back Years(LBY)=5,e=1.0。鉴于检索文献数目及保存更多的信息的需求,因此并未使用任何裁剪算法(Prunning:none)。使用Excel 16.54 和GraphPad Prism 9.3.1 软件进行统计分析及图表绘制。
2 结果与分析
2.1 马瑟兰研究年度发文量统计
研究领域文献数量是对贡献者(国家、期刊和作者等)效率的一项重要的评价指标[29],同时一定程度上也可反映该领域的发展状况。对检索所得共190 篇文献进行年份统计分析,结果如图1 所示。
图1 CNKI 和WOS 数据库年发文统计Fig.1 Annual publications from CNKI and WOS
根据数据库文献数目增长规律,可大致划分为3个阶段。第一阶段(2006~2009 年)文献主要以WOS 核心合集数据库文献为主,此阶段文献数目变化较为平缓(图1B)。由图1A 可知,2006 年WOS 核心合集数据库最先出现马瑟兰相关研究文献。根据CNKI 数据库记载,直至2008 年才有马瑟兰相关中文文献收录。第一阶段内,WOS 核心合集数据库年发文量随年份变化呈现轻微波动趋势,但总体呈现平稳、缓慢增长。尽管如此,第一阶段各数据库和总体文献数量均在较低水平,两数据库年均发文量总和均不足2 篇。第一阶段总文献数不足10 篇,仅占总文献数3.68%(图1B、图1C)。这一结果反映了此阶段马瑟兰研究发展缓慢,且外文文献发展起步早于中文文献。
鉴于2010 年发文量首次突破了5%,因此将2010年视作一个关键节点。第二阶段(2010~2015 年)中,CNKI 数据库和WOS 数据库文献数目均呈现出缓慢增长趋势(图1B)。由图1A 可知,总文献增长量虽有轻微变化,但总体上呈现出缓慢上升且趋于平稳的状态。CNKI 数据库文献年发文量总体呈现出缓慢上升的趋势,而WOS 数据库文献年发文量则总体呈现出下降趋势。这一结果反映了外文文献增长速度变缓,与此同时中文文献增长速度则呈现出稳定增加的趋势。由图1C 可知,第二阶段年均发文数首次突破了5篇。同时,第二阶段两数据库文献数均突破了10 篇,总文献数在此阶段超30 篇。此结果展示出第二阶段马瑟兰研究继上一阶段基础稳定发展。
2016 年被视作是另一个关键时间节点,因2016年之后(2017 年)发文量首次突破了总文献量的30%,并此后呈现出年发文量大幅增加。第三阶段(2016~2022 年) 总年文献增长量呈现出了更明显的波动,但总体上呈现出了高于前两阶段的增长量(图1A)。与前两个阶段比较,特别是CNKI 数据库文献年增长量在波动中持续大幅增加,并始终高于WOS 核心合集数据库年文献增长量。在此阶段,WOS 核心合集数据库总文献增长量先增加了短暂下降,进而经历了一个回升阶段(2017~2019 年),紧接着又经历了一轮波动并在2022 年达到历年增量之最。值得一提的是,在此阶段CNKI 核心合集数据库发文量相较前一阶段有了跃升。在2016 年之后CNKI 数据库文献总数首次超过WOS核心合集数据库,这也是中文文献量首次超越英文文献,并在此后直至2022 年均保持超过关系(图1B)。在第三阶段内,WOS 核心数据库文献量保持缓慢上升。与之形成对比的是CNKI 数据库文献量相较前两个阶段呈现快速上升,增速超过WOS 核心数据库。由图1C可知,在此阶段内两数据库和总文献量数量超越了前两个阶段。此阶段内发表相关文献数目占总文献数的78.42%。这一结果显示出第三阶段是马瑟兰相关研究的迅速发展阶段,特别是中文文献。CNKI 数据库年均发文数为15.7 篇,与第一阶段(0.3 篇)和第二阶段(2.3篇)相比较有了较大程度的增加。且中文文献的年均发文数要高于WOS 核心合集数据库(5.6 篇)。WOS 核心合集数据库在此阶段的年均发文数与第一阶段(1.5篇)和第二阶段(3 篇)无大幅的提升。
2.2 马瑟兰研究发文作者分析
以文献量为衡量维度一定程度上可用于衡量作者在此领域的贡献[29]。对所检索的WOS 核心合集数据库和CNKI 数据库的文献按照发文作者进行分类后以发文量由大到小进行排序分析,分别选取排名前十作者进一步分析,结果如图2 所示。
由图2A 可知,WOS 核心合集数据库发文量最多的Adrian Marielle,发文总量达14 篇,占WOS 核心合集数据库所有马瑟兰主题文献量的21.54%。其次,发表文献数所占比例高于总文献10%的作者为Heloir Marie-Claire (12 篇)、Trouvelot Sophie (11 篇)、Daire Xavier(10 篇)和Poinssot Benoit(7 篇)。Duan Changqing是该领域在WOS 核心合集数据库发表文献数最高的中国作者,发表总文献达6 篇,占总文献数的9.23%。文献被引一定程度上可反映其科学影响力[29],因此,研究贡献者被引用次数有助于更全面评价其贡献程度。总被引次数折线和篇平均被引次数折线具有相似的趋势,但在数量关系上偶有差异。图2A 中,Daire Xavier 是所研究作者中总被引次数最多的作者,其总被引次数达610,篇平均被引次数(61)位列所有作者第二名。Pugin Alain 尽管在发文总数上仅有4 篇,但其篇被引次数(96.75)位列所有作者第一名。这一定程度上代表了Pugin Alain 在马瑟兰研究领域贡献了较高质量的研究。
由图2B 可知,CNKI 数据库发文最多的是唐美玲,发文总量达8 篇,占CNKI 数据库该领域文献量的6.4%。CNKI 数据库发文量最多的作者所发表文献占比远低于WOS 核心合集数据库中最高发文量占比(21.54%)。这一结果说明了CNKI 数据库中各作者发文量相对WOS 核心合集数据库而言较为分散,即数据库文献倾向于由更加丰富的作者群体贡献。此外,发表文献数所占比例高于总文献5%的作者为肖慧琳、郑秋玲、马宗桓和毛娟,其文献数均为7 篇。如图2B 所示,刘长江是所有研究作者中总被引次数最多的作者,其总被引次数达67。同时,刘长江的篇平均被引次数(16.75)位列所有作者最高。与WOS 核心合集数据库(图2A)相比较,CNKI 数据库文章总被引次数和篇平均被引次数普遍较低。因此,我国马瑟兰研究质量和数量仍存在较大发展空间。
研究作者共现网络有助于直观快速地了解该领域作者之间的合作关系并展示贡献者(国家、机构和作者等)主导地位或合作倾向[29]。基于Citespace 软件分别对两个数据库文献作者之间关系网络进行可视化分析,其结果如图3 和图4 所示。
图3 WOS 核心合集数据库文献作者合作关系及关键词聚类图Fig.3 Author collaboration and keyword clustering from WOS
图4 CNKI 数据库文献作者合作关系及关键词聚类图Fig.4 Author collaboration and keyword clustering from CNKI
为使作者关系网络更清晰可辨,将time slice 参数设置为2,即两年作为一个时间跨度,同处一个时间跨度标记为相同颜色(除聚类图外)。每一节点代表一位作者,节点的相对大小代表了该节点作者发文数量的相对多少,即节点相对越大,发文数量相对越多。受限于节点众多,为保证作者关系可辨性最佳,无法展示所有作者节点名称。因此,通过调整阈值(Threshold)参数值,仅筛选出一定量作者节点展示于图中。节点间的连线代表的是作者间的合作关系。由图3A 可知,Adrian Marielle、Heloir Marie-Claire、Trouvelot Sophie 和Daire Xavier 为马瑟兰领域发表文献较多的作者,且其间合作关系密切,合作年份集中在2010~2011、2014~2015 年和2018~2019 年。以Huang Weidong 为代表的作者合作网络和Li Hua 等组成的作者合作网络所显示出合作主要集中于2022 年,这是两个主要的中国作者合作网络。综上,国外作者合作网络自2006 年起在多个时间段均有分布,国内作者合作网络较有局限性且时间集中于2022 年。这一结果显示,目前世界马瑟兰研究呈现出缓慢发展的态势,且近年来主要以中国作者间合作为主。我国马瑟兰研究合作主要集中于现阶段且以国内作者间合作为主,预示着我国马瑟兰研究仍处在蓬勃发展阶段,并仍存在巨大进步空间。综上,WOS 核心数据库马瑟兰主题文献作者合作网络自2006~2007 年开始。同时,未来我国马瑟兰研究应当注重国际间交流与合作。对8 个主要作者合作网络进行关键词提取可对各组作者的研究主题进行大致的了解(图3B)。包含作者最多的合作网络研究关键词为“stomatal conductance (气孔导度)”,表明以Adrian Marielle 和Heloir Marie-Claire 等作者为代表的一组作者合作网络以马瑟兰为主题的研究重点可能侧重于马瑟兰的气孔等植物学主题。除此之外的作者合作网络马瑟兰主题的研究关键词集中于“grape cultivars(葡萄品种)”、“wine fermentation(葡萄酒发酵)”、“grapevine(葡 萄 藤)”、“plant immunity (植 物 免 疫)”、“seed germination(种子萌发)”、“degree of polymerization(分子聚合度)”、“elicitor(诱导子)”。
由图4A 可知,唐美玲和王安妮等为马瑟兰领域发表文献较多的作者,且其间合作关系密切,合作年份集中在2018~2019、2020~2021 年和2022 年。所有作者合作网络时间段均在2012~2013 年之后,与WOS 核心数据库中作者合作网络时间相比较晚,但早于WOS核心数据库中主要的中文作者合作网络。如图4B 所示,包含作者最多的合作网络研究关键词为“花色苷”,这代表着以唐美玲等作者为代表的一组作者合作网络以马瑟兰主题的研究重点侧重于马瑟兰相关的花色苷研究。除此之外的作者合作网络马瑟兰主题的研究关键词集中于与马瑟兰植株高度相关的 “光照强度”、“绿枝嫁接”、“产量”等主题,和马瑟兰葡萄酒较为相关的“香气” 和“酿酒特性”。两数据库比较得出,WOS 核心合集数据库中马瑟兰研究作者合作网络出现时间较早。以中国作者为主的CNKI 数据库中各个作者合作网络的出现时间相对较晚。国内作者对马瑟兰研究起步较晚,随着国内马瑟兰种植规模的不断扩大,近年来呈现出越来越蓬勃发展的趋势。
2.3 马瑟兰研究发文国家及机构分析
通过对马瑟兰研究分布国家进行分析可对该领域研究密集强度分布和国际间合作关系进行总体了解。WOS 核心数据库主要国家及合作网络见图5。
图5 WOS 核心数据库主要国家及合作网络Fig.5 Main research countries and cooperation networks from WOS
由图5 可知,中国和法国是马瑟兰领域发文数量最多的两个国家,分别为29 篇和21 篇。法国研究文献主要分布于2018 年之前,而中国研究则主要分布于2018 年之后。这代表着近年来在WOS 核心数据库中,中国的马瑟兰研究发展迅速且成果丰厚,这与2.2 中由作者合作网络所得出的结论一致。节点与节点的连线粗细代表着合作密切程度,图5 中可大致分为以中国为中心和以法国为中心的两个合作网络。以法国为中心的合作网络具有较多分支,法国中心性较强(0.45)且涉及的合作国较多,以同样位于欧洲的国家(德国、意大利、英格兰、瑞士、波兰)为主,也包含少数南美洲国家(阿根廷和巴西)。综上,以法国为中心的网络显示出显著的地域特性,主要以欧洲国家为主且集中。法国作为马瑟兰的起源国家,其文献发表与合作多集中于2016 年以前的早期时间段,其中与波兰和巴西合作时间相对较近(2018~2021 年)。以中国为代表的合作网络相对较为简单,其中以中国-新西兰和西班牙-乌拉圭的合作为主,合作国家跨越亚洲、欧洲、南美洲和大洋洲。总之,以中国为中心的国际合作网络则呈现出了较为分散(中心性为0.08)且地域跨度较大的特点。尽管如此,我国的合作国家数目却相对较少,因此仍需加强马瑟兰方面的国际交流合作。尽管两个主力国各自形成了多个国家间国际关系网,但二者间的合作鲜见。
WOS 核心数据库和CNKI 数据库中马瑟兰相关主题研究主要机构及合作网络如图6 所示。
图6 马瑟兰研究在数据库中主要发表机构及合作网络Fig.6 Major institutions and cooperation networks of Marselan research in databases
WOS 核心数据库中以勃艮第大学(Univ Bourgogne)、中国农业大学(China Agr Univ)和西北农林科技大学(Northwest A&U Univ) 为主要研究机构(图6A),其中心度分别为0.06、0.02、0.01。中国农业大学发文数量最多(11 篇),其次是勃艮第大学(9 篇)。从机构合作来看,主要以地域相近的机构合作为主,但也不乏如我国的中国农业大学与西班牙的萨拉曼卡大学等机构之间的跨国的合作关系。从时间跨度来看,以两个中国机构为主的合作网络各自反映出近年来的合作的关系(2020~2022 年),但两个机构间的合作十分微弱。以勃艮第大学为主的合作网络则集中于2014~2017 年。由机构间的合作关系也可看出马瑟兰研究国际间机构特别是跨国家和地区之间的交流仍有待加强。CNKI 数据库中以山东省烟台市农业研究院(8 篇)、甘肃农业大学园艺学院(8 篇)、宁夏大学农学院(7 篇)和西北农林科技大学葡萄酒学院(5 篇)等为主要研究机构(图6B),中心度分别为0.01、0.01 和0.02。与WOS 核心数据库相比,CNKI 数据库各主要机构中心度较低,说明其网络相对较为分散。机构与机构之间的合作以地域相近的为主。除了科研院所之间的合作外,科研院所与企业之间的合作也较为频繁。
2.4 马瑟兰研究发文期刊分析
对于发文期刊的分析有助于了解马瑟兰领域主要研究方向。分别统计了CNKI 数据库和WOS 核心合集数据库的文献期刊,结果见图7。
图7 数据库中马瑟兰相关文献的主要发表期刊Fig.7 Major journals publishing Marselan research in databases
CNKI 数据库中125 篇文章发表于49 个期刊中,刊载文量为2.55 篇。选取发表马瑟兰相关文献数排名前十位的期刊,如图7A 所示,发表马瑟兰相关文献最多的期刊是《中外葡萄与葡萄酒》(14 篇),该期刊为葡萄与葡萄酒相关领域的核心学术期刊。其次是《北方园艺》、《葡萄酒》、《中国酿造》(8 篇),其中《北方园艺》和《中国酿造》为北大核心期刊。排名前十的期刊中大部分期刊主题侧重于果树栽培等植物学主题及食品酿造领域的期刊,其中有5 个期刊为北大核心期刊。
WOS 核心合集数据库中66 篇文章发表于45 个期刊中,刊均载文量为1.47 篇。选取发表马瑟兰相关文献数排名前十位的期刊,如图7B 所示,发表马瑟兰相关文献最多的期刊是FRONTIERS IN PLANT SCIENCE(5 篇),该期刊为植物科学相关领域的一区TOP学术期刊。其次是侧重于植物与微生物学的MOLECULAR PLANT-MICROBE INTERACTIONS 和侧重于食品领域的FOODS(4 篇)。专注葡萄与酿酒领域的SOUTH AFRICAN JOURNAL OF ENOLOGY AND VITICULTURE 和AMERICAN JOURNAL OF ENOLOGY AND VITICULTURE 两个期刊均有3 篇相关文献。
综上,两个数据库仅有少部分文献发表于专注于葡萄与葡萄酒主题的期刊,大部分文章发表于植物学和食品领域泛学科类的期刊。两数据库发表马瑟兰相关文献的期刊总数相近且较少(均<50 个),刊均发表马瑟兰相关文献数期刊也都较低(<3 篇/刊)。这意味着两数据库中马瑟兰相关文献和发表期刊仍较匮乏。
2.5 马瑟兰研究关键词分析
关键词是文章主题的高度概括,揭示了作者列出的关键词之间的关系,通过关键词的分析可发现研究之间共同的主题[29]。对两个数据库马瑟兰相关文献进行关键词及聚类分析结果如图8 所示。
图8 马瑟兰研究关键词及聚类分析Fig.8 Keywords and cluster analysis of Marselan research
从WOS 核心合集数据库选取了所包含文献数最多的7 个主要关键词聚类,其中以“plasmopara viticola(葡萄霜霉病菌)”为主题的关键词聚类最大(图8A)。该主题下以“botrytis cinerea(灰葡萄孢霉)”、“gene expression(基因表达)”和“guard cell(保卫细胞)”为出现频次次要关键词。由此可知,WOS 核心合集数据库中大部分马瑟兰相关研究以马瑟兰植株的病理研究为主,特别是霜霉病。由图8A 可知,该聚类下“botrytis cinerea(灰葡萄孢霉)”节点具有紫色外圈,意味着其中心性不小于0.1,即该节点作为桥梁与其他节点连接较多。聚类大小排名其次的是主题为“wine grape(酿酒葡萄)”的聚类。其中以“biosynthesis(生物合成)”、“anthocyanin(花色苷)、“grape(葡萄)”和“red wine(红葡萄酒)”为主要的关键词,且“biosynthesis(生物合成)”具有极高的中心性。WOS 核心数据库中马瑟兰葡萄为第二大研究主题,且“biosynthesis(生物合成)”为马瑟兰葡萄的研究热点。由主要的关键词可推断出一些与葡萄果实和葡萄酒质量为主的次级代谢产物(如花色苷)和生物活性是马瑟兰葡萄研究的主要趋势。葡萄浆果的“grape seeds(葡萄籽)”也是马瑟兰研究的热门主题。其中种植历史悠久的优良酿酒品种“cabernet sauvignon(赤霞珠)”为中心性较高的关键词,这显示了赤霞珠常用作与马瑟兰进行比较研究。此外,“grape seeds(葡萄籽)”研究主题下“chromatography(色谱)”和“astringency(涩感)”也是两个主要的关键词,葡萄籽中富含单宁,与涩感具有极大关联。“elicitor(诱导子)”、“signal transduction(信号传导)”、“ms(质谱)”和“physiology(生理学)”也是马瑟兰的研究热点。
CNKI 数据库中,“酿酒葡萄”为马瑟兰研究最主要的主题,其中“酚类物质”为重要关键词。其次是聚焦于以生产实践价值为评价标准的主题研究,如与葡萄果实相关的“果实品质”及与马瑟兰植株相关的“品质”主题。此外,“红葡萄酒”也是一个重要研究主题。植株与葡萄酒品质间的关联反映马瑟兰研究的重要趋势。“糖代谢”和“旱害指数”为马瑟兰研究中涉及植物生理的主题。综上,WOS 核心合集数据库中植物学领域的研究占据重要地位,而CNKI 数据库中则以与生产实践为目的的研究为主。
3 结论
随着中国葡萄酒产业的不断发展,马瑟兰的热度不断提升。然而,通过使用文献计量学的方法对WOS核心合集数据库和CNKI 数据库的马瑟兰相关研究进行可视化分析,马瑟兰相关研究目前文献数量仍较少,该领域仍有较大发展空间。2016 年之后是马瑟兰研究高速发展的时间。两数据库相较而言,中文马瑟兰研究正呈现出高速发展趋势,但国际间交流合作仍待加强。葡萄霜霉病和酿酒葡萄品质分别为WOS 核心合集数据库和CNKI 数据库的重要研究主题,这反映了国内外研究倾向的差异。作为酿酒葡萄品种新星,马瑟兰的重要的作用之一就是成为优质葡萄酒原料。因此,多手段全方面针对马瑟兰葡萄及葡萄酒的相关品质及其机理的研究将具有重要意义。