APP下载

基于第16届ISSI会议的“五计学”研究可视化分析*

2019-04-16邱均平沈恝谌宋艳辉

图书馆论坛 2019年4期
关键词:计量学主题词发文

邱均平,沈 莹,沈恝谌,宋艳辉

0 引言

“五计学”是指包括文献计量学(Bibliometrics)、科学计量学(Scientometrics)、信息计量学(Informetrics)、网络计量学(Webometrics)和知识计量学(Knowledgometrics)在内的五大计量学学科。文献计量学是以文献体系和文献计量特征为研究对象,采用数学、统计学等方法,研究文献的分布结构、数量关系、变化规律和定量管理,进而探讨科学技术的结构、特征和规律的一门学科[1]。科学计量学是以社会环境为背景,运用数学方法计量科学研究成果,描述科学的体系结构,分析科学系统的内在运行机制,揭示科学发展的时空特征,探索整个科学活动定量规律的学科[2]。信息计量学是采用定量方法来描述和研究信息的现象、过程和规律的一门学科。网络计量学是采用定量分析方法,对网上信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以揭示其数量特征和内在规律的学科[3]。知识计量学是以整个人类知识体系和知识活动作为研究对象,采用计量学方法对知识载体、知识内容、知识活动及其影响等进行定量研究的交叉性学科[4]。

2017年10月17-20日,第16 届国际科学计量学和信息计量学学会(International Society for Scientometrics and Informetrics,ISSI)在武汉大学召开。本次大会由武汉大学、ISSI 和中国科学学与科技政策研究会主办,武汉大学中国科学评价研究中心、中国科学计量学与信息计量学专业委员会和中国科教评价网承办。会议主题是“The theory,method as well as principle of five metrices science concepts including Bibliometrics,Informetrics,Scientometrics,Webometrics and Knowledgometrics”(包括文献计量学、信息计量学、科学计量学、网络计量学和知识计量学在内的五种矩阵科学概念的理论、方法和原则)。33 个国家/地区近200 名学者及相关人员参会,共收录208 篇论文。本文以第16 届ISSI 会议论文集为数据源,利用文献计量分析法,研究和探讨“五计学”的发展与应用。

本次会议的分主题包括但不限于:Altmetrics,计量指标,研究前沿和新兴课题,“五计学”的创新和发展,大数据对“五计学”的影响,数据科学与计量学,科学政策和研究评价,高校政策和机构排名,期刊、数据库和电子出版,数据消歧,学术不端,智库建设和评价,信息计量学在科学评价中的应用,计量方法和技术,引文和共引分析,知识图谱和可视化研究,专利分析,社会网络分析,知识发现和数据挖掘,科学交流,不同层面的科学政策研究,科学学和创新发展战略,共现分析,创新和创造力研究,计量学与图书情报学的发展[5]。

一些学者研究了往届ISSI 会议。梁立明对科学计量学与信息计量学的总体发展形势、重点研究领域、研究情况和前沿课题等作出评价,并对学科发展提出若干建议[6]。梁立明和Ed Noyons通过分析ISSI 会议的征文和投稿情况,揭示论文评审机制与评价指标,对提交论文、录用论文及评审专家的国别分布作了进一步分析[7]。Aleixandre-Benavent,Rafael 等分析了第五、八、十届ISSI 会议论文的文献计量特征,发现多数会议论文会后发表在期刊上[8]。赵蓉英等从历届ISSI 会议视角剖析科学计量学演进历程[9]。邱均平、柴雯通过第15 届ISSI 会议回顾历史和分析现状,从国家/地区、机构和主题等角度解析全球科学计量学的发展趋势[10]。

1 国家/地区分析

衡量一个国家/地区在某个领域科研实力的最简单办法是进行发文量的统计与比较。在科技全球化的时代背景下,由于科研的复杂性、技术的迅速变化和知识的动态增长,科学研究模式越来越趋向于协同与合作,国际合作逐渐成为科研质量提升的重要战略[11]。

本文对论文集中208 篇论文进行统计分析,提取全部作者、国家/地区和机构的信息。在考虑不同国家/地区作者合著的情况下,共提取出全球39 个国家/地区,发文频次共计257 次,具体情况见表1。由于存在大量作者合著现象,因此表1统计的国家/地区发文频次总和要大于全部文献数量。

以大陆板块为单位进行划分,北美洲的发文频次(3 个国家)为33 次,大洋洲(2 个国家)3 次,非洲(4 个国家)8 次,南美洲(1 个国家)2 次,欧洲(17 个国家)86 次,亚洲(12 个国家/地区)125 次,可见欧洲和亚洲是科研的两大主要力量。亚洲发文频次最高,但存在发展水平不均衡的问题,中国大陆发文频次占据亚洲83.2%。欧洲作为计量学的起源地,整体科研水平较为均衡,其中荷兰、西班牙、比利时在计量学领域的研究比较突出。

中国大陆发文频次为104 次,占发文总频次的40.47%,位居第一。与第15 届ISSI 中国大陆发文频次28 次相比,增幅巨大。究其原因,一是第16 届ISSI 在中国大陆召开,激发了中国大陆科研人员的参与热情;二是与中国大陆“五计学”的科研人员数量大幅增加、科研人员英语水平不断提升有关。美国发文频次依旧处于第二位,在该领域的研究基本趋于平稳。与第15 届ISSI 发文频次相比较,上下浮动大于3 次的国家有加拿大、西班牙、荷兰、比利时、英国、德国、意大利、法国、巴西、瑞典、波兰。除巴西外,其余十国均来自欧洲,当中除了波兰,余下九国的发文频次均大幅下降,表明举办国家的不同对其他国家发文量有一定影响。上一届ISSI 在土耳其举办,土耳其横跨欧亚大陆,虽然严格上说属于亚洲,但从文化、政治等方面来看属于欧洲,故而上一届发文频次最高的大陆板块是欧洲,而这一届则是亚洲。

表1 国家/地区发文频次

2 机构分析

研究机构对学科发展作用巨大。本文共提取出178 个机构,发文频次排名前30 的机构见表2。发文机构以大学为主,研究所为辅。与第15届ISSI 相比,武汉大学、南京理工大学、西南大学、浙江大学等中国大陆高校发文频次激增。这是因为此次会议在武汉大学召开,为中国大陆高校提供了走向世界舞台的机会。这些高校和研究所也是中国大陆“五计学”研究领域的主力军。荷兰莱顿大学、鲁汶大学、蒙特利尔大学、瓦伦西亚理工大学发文频次分别为10、7、7、6,与上一届发文频次相比没有太大波动,可见这些高校在该领域的研究相对平稳。比利时安特卫普大学没有参与上一届ISSI 发文,此次以发文频次8次成为新星。

表2 机构发文频次

3 作者分析

随着学科交叉化发展,越来越多的复杂问题需要不同学科、不同领域的学者共同解决,因此科研合作频繁,而科研合作的重要形式是作者合作[12]。由于论文集的数据无法直接应用于可视化软件CiteSpace,并且Web of Science 的文档格式复杂,故将数据整理成CNKI 格式,进行可视化分析。其中3 篇论文没有作者,无法被CiteSpace 识别,故舍去,最终可用于分析的数据为205 篇论文。会议在2017年举办,因此将所有论文的发表时间定为2017年。将数据导入CiteSpace,设置时间分割为2017-2017年,节点类型选择Author,为显示全部作者,设置阈值为0。运行CiteSpace 将作者及其合作者以知识图谱的形式呈现,得到图1。

普赖斯发现,75%科学家一生只发表1篇论文,10%科学家一生中所发表的论文占所有论文(总量)一半,由此提出普赖斯定律[13],即高产作者的数量等于全部科学作者总数的平方根,表示为:

图1 作者共现知识图谱

其中,n(x)表示撰写x 论文的作者数;I=nmax为该领域最高产作者的论文数;N 为作者总数;m 的确定方法为m=0.749(nmax)0.5。根据普赖斯定律,可以确定论文集中的高产作者为论文数大于等于2 篇的作者。根据CiteSpace 运行结果,共有486 名作者参与发文,发文量≥3 篇的作者有13 位,详见表3。

表3 高产作者及发文量

205 篇论文中,22 篇是独著,合著183 篇,作者合作率在89.27%左右,可见作者间的科研合作较为紧密。从图1和表3可以看出,加拿大蒙特利尔大学Vincent Larivière、法国国家科学研究中心(CNRS)波尔多大学Philippe Gorry、南京理工大学信息管理系章成志、荷兰莱顿大学科学与技术研究中心(CWTS)Nees Jan van Eck、武汉大学赵蓉英的发文量位居前五位。他们对“五计学”做了大量研究,是ISSI 大会的核心作者。

Vincent Larivière 发文量最高(5 篇),且以他为中心的作者间合作较为紧密。他分别与同校的Cassidy R.Sugimoto、Dakota Murray 和印第安纳大学Nicolas Bérubé 等合著。Vincent Larivière 的合著者又有各自的合著者,最终形成了一个较大的合作网络,整个网络具有较好的连通性。Nees Jan van Eck 与瑞士洛桑联邦理工学院数字人文实验室的Ludo Waltman和美国科学技术策略公司的Kevin W.Boyack 等形成合作网络,说明这些学者之间存在紧密的团体协作关系。图1的边缘区域零零散散地分布着一些学者,这部分学者较为独立,多为单独发文。

4 主题分析

关键词是作者对文章核心内容的高度提炼,用于表达文献主题内容,对高频主题词的统计有利于把握当前的研究热点。由于论文集中的部分文章没有关键词,只有会议主题(Conference Topic),因此将这类文章的会议主题作为关键词。设置节点类型为Keyword,阈值为2,运行CiteSpace将高频主题词以及主题词的聚类以知识图谱的形式呈现出来,得到图2。根据CiteSpace 运行结果,经过统计,本会议论文集共有主题词223个,其中频次排名前20 的主题词及其中心度和频次详见表4。

图2 主题词共现知识图谱

表4 高频主题词分布

根据图2,将所有主题词聚成六类。

(1)文献计量学(Bibliometrics)、科学计量学(Scientometrics)、信息计量学(Informetrics)、网络计量学(Webometrics)、知识计量学(Know-ledgometrics)、社会网络(Social Net work)、科学史(History of Science)、睡美人(Sleeping Beauty)、科学经济(Ecomony of Science)等主题词。

“五计学”的理论、方法和原则为本次会议的主题,科学计量学、文献计量学、知识计量学、信息计量学和网络计量学作为最重要的主题词聚成一类是显而易见的,而且彼此之间联系紧密。睡美人(Sleeping Beauty,SB)在文献计量学中指的是一个长期未被注意的“睡眠”出版物,某个时间会突然引起很多关注,就像“被王子唤醒”。这个概念实际上是对“科学成就延迟认可”的定量描述[14]。“不成熟的发现”“变革性的创新”对科学发展至关重要,但它们往往最初被科学界忽视或抵制,因此受到延迟认可[15]。在本次会议论文集中,为扩大引用分析的应用范围,学者们尝试提出SB 出版物的系统识别方法,讨论识别这些有潜力的出版物或研究的意义,并找出其主要特征,以缩短原始研究获得认可的时间滞后。科学史(History of Science)与科学计量学紧密联系。科学计量学这一术语起源于俄罗斯,指的是将定量方法应用于科学史[16]。

(2)合作(Collaboration)、学术交流(Scholarly Communication)、科学交流(Science Communication)、高校政策和机构排名(University Policy and Institutional Ranking)、科学参与(Participation in Science)等主题词。

互联网和信息技术的发展,以及学科的不断交叉与融合,促进了不同国家/地区之间的学术交流,提供了更多的合作机会。近年大学排名迅速成为政府教育决策的重要工具,国际上权威的大学排名有QS 世界大学排名、泰晤士高等教育排名等。许多政府以建立世界一流大学的教育和学术地位以及提升大学排名为发展目标,帮助所在国家/地区在全球竞争中获取优势地位。

(3)社会网络分析(Social Network Analysis、Gephi、Bibexcel)、科学前沿(Scientific Frontier)、知识结构(IntellectualStructure)等主题词。

社会网络分析是对社会关系进行量化分析的方法,包括调查和测量社会系统中各部分(“点”)的特征与相互之间的关系(“连接”),将复杂多样的关系形态表征为一定的网络构型,然后基于这些构型及其变动,阐述其对个体行动和社会结构的意义[17]。Gephi是社会网络分析工具,Bibexcel是文献计量工具。Gephi 是基于JVM 的开源跨平台复杂网络分析软件,主要用于网络和复杂系统、动态和分层图的交互可视化与探测。Bibexcel是瑞典科学家佩尔松(O.D.Persson)开发的文献计量学研究软件,用以帮助用户分析文献数据,通过共词分析、耦合分析、共被引分析等对研究领域的知识结构和科学前沿进行可视化处理。

(4)知识图谱和可视化(Mapping and Visualization)、知识发现和数据挖掘(Know-ledge DiscoveryandDataMining)、方法与技术(Methods and Technique)、研究前沿和新兴问题(Research Fronts and Emerging Issue)、学科交叉(Interdisciplinarity)、共现分析(Co-occurrence Analysis)、对个体科学家水平的研究(Studies on the Level of Individual Scientist)、国家级研究(Country-levelStudy)等主题词。

知识图谱和可视化(Mapping and Visua-liza tion)、知识发现和数据挖掘(Knowledge Dis covery and Data Mining)、共现分析(Cooccurrence Analysis)作为科学计量学的重要方法和技术,用于分析研究前沿和新兴问题,在经济、管理、图书情报等学科领域应用广泛。近年学科的交叉与融合不断发展,本次会议作者合作率为89.27%左右,科研人员之间越来越趋向于合作。不同机构、不同国家/地区学者的合作越来越紧密,以国家/地区为单位,着眼于国家/地区、全球的研究越来越普遍。

(5)指标(Indicator)、科学学(Science of Science)、引文和共引分析(Citation and Cocitation Analysis)、数据消歧(Data Accuracy and Disambiguation)、期刊与数据库和电子出版物(Journal,Database and Electronic Publication)、信息计量学在科学评价中的应用(Application of Informetrics on Evaluation)、科学政策和研究评价(Science Policy and Research Assessment)、使用数据(Usage Data)等主题词。

期刊与数据库和电子出版物(Journal,Database and Electronic Publication)是使用最频繁的科学计量对象。准确引用数据对高质量的文献计量学研究至关重要,引文数据的准确性可以从两个角度来分析:一是关于参考数据的准确性,二是关于引用匹配的准确性。这是使用数据前应该考虑的问题,对期刊与数据库和电子出版物进行引文和共引分析(Citation and Co-citation Analysis),是信息计量学在科学评价中的应用。科学政策与研究评价,重点在“评价”,注重评价指标体系的构建,评价最终又为科学决策服务。科学学(Science of Science)是研究科学和科学活动发展规律及其社会功能的综合性新兴学科。有学者认为科学计量学是科学学的分支,科学学诞生于运用科学的定量方法来研究科学,因此在一定意义上科学学就是科学计量学[18]。

(6)替代/补充计量学(Altmetrics)、专利分析(Patent Analysis)、科学影响(Scientific Impact)、文献计量分析法(Bibliometric Analysis)、国际合作(International Collaboration)、推特(Twitter)等主题词。

随着社会网络和社交媒体的快速发展,科研人员在科学研究和学术交流中越来越多使用社会网络工具,如Twitter、博客、微博,产生了丰富的在线活动痕迹,简单的文献计量分析法在一定程度上已不再适用。因此,互联网时代的学术交流催生了新的计量学研究测度方法和多元化指标——替代/补充计量学(Altmetrics)。它利用工具收割文献管理系统和社交网络中涉及某一研究成果的相关信息(下载量、引用次数、浏览次数、评论、转发等),通过对这些数据进行聚类分析和统计计算,达到评价该研究成果学术及公共影响力的目的[19]。专利分析(Patent Analysis)也称专利信息分析或专利情报分析,它是竞争情报分析的重要形式,是在对专利文献进行筛选、鉴定、整理基础上,利用文献计量学方法,对其所含的各种信息要素进行统计、排序、对比、分析和研究,从而揭示专利文献深层动态特征,了解技术、经济发展的历史及现状,进行技术评价和技术预测[20]。专利分析能够有效利用专利信息、防范专利权纠纷、降低运营风险,是有效开展和保护自主知识产权、提升竞争优势的重要途径。

5 结论

本文利用CiteSpace 对第16 届ISSI 会议论文集进行统计与分析,得到如下结论:

(1)第16 届ISSI 会议在武汉大学召开激发了中国大陆学者的热情,中国大陆的发文量位居第一,亚洲的发文量比欧洲高。但是,亚洲研究水平不平衡,中国大陆有较大优势。欧洲研究水平相对平衡,荷兰、西班牙、比利时的研究水平较突出。

(2)机构以大学为主,研究所为辅。中国大陆高校发文量和机构参与数较上一届有大幅提升,武汉大学、南京理工大学、西南大学、浙江大学等为此次会议做出不小的贡献。除比利时的安特卫普大学以8 篇发文量在本次大会崭露头角外,国外高校的发文量基本没有太大波动。

(3)由于学科的交叉融合,作者间的科研合作愈发紧密。此次会议论文集中,作者合作率为89.27%。蒙特利尔大学Vincent Larivière、荷兰莱顿大学Nees Jan van Eck、武汉大学赵蓉英等对本次ISSI 大会做出了卓越贡献。他们与其他作者合作发文,形成了以他们为中心的合作网络。然而,中国大陆的核心作者相对较少,可见中国大陆以作者数量取胜,而并非以单个作者发文量取胜,表明其科研力量分散,科研实力较弱。

(4)指标、方法和技术、引文和共引分析这三个主题词在本次大会中占据重要位置。通过对“五计学”理论、方法和原则的研究,可将“五计学”更好地运用于科研。替代/补充计量学为科学计量学提供新的数据、方法和应用,适用于当前网络科研交流日益频繁的环境,故而其研究热度不断上升。社交网络和信息技术催生了社会网络分析法,它对研究对象的社会关系进行量化分析,其应用范围随着研究的深入越来越广泛。

猜你喜欢

计量学主题词发文
基于CiteSpace的医药语料库文献计量学分析
针刺治疗失眠症的文献计量学分析
基于Web of Science数据库的老年综合评估文献计量学分析
关键词的提取与确定
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
《中国医学计算机成像杂志》2020 年第26 卷主题词索引
基于科学计量学的公安院校科研与评价
取消公文主题词的真正原因是什么?