Altmetrics十年发展综述
2021-11-22王贤文
杨 岳 王贤文
(大连理工大学科学学与科技管理研究所暨WISE实验室 大连 116024)
1 Altmetrics概念提出及在中国的传播
1.1Altmetrics概念提出前的相关研究Altmetrics自从提出之后便成为图书情报学领域所关注的热点,自2010年发展到今天已然经历了十年时间。Altmetrics被看作是一种用于科研传播、讨论和评价的一种新型的计量指标。Altmetrics从本质上来讲是学界之于科学评价的内在需求与社交网络应用的深度结合。我们既可以将Altmetrics看作是传统计量方法应用于社交网络的新型实践,也可以看作是社交媒体平台对于科学领域的普遍应用。从最早的学术网络ARPANET诞生,到社交媒体蓬勃发展,我们可以清晰地看到,网络深刻影响着科学领域的各个方面。早在Altmetrics概念提出之前,便有学者开展基于学术互动的社会计量和文献计量研究,例如,用来研究识别网络中学者的关系的研究[1],基于文献的使用数据[2]和学术论文网址引用关系[3]的定量化评价指标研究。此外,软同行评议(Soft Peer Review)[4]、文章级别计量(Article level Metrics)[5]和学术3.0(Authority3.0)[6]等对Altmetrics的理念有着重要影响的学术概念都是在这一时期被提出。其中与Altmetrics最为接近的研究是多伦多大学的Gunther Eysenbach提出的Tweet metrics,虽然研究结论否定了Twitter Metrics取代传统计量的能力,但为接下来的Altmetrics提出做出了重要贡献。同时在意义上,这也更贴近Altmetrics的中文译法:补充计量学。
1.2Altmetrics的提出2010年10月Priem发表“科学计量学2.0”[7],并与同年10月26日联合Taraborelli、P.Groth和C.Neylon等人建立了Altmetric.com网站并发表联合宣言,自此Altmetrics正式进入了学界的视野。一石激起千层浪,在科学界产生了巨大的影响。Altmetrics向依赖影响因子作为评估指标的文献计量评价方式提出挑战,主张用创新的科学评价方式弥补传统计量方法在发表、出版等环节存在的问题和不足。在随后的发展过程当中,这种新型计量评价方式不断受到学会和权威机构的认可。2011年召开的国际计量学会对Altmetrics做了专题报道,包括美国国家科学基金会(NSF)在内的许多基金都将使用数据、社交媒体参与指标和网络行为纳入到新的评估指标当中。2013年美国细胞生物学会年会发表《旧金山宣言》,宣言当中的一般建议的第三条、机构建议第二条都明确指出,在评价研究中应呈现各种所能呈现其价值的结果,将包括数据集和软件作为经典原创文章的补充[8],随后荷兰莱顿大学于2014年发表的《莱顿宣言》也从多个维度探讨Altmetrics指标的效度,讨论指标的质量标准。
总体来说,纵观Altmetrics发展的十年,它带给科学界一种以社交网络数据为基础的,更新、更快速、更全面的学术评价指标体系,旨在替代仅依靠引文指标的、保守的、刻板的科研评价体系。另外,Altmetrics促进了开放科学的进程和科学在线交流的全面发展。科研工作者、出版商和科研机构开始活跃于社交网络上,通过Twitter和Facebook等社交网站与同行进行学术交流。例如:通过社交网络分享、宣传文章,以提高自身的知名度。Altmetrics在实际意义上打破了科学交流的时空壁垒,远远超出了仅限于学术同行评议的范围。科学工作者对其寄予厚望,希望通过这种创新的科学评价方式来改变现存的科学评价体系,让科学评价更加公正、公平且更加效率,这对科学计量学的发展起到了非常积极的推动作用。
1.3Altmetrics概念在中国的传播Altmetrics在国内的发展呈现百家争鸣的态势,刘春丽在2012年最早将Altmetrics引入中国,并做了详细地介绍,命名为“选择计量学”[9]。随后出现了许多不同的翻译版本,例如“替代计量学”[10]、“补充计量学”[11]、“社媒影响计量”[12]、“知识计量学”[13]、“网络补充计量学”[14]和“基于网络的社交影响计量学”[15]等。由于不同的译名的侧重都有所不同,这给相关研究人员带来理解上的困难,不仅人为造成了后续研究中文献查全率低,更是人为地分散了有限的研究资源,这极大地阻碍了Altmetrics在我国的深入发展和应用。虽然不同学者对Altmetrics的解读略有不同,不过在对Altmetrics本质的理解上达成了共识,即是对采用传统引文指标的评价指标体系的一个合理补充。值得一提的是,早在2008年,苏新宁及其团队便采用了部分Altmetrics指标用于学术著作影响力研究[16]。在Altmetrics与机构应用结合方面,西安交通大学在2015年首次将机构知识库与WOS和PlumX整合[17]。
虽然有许多学者对Altmetrics加以概括总结,但始终未能形成一套较为完善的理论体系,加之有一些学者只是将Altmetrics看作是一种补充计量指标来使用,这严重阻碍了学界对Altmetrics内涵的进一步探究,因此,本文参考莫顿、乔纳森科尔和斯蒂芬科尔的科学社会学思想,并借鉴活动理论模型构建Altmetrics理论体系,将科学研究当作是一种科学界的社会活动行为看待,进而分析其内在机理。不难发现,现有的Altmetrics研究没有非常明确的将科学活动的主体和研究对象区别开来。尤其是将用来评价论文的一套方法用在了期刊杂志、学者产出、甚至机构评级等问题上,由于这些研究对象各自都具有不同的属性和特点,滥用Altmetrics指标所导致的评价效果的参差不齐,进而引发了外界对Altmetrics本身产生怀疑。事实上,Altmetrics在评价早期论文的方面具有独特的优势,若一味认为可以一种方法放之四海而皆准,则丢失了科学的严谨精神。本文参考科学活动理论,解构科学活动中的主体、工具和客体,最终将Altmetrics的研究内容分为一体四类,四大类分别为理论研究,科学活动主体研究、科学活动客体研究和数据来源、平台与工具研究。通过归纳总结,理论部分包括概述研究、科学评价、科学传播、数据质量和指标可用性研究;科学活动主体研究部分关注学者、机构和国家三个层面的研究;科学活动的客体研究包括论文、图书、期刊和学科领域研究;数据来源、平台和工具研究根据数据来源、易得性和易用性分为源于大众媒体的Altmetrics数据来源、源于学术社交媒体的Altmetrics数据来源的单一指标来源,和面向指标的Altmetrics集成平台。本文以此来展开论述。
2 Altmetrics理论研究
2.1概述研究Altmetrics概述研究主要包括Altmetrics理念的介绍,定义以及传统科学计量学的辨析等相关研究。对Altmetrics来说,学者在早期的研究中将关注的焦点放在Altmetrics和传统科学计量学之间的关系上。学者希望基于Altmetrics建立起一套完善的科学评价体系。但是,随着学者在宏观层面研究发现,Altmetrics与传统科学计量学之间并不是替代关系,Altmetrics想要广泛地替代传统指标仍缺乏系统的论证。同时,对Altmetrics的质疑声音也普遍存在,经调研发现有些撰稿人对Altmetrics的态度并不积极,甚至冷淡,对Altmetrics是否能取代传统计量表示否定,认为Altmetrics仅仅是将科学影响力运用到了一个快速传播的近乎通用的社交媒体的大环境中而已[18]。
但是,Altmetrics不可否认地给传统科学计量学带来了新的契机。更新、更广、更快已经成为Altmetrics最显眼的标签,成为其最典型的特征[19]。而且从学界的传播速度和认可度来看,Altmetrics具有巨大的潜力,尤其是在国内,学界很快就接纳了Altmetrics这个新概念,并开始普遍推广。不过由于国内学者普遍无法使用诸如Twitter等社交媒体工具导致国内的Altmetrics研究者更倾向从理论层面上开展研究,而在指标的有效性和准确性等方面的实证研究与国外学者有一定差距。近年来对Altmetrics的研究趋势在于越来越多的学者开始关注Altmetrics数据背后的社会动因。Altmetrics复杂的数据指标背后的社会现实被认为是Altmetrics理论研究所关注的核心问题[20],倡导在研究社交媒体的补充计量指标中加入定性研究,从而让人们可以直接看到指标背后的本质问题,进而提高Altmetrics的评价功能,吸引更多对Altmetrics研究感兴趣的人[21]。
2.2科学评价研究Altmetrics的本质就是科学评价,同时Altmetrics的科学评价功能也是Altmetrics的价值归宿。虽然人类社会有近350年的学术评价经验,但做得仍然不够好[22],科学界仍在不断地为了构建公平合理的科学评价方式而努力,目的是为了寻找一种更为理想的科学评价方式。Altmetrics提出的初衷便在于此,最直接的应用便是用来对学者、机构、单位甚至国家的学术产出、绩效进行有效的描述。在社交媒体大数据环境下,传统的科学论文评价机制暴露出了滞后性,Altmetrics的提出改善了当前的核心期刊评价体系[23],对不同的评估范围、目的和政策环境构建评价模型[24]对科学产出进行评估[25]。
随着科学的不断发展,要求我们清晰地理解Altmetrics科学评价功能的内部性和外部性。首先,内部性体现在Altmetrics评分高并不一定意味着文章本身的有用性。值得一提的是,由科研成果的有用性而引申出来的对科学评价的基本逻辑是建立在“如果论文对某一领域的科学研究有重要贡献,其在出版后会被更多的新文献引用”这一假设之上的。正如默顿在《科学的规范结构》中所说的那样,影响因子(IF) 也是建立在这一假设之上。这也是传统计量指标和Altmetrics计量指标之所以能存在的基本逻辑。虽然Altmetrics对科学评价带来新的可替代方案,但是,和影响因子所面临的问题一样,Altmetrics指标也是有局限的。当前的研究表明Altmetrics不能对论文本身的质量进行评估。这就导致有些声音认为Altmetrics本质上只是在社交媒体所展现的社会某些领域的简单共鸣[26]。另一方面,外部性体现在Web2.0在扩大影响范围的同时存在评估质量降低的隐患,同时,有学者从数据分布角度出发,提出呈偏态分布的引文数据和社交网络数据并不适用于均值的统计方法用于评价。由于当前研究无法证明Altmetrics要优于传统引文评价方法,因此要客观冷静地看待Altmetrics的科学评价功能的实际作用[27]。
2.3科学传播研究Altmetrics是学界之于科学评价的内在需求和社交网络应用的深度结合。尤其是社交网络普及的今天,社交媒体平台对于Altmetrics的发展起到了至关重要的推动作用。Twitter、Facebook等社交媒体的发展催生了Altmetrics是不争的事实,简而言之这是科学的社交媒体时代。对Altmetrics开展科学传播的研究,量化Altmetrics社交媒体的使用情况[28]需要从以下三个层面展开:首先,在网络资源层面,互联网的开放性特征催生了科学界的开放获取运动(Open Access),使得越来越多的网络科学资源变得可用,且颇具规模,其所覆盖范围都是前所未有的。其次,在网络传播层面,出版物以一种分散式的循环模式在Web2.0社交媒体上传播,在传播性、曝光率和学科交流方面都得到加强[29],为学者,以及科研管理部门推广学术成果,提高科学交流效率提供新途径。再次,在网络交流层面,以社交软件为主的科研交流已经成为科学社会当中的主要交流形式,其具备效率高、速度快、智能化、分散化等众多特点,不仅有助于科研成果的传播,同时缩短了科研成果转化的过程[30]。
通过归纳有关Altmetrics科学传播的文献可发现,Altmetrics通过社交媒体提供三种全新的特性:即补充性、外部监督性和便捷性。首先,补充性体现在:社交媒体已成为向社区和决策者传播知识和活动以及建立实践社区的重要空间[31]。王贤文从成本机制、宣传机制、内容机制三方面分析了科学论文在社交网络中的传播机理[32],刻画基于替代计量学的在线科学交流过程[33]。其次,监督性体现在:社交媒体可以起到的监督作用,在线科研成果通过社交媒体可以接受更广泛的同行和大众群体的监督,打破了学科内同行小团体的束缚,并且贯穿整个文献的生命周期的始终。再次,便捷性体现在:Altmetrics为年轻学者提供很大的便利,相对IF需要一定时间才能体现出效果,不同的是Altmetrics可以将学术成果在第一时间进行传播并计数,而这点对年轻学者非常友好,认为Altmetrics使得科学变得更加民主[34]和开放。
2.4数据质量数据质量研究是Altmetrics研究的重要领域。Altmetrics目前主流的研究方式是通过实证研究得出相应结论,并且许多重要的结论都是通过获取高质量数据实证分析而得来。因此,保证数据的真实性、有效性和全面性显得格外重要。为了在Web2.0环境下,计量科学研究的影响力、传播和使用情况,最理想的方式是构建具有通用意义的数据质量评估体系[35], 建立起Altmetrics通用的数据标准化的数据框架。但是由于Altmetrics数据来源过于繁杂,当前阶段想要实现这个目标难度较大。
通过对数据质量现有文献进行归纳,针对Altmetrics数据质量展开的讨论主要围绕着三个问题展开:首先,Altmetrics的数据质量会直接影响其研究结果[36]。究其原因,包括研究范式、数据提供平台、研究者的主观因素和研究者的技术水平。此外,Altmetrics来源平台的元数据准确性是否可靠,数据平台的文献识别方法的差异,数据分析过程中的目标定位和技术能力差异,数据的整合清洗方式不透明等诸多原因都是重要影响因素[37],对研究结果是否科学产生重要影响。其次,由于不同的Altmetrics数据平台数量多,且数据和指标存在差异,导致数据整合、去重难度大。学者从不同的社交平台收集,处理,汇总和更新社交媒体指标的难度不同[38],通常只能通过选取有代表性的社交媒体数据进行采样,严重影响研究结果的全面和准确性。再次,Altmetrics度量背后的意义对于不同学术背景的研究团队来说无法形成统一标准。数据标准化、归一化等难题也在不断困扰着研究者[39]。这些原因也是限制Altmetrics继续发展的因素。
总体而言,Altmetrics数据特性具备多样性、易用性、准确性和时效性等特点。Altmetrics数据多样性体现于近年来涌现出的许多优秀Altmetrics平台使得学者分散在不同的平台,研究人员在不同数据平台传播和共享数据[40]导致的Altmetrics数据呈现有多样性特征。Altmetrics数据易用性体现在其会直接作用于Altmetrics的表现结果。Peters发现有关于汇总数据和序列数据等可用且规范的数据会更频繁地被引用,且Altmetrics score会更高[41]。Altmetrics数据的准确性主要体现在文献的DOI号码在Altmetrtics的表现,很多时候API和DOI的可用性在很大程度上决定着Altmetrics的表现状态[42]。时效性体现在Altmetrics被用作文章初期的风向标,这点与文献计量可以互为补充。
2.5指标可用性研究与数据质量研究相对应的是对Altmetrics指标的可用性研究。指标可用性研究是对数据质量研究的进一步深入,通常情况下,通用型指标是由数据提供方所提供的。现有研究表明基于引文指标的期刊学术影响力表现与Altmetrics指标的社会影响力表现存在较强正相关。通过对现有指标可用性研究进行归纳,Altmetrics指标所具备的特点包括可用性、即时性、开放性和透明性等特征。从Altmetrics指标分类来看,大致分为长期指标和短期指标,定性指标和定量指标。在Altmetrics指标的表现上来看,整体来说,Altmetrics在高水平的期刊论文和会议论文表现的效果更好[43],不同地区、不同领域的Altmetrics指标表现结果也不尽相同[44]。在Altmetrics指标标准化方面,研究针对稀疏的科学计量学数据,而建立的新指标体系,评估不同论文的Altmetrics表现[45]。在Altmetrics指标对比方面,对比不同级别出版物的Altmetrics指标的有效性,研究论文级别Altmetrics指标,验证Altmetrics指标差异,总结指标适用范围[46]。
2.6理论研究评述Altmetrics是一个全新的研究领域,它的发展在经过后一段时间的热度之后逐渐回归理性。Altmetrics诞生于社交网络的兴起,被予以厚望,原因在于互联网技术的飞速发展给学者以信心,可以通过大数据、机器学习等技术手段实现对科学成果、学者以及机构的评价。但是通过研究发现,即便Altmetrics被用作论文早期的评价标准,也充满着争议,甚至没有引文评价的表现效果好。究其原因是在计量的过程中许多重要数据是无法通过互联网获取的,最典型的是所涉及的社会属性数据。简而言之,是没有打通指标与真实社会现实之间的关联,在没有弄清楚数据背后的社会现实和动因的情况下,仅仅通过现有的,能获取到的Altmetrics指标来进行度量,只是在做表层的数据分析,无法摆脱与传统计量方法一样的困境,无法对论文本身的质量和有用性进行评估是问题的核心,而这将是Altmetrics接下来研究的重要方向。同时Altmetrics研究发展至今仍然缺少一个系统性的理论框架。Altmetrics天然具备开放的特点,其研究者不仅包括不同学科领域的学者,甚至还有编辑、医生和图书馆员等更广泛的群体,同时受限于研究者自身科研水平等因素影响,导致Altmetrics研究难以形成相对系统的理论体系。
3 科学活动主体级别研究
3.1科研人员相关研究科研人员相关研究是Altmetrics主体研究的核心问题。通过归纳相关文献发现主要存在两大方面。首先,研究了解科研人员是否使用Altmetrics及相关社交媒体平台,作为工具在科研人员当中的普及程度如何?研究发现欧洲科学家在社交媒体的普及程度不高,大多数的科学家并没有在社交网络中创建账号[47]。但科研人员使用社交网络等形式传播、交流学术信息已经形成一种趋势。研究发现拥有一个完善的社交网络账号的科学家有更大的可能会在其它社交网络平台上注册,其中Twitter最受欢迎[48]。而对于EI撰稿人来说,Google Scholar Profiles更受欢迎,其次是LinkedIn和Mendeley[49],对于国内学者则更倾向于使用Research Gate建立自己的学术社交群落[50]。
另一方面,随着社交媒体在学术界的普及,许多学者认为可以通过社交媒体来获得一系列新的指标为学者的科学影响评价提供支持,Orduna运用多种指标对文档和作者进行分析,定量分析学者的表现,衡量学者智力活动,提出作者级别的度量标准(ALMetrics)[51]。另外,有学者从社会学和心理学的角度出发分析学者使用社交媒体时所表现出来的差异[52],来衡量学者的科学活动的表现和科学成果的价值。总体而言,学者通过社交媒体所产生的“数据”“学术记录”以及与学术记录紧密相关的“个人”信息被认为是促进研究科研人员在社交网站上行为研究的关键[53]。虽然,目前Altmetrics缺少在学者行为层面的关注和深入理解,不过在不久将来会受到越来越多的学者们的重视[54]。
3.2机构相关研究机构相关研究是科学评价领域的热门话题,而Altmetrics往往能为一个机构的科研竞争力提供相应证明。从这个角度而言,很容易引起机构研究者的兴趣。通过对机构相关文献进行归纳发现Altmetrics指标可以解释学术机构的学术影响在不同方面的表现。例如:有的研究者通过Mendeley研究我国前50名学术机构的自然指数,分析不同排名之间的差异,并得到很好的效果[55]。但是,对欧洲和美国高校等科研机构的研究发现,Altmetrics评分并没有真实还原机构的实际影响力[56]。此外,Thelwall在2018年首次从项目资助的角度对Altmetrics进行分析,以帮助筹资机构评估其筹资计划[57]。Serrano提出了一个指标模型来评估西班牙机构知识库,帮助提高咨询和信息服务质量[58]。国内在Altmetrics与机构应用结合方面,西安交通大学于2015年首次将机构知识库与WOS和PlumX进行了整合,通过利用Altmetrics可以弥补传统计量学方法和机构知识库质量控制方面的不足。
3.3国家相关研究以国家为研究对象的Altmetrics研究在近些年渐渐出现在学者们的视野当中。研究者认为可以通过统计不同地域国家的科研成果的Altmetrics表现可以在一定时期内从侧面反映该地区科技政策、科学发展和科学合作的状态,具有重要意义。运用Altmetrics研究使用补充计量的方法评估了欧洲、亚洲[59],北美洲、拉丁美洲[60]的在线科学关注度的驱动力[61]和学术影响力,了解Altmetrics在世界范围的变化趋势。但是开展国家级别的Altmetrics研究需要考虑到不同地区的网络开放和管制程度,网络的开放和普及率是影响Altmetrics指标表现的重要因素,在这方面,亚洲地区较欧美地区处于劣势。
3.4主体研究评述发展Altmetrics理论,完善Altmetrics指标体系,在未来的研究当中应当重视科学活动中的主体研究。科研人员是构成整个科学社会的基本单元,是科学活动与评价的主体,同时是为科学评价的最终受益者。Altmetrics领域中主体研究与客体研究最大的区别在于,科研人员自身是具有很强的社会属性,而这些社会属性会在现实的科学活动当中起到非常重要的影响作用。可惜的是目前的Altmetrics指标体系并没有涉及这部分内容,而且这部分数据无法通过现有Altmetrics获取,只能通过用户调研、问卷或者大数据用学者画像技术等辅助手段来获取。
其他方面,随着社交媒体在学术界的普及,Altmetrics在一定程度上可以作为指标使用,为科学影响力评估提供支持,丰富评估手段。研究方法方面,现有研究主要是将传统计量指标和补充计量指标结合起来形成更全面的评价指标体系使用。从研究数量上来看,Altmetrics主体研究当中的学者研究占主要部分,机构和国家级别的研究相对较少。科学活动的主体级别研究是Altmetrics的重要研究方向,力求公平且有效地衡量科研主体的科学产出、科研绩效和科学贡献。而在这个过程中,Altmetrics将扮演着越来越重要的角色。
4 科学活动客体级别研究
4.1论文相关研究对Altmetrics论文评价体系进行分析和探讨,发现Altmetrics作为一种早期指标在一定程度上可以被视为论文能否在未来获得高被引的风向标。随着Altmetrics论文评价指标的不断丰富和完善,提高了Altmetrics评价科研论文的能力,在论文社会影响力方面提供了一种连续、动态和复合的单篇论文评价的解决办法。这弥补了传统科学评价体系所表现出来的滞后性和片面性等问题。值得注意的是,Altmetrics论文相关研究不同于文献级别计量(ALM)仅采用引文和使用数据的测量方式,Altmetrics作为一种早期的指标应用更加广泛,相比ALM更具影响力,是更广义层面上的计量方式。
总体而言,Altmetrics论文级别研究热点包括两个方面:首先,构建学术论文的综合评价模型。Altmetrics可以从多个角度评价论文的综合影响力,通常情况下高Altmetrics得分的论文同时具有较高的学术影响力[62]。但这种状况并不绝对,有研究指出Altmetrics的影响力偏向社会影响力及社会关注度,而不是学术影响力[63],这就说明Altmetrics并不能对论文本身的质量进行评估,这就意味着我们要理性看待Altmetrics评分,就如看待影响因子一样,不能陷入到对数据指标的迷信当中。而且还有一种更为极端的例子,就是即使某一篇文章被撤稿,其在社交媒体上的Altmetrics数据并不会受到所谓撤稿的影响,Altmetrics的引用计数仍会继续增长[64]。其次,比较不同学术论文影响力。现有研究表明不同类型的文章的Altmetrics表现存在差异,如开放获取(OA)论文比非开放获取文章Altmetrics表现更好[65],研究型论文与文献综述的Altmetrics表现也存在差异[66]等等。
4.2图书相关研究Altmetrics图书相关研究也是一个非常重要的研究领域。书籍是传播知识的重要信息载体,Altmetrics正在成为一种更易实施的学术图书影响力评价的新方法。互联网提供海量图书数据, 例如:Altmetric.com可为书籍提供指标数据,进行书目计量分析[67]。虽然并不能简单通过书评对书籍进行评价[68],但,Altmetrics能有效揭示图书学术价值,尤其是在艺术、人文科学和社会科学的某些领域书籍。目前而言,将Altmetrics用于图书评价,尤其是对于电子图书出版物取得了很好的效果。这不仅有利于为学术图书的采购、评价、使用及研究提供帮助[69],也有助于对学术图书影响力进行综合评价。Altmetrics指标在电子图书学术影响力评价方面具有无可比拟的优势,从学术维度和社会维度两个方面[70]构建了人文社会科学学术专著影响力评价指标体系[71],设计了一套电子图书学术影响力评价指标体系,完善学术专著评价的实现机制意义重大。
4.3期刊及数据库相关研究科学期刊是学术交流的重要组成部分。长期以来,学术期刊都是汇聚科学研究成果的主要载体,是科学领域知识发现的重要媒介。总结现有研究成果发现:对于期刊的Altmetrics评价,目前学界公认的做法是将Altmetrics与传统的学术影响力评价结合起来[72],利用Altmetrics在受众、传播途径、数据指标等维度上拓展传统期刊评价方法。与此同时,学术期刊也会更加频繁地使用社交媒体来宣传自己[73]。Altmetrics在科技期刊评价中具有诸多新的特性,被学者用来与传统文献计量指标进行比较。比如:在引文数据时滞不足的情况下,可以通过Altmetrics数据用于期刊前端评价[74]。构建多元评价信息的多维度评价模型[75],比较Altmetrics指标与传统计量指标,在面对期刊评价的问题时应该注意三个问题:首先,由于期刊在不同Altmetrics平台的表现不同,即使是如Nature的顶级期刊在不同平台上的表现也存在差异[76],因此,应根据实际情况探讨如何合理利用各项指标对不同学科的学术期刊进行评价。其次,期刊的在线关注程度会受到部分热门文章的影响,因此Altmetrics用于期刊层面的评价方法似乎并不合适[77]。此外还包括且不限于评价指标体系不统一、难以反映学术影响力、无法精准测量社交媒体的情绪表达、本土化评价体系是亟待解决的问题。再次,Altmetrics与近年来的开放获取运动起到了相辅相成的作用,开放存取大大提高了期刊的Altmetrics指标在统计学意义上的提升,提高了期刊的利用率,开放获取是科学期刊提高在线关注度的明显驱动力,就目前而言,更广泛地推广并使用OA已经形成一种趋势。
4.4学科领域研究Altmetrics的学科领域研究是从更高层次上解释了科研进步和科学发展。总体来说,现有研究表明Altmetrics研究存在学科差异。近年来的一些研究已经注意到Altmetrics指标在不同学科上表现的不同,得出了很多有价值的结论。例如:对于人文社会学科而言,社交媒体指标在人文社会科学与生命医药科学领域有较好表现[78],社会科学的Altmetrics推荐的文章数量在稳步的增长,引用率较高的学科Altmetrics Score会更高等。社会科学的社交媒体使用率要高于物理学[79]。但是如果从研究者交流积极性来看,人文社会科学、自然资源领域等的学者之间的交流表现比较被动。交叉学科更多地出现在学术博客、Facebook这样的平台;此外计算机科学领域的社交媒体内容更多的面向信息的传播和交互[80];商业金融和法律学科的引用率很少[81]等等。
不仅如此,在学科分布方面,不同领域研究人员使用 Twitter 等社交平台的特征也有所不同。生物化学领域的推文数量最多,数字人文和认知科学领域将 Twitter 用于学术交流,经济学研究人员则更多的分享链接[82]。另外有研究通过实证发现生物化学、天体物理学、化学信息学和数字人文学的科研人员更愿意使用Twitter作为交流工具。例如,像人文社科领域的学者则是Academic.edu这样的学术社交平台的主要受众,Research Gate平台中生物学者占比最大等等。
4.5客体研究评述相对于科学活动的主体,Altmetrics客体研究种类更多,范围更广,主要包括:论文研究、图书相关研究、期刊及数据库研究和学科领域研究。总体来说,Altmetrics正在成为一种更易实施的学术论文、图书影响力分析评价新方法,但是在用来评价科学期刊的表现时出现了分歧,有些学者认为Altmetrics不适用于期刊层面的评价。学者们达成的共识是:在引文数据时滞不足的情况下,可以通过Altmetrics数据用于期刊早期评价,但是需要和传统评价体系相结合。因为Altmetrics存在一定的漏洞,即网络数据或者说是科学活动的网络足迹人为干预成本低,容易造成数据造假。另外有两项比较有趣的发现是,国内中文研究Altmetrics的学者倾向于构建论文评价指标体系,且中文有关Altmetrics研究主题的文章大多都有基金作为支持的,这点与国外研究有很大的不同。
5 数据来源、平台与工具研究
Altmetrics平台和工具为科研人员提供利于科学交流、传播的平台,同时通过对必要数据的记录和筛选,为科研人员的科研活动提供有价值的Altmetrics数据。由Vogin-fonds基金会支持的一项调研显示,到目前为止有近600多个用于学术交流工具,其中不乏探索型、分析型、协作型、出版型、外延型、评价型等用途的Altmetrics工具。比较有名的包括Altmetric.com、Research Gate、 Mendeley、 Google+、PlumX、Impactstory等等。此外还有很多不同的分类方式,例如分为商业软件和免费软件、开源和非开源等等。也可通过数据来源的特征分为聚合性数据来源和单一性数据来源,其中Altmetrics.com、Plum Analytics属于聚合性,其他如Mendeley、Research Gate和Twitter都属于单一性数据来源,特点是易用性(指标可用)、易得性,且更受学者欢迎。本文根据平台面向对象和平台自身的功能和特性将相关研究大致分为三类:源于大众媒体的Altmetrics数据来源,源于学术社交媒体的Altmetrics数据来源,和例如像Altmetric.com和PlumX的面向指标的Altmetrics集成平台,如图1所示。
图1 Altmetric平台工具类型分布
5.1源于大众媒体的Altmetrics数据来源面向大众媒体的Altmetrics平台工具大多是比较成熟的社交媒体平台,例如Twitter、Facebook、YouTube等在线社交媒体平台。他们在不断的发展过程中,积累了大量用户,其中不乏各个科学领域的学者。科研工作者通过Twitter和Facebook 等社交网站与同行进行学术探讨,以此为基础自发形成的社交群落是此类Altmetrics平台工具的基础。探索科研人员如何利用Twitter和YouTube这样的社交媒体来开展自身的工作[83],例如,Facebook上的点赞是否会对学者职位升迁产生影响[84]?研究发现学者最有可能在Facebook上分享他们的工作,而在Twitter上共享的信息享有更高的点击率[85]。社交媒体真实账户信息是衡量Twitter参与水平的重要指标,例如,卡戴珊指数[86]。从这点上来说Twitter等拥有广大科研用户群体的社交网络平台具备绝对的优势。研究学者用户在社交网络中所占比率和特征发现,学者社交媒体参与度需要对用户身份进行识别,真实用户往往更加真实地描述自己所研究的领域,且推文和自身介绍的相关性较高,Twitter是科研人员开展活动、学术传播和与他人合作的主要平台,Altmetrics指标在Twitter上的表现特别抢眼[87]。从广义上来讲Twitter活动与引用次数存在强相关[88]。研究表明Twitter的提及和followers的人数对影响因子有促进作用。Twitter在发现学术信息和跨学科知识传播中发挥着重要作用。期刊可以通过Twitter sphere来提高知名度和社会影响力。大量的非学术用户也支持使用Twitter作为学术研究的非学术影响的标准[89],接受这种之于传统方式的新的补充模式。
5.2源于学术社交媒体的Altmetrics数据来源面向科学交流的Altmetrics平台工具与面向大众传媒的最大不同便是面向的客户群体的定位不同。在商业资本的推动下,社交媒体进入学术交流的领域,越来越多新颖的、成熟的互联网公司和社交网络平台开始发展科研工作者这个群体。诸如Google+, Research Gate,Academia和Mendeley等都在设计之初便开始积极寻求与学术界的融合之路,社交媒体和科学活动在这样的背景下不断地深度融合。最具潜力的Google+依托于Google Scholar的海量文献数据,目前该数据库大概包含约3.89亿份文档,是目前全球最大的学术数据库。学者可以创建个人的“学者引文简介”,以提供自己的兴趣和专长领域,并且会自动计算并显示个人的总引用次数,h指数和i10指数。Google+更倾向于多学科[90],且在书籍和书籍章节的文档覆盖面非常高[91]。比较有名的Altmetrics平台工具还有Research Gate 和Mendeley。Research Gate是欧洲商业社交网站,旨在为研究人员分享论文,提出和回答问题以及寻找合作者而设计的。2014年的一项研究表明,当时Research Gate是拥有最多活跃用户的学术社交网络[92]。然而,虽然Research Gate提供了具有巨大潜力的功能和文献计量指标,但是其交流政策以及在设计,开发和传播指标方面存在争议[93]。Copiello发现Research Gate提供的分数主要受到成员的社交网络参与度的影响,其次才受到出版物的影响。这一发现支持了RG分数不能作为科学和学术声誉的可靠指标的说法,而更倾向于商业推广工具[94]。Mendeley是一家位于英国伦敦的公司,为学术研究人员提供产品和服务,以其参考文献管理器Mendeley闻名。Mendeley可以提供文章影响的早期测度,且Mendeley读者人数对于新旧文章都是有用的影响指标[95]。在特定情况下其可以实现与传统引用影响相似的用法[96]。然而,Thelwall分析了Mendeley读者人数与所有医学领域的引文的相关性,发现在排除学生读者时,相关性会略有下降。从数据的分布来看,认为两者可能存在根本差异。
5.3面向指标的Altmetrics集成平台面向指标的Altmetrics的工具最有名的要数Altmetric.com和PlumX,他们通过建立系统的指标体系和评分系统,对网络平台上的替代计量数据源进行及时性追踪,最终以评分或者报告的形式对科研活动或科研产出的影响力进行评价。它们可以用作学者寻求信息的辅助工具,Altmetric.com提供免费(有限使用)API,在产品主页提示:Altmetrics 指标仅测度关注度,不测度质量。该平台可以向商业发行方提供可视化报告。PlumX不提供API服务,PlumX在技术层面与机构知识库的融合方面做的非常优秀,在与机构知识库的融合方面技术相对更加成熟,能最多样化的体现研究成果和指标来源,在对一级、二级机构等和研究人员与机构关系方面的研究上也十分出色,构建完善的指标体系例如:“科学参与”“社交媒体资本”“社交媒体活动”和“科学焦点”等,现有研究表明Altmetrics的表现主要受到成员对社交网络环境的参与的影响[97]。大多数文章在单链接社区中共享,向公众的传播效果非常有限。PLOS ALMs聚合展示论文级别的各种指标,包括传统引文指标、网络浏览、下载指标和部分Altmetrics指标等等。
5.4数据来源评述Altmetrics平台工具所提供的系统的、标准化的、可用的数据,这对Altmetrics的发展起到至关重要的作用,为学者的研究提供方便、实时、准确的数据支持。在避免由于信息过滤失败(filter failure)的情况下,社交媒体对于学术信息和跨学科信息传播发挥着重要作用。越来越多的学者意识到可以通过策略性地积极参与、增加社交媒体上文章的传播次数,提高Altmetrics表现,进而提高工作效率。同时,Altmetrics工具可用于提高科学评价效果,促进科学交流互动的作用。聚合性Altmetrics工具Altmetric.com、Plum Analytics以其易用性(指标可用)、易得性(开放的API)成为最受学界欢迎的Altmetrics工具。Altmetrics工具不仅在数据维度为学者提供便利,也为科研人员的研究工作提供了新的主题发现工具,更是为可能用到的科学评价和科技政策的制定提供更为全面的参考。最近的研究认为Altmetrics平台工具研究早期过于关注技术指标,忽视了数据的交互性,缺乏对Altmetrics指标背后的行为分析。越来越多的学者建议将结合质性研究的新研究方法运用到未来的研究当中,去了解Altmetrics的的创作动机等深层次动因。
6 结论与展望
虽然Altmetrics可以提供一种在社交媒体环境下的“公开、公正、规范”的评价机制,但是通过分析Altmetrics历史现状、前沿趋势、逻辑框架[98]和社会环境等不同侧面发现Altmetrics的研究仍然未形成一个系统的、较为完善的理论框架。研究发现Altmetrics研究过程当中缺失社会维度的计量方法。如果我们将Robert K Merton所描述的美国物理学界称之为科学社会1.0,那么受网络和社交媒体深刻影响的当下科学界便是科学社会学2.0,其特点是拥有更为复杂的科学社会网络结构。结合科学社会学理论和科学活动理论模型统筹Altmetrics理论体系,从社会学的角度分析科学活动的各个组成要素例如,学者、科研对象、科研工具与科学环境等等。对科学活动的主体和客体两个不同侧面加以区分,不仅可以体现出科学评价的价值和功能,更是对Altmetrics评价对象的准确把握。
综上所述,现有研究所引发的思考主要有以下几个方面:首先,继续深化Altmetrics理论的研究。Altmetrics理论在不断地完善。从Altmetrics改名事件便可以看出,将Altmetrics改名为Altnative indicator加以限定,便是为了方便研究者更好的理解Altmetrics的本质和内涵。其次,深化对科学活动主体层面的研究,开展Altmetrics视角下学者分层研究。可以从一下两个方面展开,一方面,将Altmetrics根植于具体的社会背景当中与科研工作者进行有机结合,将Altmetrics指标与学者在现实工作和生活中的社会属性结合起来进行研究。从另外一个角度来讲,现有的Altmetrics指标很少考虑到科研人员的自身的不同,而且指标背后的行为人动机和社会现实规律是当前Altmetrics研究所欠缺的。从数据角度来讲,这一点并不容易获取,针对不同量级的数据可以采取不同的方案,可采用问卷或大数据环境下学者画像技术(scholar profiling)弥补数据获取上的不足。科学主体的分层研究对Altmetrics研究具有重要的学术意义。科学活动主体是科学生产活动的参与者也是科学评价(科学活动的反馈)的价值归宿,同时也是科技成果转化的受益者。最后,普及和推广社交媒体的使用。就目前而言,Altmetrics数据来源、平台和工具所能提供的数据较为不足,并不全面,在统计学意义上的覆盖率不是很理想,由此所遭成的问题不仅包括所获得的数据不具有代表性,以偏概全,且非常容易陷入唯指标论的陷阱。