替代计量学的理论框架研究
2022-08-31余厚强
余厚强
(中山大学信息管理学院,广州 510006)
1 引 言
自2010 年Priem 等[1]发 表Altmetrics:A Manifesto算起,替代计量学研究已经度过了十余年。在值得纪念和反思的十周年到来之时,Altmetric 公司出版了纪念专辑The State of Altmetrics:A Tenth Anniversary Celebration[2]。在该专辑中,多位国际专家从不同的角度审视了替代计量学的发展态势和未来趋势。替代计量学是典型的数据驱动型研究方向,也是开放科学和社交网络环境下科学计量学新的学科增长点,它的发展和最初的设想还有一定差距,发展的主要外在障碍是平台数据开放程度不足,主要内在障碍是替代计量数据和指标本身存在局限性。但是,也取得了令人瞩目的成绩,替代计量学成功地拓展了各界对学术成果及其影响力的认识,推动了科学交流和科技评价的深化发展。Altmetrics 引介到国内以后存在不同的译名,参考之前研究的辨析[3],本文采用替代计量学的译名。
替代计量学的发展离不开两个方面,一个是实业界的应用,另一个是理论上的探索。实业界关心用户价值,有用户需求的内容就有存在的价值。替代计量公司的兴起和繁荣、多样化的用户群体,客观上反映了替代计量数据和服务具有较好的商业价值。以Altmetric 公司为代表的替代计量公司对替代计量学研究提供了大力支持,向学术界开放数据,并且参与组织了学术研讨会。理论上的探索,焦点不在于衡量替代计量数据的商业价值,而是更注重从科学层面上回答:替代计量学解决怎样的学科命题,替代计量数据的产生过程和内在机理如何理解,替代计量指标具备怎样的外在属性和相互关联等。替代计量研究涉及许多不同的数据源,可能存在完全不同的动机、行为和成果类型,因此,想要建立理解它们的统一框架十分困难。尽管如此,在理解替代计量学的本质上,仍然取得了不少进展。
早在20 世纪90 年代,美国著名情报学家Cronin就预言,互联网上的学术交流将带来巨大变化,既体现在学术成果的表现形式上,也体现在学术成果的交流方式上[4]。但是,互联网对学术交流产生影响的速度要远慢于商业活动,所以直到二十年后,Cronin 的预言才得到了较好的印证,“替代计量学”的提出和发展,将Cronin 的思想付诸实践。早期针对替代计量学的含义存在许多不同的解读,NISO(National Information Standards Organization,美国国家信息标准组织) 标准[5]的出台基本平息了“定义”杂乱的局面。根据NISO 标准的定义,替代计量学“是个宽泛的术语,囊括了与学术成果相关的多种数字化指标,这些指标源于学术生态体系乃至社会公众空间中多方利益相关者与学术成果发生的活动与交互”;并进一步说明,“定义中多种不同类型的学术成果和不同形式的交互,将替代计量学区别于传统引文指标,同时又允许在衡量学术影响力时,将传统计量指标纳入作为补充”。但是,NISO标准的定义也存在不足,它是从实践角度出发去定义的,而非从学术角度进行严谨的定义。与此同时,替代计量学的范畴受到替代计量数据库的巨大影响,大多数替代计量研究基于这些数据库所采集的数据开展,而所能采集到的数据只是替代计量学所定义的一部分,数据的局限某种程度上禁锢了思维。在愿景的宏伟与现实的局限之间,需要取得一个平衡点,以使研究既不显得空洞,也不至于短视。
因此,梳理和归纳替代计量学的相关理论研究就显得尤为迫切。相比于精细的实证研究,理论研究的视野更加开阔,能够为替代计量学研究提供富有远见的指导。我们将替代计量学的相关理论研究进行梳理和总结,力图在广阔的社会背景和学科环境下,提出一个解读替代计量学的通用理论框架,并对其未来走向进行展望。
2 替代计量学的理论框架
理论分为不同类型的理论,这里我们主要讨论用于深度解释替代计量学的理论。在对文献分析的基础上,结合我们的思考,将替代计量学的相关理论划分为三层,并构建了替代计量学的理论框架,如图1 所示。
图1 替代计量学的理论框架
第一层次,用于解释替代计量学作为学科方向诞生的理论——科学范式转变理论。该理论认为,科学计量学正在经历一次科研范式的变革,而引起变革的根本原因在于计量对象、数据来源、研究问题均发生了变化。
第二层次,用于解释替代计量数据产生根本过程的理论——科研活动计算机化理论。该理论认为,随着计算机技术和通信技术的发展,科研活动已经逐步走向计算机化,甚至最终将完全实现计算机化,其外在的表现形式是数字化。因此,科研活动的各个环节均在相应的互联网平台上得到记录,产生学术成果的“数字痕迹”,进而形成“科学大数据”。
第三层次,用于解释不同类型替代计量数据内在关系的理论——交互程度递进理论。该理论认为用户与学术成果相关的活动和交互存在交互程度上的差异,交互程度体现在多个方面,如时间、精力、名誉等,交互程度越高,相应替代计量数据的价值越高。
需要指出的是,上述理论框架包含中观层次的理论,而没有涉及更加微观层次的理论,例如,解释用户与学术成果交互行为本身的理论,或者描述学术成果交流路径的理论等。上述三种理论是逐层递进的,组合在一起较好地解释了替代计量学产生的根本原因和基本机制。科学范式转变理论从学科角度、在认知上解释了替代计量学的定位,科研活动计算机化理论从认识论角度解释了替代计量数据的来源和过程,交互程度递进理论在基本面上解释了不同替代计量数据的价值及其相互关系。
3 宏观层次的科学范式转变理论
3.1 科学范式转变理论的内涵
科学范式转变理论是指随着学科内部广为接受的概念框架发生变化,学科将发生研究范式上的根本转变。科学范式转变理论是支撑替代计量学成为独立分支研究方向的根本依据,其基本思想来自著名哲学家库恩。库恩认为,一门学科如果步入成熟范式,那么后续的发展都只是在进一步完善,不会产生根本性的变化;相应地,如果该学科的基本模式发生变化,即可认为该学科正在经历科学范式的转变[6]。按照这种思路,科学范式转变可以进一步归纳为学科领域内部广为接受的框架发生变化,在科学计量学领域,这个广为接受的框架就是基于论文和引文的数据来开展研究和应用[7]。用于解读替代计量学的科学范式转变理论的内涵如图2 所示。
如图2 所示,由于外部环境的影响(具体包括学术交流的革新、政策环境的变化和公众需求的发展),科学计量学在研究对象、数据来源、指标构建和测度目标上都发生了根本性的拓展,因此,科学计量学的研究范式发生转变,发展出替代计量学这个研究分支。需要注意的是,由传统科学计量学发展出替代计量学,主要是在影响力测度方面发生了拓展,而非由替代计量学完全取代科学计量学。
图2 科学范式转变理论的内涵
科学计量学经过几十年的发展,不论是数据来源还是应用方向,都较为稳定,大量的新研究都关注于持续改善经典的引文指标,例如,是否应该用百分位数取代平均引用率[8];或者改善已有研究方法的技术细节,例如,是计算平均比例(rate of av‐erages)还是比例平均(averaging of rates)[9]。
但是,替代计量学的出现带来了某些根本性的改变,表现在“影响力”这个科学计量学的核心术语,其内涵从过去引文所测度的学术影响力,扩展到了不局限于学术的多种不同影响力,包括研究对社会的各个领域如经济、文化、环境等方面的影响[10]。因此,替代计量学是科学计量学经历科学范式转变的结果[11]。不过,替代计量数据相对于传统引文数据更容易受到人为操控的各种不确定因素的影响,所以,有必要对替代计量学研究的社会相关性进行评估,还应该广泛研究这些测量方法与社会学理论、信息计量学理论以及学术传播理论之间的联系[12]。
3.2 科学范式转变过程中经典引文理论的拓展
替代计量学是科学计量学和网络计量学交叉发展出的研究分支,因此,科学计量学的经典引文理论具有启示性。经典引文理论主要有两个,第一个是规范化理论(normative theory),第二个是社会构建理论(social constructivist theory),下面探讨这两种理论在替代计量学语境下的适用性。
1)规范化理论在替代计量学中的适用性
规范化理论的代表人物是著名科学社会学家默顿,核心思想是引文代表着科学共同体内对前人贡献的认可。默顿认为,科学精神包括四种基本规范,即共产性、普适性、无私性和有组织的批判[13]。科学家基本遵循这些规范,能够客观地评价文献,按需设引,每一条引文都构成了科学大厦不可缺少的一部分,是对前人贡献客观公正的致敬。
在替代计量学的情境下,某种程度上规范化理论也是适用的。在替代计量学研究中,引用泛化为“提及”,或者说“提及”也是一种“引用”。不论是推特提及还是新闻提及,本质上都是表明采用了这个学术成果,是对学术成果贡献的一种“认可”。替代计量学中的提及通常不像引文那样有规范的格式,而是以某种可被追踪的方式提及,链接和DOI(digital object identifier)是两种最常见的形式,提到学术成果标题和作者也是常见的形式。
虽然理论上,任意一种学术成果都可以被规范地引用,并且也有研究人员在致力于研发便捷规范引用的工具[14],但是,由于替代计量学研究的对象用户不限于学术界,无法要求所有用户像学术界那样规范地标注引用,对于特定的替代计量数据来源,甚至会出现机器账户[15]。在规范化理论中,所有引用都是出于发展科学的崇高目的,但是替代计量学中的提及,受到国籍、种族、文化等非科学相关因素的影响可能会较大。因此,规范化理论原则上适用于替代计量学中涉及学术用户的部分[16]。
2)社会构建理论在替代计量学中的适用性
与规范化理论不同,社会构建理论强调引用的动机是复杂的,许多非科学相关的因素会影响引用行为[17]。社会构建理论在引证动机中的代表性体现包括说服假设、敷衍式引文、马太效应和负面引用,较好地解释了引证当中歪曲或持有偏见的情况。
在替代计量学的情境下,社会构建理论同样是适用的。第一,在针对推特提及数据的研究中,发现了较高比例的敷衍式提及,例如,仅提供链接而没有任何实质性内容。第二,在针对推特、脸书、新闻、政策文件、新浪微博数据的研究中,均发现了较显著的马太效应。例如,一个学术成果会因为得到权威新闻机构的报道而受到其他各个媒体的竞相报道,甚至在其他社交媒体上也受到追捧和转发[18]。第三,在各个替代计量数据源提及学术成果的动机研究中,发现了较高比例的支撑动机的提及,本质上在一定程度上符合说服假设。
在互联网环境下的科学交流中,多样化的用户主体的提及动机呈现多元性,受到个体认知模式和个人性格特点的影响,因此,社会构建理论在替代计量学中更加具有普适意义。
3.3 科学范式转变与社会发展的互动关系
科学计量学的研究范式发生转变,和社会环境、政策机制存在着密切的互动关系。一方面,各国科技政策的转变促进了科学计量学向替代计量学的拓展;另一方面,替代计量学的发展顺应了社会环境的变化和需求。
我国正在经历一场自上而下的科技管理与科技评价体制改革。从破“四唯”到破“五唯”,再到“八不准”,本质上是在追求多元化的创新评价机制,让潜心治学的研究人员能够得到认可。例如,优秀网文被接受作为一种促进科学传播和社会进步的成果,期刊评价纳入了更多引文指标之外的新指标。这些宏观层面的科技政策,在事实上推动着科学计量学研究范式的转变,将促进替代计量学的蓬勃发展。
事实上,在我国正式启动教育与评价改革之前,科学计量学已经在国际学术界、出版界和基金会的共同推动下,开始了科学范式的转变,替代计量学成功地实现了“影响力”内涵的拓展,使包含“社会影响力”在内的全面影响力深入人心。这使得破“五唯”等举措具有了良好的思想基础,也为这些举措的深入实施提供了理论依据。
当前的核心问题是,替代计量学的发展速度能否很好地回应社会发展的诉求。Tahamtan 等[19]探究了使用不同来源的替代计量数据度量社会影响力的可能性,发现替代计量数据(如社交媒体指标)可能主要反映的是公众对学术成果的兴趣和讨论,而不是它们的社会影响力。所以,在研究评估时不能只简单地计算推文量、提及率,一些其他指标如Mendeley 阅读量等,也可能应用于研究评估,但使用时仍需谨慎。
4 中观层次的科研活动计算机化理论
4.1 科研活动计算机化理论的内涵
信息和通信技术(information and communication technologies,ICT)的发展,极大地促进了社会交流。计算机化运动(computerization movement)是指以计算机系统为核心技术,营造新型社会秩序[20]。某种程度上,替代计量学是科研活动经历计算机化的结果,是计算机化运动在科研上产生作用的实例。解读替代计量学的科研活动计算机化理论的内涵如图3 所示。
图3 科研活动计算机化理论的内涵
科研活动计算机化理论的第一重内涵是,科研活动的各个环节在走向数字化的过程中,产生了前所未有的科学计量大数据。科研活动主要包括六个环节:发现、分析、写作、出版、推广和评价。在计算机化运动的作用下,这六个环节均向数字化和网络化发展,形成了许多新型的工具和平台。在互联网平台上,用户行为可以得到记录,从而形成围绕学术交流的数字化痕迹[21],进而形成科学大数据[22-23],可以用于揭示以往不可见的学术交流[24]。从微观角度来说,替代计量数据记录了学术资料在数字图书馆、参考文献管理器、社交平台和媒体中的传播情况[25],强调社交媒体在引导人们阅读学术文章方面发挥着重要作用。
科研活动计算机化理论的第二重内涵是,基于用户行为的大数据,可以形成集体协作,挖掘群体智慧。Priem 等[1]指出,基于这些互联网上的数据,可以实现众包同行评议、实时推荐和协同文献过滤系统。未来的科学交流将是基于网络的、基于算法的[26],变得更加智能。这与Nielsen[27]的重塑发现理论相契合,该理论的一个中心论点是,在线工具可以并且应该被用于放大集体智慧。集体智慧来源于认知的多样性,而加强合作能够扩大认识的多样性,在线工具和平台为高效合作提供了有力支撑。
值得注意的是,在理论上,计算机化运动能够极大地提高科学交流效率,在实践上,却面临许多挑战,其中最大的挑战是数据开放问题。开放科学的发展,使得科学研究、数据和传播向社会各阶层、业余或专业人士开放,信息和通信技术(ICT)的发展为研究过程的组织以及整个社会创造了巨大的可能性,正是在这种背景下,替代计量学的出现和潜力才值得考虑[28]。然而,大多数平台掌握在商业公司手中,这些公司不愿共享这些数据。例如,Twitter 上的学术交流非常活跃,ResearchGate 已经成为全球最大的学者社交网络,但是这些网站的用户使用数据仅局部公开甚至完全不公开。
4.2 科研活动计算机化的过程
完整的科研活动计算机化过程可以分为三个阶段,第一个阶段是计算机诞生到互联网诞生之前,主要是实现了科学计算的计算机化;第二个阶段是Web 网络诞生到Web 2.0 成熟之前,主要是实现了科学通信的计算机化;第三个阶段是Web 2.0 时代至今,主要是实现了全方位的科学交流数字化。置于这样的视角下,对于科学计量学而言,科研活动计算机化的影响同样经历了三个阶段,第一个阶段是引文数据的电子存储,第二个阶段是引文数据的网络服务,第三个阶段是替代计量数据的涌现和广泛应用。下面围绕科研活动的六个环节具体阐述其计算机化的情况。
1)发现问题阶段的计算机化
在问题发现阶段,计算机化体现为越来越多的学科融入了“计算”或“数字”的元素,如计算社会学、计算传播学、数字人文、数字图书馆等。这种发展意味着传统问题在互联网上的映射以及互联网环境下的新问题出现在各个学科的视野,不可避免地重塑着学科问题发现的途径和描述的形式;并且,研究人员开展信息搜索、浏览和阅读等科研工作,许多都转移到了网络上,形成了可追踪的使用痕迹。例如,根据文章下载时间追溯学者的工作时间表[29],还能够根据下载内容和时间追踪研究趋势,如探究下载时间的动态规律[30]。
2)数据分析阶段的计算机化
在数据分析阶段,计算机化体现为利用互联网平台开展的大规模协同分析,甚至数据分析所用的资源本身就在“云”端。在图书情报学领域,众包数字人文项目通过建立数字协作平台,实现了众多分析人员同时进行标注和分析的工作。在计算机领域,机器学习平台Kaggle 的所有计算都部署在云端的服务器,开发人员可以共享代码和工作流,共同攻关高难的数据问题。
3)成果写作阶段
在成果写作阶段,计算机化体现为在线工具的综合利用和表现载体的丰富多样。研究人员可以运用微博或笔记工具记录灵感,运用博客或帖子整理阶段性进展,运用维基和在线文档实现多人协同写作。与此同时,成果的写作不再局限于文字,图片、动画乃至视频可以整合进来,形成富媒体的报告、文章或案例。
4)成果出版阶段
在成果出版阶段,计算机化体现为出版速度的即时性和出版流程的数字化。计算机化让传统出版概念受到了颠覆,通过预印本、优先在线出版等形式,成果的出版速度得到提升的同时,保障了知识发现的优先权。通过自媒体或某些在线平台,成果可以在完成以后,不经同行评议,没有任何时滞地得到出版;甚至,出现了将整个科研过程实时在线发布的项目,每一次内容更新都可视作一次出版。对于提供出版服务的主体而言,出版的各个环节都实现了数字化,收稿、审议、编排、发表等过程,都留下了可供分析的数据,例如,可用于分析期刊的审稿周期、发表偏好,分析单篇期刊论文被下载、转载和分享的情况。
5)成果推广阶段
在成果推广阶段,计算机化体现为学术社交网络的发展和在线会议的兴起。传统的成果推广主要依赖会议口头报告和出版商的营销,经过计算机化,学者通过在线平台构建学术网络,推广手段包括但不限于建立个人主页、撰写博客帖子、联系在线媒体报道和接受学术社交平台的推荐服务。利用学术社交网络中关注和被关注的双向关系,学术成果能够及时地传递给感兴趣的受众。与此同时,在线多人视频会议技术的发展,使跨区域远程学术会议成为现实。受新冠疫情的影响,在线学术会议更是呈井喷式增长,预计将成为学术交流的新生态。
6)成果评价阶段
在成果评价阶段,计算机化体现为传统的引用泛化为多源网络数据中的“提及”,以及各个科研活动环节中积累了可供计量的网络数据。正如上文所述,“提及”本质上可以理解为一种泛化的引用,是最主要的替代计量数据来源和构建替代计量指标的基础。在成果评价中,这些“提及”为衡量新型的、更广泛的影响力提供了丰富的工具。
4.3 科研活动计算机化的影响
科研活动计算机化的影响是深远的,重塑了整个科学交流的过程、形式和文化,这里我们着重指出与替代计量学相关的三点影响。
1)基于模块化思想的成果类型
传统科学交流环境下,学术论文是最小的交流单元。科研活动计算机化以后,交流单元的粒度可能得到进一步细化。为了实现更加高效的科研活动,计算机化的思想提倡模块化的学术成果类型,鼓励参与者以模块化的形式,做出粒度细小、耦合性好的学术成果,以实现轻松复用、整合和创新。
2)注意力架构的重构与信号机制的泛化
每位学者的注意力是有限的,在科学合作中,最有效的方式是让每位学者的注意力投向其最擅长的部分。注意力架构是个抽象的概念,是指科研合作中形成的注意力结构。利用在线协作工具,可以更加高效地实现注意力分配,通过分数或指标将参与者的注意力引向最适合的地方。
分数或指标根据信号机制计算得到,传统科学计量学分析中,这种信号是引文,引文作为一种概念符号,施引的过程就是将作者特定思想与特定文献联接在一起的过程[31]。当某篇文献或某个学者被反复引用时,体现了该文献或学者的重要性。在替代计量学中,信息机制还表现为社交媒体平台的点赞、转发、收藏等,例如,微博上点赞量高的研究通常会表现为置顶帖子或热搜。研究者、商业机构、新闻媒体等可以借助提及某项权威科研成果呼吁公众关注某个领域、某项研究或某个事件。
3)基于算法的科学交流服务
各种计算机算法的基础是数据,对于研究内容的点赞、收藏、提及、转发等行为,从某种意义上看就是进行数据标注的过程。利用这些数据,能够实现基于算法的科学交流服务,例如,基于推荐算法可以实现科学文献的实时和精准推送,基于挖掘算法可以预测潜在的合作对象。
5 微观层次的交互程度递进理论
5.1 交互程度递进理论的内涵
替代计量数据有多种形式和多种来源,可以反映在线活动的不同方面,或者不同研究成果对不同受众产生的不同程度的影响[32]。众多替代计量学者开始关注用户和科研成果的交互活动,以期从用户交互程度的角度理解替代计量指标的内涵,逐渐形成了交互程度递进理论。交互程度递进理论有以下两个主要内涵。
(1)多样化的替代计量数据来源遵循着交流过程的内在逻辑。用户首先要感知到学术成果的信息,然后才能判断学术成果的相关性,决定是否采用它,最后当用户以某种方式使用学术成果时,学术成果的影响力得到外化。
(2)不同替代计量数据的价值在理论上可以用交互程度来衡量。虽然价值是个抽象的概念,但是在商业领域,价值可以通过价格去衡量,价格围绕价值上下波动,借鉴这种思路,不同替代计量数据的价值在直观感受上也存在差异,可以利用替代计量数据背后蕴含的用户交互程度来衡量。用户交互程度越高而产生的数据,其价值也越高。举例而言,在一个政策文件中引用一个学术成果,其所蕴含的交互程度大概率要高于在推文中随意提及这个学术成果。
5.2 交互程度递进理论的推理过程
交互程度(level of engagement)的概念来自社交媒体分析学(social media analytics),社交媒体中不同品牌和产品的提及,可以根据交互程度进行分组。从可见度到影响力,有一系列不同等级的交互程度,最高等级的交互程度是影响性交互(reaching engagement)。
在替代计量学背景下,被提及的不是品牌或商品,而是学术成果;提及的平台不仅是社交媒体,也包括新闻、政策文件、专利和其他灰色文献;商品从浏览到加入购物车再到最后消费,与学术成果从阅读到收藏再到最后使用,具有相似性。交互程度递进理论在替代计量学中的发展经历了三个阶段。
1)基于交互程度的用户行为划分
在替代计量学理论研究中,Lin 等[33]注意到,从论文的网页浏览到下载再到引用,数字不断减小,从而得到启示,将用户与论文的交互活动类型划分为查看、保存、讨论、分享和引用,并且依次存在兴趣的增加,表明交互程度逐渐加深。这种划分逻辑构成了PLoS ONE论文级别数据的展示依据,该刊现在仍在使用。PlumX 对数据的划分和展示,也从中受到启发,目前PlumX 的产品沿用了类似的划分标准。
2)基于影响力水平的用户数据分组
替代计量学的理念是研究成果在社交媒体上的提及率、关注度或知名度能够一定程度上说明该研究的影响或影响力[34]。与Lin 等[33]的思路略有不同,Holmberg 等[35]直接从影响程度入手,认为依据数据来源和活动类型划分的替代计量指标并不能够准确地描述替代计量数据,相同数据来源的多种指标以及不同数据来源的相同指标可能反映不同程度的影响。进而,Holmberg[32]提出了基于影响程度(level of impact)的分层方法,将特定的替代计量指标依据对用户产生的影响力划分为低、中、高三个水平,低影响力水平指标表示用户查看了该研究但无法确定其对用户产生了影响,如用户点击、浏览、Facebook 分享等;中影响力水平指标反映该研究在一定程度上对用户产生了影响,如提及、下载、书签等;高影响力水平指标通常体现更多的信息,能够了解该研究如何影响用户并确定产生的影响类型,如博客提及、论文引用等。指标影响力水平的增加,反映了用户与研究的交互程度逐渐加深,对应替代计量指标的研究价值逐渐增大。
3)基于影响力产生过程的指标分层
在上述研究的基础上,Haustein 团队和邱均平团队先后独立提出了将交互程度与学术成果应用过程相匹配的思想,从而更深层次地揭示了交互程度上升的底层逻辑[36-37]。
Haustein 等[36]采用NISO 推荐的标准术语,对替代计量数据所代表的主体和行为做了严格的定义,将交互活动划分为获取、评价和应用三种类型,通过螺旋布局的框架形象地展示了随着学术主体与学术成果交互程度的增加,用户行为会从获取层过渡到评价层,再从评价层过渡到应用层。其中,获取层包括对研究对象的访问和表现出研究兴趣的行为,例如,查看学术成果的标题、摘要,或者访问某位学者在ResearchGate 上的用户主页等;评价层包括在各种平台上对研究对象的提及行为,随着学术主体交互程度的增加,可以从社交媒体上简单的提及上升到政策文件中较为正式的引用;应用层是指积极地应用和转化学术成果的重要部分,例如,在博客中讨论一篇科学文献,对数据集或软件的改进,甚至是出于商业目的使用学术成果等。
相较于Haustein 的模型[36],邱均平团队提出的影响力产生模型[37]在对底层内容的思考上更进一步,从学术成果的利用过程出发,其基本原理是转化(隐性层面向显性层面转化,低层向高层转化),描述了显性世界(知名度、影响力、交流)和隐性世界(感知、应用、传播和互动)的平行关系,揭示了学术成果由低层的感知产生潜在影响力后,通过中层的传播,转化为高层的应用,产生真正影响力的过程。据此,提出了金字塔型的替代计量指标分层体系(由下到上依次是传播层、获取层和利用层),对每层中的替代计量指标按用户的交互程度(即传播强度、获取黏性、利用深度)进行排序,程度的深浅将决定下一阶段转化率的高低,并从时间成本、声誉成本和精力成本三个方面对交互程度加以解读。
通过这样的分析,不仅区分了替代计量数据的交互程度,而且考察了背后的原因,将替代计量数据与利用过程建立了映射。
5.3 交互程度递进理论的底层依据
除了来自社交媒体分析学的支撑以外,交互程度递进理论还有深刻的社会学理论作为依据,例如,社会资本理论可用于解释交互行为的动机,注意力经济理论和印象管理理论可用于衡量交互程度,如图4 所示。
图4 交互程度递进理论的底层依据
社会资本理论指出,人是一种社会动物,需要与其他人形成密切联系的集体,通过相互支持和再投入来维系。社会资本与经济资本、文化资本一起构成社会关系的三类资本[38],已经被广泛用于研究信息与通信技术环境下的社会互动(social interac‐tions)。在替代计量学的语境下,包括学者在内的多方主体与学术成果开展交互的根本原因之一,可能是出于积累社会资本的需求。例如,学者在学术型社交媒体平台上的活动,包括上传资源、关注学者、添加评论,可能主要是为了提高自身可见度、构建自身学术网络和积累隐形学术资本。
注意力经济理论(attention economy theory)考虑的是搜寻有用信息所付出的成本和收益[39],在互联网时代,人们有限的注意力是最珍贵的资源之一。在科学界同样如此,科学家已经无法阅读所有相关文献,除了少数科学领域针对科学问题存在唯一解,对于大多数科学问题存在不同路径的研究结果,这些研究需要得到同行的感知,才能获得更多被利用的可能。因此,一方面,学术成果的利益相关者会进行有计划的宣传,例如,在推特或脸书上进行转发;另一方面,科学家会利用某些信号来筛选,例如,优先阅读被Nature新闻报道的成果,或者被知名学者推荐的文章。
印象管理理论(impression management theory)指出,人们在交往时会为了避免尴尬和丢脸而对自身形象进行管理和维护[40],在替代计量学的语境下,这意味着用户行为与其声誉相关联,若用户行为所承担的声誉损失风险更大,则相应的交互程度越高。例如,在博客上公开推荐一篇论文,相比于将一篇论文收藏到自己的Mendeley 账户,其声誉损失风险更高,用户可能会更加慎重。研究表明,脸书平台上的学术分享行为有一半以上是通过私人链接的形式交互的,可能是因为非公开分享的声誉损失风险较低[41]。
6 总结与展望
6.1 替代计量学理论的总结
替代计量学是科学进入第四范式的生动体现,是典型的数据驱动型研究。目前,其理论研究滞后于应用实践,但是没有理论研究支撑的研究方向终将是“无源之水”,所以理论研究迫切需要加强。理论研究的价值主要在于理解事物的存在机理,并最终指导人类的生产实践活动。虽然替代计量学还没有形成自身的独特理论,但是借助成熟的理论,结合对替代计量学的深入观察和思考,学者们还是形成了一定的理论研究,经本文梳理,形成逻辑严密、层次清晰的框架。
本文提出的替代计量学理论框架由三个层次的理论构成。在这个框架中,最宏观的理论是科学范式转变理论,构成了替代计量学作为分支研究方向的依据;相对中观的理论是科研活动计算机化理论,解释了替代计量数据产生的过程和根本原因;最微观的理论是交互程度递进理论,阐述了不同替代计量数据的内在关联。
在科学范式转变理论中,“影响力”这个核心术语内涵的发展,推动了在研究对象、数据来源、指标构建和测度目标方面的根本性转变。两个经典引文理论向替代计量学拓展的过程中,各自具有一定的适用性和局限性,其中社会构建理论的适用面更广。替代计量学的发展顺应了世界范围内科技评价改革的浪潮,知识型社会的发展也客观上促进了科学计量学向替代计量学的科学范式转变。
在科研活动计算机化理论中,科研活动的各个环节都经历了计算机化,形成了科学计量大数据,这些海量的多源数据为智能算法提供了原料,通过集体协作放大了集体智慧。这构成了替代计量学的基本逻辑,无论是“数字痕迹”,还是“众包评议”,本质上都是遵循科研活动计算机理论的路径。科研活动的六个环节,每个环节计算机化的具体过程各具特点。从最终影响来看,模块化学术成果、信息机制的泛化和基于算法的科学交流是最为显著的三种变化。
在交互程度递进理论中,表面看似毫无关联的多样化替代计量数据,其实遵循科学交流过程的内在逻辑,并受到社会理论的支配,体现在交互程度的差异上,可用于在概念上衡量不同数据的价值差异。交互程度递进理论构成了替代计量数据划分类别和替代计量指标区分层次的依据,社交媒体分析学为该理论提供了概念和术语的理论支撑,社会资本理论有助于解释用户与学术成果发生交互的行为动机,注意力经济理论和印象管理理论有助于解释交互程度螺旋上升的根本原因。
上述三种理论结合起来,形成了有机互补的理论框架,对理解替代计量数据、应用替代计量指标具有较好的指导作用。
6.2 替代计量学理论研究的未来方向
(1)深入融合相关学科的理论。替代计量学作为一种应用性相对较强的研究分支,在整个科学大厦中处于较为终端的位置,研究内容存在广泛的学科交叉。第一,从学科属性上来说,替代计量学是网络计量学与科学计量学的交叉,因此,可以借鉴和拓展这两个学科的相关理论。第二,从研究内容上来说,替代计量学的不同数据来源与多个学科存在交叉。例如,新闻替代计量数据与新闻学、科技传播学存在交叉,政策文件替代计量数据与公共政策、公共管理存在交叉,推特替代计量数据与社会学、社交媒体分析学存在交叉。因此,可以借鉴和拓展这些学科的相关理论。
(2)形成替代计量学自身的理论。虽然替代计量学可以借鉴相关学科的理论,但还是呈现出自身的特点,必须逐渐形成属于自身的理论,例如,刘晓娟等[42]从理论角度构建了替代计量学的分析方法体系。未来可以考虑从以下两个方面深入研究。第一,针对替代计量数据形成过程的质性分析。Bornmann[43]呼吁对替代计量数据开展更多的内容分析,关注3W问题,即谁(who)、如何(how)、为什么(why)形成替代计量数据,这是解释替代计量学的基本问题。第二,针对替代计量学内涵和外延的拓展。Costas[44]强调不能将目光局限在学术成果,替代计量学可拓展为科学的社交媒体研究(social media studies of science)。从这些新的视角开展的实证研究,经过积累和沉淀,将会形成替代计量学的独有理论。