学术成果的脸书提及量分布特征研究
2021-10-26余厚强曹雪婷
余厚强,章 玮,曹雪婷
(1. 中山大学信息管理学院,广州 510006;2. 南京理工大学经济管理学院,南京 210094)
1 引 言
2020 年2 月,教育部、科技部正式印发的《关于规范高等学校SCI 论文相关指标使用树立正确评价导向的若干意见》①http://www.moe.gov.cn/srcsite/A16/moe_784/202002/t20200223_423334.html中明确指出,“坚决摒弃‘以刊评文’”,不能简单地以SCI 论文相关指标来判断论文的质量。这意味着在完善同行评议制度之外,需要收集反映论文价值的其他指标,来更加全面地评价学术成果。替代计量指标,通常是指基于网络可获取的学术成果交互数据构建的非引文指标,主要数据来源包括社交媒体、新闻平台和灰色文献等,为更加全面地评价学术成果提供支持。
替代计量指标具备多样性,在实际研究中,既可依据数据来源分类,如推特替代计量指标(Twit‐ter altmetrics);也可依据活动类型分类,如阅读替代计量指标(readership altmetrics)。应对这种多样性,既需要开展指标体系的研究,也需要开展每个指标的纵深研究。 在纵深研究方面,推特[1-2]、Mendeley[3-4]、F1000[5-6]等平台的研究较为深入,其他数据来源也积累了一些研究,例如,新闻平台[7]、政策文件[8]、学术博客[9]、课程大纲[10]以及一些开源软件平台[11]。
脸书用户占世界人口的近三分之一,约占世界社交媒体在线用户的二分之一,虽然在中国访问受限,但是其在国际学术交流中的影响力不可忽视。越来越多的科研工作者倾向于在脸书平台分享学术信息,并通过点赞、关注、转发等方式进行学术交流活动。科研工作者可以在脸书上建立专属的学术研究社交网络,成员之间可以实时获取其他人的学术动态,这极大地提高了学术交流效率[12-13]。随着科研实力的稳步增长,中国需要更加开放的全球视野,因此,研究者在关注国内平台的同时,关注国际平台也是十分必要的。并且针对社交媒体平台的研究具有共通性,脸书数据的研究对以后国内平台数据的研究具有参考和启示价值。
脸书帖子中以某种可被追踪的形式提及学术成果,构成一种特定的学术交流形式,称为学术成果的脸书提及量(Facebook mention of scientific prod‐uct),在本文中简称为脸书提及量(Facebook men‐tion)。脸书提及量是最基本的脸书替代计量指标(Facebook altmetrics),在此基础上,可以衍生出其他类型的脸书替代计量指标,如学科标准化的脸书替代计量指标。
在与引文量相关性的测定中,脸书提及量的相关系数较低[14],表明该指标反映的内涵与引文不尽相同。但是脸书提及量的回归曲线与引文量的完全相同,这在统计学上证明了脸书提及与引文受到相似的社会环境和选择机制的影响,呈现出相同的增长机制[15]。就脸书提及量涉及的影响力类型而言,学者通过研究数据生产者在脸书帖子上提及学术成果的动机,来判断该指标的内涵与价值。基于心理学论文的实证研究表明,对论文的讨论与评价占20%,在现实生活实践中应用占17%,自我宣传占6%,数据来源交换占6%,这传递了脸书提及量的社会影响力[16]。基于医学领域数据的实证研究证实了非学术用户占较大比例(占58%)[17],并且链向学术成果的脸书帖子主要起到沟通非学术界专业人士与公众的作用。这些结果表明,脸书能更好地反映普通大众的态度或看法,指示综合学术界和非学术界的关注度情况。
本研究通过测定脸书提及量的分布情况,为理解脸书替代计量指标的性质,开展进一步研究及其应用提供参考。具体而言,基于全量数据,测定了脸书提及量的相对覆盖率、及时性分布,以及论文层次、来源层次和学科层次的数值分布,并通过总结这些分布特征,与其他替代计量指标进行横向对比,揭示脸书提及量这一指标的特有属性,探究其研究价值与应用前景。
2 研究方法
2.1 数据获取
不同的数据平台采集脸书提及数据的方式不同。例如,Altmetric.com 公司采用数据挖掘的方法,从公开脸书帖子中识别学术成果的脸书提及;Plumx Analytics 公司利用脸书API (application pro‐gramming interface) 对学术成果的脸书提及量进行检索和聚合,这就涵盖了那些私有脸书帖子当中的内容[18]。尽管Altmetric.com 公司的脸书提及量数据与真实情况相比存在低估,但是使用公开脸书帖子数据进行研究,规避了侵犯脸书用户隐私的问题,这是该公司将数据采集范围限定在公开脸书帖子的主要原因。由于Altmetric 数据库是当前国内外开展替代计量研究时较为权威的数据库,因此,本文采用Altmetric 数据库。
经过数据抽取,获得从2018 年7 月至2019 年6 月Altmetric 数据库中所有脸书提及数据记录,共42 万余条。每条数据记录包括脸书提及时间、学术成果类型、学术成果标题、学术成果出版时间等26 项元数据,构成本文的数据集。经过初步统计,显示Altmetric.com 公司提供的被脸书提及的学术成果类型包括学术论文(article)、专著(book)、章节(chap‐ter)、临床试验研究记录(clinical trial study record)、数据集(dataset) 和新闻(news) 等共计6 种,其具体分布与相对覆盖率如表1 所示。其中,学术论文(article) 居绝对主导地位,所占比例高达89.9%。
表1 具有脸书提及量的学术成果类型及其比例
2.2 分析角度
为了系统地揭示脸书提及量的分布特征,本研究从以下五个方面展开计量分析。
(1) 脸书提及量的相对覆盖率。相对覆盖率,是指相对于其他类型替代计量数据的覆盖率。脸书提及量的相对覆盖率计算方式为:在特定时间窗口中,具有脸书提及数据的学术成果数量与具有替代计量数据的学术成果总数的比值,反映脸书提及数据的可见度情况,计算方式为
其中,CFacebook代表脸书提及量的相对覆盖率;NF代表学术成果中有脸书提及量的记录数量;NA是具有替代计量指标的学术成果记录数量。如果将分母换成该时间窗口中学术成果总数,那么求得的是绝对覆盖率。
(2) 脸书提及量的及时性分布。及时性反映的是脸书提及数据首次出现的速度,可通过计算学术成果首次脸书提及时间与出版时间的时间差得到。计算方式为
其中,IFacebook代表脸书提及量的及时性,指示学术成果出版多久后会被脸书提及;TM是学术成果获得首次脸书提及的时间;TP是学术成果的出版时间。本研究将及时性在180 天以内视作是及时的,这是相对于引文数据首次出现通常在一年以上而言的,关于及时性的判定并没有明确的标准。本研究认为,若时间差在180 天以内,则该替代计量指标是及时的。
(3) 脸书提及量的成果层次分布。计算每个学术成果所获得的脸书提及量,绘制脸书提及量的区间分布,以及随成果数量的分布曲线,可以揭示脸书提及量的成果层次分布特征。本文使用学术成果而不是学术论文,是由于其还包括专著、新闻、临床试验记录等其他类型的非论文学术成果。
(4) 脸书提及量的来源层次分布。计算每个来源所获得的脸书提及量,绘制脸书提及量的区间分布,并依据布拉德福集中离散定律,识别核心来源。需要说明的是,此处使用来源而不是期刊,是由于其还包括预印本平台、新闻平台等其他类型的非期刊来源。
(5) 脸书提及量的学科层次分布。计算每个学科所获得的脸书提及量,以理解其学科差异。由于Altmetric 数据库从早期的Scopus 学科分类转向FoR(fields of research) 分类,所以本文在统计时也采用FoR 的一级学科和二级学科体系。关于FoR 学科分类的更多介绍可以参见Rousseau 教授的论文[19]。
3 分析结果
3.1 脸书提及的相对覆盖率
根据2018 年7 月至2019 年6 月的Altmetric.com 数据集(共25195509条,涉及学术成果3379536个)测定发现,共有427030条含有脸书提及数据,涉及学术成果272728个。由此可以计算出,在2018年7月至2019年6月,脸书提及量的相对覆盖率CFacebook为8.1%。
3.2 脸书提及的及时性分布
将脸书提及量的及时性按照时间节点-360 天、-180 天、-7 天、-1 天、1 天、7 天、30 天、180 天和360 天进行区间统计,其具体分布如图1 所示。从图1 可以看出,22.9% 的学术成果在1 天内被脸书提及,41.2% 的学术成果在7 天内被脸书提及,57.4% 的学术成果在30 天内被提及。 经过统计可得,180 天内被提及的学术成果高达74%,这表明脸书提及量较为及时。值得注意的是,存在14.3%的学术成果在正式出版之前就在脸书上引发了关注和讨论的情况,这部分学术成果主要由预印本或者优先出版的论文构成。
图1 脸书提及量的及时性分布
本文选取6 个典型案例进行分析,以建立对脸书提及量及时性的初步认识,如表2 所示。表2 中包括及时性最强的3 个案例(#1、#2、#3) 和及时性最弱(#4、#5、#6) 的3 个案例。在案例分析过程中,对每个案例的所有可获取数据进行分析,包括脸书帖子文本、脸书用户数据、学术成果数据。
首先,观察表2 中脸书提及的及时性最好的三条记录#1、#2、#3。#1 号学术成果涉及学科领域为心理学与认知科学,主要研究跨文化是否会影响人们认知行为的一致性。该论文于2019 年11 月正式发表于Journal of Personality and Social Psychology,但在纸质印刷之前于2018 年7 月由PubMed 等平台支 持,以“Epub (Electronic publishing ahead of print)” 类别提前电子出版了,领先于正式出版时间462 天。 提及账户为“Usmle Behavioral Sciences”,该账户针对的群体主要为学习USMLE (United States Medical Licensing Examination,美国执业医师执照考试) 行为科学的用户,出于科普分享或教育的目的提及行为科学相关学术论文。#2 号学术成果所属学科领域为信息科学与计算机科学,主要研究了在深度卷积网络中,基于奖赏调制的尖峰时间相关可塑性的仿生数字识别。该篇论文于2019 年10月正式发表在Pattern Recognition,但在此之前该文于2018 年4 月发表于arXiv 上,并于2018 年7 月被在脸书上被提及,所以领先于正式出版时间456天。提及该学术论文的账号为Deeplearning4j,隶属于软件公司,是为Java 或Java 虚拟机编写的分布式开源深度学习库。该账户通常出于科普或分享的目的提及计算机科学相关前沿学术论文。#3 号学术成果为医学相关,主要通过提出一个临床脑病例,探究剂量计算网格分辨率的选择对计划剂量分布是否会产生影响。该篇论文于2019 年12 月发表于Medi‐cal Dosimetry,但在此之前该文于2018 年8 月提前电子出版,并于2018 年9 月在脸书上首次提及,领先于正式出版时间446 天。 提及账户为Sociedad Venezolana de Física Médica,隶 属于医学公司,关注的学科主要为医学,该账户出于科普分享或宣传推广的目的提及医学相关前沿学术论文。由此可见,在正式出版之前就在脸书上引发了关注和讨论的学术成果主要由预印本或者优先出版的学术论文构成,提及用户主要是机构账号,并且提及这类学术成果的动机主要为科普分享、宣传推广或出于教育目的。
表2 脸书提及量的及时性分布案例
其次,观察表2 中脸书提及的及时性最差的三条记录#4、#5、#6。#4 号学术成果涉及学术领域为生物科学,该成果是由著名瑞士作家Gessner Con‐rad 等于1560 年发表的德语专著,该专著主要描绘了常见动物图标,是科普类读物,被Biodiversity Heritage Library 官方账号于2018 年8 月提及,脸书关注时间滞后458 年。由于2018 年8 月8 日是国际猫日和木刻星期三,该账号出于科普和纪念目的,选择在这一天展示了该书中木刻作品的摘录——一只木刻小猫,同时,分享了这部首次描述所有已知动物的现代动物学作品。#5 号学术成果所属学科为法学,该成果是由圣地亚哥德孔波斯特拉大学于1602 年出版的圣提亚哥大学及其学院的皇家宪法,在脸书上被BSUC 官方账号在2018 年11 月提及,滞后时间长达415 年。 该账号在脸书上写道他们在BUSC 的总图书馆发现了一本1602 年的小册子,并邀请读者阅读这本小册子的全文,并提及其中某些条款与当代普遍认知截然不同。该账号出于科普的目的分享了该学术成果,并就学术成果内容与公众进行探讨与交流。#6 号学术成果是由Gessner Con‐rad 等于1604 年发表的意大利语专著,该专著主要科普了野生动植物,属于生物学领域,于2018 年10 月被Biodiversity Heritage Library 官方账号在脸书提及,滞后时间为412 年。该账号选择在万圣节这天复刻了此书中提及的海蛇,契合节日气氛的同时,向读者分享了这本经典著作。由此可以看出,脸书不仅关注最新发表的学术成果,也会对经典历史文献进行回溯和讨论。关注历史文献用户主要为学术官方机构账号,如图书馆、高等院校等,并且通常在某些特殊节点出于纪念、科普的目的分享这些经典著作。
3.3 脸书提及量的成果层次分布
由于脸书提及量在成果层次存在绝对提及数(number of post,NP) 和独立用户数(number of unique users,NUU) 的差异[20],因此,对这两种数据进行分析比对,统计结果如图2 所示。考虑绝对提及数时,即提及学术成果的所有脸书帖子数量,平均每篇成果被脸书提及的频次为1.72 次,92.7%的成果的脸书提及频次不超过3 次,而仅有1% 的成果有超过10 条脸书提及。 考虑独立用户数时,即去除一篇学术成果被同一用户多次提及的情况,篇均脸书提及数为1.04 次,98.3% 的成果的脸书提及频次不超过3 次,仅有0.06% 的成果有超过10 条脸书提及。这说明绝大部分学术成果被提及频次均较少,仅有极小一部分学术成果在脸书平台上获得了较高的关注度。
图2 脸书提及量学术成果频次分布图
为了进一步研究脸书提及量的分布特征,对脸书提及量按学术成果的数量累积分布进行了统计,其累积曲线如图3 所示。由图3 可知,整体分布较为均匀,绝对提及数量分布曲线的集中程度要高于独立用户数量分布曲线。就绝对提及数量而言,20%的学术成果获得48% 的脸书提及量,从30% 以后呈直线均匀增长,曲线走势先陡后平;就独立用户数量而言,20% 的学术成果获得37% 的脸书提及量,从18% 以后呈直线均匀增长,曲线走势先陡后平。
图3 学术成果层次脸书提及量累积分布图
本文分别选取基于NP 和NUU 的脸书提及频次最高的10 篇学术成果作为案例,对获得高脸书提及量的学术成果特点进行初步探究。
基于NP 的高脸书提及量的学术成果案例如表3所示。排名前10 的学术成果的类型主要是论文,其中还包括一篇新闻与一本专著。所涉及的学科领域有医学、生物学、统计学、地球科学与历史科学,其中,以医学(#1、#5、#9、#10) 和生物学(#2、#3、#7) 居多。
表3 基于NP的高脸书提及量学术成果案例
基于NUU 的高脸书提及量的学术成果案例如表4 所示。表4 中所列举的高脸书提及量的学术成果与表3 存在部分重合,学术成果类型同样几乎为学术论文。表4 中高提及量学术成果涉及的学科类型仅包含医学(#1、#2、#3、#4、#5、#7、#8、#10) 和生物学(#6、#10),并且医学相关的学术成果数量遥遥领先。
基于以上案例分析与解读,我们发现:①脸书提及量高的成果类型大多为学术论文;②医学相关学术成果的脸书提及量较高且占比较大(如表3 中的#1、#5、#9、#10,表4 中的#1、#2、#3、#4、#5、#7、#8、#10),或许由于这类学术成果与生命健康相关,更容易吸引民众的注意,又或是医学领域或医疗健康行业的脸书用户更关注学术成果;③结论新颖的学术论文更容易受到关注,可能由于这类论文更容易激发民众的好奇心,从而引发更多的关注(如表3 中的#2、#5、#7,表4 中的#4、#5、#9);④颠覆固有认知的学术论文的脸书提及量较高的原因,可能是这类论文的结论本身就容易引发更多的讨论(如表3 中的#4,表4 中的#7、#10);⑤发表在如Science、Nature之类的知名期刊上的学术论文也更容易受到关注(如表3 中的#4、#6、#7)。脸书提及这些学术成果的原因大致分为以下两点:第一,对学术成果的研究结果进行科普和宣传;第二,对学术成果的结论进行评论、质疑或肯定。
表4 基于NUU的高脸书提及量的学术成果案例
3.4 脸书提及量的来源层次分布
在本文的数据集中,共有234302 条记录(占比为94.6%) 具有来源数据,共涉及13507 种来源,平均每种来源被脸书提及17 次。脸书提及量的来源层次区间分布如图4 所示。其中,被脸书提及1次的来源占比为32.5%,被脸书提及2 次的来源占比为14.1%,被脸书提及3 次的来源占比为8.6%,被脸书提及10 次及以下的来源占比达到86.5%。由此不难发现,大多数来源被脸书提及频次较少。
图4 学术成果来源被提及频次分布图
为了进一步探究脸书提及量的来源分布规律,识别其中的核心来源,本文对脸书提及学术成果所在来源分布进行布拉德福图像分析,结果如图5 所示。该图像指示脸书提及量来源由核心区、相关区和非相关区三个部分构成,分别呈指数增长、线性增长以及格鲁斯下垂的特性。按照布拉德福定律的公式推算得出,学术成果在三个区域的来源数量关系为1∶6∶89,因此,计算得到脸书提及的核心来源为140 个。
图5 脸书提及学术论文所在来源分布图
本文按来源成果数量大小排序,列举前30 名的来源名称如表5 所示,所有被脸书提及的学术成果中,有18.4% 属于这30 种来源。The Conversation排名第一,被脸书提及11678 次,占比为5%,该来源事实上是一个新闻平台,主要刊载学术界的各类成果及资讯以传播给更广泛的公众,由于该来源具有学术和新闻的双重属性,因此,这一平台发表的文章更容易吸引民众的关注。另外,在排名比较靠前的来源中,除了Nature、Science和Scientific Reports三大知名综合期刊外,还存在PLoS ONE和bioRxiv这样的开放存取期刊与预印本平台,表明开放存取已经得到广泛的认可。同时,在排名前30 位的来源中,共有13 种医学期刊,如British Medical Journal、JAMA、BMJ Open、The Lancet等,所 占 比 例高达43.3%,由此可见,医学相关的来源更容易受到脸书用户的关注。
表5 学术成果脸书提及的核心来源列表(前30名)
3.5 脸书提及量的学科层次分布
在所有记录中,共有316403 条具有学科分类,比例为74.1%。经初步统计,共有22 个一级学科和148 个二级学科。脸书提及量的一级学科分布如图6 所示。由图6 可以看出,医学与健康科学的学术成果被脸书提及的占比最大,高达60.6%;其次为生物科学(13.4%); 心理学和认知科学(4.5%)、化学(2.7%) 的学术成果也受到脸书较多的关注;其他学科的学术成果占比均不超过2.5%。由此可以发现,相比其他学科领域,医学与健康科学遥遥领先,指示医学与健康科学是民众关注的焦点,生物学、心理学同样受到较多的关注,这三个学科被脸书提及的学术成果占总量的78.5%。
图6 脸书提及量的一级学科分布
脸书提及量的二级学科分布共有148 个,本文将占比排名前20 位的学科列出如表6 所示,所有被脸书提及的学术成果中,有78.9% 来源于这20 个学科。 排名第一和第二的学科分别是临床医学(18.9%) 和公共卫生科学(17.7%),位列第三、第四和第五的学科分别是神经科学(5.9%)、心肺医学(4.5%) 和生物化学(4.2%)。这5 个学科相关学术成果占被脸书提及学术成果总量的51.2%。从上述数据不难看出,排名前五的二级学科中,医学相关学科(#1、#2、#3、#4) 占绝对优势;且涉及学术成果数量所占百分比高达46.96%,这一数据再次佐证了公众对于医学相关学术成果的关注程度。
表6 脸书提及量的二级学科分布(前20位)
4 讨 论
推特、新闻等平台的替代计量指标已经积累了部分研究成果。本文通过比较脸书提及量与其他替代计量指标的特征属性,总结出脸书提及量这一指标的优劣与其特有的分布规律。需要指出的是,上述比较所采用的数据是基于前人研究的结果,与本研究所使用数据的时间窗口不同。但是,这些研究的年份相近,所揭示的分布特征是全局性的,具有一定的稳定性,因此,这些数据仍然具有与脸书数据分布特征的可比性。
4.1 与若干典型指标在覆盖率、及时性以及成果层次分布的对比
通过以上研究,可以发现脸书提及量相较推特提及(CTwitter=65.7%)[21]而言,其相对覆盖率比较低,仅为8.1%,但是高于新闻提及(CNews=6.3%)[22]、政策文件提及(CPolicy=1.7%)[23]以及新浪微博提及(CWeibo=0.5%)[24]。为了解释脸书平台受欢迎程度以及学术成果覆盖率之间的差异,En‐khbayar 团队[25]通过收集脸书平台分享、点赞和评论,包括用户的私人时间线,与2015 年至2017 年发表在PLoS ONE上的所有文章数据;并将收集到的数据与Altmetric.com 平台的数据进行比较。结果显示,在平台上分享的论文中,有59% 发生在公众视野之外却没有纳入Altmetric.com 数据库之中,这可能导致脸书成果覆盖率统计结果偏低。
脸书提及的及时率很高,达到74%,优于推特提及(ITwitter=64%)、新闻提及(INews=56%)、政策文件提及(IPolicy=12%) 和新浪微博提及(IWeibo=69%)。其中,存在14% 的学术成果在正式发表之前就在脸书平台上得到关注和讨论,这类学术成果主要由预印本或者优先出版的论文构成,且提及这些论文的用户大多是机构账号或者学术官方账号。这与Fang 等[26]发现的替代计量数据积累模式相一致,大众社交媒体来源的替代计量数据积累的速度最快。
脸书提及量的学术成果层次分布相对比较均匀,没有呈现出非常显著的离散集中特点。以20%的学术成果对应的累积提及量为参照(基于绝对提及数的数据),脸书提及量的累积百分比是48%,高于政策文件提及(43%),远低于引文频次(61%)、新闻提及(74%)、新浪微博提及(72%)和推特提及(76%)。案例分析表明,医学相关以及结论新颖或颠覆大众固有认知的学术成果更容易获得脸书帖子的关注,这与推特提及、新浪微博提及表现出相似性。
4.2 与若干典型指标在来源层次分布的对比
脸书提及量的来源层次分布集中程度较高,识别出140 个核心来源,占来源总数的1%。将不同替代计量指标的排名前15 位核心来源进行对比,如表7 所 示。 从表7 可 以看 出,Nature、Science和PLoS ONE这三种来源是五种替代计量指标共同的核心来源;脸书提及和新闻提及相同的核心来源数量最多,前10 位核心来源中有9 个是相同的。脸书提及与新浪微博提及、政策文件提及的核心来源重合率分别为40% 和30%。
表7 若干典型替代计量指标的核心来源(排名前15位)
为进一步比较各个替代计量指标成果来源的相似性以及差异性,本文分别将新闻指标、推特指标以及政策文件指标与脸书指标的成果来源按照提及量由高至低排序进行重叠比对,其结果如图7~图9所示。脸书提及量与推特指标来源重叠率最高,达到70%;其次为新闻指标,二者的重叠率稳定在65%;脸书提及量与政策文件指标的重叠率随着成果来源提及量的降低而逐渐升高,最后约为50%。考虑到脸书、推特等平台相似的社交属性,其指标核心来源的重叠率可能更高;而政策文件更多地面向于政府部门,这类指标与上述指标类型性质差异较大,因此对于学术成果来源的关注略有别于其他指标;此外,还需考虑新闻的传播特性,即被新闻关注的学术来源更容易出现于公众视野之内,这类来源在社交平台引发讨论的几率相对更大,这可能是新闻指标来源与脸书指标核心来源高重合的原因之一。
图7 脸书提及和新闻提及来源期刊重叠率
图9 脸书提及和政策文件提及来源期刊重叠率
图8 脸书提及和推特提及来源期刊重叠率
在此基础上,通过比对各个指标成果来源的JIF (journal impact factor) 平均百位数分布,识别其来源偏好,如图10 所示,其中百分数表示期刊影响因子的排名。脸书提及量、新闻指标、推特指标与政策文件指标来源的平均JIF 百分数在较高水平上均呈下降趋势,表明这些指标更关注高影响因子来源。其中,降幅最快的是新闻指标来源,其次为脸书来源以及政策文件来源,降幅最慢的为推特来源,这分别对应着对高影响来源的偏好程度,即新闻指标对高影响来源的偏好程度最高,脸书、政策文件次之,推特指标高影响来源的偏好程度最弱。
图10 各替代计量指标所关注的来源期刊质量分布图
4.3 与若干典型指标在学科层次分布的对比
在学科分布层面,由于FoR 学科分类和Scopus学科分类存在差异,所以分开来进行比较。表8 对比了脸书提及量与其他指标的前10 名学科分布。通过观察与比较表8 中罗列的各个指标的学科类别与涉及的成果比例,可发现替代计量指标在学科分布层面具有相似性,且集中程度均处于较高水平,学科类别分布也比较类似。以脸书指标与新闻指标为例,脸书指标排名前10 位的学科中成果覆盖率为92.4%,新闻指标中前10 名学科占据的成果比例为94.6%。两者排名靠前的学科基本类似,排名前9 位的学科完全相同,只是在排位上略有差异,均涵盖医学与健康科学、生物科学、心理学、工程科学以及自然科学等。在其他指标中,医学、生物学等学科均名列前茅。但也存在差异性,各个平台对于学科领域的关注不尽相同,例如,脸书指标对历史学给予了相当关注,而其他指标的高提及学科中并不涉及这一学科领域;政策文件、新浪微博中排名靠前的学科包括经济学,新闻中受到关注较多的学科涵盖信息与计算科学等。
表8 若干典型替代计量指标的学科分布(前10名)
5 结 论
在科技评价日趋多元化的今天,越来越多的学者意识到在社会网络传播学术成果的重要性。脸书作为重要的学术交流媒介之一,是替代计量学研究重要的数据来源之一,脸书提及量的分布反映了脸书平台交流学术成果的基本属性。本文从相对覆盖率、及时性分布、成果层次分布、来源层次分布以及学科层次分布五个层面,对脸书提及量进行统计分析,并对其分布特征及规律进行了总结,可归纳得出以下五点结论。
(1) 基于本研究数据集,脸书提及的相对覆盖率较低,仅为8.1%,低于推特替代计量指标的相对覆盖率(65.7%),但高于政策文件指标(1.7%)、新浪微博指标(0.5%) 与新闻替代计量指标(6.3%)。
(2) 脸书提及量的及时率高达74%,优于政策文件(12%)、新浪微博(69%)、新闻指标(56%)以及推特指标(64%)。脸书主要关注最新发布的论文,甚至存在14.3% 的学术成果在正式出版之前就在脸书上引发了关注和讨论,这类成果主要由预印本和优先出版的论文构成,并且提及这些论文的用户主要是学术官方账号。除此之外,脸书还会对经典的历史文献进行回溯和讨论。
(3) 脸书提及量成果分布相对比较均匀,没有呈现出非常显著的离散集中特点。以独立用户数来计算,以20% 的学术成果累积的提及量为参照,脸书的仅为37%,低于政策文件提及(43%),远低于新闻提及(65%)、推特提及(76%)、新浪微博提及(72%) 以及引文指标(61%)。根据案例分析显示,脸书提及量高的成果类型大多为学术论文,医学相关、结论新颖、颠覆固有认知或者发表在知名期刊上的论文更容易引起公众关注。
(4) 脸书学术成果分布存在来源差异与来源偏好。本文对脸书提及学术成果来源进行了频次统计与布拉德福图像分析,并将其来源分布与新闻指标、推特指标与政策文件指标来源进行重叠率比对。通过计算得到核心来源数量约为140 个。排名前3 位 的The Conversation、 Nature、 Science,共 占比7.69%。大多数来源被脸书提及频次较少,存在65.4% 的来源提及频次不超过5 次,脸书提及10 次以上的来源比例仅为13.5%。脸书学术成果的分布与其他替代计量指标具有相似性。脸书提及量来源与新闻指标来源重叠率高达70%,与推特指标的重叠率为65%,与政策文件的重叠率约为50%,均处于较高水平。脸书成果分布存在来源偏好。脸书用户更关注高影响来源,这与新闻指标、推特指标以及政策文件指标来源分布类似。
(5) 脸书关注的学术成果存在学科差异。脸书提及量的学科分布与新闻、推特、政策文件和新浪微博具有相似性,医学与健康科学以及生物科学在各个指标学科分布中均名列前茅。在二级学科分布中,排名最高的几个学科分别为临床医学、公共卫生科学、神经科学和心肺医学,均是医学相关学科,这与前文观察到的医学相关成果更容易吸引用户关注这一结论相一致。
上述结论表明,脸书提及量相对引文指标而言,可以更加及时地反映学术成果获得关注和传播的情况,并且在学术成果层次没有分布过于集中的局限,能够识别出不同于引文指标的核心学术成果来源。但是,脸书提及量在学科层次的分布很不均衡,对于某些脸书可见度低的学科可能不太适用。值得注意的是,脸书提及量不宜作为学术影响力评价的单一指标,而应视作观察学术成果传播过程和测度学术成果影响力的一个新视角,与其他传统指标和新兴指标共同使用,以获得更加全面的评价结果。同时,脸书提及量的具体使用路径,还需要更多后续的研究去揭示。