APP下载

数智时代基于Altmetrics热点论文指标分析的高校图书馆学科数据服务探析

2023-09-28宋玲玲

兰台内外 2023年25期
关键词:影响因素分析特征分析

宋玲玲

摘 要:尝试将Altmetrics的应用指标融入高校图书馆学科数据服务,由新的替代计量视角来正面影响高校智慧图书馆的定位。本研究以2017~2021年近5年的Altmetric Top100 论文数据指标为研究对象,对其发表时间、来源期刊和研究学科主题开展统计检验和比较分析,讨论这些特征的动态演化情况,并对影响Altmetric Top100论文的主要因素,采用描述性统计分析、相关性统计分析以及回归模型分析等方法综合探讨。在研究影响Altmetric Top 100论文的主要因素的基础上,立足于Altmetrics 思维提出数智时代高校图书馆学科数据服务的新途径。

关键词:Altmetrics;特征分析;影响因素分析;学科数据服务

当前,在线科学交流迅猛发展,引文至上的传统学术评价体系已经不能完全满足科研需求,Altmetrics以其广泛的数据源,新颖的研究视角,精细的影响力评价受到学者们的密切关注。本研究以 Altmetric Top100 论文数据指标为样本,研究分析高 Altmetrics 指标论文特征的动态和演化,并力求在现有基础框架上,立足Altmetrics 研究思维,提出数智时代高校图书馆学科数据服务新思路,以期为数智时代高校智慧图书馆学科数据服务以及相关的研究领域提供一定的参考依据。

一、研究设计

1.数据来源及采集

Altmetric.com自2014年开始至2020年期间每年都会公布Altmetric分数(Altmetric Attention Score)排名前100的论文即Altmetric Top100(时间为每年的11月中旬或12月份左右),它们普遍在社交媒体中提及量相对较高,具有典型性和代表性研究价值。其官方网站每年公布的数据信息包含Altmetric Top100论文的Altmetric分数(Altmetric Attention Score)、学科分布(Subjects)、来源期刊(Journal/Collection Title)、出版日期(Publication Date)以及综合计量Altmetric分数时所依据的社会大众对论文的关注度(新闻报道中被提及讨论的次数)(Number of news stories)等等最多共计47项。

本研究数据来源及采集具体步骤为:

自www.altmetric.com官方网站和https://figshare.com网站取得Altmetric TOP100 论文。

(1)根据api.altmetric.com 所提供的 API,选定近5年来的TOP100论文的元数据作为数据样本;由于Altmetric Top 100数据也会上传至 Figshare 网站,考虑到Altmetric.com自2021年没有继续发布提供Altmetric Top 100论文的数据,因此从Figshare 网站获取2021年的Altmetric Top 100论文数据;

(2)根据文献DOI的唯一持久性,由Altmetric TOP100 论文在Altmetric.com官方网站获取的DOI继续在WoS 数据库匹配下载 TOP100 论文相应的文献数据作为共同数据样本。

其中从 api.altmetric.com 共计获取 Altmetrics 近5年的 TOP100 论文的元数据13100条,从WOS 数据库共计获取1500条相关研究数据。

数据收集时间为2022年9月。

2.研究方法及数据处理

首先,就Top100论文发表时间的分布、来源期刊的分布及学科的分布等进行统计分析。其次,运用Stata和SPSS软件对数据指标先后进行描述性统计分析、相关性统计分析、多元线性回归模型分析等,测度Top100 论文各数据指标、论文在 WOS 数据库的文献指标之间的联系,检验分析并探讨影响高 Altmetrics指标论文的学术影响力的因素,并在此基础上提出数智时代高校智慧图书馆学科数据服务的模式及策略。

3.变量设定

本研究选取2017~2021年近5年公布的共计500篇TOP100指标论文和其DOI匹配的WOS文献数据为研究指标数据对象。依据前人相关研究以及在社交媒体中的数据提及量和受关注量,为了保证结果的准确客观,更好地观察指标演变特征,最终确定Stories、Tweets、Facebook、Reddit、Blog、Google+、Mendeley、Videos、Wikipedia、Dimensions典型数据指标为解释标量,它们是该研究中的自变量。

4.回归模型设计

本研究所有变量均满足正态分布条件,所以,本研究选定多元线性回归数学模型进行分析。

根据多元线性回归模型表达公式:

ya=β0+β1x1a+β2x2a+…+βkxka+εa

综合考虑论文指标多方面的影响因素,避免单一指标之间影响的缺陷,本研究集合能够一定程度代表论文影响力的WOS数据库的文献指标和Altmetric分数(以下简称As)指标,并将其他影响因素固定的边际作用考虑在内,进行多元线性回归模型分析,以探测论文指标的真实影响。

二、研究结果与统计分析

本研究共构建四个回归模型,顯示TOP 100指标论文的10个典型数据指标因素对因变量影响分析结果。

模型一,所有自变量对被引频次TC的影响模型数据分析。可以看出,News对应的相关系数为-.403***,Tweets对应的相关系数为-.015***,显而易见,论文在新闻报道中提及讨论的次数与被引频次呈显著负相关关系。同样,论文被推文提及讨论的次数与被引频次也呈显著负相关关系,且都是在1%水平下显著,即论文在新闻报道中提及讨论的次数越多,对被引频次的影响就越低,论文被推文提及讨论的次数越多,对被引频次的影响就越低。此外,Mendeley对被引频次TC的相关系数为-.197**,在5%水平下显著负相关,其余变量对TC并没有产生显著影响。

模型二,所有自变量对论文最近180天的使用次数U1的作用模型数据分析。可以看出,自变量分别与最近180天的使用次数(U1)呈一定的负向相关关系,且均不显著。从这里可以看出,这些自变量分别对最近 180 天的使用次数U1的影响比较小,从侧面可以反映出WOS数据库中的此类文献指标,还不能显著影响到As的大小。

模型三,所有自变量对2013 年至今的使用次数U2的影响模型数据分析。可以看出,News与WOS数据库中文献指标2013 年至今的使用次数U2在1%水平下呈显著负相关关系,相关系数为-.424***。Tweets与WOS数据库中文献指标2013 年至今的使用次数U2在5%水平下呈显著负相关关系,相关系数为-.012**。Mendeley、Reddit、Wikipedia分别与WOS数据库中文献指标2013 年至今的使用次数U2在10%水平下呈显著负相关关系,由数据可以看出News对U2的影响最为明显,其值最高。其他变量对2013 年至今的使用次数U2没有显著影响。

模型四,所有自变量对As的影响模型数据分析。可以看出,As和这10个自变量均呈现出正相关关系,所有自变量均能对As产生影响,且数值越高,对As影响越大,其中影响最大的是News、Blog这两个变量。

三、讨论分析

第一,论文发表时间演变层面。Altmetrics的指标对最新的研究论文成果的响应和反馈速度较引用指标快。社交网络高速发展,高Altmetrics指标论文社交媒体讨论度发展近5年来一直趋于大体上升态势,公众尤其是科研人员对在线网络的交流讨论的依赖性持续走高。

第二,近5年期刊演变特征分布层面。国际综合性期刊《Nature》《Science》论文总数名列前茅,近5年来TOP100论文发表总数最多的是《Nature》,其科技价值和权威影响力可见一斑。排名前三的TOP100论文来源期刊影响因子普遍较高,均为自然科学类权威期刊,且均为Q1 区期刊。Altmetrics 指标论文能够在一定程度上反映学术论文的质量。Altmetrics 不仅能够衡量已发表期刊论文的关注情况,还可以衡量非期刊预印本平台中论文的受关注情况。大部分期刊都可开放获取,这也能够推动人们对论文网络的关注。

第三,研究学科主题特征演变层面。备受大众社交媒体关注的论文学科类别为医学和健康科学类、人类社会研究类、物理科学类以及信息与计算科学类,且高 Altmetrics 指标论文一直以医学与健康科学为主导,国际科技论文在医学领域比较集中,论文的As高,大众媒体对其传播也更加广泛,其社会影响力也会增强,会促进科研人员对该论文的引用,从而提升了论文的学术影响力。

第四,由变量描述性统计分析和相关性分析来看,近5年来TOP100学术论文在社交媒体和大众评议上引起的关注度普遍很高,体现了较强的学术影响力,且彰显了较高的社会影响价值。论文被推文提及讨论的次数能够影响其As,且该次数越多As越高。论文被引频次对于As的增长贡献不大。

第五,由多元线性回归模型结果分析来看,论文在新闻报道中提及讨论的次数、论文被推文提及讨论的次数与被引频次呈显著负相关关系,论文在新闻报道中提及讨论的次数越多,对被引频次的影响就越低。同样,论文被推文提及讨论的次数越多,对被引频次的影响就越低。News、Tweets与U2、Mendeley、Reddit、Wikipedia分别与WOS数据库中文献指标2013 年至今的使用次数U2呈显著负相关关系。所有自变量对As的影响均呈现出正相关关系,即所有自变量均能对As产生影响,且数值越高对As影响越大,其中影响最大的是News、Blog这两个变量。

总之,Altmetrics以其对高水平文献反馈速度快、影响广、泛度高社会关注量大等优点,一定程度上弥补了传统计量指标存在的局限性、时滞性,论文发表的“负的马太效应”等。尝试将Altmetrics的应用指标融入高校图书馆学科数据服务中,由新的替代计量视角来正面影响高校智慧图书馆的定位会有更好的前景。

四、对高校图书馆学科数据服务的深入研究

数智时代,Altmetrics数据评价指标的推广,为高校图书馆学科数据服务带来了新的发展机遇和挑战。高校智慧图书馆建设需要更为丰富的馆藏资源,需要高效过滤学科信息,及时向科研人员推送学术成果,研究本校专家学者的学术影响力等,Altmetrics数据评价工具以其发现和评价的核心功能可以被有效运用到其中。高校图书馆应及时更新智慧学科数据服务理念,考察用户个性化需求,在多渠道宣传引导Altmetrics数据评价指标使用的基础上,鼓励科研人员、高校教师将Altmetrics数据评价指标作为科研项目立项和评估的标准之一,呼吁电子出版商支持Altmetrics数据评价指标的开发和融入。高校图书馆学科数据服务既可以使用Altmetrics数据,也可以将其作为数据来源。高校图书馆应充分抓住此优势,为高校科研评估、双一流高校学科资源建设,提供创新型思路创新服务。

1.学科知识检索层面

区别于传统文献检索方式,引入Altmetrics数据指标之后的知识检索,深度挖掘文本数据,实现个性化检索,不仅可以采用主题检索、关键词检索、全文检索、摘要检索和作者检索等传统检索方式,还可以通过转载量、讨论量、浏览值、收藏量、推荐值和关注值等来提供检索。并且,在此数据指标基础上,来源期刊分布、学科主题分布都比较明显,系统可以进行同行专家评議、开放共享数据和文献收藏保存等,实现相关可视化推送,提高了时效性和精确性。

2.学科资源建设层面

馆藏建设优化,学科资源建设是高校智慧图书馆发展的关键之一。其所选期刊或文献资源是否可以纳入馆藏系统,可以将Altmetrics替代计量数据分析作为主要衡量依据之一。例如,高校图书馆可以考虑将一些开放获取且学术影响力较高的期刊,如PLOS等OA资源纳入学科资源来优化馆藏建设。但是,在这个过程中要注意的是,不同的在线数据库的Altmetrics指标类型不尽相同,数据来源多种多样,如何用这些数据指标来源规范学科,高效选择,客观甄别,这对于高校图书馆运用Altmetrics替代计量指标服务教学科研来说是一个挑战。

3.学科评估层面

在学科评估层面,专家学者对我国高校学科评估的研究主要体现在学科价值取向、国家政策影响、学科评估的影响因素和重点学科评价体系等方面,而且学科评估工作主要是基于CNKI、WOS、SCOUPS 等数据库的引文资源数据来实现的,但除了学术文献资源引文数据外,视频资源、在线讲义、电子书和音频等学术资源并没有提供引文数据,因此,学科评估系统有力引入Altmetric替代计量工具,采用Altmetric数据指标进行在线评估,发挥其开放性和智慧性评估优势,能够为高校学科评估作出贡献。

4.特色数据库建设层面

高校特色数据库是根据高校发展特色来组织、建立、存储和管理的特色馆藏数据库。高校图书馆可以将Altmetric数据指标组织整合进入特色数据库,追踪、评议高校特色学科发展成果的影响力,优化建设模式,提高高水平特色文献反馈速度、影响广泛度和社会关注度等。

参考文献:

[1]曹丽江.基于Altmetrics的学者影响力综合评价研究[D].苏州:苏州大学,2017.

[2]赵蓉英,王 旭.引入Altmetrics指标的学术期刊影响力评价研究——以国际图书情报学期刊为例[J].图书与情报,2018(5):1-10.

[3]杨 柳,陈 贡.Altmetrics视角下科研机构影响力评价指标的相关性研究[J].图书情报工作,2015,59(15):106-114,132.

[4]雷淑义,吕先竞.Altmetrics视角下的学术图书影响力评价研究[J].西南民族大学学报(人文社科版),2017,38(6):225-231.

[5]余厚强,邱均平.替代计量学视角下的在线科学交流新模式[J].图书情报工作,2014,58(15):42-47.

[6]魏思廷.结合替代计量学的数字图书馆知识服务新模式[J].图书情报知识,2015(2):87-92.

[7]刘丽敏,王 晴.融合Altmetrics的图书馆服务增值业态及优化路径[J].现代情报,2016,36(6):95-99.

[8]赵蓉英,王 旭.中美国际OA期刊影响力评价与比较[J].情报资料工作,2019,40(2):5-13.

[9]楊 昭.大数据时代高校图书馆世界一流学科评价服务研究[J].图书与情报,2018(5):81-86.

[10]陈 铭,叶继元.中文Altmetrics数据整合分析平台的建立研究[J].大学图书馆学报,2022,40(04):110-119.

[11]周子番,邱均平,魏开洋.从文献计量学到“五计学”:计量学方法的演化与发展[J].情报杂志,2021,40(10):171-178.

[12]魏思廷.结合替代计量学的数字图书馆知识服务新模式[J].图书情报知识,2015(02):87-92.

[13]葛梦蕊,曾建勋.补充计量学在图书馆资源发现系统中的应用研究[J].图书馆建设,2017(11):41-48.

(作者单位:中国民航大学图书馆)

猜你喜欢

影响因素分析特征分析
泡罩包装挥发性有机物排放特征分析
2012 年南海夏季风特征分析
集群背景下服务业FDI技术溢出效应影响因素分析
风电场工程建设全过程造价影响因素分析
薪酬激励对员工满意度影响问题的研究
水稻生产中的要素投入粗放型及影响因素分析
黑龙江省煤炭物流发展与动态联盟构建的影响因素分析
基于回归分析法的高校科技产出能力影响因素分析与预测研究
基于PowerPC的脉内特征分析算法的工程实现
肾康注射液不良反应特征分析