数据赋能的国际图书馆学研究特征与前沿展望
2019-11-20秦顺刘昆雄赵维
秦顺 刘昆雄 赵维
摘 要:文章以从Google Dataset获取的93个国际图书馆学研究数据集为样本,对其外部特征进行计量与讨论,并遵循元分析法思想、利用文本挖掘工具对其内容特征进行定量和定性分析。研究发现,数据赋能的国际图书馆学形成“现代图书馆事业管理”“LIS教育与信息素养培育”“研究数据管理与共享”“科学计量与替代计量学”“信息与科学技术应用”“开放科学与开放存取”等六大前沿议题;展现出理论与技术融合创新提供了新基础、研究数据管理与共享上升为新焦点、开放科学交流与合作成为发展新趋势等三个研究发展方向。
关键词:数据赋能;国际图书馆学;谷歌数据集;研究数据;研究前沿
中图分类号:G250 文献标识码:A DOI:10.11968/tsyqb.1003-6938.2019062
Research Characteristics and Forefront Outlooks of International Library Science from the Perspective of Data Empowerment——Evidence from Google Dataset
Abstract Taking 93 international library science research datasets, which obtained from google dataset as samples, this paper quantifies and discusses its external characteristics, then following the idea of meta-analysis and with the help of text mining tools, to analyze its content characteristics with quantitative and qualitative analysis methods. It was found that the international library science from the perspective of data empowerment has formed six frontier topics: modern library management, LIS education and information literacy cultivation, research data management and sharing, scientometrics and altmetrics, information and science technology application, open science and open access. Three directions of research development are presented, including: the integration of theory and technology provides a new basis for innovation, research data management and sharing has become a new central issue, opening scientific exchange and cooperation has become a new trend of development.
Key words data empowerment; international library science; google dataset; research data; research frontier
隨着数据密集型科学发现发展成为第四研究范式,数据驱动型研究将进一步延伸至数据驱动型学术创新,如《图书馆杂志》数据出版管理平台开创了“数据论文、论文+数据支撑、论文+富媒体格式”的研究数据共享与出版模式。在数据科学时代,数据赋能(Data Empowerment,DE)带来了学科范式的嬗变,对于正处于快速发展的图书馆学而言,可期以智慧化数据驱动范式推动面向科研的知识服务创新。与此同时,数据赋能也为识别、跟踪图书馆学研究前沿与发展趋势提供了新视角:研究数据作为科研成果的重要载体之一,蕴含着大量科学研究主题,准确地挖掘、分析隐含在图书馆学背后的研究数据主题及其演化脉络,可以帮助我们明晰学科发展动态与方向。基于此,本文拟以Google Dataset收录的93份相关研究数据集为样本,统计分析其外部特征及内容特征,对国际图书馆学研究前沿和发展趋势作出研判。
1 相关研究简评
本文选用中国知网以及Elsevier Science Direct、EBSCOhost和Google Scholar外文数据库作为检索工具,分别以Title=“图书馆学 AND (热点 OR 前沿)”和“library science AND (hotspot OR frontier)”等作为检索词进行组配检索(检索时间:2019年5月4日),经剔除非学术性文章后共计获得相关中文文献102篇,外文文献25篇。从已有论文成果来看,国内外学者对图书馆学热点与前沿的研究包括以下维度:
(1)样本维度。研究样本主要以文献资料为主,包括期刊论文、学位论文、报告以及国家社科基金项目和课题指南等。如K. Dong等[1]就图书情报学(LIS)领域提出了从科学文献中识别和预测跨学科主题的综合方法;X. Xiao等[2]以10所LIS教育机构的CSSCI、SSCI索引论文作为研究对象;柯平[3]、朱明[4]等分析了国内外图书馆学的核心期刊论文和高被引论文;李维[5]、王君[6]等关注了硕博学位论文的视角;从这些方面探讨图书馆学研究热点和趋势。此外,亦有学者基于趋势报告(如“IFLA Trend Report”)、国家社科基金项目及课题指南、研究生招生方向等对国内外图书馆学学科研究热点与前沿进行剖析[7-9]。
(2)方法维度。总体而言,采用科学的研究方法的目的是为了对研究样本及其内容进行客观解析,以便得出更加精确的结果。文献计量法(如以Hist Cite统计作者、关键词频次)、内容分析法(如通过高被引、热点论文探寻热点主题)是最为常用的研究方法,除此之外亦包括引文分析法、共词聚类分析法、社会网络分析法、可视化分析方法(如使用CiteSpace、VOSviewer等工具绘制知识图谱,直观推演热点与前沿)等研究方法。
(3)内容维度。相关研究主要关注文献资料的外部特征和内容特征:外部特征主要为刊源、载文量、年份、区域、作者、机构、支持基金、影响因子、下载和被引频次等;内容特征则主要涉及关键词词频分析、主题演化分析等,如J. Hodonu-Wusu和Lazarus[10]通过关键词计量分析证明,学术图书馆(Academic Library)、信息素养(Information Literacy)、文献计量学(Bibliometric)、引文分析(Citation Analysis)、开放存取(Open Access)等相结合的主题将是未来图书馆学相关领域的研究趋势。
可以看出,国内外图书情报界学者从未停止对学科热点与前沿的认知规律探索和解析,产出了丰硕的研究成果,指引着学科研究与实践的发展。从研究样本、方法和内容维度而言,前人研究成果较为全面,更不乏立言立说之努力。然而针对最原始的、第一手的研究数据这一具有较高价值和内涵的信息源,仍没有得到广泛认识,基于多源数据的领域前沿识别方法应用亦有待强化。而数据赋予图书馆学发展以“动能”,数据赋能的国际图书馆学研究前沿与发展趋势识别正是本研究的价值和意义所在。
2 数据来源及研究方法
2.1 数据来源
2018年9月,谷歌推出了一个存有海量研究数据的开放数据生态系统(Open Data Ecosystem)及其搜索引擎——Google Dataset Search,它使用开放标准schema.org、W3C DCAT、JSON-LD等进行数据标识,旨在实现研究人员与研究数据的智能连接,实现数据的知识图谱(Google Knowledge Graph)协调与智能排序、检索,从而促进数据重用和科学研究的推陈出新(搜索技术见图1)。Google Dataset收割了Harvard Dataverse、Figshare等众多出版平台的数据集,存储的研究数据较为全面,具有一定的代表性。本文以其为数据源,检索主题为“library science”,检索与统计时间为2019年5月1至2019年5月10日,初次检索得到数据集246个。进一步经内容分析、人工筛选得到实际有效数据集93个,作为研究样本。
2.2 研究方法
前沿研究必须树立问题导向、运用科学的方法和工具、经过科学的研究过程[12]。从数据赋能的角度看,图书馆学前沿研究本质上是一种数据内容解析过程。因此,本文主要采用两种研究方法:计量分析法和元分析法(Meta-Analysis)。首先,对特定的数据集显著属性(如名称和描述、空间和时间覆盖、出处信息等)逐一进行计量统计,并分析数据赋能的国际图书馆学外部特征;其次,揆诸元分析法思想的精要,使用文本挖掘工具深入“数据内容”这一知识单元,进行定量与定性分析,总体遵循元分析法“提出问题→收集资料→筛选资料→提取信息→计算数据→检验分析→结果解释”的流程,归纳研究前沿及发展趋势。
3 数据赋能的国际图书馆学研究外部特征统计与分析
3.1 数据集时间特征分析
对国际图书馆学研究数据集时间分布特征进行分析可知(见图2):(1)数据集最早可追溯至1951年美国国家海洋与大气管理局(National Oceanic and Atmospheric Administration,NOAA)发布的《国外数据图书馆》(Foreign Data Library)[13],此数据提供了NOAA中央图书馆的馆藏资源情况;(2)数据集高度集中分布的時间区间为2007-2019年,这与近10余年来从知识范式到数据范式的数据科学发展时间历程基本吻合;(3)2014年以后,国际图书馆学主题研究数据量呈线性高速增长趋势,一定程度上反映出国际图书馆学“数据管理”发展的蓬勃之势。
3.2 数据集提供者特征分析
统计93个国际图书馆学研究数据集的提供者(机构层面)信息共计涉及54个提供者。依据提供数据量≥2个的标准,本文梳理并绘制了数据集Top 15提供者图(见图3),可以看出:首先,科研教育机构的项目负责人(Principal Investigator,PI)、联系人(Point of Contact,PC)等扮演了重要角色,PI和PC等发布的数据集主要为“Library Holdings for EX”系列,此系列数据集主要为数据管理计划(Data Management Plan,DMP)、科学快速预览报告等图书馆目录数据[14];其次,Harvard Dataverse、Figshare和Zenodo等科学数据开放存取(Open Access,OA)出版平台提供的数据集占有较大比重,这些出版平台尤为重视数据生命周期视角下的科学数据OA出版,数据集内容主要包括OA、LIS研究以及研究数据管理与共享的政策、需求和实践等。
3.3 数据集作者特征分析
对国际图书馆学研究数据集提交作者信息进行分析,共计包含59位参与作者。其中,英国城市大学(City, University of London)的E. Priego和美国高校政治与社会研究联盟(Inter-University Consortium for Political and Social Research ,ICPSR)的R. C. Schonfeld参与度最高,前者研究方向包括科学计量学(Scientometrics)和替代计量学(Altmetrics),研究对象包括图书馆学期刊和推特档案(Twitter Archive)等产生的数据[15-16];后者主要组织了“Ithaka S+R”系列调查,为科研教育机构、图书馆等的战略咨询和决策支持服务提供相关数据[17]。此外,来自ICPSR的C.Wolff、A.M.Pienta、J.Lyle和来自Figshare的K.Holmberg等人的数据集上传频次均为2次以上(高参与度(上传频次≥2)数据集提交作者见表1)。
3.4 数据集覆盖范围特征分析
对列出数据覆盖范围(国家/地区分布)的国际图书馆学研究数据集进行统计分析发现(见图4):(1)北美参与度较高,其中尤以美国和加拿大为主。一是缘于Google Dataset成立于美国,主要为欧美科研人员所使用;二是缘于美国与加拿大在学科体系与工作实践中重视图书馆学、情报学与相关信息学科;(2)以英国为主的欧洲国家次之。这与欧盟国家制定的科学数据管理保障与驱动政策有关,如欧盟《通用数据保护条例》(General Data Protection Regulation,GDPR)、欧盟研究与创新指导委员会《OA 2020计划行动纲要》、FAIR《科学数据管理指导性原则》等。
3.5 数据集资助者特征分析
93个国际图书馆学研究数据集中仅有6项受到资助,资助者涵盖美国、奥地利的6个机构,包括美国莉拉·华莱士(Lila Wallace)读者文摘基金会(3项)、美国卫生与公众服务部(2项)、美国国会图书馆国家数字信息基础设施保存计划(NDIIPP)项目(2项)、美国国家医学图书馆(2项)、美国国立卫生研究院(2项)以及奥地利科学基金会(1项),主要资助推动公共图书馆成年人文化项目发展、社会科学中的数据共享等研究[18-19]。
3.6 数据集许可协议特征分析
遵循创作许可(CC)等知识共享协议提供的豁免与规范,能够保护使用或重新分发数据作者作品的科研人员免受版权侵权的关注,同时保护数据拥有者的权利[20]。统计发现,共计48个数据集明确遵循知识共享许可协議(CC BY 4.0、CC0等)和ICPSR使用条款(Terms of Use for ICPSR)等8项约束型许可协议,有1个数据集表明版权状态处于公共领域,遵循开放型许可协议“公共领域标记1.0”(Publicdomain Mark 1.0)(见图5)。可见,国际图书馆学研究数据集较为重视规范研究数据共享过程中的知识产权保护。
3.7 数据集下载格式特征分析
国际图书馆学研究数据集常见的下载格式较多,共计有24个数据集注明了下载格式(见图6),并提供25种格式在内的数据下载方式,相关数据集可供下载的格式较为丰富。其中,大多数数据集支持pdf、csv、stata、spss和delimited等一系列下载格式,这些下载格式可便于作者进行科学研究过程及结果的二次验证和重用研究数据。另外,部分数据集提供了基于数字对象标识符(Digital Object Identifier,DOI)的唯一永久标识、引用方式,以此推动数据可发现、可访问、可互操作和可重用[21]。
4 数据赋能的国际图书馆学研究前沿与展望
主题词能够从很大程度上反映出学科研究热点与前沿。研究热点部分源于研究前沿,研究前沿发展到一定阶段,往往可能演化、析出为下一段时期的研究热点,如苏福和柯平[22]的研究表明:国际图书情报学研究前沿呈现的特点为运用LIS方法研究跨学科领域的对象。由于Google Dataset并未标识数据集关键词,因此,可利用文本挖掘工具ROST CM6以及Python的Jieba、Wordcloud等模块库对数据说明字段(Illustration)进行高频词统计、清洗和可视化分析,有效地展现了出国际图书馆学研究数据集的主题特征(见图7)。此外,借鉴元分析法的基本思想深入“数据内容”这一知识单元,赋予93个国际图书馆学研究数据集以相关主题并进行定量分析(见表2),最后结合高频词的可视化和主题分类,选定数据赋能的国际图书馆学研究前沿,并对其发展趋势作出展望。
4.1 研究前沿
4.1.1 现代图书馆事业管理
信息资源的有效管理是现代图书馆发展的使命和任务,研究数据集主要围绕馆藏及其目录、数字图书馆、未来图书馆等展开。现阶段,馆藏及其目录管理信息化趋势逐步凸显,如NOAA发布的图书馆目录包括数据管理计划、科学快速预览报告等[14];澳大利亚约翰·科廷总理图书馆(John Curtin Prime Ministerial Library)收录的馆藏资源含科廷家族的个人记录、出版物、口述历史等数据副本[23];美国海军研究实验室(Naval Research Laboratory,NRL)研究图书馆提供全方位的数字图书馆服务,如嵌入型学科服务和信息资源、参考工具的推荐,其中信息资源包括NRL-DC、NRL-Stennis、NRL-Monterey等数据资料,参考工具包括WOS、SCOPUS和INSPEC等[24]。此外,来自ICPSR的K. Maloney等为厘清未来图书馆的发展方向,对图书馆领导进行了组织文化满意度、有效性调研,主题内容包括:(1)图书馆的未来和作用;(2)图书馆的组织文化和管理现状;(3)受访者的当前角色和未来目标[25]。
优化管理一直是现代图书馆事业的核心工作。近年来随着信息化、智慧化趋势愈来愈明显,数字图书馆、未来图书馆等复合形态的图书馆势必成为研究和实践的方向,现代图书馆事业管理的资源、技术、服务、馆员和用户等要素亦向信息化、智慧化方向协同迈进。
4.1.2 LIS教育与信息素养培育
图书情报学教育以培养“跨域横向整合能力+两种素质能力要求”的“∏型人才”为基本目标[26],这一过程中LIS、图书馆学硕士(MLS)教育为主要形式,信息素养培育则为补充方式。在LIS教育方面,研究数据集主要涉及德国图书馆学、情报学与技术科学的书目学(LISTA Bibliographische)研究数据以及E-LIS存储库以OAI 2.0协议方式提供的印本资料(E-prints)及元数据等[27-28];在MLS教育方面,W. Michael统计了美国研究图书馆协会(Association of Research Libraries,ARL)中拥有MLS学位点的机构信息以资学界参考[29]。此外,R. C. Schonfeld的调查数据“Ithaka S+R Library Survey”等详细解析了图书馆在促进信息素养、知识发现服务方面的作用[30]。
LIS教育与信息素养培育是信息时代下图书馆学学科发展的永恒主题,现阶段正在进行着深刻的数字化转型。研究数据集将其归置到数字化情境中,对LIS教育的信息资源、课程和学位项目配置以及图书馆信息素养培育等进行量化分析,藉以探寻提高LIS教育与信息素养培育质量的解决方案,这将成为业界持续努力的方向。
4.1.3 研究数据管理与共享
近年来,研究数据管理与共享已成为国际图书馆学研究的重点。相关研究数据集的热点与前沿整体聚焦如下:(1)机构研究数据政策描述。如Harvard Dataverse参照文章《图书馆数据服务和机构数据政策的现状回顾》(A Review of the Current Landscape of Library Data Services and Institutional Data Policies),对归类为卡内基(Carnegie-classified)“高”和“非常高”研究水平的206所美国大学图书馆数据服务的基本信息、数据政策制定情况及其政策内容一般信息进行了完整描述[31];(2)图书馆研究数据管理(Research Data Management,RDM)需求和实践。如2015年至2018年,加拿大多伦多大学图书馆、女王大学图书馆和英属哥伦比亚大学图书馆(UBC Library)等为促进工程科学、生命科学和人文社会科学等学科的RDM实践,推进了RDM基础设施和服务信息等需求调研[32-33];(3)研究数据开放共享。如美国国家科学基金会(NSF)、国立衛生研究院(NIH)和ICPSR调研回收的1021份有效问卷数据,其内容实证测度了研究数据共享态度、共享方法等[19]。
研究数据的科学性、知识性、智慧性使其具备支撑研究结论和进行科学决策的作用。2014年以来,研究数据管理与共享服务需求与供给研究持续升温,在已有基础上完善多环节、多维度视角下研究数据管理与共享的关键性问题业已变得尤为重要。
4.1.4 科学计量与替代计量学
Altmetrics是文献情报与科学计量学在大数据时代的延伸和发展,同时亦是科学计量与科研评价中的研究热点[34]。采用具备大数据特质的、异于传统科学计量学的Altmetrics指标对图书和期刊、商业和社交网站等数据进行计量评估是国际图书馆学研究数据集关注的重点,如E. Priego以15种图书馆学期刊的196篇文章计量分析图书馆学研究趋势,此外,在2014年举办的ACM网络科学研讨会中,他还收集了1758条标有“#Altmetric14”的推特数据进行计量分析,致力推动Altmetric研究数据开放共享于学术研究和教育用途[15-16];K. Holmberg等采用Altmetric评价指标衡量开放科学(Open Science)的社会影响,基于研究数据指出:Altmetrics和开放科学运动具有共通点,即替代计量学的证据主要来自OA文献资料和研究数据[35]。
从关于科学计量学的研究数据集可以看出,由于传统计量学存在的局限和大数据时代研究数据共享具备的独特优势,传统科学计量与Altmetrics研究虽将一直并行,但前者的重要性逐渐弱化,后者在开放科学背景下的地位逐步提升。
4.1.5 信息与科学技术应用
相较于以往历史时期,网络交互时代的图书馆面临更多的机遇和挑战,专业化的知识内容组织与服务是图书馆的立身之本和发展路径,这有赖于信息与科学技术应用。就我国图情领域而言,本体与语义网、关联数据、知识服务后三者相结合的研究与实践已成为热点。从数据赋能的角度来看,国际图书馆学信息与科学技术应用于知识、数据内容的组织亦有相近之处,主要使用信息和通信技术(ICTs)、都柏林核心元素集(Dublin Core,DC)、资源描述框架(RDF)、可扩展标记语言(XML)、本体(Ontology)以及数字对象标识符(DOI)等。如R. Sieger等[36]采用软件工具“PanXML”,为在德国国家科学技术图书馆(Technische Informationsbibliothek,TIB)的DataCite目录中具备DOI注册号的出版物创建XML文档;L. Pouchard等[37]实现了“SWEET”和“ENVO”两个本体之间的RDF映射。
信息时代,图书馆与信息、科学技术密不可分。同时,第四研究范式下的科学研究需要数字化手段以及研究数据管理计划、存储、分析、标识和引用等技术工具的辅助。聚焦于信息与科学技术应用,可期探寻理论与技术的深度融合创新。
4.1.6 开放科学与开放存取
欧盟地平线2020计划(Horizon 2020 Programme)资助的FOSTER Plus项目指出:开放存取与开放数据是开放科学运动的两支主要力量[38]。开放存取对于促进开放科学、数据科学的发展具有很大的推动力,近年来,国际图书馆学研究数据集亦较为关注信息资源的开放存取,如奥地利科学基金会(Austrian Science Fund,FWF)于2014至2016年连续发布的《开放存取图书OAPEN使用报告》①,其中包括最受欢迎的OA图书、全球及区域OA使用分析等[39],从该研究数据集可以看出:开放存取已然成为全球趋势;O. V. Chernobay等[40]提出了开放获取资源作为科学评价工具的观点,并以研究数据进行实证评价;K. Holmberg等[35]则认为Altmetrics和开放科学运动具有共通点。
交叉融合是学科发展的历史必然,开放科学与开放存取是交叉融合的基本前提。开放数据为全球化的科学交流与合作提供了便利条件,使开放科学与开放存取成为图书馆学发展过程中关键环节之一,引发了持续的学术关注和实践探索。
4.2 研究展望
4.2.1 新基础:理论与技术融合创新
研究数据集作为科学发现最有力的支撑要素,具有为理论研究赋能的作用。研究数据本身具备一定的技术性,其为国际图书馆学理论研究赋能主要表现在:(1)以技术方法提升研究的链接、智能能力,通过RDF、XML等技术为主的本体及语义网技术提供元数据创建、关联数据和知识发现分析,深度揭示与挖掘文献信息资源的知识、数据机理;(2)以技術指标提升研究的分析、评估能力,涉及采用Altmetrics方法展现的研究范式,如Altmetrics指标与开放科学、OA信息资源、社交媒体资源等的关联;此外还涉及文献计量分析(Bibliometric Analysis)、共词分析(Co-Word Analysis)等分析方法应用于理论实证。
一直以来,图书馆在技术应用上存在导向上的不足,忽略了图书馆作为社会赋能器的功能。事实上,在数据爆炸的信息环境形势下,技术无用论、技术本位论皆会导致图书馆的“去中介化”现象进一步加深,善用技术将成为应对图书馆消亡的解决之道:我们认为,以指数级增长的技术和图书馆学理论研究、实践创新深度融合可引发倍乘的图书馆资源效应。未来,图书馆研究与实践将扎根于“历史”“原理”“应用”支撑的学科体系,借理论与技术融合创新完善学科内蕴。
4.2.2 新焦点:研究数据管理与共享
美国大学与研究图书馆协会(Association of College & Research Libraries,ACRL)每年均会发布《学术图书馆的主要趋势》(Top Trends in Academic Libraries),2016年以来“研究数据服务”一直在列,2018年将研究趋势之一定位为“研究数据集获取、文本挖掘和数据科学”[41];美国Ithaka S+R咨询机构也认为“数据管理可能是未来图书馆管理的核心问题”[42]。研究数据管理与共享主要涉及数据生命周期和利益相关者双重视角:(1)数据生命周期视角(Data Life Cycle,DLC),关注研究数据管理政策制定与完善以及研究数据管理计划、采集与存储、共享与出版、访问与重用、转移与销毁、保密与安全、监督与保障机制等业务流程;(2)利益相关者视角(Stakeholder),讨论作为重要利益相关者的“图书馆”如何有效参与全生命周期的研究数据管理与共享,以满足用户和实践需求。
从近年来国际图书馆学研究数据集可以看出,研究数据管理与共享具有从学科难点、热点转向具有发展潜力的研究前沿的趋势。研究数据管理与共享具有提高科研诚信、提升研究质量、促进再利用等诸多意义和价值,受到图书馆学界高度重视。可以预见,伴随着数据科学、开放科学驱动环境的不断完善,加之数据的核心地位、数据赋能的作用不断凸显,这一研究领域或将持续升温,进一步演进为学科研究新焦点。
4.2.3 新趋势:开放科学交流与合作
未来,开放科学交流与合作成为学术交流的主要模式之一是必然趋势。开放科学正在改变研究的产生、获取和利用方式,在其影响下将出现新型的、多样化的科学交流与合作方式[43],国际图书馆学研究亦有相近之处。C. Gail[44]通过研究数据的实证指出,互联网提供的功能和服务能促进科学交流、合作、出版、数据共享和文献资料检索发现。开放化、共享化、合作化的科学环境给图书馆学研究带来了很大的机遇,开放科学交流与合作的研究以OA文献信息资源为基础,延伸至开放存取与科学评价、Altmetrics指标与开放科学运动关联等,展现出大数据、网络化、数字化、智能化的学科交叉交流与合作趋势,逐步迈向科学学与科学计量学4.0的新时代。此外,从某种程度上而言,在科研模式变革环境下,数据管理服务将逐步成为实现开放获取、开放数据、开放科学的重要途径[45]。
由此可以发现,开放存取、替代计量、研究数据管理与共享等将是图书馆学开放科学交流与合作的基础,不断驱动图书馆学理论与技术应用于全球化场景,通过不断践行现代图书馆的基本理念,可期构建更开放、多元、包容的国际图书馆学学科交流与合作体系。
5 结语
本文提出了一种通过数据赋能视角揭示国际图书馆学研究的外部特征、研究前沿和发展趋势的方法,通过文献计量和可视化分析得出以下结论:
(1)从外部特征来看,数据集集中分布于2007-2019年,2014年以后研究量高速增长;科研教育机构的PI、PC以及科学数据开放存取出版平台等是数据集的主要提供者;数据集高参与度作者主要是来自英国城市大学、ICPSR和Figshare的E. Priego、R. C. Schonfeld等;数据集地区分布不均衡,主要集中于欧美的美国、加拿大、英国等;受资助数据集占比较小,资助者包括美国、奥地利的6个机构;学者及机构较为重视通过约束型、开放型许可协议规范研究数据共享与利用;数据集格式较为丰富,便于作者进行科学研究过程及结果的二次验证和重用研究数据。
(2)从研究前沿和发展趋势来看,信息与数据业已成为国际图书馆学研究的核心,近年来持续研究的前沿热点包括图书馆事业管理、LIS教育与信息素养培育、研究数据管理与共享、科学计量与替代计量学、信息与科学技术应用、开放科学与开放存取等;研究发展趋势为:理论与技术融合创新提供了新基础,研究数据管理与共享上升为新焦点,开放科学交流与合作成为发展新趋势和重点。
当然,本研究难免存在局限性。一是通过研究数据集虽可以判定出研究结论,但无法识别出数据作者的具体观点,这给前沿与发展趋势的研判带来了一定的障碍,在研究过程中,笔者试图结合研究数据集的对应研究论文来校正作者核心观点,但因关联论文部分缺失,对前沿与发展趋势的研判可能缺乏更为多元的材料佐证;二是因Google Dataset仅展现内容与结构生成的内生指标,所提供的研究数据集无法展现引文关系,故无法使用外生指标探究本学科研究数据的传播规律。这些将是未来值得我们深入研究和拓展的重点。
参考文献:
[1] Dong K,Xu H,Luo R,et al.An integrated method for interdisciplinary topic identification and prediction: a case study on information science and library science[J].Scientometrics,2018,115(2):849-868.
[2] Xiao X,Zhang F,Li J.Library and information science research in China—a survey based analysis of 10 LIS educational institutes[J].Journal of academic librarianship,2015:41(3):330-340.
[3] 柯平,陈信,宋家梅,等.2013年国外图书馆学研究前沿与热点分析[J].图书情报知识,2014,161(5):17-29.
[4] 朱明,谢梦晴,刘宇.近十年国内图书馆学研究热点述评:基于高被引论文的计量分析[J].高校图书馆工作,2019,39(1):5-10,54.
[5] 李维,文庭孝.我國近10年图书馆学硕士学位论文研究热点分析[J].图书馆学研究,2015(16):2-8,31.
[6] 王君,刘竟,卢章平,等.我国图书馆学硕博士学位论文研究热点可视化分析[J].图书情报工作,2010,54(19):28-31.
[7] 柯平,邹金汇.2014-2015年国外图书馆学研究前沿之一——《IFLA Journal》综述分析[J].图书馆理论与实践,2016(11):1-8.
[8] 郜正亚.我国图书馆学学科研究热点分析——基于2011年国家社科基金项目及课题指南的统计[J].图书馆工作与研究,2012(5):8-12.
[9] 赵超烨,徐芳.图书馆学研究热点问题与走向分析——基于2013研究生招生方向的统计[J].图书馆杂志,2013,32(7):21-26.
[10] Hodonu-wusu J O,Lazarus G N.Major trends in LIS research:a bibliometric analysis[J].Library philosophy & practice,2018(11):1-21.
[11] Matthew B,Natasha N.Building google aataset search and fostering an open data ecosystem[EB/OL].[2019-05-04].https://ai.googleblog.com/2018/09/building-google-dataset-search-and.html.
[12] 柯平.探寻图书馆学前沿的科学路径[J].数字图书馆论坛,2016,149(10):2-8.
[13] NOAA.Foreign data library[EB/OL].[2019-05-04].https://toolbox.google.com/datasetsearch/search?query=library%20science.
[14] NOAA.Library holdings for EX0903:mapping field trial[EB/OL].[2019-05-05].https://toolbox.google.com/datasetsearch/search?query=library%20science.
[15] Ermesto P.196 Papers from 15 library science journals[EB/OL].[2019-05-06].https://toolbox.google.com/datasetsearch/search?query=library%20science.
[16] Ermesto P.Data from:an #altmetrics14 twitter archive[EB/OL].[2019-05-06].https://toolbox.google.com/datasetsearch/search?query=library%20science.
[17] Schonfeld R C.Ithaka S+R | Jisc | RLUK UK survey of academics 2015[EB/OL].[2019-05-06].https://toolbox.google.com/datasetsearch/search?query=library%20science.
[18] ICPSR.Survey of cultural programs for adults in public libraries[EB/OL].[2019-05-06].https://toolbox.google.com/datasetsearch/search?query=library%20science.
[19] Pienta A M.,LYLE J.Data sharing in the social sciences: restricted use[EB/OL].[2019-05-06].https://toolbox.google.com/datasetsearch/search?query=library%20science.
[20] Wikipedia.Creative Commons license[EB/OL].[2019-05-06].https://en.wikipedia.org/wiki/Creative_Commons_license.
[21] Wilkinson M D,Dumontier M,Aalbersberg I J J,et al.The FAIR Guiding Principles for scientific data management and stewardship[EB/OL].[2019-05-06].https://www.nature.com/articles/sdata201618.pdf.
[22] 苏福,柯平.国际图书情报学热点与前沿动态研究(2014—2015年)——27种SSCI核心期刊的全样本分析[J].大学图书馆学报,2017,35(1):11-19,45.
[23] Curtin University.John Curtin Prime Ministerial Library collection[EB/OL].[2019-05-10].https://toolbox.google.com/datasetsearch/search?query=library%20science.
[24] Federal Laboratory Consortium.Ruth H.Hooker Research Library[EB/OL].[2019-05-10].https://toolbox.google.com/datasetsearch/search?query=library%20science.
[25] Maloney K,Antleman K,Arlitsch K,et al.Data from:future leaders' of North American research[EB/OL].[2019-05-10].https://toolbox.google.com/datasetsearch/search?query=library%20science.
[26] 梁春华,刘红霞.∏型情报专业人才能力素质的再探讨[J].情报理论与实践,2019,42(3):12-16.
[27] University Library of Bern.Library and information science & technology abstracts[EB/OL].[2019-05-12].https://toolbox.google.com/datasetsearch/search?query=library%20science.
[28] Roberto D D.e-LiS,e-prints in library & information science[EB/OL].[2019-05-12].https://toolbox.google.com/datasetsearch/search?query=library%20science.
[29] Michael W.Member universities of the association of research[EB/OL].[2019-05-12].https://toolbox.google.com/datasetsearch/search?query=library%20science.
[30] Schonfeld R C,Long M P.Ithaka S+R Library Survey 2013[EB/OL].[2019-05-13].https://toolbox.google.com/datasetsearch/search?query=library%20science.
[31] Harvard Dataverse.Data from:do you have an institutional data policy?[EB/OL].[2019-05-13].https://toolbox.google.com/datasetsearch/search?query=library%20science.
[32] Harvard Dataverse.Research data management needs and practices[EB/OL].[2019-05-13].https://toolbox.google.com/datasetsearch/search?query=library%20science.
[33] Scholars Portal Dataverse.Data from:UBC research data management survey[EB/OL].[2019-05-13].https://toolbox.google.com/datasetsearch/search?query=library%20science.
[34] 王賢文.科学计量大数据及其应用[M].北京:科学出版社,2016:1-228.
[35] Holmberg K,Didegah F,Bowman T,et al.Measuring the societal impact of open science–presentation of a research project[J].Informaatiotutkimus,2015,34(4):1-5.
[36] Rainer S,Hannes G.Data from:PanXML–a tool to create XML files for DOI[EB/OL].[2019-05-14].https://toolbox.google.com/datasetsearch/search?query=library%20science.
[37] Line P,Michael H.RDF mappings between SWEET and ENVO ontologies[EB/OL].[2019-05-14].https://toolbox.google.com/datasetsearch/search?query=library%20science.
[38] FOSTER Plus.Open science[EB/OL].[2019-05-18].https://www.fosteropenscience.eu/foster#taxonomy.
[39] Austrian Science Fund.OAPEN usage report for open access books funded[EB/OL].[2019-05-19].https://www.fosteropenscience.eu/foster#taxonomy.
[40] CHERNOBAY O V,АKSENOVA O Y.Resourses of open access as a tool for formation of scientific rating of scientists[J].Bulletin of dnipropetrovsk national university of railway transport,2013,6(48):168-174.
[41] ACRL Research Planning and Review Committee.2018 top trends in academic Libraries: a review of the trends and issues affecting academic libraries in higher education[J].College & research libraries news,2018,79(6):286-300.
[42] 文庭孝.大數据时代图书馆创新发展思考[J].图书馆,2019(5):15-22,27.
[43] European University Association.Open science[EB/OL].[2019-05-20].https://eua.eu/issues/21:open-science.html.
[44] Gail C.Data from: Science and technology on the Internet[EB/OL].[2019-05-20].https://toolbox.google.com/datasetsearch/search?query=library%20science.
[45] 顾立平.科研模式变革中的数据管理服务:实现开放获取、开放数据、开放科学的途径[J].中国图书馆学报,2018,44(6):43-58.
作者简介:秦顺(1995-),男,湘潭大学公共管理学院硕士研究生;刘昆雄(1966-),男,湘潭大学公共管理学院教授;赵维(1993-),女,湘潭大学公共管理学院硕士研究生。