APP下载

大数据时代背景下科学数据发展对情报学变革影响研究

2022-09-15刘彦乔杨熙若雍石泉李亚丹

甘肃科技纵横 2022年7期
关键词:情报学范式情报

刘彦乔,杨熙若,雍石泉,李亚丹,王 涛

(四川省科学技术信息研究所,四川 成都 610021)

0 引言

近年大数据、云计算引领的信息技术已然改变了全球经济和社会运行模式,触角遍布几乎所有行业的工作场景和人们的日常生活。数据是这场转变的中心,而且未来还会有更多的数据。数据驱动创新将带来巨大的利益,例如通过改进个性化医疗、更新移动传输介质,促进可持续化绿色发展。与此同时,全球共享科学数据和商业数据量不断增加,数据存储和处理方式的技术革新将成为把握时代命脉的关键。

1994年我国正式接入互联网,数据化、信息化革命开始席卷我国各行各业的科学技术发展,科学数据也迎来数量激增期,数据存储规模日益扩大,同样刺激情报学发展变革,对情报学如何存储、处理、整合以及利用数据施加了不小的压力,情报学研究逐渐向信息化过渡。2021 年我国进入“十四五”规划阶段,对科技创新有了更高的要求和期许[1],面临这个关键时期,准确了解前沿科技发展方向和尺度,制定合乎我国国情的发展战略,情报学就成为了我国迈向科技强国的指南针。以情报学深度挖掘科学数据价值,达到科学数据利用效率最大化,正是通向科技强国的一条关键路径[2]。本论述通过梳理科学数据和情报学研究发展历程,利用文献可视化分析了解交叉领域研究现状,情报学领域研究变化情况,以此得出影响情报学变革的主要原因。

1 科学数据和情报学领域发展历程分析

1.1 科学数据发展历程

科学数据指的是在科技活动(实验、观测、探测、调查)中通过其他方式所获取的反应客观世界本质、特征、变化规律等的原始数据,以及根据不同科技活动需要,进行系统加工整理的各类数据集[3]。

在大数据时代背景下,数据传输的速度、影响、潜力都已经与一个国家战略实力高度成正比,科学数据更是成为科技创新的基石和命脉。欧美等国家早已开启深度挖掘科学数据资源余量价值,我国虽然起步较晚,但也逐步在人才培养、政策制定上显现出对科学数据的重视。

科学数据伴随科学研究范式的变化而变化,科学数据目前为止经历了4 个科学研究范式:实验科学范式、理论科学范式、计算科学范式和数据密集型科学范式[4],如图1所示。

图1 科学研究发展范式

信息化时代科学数据存储和传播都更加便利快捷,数据量级井喷式增长,数据所带来的信息资讯更新换代频率也极其迅速,为了避免“知识鸿沟”出现,科技发展早已告别科学家们“单打独斗”的时代,公众科学同样关乎综合国力,全世界各国政府都紧紧抓住技术突破当口,纷纷实施科学数据开放共享。

欧盟长期重视科研数据的开放获取,并走在数据共享的前列,在2016年发布的《开放革新、开放科学、向世界开放——欧洲愿景》中规定三个“开放”作为优先政策,其中开放科学政策旨在让整个欧洲的科研数据达到可寻找、可获取、可互动和可重现的目的[5]。在此之前,欧盟已经提倡建立开放和竞争的“单一数据市场”理念,这里的“单一”指的是无国界、无边界[6],意欲借助数据化、信息化技术整合欧洲,乃至全世界的数据资源。

2001年,“科学数据共享工程”由我国科技部启动,十年时间内完成了从共享机制到国家级数据共享网络的建立[7],2015 年国务院为规范大数据发展,印发《促进大数据发展行动纲要》,2018 年又发布《科学数据管理办法》,其实质都是为顺应大数据时代、信息技术时代蓬勃发展,推动科学数据向大众开放共享,增强我国科技创新能力,提高整体科技水平,得到社会、经济全面发展。

1.2 情报学变革历程

纵观情报学学科发展历程,始终是与时代前沿技术革新和突破发生的重大结点相一致,情报学的研究方法和学科范式不仅持续随着科技发展更新换代,还利用技术特征,消化成为自身学科优势。

情报学以文献学开始,半个多世纪经历了从文献学、情报技术到情报学科的发展历程,其内涵、体系和方法都随着信息化、数字化技术的不断突破、用户需求持续变化及自身分析算法演变而不断完善,社会功能及价值也在不断提高。

从情报学学科发展范式来看,总体大致经历了以下四个阶段:第一阶段:基于information 的事实型情报学发展范式;第二阶段:基于information management的综述型情报学发展范式;第三阶段:基于Intelligence的智慧型情报学发展范式;第四阶段:基于大数据的情报学发展范式[8]。

我国情报学起始是1958年中国科学院以创办中国科学情报大学为标志,在我国率先形成文献与情报融合的学科发展模式。我国围绕专业学科背景构建情报机构体系是从中国科学院科学情报研究所更名为中国科学院科学技术情报研究所开始的[9],这也发生在1958年。情报工作开展的重心也由简单的编译报道、检索服务,向多维度多角度的情报研究、情报决策转变[10]。

以新中国成立之后我国情报研究的路径创新来划分有三个阶段:第一阶段:以传统科技情报为支撑的事实认知范式;第二阶段:以信息网络为依托的技术分析范式;第三阶段:以大系统融合为方向的情报工程范式[11]。

可见传统情报学跟随数字时代发展注入了新活力,发挥其包容的特质,接纳新技术并加以利用,在科技发展浪潮中,情报学在不停地更新自己的领域边界,以免落后或淘汰。

2 科学数据发展对情报学变革影响原因分析

2.1 科学数据与情报学深度融合

本论述利用CiteSpace 软件对“科学数据”和“情报学”主题下的文献进行可视化分析。中文文献选择知网(CNKI)数据库,英文文献选择Web of Science(以下简称为WoS)的核心库。

在知网(CNKI)通过高级检索输入主题“科学数据”和“情报”进行检索,共有404篇文献同时涉及到科学数据与情报学领域,筛选后导出文献369 篇,利用CiteSpace转换为Web of Science文献目录格式得到368篇为可分析的文献。

在WoS 核心库中分别用“Scientific data”和“information science”主题以及“Scientific data”和“Informatica”主题进行检索分别得到171和232篇文献共403篇,利用CiteSpace筛选去重后,得到234篇可分析文献。

2.1.1 国外交叉领域研究现状

英文文献跨度自1979~2022 年为43 年,选择5 年为时间切片,得到共现关键词如图2所示,节点数量为N=764,连线数量为2466,密度为0.0085。以文献标题为基准进行聚类(cluster)分析,发现出现频次最高的文献群组为研究数据(research data)、情报学(information science)和基于服务的框架(service-based framework)。处于网络中心位置的是研究数据(research data),且根据时间切片是2021~2022 年,说明科学数据与情报学交叉领域的研究中,研究数据是当今最频繁最新颖的主题。

图2 交叉领域英文文献共现关键词网络

2.1.2 国内交叉领域研究现状

中文文献的时间跨度是从1988~2022 年,共34年,以4 年为时间切片的共现关键词网络如图3 所示,节点数为430,连线数量1229,密度为0.0133。处于网络中心地带是中文文献讨论热度最高的关键词,中文文献交叉领域的研究以科学数据为主。结合共现关键词网络和高频关键词(表1),情报学和科学数据交叉领域受数据化、信息化技术浪潮影响,研究逐渐与大数据、数据科学等黏性增强,说明密集型数据量激增,在持续影响情报学科研究方向和技术手段。

图3 交叉领域中文文献共现关键词网络

表1 科学数据与情报学交叉研究高频关键词

2.1.3 原因分析

随着搜索引擎、社交信息网络等互联网应用的盛行,数据量呈爆发式增长趋势,科学研究进入了以数据为基础进行科学发现的第四范式时代[12]。科学研究的发展到达第四范式是数据密集型范式,以数据考察为其遵循原则和度量基础,科学数据自然成为其理论构成、实践路径的重中之重[13]。

原来科学数据并没有得到足够重视和利用,研究视角大部分都是基于文献或者图书这类纸质材料的信息载体,流通成本较高,速度较慢。信息技术的广泛应用,使数据的存储、传输、下载、更新等操作变得简单,使用门槛也较低,科学数据的价值逐渐被研究者们发掘,但目前科学数据的利用率与其体量比起来还比较滞后,尚待全面的政策支持和深层次的价值挖掘机制出现。

情报学是以“知识”为中心,以“分析”为方法的学科[14],科学数据具备“知识”的属性,随着信息技术的发展和科学数据共享机制的产生,情报学拥有了充足的事实数据和更加完备的“分析”技术,情报学的变革随之发生。

如上所述,各类数据数量激增使得数据密集型科学范式的产生,而科学数据共享机制的推行,丰富了情报学“知识”的素材和形式。科技创新需要决策科学化来引领前进的脚步,情报学则就发挥了其“耳目、尖兵、参谋”的学科特点,独树一帜的获得了“创新发展情报先行”的有利地位,情报学研究发展也进入基于大数据的研究发展范式。

2.2 大数据引发情报学自身转型压力

2.2.1 情报学领域的研究发展

在WoS 核心数据库搜索主题“情报学(informatics)”+标题“情报学(informatics)”得到8182 篇文献,通过CiteSpace 筛选去重复后,英文文献为3106 篇,跨度从1966至2022年达58年。

(1)情报学与各领域深入融合发展

对英文文献以5年为时间切片,进行共现关键词和领域分析。共现关键词网络节点数为543,连线数量1812,密度为0.0123。从图4中可见,聚类(cluster)字体大小代表文献数量,可见情报学在医学信息学和健康信息学领域研究最广泛,根据时间切片判断最近情报学在材料信息学中应用逐渐增多。结合共现领域网络分析(图5),出现频次最高的几乎都是情报学与其他领域融合产生的交叉学科,涉及情报学自身领域发展的研究较少。计算机科学(computer science)为频次最高的领域,1082 次,其次是医学信息学(medical informatics)和社会学(social science)。

图4 情报学领域英文文献共现关键词分析

图5 情报学领域英文文献共现领域网络

(2)我国情报学领域发展势头强劲

对英文文献进行国家合作网络分析(图6),节点数为149,连线数为652,密度为0.0591。合作网络显示时间从1966~2022 年以5 年为时间切片的变化情况,从国家在情报领域的发文量看,美国位居第一,且是断崖式超越其他国家,中国和英国居第二、第三位(表2),最上沿时间切片可以分辨出中国和英国的发文量增加集中在近十年。

图6 情报学领域英文文献国家合作网络

表2 情报学领域英文文献国家合作网络-国家频次

我国不仅发文量近年增加,经突发性探测(图7)发现,文献被引量在2016~2022年也维持在较高水平,发展势头强势。其他亚洲国家,如日本、印度和巴基斯坦也在近年有文献被引量增加的态势。

图7 情报学领域英文文献国家合作网络突发性探测

2.2.2 原因分析

1992 年9 月15 日,国家科委在召开的全国科技情报工作会议上宣布:经国家科委研究决定,从这次会议开始,将“科技情报”改称为“科技信息”[15]。至此之后,在“情报”(intelligence)与“信息”(information)的适用边界和语义规范上的讨论在情报学科持续至今。但其实两者的内涵和外延都有着较为明确的区分,情报本质上是信息,但是又不等同于信息,比信息拥有更加具有战略意义的延升。

介于“信息”在大众和科技领域的普及程度,“情报”已经出现经常被“信息”一词所替代的情况。目前情报工作受大数据、云计算等信息技术影响热衷于建库(数据库、语料库)、建网(信息系统)与数字化资源建设等,并表现出明显的后现代主义特征,学科的中心内容不断被游移或者稀释[16]。并且由于情报学本身的包容性,衍生了各式各样的交叉学科,虽然情报学在各个行业领域都能发挥作用,但却时常处在附庸位置。

如今我国学者对情报学学科研究增加,发展势头迅猛。借此势头,情报学科可从树立自身学科优势的角度,适应时代发展的同时,主动发挥学科特色,寻找深化研究范式的路径。

3 结论与展望

信息技术正深刻改变我们的日常生活、工作和商业模式以及人们旅行、交流和相互联系的方式。数字通信、社交媒体互动、电子商务和数字企业正在稳步改变我们的世界。当前生成的数据量不断增加,如果能够对这些数据进行汇集、整理和使用,借助这种创造价值的新手段和水平,将会是一场与工业革命一样的根本性变革。

各学科之间的交叉融合,相互影响变得容易。但是随着数字化、信息化等技术浪潮席卷全球经济、科学乃至政治领域,对各行业各学科带来新活力的同时,也伴随着新旧模式变革挑战。科学数据发展将新机遇带给了情报学,情报学从边缘学科逐渐在我国创新决策科学化要求下崭露头角。

情报学在科技领域中不仅要把握国内科技发展态势,还应对全球科技前沿有清晰感知,情报学能够对信息准确分析研判,国际国内政府、各科研机构须共同努力推动科学数据公开共享,无缝访问。科学数据的范围也需探索拓展到从研究提案、筹备、执行和结束全生命周期产生的如软件、科研笔记、失败案例等方方面面,提高科研资源利用率,避免浪费。

开放共享科学数据将促进科技情报能力转变为一国科技竞争实力,情报学科也应当积极引进先进数字化技术和算法,丰富自身理论体系,重视方法实践,做好国家科技战略指南针。

猜你喜欢

情报学范式情报
开放与融合:公安情报学进入情报学方式研究*
情报
情报
情报
以写促读:构建群文阅读教学范式
范式空白:《莫失莫忘》的否定之维
孙惠芬乡土写作批评的六个范式
构建中国特色的情报学
管窥西方“诗辩”发展史的四次范式转换
国内图书馆情报学的发展现状与趋势探索