近30年图情领域ILM理论研究:热点演进、范式归纳与进路展望
2022-09-20徐淋楠南京大学信息管理学院图书馆
徐淋楠,邵 波,b△(南京大学 .信息管理学院 b.图书馆)
自19世纪80年代生命周期的概念被引入信息资源领域以来,基于生命周期理论对各类信息资源进行管理的思路被广泛地应用到图情行业,且已成为对信息资源进行研究的基础理论之一。纵观近30年来学界对ILM理论的研究,多数成果侧重对信息生命周期管理(Information Lifecycle Management,ILM)理论与资源管理工具和资源管理方法的应用结合,而图书馆作为信息资源和信息服务的主要提供者,对ILM理论研究热点的演进、研究方式的变革、研究方向的发展进行梳理与分析可以更好地回应 “数智” 时代下图书馆资源管理的发展要求,进而为新业态下的图书馆研究提供理论支撑。因此,本文拟通过信息计量学的方法对近30年图情领域ILM理论的相关成果进行可视化分析,借此剖析ILM理论热点主题的发展脉络,归纳ILM理论研究范式的发展变化,冀为后续的相关研究提供参考。
1 数据来源及分析方法
1.1 数据来源
本文基于中国知网数据库和Web of Science核心合集进行数据采集,文献发表时间限定为1990年1月1日至2020年12月31日。国内文献部分以SU%='生命周期'OR SU%='ILM'为检索式进行专业检索,限定数据来源为CSSCI数据,限定学科为图书情报与数字图书馆,限定类型为期刊,导入Endnote去重后,共得到有效文献207篇;国外文献部分以((TS=(information OR electronic resource OR digital resource)and TS=(lifecycle*OR Life cycle)) OR TS=ILM) 为检索式进行高级检索,筛选文献类型为Article,限定学科为Information Science library Science,后进行同样的数据清洗工作,共得到354篇有效文献。
1.2 分析方法
本文在信息计量学的基础上,通过研究工具CiteSpace.5.7.R2分别对国内外相关研究成果进行可视化图谱绘制,探究该学科领域近30年的热点主题演变的关键路径及知识转折点,并以此为基础对领域内的研究范式进行系统探讨、梳理归纳,并据此提出未来研究展望。
2 图情领域ILM理论研究的热点演进
基于高频关键词的聚类可以探查领域内热门的研究主题,而基于时间线的关键词聚类则可以展示特定主题的发展脉络。本文借助CiteSpace完成国内外文献内容的Keyword聚类分析(见图1、图2),以及基于聚类结果统计前20位高频关键词(见表1、表2),并据此探究国内外图情领域ILM理论相关热点主题的演变趋势。
2.1 国外图情领域ILM理论研究的热点演变路径
由国外图情领域ILM理论研究时间线图(见图1)可知,国外图情领域基于ILM理论的研究热点聚类分别为:#0 information processing needs(信息处理的需求)、#1 cognitive model(认知模型)、#2 business mode(商业模型)、#3 life cycle management(生命周期管理)、#4 social networks(社交网络)、#5 field study(实地研究)、#6 software development(软件开发)、#7 information management(信息管理)。结合关键词词频统计(见表1)和关键词聚类时间线(见图1),可以进一步从时间维度对聚类出的关键词进行主题归纳和趋势分析。
图1 国外图情领域ILM理论研究时间线图(WOS)
第一阶段(1990-2000)的研究热点主要集中在#0 information processing needs(信息处理的需求)、#3 lifecyclemanagement(生命周期管理)、#6 software development(软件开发)等主题范畴。这一时期的研究成果主要关注基于生命周期的各类信息管理系统的开发设计。由于互联网时代的到来,信息资源呈现指数型增长的趋势,海量的信息资源亟须科学、系统地管理。由此,信息管理系统应运而生,出现了以信息系统开发生命周期(Information System Development Life Cycle,ISDLC)为基础的系统设计方案、基于生命周期的信息系统开发方式比较分析和效益评价等研究。此阶段出现的信息管理系统主要为商业性质,主要在企业中应用。
第二阶段(2000-2005)的研究主要集中在#5 field study(实地研究)、#7 information management(信息管理)等主题范畴。这一时期的研究热点主要是对信息管理系统开发热潮的反思。随着信息管理系统的兴起,大量机构和企业在未满足适配条件的背景下盲目引入信息管理系统,从而导致了系统应用的失败。因此,出现了部分基于失败实践经验的文章,并提出了系统选择的评估框架。
第三阶段(2006-2020)的研究主要集中在#1 cognitive model(认知模型)、#2 business mode(商业模型)等主题范畴。这一时期ILM的应用范围得到了扩展,除了与数字孪生技术结合应用于信息管理系统的开发,也出现于数字保存、数字策展领域,并在图书馆、档案馆、艺术馆的信息资源保存中发挥着重要的作用。
2.2 国内图情领域ILM理论研究的热点演变路径
据图2可知,国内电子资源生命周期管理领域内研究热点聚类包括#0数字图书馆、#1生命周期、#2知识服务、#3高校图书馆、#4电子资源、#5数据生命周期、#6专利分析、#7图书馆、#8图书馆服务,共计9个聚类。结合表2所展示出的前20位高频关键词和基于专业术语探测运算形成的时间线图,可对国内图情领域基于ILM理论的研究成果发展作出如下划分。
表2 国内图情领域ILM理论研究关键词词频统计表 (CNKI)
图2 国内图情领域ILM理论研究时间线图(CNKI)
第一阶段(1990-2002)处于我国对于ILM理论引进和应用的萌芽时期,这一时期仅有少数学者将这一理论引入数据库和信息系统的建设中,研究成果并不密集。
第二阶段(2003-2010)是我国图情领域基于ILM理论成果产出最为高频的时期。这一阶段的研究成果主要以#0数字图书馆、#1生命周期、#3高校图书馆、#4电子资源等主题为重点。伴随着我国数字图书馆这一概念的提出和发展,数字资源如何合理有效地保存成为领域内的研究热点,学界出现了关于数字馆藏成本计算和馆藏策略的探讨。与此同时,电子资源管理系统(ElectronicResourceManagementSystem,ERMS)作为管理电子资源的重要工具逐渐被学界所重视,出现了我国自主基于生命周期理论的ERMS开发设计研究和国外引进ERMS的经验介绍。
第三阶段(2011-2020)ILM理论的应用对象不断细化,出现了由对信息资源本身进行研究逐渐转移至对信息资源及其相关要素研究的趋势。在这一时期内,#2知识服务、#5数据生命周期、#8图书馆服务等主题成为领域内的研究热点。而如何基于生命周期对高校图书馆的科学数据、图书馆用户、图书馆服务、图书馆员进行管理是学界这一时期的研究热点。
整体而言,国外图情领域对ILM理论的应用早于国内,但其主要侧重商业信息管理系统的开发,较为广泛地应用在企业管理领域。国内学者则更为关注信息资源本身,基本以图书馆为核心展开研究。
3 图情领域ILM理论的研究范式归纳
“范式” 这一概念是20世纪70年代美国哲学家库恩在其著作《科学革命的结构》中提出的,用以阐释某一领域内被人们所共同接受、使用并作为交流思想的一套概念体系和研究方法[1]。参考《网络信息生命周期规律研究》中对于信息生命周期研究范式的划分[2],本文将目前学界基于ILM理论进行研究的有关成果划分为:管理范式、存储范式、价值范式等三种范式。
3.1 管理范式
本文认为管理范式下的研究成果主要集中在以下三个方面:整体信息资源视角下的管理、电子资源视角下的管理、基于电子资源管理系统视角下的管理。
(1)整体信息资源视角下的管理。1985年,霍顿在《信息资源管理》中提出了信息生命周期的定义,并将其形态划分为两种[3]。自此,国内外逐步开始了对管理范式下信息生命周期的探索。国内具有一定代表性的研究成果是2006年我国学者创造性提出的信息生命周期管理的层次模型,其将信息生命周期管理从纵向的应用层级划分为存储层、管理层、应用层三个层次,从横向的管理阶段划分为创建、采集、组织、存储、利用、清理六个阶段[4]。在这一视域下,信息资源并没有被细分,仅是针对整体信息资源生命周期管理模型的表述。
(2)电子资源视角下的管理。这一时期将信息资源细化到电子资源这一主体上,前序模型的 “创建” 环节更改为对电子资源的 “发现” ,而 “清理或处置” 环节则表述为对电子资源的 “续订或停订” 。有研究成果根据数字资源特点将其生命周期管理划分为发现、采集、试用、选择、订购、提供检索、管理与维护、更新或终止等八个阶段[5]。陈定权基于图书馆所承担的 “中介” 角色,将图书馆电子资源的管理流程归纳为发现、试用、选择、采访、访问、停订或续订六个阶段[6]。还有研究将科研机构及图书馆视为生长着的有机体,将某一时间点或状态点设定为初始点,让新资源在发现、试用、选择与采购、使用与服务、续订或停订决策阶段不断循环[7]。此后国内在此方面著述较多,但多为对前人所提出模型的沿用。
(3)基于电子资源管理系统视角下的管理。2004年数字图书馆联合会(Digital Library Federation,DLF)制定的电子资源管理计划(Electronic Resource Management Initiative,ERMI) 将电子资源的生命周期划分为4个阶段:产品的考虑与试用,采购(许可协商、技术评估、商务谈判),安装与试用,维护与评估(统计数据获取、故障排除、URL修订)[8],这也成为国内外ERMS开发的主要生命周期管理模型参考。相较于单纯强调对电子资源的管理,这一类别的研究更为重视ILM理论在电子资源管理系统开发中的实用性,并且模型每一环节的内容都被大大丰富,商业采购、维护评估等电子资源的前序环节和后续环节也被纳入了进来。
3.2 存储范式
数字信息资源爆发式的增长在给人类带来便利的同时也带来了巨大的挑战,能够长期有效地存储数字信息资源是人们使用它的前提。为了应对数字化社会环境发展的需求,越来越多的企业将ILM理论引入了数据存储管理领域,应用这一理论对数据资源进行存储管理研究的相关成果大致可依据使用目的划分为两类:一类主要以降低存储成本为目的,另一类则侧重数字资源的长期保存。
(1)在以降低存储成本为目的的研究中,较具代表性的是2004年EMC公司[9]提出的管理模型,它将ILM理论引入数字存储领域,并划分出数据的创建、保护、访问、迁移、归档以及回收(销毁)等6个阶段,在引起研究热潮的同时,也成了之后诸多学者的研究参考。我国学者基于ILM理论的研究成果提出了基于数字资源特点的基本保存原则、基于数字保存项目的延迟期权价值计量模型、借鉴分级存储思想的馆藏资源存储模型、立足前人观点的高校数字图书馆建设等研究成果。
(2)在以长期保存为目的的研究中,不少国家和机构制定了专门的政策以保障数字保存的顺利进行。如,澳大利亚的数字信息长期保存和利用项目 (Preserving Access to Digital Information,PADI)[10]、美国的国家数字信息设施保存计划(NationalDigitalInformation InfrastructurePreservation Program,NDIIPP)[11],英国的电子文献生命周期信息项目 (Life Cycle Information for E-Literature,LIFE)[12]等均是各国在数字资源保存方面的重要实践。我国学者主要是从不同角度提出了数字馆藏控制和长期保存的策略、数字信息资源的规划和体系建设,并从应用层面展开设计。随着数字保存项目发展的不断深入,人们对于数字资源的保存不再只满足于资源的可用性,而是对已保存资源的价值提升提出了更高的要求,数字策展的概念也由此应运而生。英国成立的数字策展中心(Digital Curation Centre,DDC)对数字策展的概念、价值以及如何实现数字策展进行了阐述,并提出了数字策展的生命周期模型[13]。当前,这一模型的应用领域正在不断扩展,不仅在图书馆、档案馆等研究领域被广泛应用,在考古、地理、制造等领域也发挥了独特的作用。相较于国外数字策展的快速发展,我国学界在2011年前后注意到数字策展(Digital Curation)这一概念,但在2014年后国内学界便很少有对这一概念的论述,取而代之的是对数据监管(Data Curation)的研究逐渐成为主流。之后,关于科学数据的生命周期管理和价值的再利用逐渐受到学界关注。如,Michener等将数据生命周期归纳为计划、收集、保证(即质量保证和质量控制)、描述(即元数据)、保存(即数据在存储库中的安全)、发现(即识别可能需要回答问题的数据)、集成(如合并多个数据源)、分析(如数据统计及可视化)8个阶段[14]。张洋等提出的数据生命周期管理模型分为制定数据管理计划、数据收集管理、数据分析与加工管理、数据保存管理、数据共享与利用管理 5 个阶段[15]。
3.3 价值范式
相较于运用ILM理论将信息作为生命体进行探究的前两种研究范式,价值范式则是从信息自身的价值变化和运动规律着手。如果说前两者侧重于定性类型的讨论,后者则注重定量方法的研究。信息价值随时间而衰减的现象一直是信息老化领域的研究重点。20世纪40年代,Gosnell创造性地基于藏书老化问题提出了文献生命周期幂指数模型,并将 “半衰期” 和 “老化率” 作为信息生命周期的测度指标进行考量[16]。1958年物理学家Bernal参考原子物理中半衰期的概念对图书情报领域的旧有概念进行了修正,对 “真实半衰期” 和 “回溯半衰期” 进行了精准定义[17]。其后普莱斯指数、效用因子、年度老化因子等概念的相继提出使得信息老化领域研究发展迅速,并逐渐受到图书馆重视而应用于馆藏计划的制订。随着20世纪90年代数字化浪潮的兴起,经费预算与馆藏空间带来的压力使得图书馆对传统纸质资源的需求逐步下降,数字资源成了信息老化研究领域学者的新目标。不少学者基于数字图书馆的使用情况逐步开展基于价值视角的数字资源生命周期研究,并与存储范式下的相关研究有所交叉重合,随后互联网的发展更是为价值范式下的ILM理论研究赋予了新的内涵。借鉴文献信息生命周期的概念及测度方法对网络信息资源进行应用,这类研究通常以网站或者网页乃至文献的网络引文进行半衰期测度研究。整体而言,无论信息依托于何种载体存在,从价值范式对信息生命周期进行管理的研究都是基于信息的本质规律来完成的,从文献数量来看,这一领域已逐渐进入稳定期。
4 图书情报领域ILM理论研究的进路展望
4.1 研究范式内涵的交融与革新
尽管可将领域内已有成果的研究范式归纳为管理、存储、价值范式三种,但三者之间无法完全分割,尤其对于管理范式和存储范式而言,二者侧重点虽有不同,但均将信息作为生命体来考量,其内涵正随着时代的发展逐步交融。以科学数据生命周期管理为例,尽管科学数据是信息的一种,但科学数据生命周期管理却不能和ILM等同。科学数据的生命周期管理受到研究方法、工具、手段等多种因素影响,无法仅仅依靠信息自身的老化规律进行衡量,因此多数学者不会通过价值范式进行研究。但由于其管理范围不仅包括科学数据本身,还要涵盖科学数据相关的环境、技术甚至成本、制度等多个方面,其本质是依据科研过程来管理数据,所以有不少学者从存储和管理两个范式的角度融合探究。跳出图书情报领域来看,ILM理论研究的范式也在不断地与地理、建筑、制造、金融、环境等学科领域进行跨学科的范式融合,并以此回应不同业态下信息资源的管理需求。在 “新文科” 大趋势的推动下,未来ILM理论的研究范式或会进一步地细化进入 “多元回升” 阶段,甚至出现新的研究范式。
基于研究范式变迁过程的梳理,ILM理论所针对的概念主体经历了从信息到数字信息再到数据乃至科学数据等的转变,几者囊括的概念范围有所重合,但其内涵却基于概念的细微差异而在不断革新。因此,尽管近年来专门针对ILM理论的研究成果已较少出现,但将理论与新技术、新平台、新场景结合的科学成果产出却源源不断,展现出了独特且不会被时代所抛弃的旺盛生命力。
4.2 应用场景的新结合与新发展
基于对图情领域内近30年研究热点的梳理和跟踪,不难发现ILM理论的涉及要素、蔓延边界、应用场景正在不断扩展。
(1)ILM理论与新技术的结合。图书馆实体空间与虚拟空间的深度融合既是搭建图书馆智慧服务体系的关键之一,也是实践落地的难点之一。基于ILM理论所提出的数字孪生技术为图书馆智慧服务的实现提供了新思路与新路径。这也意味着其应用范围由信息管理进一步扩展到图书馆全周期管理,将图书馆从系统到服务的所有元素都视为可综合统筹的有机生命体。显然,这一技术不止可被应用于智慧图书馆,其在智能制造、智慧城市等诸多场景中都能发挥极其重要的作用,而且未来ILM理论所能应用的边界或将无限扩张。
(2)ILM理论与新平台的结合。这一理论在与ERMS及下一代图书馆服务平台的结合上得到了灵活运用。以南京大学图书馆与江苏图星软件共同研发的全国首家下一代图书馆服务平台(NextLibraryServicePlatforms或称NJU Library Service Platforms,NLSP)为例,NLSP与传统ERM在资源管理方面的不同之处在于前者能够对纸电数进行一体化的全资源管理,并在打破旧有业务流程的基础上进行图书馆资源管理流程重组,这对传统的ILM理论提出了不少的挑战。传统的ILM模型通常始于信息流程的 “创建” 而终于信息流程的 “清理” ,而针对电子资源所提出的模型也通常会包括从电子资源的 “发现” 到 “停订或续订” 的决策环节,这都无法涵盖全资源生命周期的所有环节,也就无法满足NLSP背景下资源生命周期管理的要求。尽管ERMI所制定的标准与NLSP的适用性和匹配度有所提高,但仍然无法完全贴合我国图书馆的工作实际。因此,ILM理论模型进一步革新,依托NLSP的实例出现了将其划分为产品考虑与试用、采购、安装与使用、管理、维护与评估等5个环节的观点[18]。随着知识服务需求的增长和知识社会的转型,NLSP未来或将向KSP(Knowledge Service Platform,下一代知识服务平台)发展,ILM理论也将会随之焕发出新的生机。