APP下载

基于信息生命周期理论的图书馆信息资源管理模式构建

2013-09-12冯明毅湖北文理学院理工学院图书馆湖北襄阳441003

图书馆建设 2013年7期
关键词:存储介质信息资源管理存储设备

冯明毅 (湖北文理学院理工学院图书馆 湖北 襄阳 441003)

随着网络信息技术的快速发展,数字资源数量正在指数级快速增长,图书馆作为信息服务中心也在尽可能地收集并存储齐备的数字化信息资源,以满足广大读者对信息服务的需求。如何科学处理资料量庞大、种类多元、更迭迅速的信息资源的存储、管理与提供应用的问题,已成为当前图书馆业务中面临的新难点之一。本文将借助信息生命周期管理理论,提出图书馆的存储管理架构,建立分级的数字资源存储与服务体系,以不同的信息服务等级和服务方式实施图书馆的信息资源管理与服务工作,缓解图书馆由于信息资源存储与服务能力不足所引起的“信息过载”现象。

1 信息生命周期管理理论

信息资源在其存在的生命周期的不同阶段具有不同的价值,需要采用与之匹配的管理策略和方法。在信息的生命周期中,资源在刚建立的数月内使用频率最高,为组织带来的效益和收入也最高,随着时间的推移,使用频率逐渐降低,资源的价值也随之下降[1]。信息生命周期管理(Information Life-cycle Management,简称ILM)是一种信息管理模型,它根据信息资源所处不同生命阶段时的效用差异采取不同的存储与服务策略,力争在信息生命周期的每个阶段都能以最低的成本获得最大的效益。ESG(Enterprise Strategy Group,企业战略集团)研究显示,在信息生命周期中,信息资源的价值一直都在变化,大部分信息资源在一定时期后就会进入使用频率极低的状态,随着时间的更迭,90%以上的信息价值会逐步衰竭甚至面临淘汰[2]。一般情况下,资料使用频率与资源生命周期之间呈现一定的相关关系(见图1)。

图1 信息使用率与信息生命周期的关系[2]

2 ILM的整体构架

ILM的核心是针对不同数据的不同生命阶段,采用不同的存储策略和存储介质。为了解决日益剧增的数字资源管理与服务问题,数据存储界提出了ILM 的概念,希望通过对信息的价值判断,将最重要的信息、最常被存取的信息资源存储在最昂贵、反应速度最快的存储设备上;次重要的信息资源则存储在稍便宜的硬盘上;使用频次较低的信息资源可以存储在磁带等更便宜的存储媒介上,以符合信息价值与存储成本平衡的原则,并通过有效管理降低不必要的设备扩充投资,提高现有存储设备的使用效能。参考业内学者对信息生命周期的研究总结和实验分析,综合存储界对信息演化特性的分析,可将信息的生命周期划分为资料建立、资料存储、资料撷取、资料归档与资料剔除5个阶段,并根据此5个阶段建立ILM的整体构架(见图2)[3]。

图2 ILM的整体构架

在ILM的整体构架中,信息资源的形成和演进过程依序为:资料建立——资料存储——资料撷取——资料归档——资料剔除,其中在资料归档过程中,需要剔除无用资料,以保证归档资料的质量。在ILM5个阶段的演进过程中,资料需求环节为资料建立提供了方向性指导;资料分类环节为标准化处理资料存储提供了基础和依据;检索规划环节为处理资料撷取提供了框架指引;价值评估环节则为实施科学的资料定期归档提供了保障,在以上4项信息资源的处理环节过程中,实现了最终的ILM闭路循环。ILM的5个阶段的内容详细描述为:

(1)资料建立阶段 此阶段组织会自主收集加工或者直接购买信息服务商的多种信息资源,以满足组织发展的各项需求。由于属于信息源头的建立阶段,其作用直接影响到信息资源体系后续的各个阶段。

(2)资料存储阶段 该阶段需主要解决资料量庞大、种类多元、更迭迅速的海量信息资源的存储、管理与提供应用的问题;根据信息的需求等级和价值分配不同性能的存储介质,建立分级的数字资源存储与服务体系,即为该阶段的核心内容。

(3)资料撷取阶段 ILM的主要目标是确保信息资源可以最大限度地发挥其信息服务的价值。根据信息的需求层次,用户存在3种资料撷取途径:线上、近线和离线。这3种资料撷取途径需要不同类型的存储介质和服务系统完成资料撷取服务。

(4)资料归档阶段 资料归档是信息资源存储策略的重要组成部分,由于部分信息资源进入其生命周期的末期后,资料撷取的频率和速度要求均不是很高, 因而价格低、容量大的存储介质和系统成为资料存储的最佳选择。

(5)资料剔除阶段 许多信息资源在一段时间后就没有了再继续存储的价值,因此组织必须要制定相关的政策,对没有保留或存储必要的信息资源进行销毁或回收,这就需要组织建立明确的信息资源销毁规则,不能轻率地进行销毁。

ILM整体构架为实施科学的信息管理与服务提供了基本导向。在ILM研究中,许多信息服务商提供了多种类型的信息生命周期整体解决方案,但在具体行业应用方面,大量信息资源分级、分类存储的实现依然存在较大技术局限和问题。在图书馆信息资源服务体系中,高效能的网络存储设备长期存储大量使用频率低的数字资源已经成为一种严重的资源浪费现象,同理,高价值的信息资源如果被存储在普通的设备中提供服务也是其管理的失败,理想的状态是达到价值和成本之间的平衡。基于此,笔者以湖北文理学院图书馆数字化信息资源的管理规划为样本,结合实际工作讨论、分析基于ILM的图书馆信息资源管理模式。

3 湖北文理学院图书馆信息资源管理模式构建

3.1 湖北文理学院图书馆信息资源概况及年度数据访问频率统计

湖北文理学院图书馆(以下简称我馆)目前馆藏数量182万余册(件),办证人数约1.2万,每月借阅册数约1.5万册(件),数字资源日访问量(在线浏览与下载量)1.5~4万人次。我馆拥有丰富的数字文献资源且更新迅速,年数字资源新增量为20~30TB,其中自主加工数字资源量为200~500GB,在线存储服务能力为100TB,普通存储空间为400TB。我馆数字资源类型主要包括:数字图书、随书光盘点播系统、数字影音资源、数字典藏、重点学科服务专题资源、地方特色数据库等,其中期刊数据采用网上包库形式提供服务,不占用本地存储空间。为了统计分析我馆网上数字信息资源的访问现状,笔者借助图书馆系统对下载或浏览日志文件的数量进行统计分析得到我馆各类资源的使用状况。统计结果显示:我馆网上数字信息资源的下载或浏览量主要集中在2008年以后入库的信息资源,2005年前入库的信息资源只有极低的访问频率,甚至有相当比例的资源在2005年后一直处于“无人问津”的状态。我馆在2003—2012年对不同年度网上数字信息资源受访比例进行了统计(见表1和图3)。

表1 湖北文理学院图书馆不同年度数字信息资源受访统计(2012年) (单位:%)

图3 湖北文理学院图书馆不同年度的网上数字信息资源受访比率分布

由表1数据和图3曲线显示的我馆网上数字资源受访统计可知,我馆网上数字资源受访比率随着年度的更迭,其受访比率会出现急剧下滑,这说明最新入库的网上资源较受访问者青睐。2005年以前入库资源的受访比率明显较低,尤其是数字图书、随书光盘和数字影音等资源,其受访比率均不足5%,这充分说明信息生命周期理论在我馆网上数字资源中也同样适用。2005年以前的数据资源中,30%的资源内容在最近5年内没有访问记录,即在最近5年内没有读者再使用过该资源项;在所有数据资源中,低使用频率的信息资源量远远超过高使用频率的信息资源量,日益更新的网络资源已成为读者访问的主体内容,而早期的大部分资源已逐步淡出读者视线。因此,管理者应该制定科学的信息资源管理体系,合理处理访问量极低的陈旧数字馆藏,集中高性能网络存储设备存储新数据资源,为提供高质量的网络检索与信息服务奠定基础。

3.2 基于ILM的图书馆信息资源管理模式建构

为了更好地解决新数据资源的网络存储与提供优质、高效的信息服务中存在的问题,我馆决定根据数字资源的访问频率,借助ILM理论科学地规划我馆的存储管理架构,建立分级的数字资源存储与服务体系,以不同的服务等级和服务方式为读者提供服务,力求最大限度地实现图书馆存储设备的效能与信息资源的效用,取得最大化的服务效益。根据ILM的5个阶段,结合图书馆信息服务的要求和信息更迭的过程,笔者参考何俊、杨明(2007)的研究成果[4],构建出基于ILM的图书馆信息资源管理模式(见图4)。

图4 基于ILM的图书馆信息资源管理的运作过程

根据图书馆信息资源管理运作过程可知,图书馆实施信息资源管理主要需要完成以下工作:

(1)建立图书馆信息服务等级评价标准,制定图书馆数字资源综合服务流程。在图书馆实施基于ILM的信息资源服务模式前,首先需要成立图书馆信息资源价值分析小组,完成图书馆资料总量、资料类型、资料年增长率、资料下载使用率、资料使用者的偏好和类型的综合调研分析。然后根据图书馆的信息服务能力和未来规划,制定科学的图书馆信息服务等级,确定图书馆馆藏数字资源的服务方式。例如,①公网即时,指可在图书馆资源信息授权的IP范围内,即时获取使用频率较高、价值较高的各类文献资源;②延时传递,一般为使用频率较低或没有被授权公共使用的资源按读者定制服务需求,采取一对一传递的方式提供使用;③馆内即时,如在线视频等资源仅限制在图书馆内在线点播使用;④归档查询,部分使用率极低或较为久远且已经采取归档处理的信息资源仅提供网络目录检索,详细的全文内容需要进入图书馆获取;⑤馆际待查,部分信息资源由于过于陈旧(没有入库或已经剔除)或过于新近(新出版信息资源,还未进入图书馆馆藏),可采用馆际服务的手段,协助读者完成信息资源获取。以上多种信息资源服务形式的应用,可较好地解决读者多元化的信息服务要求。

(2)整合图书馆现有的服务系统与存储介质,建立分级存储的综合信息服务体系。一般存储架构设计主要分为直连式存储(Direct Attached Storage,简称DAS)、网络附加存储(Network Attached Storage,简称NAS)与存储区域网络( Storage Area Network,简称SAN)等3种存储形式[5]。建立数字资源生命周期存储管理系统,需要先完成存储硬件的整合分类,提升存储设备的利用率。图书馆为解决目前以及未来可能面临的存储设备系统的使用效率问题,依据国际存储网络产业协会(Storage Networking Industry Association,简称SNIA)的整体架构规范,参考图书馆数字资源的特性和服务要求,将图书馆存储设备分为在线(On-line)、近线(Near-line)及离线(Off-line)等3种存储等级[6]。重构的图书馆存储设备架构与各类服务系统的整体构架如图5所示。

在图书馆分级存储架构的体系中,将第一层(Tier1)配置为高性能的Fiber Channel(光纤通道)存储设备;第二层(Tier2)配置SAS(Serial Attached SCSI,串行连接SCSI)、SATA(Serial Advanced Technology Attachment,串行高级技术附件,一种串行硬件驱动器接口)等高性能硬盘;第三层(Tier3)使用低成本的SATA、ISCSI(Internet Small Computer System Interface,Internet小型计算机系统接口)或磁带等存储介质,必要时还可以多分几个层次来构架存储介质[7]。在分级构架存储集群的基础上,合理规划图书馆Web主机群及电子图书室等系统主机群、归档管理系统、备份主机系统等图书馆服务器形成网络体系,完成基于生命周期存储管理的图书馆数字资源存储与管理系统的相关架构。其中,分级存储是建立数字资源生命周期存储管理系统的硬件核心,其存储规范原则上将以时间和使用频率作为分类基础,同时注意信息资源的可用性,即是否能随时取得信息资源,为使用者提供最佳服务。

图5 基于分级存储的图书馆数字信息资源综合管理体系示意图

(3)建立综合的信息资源整合与迁移的管理体系。根据信息所处不同生命阶段的价值差异,将应用价值较高的信息资源存储于性能较高的存储介质中,将价值相对较低的信息资源存储于性能普通的存储介质中,以最低的成本获得最大的应用价值。笔者推荐使用赛门铁克公司推出的Symantec Enterprise Vault解决方案。此归档软件能够自动统计信息资源受访频率,智能识别重复数据,并把重复数据按照逻辑存储模式进行处理,保持数据的唯一性,从而将存储空间和成本节约 60% 以上[8],同时也可以自动地将比较陈旧、不经常被访问的信息从昂贵的存储介质中转移到成本较低的存储介质中,完成数据的集中自动归档,以避免信息资源数量的无限扩大,提高图书馆信息系统的综合服务能力,增强图书馆各类馆藏数据的安全性。

4 总结与展望

本文借助分级存储的管理思想,根据信息资源在不同生命周期阶段所体现的不同的信息价值,选取不同类别的存储介质,为实现信息更迭过程中存储介质服务效用的最大化提供了可能。本文构建的基于分级存储的图书馆数字信息资源综合管理体系示意图,给出了图书馆实施信息资源管理的主要方法和策略,为图书馆实施信息资源科学管理提供了一则参考范式。基于ILM的图书馆信息资源管理体系可以在一定程度上缓解图书馆日益剧增的信息资源在不断更迭的过程中因需要存储介质不断扩容而带来的经济压力,提高图书馆存储介质的服务效能。

目前,ILM 作为全新的信息管理思维正引航数据存储与信息服务业的发展方向,但由于ILM本身就是个难以量化的概念,现有应用系统中的数据如何按照生命周期实施科学的管理始终是一个难点,需要在实践中不断摸索、深化。

[1]白献阳.知识生命周期方法论研究[J].图书馆学研究,2013(1):2-6.

[2]Birkinshaw J,Sheehan T.Managing the Knowledge Life Cycle[J].MIT Sloan Management Review,2002(3):135-143.

[3]索传军,王 涛.国内外信息生命周期管理研究综述[J].图书馆杂志,2008(7):14-20.

[4]何 俊,杨 明.信息生命周期管理的分层模型及实施方法[J].图书情报工作,2007(2):59-61.

[5]裴 雷,望俊成.信息生命周期管理研究进展述评[J].情报杂志,2010(9):7-10,20.

[6]张春颖.信息生命周期管理研究述评[J].情报科学,2012(6):953-958.

[7]窦天芳,张成昱.数字图书馆存储系统建设方案与技术[J].现代图书情报技术,2005(1):67-70.

[8]索传军.试论信息生命周期的概念及研究内容[J].图书情报工作,2010(13):5-9.

猜你喜欢

存储介质信息资源管理存储设备
美军信息资源管理战略概况研究与启示
浅谈信息系统与信息资源管理在H公司电工产品战略上的应用
HDFS数据动态分布设计与实现
浅谈西藏农牧业信息资源管理
一种使用存储介质驱动的方式
浅析铁路视频监控存储设备设计
信息资源管理方案在基层党校中的实践运用
Windows环境下禁用USB存储设备程序设计与实现
医院环境下移动存储介质的信息安全管理
防止USB接口泄密