APP下载

基于信息共享的高校图书馆数字资源存储问题研究

2020-03-04陈敏饶志华熊靖菊

九江职业技术学院学报 2020年3期
关键词:数字信息数字资源

陈敏,饶志华,熊靖菊

(1.江西科技师范大学,江西南昌 330038;2.南昌师范学院,江西南昌 330032)

20世纪50年代以后,计算机技术、网络技术、高密存贮技术逐步引领人类社会进入信息时代,知识信息成为社会发展的重要资源,数字资源成为知识创作、传播和利用的一种常规形态。信息资源的价值主要是利用信息的可复制性来进行共享。按照信息科学理论,信息的交换是为了共享,是为了提高信息资源的利用率,从而节约社会成本。

2000年12月,美国国会拨款1亿美元,启动国家数字信息基础设施和保护计划(National Digital Information Infrastructure and Preservation Program),用于收集和存储重要的数字资源。〔1〕在2002年11月联合国教科文组织颁布《数字遗产保存宪章》之后,国际组织和各国政府开始制定数字资源的长期保存政策,数字信息资源长期存储成为战略任务。国内学者也开始研究各种数字信息资源的采集与存储,其中包括网络资源、电子出版物、机构特色数字资源、个人数字资源和开放存取资源(OA,Open Access)等,而且由此延伸到国家政策、技术、知识产权、元数据、标准、模型建构等相关领域。

一、信息共享与信息存储概述

(一)信息资源

信息、物质和能量是现实世界的三大要素。其中,物质提供材料,能量提供动力。信息是物质间相互作用而形成的,是事物存在的形式,更是一种独立的资源。对信息进行加工处理和开发后形成的信息资源,能够充分实现信息的价值,发挥信息的效用。信息资源作为一种非天然形成的资源,具有非常强的目标导向性。与其他资源相比较,信息资源具有共享性、时效性、动态性、支配性、不可分性和不同一性等特征。

(二)数字资源

《数字遗产保存宪章》明确提出,数字资源是人类知识的一种特有的表达方式,是以数字形式存在的资源。数字资源既包括电子出版物、数字文本、数据库、数字影音、数字图文、软件等组织形态的资源,也包括博客、电子邮件、日志等个人形态的资源。

(三)信息共享

共享性是信息资源的一种基本属性。一方面,信息资源效用的实现需要通过共享来达成;另一方面,信息资源的共享提升了信息资源的利用率,避免了信息采集、存储及管理上的浪费和重复劳动。信息资源具有外部公共性,可以无差别地复制和通过各种平台交流,从而降低信息收集管理的成本,提升信息使用效率,实现社会效用的最大化。在现代信息社会,依赖于互联网、数据库和分享服务器,人们利用客户端的信息终端能够更高效地对信息资源共同管理,实现信息资源的最优化配置和快速分享。

(四)信息存储

信息的共享与利用,都需要利用特定的介质,即信息存储在什么地方、信息资源附着于什么地方。信息存储的方式伴随着科技和社会发展而不断变更。从远古至今,人类把信息先后存储于石块、甲骨、金属、丝帛、纸张、胶卷、计算机、虚拟的网络之上。信息存储方式的沿革,就是人类材料科学发展的历史。信息存储是信息系统的重要组成部分。信息储存方式的高效与否,关系着信息检索利用的效率。伴随着信息技术的进步与发展,未来的信息存储将使信息成为重要的资产,信息的高效存储、备份、防灾与恢复已经成为企业信息基础设施建设的重要环节。

二、网络时代数字信息资源存储

(一)数字信息资源存储的意义

自上世纪50年代以后,信息技术引领了社会发展的方向,也日益深入到百姓的社会生活,改变了企业发展的路径。特别是进入21世纪以后,信息技术相关企业取代了传统的制造业,以微软、谷歌、亚马逊为代表的IT企业成为了公司排行榜上的大鳄,取得了巨大的财富。

在网络时代,信息资源成为社会发展和竞争的重要战略性资源,持续推动社会的可持续和全面发展。特别是大数据时代的来临,海量的数据潮水般涌现,全球数据总量每年都以近50%的速度递增,数字资源日益集中反映着时代的文化、科技、政治和经济领域特征,逐渐成为网络时代的社会信息资源的主流,塑造着各个国家的民族特征,保留着各个民族的记忆,日益体现出国家软实力的竞争力。《数字遗产保存宪章》提出,数字资源已经成为子孙后代活动的资本和遗产。数字资源保存如果缺失的话,将会导致人们处于“数字黑暗年代(Digital Dark Age)”。〔2〕

(二)数字信息资源存储的内容

美国图书馆学会ALA(American Library Association)认为数字信息资源存储是为了长期精确再现验证数字内容以确保使用者能够长期访问和利用,存储数字信息资源要避免资源不受媒体过时和技术变革的影响。欧洲数字保存联盟则认为数字资源的保存是为了促进数字资源被用户定位、再现、利用和理解,数字资源的储存内容包括数字信息资源的名称、地址。

以高校图书馆为例,从资源结构角度来说,数字信息资源的存储包括资源载体(硬盘、云盘、录音录像带等)的存储、资源内容(以比特流来描述)的存储、元数据的存储和资源相关信息的存储;从资源安装角度来说,包括本地服务器上安装的数字资源的存储、远程服务器但在本地做了镜像的数字资源的存储和仅仅提供通过帐号入口的数字电子资源的存储;从资源内容角度来说,包括馆藏数字资源的存储、学位论文数字资源的存储、电子期刊的存储、电子图书的存储、数字科研资源的存储、数字教学资源的存储、馆藏图书的电子书目的存储、文摘类数字资源的存储和图书馆自建数据库的存储;从资源形式来说,包括文本数字资源存储、图像数字资源存储、音频数字资源存储、多媒体数字资源存储等。

三、网络时代数字资源存储的问题

(一)资源存储导致的知识产权问题

人类社会发展过程中,知识创造是社会发展的核心推动力,人类社会的进步也伴随着智力劳动成果的产生与推广。为了更好知识创造,提升科技发展,有必要保护产权人的利益,推行保护知识产权制度。为保护产权人的利益,近年来,我国出台了一系列政策文件:2017年4月24日最高法颁布实施《中国知识产权司法保护纲要》;2018年9月国务院颁布《关于加强知识产权审判领域改革创新若干问题的意见》;2019年11月国务院颁布《关于强化知识产权保护的意见》。

用户通过进入公共信息资源平台,使用已经公开的数字资源,虽然使用中不需要经作者的许可,但其知识产权依旧受法律保护,其版权归于著作权人。关于数字化的学位论文版权归属,部分学者认为归属学位授权单位,但也有学者认为版权部分属于论文作者,主要是看论文的撰写过程对于授予单位资源的利用情况。根据《中华人民共和国著作权法》第16条,“主要利用法人或其他组织的物质技术条件创作,并由法人或其他组织承担责任的职务作品”或者“合同约定的由法人或者其他组织享有的职务作品”,版权属于机构,作者仅享有署名权。数字化的教学资源和科研资源这些职务作品,利用了学校资源并由学校承担责任的,权利应属于学校,其他的著作权为著作者,学校享有优先使用的权利;学校外购的数字资源中,内容资源版权归属于原著作人,数据库版权归属于数据商。对于免费的网络数字资源,要视具体情况而定,其中不受著作权法保护的资源不享受版权,受法律保护的则版权归属于著作人。根据《中华人民共和国著作权法》第13条,“作者身份不明的作品,由所有人行使著作权,身份确定的则由作者或者继承人享受著作权”。此外,图书馆的数字书目资源,不具有版权意义,不受著作权法保护〔3〕。

(二)技术发展导致的不确定性问题

传统的高校图书馆资源存储主要是纸质资源,以及部分音像资源、缩微资源、具有文物性质的其他媒介存储形态的资源,如甲骨、丝帛、金属器具等。这些传统资源的保存主要是针对介质的保护:纸张的防虫防火防潮的技术保护、音像缩微制品的电子产品保护和甲骨等的技术保护等。随着信息技术的发展,数字资源成为图书馆保存的主要资源,更是图书馆读者利用的主要资源。图书馆数字资源的存储技术,既包括传统资源转换成数字资源的技术——扫描技术、网络数字资源的采集技术,也包括爬虫软件技术、各种格式和动静态存储技术、资源安全存取技术、元数据技术和数据库技术等资源的获取加工技术,还包括数据备份技术、仿真技术、数据封装技术、再生性保护技术、数据迁移技术等资源保护技术。

传统资源的存储经过社会的发展,已经积累了大量的经验,具有成熟的解决方案,但是数字资源的保存依赖的是信息技术,而技术的发展具有诸多的不可测性,技术问题带来数字资源存储的极大不确定性。首先是数字技术的标准问题,以通信技术为例,1G到5G仅仅30年时间,技术的迭代非常迅速,导致各种标准变化多端。数字资源的存储涉及许多技术标准,如元数据标准、系统模型标准、文件格式标准等,反映在存储方面则为电子文档格式标准、OAIS参考模型标准、电子文件归档标准等;与标准的变化类似,数字资源的存储面临更大的不确定性是技术的更新与过时问题,例如现在缩微文档的存储与阅读、软盘资源与光盘资源的存储与阅读等,都因为技术的过时已经非常难以使用。随着技术的快速发展,软硬件的变化极大,文件格式的过时、技术平台的变更、资源的保存介质的淘汰等,都对数字资源的存储带来了极大的挑战。

(三)数字资源建设导致的海量存储问题

随着信息技术的迅猛发展,读者阅读习惯发生了革命性变化,使用的资源逐步以数字化为主。数字化资源具有传统资源所不具备的天然优势——检索便利、使用高效、存储方便。因此,图书馆的资源建设必然地走向数字化。国家主管部门也因这种变化而开展了一系列相关建设,如90年代末启动了CALIS系统(中国高等教育文献保障系统,China Academic Library & Information System)建设。CALIS管理中心设在北京大学,下设文理、工程、农学、医学四个全国文献信息服务中心,华东北、华东南、华中、华南、西北、西南、东北七个地区文献信息服务中心和一个东北地区国防文献信息服务中心,提供联机编目、电子资源导航、公共检索、馆际互借和文献传递服务。

数字资源的数量每天都以巨大的速度增加,形成了浩瀚的电子资源海洋。根据统计,非科技文献每30~50年增加1倍,科技文献每10年左右增加1倍。随着信息爆炸,资源的增长量更是巨大无比,按照EMC和IDC发布的《2020年的数字宇宙》预测,全世界到2020年数字信息资源的数据量将达到1000T。而且国外学术类期刊,国内订阅的出版形式都是以网络形式的电子期刊,国内的高校科研工作人员使用的资源也是以知网、万方、维普为代表的电子出版物。如何解决这些海量数据的存储,将是高校图书馆面对的一个巨大挑战。在这些海量资源的存储中,如何保障数据存储中的数据安全、加强存储数据的管理能力、提升存储数据的现实可用性、保障存储系统的可扩展性、保持系统的高效性都是必须考虑的问题,也是数字图书馆的关键技术问题。

(四)数字资源存储中的成本问题

英国联合信息系统委员会(JISC,United Kingdom joint information systems committee)启动的电子文献的生命周期信息(LIFE,Life Cycle Information for E-Literature)项目,建立针对电子文献的生命周期中资源的采集、整理、存储及利用数学模型,进行整个数字资源的成本核算和分析,从而得出数字资源建设的成本。该研究项目提出,数字资源相关的成本包括资源建设成本、资源获取成本、资源导入成本、比特流保存成本、内容保存成本、资源提供成本和非生命周期因素的成本。

与纸质资源的存储成本相比,数字资源的存储成本是一个长期的持续投入的过程。伴随着海量资源的迅速增加,数字资源的保存将是一个非常昂贵的投入,需要国家在资金方面的支持,以实现数据的使用和资源的共享。在我国高校图书馆,国家要求生均年购纸质书不低于4册,在大多数高校学生数量持续增加的情况下,图书馆为满足学生阅览座位和购买纸质书的费用,已经负担极重,而数字资源存储的投入将更加增加学校的经济负担。因此,数字资源的利用更应该加强馆际协作,实现资源的共建、共知、共享。

数字信息资源日益成为社会发展的重要资源,数字资源的储存也日益成为国家战略的组成部分。高校图书馆的资源采访和资源存储,要适应由传统的建设大楼大书库保存纸质资源转变为数字资源存储方面的基础设施建设。但是,数字资源存储作为一个新生事物,不仅存在着诸多困难,如海量信息资源增长快、技术迭代快、标准不统一、成本收益不确定、存在知识产权风险等问题,还面临着社会环境、文化环境和技术环境不断变化的挑战,需要政府、高校、数据商和IT企业等多个主体共同努力推动工作的开展和运行。

四、对策和建议

根据前面阐述的高校数字资源发展和所面临的各种问题,笔者通过对国内外相关数字资源存储方面的资料进行梳理,在此提出几点建议和对策,希望能够逐步缓解高校数字资源建设过程中出现的一些问题和不足。

第一,针对数字资源存储中涉及的知识产权问题,要认真对待,妥善解决。在国家知识产权等有关法律的规定范围内,积极做好与数字资源供应商或版权所有者的友好合作关系,通过签订各种形式的协议充分保证高校图书馆数字资源的保存权利。另外,进一步增强高校师生有关知识产权的法律意识和思想教育培训,逐步建立健全数字资源保存的长效管理机制。

第二,针对数字资源存储中涉及的技术发展方面的问题,可充分利用当前世界上普遍流行使用的区块链、联盟群等技术,进一步促进构建高校图书馆数字资源的协同与共享的管理体系,搭建相关数字资源信息的共享平台。这既能提高高校图书馆数字资源的利用效率,又可以满足一些特殊用户的个性化需求,充分发挥数字资源的特色和价值。

第三,针对数字资源存储中涉及的成本问题,建议从国家数字资源保存的管理体系和机制中探寻一种可以统一谋划、分层设计、通力协作的一体化管理模式,加强高校与地方政府和社会各层次的协同与合作,国家起主导作用,全民共同参与,吸收国外有关数字资源保存的先进经验,出台我国数字资源保存的有利政策和法规,建立健全我国数字资源保存的管理体系。在数字资源的管理定位、选择与保留的依据、有关数据的格式规范等方面着手,避免重复建设,实现资源共建共享,节约各种管理经费,保障数字资源存储的成本可以得到有效的控制,使更多有价值的数字资源能够得到长期有效的保存和利用。

猜你喜欢

数字信息数字资源
基础教育资源展示
基于BIM的企业数字信息归档与利用模式研究
一样的资源,不一样的收获
北京尚水数字信息产品介绍
数字有形状吗?数字信息精确性和品牌标识形状的匹配效应*
资源回收
答数字
资源再生 欢迎订阅
数字看G20
成双成对