APP下载

数字保存系统威胁因素及其应对策略探析

2010-02-16刘宛珍

周口师范学院学报 2010年1期
关键词:存储介质数字信息威胁

刘宛珍

(周口师范学院图书馆,河南周口466000)

作为数字保存项目的核心,数字保存系统无疑应当是数字保存项目的研究重点。然而国内外的研究现状表明,目前仅有几个项目提出了“数字保存系统”概念并进行初步的系统实现,对数字保存系统可能遇到的障碍及应对策略进行研究的项目屈指可数[1]。数字保存系统实现数字资源长期保存的具体时间尚不明确,一般的理解是依据现有的技术和条件,能够实现的最长的时间。它要比单个存储介质或单个软硬件或信息的存储格式的寿命都要长[2]。因此,为了实现数字保存系统“长期保存”的目标,笔者总结出了数字保存系统的常见威胁因素,并提出应对策略。

一、数字保存系统威胁因素分析

(一)技术威胁

数字信息保存系统在技术上面临三大威胁因素:一是存储载体不耐久;二是读写信息的计算机软硬件技术过时;三是数字信息的真实性[3]。

(1)存储介质易脆性。数字信息是存储在各种类型的物理媒体上的。它既可以承载于磁盘和光盘,又可以存储于网络服务器。由于数字存储介质的物理特性天生不稳定,如果没有相适应的存储环境和正确的管理方法,会引起诸如磁盘损坏、脱机媒体损坏等暂时性的或永久性的故障。

(2)技术老化。数字信息的长期可用依赖相应软件,而这些软件又依赖专门的操作系统甚至硬件系统,一旦离开了软硬件系统,数字信息的使用价值也就结束了。然而近二十年来经常性的技术变化引起了重大的技术变革,因此技术老化被大部分馆藏管理者看作是对数字存储的最大威胁[4]。

(3)内容真实性。与纸质环境相比,在数字环境中对存储内容进行改动显得更加容易。不论是故意还是无意所致,辨别数字信息的真伪已成为目前一个比较棘手的问题。

(二)环境威胁

环境威胁因素主要包括网络环境、组织环境及自然环境[2]。

(1)网络环境。主要指数字保存系统的外部网络服务(包括域名及URL s)可能会遇到暂时性的或永久性的故障;在某特定时间段内,网络可能会出现传输错误(传输失败或部分传输);数字保存系统易遭受公网上的病毒攻击。

(2)组织(机构)因素。组织机构的解体、破产或使命改变可能导致数字保存系统的技术丧失。遇到此种威胁,要么有后继组织接管,要么进行其他的合理处置。

(3)自然灾害。如洪水、火灾及地震等各种自然灾害都可能给数字保存系统带来意外威胁。

(三)其他威胁

其他威胁因素包括人为因素[2]、成本因素[2]及知识产权因素。

(1)人为因素。主要指计算机专家和操作人员两方面。由于计算机专家经常被授权访问数字保存系统,就算将系统与外部网络隔离能够防止外部病毒的袭击,却难抵御个别另有图谋的计算机专家的内部攻击。操作人员的不良行为也可能造成暂时性的或永久性的系统故障。这种故障不仅可能发生在数字保存系统本身,而且也可能发生在操作系统、应用程序、硬件设施及计算机网络身上。

(2)成本因素。首先将数字保存成本与文献数字化的成本区分开来,后者只是前者的一部分[5]。数字保存成本不仅大于文献数字化成本,而且与保存纸质文献相比,更易受到经费的影响;因为如耗电、带宽、系统管理、域名注册等一系列数字保存活动,都需要经费作保障。

(3)知识产权。知识产权问题是数字保存面临的重要挑战,从数字信息的收集开始,知识产权问题就出现了,而数字保存进程的每一个阶段又都与此息息相关,不可分割[6]28。但到目前为止,各个国家和地区都没有完整的数字保存知识产权法律,这不能不说是影响数字保存的重要因素。

二、数字保存系统威胁的应对策略

针对上述威胁,笔者提出了以下几种可行的应对策略。

(一)普通文本的“双套制”解决方案

复制/拷贝又称数据更新,它是在原来的技术环境下实施重写信息数据,将数据流从旧存储介质转移到新存储介质上,防止由于存储介质理化性能变化而引起的信息丢失[6]38。这种方法早就大量应用于磁带、磁盘、光盘的保存上。但这只是一项常规的管理工作,并不能真正解决由于计算机软硬件过时引起的长期保存问题。再生性保护技术指将技术过时的数字信息实时转移到缩微品或纸上。由于缩微胶片存储量大、寿命长(其保存寿命理论值是500年,国际上已有100多年的实践经验,国内也有几十年的实践经验)、便于保管、不再使用计算机软硬件技术读取,因此,它为长期保存数字信息提供方便,并且可避免计算机软硬件技术过时所带来的任何麻烦。于是,笔者认为数字拷贝和保存缩微胶片的“双套制”方案[7]为保存使用频率较低的纯文本信息(而不是声音、超文本、多媒体信息),提供了一种最佳方案。随着摄影技术和设备的发展,缩微胶片记录的模拟信息将能进入计算机网络系统,不用担心数字信息会失去它原有的数字风格。

(二)技术仿真策略

技术仿真策略是在实施拷贝保存数字信息内容的同时,制造一种能运行过时软硬件的软件,在这种软件中对某一过时的软硬件进行模仿,使得保存的数字信息能在模拟的软件上运行,这是一种延迟技术淘汰的方法[6]39。实际上这与“计算机技术档案馆”方法有关,由于保存有关软件版本和硬件设备的物理实体建立“计算机技术档案馆”对大多数保存机构来说都不现实,因此人们更多的是详细描述数字信息利用、各种技术参数和环境条件,以便未来计算机系统可以模仿原始系统环境来读取和使用数字信息内容。技术方针策略使我们可通过新的仿真器来仿真上一代仿真虚拟机,因此不必持续更新针对特定数字信息的定义语言、仿真说明、解释器等。这从技术的角度来看是可行的,但在实践中它的兼容性并不可靠,仿真器自身的耐用性不稳定;所以笔者认为这不太可能是一直有效的方法,软件制造商也可能会因为其兼容性差,而最终放弃某些软件。

(三)数字信息格式迁移策略

迁移是持续将数字信息从一种技术环境转换到另一种技术环境,意味着基于字符的数据可以从一个存储介质转移到另一个存储介质上,以便进行数字信息的长期保存;同时,也可以将原始数据格式转换为独立于具体原始软硬件平台的标准数据格式,由于这些原始数据格式的开放性和标准性,可以保证总有相应软硬件系统来处理这些数据[6]39。这种方法维护了数字对象的物理形体,也保护了其内容存在,但其缺点是无法保证其外观、功能和背景信息的完整等;因此限制迁移过程中的各种损失是采用这种方案的关键,它至少对于结构简单的单一文件是比较适用的。虽然很多机构都采用数字迁移策略,但具体实施办法又有所不同,有的是改变存储媒体(如再生性保护技术,笔者认为它是迁移策略的一种方法),主要用于保存使用频率较低的数字信息;有的是格式迁移(也是狭义的迁移策略),适于保存使用频率较高的数字信息。为了建立有效的数据格式迁移策略,需要对数字文献格式进行标准化处理,如澳大利亚国家档案馆采用了规范化方法,就是将各种数字信息存档为通用的XML格式,荷兰国家图书馆(KB)仅接受PDF格式的数字信息[2]。

(四)评估策略

采用评估策略的原因有二:一是在获取数字信息阶段对获取的数字信息进行评估以检验其真实性;二是对保存特色文献的系统进行评估可以及时发现潜在故障,从而降低维修成本。评估方法主要有第三方评估和互评估。前者是一种常用的评估方法,是将被检索系统里的内容和摘要与保存在其他系统内的内容和摘要进行比较,它可以检测系统是否具备端到端的检测性能,不足之处是检测内容都以比特流的形式存在,可能会导致二者错误匹配。互评估方法的优点是对原有信息不会产生风险,并且不必向评估人员泄露信息内容,不足之处是不能进行端到端的评估[2]。笔者认为,两种方法各有千秋,如果二者能够恰当结合,将会相得益彰,更有利于数字信息的长期保存。

(五)经济策略

保存数字信息要比保存纸质文献的成本高。数字保存系统的运作过程可分为获取数字信息及其元数据、保存数字信息和发布数字信息三个阶段,每个阶段都有其成本构成[2]。首先,获取阶段的成本由获取数字信息的产权许可费用和获取数字信息及其元数据的费用构成;其次,保存阶段的成本包括购买并持续更新软硬件的费用、格式迁移成本及业务成本(如电力、带宽、员工的时间及评估成本);最后,发布阶段的成本由保存数字信息协议条款中规定的费用以及向授权用户发布数字信息的费用两部分构成,前者主要指认证系统的管理成本,如引导用户进入和退出系统及监督有关出版机构的管理费用,后者主要指操作w eb服务器和带宽的花费,这笔费用一般不高。

根据以最小的投入获得最大的收益这一经济学原理,数字保存系统的主办机构在经费有限的情况下,就必须考虑以最小的成本投入保存更多的信息资源,并降低保存风险。笔者所说的经济策略主要指降低获取和保存阶段的成本。主要措施有:保存本单位拥有版权的资源,健全版权许可法律体系等以降低产权许可费;通过对获取过程及评估系统实施自动化管理来降低获取数字信息的成本;通过采用机器自动生成元数据,或在从数字信息创建者那里获取数字信息时一起获取元数据来降低获取元数据的成本;由于对数字信息实施单独管理或将数字保存系统与其他基础设施集成管理降低业务成本的方案风险性高,因此尽量让操作人员参与系统操作;采用适当的转移方法来降低格式迁移成本。

(六)健全数字保存法律规定,建立全国统一的数字信息归档系统

目前,一些传统的图书馆、档案馆与其他文献收藏部门都开始收藏数字文献,并提供网上浏览与借阅,但这些传统图书馆包括发达国家的数字图书馆,都没有把数字信息长期保存纳入其职能范围之内[8]。这样,就使得一些在网上流动的、未被收容的、有价值的信息,在当前技术情况下无法长期保存。因此,有必要建立一个全国数字信息归档系统,使之对全国文化、经济、科技、社会等领域数字信息的存贮和存取承担管理责任,使之成为我国数字信息的资源基地。

法定保存是解决数字保存面临的知识产权问题的首选方法,而且它为数字信息归档系统提供了强有力的资源保障。国外已有对数字信息采用多种方案进行法定保存的先例,如英国采用法律条文规定,澳大利亚采用法律覆盖和自愿收集的混合法。笔者认为在我国建立数字信息呈缴本制度具有可行性,因为印刷文献的呈缴本制度在各国已广泛实施并成功地解决了印刷文献长期保存的知识产权问题,对于人类文化遗产的长久传承发挥了关键作用。虽然数字信息的真伪难辨会给其呈缴本制度的实施造成一定的难度,但在丹麦、芬兰和挪威等少数国家已有先例,也就是说,我国不妨借鉴其成功经验进行尝试。

每种新技术都是一把双刃剑,所有的技术方案都不是尽善尽美的,只是解决了部分问题,因此,笔者建议选择数字保存系统的风险防范策略时,要根据选择技术方案的要求和标准(保存什么、为谁保存及怎样保存)[7]来选择最理想的技术解决方案。

[1]张智雄,郭家义,吴振新,林颖.基于OA IS的主要数字保存系统研究[J].现代图书情报技术,2005(11):1-9.

[2]David S H,Rosenthal,Thomas Robertson,Tom Lipkis, Vicky Reich,Seth Morabito.Requirements for digital p reservation system s:a bottom-p app roach[J/OL].D-lib Magazine,2005(11)[2008-01-12].http://www.dlib.o rg/dlib/november05/rosenthal/11rosenthal.htm l.

[3]郭瑞华.数字信息长期存取策略研究[J].情报理论与实践,2002(2):133-135.

[4]Hedstrom M,Montgomery S.Digital p reservation needs and requirements in RLG member institutions:a study commissioned by the research libraries group[M/OL].[2008-06-20].http://www.Rlg.org/p reserv/digp res.htm l.

[5]朱烨.数字保存中的技术、组织及法律因素分析[J].图书馆学研究,2005(4):36-38.

[6]宋显彪.数字信息的长期保存[D].成都:四川大学, 2005.

[7]颜晓栋.保存数字信息技术方案选择与评价[J].档案管理,2003(1):23-24.

[8]张绍武.数字信息长期保存的策略[J].现代情报,2002 (4):152-153.

猜你喜欢

存储介质数字信息威胁
基于BIM的企业数字信息归档与利用模式研究
HDFS数据动态分布设计与实现
人类的威胁
北京尚水数字信息产品介绍
数字有形状吗?数字信息精确性和品牌标识形状的匹配效应*
受到威胁的生命
一种使用存储介质驱动的方式
搞笑图片
数字信息时代图书馆职业权利缺失与回归路径
医院环境下移动存储介质的信息安全管理