国外数字资源长期保存和长效利用研究进展❋
2011-03-19潘菊英刘可静
潘菊英 刘可静
(1.武汉理工大学图书馆 湖北武汉 430070;2.华中师范大学信息管理系 湖北武汉 430079)
随着信息技术的不断发展,无论是文化、教育、科学,还是技术、法律等各类信息越来越多地以原生数字(born digital)形式创建,或者从现有资源转化成数字形式的文献。数字文化遗产包括全世界各地联机或脱机产生的文本、数据库、静态的和动态的图像、音频、图形、软件、网页等。数字资源已逐步发展成为人类知识信息传播与利用的主要形式,以数字文献资源为主的科技与教育文献服务体系正在迅速发展。数字资源的普及极大地提高了用户获取信息的能力,但也带来了长期保存的严峻挑战。如何保障数字信息资源长期、可靠和稳定地供现代和未来的人类使用,促进人类智力成果和文化遗产的长期保存和长效利用日益成为国际上关注的战略问题,也是国内外学术界和信息服务领域近几年关注的焦点。充分了解国际数字保存进展、学习国际先进经验、加强国际交流与合作,对于推动我国数字资源长期保存的研究和应用具有重要的现实意义。
1 国外相关组织从事数字资源长期保存和长效利用的研究与实践活动
1.1 联合国教科文组织(UNESCO)
(1)《数字文化遗产保存纲要》
早在2003年3月12日联合国教科文组织就发布了总干事关于《数字文化遗产保存纲要》草案的修订报告(Report by the Director General on a Revised Draft Charter on the Preservation of the Digital Heritage)。报告指出,数字资源长期保存是指如何及时、有效地对数字信息资源进行永久性保存,以保证未来用户可以检索、获取各种数据和记录。报告阐述了世界日益增长的数字遗产的保存原则和可持续获取策略。保存数字遗产的目的是确保永久获取。强调数字遗产的使用应当是平等的,免受限制的。创建者、权利拥有者和获取数字资料的公众之间的权益平衡应当得到重申。报告要求,每一成员国要与相关组织和机构合作,以鼓励法律和实践环境的创建,最大限度地获取数字遗产。报告号召全世界政府和非政府组织,国际、国内和私人机构通力合作,确保数字遗产保存政策在国家层面给予优先权。〔1〕
(2)《数字遗产保存指南》
2003年3月,联合国教科文组织(UNESCO)发布了《数字遗产保存指南》(Guidelines for the Preservation of Digital Heritage)。该指南是UNESCO数字遗产保存报告的姊妹篇,由联合国教科文组织委托澳大利亚国家图书馆编写,指南主要涉及数字保存的实践方面,分别从理论、实践、管理与技术等多个层面对数字遗产保存的意义、面临的困难和需要解决的问题进行了阐释,并针对这些问题提出了开展数字遗产保存活动的指导原则以及相关的实践建议。指南指出,数字遗产是属于全人类的文化遗产,世界各国应在数字遗产的保存保护工作中坚持合作。该指南还告诉人们如何进行数字文化遗产的保护工作,例如,责任的明确、知识产权的管理、与出版社和制作者的合作、被保护遗产的选择、控制和描述等,并指出应该有一个呈缴制度以保证数字文化遗产的保护。〔2〕
1.2 国际图联
(1)IFLA/IPA:永久保存世界记忆——关于保存数字信息的联合声明
国际图联(IFLA)和国际出版者协会(IPA)于2002年6月共同发布了《IFLA/IPA:永久保存世界记忆——关于数字信息存档与保存的联合声明》(Preserving the Memory of the World in Perpetuity:A Joint Statement on the Archiving and Preserving of Digital Information)。声明指出,保存数字信息正日益成为图书馆和出版者的严峻挑战。随着数字信息量的快速增长,适应这一资料格式的保存政策和技巧仍未得到解决。声明就数字信息的保存提出了七条原则和建议。IFLA和IPA分别代表国际图书馆界和出版界表示将就数字保存的技术、经济和法律等方面问题开发合作项目。声明强调,国家图书馆受命获取和保存各国出版的文化遗产,而且大多数正在进行数字出版物的获取试验,这些图书馆应当担当起数字出版物长期存档的主要责任。〔3〕
(2)国际图联和国家图书馆馆长会议数字战略联盟(ICADS)
ICADS(IFLA -CDNL Alliance for Digital Strategies)是国际图联(IFLA)和国家图书馆馆长会议(Conference of Directors of National Libraries,CDNL)数字战略联盟,成立于2008年8月。ICADS联盟重点是国家图书馆层面的数字图书馆发展。在澳大利亚保存获取数字信息项目(Preseving Access to Digital Information,PADI)框架下,ICADS联盟提供国际图书馆界关于创新数字项目最新信息。ICADS的工作内容集中在:①创立和建设数字馆藏,包括数字化、网络存档、数字存档等;②管理数字馆藏,包括数字摄取、数字存储和数字保存;③获取数字馆藏,包括数字资源发现和数字权利管理。其工作目标是促进国家图书馆数字发展,增强IFLA会议对新的战略下数字保存问题的重视,这些问题涉及国家图书馆全球化(National Library Global,NLG)的评估、长期存档系统开发和图书馆数字藏书的保存、未来发展路径和资助资金、可能的分布式地区模式、元数据和内容的集中使用等。〔4〕
(3)《数字保存的网络化:15个国家图书馆现行实践》
2004-2005年,IFLA委托荷兰国家图书馆(KB)进行了一项关于国际图书馆界数字保存标准使用和发展的调研。调研15个国家图书馆的数字保存现状和现行国家和国际项目。这15个国家图书馆是澳大利亚、奥地利、加拿大、中国、丹麦、法国、德国、日本、荷兰、新西兰、葡萄牙、瑞典、瑞士、英国和美国等。调查包括数字保存的实际运作和研发活动,主要焦点在于操作安全环境的标准使用和永久获取战略,如迁移和仿真问题。调研形成的成果是IFLA于2006年出版的《数字保存的网络化:15个国家图书馆现行实践》一书。该书认为,数字形式出版物,在线或CD或数字化图像以及原生数字对象,需要得到保护和持续获取。保护数字化遗产是一项重要任务,特别对于国家图书馆而言,因为保存国家遗产是其法定职责。强调数字对象存储和获取的实践需要制定数字知识库建设标准、长效利用研究标准等特定标准。要求图书馆不仅需要可信的数字存储系统,还需要合适的旨在开发保存战略的研发计划。〔5〕
1.3 英国数字保存联盟
英国数字保存联盟 (Digital Preservation Coalition,DPC)成立于2001年。联盟的目的在于保护保存英国数字资源,激励和支持联盟成员确保长期利用和管理数字知识资产,与国内国际合作伙伴一起为保护全球数字记忆和知识资产而努力工作,推动数字保存和管理的发展。为达到这一目的,联盟制定了长期目标:①生产、提供和传播有关最新研究和实践,在成员间建立专家组,促进教育学习,全面拓展数字保存专业技能;②提供英国数字保存策略发展和协调论坛,通过国际代表参与活动,将英国数字保存活动定位于国际背景下;③促进数字保存服务、技术和标准的开发;④与相关国内和国际组织一道打造战略联盟,与行业组织和研究组织一起解决共同面临的数字保存的全球性挑战;⑤参与数字保存的国际活动,制定开放存档信息系统(OAIS)标准,开发与澳大利亚国家图书馆(National Library of Australia,NLA)合作协议。〔6〕
2 国外数字资源长期保存主要项目
2.1 澳大利亚PADI项目
数字信息长期保存和利用项目(Preseving Access to Digital Information,PADI)是澳大利亚国家图书馆主持的一项有关数字保存的合作项目,该项目得到英国数字保存联盟(DPC)和德国数字资源长期存储专业网络(NESTOR)项目的支持。该项目目标是促进数字信息保存和利用战略和指南的研发;创建和维护一个推广数字保存信息的网站;主动促进相关活动的开展;提供论坛供数字信息保存利用领域跨部门合作交流。
1993年,项目成立了由图书馆和档案部门的代表组成的工作组,为电子信息保存开发合适的指南。为应对处理数字信息所面临的挑战,工作组扩大到包括其它来自博物馆、信息技术部门和学术研究界成员。项目设有顾问团,为PADI项目提供咨询和指导。
PADI网站是数字保存资源的学科信息门户,提供关于世界上数字保存和获取的最新信息。网站主题信息包括保存方法,如迁移、仿真等;特殊介质和格式问题,如电子邮件、电子记录和磁介质资料等;技术老化、资源发现和认证问题;元数据、版权和相关获取问题。PADI工作组正通过网络有效增加可获取信息的价值,确保数字信息经营、管理、保存和未来使用。〔7〕
2.2 英国 LIFE项目
电子文献的生命周期信息(Life Cycle Information for E-Literature,LIFE)项目由英国联合信息系统委员会(JISC)和研究信息网络(RIN)资助,英国国家图书馆与伦敦大学(UCL)共同实施合作,旨在开发馆藏数字资料的生命周期的分析和成本核算方法体系。项目主要分为LIFE1(2005.5-2006.4)、LIFE2(2007.3 -2008.8)和 LIFE3(2009.8 -2010.8)3个阶段,LIFE1检视UCL和英国图书馆的重点数字馆藏的生命周期。LIFE2在第一阶段基础上制定生命模型,并对三个案例进行了研究。LIFE3通过生产预期成本核算工具,极大地提高了机构组织数字保存的计划和管理能力。LIFE3突破LIFE1和LIFE2通用保存模型,创造一整套涵盖所有生命周期阶段的模型,提供更准确、更保险的成本评估。这一方法模型使人们能够基于数字资源的生命周期对其保存成本进行核算,从而有可能对未来的数字保存活动进行长远规划和管理。〔8〕
2.3 美国NDIIPP计划
美国国会于2000年12月授权国会图书馆从事国家数字信息设施保存计划 (National Digital Information Infrastruc-ture Preservation Program,NDIIPP)项目研究,阻止数字文化遗产的流失。该计划项目目的是研发国家数字保存战略,保存原生数字资源,为当代和后代获取利用。国会图书馆已与国内外130多个合作伙伴建立合作关系,一起应对保存网络的挑战,并就大量的项目共同合作。项目研究重点集中在三个方面:①搜集、保存和获取重要数字内容;②建立和加强合作伙伴网络;③开发工具和服务的技术设施。
作为国家级的数字资源保存项目,NDIIPP包括8个子项目,构建了一个数字资源长期保存的国家策略。2007年,国会图书馆资助“保存创造性美国”计划,主要针对范围广泛的创造性作品的保存问题,包括数字扫描、卡通、动画、图片、录音、视频、游戏等。2008年运行“保存州政府信息计划”,取得23个州4个课题的支持。国会图书馆2005年以来,还定期主持了数字保存伙伴会议,共同研讨数字保存相关问题。〔9〕
2.4 德国NESTOR项目
德国数字资源长期存贮专业网络(Network of Expertise in Long-term Storage of Digital Resources,NESTOR)项目是由德国教育和研究委员会启动资金80万欧元资助的数字资源长期保存项目,项目在2003-2009年间进行,德国国家图书馆负责项目的实施。
项目的目的是保存德国的数字资源,同时和其他国际组织合作保存全球数字记忆和知识,在德国创建一个数字资源长期存档和长效利用的信息网络。该网络确保德国数字资源长期存档、保护和获取使用。通过国家和国际合作,达到保卫全球文化遗产的目的。
NESTOR项目力图开发可信赖数字知识库的标准、数字存档认证系统的步骤、数字资源搜集原则和存档标准选择、数字资源长期存档政策等。该项目还在数字保存教育和培训方面进行了成功的尝试。与高等教育合作伙伴一起开发和实施德国数字保存的培训课程,编制了一系列的指导教程,作为相关机构的教学资料。培训形式包括举办研讨会、建立工作站、开办春季和冬季学校,编制数字保存知识手册等。〔10〕
2.5 欧洲NEDLIB项目
网络化欧洲存储图书馆项目(Networked European Deposit Library,NEDLIB)是以荷兰为领导的欧洲国家图书馆间的一个合作项目,该项目由荷兰国家图书馆主导,欧洲八个国家图书馆、一个国家档案馆、二个ICT组织和三家主要出版社参与。项目旨在为建立电子出版物存储系统开发共同的基础设施和功能设计框架及基础工具。主要目标是寻求保存和利用在线和非在线(物理格式)数字出版物的解决方案。项目开展的重要工作之一是电子出版物存储系统(DSEP)的功能规格和总体设计。其它焦点在于评估迁移和仿真过程、起草技术元数据标准。目的是构建一个网络化的欧洲存储图书馆赖以建立的基础设施。其成果主要有,建立了英国CEDARS和澳大利亚PANDORA项目所采用的开放存档信息系统模型作为参考模型;荷兰国家图书馆开始了合作保存仿真试验,迈出了保存机制技术测试的步伐;研制了建立存储系统的小型工具包,元数据搜索程序等。〔11〕
3 国外数字资源长期保存和长效利用发展趋势
3.1 国家图书馆的主导作用
国家图书馆是国家重要的文化机构,具有对国内外图书文献履行收藏和保护的职能。对保存数字信息或电子格式信息,利用人类记忆和遗产,国家图书馆具有义不容辞的职责。综观国外的数字资源长期保存工作,发现多数保存项目都是由各国国家图书馆发起并组织实施的。如美国的NDIPP项目、德国的NESTOR项目、澳大利亚的PADI项目等,在这些项目实施的过程中,国家图书馆都发挥了重要作用。
联合国教科文组织在《数字文化遗产保存指导方针》中指出,国家图书馆拥有法定权去获取和保存该国出版的文化遗产,国家图书馆必须承担长期保存的责任,其中有的还要起引导作用。数字信息长期保存的责任主体需要进行战略上的合作,共同行动以促进立法等环境的改变。〔12〕随着数字资源长期保存活动的开展,国家图书馆在国际范围内数字保存业务协作协调的主导作用将会得到进一步加强。
3.2 协同合作的全球化
网络环境下,国际出版者可以在任何地方传递数字出版物,数字保存活动越来越多地在本国框架外的全球范围内发生,在本国背景下的存档作用不再明显。网络的发展和其赋予的国际活动日益超越了国家的界限。同样,全球化也适用于数字保存硬件和软件的开发,信息技术公司和市场趋势越来越以全球化规模运作,且适用于不同部门。这意味着国际机构间、部门间的国际合作有更大的潜能和裨益。〔13〕
欧洲NEDLIB项目就是由荷兰国家图书馆主导,八个国家图书馆参与的合作项目,项目还吸纳了英国CEDARS项目和澳大利PANDORA项目所采用的开放存档信息系统模型。德国的NESTOR项目通过国内、国际合作,以达到保存全球人类知识记忆的目的,不仅加强了本国图书馆、档案馆、博物馆、文化部门间的合作,而且加强了与英国数字保存联盟(DPC)和澳大利亚PADI项目的联系与合作。可以看出,数字保存合作的全球化趋势越来越明显,跨部门、跨地区的国际范围内的合作和交流更加密切。
3.3 数字保存第三方合作的发展
由于长期保存在技术和操作方面相当复杂,任何一个图书馆的经费都不足以支持数字学术资源的长期保存。因此,数字存储的另一个主要趋势是和第三方合作。目的是共同承担经费,共同筹划市场,共同提供更多的内容等。和第三方合作的主要原因是:用户的需要、加强力量、合作的需要、基金提供者的要求、缺少基金、第三方的威望和影响。合作要考虑的主要方面是内容、格式、元数据、存档问题、版权问题等。
美国PORTICO〔14〕项目就是适应数字保存的需求出现的第三方保存项目,能够便捷和低廉地搜集和保存授权电子内容的拷贝,提供给图书馆确保数字资源存档或长期使用。项目特点有:①开源软件技术支持;②低成本运行;③长期平台中立性;④可持续的分布式保存模式。其宗旨是确保基于WEB的学术出版物的长期保存,为全球研究者、学者和学生提供数字学术资源的长期存储服务。当数据库商停止运营或平台发生不可预知灾难时,项目对所有提供存档支持的图书馆提供其订阅资源的校园访问服务。
3.4 版权管理的挑战与变革
数字保存始于对数字资源的拷贝(复制)。在版权法里,复制权是版权拥有者的专有权利之一,良好的保存实践需要对数字资源制作多个备份。目前,现行版权法律还没有对数字资源的长期保存与利用活动中的版权问题做出相关规定,没有哪个国家制定了数字出版物存档的全面的法律条款〔15〕,但版权法赋予了图书馆和档案馆保存和限量使用合法作品的豁免权。如,美国版权法第108条第17款规定图书馆和档案馆有额外的保存选项。美国千年数字版权法案(DMCA)明确规定,图书馆和档案馆为保存目的可以任何格式(文本、图像、声音)补足三个备份。保存机构从事数字资源存档和利用需要更多的合法使用版权限制的例外,因此,相关版权法规条款需要特别明确规定数字资源的长期合法存储和合理使用的原则。
当前,对数字资源的保存与利用的版权管理模式也发生了变革。美国 CLOCKSS〔16〕(Controlled Lots of Copies Keeps Stuff Safe)项目对于遗弃的和孤本的内容就采用知识共享许可证(Creative Commons License),以方便用户长期获取利用。此外,数字资源许可使用合同也是版权管理数字资源的形式之一,它影响和制约着长期保存与利用活动。在对许可资源进行保存之前,图书馆与相关保存组织要认真阅读签订的许可协议是否包含有存档条款〔17〕。大多数出版者采用的许可证只允许订购其内容的图书馆用户获取拷贝,LOCKSS〔18〕(Lots of Copies Keeps Stuff Safe)项目允许图书馆经过出版者授权后搜集、保存和传播所订阅资料的拷贝给其用户。
3.5 保存行动的早期化和保存内容的拓展
数字资源长期保存与利用在时间上具有紧迫性。由于数字资源是脆弱的,容易丢失和损坏,保存行动必须尽早开始。此外,选择数字资源是否长期保存与利用的决定可能是困难的,因为要发现和揭示不同行业数字资源的历史重要性,就必须在数字资源生命周期的早期就做出决定。而获取、保存和利用它们所依赖的硬件和软件又在快速发展,并极易被淘汰。因此,在数字资源的长期保存与利用过程中,相关机构必须尽早并长期与数字资源的创造者和供应商保持比以往更加密切的联系〔19〕。
数字资源长期保存与利用在内容上的拓展变化体现在多方面。由于在数字环境下,数字资料不需要再生成许多复制品,一个单一的副本可以通过PC机和网络连接被任何人获取。出版物、手稿和存档记录之间的界限因而变得模糊不清,使图书馆和档案馆在数字环境下的任务和使命在很大程度上有可能交叉重叠。出版物只是大众文化和文化记录的一个方面,电影、电视和万维网也成为文化的一部分。任何一国的保存计划,都需要考虑新领域的收藏发展和未来研究需求机制。为了保护和传承人类优秀的智力成果和文化遗产,需要更多人为之努力。
4 结语
数字保存是当前较新颖且较复杂的领域,涉及技术、法律、经济、管理等多方面问题。为应对数字资源长期保存和利用带来的挑战,联合国教科文组织、国际图联ICADS、英国DPC等相关国际组织进行了大量数字资源长期保存和利用的研发和实践活动,欧美和澳大利亚等发达国家图书馆也大力开展项目研究和试验,对数字保存和利用的各种问题进行了深入研究和探讨,国外数字资源长期保存方面的研究和应用已经取得长足进步,并将朝着数字资源长期保存和利用的全球化、国际化方向发展。我国应借鉴国外成功经验,加强数字资源长期保存和长效利用的服务体系建设,确保数字资源长期、稳定、可持续地为科研人员获取和利用,以促进我国数字资源的稳定保障和服务发展。
1,12.United Nations Educational,Scientific and Cultural Organization.Report by the Director General on a Revised Draft Charter on the Preservation of the Digital Heritage.〔2011 -04 -02〕.http://unesdoc.unesco.org/images/0012/001296/129679e.pdf
2.Prepared by National Library of Australia.Guidelines for the Preservation of Digital Heritage.〔2011 -04 -02〕.http://unesdoc.unesco.org/images/0013/001300/130071e.pdf
3.IFLA/IPA Steering Group.Preserving the Memory of the World in Perpetuity:a joint statement on the archiving and preserving of digital information.〔2011 - 04 - 02〕.http://www.ifla.org/V/press/ifla -ipa02.htm
4.About the IFLA -CDNL Alliance for Digital Strategies(ICADS).〔2011-04-02〕.http://www.ifla.org/en/about-the-ifla-cdnlalliance-for-digital-strategies
5,19.Ingeborg Verheul.Networking for Digital Preservation:Current Practice in 15 National Libraries.IFLA,2006.〔2011 -04 -02〕.http://www.ifla.org/en/publications/ifla-publications-series-119
6.About the Digital Preservation Coalition.〔2011 - 04 - 02〕.http://www.dpconline.org/about
7.National Library of Australia.PADI:gateway to international digital preservation resources and to ICADS(IFLA-CDNL Alliance for Digital Strategies)〔2011 -04 -02〕.http://www.nla.gov.au/padi/index.html
8.Welcome to the LIFE Website.〔2011 -04 -02〕.http://www.life.ac.uk/
9.NDIIPP 2010 Report.〔2011 - 04 -02〕.http://www.digitalpreservation.gov/librar
10.Welcome to nestor.〔2011 - 04 -02〕.http://www.langzeitarchivierung.de/eng/
11.Titia van der Werf- Davelaar.Long - term Preservation of Electronic Publications:The NEDLIB project,D - Lib Magazine September 1999.〔2011 - 04 - 02〕.http://www.dlib.org/dlib/september99/vanderwerf/09vanderwerf.html
12,13.Neil Beagrie.National Digital Preservation Initiatives:An O-verview of Developments in Australia,France,the Netherlands,and the United Kingdom and of Related International Activity,the Council on Library and Information Resources and the Library of Congress,April,2003.〔2011 - 04 - 02〕.http://www.clir.org/pubs/reports/pub116/contents.html
14.Portico:A Digital Preservation and Electronic Archivng Service.〔2011 -04 -02〕.http://www.portico.org/digital-preservation/
15.Brian Lavoie,Lorcan Dempsey.Thirteen Ways of Looking at...Digital Preservation,D - Lib MagazineJuly/August 2004.〔2011 -04 -02〕.http://dlib.org/dlib/july04/lavoie/07lavoie.html
16.Peter B.Hirtle .Digital Preservation and Copyright.〔2011 - 04-02〕.http://ecommons.library.cornell.edu/handle/1813/53
17.CLOCKSS.A Trusted Community - Governed Archive.〔2011 -04 -02〕.http://www.clockss.org
18.What is LOCKSS Program?〔2011 -04-02〕.http://lockss.standford.edu/lockss/home