电子期刊长期保存方案的比较研究
2016-11-10臧国全赵毅郑州大学信息管理学院
臧国全,赵毅(郑州大学信息管理学院)
电子期刊长期保存方案的比较研究
臧国全,赵毅(郑州大学信息管理学院)
探讨了电子期刊长期保存方案的几个基本问题,比较分析了四个全球比较著名的保存方案特征以及对常见访问事件的处理方法,探讨了一个完善的保存方案中各利益相关方应承担的基本职责,以期为图书馆等机构制定电子期刊长期保存方案所参考。
电子期刊;长期保存;LOCKSS;CLOCKSS;Portico;e-Depot
与其他类型的数字资源相比,无论是在国外还是国内,电子期刊的长期保存理论研究与实践开展最早,研究成果最丰厚,保存项目最多。但是,在这繁荣的保存实践中,至今为止,仍然存在一些问题。基于对一些著名电子期刊解决方案的考察,发现和总结这些问题,探讨对应的解决方法,是完善电子期刊长期保存方案的一个有效途径。
1 保存方案的基本问题
1.1 保存对象
电子期刊长期保存对象有两种:一是作者提交的论文文件;二是电子期刊的出版文件。两者各有优点和缺点,在保存实践中,两种保存对象的实施方法可能存在较大差异。
前者的优点是保存内容比较全面完整,不仅包括呈现在期刊中的论文内容,还可能包括不出现在论文中的用于支撑论文观点的研究型数据等。但缺点也很明显,一是由于作者采用的文件格式众多,需要对来源文件转换为标准的格式以满足长期保存的要求,需要大量的前期投资;二是保存的一些内容(如一些研究型数据)可能很少有用户访问,导致保存成本提高。
后者的优点是保存文件完全呈现了期刊出版的外观,用户浏览阅读的观感友好度高,保存无需格式转换,初始成本较低。缺点是出版商为了保护其商业利益,常采用非标准格式进行出版,导致保存文件在长期保存过程中可能需要较多的数字迁移。
在电子期刊的长期保存方案中,上述两种方法都有应用。并且,由于难以分出孰优孰劣,一些保存方案甚至同时保存上述两种数字对象,比如,Pub Med Central[1]、Portico[2]、KB E-Depot[3]等。
1.2 永久访问与长期保存
在设计电子期刊长期保存方案时,理解永久访问和长期保存的区别非常重要。JISC对两者界定如下。[4]
永久访问常与电子期刊许可条款有关,旨在对订阅的电子期刊在一定环境内被持续访问提供保证,包括对取消订阅的电子期刊的持续访问(Post-Cancellation Access)。因此,永久访问是在试图复制传统纸介质期刊的场景。在这个场景中,图书馆接收和保存期刊,并确保已订购期刊处于可获得状态,无论是否继续订购。
长期保存强调的是过程与程序,旨在采用这些过程与程序确保保存的电子期刊在未来仍处于可被访问状态。长期保存可以被看作一个问题,该问题不仅仅是订阅电子期刊的图书馆需要处理的,而且也是整个社会需要解决的,这个问题就是如何确保已有学术成果对于未来时代的学者乃至整个人类具备持续的可访问性。产生这个问题的原因是存储技术和传播技术的不断发展导致电子期刊存储格式过时或数据丢失。
基于上述区别,一个承担电子期刊法定保存义务的机构(如国家图书馆)无需同时经营对电子期刊在线访问的业务,用户可以现场使用国家图书馆保存的电子期刊。这样一来,作为法定保存授权机构仅为电子期刊长期保存提供解决方案,无需为用户永久访问提供服务保障。
1.3 出版商许可
电子期刊的长期保存需要寻求这样一个解决方案:出版商把注意力集中在能够做得最出色的事情上,(如给所出版的内容添加更多的价值),而不是纠结于图书馆对电子期刊进行永久访问的保证上。因此,业界应该设计一套电子期刊永久访问的许可模型,以供出版商与图书馆签订许可访问协议时参考。目前为止,NESLi2[5]许可模型是一个比较著名的实例。
NESLi2许可模型是英国图书馆与出版商之间涉及电子期刊长期保存与永久访问事宜签署的许可协议结构框架。针对永久访问条款,在图书馆停止支付电子期刊许可访问费用后,出版商提供三个选项为图书馆用户继续访问已停购的电子期刊内容。(1)从出版商服务器上获得永久访问;(2)在图书馆的保存设施上提供图书馆以前订购的电子期刊副本;(3)在第三方的保存设备上提供图书馆以前订购的电子期刊副本。
上述第一个选项需要出版商提供完整的内容,第二个选项需要订阅期刊的图书馆履行保存责任,第三个选项是将长期保存职责委托给专业保存系统。既不将保存责任完全交给出版商,也不把责任交给个别图书馆,应该被视为是较好的选择。这样,出版商专注于出版优质内容,图书馆专注于为用户提供优质服务,保存系统则专注于电子期刊长期保存,各司其职,共同建立一个良性的学术交流系统。
1.4 法定缴存
较早对电子期刊实施法定缴存的是英国,2003年的《英国法定缴存图书馆法》[6]扩展了之前的出版物存缴法已包括电子期刊在内的所有电子出版物。自此之后,不少国家立法机构也通过了相似法案,授予国家图书馆接收实施电子期刊的缴存,作为其法定收缴传统期刊在数字时代的延伸,用来保护本国的数字文化遗产。到目前为止,尽管并非所有国家都对电子期刊的缴存进行了立法,但无论是法律形式的还是自愿形式的电子期刊缴存都是出版主体履行的一项社会职责。法定缴存可被视为数字保存的一项重要内容。但由于下述三个因素,导致法定缴存在履行保存职责的同时存在一些局限性。
(1)基于法定缴存的授权,国家图书馆仅履行长期保存职责,没有义务向用户提供在线、全面、甚至增值的检索访问服务,因此无需设计运行检索系统。用户使用法定缴存的电子期刊,只能到现场,就像用户使用缴存的传统出版物一样。但是,这种使用方式完全没有体现电子期刊的数字化信息资源特征。(2)尽管一些国家图书馆已经开始实施电子期刊的法定缴存,但作为一种数字资源长期保存的机制,其有效性的证实需要一个漫长过程。数字迁移和数字仿真是目前数字保存系统广泛使用的长期保存策略,目的是解决数字资源格式的过时导致无法被用户有效访问使用的问题。但是用户访问不是法定缴存保存系统的职责,所以这类保存系统实施数字迁移和数字仿真的必要性目前在业界仍在争论探讨中。因此,认为法定缴存制度是一个不错的电子期刊长期保存解决方案还为时过早。(3)网络环境下,电子期刊法定缴存所基于的出版商国籍身份乃至出版机构所在地都变得越来越模糊,导致法定缴存的界限有时难以清晰界定。比如,STM(科学、技术与医学出版商国际协会)中的大型电子期刊出版商的国际化趋势已很明显,电子期刊的跨国管理和国际化服务已成常态。所以,法定缴存的界限遇到了挑战。
2 四种保存方案的特征分析
到目前为止,电子期刊长期保存方案已有不少,下面仅对四个国际上比较著名的方案进行分析。
2.1 LOCKSS
LOCKSS[7]电子期刊长期保存方案采用联盟制,联盟中的会员有电子期刊出版商和图书馆两类。其基本特点有:一是当图书馆订阅一种电子期刊时,该电子期刊出版商给订阅图书馆一个授权,许可该图书馆采用LOCKSS开源软件从出版商中收割订阅的期刊并将其副本保存到图书馆本地,当图书馆取消订阅时,已收割的订阅期刊副本被永久保存在图书馆本地;二是当图书馆用户访问订阅期刊时,首先链接出版商,当出版商平台无法访问时,转到图书馆本地副本进行访问使用;三是成员图书馆之间通过LOCKSS软件实时比较保存的副本,以确保保存期刊的完整性。
LOCKSS的优势在于:一是高度分布式的保存,能够保证灾难降临到某一个或一些LOCKSS会员时,有足够的副本确保电子期刊的安全;二是确保图书馆用户的无间断即时访问,即使与出版商服务器之间的通信出现短暂障碍,LOCKSS系统可及时转换到访问图书馆的保存副本;三是图书馆获得了对订阅电子期刊的控制权,就像图书馆对购买的传统印刷型期刊的控制权一样,克服了对数字资源授权访问的虚拟性;四是厘清并强化了保存职责,无论出版商的规模大小(LOCKSS联盟中除了STM大型出版商外,也有大量的DOAJ小型出版商),也不管图书馆的用户多少,只要加入该联盟,就共同承担电子期刊的长期保存职责,既有合作,又有分工,LOCKSS证实了这种保存职责共同承担模式的可行性。
LOCKSS的缺憾有:一是LOCKSS系统需要持续的技术支持,尽管大部分技术支持都可远程实施,但出版商和图书馆都需要专门人员监视本地服务器运行;二是图书馆的LOCKSS平台较难与其他数字资源平台整合在一起,增加图书馆的运行成本;三是大型STM出版商对这种高度分布式保存模式中电子期刊的安全性担忧,导致加入LOCKSS的热情不高,这在LOCKSS会员的一些报告中也常有体现。
2.2 CLOCKSS
CLOCKSS[8]电子期刊长期保存方案是LOCKSS的改进版。具体改进有以下内容:一是虽然电子期刊的保存也是由基于分布式的图书馆实现,但图书馆是经过优选的;二是图书馆保存的不再仅限于订阅的电子期刊,而是出版商的所有期刊;三是图书馆保存的不仅是电子期刊论文的出版文件,还包括作者的提交文件,因此,图书馆需要运行两个存档库;四是当遇到突发事件,出版商无法向用户提供访问时,图书馆的保存副本将向所有用户(而不是仅限于本馆用户)提供访问服务。
CLOCKSS的主要优势为:电子期刊长期保存的职责划分更科学,经过选择的一小部分图书馆与出版商共同承担所有电子期刊的长期保存任务,这样至少可以部分解决大型出版商对电子期刊保存的安全担忧。该项特征通过众多STM出版商加盟CLOCKSS已得到证实。但是CLOCKSS不支持图书馆取消订阅后对原订阅期刊的继续访问服务。
2.3 Portico
Portico[2]是第三方机构进行电子期刊保存的解决方案。基本特征有:一是电子期刊出版商以非独占方式许可给Portico进行长期保存,并有权对自己出版且保存在Portico中的电子期刊进行访问和获取;二是图书馆将已订购、获得授权的电子期刊委托给Portico进行长期保存;三是Portico收取出版商和图书馆的保存费用;四是当出版商平台无法提供访问服务时,Portico向图书馆提供原有订购范围内的访问服务。
Portico的优势有以下方面:一是免除了图书馆对订购电子期刊的保存负担;二是基于图书馆与出版商之间的协议,Portico向图书馆订购期刊提供永久使用服务;三是Portico同时提供电子期刊的作者提交文件和出版文件的保存,当后者出现问题时,可基于前者生成后者;四是Portico与其他著名保存系统(如KB)达成协议,建立Portico保存内容的镜像站点,提高Portico的长期保存可信任度。遗憾的是对于图书馆来说,委托给Portico进行保存的电子期刊仍是虚拟的。
2.4 e-Depot
e-Depot[3]长期保存的一个主要对象是STM出版商的电子期刊。其基本特征为:一是基于签订的保存协议,出版商委托e-Depot长期保存;二是针对一般用户,e-Depot不提供在线访问,仅提供现场浏览或荷兰境内的原文传递;三是针对订购电子期刊的图书馆用户,在出版商平台中断服务时,提供访问服务;四是针对进入公共领域电子期刊和出版商停止供应的期刊,面向所有用户提供开放获取。
e-Depot的优势有:一是涵盖的STM出版商多,资源优势明显;二是在数字保存的研究和实践领域中享有很高的声誉,公认技术实力领先;三是同时保存作者提交文件和出版文件,以克服出版文件损坏的风险。但存在缺陷:一是因为e-Depot包含的主要是STM出版商,而这类出版商技术力量雄厚,中断服务几率极小,导致e-Depot提供开放获取的触发事件概率也很小;二是目前对e-Depot所保存电子期刊的访问只能现场实现。
3 四种保存方案对常见访问事件的处理比较
有很多原因导致电子期刊订阅者无法访问期刊内容,有些是可以预见的,比如图书馆经费的削减导致某种期刊被终止订阅;有些是突发的,比如,期刊被出版商撤销。持续时间有些是短暂的,如,暂时的网络故障导致无法访问出版商平台的电子期刊;有些是长期的甚至是永久的,例如,灾难性事件造成的无法访问。发生的频率有些较高,有些较低。导致的结果有些仅引起较小的麻烦,有些导致服务中断。
为了对比上述四种保存方案,列出下面四种导致电子期刊无法访问的常见事件。
事件1:图书馆停止订阅,但要求继续访问已订阅过的期刊。这类事件是由图书馆方面的原因触发的。在停止订阅前,图书馆应该进行风险评估,并制订预案保证对原订阅电子期刊的访问。
事件2:电子期刊的过刊已经不能从原出版商获取。这类事件的出现具有一定的概率,比如出版商合并、出版商改变商业模式、出版商调整出版范围、出版商之间交易期刊出版权等,都会导致期刊的原出版商不再提供过刊的访问。
针对出版商之间期刊出版权交易所带来的问题,英国Sage出版公司制定了一个规则:出版权接收方对接收期刊的过刊保存一般不作改变。比如,2010年,Sage出版公司不再出版期刊,当然,在其出版平台上也不再提供该期刊的访问,但对该期刊的过刊仍然提供两个解决方案——Portico和CLOCKSS。
事件3:出版商停止商业运行,出版的电子期刊也无法获取。大型出版商发生该类事件的概率较低,但小型出版商的发生概率很高,对用户造成的影响很大,甚至难以接受。
事件4:出版商运营过程中服务器出现灾难性失效。该类事件将导致完全中断对出版商电子期刊的访问。虽然发生概率很小,但导致的破坏影响很大。发生的情景如火灾、洪水、闪电袭击或是恐怖主义袭击等致使出版商的服务器以及所有备份完全被毁掉。一般大型出版商的防御措施是异地备份,甚至在世界不同地域建立镜像站点,但小型出版商财力难以负担。
在该类事件发生时,出版商重建访问平台恢复对用户的访问服务可能需要花费较长时间。为了不影响订阅用户的使用,就需要启动电子期刊保存方提供的访问服务,但这种服务的启动需要在出版商与保存方之间事先达成协议。比如,Portico的保存服务协议中指定实行开放访问的条件为[9]:“电子期刊许可方停止出版业务,或暂停90天以内的对其出版物的访问,原因可以是技术的难题、业务的中断、资不抵债的破产等。”该条款的一个前提是出版商在90天之内能够恢复运行,仅在此期间由保存方提供访问服务。
不同保存方案对上述事件的处理有所不同。下表列出了四个保存方案对上述四类事件发生时对用户继续访问的处理情况。
表保存方案对事件的处理情况
4 一个完善的保存方案的各方基本职责
基于上述保存方案的对比分析,一个电子期刊保存方案的基本构成是其各个利益相关方,主要包括图书馆(代表使用者)、出版商(电子期刊的提供者)、保存系统(电子期刊的长期保存者)、国家(作为一个国家地域内所有用户利益的集体代表),每一个利益相关方都应该承担自己的基本职责,只有这样,才能建立一个比较完善的电子期刊保存方案。
4.1 图书馆方面
图书馆是电子期刊的最大用户群体,永久访问是其核心关注。为实现其用户对电子期刊的永久访问,图书馆应承担的基本职责有:(1)强化对电子期刊永久访问困难性的认知,将永久访问纳入图书馆的战略发展规划,并为实现永久访问制定相应的政策和策略;(2)全面分析图书馆中影响永久访问的因素,对其风险和可能带来的损失做出评估,在基于成本效益分析的基础上,做出针对不同因素出现时实现用户访问的预案;(3)永久访问的前提是长期保存,后者需要持续投资,因此,图书馆必须将这项投资纳入到长期预算中,并根据经费情况,制订永久访问实施计划;(4)加强与其他图书馆的合作,共同承担长期保存任务,分担保存费用,减轻单个图书馆的经济负担,降低永久访问不可持续的风险。
4.2 出版商方面
主要职责是:(1)出版高质量的电子期刊,同时确保电子期刊的长期有效性;(2)需向图书馆说明其保存政策以及图书馆取消订阅后的服务政策,尤其是对本文第三部分内容的四种事件被触发时的处置政策;(3)现实的实践是大型出版商常常自行长期保存出版的电子期刊,而小型出版商更倾向于委托给保存系统。理想的做法应该是:至少委托给一个专业的保存系统,不管是大型出版商还是小型出版商,也无论是否自行保存。
4.3 保存系统方面
(1)需拥有一个良好可持续、透明的财务收支模型,并得到尽可能多的出版商加盟,这是保存系统运行可持续的前提;(2)需赢得出版商的信任,以便基于产权许可的方式获取电子期刊的作者提交文件和出版文件,这是保存系统的核心商业资产;(3)需制定所需技术和专业知识支持的获取渠道,以及与出版商的沟通方式,以便处理诸如数据结构、保存格式和检索策略等事项;(4)出版商常对电子期刊进行增值处理,如嵌入引用和多媒体剪切等,但如何保存和向用户提供这些增值处理内容是保存系统的一个困扰;(5)需设定面向用户开放访问的条件和用户范围。条件的例子见本文第三部分的四种事件。用户范围是指当开放访问条件被触发时,是对所有人开放访问,还是仅对当前订阅者,还是包括以往的订阅者,后两种情况需身份验证。
4.4 国家层面上
(1)国家应该立法建立包括电子期刊在内的电子出版物呈缴制度,至少指定国家图书馆履行本土出版电子期刊的呈缴接收和长期保存使命,为防止电子期刊的消失构建最后一道防线。(2)电子期刊的呈缴本保存系统应采取面向用户服务的日常方式(如现场浏览),以及极端事件发生时用户服务的特殊方式(如在线访问)。
5 结语
自古以来,期刊都是学术交流系统的重要组成部分。数字时代,电子期刊扮演着同样的角色,只不过载体和传播方式发生了变化。但是,与传统期刊相比,由于其载体的脆弱性和文件格式的易过时性以及产权保护的困难性,电子期刊的长期保存面临更大挑战。本文在对国际上比较著名的四种电子期刊长期保存方案比较分析的基础上,探讨了一个完善的保存方案中各利益相关方应该承担的基本职责,以期供现有保存方案的完善以及新保存方案的设计参考。
[1]PMC.Pub Med Central Overview[EB/OL].[2015-03-01].http://www.ncbi.nlm.nih.gov/pmc/about/intro/.
[2]Portico.Preservation Approach[EB/OL].[2015-04-20].http://www.portico.org/digital-preservation/ about-us.
[3]Eijic V H.The Development of the Strategy for the e-Depot of the Koninklijke Bibliotheek,National Library of the Netherlands,National and International Context[J].2008(1),91-95.
[4]Jones M.JISC Briefing Paper:e-journals Archiving and Preservation[EB/OL].[2015-03-11].http://www.jisc.ac.uk/publications/publications/pub_ejournal spreservationbp.aspx.
[5]NESLi.NESLi2 Licencefor journals[EB/OL].[2015-04-28].http://www.nesli2.ac.uk/nesli2_lic_01090 3.htm.
[6]The National Archive.Legal Deposit Libraries Act 2003[EB/OL].[2015-03-16].http://www.legislation.gov.uk/ukpga/2003/28/introduction
[7]What Is LOCKSS?[EB/OL].[2015-06-01].http://www.lockss.org/about/what-is-lockss/.
[8]CLOCKSS.The CLOCKSS Archive:A Trusted Community-Governed Archive[EB/OL].[2015-06-21]. http://www.clockss.org/clockss/Home.
[9]Portico.Termsand ConditionsofUse[EB/OL].[2015-07-01].http://www.portico.org/digital-preservation/ terms-of-use.
Comparative Study on Long Term Preservation Solutions ofElectronic Journals
Zang Guo-quan,Zhao Yi
This article discusses several fundamental problems of long-term preservation solution ofe-journals,comparatively analyzes the features of four global famous preservation solutions and methods ofdealing with the common access events,and discusses basic duties of the beneficiaries in a perfectsolution.The above research is to provide
for the long-term preservation solution design ofe-journal forinstitutionssuch as libraries.
E-journals;Long-term Preservation;LOCKSS;CLOCKSS;Portico;e-Depot
G255.76
A
1005-8214(2016)05-0050-05
臧国全(1963-),男,教授,郑州大学信息管理学院副院长,发表论文80多篇,出版学术专著3部;赵毅(1991-),男,在读研究生。
2015-09-22[责任编辑]王岗
本文系国家自然科学基金项目“数字保存经济要素与经济评价研究”(项目编号:71173197)的研究成果之一。