APP下载

谈档案馆数字档案的存储备份介质及利用

2017-03-11乔丽苑华伟

兰台内外 2017年1期
关键词:磁盘阵列存储介质磁带

文/乔丽 苑华伟

谈档案馆数字档案的存储备份介质及利用

文/乔丽 苑华伟

数字档案馆与传统档案馆相比,有着丰富的档案数字化资源、便捷的检索、快速的传输、高度的开放、信息共享等优点。为适应信息社会日益增长的对档案信息资源的利用需求,各级各类档案馆运用现代科技手段对数字档案信息进行采集、加工、存储、管理,并通过各种网络平台提供档案信息服务。

一、档案馆藏数字档案现状

以某档案馆为例,自2010年6月国家档案局印发《数字档案馆建设指南》以来,该馆在原馆藏档案数字化的基础上,加快了数字档案馆的建设工作。至今已完成馆藏案卷级、文件级档案四百余万条,挂接电子档案1450万页,数据量达到了24TB。目前,馆藏档案数字化工作仍在继续进行,增量电子档案接收工作同时也在稳步开展。

随着馆藏档案数字化进程的不断加快,数据量的迅速增长,给档案馆数字档案的存储、备份及管理利用等方面带来了很大的工作压力。

二、馆藏数字档案存储介质

目前,没有任何一种存储介质可永久地保存数字档案和数字信息资料。该馆现保存有缩微胶片、光盘、磁带、硬盘四种介质的数字档案。

1.四种介质的比较。一是从容量上比较。磁盘阵列单盘可达8TB,目前最大;磁带单盘可达2.5TB,压缩后可达6.2TB;蓝光光盘单盘可达100GB;缩微胶片最小。二是从速度上比较。硬盘速度最快,光盘次之,磁带和缩微胶片需要依靠特殊的设备读取,速度都较慢。三是从价格上比较。硬盘和光盘最经济,缩微胶片和磁带次之。四是从作用方面上比较。缩微胶片与光盘的存储占用空间小、保存时间长,易于交换与复制,有利于异地异质备份。磁带存储发展虽然已有60余年,但对于海量数据来说,占用空间大,保存环境要求高。硬盘从价格及兼容性方面来说都不是最好的选择。

2.数字档案存储难题。在数字档案馆建设中,存储系统通常以磁盘阵列作为核心存储设备,利用磁带进行数据备份。这种存储架构,能够满足很多行业的需求,但对档案馆这种特殊行业,存在诸多问题。磁盘阵列与磁带均属于磁性介质存储,它们对设备的依赖性强,必须依赖于指定的设备才能读出。如设备发生故障、系统瘫痪、病毒干扰等,数字档案就无法读取。一是磁盘阵列虽然存储量大,读取速度、数据信息的备份与恢复性能快,但它的寿命有限。它采用驱动器与存储介质一体化的形式,其机械故障易造成硬盘的整体更换,磁盘阵列的硬盘通常不能离线或移至其他磁盘阵列读取。到一定时间后需花费巨大的人力、财力进行数据迁移。二是磁带存储的优点是体积小、成本低、寿命较长,但可靠性差,需不定时进行倒带,存放磁带的环境要求高,维护磁带机的成本较高。它没有统一国际标准,必须使用指定品牌或型号的带库,且它的兼容性不好。在国际上,磁带的大小没有统一标准,不同品牌的磁带机互不兼容,同品牌的磁带机隔代也不兼容。要保证数字档案数据的安全可靠,数据必须迁移,带来很大的成本,也存在很大风险。三是光盘存储伴随科技的发展,它的容量已大大增加。它体积小、重量轻、价格低,稳定性好,寿命较长,可达70-200年,且光盘中的数据一旦写入将无法更改。四是缩微胶片优点是性能稳定,成本较低,密度大,携带方便,数据无法更改,寿命长,但检索速度慢,查阅率低,用一件需要调一盒,保存条件要求高,需定期检查防止粘连,易损坏,设备投资大。

3.安全问题。利用磁性介质存储数字档案信息,在数据安全性方面存在隐患。一是数据可修改、可删除。二是计算机病毒、黑客,非法网络入侵,造成的数据丢失或篡改。三是有意破坏存储装置,造成数据丢失或无法读取,例如磁脉冲破坏、短期高温等。四是人为或偶然事故造成的威胁。如工作人员操作失误而产生的不可预知的事件、网络系统软件硬件的故障、电子系统故障引发的系统问题等等。

4.存储介质规范化管理需要具备的条件。一是基于档案的重要性,数字档案信息存储介质需具备长期的安全保存年限,应有几十年、百年甚至以上的寿命。二是长期的兼容能力和持续发展能力,当介质升级时存储系统能够依然支持该存储介质。三是数据具有物理不可篡改的写入方式,较低的环境保存风险,较低的系统性、偶发性数据丢失风险。四是介质可离线保存。五是数字档案信息存储格式需要符合国家标准的格式,选择开放格式或主流格式,满足数据长期存储和读取的兼容性要求。六是要求数字档案信息存储设备与存储介质需要较低的依赖性。

三、馆藏数字档案管理利用

该馆是根据上述原因综合考虑取舍,将原有IT架构即磁盘阵列+磁带备份的老旧存储架构模式,变更为全新的基于磁盘阵列及光盘库的分级存储系统,即“磁光混合分级存储”来保存馆藏数字档案信息,用以建设数字档案馆存储系统。把全部数字档案信息存放在光盘库上,磁盘阵列作为辅助存储,将频繁使用的部分数据,从光盘库调入磁盘阵列,提高系统的响应效率,满足应用的需要。

1.磁光混合的分级存储模式。它由光盘库设备及数据归档管理平台软件两部分组成,结合已有馆藏数字档案综合管理系统,及磁盘阵列设备形成完善的数字档案管理、存储、备份及利用解决方案。采用存储集成方式,将馆藏数字档案综合管理系统,与数据归档管理平台进行存储集成。现有馆藏数字档案综合管理系统与光存储的数据归档管理平台,进行接口集成实时的数据归档,以及实时调阅查询利用。蓝光存储系统接收到数据,写入蓝光存储并在磁盘阵列中进行缓存存储,根据设定自动缓存策略进行清理或近线离线回迁,管理系统向数据归档管理平台发送调阅命令,平台根据数据存储位置,自动将数据返回给管理系统完成调阅,实现快速便捷的馆藏数字档案管理及利用服务。现该馆采用的分级存储系统,以光盘库为核心存储,用于存储全量数据,同时起到数据稽核、备份、容灾的作用,用以满足档案数据安全、稳定、长期存储备份及利用的需求,进而降低数据存储的购置、维护及迁移成本。在线磁盘作为辅助存储,用于满足高频度访问需求或临时存储数据需求。存储系统能够综合各类存储的优势,满足不同要求数据的存储、利用需求。同时系统提供数据在线、近线、离线的一体化分级存储服务。能够根据数据的特性,使用频率及响应要求自动分级存储。磁光混合存储,应用光存储实现数据长期安全存储,应用磁盘存储满足数据在线高效利用需求,实现不同特性存储设备的最佳利用,为数字化档案馆提供稳定、安全、高效、经济的存储系统。

2.磁光混合分级存储模式优点。系统可按照法规、制度的要求,依据数据的重要程度、保存年限,采取不同的备份策略。一是支持短期备份,电子档案数据的安全保存期限在5年以内。二是支持长期备份,存储介质具有较长的寿命,电子档案数据的安全保存期限达到十年、三十年及永久保存等多种长期备份需求。三是支持多介质备份。四是支持离线备份,并具有较好的离线管理功能。

3.分级存储备份策略及恢复机制。备份和恢复技术是数据保护策略的基础,保障系统安全性、可用性,系统采用标准的数据库备份管理策略,定期全备份,每日对系统进行增量备份,保障系统运行。作为数字档案存储的系统,系统提供多种存储数据容错机制。

4.光存储多数据副本备份策略。一是副本备份机制。多份不同用途的副本的自动生成,系统根据配置自动生成不同用途的副本,副本用途支持查询、备份、封存等多种用途管理。二是副本容错当系统检测光盘数据访问因灰尘等环境及人为原因造成数据异常时自动发出提醒切换访问副本。

5.磁光备份机制。一是光备份机制。当在线磁盘出现异常后或服务器出现严重故障可通过光盘数据完整恢复档案信息。二是存储逆向恢复机制。系统提供在服务器出现异常,造成档案系统中数据丢失后的存储数据恢复功能。系统可以自动扫描光盘中数据,恢复至系统中,继续提供档案利用服务。

6.磁盘阵列储存备份策略。根据档案数据变化的自身特点,数据一旦存储,若干年内只增不减,采用“完全备份加增量备份”的策略进行磁盘阵列存储备份。

(作者单位:长春市二道区人民医院吉林省档案馆)

猜你喜欢

磁盘阵列存储介质磁带
考虑问题要全面
老磁带真的值钱吗
更换磁盘阵列磁盘
档案馆移动存储介质管理方法探讨
LSIRAIDBIOS实现磁盘阵列重建
一种使用存储介质驱动的方式
创意磁带
条形码在磁带管理中的应用
医院环境下移动存储介质的信息安全管理
存储虚拟化的三个层次