APP下载

数字档案备份初探

2015-11-26河南省驻马店市城市规划档案馆贾鹏飞

办公室业务 2015年20期
关键词:存储介质备份数字

文/河南省驻马店市城市规划档案馆 贾鹏飞

随着信息化在生活中的不断深入,人们对计算机系统的依赖程度提高,数字化的档案信息较以往已经成倍地增加,一旦数据遭到窃取、泄露、丢失,都将会对社会带来巨大的打击。在面对这些威胁的时候,数字档案的备份工作就显得越发重要。备份就是将数字档案通过一定方式进行保留,当数据信息遭到外力损坏时能够在最短时间内恢复并再次使用的过程。

一、数字档案备份研究现状

我国数字档案备份工作起步较晚,以“数字档案备份”作为检索词,对已有学术数据库进行搜索,获得文章3352篇,这些文献涉及到经济、建筑、气象、计算机、法律等40个学科。其中研究重点包括备份技术、模式、载体等各个方面。通过对这3352篇文章进行分析,得到以下结果:我国最早提到对数字档案备份是来源于1977年颁布的《无线电广播技术维护制度和管理办法(草案)》,并且于1998年首次提出了电子时代档案的保护。以“数字档案备份”and“方式”为检索词进行检索得到1871篇文章,我们会发现在2001年前只有零星几篇文章,2001年美国911事件和2008年汶川地震成为档案学者对数字档案备份工作研究的时间转折点,文献数量呈几何级增长。在这1871篇文献中,对引用次数较高的文献进行查阅,得出具有代表性的观点。孙晓霞、王洁在其《数字档案备份中心的备份模式及其选择》中将档案备份分为两种方式。基于不同空间范围:原地备份、异地备份。基于不同建设方式:自建模式、共建模式、外包模式。赵生辉、侯文希在其《政府信息资源灾备体系建设模式综述》中将数字档案灾备分为两种。基于灾备范围的分类:本地灾备、异地灾备、区域灾备和分布式灾备。基于建设方式的分类:自建、互助、共享和外包。

二、影响数字档案信息安全的因素分析

数字档案开放利用和其他各种不确定因素的威胁,使得数字档案在长期安全保存中存在诸多的问题,社会各界越来越多地关注和研究数字档案的安全问题。

随着各国政府积极推动办公无纸化这一措施,越来越多的档案文件开始通过计算机网络来进行传输、保存。计算机在对档案收集、整理、保存、利用等方面产生积极效果的同时,也由于计算机在硬件、软件、环境、人员等方面存在的风险给数字档案安全带来了不小的安全隐患。总体来说,数字档案安全受到以下方面的威胁:

(一)自然灾害。自然灾害对人类社会带来的破坏力是惊人的。地震、洪水、台风、火灾这些灾害具有范围广、破坏力强的特点,往往在人们意料之外给档案文件带来毁灭性的打击。例如在2008年发生的汶川大地震,强烈的地震波无情地吞没无数生命的同时,它摧毁房屋,使得灾区大量的档案库房坍塌损毁,档案文件或被水浸泡或被乱石掩埋。胶片、硬盘、光盘这些新型材质,因对火和水的高度敏感性,使其在遇到水灾、火灾时,会变硬变脆甚至粘连在一起,如果不及时抢救,将导致严重的后果。据估算,建国以来,全国各级档案馆因火灾而导致300万份档案损毁。

(二)硬件故障。墨菲定律告诉我们,会出错的事总会出错。档案是“前世赖之可以告古,后世赖之可以告今”的宝贵历史材料,我们并不希望它只能保存10年、20年,而是千年甚至永久。高密度的现代数字档案存储介质在长时间高速运行的时候发生故障是无法避免的,硬盘驱动器损坏、服务器故障、电源中断等等因为质量、环境等因素导致的故障,会给档案机构造成无法弥补的损失。根据EMC公司在年初发布的报告中我们不难发现,在2014年的12个月中,因为数据丢失和宕机而造成的直接经济损失达到惊人的1.7万亿美元,这相当于制造业大国德国近一半的GDP。而从2012开始,数据丢失比例增长4倍的同时,令人伤心的是,有超过2/3的企业并不认为自己能够恢复这些数据。调查的同时,我们得到Kroll Ontrack公司最新的调查数据,结果显示在EMC的报告结果中,惊人的72%的数据丢失是由硬件故障导致的。

(三)人为入侵。如果说因为自然灾害、硬件故障而导致的数据丢失还给数字档案所有者留有恢复余地的话,那么来自人为入侵、破坏而导致的数字档案、数据的丢失将是难以弥补的。这方面的破坏主要包括计算机被盗取、存储服务器网络遭到黑客入侵,数据被篡改、删除。

(四)软件因素。我们这里指的软件因素包括相对于硬件设施而言的操作软件故障和操作、维护数据存储系统的档案管理人员。软件故障大多是指存储系统设置不正确、存储系统更新不及时给数据存储系统正常运行带来困难。数字档案保管机构的操作人员是数字档案的直接接触者,其自身素质影响着存储的数据是否安全。在日常管理中,常见的由于操作错误而导致的误删除占到各类问题的80%左右。数字档案的安全存储始终要坚持“三分技术、七分管理”的原则,这说明了规范管理是确保档案信息安全的重要因素。

(五)数字档案存储介质的不稳定。现代新型的存储介质使单位密度上能够存储的数据量成倍增长,但其使用寿命却远不及传统的纸质载体和缩微胶片。一般而言,光盘的保存期限为5~100年、磁带的保存上限为30年,磁盘的实际寿命只有5~10年,这还不包括因为日常误操作而导致介质损坏、保存环境不达标造成存储介质腐坏。根据日本国会图书馆对2003年前入馆保存的电子文献进行调查发现,69%存在利用困难的文献中有12%是由于存储介质导致的。

(六)数字档案存储格式的不稳定。网络、计算机、信息系统是数字档案的基础,也是影响数字档案安全的主要因素。随着计算机技术的飞速发展,平均每3个月就有一种计算机语言面世,而语言间是不存在沟通互换的。数字档案是基于一种语言存储在其对应的信息系统中的,随着时间的推移,这个特征会给数据档案的正常读取带来困难。

三、数字档案备份方式

(一)数字档案备份的基本分类方法。1.根据备份介质分类:(1)磁盘备份。现今我们选择磁盘进行备份主要包括了内部的硬盘和外部的磁盘阵列。硬盘具有读写速度快的特点,是进行实时备份的最佳选择,然而数字档案备份的首要前提是保证数据安全稳定,硬盘由于在运行中容易出现故障,决定了其只适用于小范围的实时备份系统。之后出现的磁盘阵列技术保留了前者的高速持续读写这一特点,又增加了利用冗余信息的方式使磁盘失效时不会使访问数据受损主要有RAID0、RAID0+1、RAID5三种,后三者配合热插拔技术可以实现数据的在线恢复,是未来数字档案的主要存储介质。(2)磁带备份。磁带备份技术由于价格低廉、存储量大、易于保管是目前产量最大和用途最广的存储方式。磁带是出现最早的存储介质,其标准化程度高,目前技术最成熟的DLT8000磁带机读写速度可以达到30M/S,适合大型档案馆、数字中心保存数字档案。但是,磁带的数据结构是成线性排列,不利于档案信息检索。(3)光盘备份。光盘是以塑料为盘基,金属为涂层,记录光信息的存储介质。比起硬盘,以光盘为备份载体可以节省大量资金,又可以通过光盘库技术将多张光盘组合起来,实现信息的海量存储,并且具备硬盘的高速读写功能。但是,以金属为存储介质的光盘,会因为金属的氧化而造成数据丢失。目前好的光盘能够保存20年左右,不好的只能保存2年,不能够满足数字档案的长时间安全存储。2.根据空间范围分类:(1)本地备份。本地备份是指在档案馆所在地进行数据备份,在本地建立容灾备份中心,这种建设方式只能保证主服务器数据在遭到人为破坏后保证业务流程的连续性,但是在遇到区域性自然灾害时不能够发挥作用,只能作为异地备份的补充。(2)异地备份。异地备份方式主要包括了三种:一是远程异地备份,是指将数据档案备份到不属于同一地震带、同一电网、同一河流流域、同一海岸线的区域,确保在灾难发生时,数字档案不被丢失。二是互助备份,是指两个不用地理环境的政府通过签订协议,将数字档案传输到对方系统中进行存储,这种方式不需要另外建设库房,以最小的投资,最大限度地提高了档案馆的容灾能力。三是区域备份,区域备份是指区域政府为了保护区域内数字档案的信息安全,通过政府出资建设区域备份中心,提供给区域内用户使用,实现数字档案集中备份管理。3.根据建设方式分类:(1)自建模式。自建模式是档案馆依托自身力量建设的数字档案备份体系,这种模式要求了档案馆需要具备足够的资金、专业的技术人员,建设难度大,后期维护困难。但是这种方式能够最大程度满足自身数字档案备份的需要、安全性高。适合于大型的国家档案馆。(2)共建模式。共建模式是两个或两个以上档案馆共同出资建设。优点是节省财力物力人力,缺点是多家档案馆共同管理可能会导致职权不明确、责任认定不清楚。是目前国内政府档案机构使用范围最广的一种方式。(3)外包模式。外包模式是指将数字档案备份工作交由专业的服务提供商来解决,由提供商来分析数字档案的方式,给出最佳的备份方式和服务。这种方式的优点是投资少,缺点是不能保证数据的保密性。适合于小型并且对保密性要求不高的企业。

四、基于云存储的数字档案备份策略

随着信息社会的来临,信息作为人类发展与进步的动力,在人类社会中扮演的角色越来越重要,它已然成为继物资、能源的“第三大动力”,其载体形式也由过去单一的纸制、胶片保管存储发展到近来最热门的数字化档案备份与存储。为了有效地开发利用档案信息资源,最大地发挥档案的价值,世界各国都在积极利用现代化技术和设备建设数字档案备份中心,但总体来说,由于数字档案馆需要占用大量土地资源、后期的设备维护、人员经费开支等诸多因素都影响了数字档案备份中心的建设,中小型企业在巨大的资金压力下,对数字档案备份中心的建设只能是望而却步,使其只能在大型企业集团、国家政府中得以利用,对数字档案的系统延续造成破坏。本人在借鉴他人研究成果并结合实际工作中遇到的问题,基于现有云技术的推广以现有几家云存储工具为例,对未来云环境下数字档案备份工作提出见解。云存储是由云计算技术延伸过来的新型概念,是一种新型的存储技术。云存储利用云计算技术的集群应用、网络技术和分布式文件系统等功能,将大量的网络存储设备通过并行协同软件集合起来,共同向外部提供数据存储和业务访问功能。简单来说,云存储就是将需要存储的资源放到“云”上供人存取,使用者可以在任何时间、任何地点,通过连接到网络的授权设备对数据进行操作。

(一)云存储的不利因素。1.数据的隐私保护。使用本地建设来进行数字档案的备份虽然耗资巨大,但是在对数据档案的隐私保护方面是有保证的,新型的云端存储是将数据放到网络之上,在获得极大便利的同时,将失去对数据的物理地址控制,所有的数据访问权限交由云提供商处理,意味着数据的保管责任部分转移,给数据隐私保护带来隐患。2.数据的安全保护。数字档案的存储是为了尽量保证数据零损毁。当需要进行网络数据恢复时,云端数据因为种种原因丢失,云存储提供商只能进行赔付,但并不能为用户找回数据。微软曾在2009年冬天,因为SIDEKICK故障,导致用户不能访问邮箱、日历等一系列服务一个星期,微软随后表明因为管理人员忘记进行备份操作,导致数十万用户数据永久丢失。国内的盛大云磁盘在2012年因为位于无锡的物理机本地磁盘损坏导致用户数据丢失,造成巨大损失。

(二)云存储的优势。1.节约成本。云存储技术的应用对数字档案备份成本的影响是巨大的。一般来说,传统的数字档案备份中心建设需要耗费巨大的资金,而档案部门在企业部门中一向是处于末位。传统的数字档案备份对存储介质的要求极为苛刻,必须兼容系统的要求,而存储技术的发展是迅速的,云存储的利用可以使得档案部门在不需要购买设备的情况下,享受到优质的服务。云存储提供商大多采用的更加环保绿色的节能技术,包括通过对太阳能的利用,冷却水的循环,支持基于性能加速技术的低能耗串口盘作为存储载体,可以实现高速的网络备份,整体能耗远低于传统的数字备份传输。2.可靠持续性服务。传统的数字档案备份中心系统管理中,档案操作人员往往需要同时操作不同的存储设备,使用不同的存储设备需要档案操作人员了解每个组件的具体性能和操作方式,使得工作复杂而繁重,不利于数字档案的安全备份保管。云存储提供商依托自身多机房部署保证数据访问稳定,通过冗余备份应用系统保证可以在极短的时间内还原业务系统,大大缩减了灾难后的数据恢复时间,提高灾难恢复的效率。相比于传统的数字档案备份中心容量扩容,云服务商提供的云存储采用并行存储管理系统,当使用者需要对容量进行扩大时,不再需要对存储服务器进行配置和调试,降低了因为配置错误而造成的服务器宕机,威胁到数字档案备份工作的进行。3.提高竞争力。通过使用云存储,利用最新的虚拟化和管理创新,在提升效率的同时简化基础结构。根据微软公司提供的数据,云存储成本大约只占到SAN存储的四分之一。IDC的报表介绍到,一家典型商业机构的数据存储量每年平均增长50-60%,但只有其中一小部分数据需要经常使用。SAN/NAS等完全本地化的数据存储对于此类数据存储比较昂贵。

对于中小型企业来说,市场规则总是在不断变化,企业需要实现精益并保持精益,减少不必要的投入,而在必要时迅速扩展。云服务商提供的云存储服务现已提供数据分析服务,在随时随地处理业务的同时,帮助企业在竞争中领先。

在当今的企业环境下,人们的最新标准是要用较小资源做更多的事,充分利用每一笔投资是大势所趋。

综上所述,传统的存储技术在面临信息时代数据量的爆炸式增长暴露出局限性的时候,使用云存储能够解决其中一些难题,表现出一定优势。但是,由于现阶段云存储还不是很成熟,其存在的各种问题是开展数字档案备份工作不得不考虑的问题。

[1] 王巍.数字档案长期安全保存对策[J].信息化建设,2008(03):36~38.

[2] 范韫.重要数字档案异质异地备份探析[J].数字与缩微影像,2012(01):25~28.

[3] 孙晓霞,王洁.数字档案备份中心的备份模式及其选择[J].浙江档案,2012(12):54~55.

[4] 丁宜.档案异地备份研究[D].安徽大学,2013.

[5] 姜岩.数字档案保管模式比较研究[D].黑龙江大学,2014.

[6] 杨景云.远程容灾系统的研究[D].浙江工业大学,2012.

[7] 梁艳萍.档案异地备份研究[D].郑州大学,2011.

[8] 周丹.关于档案登记备份制度的理论思考[D].浙江大学,2011.

[9] 许桂清,赵荔.电子档案异地容灾备份中心建设的实践[J].中国档案,2010(04):62~64.

[10] 谭必勇,张莹.电子政务环境下数字档案登记备份体系的构建研究[J].浙江档案,2010(12):5~9.

[11] 陶水龙.档案数字资源云备份策略的分析与研究[J].档案学通讯,2012(04):12~16.

[12] 王玉龙.“云”环境下的档案异地备份方案设计[J].上海档案,2012(06):10~13.

猜你喜欢

存储介质备份数字
“备份”25年:邓清明圆梦
档案馆移动存储介质管理方法探讨
答数字
一种使用存储介质驱动的方式
数字看G20
浅析数据的备份策略
硬盘
成双成对
出版原图数据库迁移与备份恢复
医院环境下移动存储介质的信息安全管理