大数据环境下图书全息数据存储管理研究
2014-02-11丁鑫
丁鑫
(南京图书馆,江苏 南京 210002)
大数据环境下图书全息数据存储管理研究
丁鑫
(南京图书馆,江苏 南京 210002)
随着“大数据时代”的到来,各种信息数据量剧增,原有的图书数据存储模式由于其自身固有的缺点,已无法适应这种大趋势。全息数据存储技术是近年发展起来的一种新颖存储技术,具有较高的存储密度及数据传输速率等优点。通过对比分析数字图书馆相对于传统图书馆的先进性,并结合全息存储技术的优缺点,阐述了将全息数据存储技术用于数字图书馆建设的应用前景。
大数据 全息数据存储 数字图书馆
1 引言
信息技术作为一种新兴和极具生命力的技术正在不断地渗透到社会、经济、生活等各个领域。移动计算、物联网、云计算等一系列新兴技术手段的涌现促进了社交媒体等新型应用模式的发展,进而拓展着人类创造和利用信息的范围和形式。据国际数据公司的数字宇宙研究报告称:2011年全球被创建和复制的数据总量超过 1.8ZB,且增长趋势为大约每两年翻一番,预计2020年全球数据总量将达35ZB。与此相对应的是,数据的复杂性特征也日渐增多。例如,现在每天我们都能接触到音像、图片、视频等多种多样的数据资源,这就是数据的多样性;而我们还要及时地接收、处理、利用这些资源,这又迫切需要数据具有实时性。在各种信息轮番轰炸的网络上,不见得所有的数据都是我们所需要的,所以我们还需要对其进行挑选,这无疑会耗费我们的精力。数据的疯狂增长及复杂性的增多意味着“大数据”时代已经到来。
长期以来,图书作为宝贵的知识和人类精神文明的载体,系统地收集、整合、储存了十分丰富的信息资源。在当今信息化高度发展和人类迫切需要分享信息的社会,依附于图书的大量可利用数字资源,需要进行完备的保存。并且,随着计算机网络技术如火如荼地发展,图书也逐渐呈现出信息资源数字化、信息传递网络化、信息利用共享化的发展趋势,这虽然能够提高图书资料的管理效率及人们分享、利用资源的效率,但却对构建数字图书馆所要利用的存储技术提出了很高的要求,即存储设备的存储容量要能够满足更多多媒体数据的存储。而当今的数字资源多种多样,并且需要长久、完好地保存,但对其的保存在某个大范围内并无固定统一的标准,于是,为了完成构建数字图书馆这一重要战略任务,解决现有数据的存储及利用问题已迫在眉睫。
全息存储(Holographic Memory)是一项非常新颖的大容量信息存储技术,它是基于激光干涉技术发展起来的,存储载体为感光介质。近年来,随着新型全息存储材料的不断涌现、相关光电子元器件制造技术的不断进步及计算机技术的逐渐发展,数字全息存储技术在世界范围内引发了研究热潮。
2 数字图书馆的先进性
伴随着全球信息化、网络化进程的加快,人们获取、分享信息的手段也发生了显著的变化,越来越多的人们开始喜欢足不出户就可以购物、订餐、办公、开视频会议及在网上浏览和下载更多的信息资源。无疑,传统图书馆并不能满足人们的这些需求,而数字图书馆则能通过互联网平台,将图书数字资源在更广范围内共享,进而满足人们的需求。因此,数字图书馆是传统图书馆发展的一个必定方向,它作为一种崭新的图书馆模式,其相对于传统图书馆的先进性如下。
2.1 存储载体更加多样化
传统图书馆的存储载体比较单一,主要以纸质载体为主,纸质载体主要有报刊杂志、工具书等。这就决定了图书馆存在必须要有一定的空间住址,如楼房、建筑等;其次,为了方便人们搜寻获取资料的方便,纸质载体还需分类保存,这意味着必须要有一定的保存设施,如书柜、桌椅等。而传统图书馆所需要的空间住址和保存设施无疑是成本的主要来源之一。此外,如果读者借阅纸质书籍资料次数过多,或翻阅时间过长,都难免会使纸张出现破损、残缺的现象,从而影响其他人享用此类书籍资料时的舒适性以及造成纸质书籍资料的使用寿命变短。
而数字图书馆的存储载体与传统图书馆大不相同,主要有录音带、磁盘、光盘及多种多样的数字化、电子化装置等,其存储介质的形式也打破了原有印刷体的局限,变得更为广泛,主要包括文本、声、光、图像、影视等数据信息。信息检索手段也随着存储技术的与时俱进而变得愈加智能化,读者可以获得更为活泼、具体、生动的信息。
2.2 服务更加便捷
传统图书馆的一个显著标志是物理的图书馆建筑,读者享受的服务必然局限于特定的时间空间内;相比之下,数字图书馆对读者的服务则是基于一个庞大的通过宽带高速互连的计算机网络,它所提供的信息资源来源更广,或整合了一个国家的众多图书馆资源,或按照一定的标准将不同地域甚至是全世界可利用的信息资源收集、存储与管理起来。只要有网络遍布并且获得数据库访问许可的地方,图书馆都可为读者提供信息服务。换句话说,读者在享受数字图书馆的服务时,能够不受空间和时间制约,这样极大地方便了读者的学习与工作。数字图书馆对读者提供的服务更为便捷,更能顺应时代的发展潮流,更能受到人们的欢迎。
2.3 图书馆管理员扮演的角色更加深刻
传统图书馆管理员主要负责收集、整理、保存、传播文献信息,以确保图书馆正常流通和阅览的功能,他们所扮演的是社会文化传播者的角色;而数字图书馆管理员则不仅要成为信息采集者、管理者和传播者,还要成为利用文献信息的导航员。借助于网络平台的广泛性和便捷性,数字图书馆管理员可以随时更新各种图书、文献等资源信息,并且提供便捷的多媒体远程数字信息以引导读者。因此,他们扮演的角色也由被动的文化工作者转变成了主动的教育工作者。由此可见,数字图书馆更能对人们“投其所好”。
3 全息存储技术及其在数字图书馆的应用前景
面对“大数据”时代的到来,图书馆对信息的需求量越来越大,人们对文本、声、光、图像、影视等数字信息的获取与传输需求也越来越迫切,进而对信息存储、处理的要求也越来越高。传统的光盘存储和磁盘存储等技术手段已达到其技术瓶颈,无法适应当今“大数据”时代的发展潮流。就在传统图书馆其固有存储与管理系统无法打破自身局限时,全息存储技术作为一种极具高效能和前瞻性的技术呼之欲出。全息存储技术具有高存储容量、高读写速率、可并行寻址、便于长期保存和拷贝复制等优点。下面将对其优缺点及在数字图书馆的应用前景进行详细阐述。
3.1 全息存储技术的基本知识介绍
自 Dennis Gabor20 世纪 80年代提出了全息术,全息存储(Holographic Memory)这一概念就进入了人们的视野。全息存储的技术原理是基于全息术,即先以全息照相的方式存储信息,然后通过两个光波之间的耦合和解耦合,结合信息存储和信息之间的比较(相关)、识别,甚至联想的功能,即将信息存储和信息处理结合起来。超高密度是全息存储技术最为令人瞩目的优点,可以打个形象的比方来说明,1500张CD光盘的数据总和大小约为1TB(1TB=1024GB),而如此庞大的数据可以完全存储在与一个糖块大小相当的特殊立方体中。另外,通过控制芯片具有的超强数据处理能力,全息存储技术可以拓展提供高达1000TB的容量。这个容量是目前硬盘所具有的最大容量750GB的数倍。自2004年全息通用光盘(HVD)面世后,全息技术开始转向低成本,并逐步向消费者普及。近年来,全息存储技术的发展伴随着光电子技术、计算机技术的发展而呈现出高速发展的势头。
3.2 全息存储技术的优点
3.2.1 容量高
全息存储具有较高的存储容量。在全息存储材料上形成的是体积全息图,那么存储介质越厚,其存储的容量也会越大。光束的波面位相、波长和入射角度都会影响体积全息图的再现。因此,可通过改变光束的波面位相、波长和入射角度来实现在同一存储介质中存储多重全息图。使尽可能多的全息图存储在同一介质中,能够增加存储密度,因此这是提高全息存储容量的有效途径。为此,我们已开发了混合复用共同体积、混合服用材料面积及复用空间技术来帮助提高存储密度。
3.2.2 读写速率快
传统存储技术存取数据采用的方式是:按“位”操作,以串行方式逐点存取数据。而与传统存储技术存取数据的方式不同,全息存储技术是采用“页面”方式并行来记录和读出。以页为单位存储和利用内在的并行性来恢复数据,其读出数据率达到1GBPs。全息数据库由于可以用参考光束的空间位相调制或无惯性的光束偏转等非机械手段进行寻址而不必采用传统光盘存储必须采用的机电式动臂结构,因而具有较高的读写速率。信息以页为单位,并行读写。
3.2.3 可靠性高
对于传统的光盘存储或磁存储,如果存储介质一旦遭到损坏,那么便很可能造成存取信息的破坏或丢失。而在全息存储中,所采用的全息存储材料具有良好的稳定存储性能,即使存储载体局部有缺陷或部分损坏,虽然清晰度会有所下降,但仍不妨碍读出已存储的全部数据。例如,银盐记录载体是一种很热门的全息存储材料,其保存寿命经前人研究证实,可达数百年以上。
3.2.4 具有关联寻址功能
全息存储器具有的寻址功能与产生的不同方向的“参考光”有关。对于块状角度复用体全息存储,一系列方向迥异的“参考光”在用某物光照射由角度多重法存储的多重全息图后将被识别而读出。输入图像及其对应存储图像之间有一定相似程度,而各“参考光”的强度大小便与之相一致。这样,即使在不知道地址的情况下,也可通过用强度最大的“参考光”读出目标数据页。这就是所谓的关联特性,利用此特性,全息存储器才具有了关联寻址功能。该功能对基于图像相关运算的数字图书馆的检索与管理应用方面影响匪浅。此外,“参考光”可采用声光、电光等,系统可获得一个很快的寻址速度,这可大大降低数据访问时间。
3.3 制约全息存储技术发展的因素
全息存储技术的显著优点有目共睹,即高存储量、较高的存储可靠性和高传输速率等,但其具有的缺点从某种程度上也限制了它的实际应用范围,因此不容小觑。下面将制约全息存储技术发展的因素一一介绍。
3.3.1 不易抑制的噪音干扰
全息存储读取数据过程中难免会产生噪声,这将会干扰全息存储的工作过程即用激光曝光光盘上的图像后,再通过捕捉物镜进行解码,进而影响全息存储数据的准确性。面对这个难题,Optware和InPhase公司采用的解决办法是,通过纠错和编码方式来确保数据的准确性。这是目前抑制噪音干扰的一个有效做法,但也造成了另一个附加难题即读写速度受到限制。此外,产生的噪声干扰还会降低可使用的存储容量。例如,探测器发出的噪声干扰可能会使全息图难以读出,进而导致全息存储容量受到直接影响。
3.3.2 对震动和温度太敏感
除了难以抑制噪声这一难题,全息存储对震动和温度特性也相当敏感。在全息驱动器读取数据过程中,光盘的旋转无可避免地会产生震动,而略微的震动也会很容易导致全息成像出现误差。因此全息驱动器要保证读取数据的准确性,必须依赖具有较大体积和更为复杂的避震系统。这从一定程度上导致了全息驱动器成本的居高不下。
3.3.3 价格较高
目前,全息存储光盘虽然具有超大存储容量、超高存储密度和较快的存取速度等诱人的优点,但其较高的生产成本所导致的高价格还是让众多用户望而却步。由此可见,全息存储光盘如果想在未来市场上占有一席之地,高价格是要突破的瓶颈。
3.4 全息存储技术在数字图书馆的应用
数字图书馆是未来人类精神文明建设发展的重要载体和催化剂,是传统图书馆的发展方向和必然趋势,为了方便存储与管理海量数据,并保证存储数据的快捷性和准确性,数字图书馆势必要构建更广阔的信息存储平台以适应存储数据的发展趋势。实践经验表明:在数字图书馆的建设中,我们发现很多数字信息的存储、传输与检索速度都不能达到人们的要求,因此能够在数据存储、传输与检索速度方面取得突破的全息存储技术便受到了人们的广泛关注。一个庞大的信息存储系统的容量能够达到PB级。在数字图书馆的应用方面,全息存储根据存储对象或存储材料具体可分为3种类型:图像全息存储、数字全息存储、三维盘式全息存储。
3.4.1 图像全息存储
传统的图像扫描技术具有占用较大空间、操作繁冗、排版困难和显示效果不佳等缺点,而图像全息存储技术能够克服以上缺点,对数字图书馆原印刷版的图像数据信息达到最佳的保留效果。
3.4.2 数字全息存储
数字全息存储器能够在整个数据库内实现快速搜索内容是基于关系型数据库的应用。用户能够根据需要的内容对数字图书馆里的数据进行查询。
3.4.3 三维盘式全息存储
三维盘式全息存储的方法可同时实现高密度和大容量的存储,其在全息光盘上记录的数据形式是傅里叶变换全息图,也即每个信息页面是数字数据的二维排列。这种全息图分布在全息盘的同心圆轨道上,在空间分布上既不完全分开也不完全重叠,其中对于同一轨道或相邻轨道上的全息图都可以有部分重叠。在进行全息图记录和读出时,参考光和照明光的角度都无需再调整设置。对于寻址,盘面旋转能够完成同一轨道内全息图的寻址即切向寻址;读写光学系统与盘面的相对平动能够完成对不同轨道的寻址即径向寻址。
4 结语
全息光存储的发展虽然伴随着严峻的挑战,但与传统的光盘、硬盘存储、半导体存储以及近年来比较热门的光存储技术相比,其特有的超大存储容量、超高存储密度和极快的存取速度等优点仍吸引着人们在图书全息数据存储管理方面不断地开发、探索与研究。全息光存储的研制方向即朝着实现存储容量达到TB量级和数据传输率达到1Gbps迈进。相信随着新型存储材料的推陈出新和关键器件的研发,将全息光存储应用于数字图书馆的建设并非遥不可及。
[1] Gantz J,Reinsel D.2011 Digital Universe Study:Extracting Value from Chaos[M].IDC Go-to-Market Services,2011.
[2] 张文彦,武瑞原,于洁.大数据时代的图书馆初探[J].图书与情报,2012(6).
[3] 马翠平,马秀峰,李彤彤.全息存储在数字图书馆中的应用[J].图书馆学研究,2010(8).
[4] 周莹莹.数字图书馆与传统图书馆的比较研究[J].文教资料,2010(2).
[5] 裴建华.数字图书馆与传统图书馆比较研究[J].丝绸之路,2012(14).
丁 鑫女,1982年生。在职研究生,馆员。研究方向:图书馆建设与服务。
TP333
2014-05-15;责编:王天泥。)