数字图书馆的云服务发展方向
2013-09-11孙冬雪
孙冬雪
(辽宁省图书馆,辽宁 沈阳 110015)
1 数字图书馆与云服务的定义
1.1 数字图书馆
准确来说,数字图书馆是诞生在网络信息环境下的一种将信息咨询服务、数字化服务以及数字存储相整合的服务方式及理念。它可以将大量的信息整合或分类,在海量的数据库中进行链接,通过网络不限时间、不限地域地向读者提供服务,它将存储知识、传播知识集于一体,全天候地为每一位读者服务。
1.2 云服务
简单地描述,云服务足够智能,能够根据用户的位置、时间、偏好等信息,实时地对用户需求做出预期。在这一全新的模式下,信息的搜索将会是为用户而做,而不再是由用户来做。无论采用什么设备,无论需要哪种按需服务,用户都将得到一种一致且连贯的终极体验。
2 数字图书馆建设及与云服务的差距
2.1 检索方式
随着时代和科学的进步,图书馆的工作方式也发生了改变,图书馆数字服务主要的方向是“网络化、数字化、标准化”。经过多年的建设,大多数图书馆都开展了基于互联网基础上的图书目录的检索、文献信息的咨询、图书的预约及续借等服务。这类服务的主要目的是使读者在到馆前便对自己所要查询的资料有所了解,有助于读者来到图书馆之后更快地了解获得自己所需要的文献,从而节约读者自身的时间。而随着智能手机及平板电脑等等移动终端的普及,以及3G网络的使用,数字化图书馆的含义也随之改变了,而云服务不仅仅是简单的网络服务、简单的数字化查询,而是更多地向着智能化发展与主动性发展,读者可以通过查询一条文献而将这条文献所延伸的其他信息一次性检索出来,从而让读者更简单、更方便地学习使用图书馆内的更多知识。
2.2 服务器及数据库
现在我们采用的依然是延续以往系统简单稳定的数据库,大多数是从硬件上进行升级和换代,来增加存储量以及运行速度而非从设计上改变,从而使很多读者在进行跨库检索或跨类检索时的速度不尽如人意。在数据库方面,大多数的数字化内容过于简单陈旧,如简单的图书、期刊杂志、音频资料、视频资料、科技文献的下载,以及各馆自己建立的数据库。虽然种类繁多但是内容却不多,例如期刊杂志品种有限,可选性不大,音频和视频绝大部分仍然在馆内保存,如果需要只能来馆借阅复制。虽然文献数据库内容丰富,但是因为版权等多方面的问题同样有多种限制,在网上大多数只能查到一些失去时效性的论文资料。所以总体来看,虽然在各个方面的信息都可以查询得到,但是内容却不多,而这些可以使用的文献所需的手续又过于繁琐,使得大部分想通过网络直接利用图书馆功能的读者望而却步。
3 云服务的优势及读者对其的使用
读者的主要目的是来馆查询及获取自己需要的文献资源,而数字图书馆云服务为读者所做的主要是将读者检索文献的过程简便高效地组织起来,使其可以更加简便快捷地完成所需文献的查询、下载等工作。如果想达到这样的效果首先要从两个方面入手,即云服务器与云检索。
3.1 云服务器
云服务器是类似VPS服务器的虚拟化技术,VPS是采用虚拟软件,VZ或VM在一台服务器上虚拟出多个类似独立服务器的部分,每个部分都可以作为单独的操作系统,管理方法与普通服务器一样。但是云服务器是在一组集群服务器上虚拟出多个类似独立服务器的部分,集群中每个服务器上都有云服务器的一个镜像,从而提高了虚拟服务器的安全稳定性,除非集群内的服务器全部出现问题,云服务器才会无法进行访问。云服务器是一种基于Web服务,提供可调整云主机配置的弹性云技术,整合了计算、存储与网络资源,在灵活性、可控性、扩展性及资源复用性方面都有更大的提高。
图书馆云服务器构架:基于对云服务器及云计算的研究,提出了云服务器的基本模型。如图1,主要由云采集、云加工、平行数据库以及数据整理中心、客户端5部分组成。由于检索的时候需要通过各种条件来检索数据,我们可以引用分布式数据库原理,将小型的数据库分开使用,这样可以使多种模块平行使用,缩短了搜索数据库的耗时,并且为数据库未来的扩容打下基础。记录整理中心处于客户端、数据库、云采集三方相互协调的位置,它不间断地关注数据库内所需要的数据或丢失损坏的文件以及记录整理客户端读者信息,将情况整理好送至云采集,这样不仅可以实时对数据库的情况进行了解,同时也可以有计划地增加读者需要的文献以及补充丢失数据的文献。
图1 云服务器架构
3.2 云检索
主要由被动检索、主动检索、读者信息记录3部分组成,同时检索信息还与服务器中的数据整理中心相连,如图2。当读者主动登录系统进行检索时与图书馆形成了被动检索的关系,读者将所需的文献资料登记在检索系统内进行检索下载等工作,与此同时服务器还将读者所检索内容信息登记在服务器内的读者个人档案下,读者也可以根据自己的喜好和需要主动向服务器进行自己所需信息的预约登记,当服务器掌握读者信息之后便可以进行主动性检索服务,如图书馆数据库中出现新添加的数字资源中有某位读者需要的数字文献,则可以主动提示该读者新到馆的文献简介或题名,或者在读者权限允许的情况下直接将文献信息发送至读者指定的客户端,在读者未进行检索时便已将读者需要的文献送至读者手中。云检索的功能主要是在读者还未检索文献的情况下主动向读者提供所需要的文献内容,为云采集文献提供目标,同时也可通过记录整理区相连接,随时掌握数据库的最新情况。
图2 云检索架构
3.3 将云服务与云检索相连接
3.4 传输速度
网络传输速度问题是未来建设的一个重点,因为随着需求量的增长以及信息量的加大,图书馆网的高速上传和下载是保证读者使用和网站运行的基础,而现在P2P作为一种主流传输技术很适合未来数字图书馆的发展。
3.4.1 P2P
P2P,也就是点到点的技术。这种技术当下应用颇广,比如BT下载、网络电视、即时消息等等,都是依靠这种技术。这种技术和传统的客户端、服务器端的星状结构截然不同,它创造了一种脱离服务器,在广大客户端之间直接建立连接的网状结构。这种技术的结果是在很大程度上减少了服务器的负荷量,充分利用了网络空余能力。其效果是明显的,在带宽不变的情况下,大大增加了下载的速度及网络流媒体的播放速度,改善了网络沟通的方式。
3.4.2 P2P与云服务的关系
这种技术上虽然好而且也是现在的发展趋势,但是它只是作为促进云服务的一种工具手段,而并不是云服务本身,恰恰相反,其与云服务背道而驰。云技术的主要作用是降低客户负荷增加服务器的负荷,为用户主动提供服务的同时还可以减轻用户负担,而P2P服务则恰好相反,是降低服务器负荷但却增加了客户端负荷的一种技术。云技术未来的发展势不可挡,而P2P是当下最主要的网络高速传输手段,应注重二者的相互平衡。
3.4.3 P2P与云技术相结合
现在很多人都大谈云技术、云计算等等,但是却很少有人专门关注P2P,我们可以将这两者相结合。一方面我们可以使用本馆服务器或者联合其他馆以及将网络服务器的能力联合起来,这样可以整体提高网络传输速度;另一方面也可使用大量客户端剩余的计算能力以及网络剩余的传输能力,两方面相结合来达到高速传输的目的。
4 云服务的数据库建设
4.1 现有数据库存在的问题
现有数据库最大的缺点在于数据资源不能共享及多平台发展两个问题。
4.1.1 资源共享
我国的各类数字图书馆资源均各有所长,但是长久以来并未形成统一的格局进行统一管理。虽然有下级馆与上级馆的联网共享,但是整合程度远远不够,无法充分利用网络资源实现共建共享,甚至不能将本区域内的各馆资源联网共享。
4.1.2 多平台多终端的发展模式
现在的数字图书馆只是简单地在网页上增加内容,读者只能通过登录图书馆网页进行基本的操作,但是随着当今多种操作平台的诞生,如智能手机、PDA、PC等等,配以3G高速网络,形成了现在所谓的移动互联时代,而跟随着移动终端产生的还有适应不同终端的操作系统,如在智能手机领域,苹果公司为IPHONE和IPAD开发的IOS,谷歌公司的安卓(Android),以及NOKIA所使用的“塞班系统”。因为系统原因,网页显示的效果也随之不同、各有差异,导致某些系统下数字化图书馆的某些功能也随之丧失,从而使读者无法正常使用。
4.2 云数据库
4.2.1 资源建设
云数据库的特点就是信息量大,所以如何收集资源以及如何快捷使用资源是云数据库的建设重点。
4.2.1.1 馆际共享
在未来的云服务的数据库中,不仅要储存大量读者信息进行互动,更要将各馆之间的信息相互联系、相互组织起来,形成一个各馆共同建设资源,统一标准、统一服务、统一队伍建设的格局。将各馆的服务器中的文献,特别是类似地方文献的资料进行共享,从而弥补不同地区在数据库内容上的不足。
4.2.1.2 跨库检索
云服务之所以有海量的信息就是因为它的内容是由社会多方面提供的信息,之后被集中整理,并将其整理归类之后的内容提供给广大读者,不仅联合各馆数据库的知识,更要联合专业的中文网站与期刊数据库共同建设。我们可以为读者提供期刊数据库网站的链接,提高该网站的知名度和点击率,也可为他们提供P2P服务,将数据库存放至本馆的服务器,减轻网站服务的负荷,提高工作效率。而网站则可将一部分数字资源无偿赠与图书馆,这样便可以用有限的经费购买更多的数字资源为用户服务,同时和资源类网站达到双赢的目的。
4.2.2 资源保护
在云服务的数据库中不仅有大量的读者信息,同时也需要大量的文献资料来支撑读者的阅读咨询,但是伴随着大量文献资料的使用,版权问题也随之而来。我们可以通过技术以及法律来尽量解决这方面的问题。
4.2.2.1 加密技术
使用特定的加密软件对文献资源的使用等级设置权限,并对读者的权限和等级加以限制及说明,使得该作品的不同使用人需按照等级获取,否则无法正常使用。如果读者对数字化文献进行复制修改等操作,首先要满足预先设定的条件,如缴纳版权费或通信费,然后由工作人员帮助其解密。
4.2.2.2 水印技术
这种技术是通过软件将水印标识印在数字资源中,水印标识可以显示版权所有关系信息。当该作品被用户打开,显示在屏幕上时,无论用户怎么使用该作品,修改、复制或是传输,该水印会一直加载在文件当中不会消失。由此便可以根据水印标识来掌握资源的安全性。现在主要在使用的有两种水印技术,一种是浮水印技术,它可以使水印标识显示在作品表面,很明显地标识了版权信息;另一种则属于隐形技术,可以在数字资源当中加入无法看见的标识符号,并通过特定软件,随时在网络上搜索已经做过标记的资源来掌握读者对文献的使用情况。
4.3 系统的多样性
未来的云服务主要是靠客户端的连接,而非读者打开网页的简单操作,所以未来客户端的建设将是数字化推向读者的重点之一,我们必须设计好应对不同操作系统的各类客户端,而不是固守原地仍然使用简单被动的网页为操作方法,因为未来的网络时代同时也是个性化的网络时代,单靠一种系统或一种使用方法根本无法满足多元化多终端的读者,所以只有不断地编写新的程序,升级旧的系统,才能使云服务端处于主动性的不败之地。
5 结语
云服务是未来互联网服务的发展趋势,这种趋势将会影响计算机、手机等终端产品的研制与发展。而作为数字化图书馆的云服务,每天不仅可以使读者查询到最新的文献信息,更可以将读者所需的文献信息主动发送到指定的客户端,不仅读者量及读者服务内容大幅提升,工作效率更是大幅提高。在云服务模式当中,真正使读者达到了跨时间、跨地域、无间断地与图书馆互动,使读者需求得到最大限度的满足。
[1] 陶新泉,等.云计算在图书馆中的应用[J].大学图书馆学报,2010(2):54-57.
[2] 柳文霞.浅谈云计算技术对图书馆的影响[J].内蒙古经济与科技,2011(3):60-61.
[3] 张红萍.图书馆如何面对云计算环境的到来[J].图书馆理论与实践,2011(5):25-26.
[4] 王长金,艾雾.云计算环境下数字图书馆信息资源整合与服务模式创新[J].图书馆工作与研究,2011(1):48-51.