图书情报的云环境构建
2014-11-12于积亮
于积亮
[摘 要]云环境是当前数字图书馆领域的一个热点。它的出现宣告了低成本提供超级图书情报服务时代的到来。云环境将改变人们获取信息、分享内容和互相沟通的方式。每一次重大技术的发明与应用,将推动社会整体或局部的变革,云环境推动图书情报变革将是这一历史规律的再次映证。随着云技术的深入开发和实践,其在图书情报应用的研究内容也会逐步向深入发展,并逐步进入实践和理论相互促进共同发展的阶段。此文阐述了云环境的构建困景,图书情报的数字构建困景,并对图书情报在云环境下的发展及前景进行分析。
[关键词]云环境;图书情报;困景前景
对于云环境的发展前景,各大互联网巨头都相当看好,纷纷为此调整公司的发展战略。数据显示,到2014年全球云计算服务规模将达到2000亿美元,如此大的规模肯定吸引所有电信商的投资积极性,国内云环境正处于新一轮的“圈地运动”。对于用户来说普遍担心的是云安全和统一标准的云平台,我国企业创造的云安全概念,在国际云计算领域独树一帜。云安全的策略构想是:使用者越多,每个使用者就越安全,因为如此庞大的用户群,足以覆盖互联网的每个角落,只要某个网站被挂马或某个新木马病毒出现,就会立刻被截获。既然云安全可以如此处理,那么图书情报发展等也亦然,这与云环境构建的思想就相去不远了。
一、云环境的现状构建分析
近些年互联网新技术正在受到图书馆技术人员的注意,这些新技术能够改善目前图书馆网络的应用状况,提高图书馆网络的服务能力。云环境是一个现代化图书馆自我展示的窗口, 也是图书馆传统业务在时间和空间上的延伸与开拓,同时又是图书馆数字化、网络化服务的阵地。云环境的构建就目前国内的现状主要体现在云计算上,通过云计算的现状分析就能看到云环境的构建,就目前而言,许多电信商仅仅是在占位,要想实现梦想,还需要找到合适地切入点,将流量、用户和电商有效地结合。
云计算是个多种技术混合演进的结果,其成熟度较高,又有大公司推动,发展极为迅速。Amazon、Google、IBM、微软和Yahoo等大公司是云计算的先行者。云计算的新颖之处在于它几乎可以提供无限的廉价存储和计算能力。我国对于云计算发展高度重视,已将其列入战略性信息产业规划。2008年5月10日,IBM在无锡建立中国第一个云计算中心。2010年7月,北京市经济和信息化委员会公布“祥云工程”,标志着北京地区云计算产业发展全面进入实际性操作阶段。2010年8月,上海发布“云海计划”,拟将上海打造成亚太地区云计算产业中心,现在上海新增的云计算技术研发与公共服务企业过百家。2010年10月,工信部和国家发改委联合发出通知,在北京、上海、深圳、杭州、无锡等5个城市先行开展云计算服务创新发展试点示范工作,2011年4月,云计算正式被列为“十二五”重点科技项目和未来高技术服务业,两年半来,各地纷纷建设云计算中心,有20多个城市制定了云计算的发展规划和产业政策。中国移动研究院做云计算的探索起步较早,已经完成了云计算中心试验。我国目前在CALIS、国家图书馆、省市图书馆建立了不同程度的联合编目系统。如果图书馆建立云计算应用,这是第一个可以讨论与实现的,目前有学者结合云计算、SaaS、Web2.0、SOA等技术,提出CALIS数字图书馆云战略:即设计和开发CALIS数字图书馆云服务平台(称Nebula平台),构建多级CALIS数字图书馆云服务中心,为用户提供各种类型的数字图书馆服务,同时为图书馆提供本地化的数字图书馆云计算解决方案。我国云计算同美欧发达国家相比发展仍存在一定的差距,核心技术不足、产业链不完整、服务和应用规模不大、商业模式创新不够等问题依然制约着云计算的发展。
移动互联网云的构建同样是云环境不可或缺的一环,也是受众首选的云,也是最活跃的云。智能手机的普及使移动互联网获得了飞速发展,并不断颠覆着传统互联网的产业格局。对国内许多互联网企业来说,由PC端向移动端迁移已成为首要任务。虽然目前移动互联网仍处于发展的早期阶段,但如何将流量变现已成为困扰移动互联网的最大问题,许多传统互联网的运行方式不再适用于移动互联网,已经获得巨大流量的应用则开始纷纷探索新的之路。腾讯旗下的微信被公认为已率先拿到了第一张真正意义上的移动互联网“船票”。最近阿里巴巴入股新浪微博,标志着国内移动互联网的第二张“船票”正式落户阿里巴巴。如何在蓬勃发展的移动互联网领域复制自己在PC互联网领域的优势,则是决定未来发展的头等大事。
二、图书情报的数字化现状分析
目前全国已有各类图书馆35万所,藏书40多亿册,已达到相当的规模。有些馆现已成为国家或某城市的标志性文化设施,图书馆硬件设施的改善,大大增强了图书馆综合服务能力,提升了图书馆公众形象,使图书馆成为教育、文化和情报的一支活跃力量,而且也为图书馆在新世纪的可持续发展打下了坚实的基础。
我国的公共图书馆大致有六个层次的图书馆:国家图书馆、省(直辖市、自治区)图书馆、市(省辖市、地区)图书馆、县(市辖区)图书馆、城市街道和农村乡镇图书馆以及各级少年儿童图书馆,另外还包括一些居民社区图书馆。当前,在我国公共图书馆发展战略的布局上存在着重“大”轻“小”的偏差。随着国家对图书馆自动化发展建设的重视和投入,我国的图书馆自动化软件生产趋于成熟,现今图书馆自动化系统都使用了C/S的结构体系,部分先进系统还应用了三层C/S和B/S结构的结合。目前国内较为成功的图书馆自动化管理应用系统有:丹诚图书馆管理系统、图书馆自动化集成系统、利文文献信息服务系统、文献管理集成系统、通用图书馆集成系统、金盘图书馆集成管理系统、文津图书馆综合管理系统、妙思文献管理集成系统V6.0/6.5系列等。以上各图书馆自动化系统基本上都包括8个模块:采访模块、编目模块、典藏模块、流通模块、期刊模块、系统管理模块、OPAC(联机书目查询)、Z39.50系统模块等。
在这些共性的情况下主要说说图书情报数字化的差异。图书馆的建设到现在为止仍然是受行政区划的主导,固定资产管理等限制,在总分馆制这个美国舶来品的思路引导下,全国不少地方的公共图书馆体系进行了总分馆建设,可以说是经验成果各地方有各地方的特点,千差万别,可借鉴的地方不少,不能普遍推广的实际困难也不少。图书馆联盟的建设目前是国内外图书馆学理论研究和实践探索的热点,而我国的实际情况是区域性经济发展极不均衡,国内的公共图书馆普遍存在基础设施薄弱、资金和资源匮乏、专业人才短缺、自动化程度较低等现实的问题。软硬件建设也是千差万别的,对接、互通、兼容也是现实存在要解决的问题。
如此就退回到原来的基础上,各馆办各馆,各馆建各馆,就拿编目来说,各馆编各馆的,馆际之间就不统一,我国目前30多家图书馆自动化系统中,还没有任何一家能提供云服务。书目记录MARC的编辑、MARC格式转换等各馆也是按照各自的工作性质而随心所欲的进行,同一书目多个MARC版本。以青岛市馆为例,它使用的数据顺序是中国国家馆—上海图书馆—山东图书馆,在这个顺序中一般都能解决的,个别没有的就个别处理,个别处理就没有一定的要求了,只有一个目的就是能编辑出来就算完成任务。而小馆就没有这个使用数据上的优势,只能是八仙过海各显神通,只要能找到书目记录MARC就不问出处,检索点也一般采用到一级目录结束,由于专业技术人员技术水平参差不齐,这样就必定制约馆际之间的互查性。数字资源相互独立,重复建设概率高,馆际之间的数字资源和纸质资源也是相对独立的,在实际工作中埋头建设本馆的数字资源,不去考虑其它馆的建设情况,这样重复建设所花费的人力、财力过多,不值得提倡。
最后不得不说的是,图书情报是两种不同性质的资料,分属于不同的两个行政部门,眼下看还没有一个共同发布的平台,特别是情报有其特殊性,而受解密与非解密等限制,很难在公共平台上不受限制的自由发布,然而现实生活中人们很容易把情报与信息混淆,这在一定程度上造成混乱、错觉。
三、云环境下的图书情报前景分析
云环境的构建。云环境为我们使用网络提供了几乎无限多的可能,为图书情报的资源管理提供了方便,作为一种新的技术它也存在一些问题的,这是我们在云环境构建中特别要注意的,在中国噪杂的网络环境中,我们更应该保持清醒的头脑,因为我们不知道“那片云有雨”。如最近的热点新闻中国“第一夫人”彭丽媛女士穿着中国本土品牌“例外”出席外事活动,率先报道此消息的不是门户网站,也不是国家新闻网站,而是中国独立时装网站“无时尚中文网”,一个还只在小圈子里有影响力的网站。通过这点使我们看到权威可信的第一手消息不再仅由大媒体发布,图书情报的云环境建设也是如此的,我们不能盲目地崇拜大的母公司,更不能使用“野路子”,这就要求图书馆行业建立统一的云环境平台,图书馆要建设统一的馆藏数目数据库、联合书目数据库、特色文献数据库和数据库产品,做统一的接口,图书馆需要增加信息,通过本地域网络的方式添加到所建立的统一云环境平台之上。这样统一的放置,统一的管理,就能达到真正意义的共享。
尽管云环境技术目前还处在起步阶段,还存在着各种各样的问题,云环境的标准还未确立,但毫无疑问,云环境将拥有一个光明的前景。云环境的兴起宣告以设备为中心建设时代的终结,取而代之的是以互联为中心的建设方式,就图书情报而言,云环境为图书情报跨出信息孤岛,走向全球级互联共享的蓝海,提供了强有力的技术支持。我们在云环境构建中要首先解决用户的隐私保护问题。云环境意味着机构需要把大量有价值的数据存放到云服务提供商的手中,如何保证这些数据的安全就成为一个首要的课题。其次是标准问题。云环境缺乏统一的技术标准,包括网络应用、操作系统、虚拟化、应用软件都缺乏统一的标准,对于用户究竟选择哪家云平台造成了不少困惑。最后是网络问题。如果没有网络连接,在线存储和在线服务都是没有任何意义的。用户只要一台笔记本或者一个手机,就可以通过网络服务来实现人们需要的一切。
云环境的图书情报数字化是一项复杂而浩大的系统工程,其核心问题是情报、知识资源的组织、检索与共享,现阶段,云环境能够为图书情报提供以下的技术支撑。(一)图书情报数据存储技术。数据存储从本地到云的变化是革命性的,存储在云中的数据被安放在一个安全的、可伸缩的环境中。很显然,图书情报也是海量数据存储的需求者,是云环境存储的最重要的客户之一。(二)云环境的数据与应用的检索共享,由各个数字化图书馆建设的图书情报云环境,将不同来源的图书情报资源整合成统一的海量数据资源,通过虚拟服务器和统一访问接口,消除信息孤岛,实现数据资源的智能共享。(三)云环境的海量信息处理,图书情报经常存在需要海量信息处理的业务,如果在本地进行这样的信息处理,必然面临着许多硬件和软件建设的限制,造成不必要的重复建设浪费,而且技术、管理和维护都非常复杂,而云环境则能够低成本地妥善解决这些问题。同时结合云环境的数据存储技术,通过云环境的海量信息处理结果可以直接保存在云环境的海量存储设备上。(四)建立一种有效的标准规范管理机制,首先借鉴ISO、NISO的标准先进管理经验,建立相应的管理机构,严格按照相关的标准法律的规定进行监督和管理,其次对于一些标龄长、发布年代久远的标准进行整体更新和维护,杜绝闭门造车的现象产生。
四、结语
云环境还处在初期阶段,随着云技术的发展完善,未来的图书情报必将构建自己的云环境。借助各IT厂商提供的云解决方案,结合本馆的数字资源,构建自己的云环境,使用统一的接口,将本馆的云建设与来自全球不同区域的图书情报整合在一起,在网络上组成更大规模的云,在这个庞大的云平台上,统一标准、统一管理使用资源,最终使用户通过单一入口与虚拟服务器就能检索到云环境下的所有图书情报信息资源,实现真正意义上的共享。