APP下载

智慧云图书馆构成要件分析
——由芝加哥公共图书馆发展现状想到的

2018-01-28

图书馆学刊 2018年10期
关键词:结构化图书馆资源

沈 杰

(浙江中医药大学图书馆,浙江 杭州 310053)

1 引言

以互联网为基础的信息技术的迅速发展,电子商务、社交网络、移动通讯、远程医疗以及网络教育等都获得了高速发展,人们对互联网服务的依赖度大大增加,在这些服务交互过程中产生了大量的结构化和非结构化数据即大数据,这些数据涵盖了与人类活动和社会发展息息相关的各个方面,自我形成了一个庞大的信息数据网络。传统图书馆以结构化数据为主要存储形式,对结构化数据的采集、存储、管理和分析具备较为完善的服务体系,但是现代图书馆如果缺少了对非结构化数据的采集、存储、管理和分析,就无法满足用户即时信息的需求,难以开展个性化定制和具有针对性、即时性、有效性的信息推送服务。对于以传递有价信息服务为核心的图书馆,如果无法响应用户即时信息的需求,也就无法发挥其最大价值,难以适应智慧化服务的未来发展要求。如何通过改变图书馆服务架构,适应时代需求,提高信息服务能力,是现代图书馆亟需解决的重要问题。笔者拟在大数据环境下,结合芝加哥公共图书馆发展现状,分析构建“智慧云图书馆”要件,促进图书馆在新时代的创新发展。

2 芝加哥公共图书馆发展现状

芝加哥公共图书馆成立于1873年,现又名哈罗德·华盛顿图书馆,1991年9月开馆时,人们称之为“世界上最大的公共图书馆”,包括1个总馆、两个地区馆和79个分馆,这些分馆平均分布在市区的各个地方,馆藏图书及各种资料10745608册,包括参考咨询、政府信息、历史文献阅览、语言文学文献阅览、艺术文献阅览、文献编目、儿童借阅以及成人图书流通等部门;在图书馆四楼的借阅区,大到各级别法律法规、规章制度、政府财政预算支出,小到每个政府雇员任一年度的纳税单、每一个剩余劳动力任一时期的工作申请表等信息都可以在这里找到,信息量之大、数据之完整,实属少见。该馆不仅承担着图书馆的读者服务功能,还具有博物馆和美术馆的展览功能。但是,在该图书馆,工作人员非常少,从办理入馆卡到借还书,几乎全部是计算机完成,加载有相应主体大量信息的条形码经光电识别,快速自动完成,尤其是还书和借书,无人值守;向全社会免费开放的琴房,文物、美术展览,甚至中小学生夏令营信息在手机或者平板电脑上可以即时查到;图书馆官网上有非常详尽的数据信息供所有读者查阅。对于读者提出的任何有关图书馆业务服务,轻点鼠标,一览无余,十分方便。此外,分馆与主馆之间的无缝连接大大方便了不同地方读者获得信息与信息互通。芝加哥公共图书馆非常有效地整合了传统图书馆的结构性数据和信息时代的非常规信息数据,较好地满足了信息化社会对图书馆服务的要求。

3 智慧云服务的特征

2011年美国麦肯锡公司全球研究所发布《大数据:下一个创新、竞争和生产率的前沿》,引起了全球关注[1]。事实上,在诸如物理学、生物学、环境生态学以及军事、金融、通讯等领域,大数据雏形早已形成和被采用。互联网信息的高速发展,尤其是云计算的出现,彻底激活了大数据所蕴藏的潜力[2],颠覆了传统思维。

大数据是一种规模超过传统数据库的数据集合,可以表现在如获取、存储、管理、分析数据等,有四大特征:(1)数据规模大:数据量远超传统数据,并且以数字化的形式存储在各种媒介上;(2)数据流转快:不同行业对大数据有不同需求,只有让数据流转起来才能最大程度地发挥大数据的专业价值;(3)数据类型多:除了传统的关系型数据库中的结构化数据之外还有大量的半结构化和非结构化的数据,这些多类型的数据也对数据的处理能力提出了更高的要求;(4)价值密度低:价值密度的高低与数据总量的大小成反比,在对大数据分析时往往需要大量的样本空间来提高分析结果的可靠性。如何通过强大的机器算法更迅速地完成数据的价值“提纯”也成为目前大数据背景下亟待解决的难题[3-4]。

云计算是一种方便灵活的商业计算模型,它是根据需要,利用计算机来构建资源池,可以用最少的管理付出,迅速达到各种计算资源的高效配置和推出。云计算技术在管理上,能够自动将分布式架构的计算资源集中到一起,灵活提供服务,用户不需管理或控制底层的云基础设施,包括网络、服务器、操作系统、存储等,使用户能够更加专注于自己的业务,既有利于提高工作效率、降低成本和技术创新,同时也提高了商业经营的敏捷性[5]。

智慧云服务是指由云计算技术架构支撑,对外提供的按需分配、可计量的IT服务,可用于替代用户本地自建的IT服务,分为三个层次:基础设施即服务、平台即服务及软件即服务[6]。智慧云服务能够高效地整合网络上分布式资源,并且以按需的方式有效地提供专业化服务,大大提高了资源的利用率,提升了平台的服务质量。

4 大数据、云计算对图书馆信息服务的影响

在互联网信息高速发展的今天,以大数据和云计算为基础的研究和应用逐渐成熟。各行各业可以通过对其自身相关领域的海量数据进行分析,建立拟合数学模型,对未来的行业发展做出有效评估。大数据应用展现出的强大能量使用户对数据的认识发生了根本的改变。人们更加倾向于从提供大数据分析的服务商获取所需资源,逐步失去对传统的提供信息服务的图书馆的依赖。在强大的大数据服务冲击下,传统图书馆由于其自身的诸多特性的限制,在多个层面均不可避免地受到了不同程度的影响。

4.1 非传统数据量激增对图书馆存储能力的影响

在大数据时代,信息量呈爆炸性增长,2013年中国产生的数据总量超过8亿TB,2倍于2012年,相当于2009年全球的数据总量。预计到2020年,中国产生的数据总量将是2013年的10倍,超过85亿TB[7]。互联网的快速发展使信息数据产生的成本越来越小,数据存在的方式多种多样。在国内以BAT为代表的互联网巨头,在搜索、电商、社交等领域承载并处理着中国约50%的数据量[8]。图书馆作为以数据采集、加工、存储和分析为主要职能的重要服务场所,存储了大量的结构化资源,对传统的结构化数据,如图书、期刊、档案等已经具有相对完善的处理机制。虽然随着Web2.0在图书馆的应用,图书馆非结构化的数据也逐渐增多,但是相比于大数据,所处理的数据量就显得十分有限。图书馆对于这些非结构化数据的采集、存储将有着极强的挑战性。这不仅有技术上的问题,也包含着大量的社会问题。这些问题的解决将有利于促进图书馆服务的转型升级,向智慧图书馆转变。

4.2 复合型数据对图书馆数据处理能力的影响

传统图书馆馆藏资源的类型多是一些结构化数据资源,主要包括期刊、图书、档案等,对数据资源的处理方式大都以分类编目为主。根据大数据的特点,除了结构化数据之外,更多的是以非结构化的形式存在,如微博、博客、HTML网页、社交通讯信息、地理位置信息、上网浏览记录等。这些不同类型数据数量大,来源广泛,各种数据格式之间互不兼容,大大增加了数据处理的复杂度,使得对这些数据的分析和处理难度增大[9]。然而这些非结构化数据具有非常鲜明的特性,主体专指性强,价值高,如何利用这些基础资源以协同解决其他领域存在的问题对于传统图书馆的转型发展十分重要。

4.3 大数据和云计算对传统图书馆对外信息服务能力的影响

对外提供具有明确导向性的信息服务是图书馆的核心价值所在。在传统图书馆,人们往往注重对自身馆藏资源的利用,服务对象较为片面,提供的信息内容时效性不强,信息量有限,信息表现形式比较单一等诸多不足[10]。随着以云计算为技术支撑,能够对大数据进行分析处理的云服务的出现,彻底超越了以传统图书馆信息服务模型为代表的信息咨询交互系统。在大数据环境下,用户对信息的需求越来越广泛和专业。普通用户可以通过大数据搜索引擎迅速找到自己所需要的具体专业信息。任何公司或者企业都可以通过购买云服务,及时地对自己行业的发展或遇到的某一特定问题做出最佳决策,让信息的时效性能够得到充分发挥。大数据和云计算具有独特的自身优势,潜藏着巨大的商业价值,而传统图书馆由于其自身硬件和软件的限制决定了它目前无法与大数据服务相比拟与匹配。在大数据的冲击下,大量数据依赖性用户纷纷从传统的图书馆信息服务转向到方便快捷、可靠性更高的大数据分析服务[11]。

5 构建基于智慧云计算服务的云图书馆要件分析

服务始终是图书馆的历史使命,利用大数据和云计算技术优势,能够有效提高图书馆的服务水平和管理效率。面对大数据带来的信息服务方式的变革,云图书馆的概念应运而生。云图书馆是云计算在图书馆中的应用,是促进图书馆学科转型的重要内容,也是未来图书馆理论与技术体系发展的重要方向。因此,建设云图书馆也成为图书馆当下最重要的任务之一。

5.1 图书馆资源的数字化

云图书馆是将云存储的资源以按需的方式用数字的形式提供给用户。数字化的资源能够大大提高用户与图书馆的交互能力,精确定位搜索资源,为用户快速获取所需信息提供保证,同时也提高了图书馆服务的效率和效能。由于行业特点,传统图书馆储藏着大量的纸质版图书期刊资源,利用现代信息技术对馆藏资源进行加工处理,使其转变成数字化信息资源,是云图书馆资源建设最重要的部分。有许多功能强大的商业化软件都能够将传统介质上的图文转化为数字信息,处理过程十分便捷。使用扫描仪对图书进行扫描转化成PDF文本格式,然后使用Adobe公司的Acrobat软件将PDF文件转化成可进行再加工的word或者excel文本文件,最后将所得到的编码文件归类到信息数据库中,用户便可以通过搜索引擎检索到该数字文本资源[12]。事实上,图书馆制定资源数字化的标准规范,才是当下必须解决的技术难题。图书馆技术人员需要对馆藏资源进行综合分析,逐步确立应采用的数字编码与内容标记标准。针对保存格式、浏览格式和预览格式提出应该采用的数字内容格式标准,确立数字资源加工标准和程序的选择原则,进而编制数字资源建设指南的基本操作规范[13]。通过对馆藏资源数字化操作,不仅能大大扩展图书馆数字资源的形式和范围,也为云图书馆的建立奠定大数据基础。

5.2 图书馆数字资源整合

由于其历史地理原因,图书馆中的资源往往具有局限性和偏向性等特点,例如,高校图书馆中的馆藏资源会由于其学校学科的优劣具有较大的倾向性,强势学科一般会占据大部分的资源空间。这种现象导致的结果就是学科之间的资源不对称,使得弱势学科的发展更加缓慢,不利于学校的综合建设。而一些地方特色图书馆为了更加突出其自身特色,其收藏的资源基本上都只与其主题相关,例如,位于湖南省长沙市的抗日战争图书馆,收集的资料都是关于抗日战争的史料文献。不可否认这些文史档案都具有难以估量的历史文化价值,潜在读者可能分布在世界各地,但是地域局限性使其无法最大发挥其自身价值。唯有将所有分布式采集存储的图书馆资源整合起来,建立云图书馆,才能够不断满足信息化时代人们对信息资源的需求。首先,各图书馆需要明确资源整合的类型和范畴,对本馆中的资源进行分类规整,确定符合自身发展规划,深化与其他馆的对接整合,取长补短,确保这些资源整合后的类型规范统一;其次,图书馆需要联合制定数字化信息资源的服务标准,图书馆互相之间应该协调一致,总体规划,使用统一服务平台和规范化的服务框架,避免资源的重叠浪费,增强系统的权威性和可靠性[14-15]。与此同时,引入第三方监督和审核体系,保证云图书馆服务质量,为用户切实提供更加优质的服务。

5.3 充分利用现代卫星通讯技术

现代卫星通讯技术发展十分迅速,移动网络进入5G时代,超大容量的储存功能和几无死角的接收能力,给智慧云图书馆的构建提供了便利。大数据接入移动网络,如虎添翼,形成了真正意义上的云数据链下的图书馆读者点阵。读者服务、信息发布、期刊源共享、国际前沿成果分享、国际无纸化虚拟交流等的实时完成成为可能。

5.4 图书馆大数据应用人才

传统图书馆服务是人与人或人与书之间的交互,而以大数据为基础的云图书馆则是人与计算机等智能网络设备的交互。不论是图书馆工作人员还是图书馆服务对象更多的都是通过计算机和互联网来获取指定的信息内容。在大数据时代,大部分数据以分结构化的形式存在,图书馆在收集数据过程中会得到大量分散的、无序的、随机的信息数据,将这些信息数据进行统计、重组、分类等处理将会给图书馆带来巨大的挑战。因此,针对大数据分析处理的专业人才队伍培养是云图书馆建设的重中之重[9]。首先,图书馆应该有针对性地引进人才。图书馆在进行人才招聘时应更加注重有计算机、统计学、数学等交叉学科背景的复合型人才的引进。其次,深入挖掘图书馆员的潜力。图书馆领导可以将在编的图书馆工作人员进行分类,根据不同员工的背景和实际情况有针对性地进行培养[16]。同时,通过制定奖励激励机制调动图书馆员自我学习与服务的积极性。只有逐步提高图书馆服务人员对大数据的分析能力,才能够满足信息化时代的需求,才能够给用户提供更加优质的服务。

6 结语

虽然目前云计算在图书馆的应用还处于探索阶段,但是随着大数据和云计算技术的不断成熟,大数据和云计算在图书馆领域的应用将会给图书馆的信息服务带来翻天覆地的变化。以大数据和云计算为支撑的云图书馆将是未来图书馆发展的方向。同时,在图书馆转型升级过程中,图书馆专业人员要紧跟时代潮流,加强大数据知识的学习,提高自身素质,只有这样才能提高图书馆行业的整体服务水平,体现图书馆信息资源最优的价值。

猜你喜欢

结构化图书馆资源
基础教育资源展示
促进知识结构化的主题式复习初探
改进的非结构化对等网络动态搜索算法
结构化面试方法在研究生复试中的应用
一样的资源,不一样的收获
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
资源回收
图书馆
资源再生 欢迎订阅
去图书馆