APP下载

图书馆在跨地域交流中的大数据应用

2015-02-02杨晓东

河南图书馆学刊 2014年12期
关键词:图书馆大数据应用

关键词:图书馆;跨地域;大数据;应用

摘要:文章论述了图书馆如何依托现有资源优势及组织联盟,在跨地域交流中打破机制性障碍,通过大数据共建共享渠道,产生可观的学术价值和经济效益。

中图分类号:G252.8文献标识码:A文章编号:1003-1588(2014)12-0129-03

收稿日期:2014-10-09

作者简介:杨晓东(1979-),漯河职业技术学院图书馆馆员。全国各类图书馆,近年来在OA理论(Open Access)的指引下,信息资源共享的需求越来越大。图书馆读者群和信息资源存在海量性、流动性、互补性和交叉性。图书馆行政体制、所属范畴、地域限制存在重复建设、偏安一隅的情况,造成各图书馆大量的资源损失和浪费。继“图书馆联盟”和“云计算”之后,大数据成为图书馆学界研究的热点。图书馆依托现有资源优势及组织联盟,在跨地域交流中打破壁垒及机制性障碍,通过大数据共建共享渠道,产生可观的学术价值和经济效益,具有重要的现实意义。

1大数据的概念及特点

大数据指的是无法使用传统流程、工具处理或分析的信息。有关专家认为,其表现形式是超出常规衡量尺度、处理范围与模式,引导用户采用非传统处理方法的数据集。其运行模式是:对于存储在各地域各类型的服务器中的海量信息,首先由用户发出查询、搜索请求,然后各地服务器之间进行信息交换和处理,最后把查询、搜索结果反馈给用户。

对大数据的特点,笔者总结为VHHTC:多样性(Variousness)、大容量(High-capacity)、高速度(High-speed)、时效性(Timeliness)和复杂性(Complexity)。即通过数据库解决长期存储的数据,割弃常规数据处理,转而使用新策略对异结构数据重新安排接入,实现即时应用所需数据。

2图书馆跨地域应用大数据的基础

2.1网络应用现状使信息量呈爆炸式增长

截至2014年5月16日,中国3亿网民使用虚拟专用网络(VPN)服务。截至2013年12月,我国网民规模达6.18亿,全年共计新增网民5,358万人。互联网普及率为45.8%,较2012年底提升3.7个百分点。移动设备如智能手机、平板电脑等为信息需求者提供了新的获取途径,最终吸引跨地域的人与人之间产生更多的交互,使得数据急速增加。越来越强大的技术和日益庞大的网民队伍,为数字图书馆提供了信息传输途径和服务渠道。

2.2云计算、社交网络及RFID等新技术的发展,为图书馆海量信息提供了数据来源

云计算强大的数据处理能力,为大数据的诞生和发展提供了技术基础。以微博、微信等为代表的社交网络Web2.0特质体现了开放性、独特性、互动性、共享性。因此高科技的发展使跨地域图书馆进入大数据时代成为可能。

3图书馆在地域交流中面临的困惑

3.1图书馆信息资源共享理念问题

我国图书馆信息资源共享理念相对落后。图书馆信息资源共享程度比较低。在图书馆虽然可以免费获取一定量的电子数据资源,但是这些免费下载权服务对象范围过于狭小,且只能局限于内部网络,很难跨地域实现资源共享,更遑论面向社会不特定公众服务。数字图书馆建设存在的问题是——更多突出个人英雄主义,而非重视各类图书馆联合起来搞集体行军。

3.2图书馆自身角色认知的问题

部分地区的图书馆对自己的定位评价较低,例如“学校教辅单位”“藏书楼”“借还书的地儿”等。著名图书馆学家阮冈纳赞(印度)提出,作为有机的图书馆,必须要把自己置身于社会这一大环境之下。他的图书馆学五定律非常有名:“……图书馆是一个生长着的有机体(A library is a growing organism)。”今天公众对图书馆的认知仍停留在“物理层面的图书馆”上,许多图书馆没有用发展的眼光,使公众对图书馆的认知上升到“数据化信息资源中心”上。笔者呼吁图书馆应该敢于挑起大梁,放眼所服务地域之外,拓展服务功能,将大数据作为研究和工作基础,从数据汇集、信息剥离、知识服务、智慧支持等方面进行服务。

3.3图书馆海量信息梳理问题

信息技术的发展激发了数字资源的增长。图书馆海量数据在网页数量上可以体现。截至2013年年底,中国境内的网页数量约为1,500亿个,相比2012年增长22%左右。文献出版渠道更是层出不穷。目前,我国数字杂志、电子书行业运行发展形势良好,电子书行业正逐步向产业化、规模化方向发展,数字杂志、电子书行业运行需求市场不断扩大。面对海量信息,信息枢纽专家——图书馆又该做些什么?以清华大学图书馆信息检索平台Web of Science为例。通过该平台用户可检索关于自然科学、社会科学、人文学科的文献信息,包括国际期刊、免费开放资源、图书、专利、会议录、网络资源等,可以同时对多个数据库(包括专业数据库、多学科综合数据库及“中国科学引文数据库”)进行单库或跨库检索,可以使用分析工具,可以利用书目信息管理软件建立个人文献数据库。虽然指出了“如需在校外使用,请通过校外访问控制系统,或通过Shibboleth访问”,但怎样实现跨地域组织、梳理和抽取海量信息,仍然是尚未开发的盲区。

3.4网络结构设计及建模形式的问题

传统的数据运行模式是:用户直接向服务器发出查询、搜索请求,由这个服务器直接反馈给用户。各地域服务器彼此看来是“又聋又哑”的。而笔者分析大数据运行模式,可总结为:用户发出查询、搜索请求——各地服务器之间进行信息交换和处理——把查询、搜索结果反馈给用户。联合起来的各地域服务器可以说是真正成为一个整体了。因此网络结构重新架构成为当前紧迫的任务。

大数据建模形式与传统业务应用中产生的建模形式迥异。大数据内容服务数据是非结构化(Unstructured)的,含有比较随意的信息。由于内容服务数据将应用于特定的网络模板或数据库调用中,因此越来越多的内容采用半结构化(Semi-structured)的数据形式。endprint

杨晓东:图书馆在跨地域交流中的大数据应用杨晓东:图书馆在跨地域交流中的大数据应用3.5不可预测事物的问题

预测是大数据的核心功能。但大数据只能利用过去的数据预测未知。大数据无法回归原点。当触摸不到既往时,大数据就是“无米之炊”了。大数据遇到预测不可预知的事物、缺少发展苗头的事物就停顿下来。虽然过去看似可以掌握,但是以大数据为标尺的预测决策也难以精确。数据是依照用户的思维惯性和价值理念而被架构出来。因此数据的诞生,先天附带人的主观性。用户所掌握的大数据分析结果,其价值形成走过了从构建到解读的全通道。大数据难以成为用户决策的精准标尺。

3.6用户隐私泄露的问题

跨地域利用大数据要分析用户信息。分析流程是收集、分析、传输。图书馆在传输用户信息时可能会遭遇法律问题。比如数据泄露,会为权利人带来损失,使个人用户的隐私权受到损害。

3.7数据所有权易丢失的问题

大数据时代,数据分析工具主要由专业的数据商和系统商开发。图书馆购买软硬件时容易被其限定权利。系统商和数据商在提出大数据设计方案时如配备兼容性差的软硬件设备,那么图书馆就很容易被特定数据商和系统商绑定。

3.8大数据的结果缺乏因果关系的问题

大数据的研究方法只能统计某事物发生的频率和相关性,不能得出因果关系。相连关系数据的增多,反而可能步步将用户引入岔路上。大数据仅仅解决当前问题,而对于图书馆宏观战略等问题难以着手,因此大数据的投入面临着商业风险。如果投入与产出不成正比,就是没有达到预期目的。

4图书馆在跨地域交流中的大数据应用对策

4.1跨地域交流的图书馆各主体应建立学科门户服务集成模式

笔者认为未来图书馆的信息服务方向是“跨地域学科化服务”。研究焦点是架构学科模块服务集成模式。对于具体学科范围,对数据资源进行规范性描述,进行梳理后再面向跨地域用户提供检索及导航等增值服务。包括:①主题信息模块。对信息资源描述、检索,发挥信息资源的官方性、真实性、连续性等优势。②专业信息模块。作出多学科信息模块之间的再检索、再选择及再描述,为用户提供集合各种专业信息资源的服务。③母子信息模块。以信息模块整体为母体系,整合多个分布子模块,帮助用户通过统一的信息模块体系组织信息资源的检索和应用。④开放信息模块。实现学科信息门户资源与服务的集合,根据用户的个性化需求提供信息门户定制服务,按照业务标准对信息服务进行统一安排。

4.2开展信息推送服务

信息推送是通过契约与标准,接受用户的请求,将所需信息资源主动传递到客户端。信息推送服务是以网络技术为基础的新颖服务模式。首先由用户将其个人信息与需求输入特定系统中,然后信息推送软件抽取出资源,经过加工整理传递到用户端。通过信息推送服务,用户只需输入单次信息请求,即可通过多种途径持续高效地接收高质量的信息资源。

4.3引进信息营销理念

在图书馆信息服务中引入营销理念,是进入大数据时代图书馆的创新尝试与变革。图书馆的世外桃源形象将被彻底改变。信息服务营销使得图书馆信息服务有了强大的发展动力。对信息资源及信息服务进行分析调研,利用促销、分销手段进行科学经营,在实现信息服务与用户价值交换的过程中满足用户的信息需求。信息资源的实际使用价值大大提高,实现大数据时代的双赢。笔者认为大数据时代图书馆的信息服务会升级,特别是信息营销理念会被普遍接受。比如在网上进行信息服务营销;把初级营销、高级营销、互动营销等紧密连接,形成一套完整的信息服务营销体系,利用各种营销策略促进图书馆信息服务水平的不断提升,并向着品牌化的方向发展。

4.4坚守资源建设生命线

图书馆应用大数据,很容易造成“大数据是万能的”这样的印象。大数据仅仅是一项获取信息的工具,而面对占有资源与索取资源这两个选择,我们肯定首选前者。资源建设是图书馆的生命线。只有占有资源,图书馆才能有底气,有生命力。尤其是特色资源建设代表着图书馆在业内的学术地位,在学科建设过程中占有超级资源也就拥有了学科的制高点。科技在变,但图书馆收集、整理、珍藏和利用人类智慧的功能不会改变。

4.5加强不同地域图书馆之间的合作

我国不同地域的图书馆存在严重的地域差异和两极分化的现象,加强图书馆之间的合作可以取得优势互补的效果,可以提升图书馆的综合竞争力。高校图书馆的数字资源建设及数字信息服务水平比较高,中小学图书馆、县级公共图书馆可请求高校图书馆对其进行指导,例如有关数字资源的共享、信息咨询等。该工程需要政府支持和引导。我们可以借鉴和学习美国政府于2012年启动的“大数据研究发展计划”。其计划目的是研究发展大数据的采集、组织、分析、决策工具及技术。

4.6完善学科馆员制度

学科馆员的职责是组织、分类整理、编排、升级所收集到的信息资源,对跨地域客户提供人性化、专业化的定制服务。学科馆员对应用网络检索工具熟稔于心,能够高质量开展检索,运用高效的检索技能对跨地域客户的检索问题进行回答。学科馆员建设的力度和学科馆员专业水平、服务态度的优劣,代表了图书馆的整体管理水平,也代表着图书馆个性化服务的水平。

5结语

信息社会大数据时代已经到来,大数据作为目前图书馆学界最新的研究领域之一,吸引了众多学者关注和研究。图书馆在未来的工作中,应积极倡导以大数据为导向,通过树立先进理念,不断掌握新技术,更好地为读者用户服务。

参考文献:

[1]严浪.大数据在图书馆的应用与对策[J].图书馆学刊,2014(5):54.

[2]CNNIC第33次调查报告:网民规模[EB/OL].[2014-01-16].http://tech.sina.com.cn/i/2014-01-16/10499101841.shtml.

[3](印)阮冈纳赞.图书馆学五定律[M].北京:书目文献出版社, 1988.

[4]舒忠梅,屈琼斐.大数据时代高校信息管理与决策机制研究[J].华南理工大学学报(社会科学版),2013(6):97.

[5]苗松,卢章平,王正兴.我国移动图书馆热的冷思考[J].图书馆建设,2013(4):13-16.

[6]The White House.Big Data Across the Federal Government[EB/OL].[2012-08-10].http://www.whitehouse.gov/sites/default/files/micro-sites/ostp/big_data_fact_sheet.pdf.

(编校:周雪芹)endprint

猜你喜欢

图书馆大数据应用
图书馆
GM(1,1)白化微分优化方程预测模型建模过程应用分析
煤矿井下坑道钻机人机工程学应用分析
气体分离提纯应用变压吸附技术的分析
基于大数据背景下的智慧城市建设研究
会计与统计的比较研究
去图书馆