大数据视角下图书馆的发展对策
2013-02-15王天泥
王天泥
(辽宁省图书馆,辽宁 沈阳 110015)
王天泥 女,1982年生。硕士,馆员。研究方向:信息资源管理。
1 引言
移动终端、社交网络的全民化应用以及信息化程度提高带来的大量信息查询、信息分析等信息行为,使得真正记录这些行为的非结构化数据、半结构化数据日益增多,加之沃尔玛等商业机构基于这些海量、复杂的数据对用户行为进行分析而得出的“啤酒与尿布”的经典营销案例创造出的巨大商业财富[1],因而逐渐引发了社会各界对数据的广泛关注,产生了大数据(Big Data),即由电子邮件、办公文档、社交网络等产生的非结构化数据、半结构化数据以及传统的存储在数据库中的结构化数据之和。大数据环境下,个人、企业乃至政府对其应用的依赖性越来越强,基于大数据分析的情报信息也将成为组织机构进行科学决策、生产发展、科技创新的主要依据,社会进入到了一个以数据驱动社会创新、经济增长的发展期,“大数据”时代已悄然来临[2]。
大数据时代,数据将成为组织的重要资产,被称为未来的“石油”,对于组织提升社会竞争力、推动生产创新具有巨大价值,因此大数据概念一经提出,就受到了大型企业、信息服务机构乃至政府的高度重视,包括美国政府、IBM等在内的政府和组织、企业都加入到了大数据研究的行列之中,力图在“大数据”时代的信息竞争环境下处于主导地位[3]。此外,对于科学研究来说,一方面随着科学研究范式的演化,科学研究进入到了一个主要针对密集型数据处理的时代;另一方面,大数据的产生也将为科学研究注入新的活力,基于大数据的数据挖掘、可视化分析、数据组织等必将成为其主要研究内容,正如中国工程院院士李国杰先生所指出的未来有可能形成新型交叉学科——网络数据科学[4]。
目前,在还未形成真正的大数据技术领先者及实践先行者的发展初期,笔者认为,图书馆人应以特有的信息素养、信息技能及职业前瞻性理性思考大数据会给图书馆带来什么,并在图书馆学科教育、资源配置、技能培养、服务优化等方面做出积极的变革,这无疑将对大数据时代的图书馆具有重要意义。
2 大数据在我国图书馆界的研究进展
大数据作为一个新兴研究领域,虽然发展时间较短,但是图书馆人在理论研究和实践方面已经进行了率先探索,主要成果有:杨海燕[5]在对大数据的概念、特点概述的基础上,分析了大数据时代的图书馆数据处理与服务,认为从大量的数据中分析、挖掘潜在的价值将成为图书馆的一大主要业务;韩翠峰[6]则重点研究了大数据带给图书馆的影响与挑战,认为大数据将对图书馆的数据存储、数据挖掘、数据分析等带来巨大影响,图书馆业务也将因此面临巨大的考验;樊伟红等[7]分析了未来图书馆的几个大数据主要来源,并结合当前研究现状,重点探讨了大数据将为图书馆带来的帮助;张文彦等[8]通过研究大数据的内涵指出,大数据时代的来临给图书馆带来了根本性的变革,同时大数据在图书馆中的应用将会产生许多诸如技术、人才、安全等新问题。韩翠峰[9]认为,图书馆的服务创新、质量提升需要大数据的支持,大数据将成为图书馆的核心资产。中国国防科学技术信息学会情报研究专业委员会于2012年8月23~25日在黑龙江漠河召开了“大数据背景下的国防科技情报研究”学术研讨会;[10]2012年11月17日,由清华大学社科学院经济研究所、阿里研究中心等联合举办的“大数据时代的机遇、挑战与责任”研讨会在南开大学召开[11];在中国图书馆学会2012年11月21~24日于东莞召开的学术年会“融合·创新·超越——共谋数字图书馆发展”主题论坛上,武汉大学教务部部长、著名图书馆学家陈传夫教授做了题为《大数据时代的数字图书馆》的报告,报告围绕大数据时代数字图书馆的建设与发展进行了阐述,指出数字图书馆应加强原生大数据、领域大数据、特藏大数据、相关技术等方面的开发,由静态发展转向动态发展[12];2012年11月30日至12月1日,以“大数据共享与开放技术”为主题的中国IT界技术盛会在北京召开[13]。可以看出,大数据已成为我国图书馆界的一大研究热点,短短半年时间,已形成了一定的研究热度与规模。
3 大数据视角下图书馆的定位思考
大数据的应用将为图书馆大规模数据处理、数据分析、资源整合、开展个性化服务、提升服务能力和服务水平提供新的思路和方案。如前所述,我国图情界学者已从不同的视角对大数据与图书馆的相关问题如机遇、影响等进行了研究,这对于推动大数据在图书馆的应用、提升图书馆的服务品质有着较大的理论价值和现实意义。但经仔细研究发现,对于大数据视角下的图书馆定位思考尚属空白,鉴于此,笔者试对该问题进行一定的阐释。
3.1 图书馆的业务与服务重点应向上游转移
不管是在传统图书馆还是数字图书馆,从资源的利用流向来看,图书馆的业务与服务重点均在下游,即资源的组织、利用与保存。然而在大数据时代,图书馆用户服务并不仅仅依靠结构化数据,如书目资源库、机构知识库、语义化信息等,还可能依靠大量的非结构化数据和半结构化数据,如用户的信息查询行为、阅读习惯等,通过数据挖掘、数据分析等方法为用户提供有针对性的个性化服务。因此,数据的收集、存储、分析、处理将成为图书馆的主要业务,即通过大数据的某些关键技术将海量的复杂数据进行协同处理,再通过数据挖掘、可视化分析等形成具有情报价值和决策参考价值的服务信息提供给用户,以便用户通过图书馆获得准确、及时、有效的信息知识,实现业务与服务的上游转移。
3.2 图书馆应成为公共数据存储、处理、分析与服务中心
图书馆特别是公共图书馆作为现代社会公共文化服务的重要组成部分,在文献传递、社会教育、娱乐休闲等方面起着举足轻重的作用,加强信息技术的应用,延伸图书馆服务是近年来我国图书馆界的主要建设目标。但随着全社会进入到了一个以密集型数据的相关分析、处理来推动社会创新发展的大数据时代,同时图书馆服务拓展到了大数据分析、处理领域,图书馆的定位将不只是社会文化服务机构,而是要集社会公共数据存储机构、公共数据分析机构、公共数据处理机构、公共数据服务机构于一身,担负起时代赋予图书馆的更加重要、更加凸显社会存在价值的使命。
3.3 图书馆应是一个完整的网络体系
大数据技术对于图书馆的价值所在即是其在用户服务中的应用,目前讨论最多的是数据分析、数据处理和数据服务,而这些技术的实现则需要充足、大量的数据支持,应既包括用户在图书馆的信息行为数据,也包括在社会场所的数据;既包括在一所图书馆的借阅行为、人际社交等数据,也包括在其他信息机构的此类数据,因此,在大数据时代,图书馆应借助于可能产生对象用户数据的多个图书馆的数据支持,甚至还需要借助包括商业中心、社会服务中心、娱乐中心和工作空间等在内的信息中心的数据支撑,只有图书馆间形成协调工作的有机网络体系,才能真正实现数据的共知共享,最大限度地满足用户需求。
4 大数据视角下图书馆的发展策略
4.1 拓展大数据分析与处理业务
近年来,我国图书馆事业在迎来一个发展高潮后,数字化、网络化、智能化服务已成为图书馆服务的主要内容,国家数字图书馆工程、CALIS、CADAL等数字资源建设共享项目及自建特色数据库、机构库、购买的数据库等都丰富了图书馆的馆藏数字资源,也为图书馆拓展服务提供了资源基础和机制保障。但同时也发现了一些问题,一方面,图书馆特别是公共图书馆的服务主要还是依靠纸质资源的传统服务;另一方面,图书馆所提供的数字化服务主要是基于数据库以及纸质文献资源的数字化,大部分都是结构化数据,从中很难挖掘出更深层次的信息。大数据时代的到来,图书馆所存的数据结构将发生巨大变化,非结构化数据、半结构化数据将占据较大比例,社会公众会随着大数据分析所带来的商业优势而对其产生浓厚兴趣,并迫切希望图书馆等信息中心能提供大数据分析、处理等专业化知识服务。图书馆应紧跟时代步伐,把握事业发展主旋律,通过改善基础设施、挖掘服务潜力、提高人才素质,来拓展和完善图书馆的大数据分析、处理业务。
大数据客观上要求图书馆不仅需要通过数据了解现在知识服务过程中发生了什么,用户需要什么服务,也需要利用数据对图书馆与用户的交互关系进行数据挖掘,进而分析可能发生的信息行为,还需要利用数据对图书馆与科研机构在合作交互型知识服务过程中将要发生的趋势进行预测。
4.2 重视用户隐私保护
大数据的产生促使图书馆的公共服务将从以资源为中心演变为以数据为中心的数据密集型、知识创新型服务,数据的相关业务如数据分析、数据挖掘等成为图书馆服务创新的推动力,这些业务也将成为大数据时代图书馆的服务创新点、战略制高点,数据是一切业务的基础、业务是对大量数据的价值体现。但在这一演化过程中,图书馆将不可避免地面对许多困境,特别是基于个人信息的隐私保护,将更加被用户所重视和在意。如何建立安全的信息采集、保存、利用和开发机制,在不暴露用户个人隐私的前提下为用户提供优质的个性化服务,从以往相关的隐私保护来看,要解决好这一问题至少面临着信任、机制和技术的多重考验。图书馆在面对数据安全问题时,只有以良好的职业形象、完善的保障机制、优异的专业服务、合理合法的数据利用和传播,才能达到既发挥了大数据的技术优势,又不侵犯用户隐私的双赢目的。
5 结语
作为一项新兴的信息技术,大数据已受到学术界的高度关注,图情界也不例外,可以说大数据已展现出强大的学术研究生命力。对图书馆来说,将一定的学术研究成果运用到资源建设、用户服务等实践之中,是其学科研究的最终目的,但目前大数据研究仍处于初步阶段,对其的真正应用实践还属空白。由于笔者水平有限,仅是简单地对大数据视角下的图书馆自我定位、发展策略进行了浅析,相信随着信息社会的发展以及图书馆服务的变革,诸如“图书馆利用大数据的方式”等方面研究还将深入,尚待进一步探索。
[1]高勇.啤酒与尿布:神奇的购物篮分析[M].北京:清华大学出版社,2008.
[2]Big data:The next frontier for innovation,competition,and productivity[EB/OL].[2012-08-01].http://www.mckinsey.com/Insights/MGI/Research/Technology_and_Innovation/Big_data_The_next_frontier_for_innovation.
[3]赛迪智库软件与信息服务研究所.美国将发展大数据提升到战略层面[N].中国电子报,2012-07-17.
[4]中国科学院.李国杰院士:大数据成为信息科技新关注点[EB/OL].[2012-12-20].http://www.cas.cn/xw/zjsd/201206/t20120627_3605350.shtml.
[5]杨海燕.大数据时代的图书馆服务浅析[J].图书与情报,2012(4):120-122.
[6]韩翠峰.大数据带给图书馆的影响与挑战[J].图书与情报,2012(5):37-40.
[7]樊伟红,等.图书馆需要怎样的“大数据”[J].图书馆杂志,2012(11):63-68,77.
[8]张文彦,等.大数据时代的图书馆初探[J].图书与情报,2012(6):15-21.
[9]韩翠峰.大数据时代图书馆的服务创新与发展[J].图书馆,2013(1):125-126.
[10]“大数据背景下的国防科技情报研究”学术研讨会在漠河召开 [EB/OL].[2012-11-20].http://d.wanfangdata.com.cn/Periodical_qbllysj201209031.aspx.
[11]“大数据时代的机遇、挑战与责任”研讨会会议通知[EB/OL].[2012-12-10].http://ibs.nankai.edu.cn/newsview/acadamic/1034.
[12]2012年会主题论坛:融合·创新·超越——共谋数字图书馆发展[EB/OL].[2012-12-10].http://www.lsc.org.cn/CN/News/2012-11/EnableSite_ReadNews1131362041353945 600.html.
[13]HBTC 2012.2012 Hadoop与大数据技术大会圆满落幕[EB/OL].[2012-12-10].http://hbtc2012.hadooper.cn/.