关于图书馆应用大数据视角的文献分析与思考
2016-01-13王晓燕
关于图书馆应用大数据视角的文献分析与思考
王晓燕
(安徽农业大学,合肥 230036)
摘要:通过对国内有关“图书馆与大数据”的文献进行调研,对“图书馆应用大数据”这一主题进行了分析思考。认为图书馆应该将大数据思维和技术应用于图书馆的工作和服务中,建设大数据资源,拓展和创新服务,从信息服务向数据服务、知识服务和智慧服务发展,实现图书馆服务的飞跃。
关键词:图书馆;大数据;资源建设;数据服务;知识服务;智慧服务
中图分类号:G250.76
文献标识码:A
文章编号:1006-1525(2015)01-0055-06
Abstract:Through the investigation of the documents about the relationships between libraries and big data, the author makes an analysis of this theme and believes that libraries should apply the concept and technology of big data into the work and services of libraries, to realize the great leap by establishing big data resources, widening the scale of innovative services, achieving the transition from information service into data service, from knowledge service into intelligence service.
作者简介:王晓燕 ,女,馆员。
收稿日期:2014-06-26
Analysis of and reflection on the application of big data in university libraries
WANG Xiao-yan
(Anhui Agricultural University, Hefei230036, China)
Key words: library; big data; resource construction; data service; knowledge service; intelligence service
1引言
1.1 研究背景
2012年2月,美国政府宣布推出“大数据的研究和发展计划”,将大数据作为全球性发展战略。国内外掀起了大数据的研究热潮,图书馆界也出现了较多的研究文献。[1]笔者对国内有关“图书馆与大数据”的文献进行了调研,主要从图书馆应用大数据的角度,有重点地进行了文献分析与思考。利用中国知网期刊数据库进行高级检索,以“主题”为检索途径,检索式为“图书馆”并且“大数据”,年限不限,在“全部期刊”中共检得132条结果。若期刊种类限制为“核心期刊”,则检得49条结果。对相关文章仔细阅读,梳理分析,从大数据对图书馆的影响、图书馆如何利用大数据进行服务创新的角度,对“图书馆与大数据的当今握手,即图书馆对大数据的应用”这一主题进行了分析思考。
1.2 大数据的内涵、特征和应用
2011年5月,麦肯锡公司发布了《大数据:创新、竞争和生产力的下一个前沿领域》报告,首次提出了“大数据”的概念,但至今关于大数据并没有一个统一的定义,较有代表性有:大数据研究机构Gartner的定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。维基百科将大数据定义为:“大数据”是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集。[2]更多的研究者认为,“大数据”技术就是从海量的各种结构化、半结构化和非结构化的数据中快速获得有价值的信息的能力。大数据的特征与大数据的内涵息息相关,大多数研究者对大数据的4大特征意见基本一致,即大量化、多样化、快速化和价值密度低,亦即4V-Volume,Variety,Value,Velocity。
大数据的价值关键在于应用。大数据将逐渐成为现代信息社会重要的基础资源,数据洪流里蕴藏着巨大的财富。通过对数据进行专业化的数据分析、数据处理和数据挖掘,揭示其现实或潜在意义。从市场营销到商业智能,从企业管理到公共服务,从科学研究到技术创新,几乎社会的各个领域都将被大数据所影响和改变。
1.3 大数据在图书馆的应用
“虽然从长远看,每一个行业都将‘大数据’化,传统行业最终都会转变为大数据行业。但从当前来看,大数据并非能够马上颠覆或影响所有行业和领域。今天的图书馆尚未掌控真正有价值的‘大数据’,短期内图书馆难以‘拥抱’‘大数据’,只能与‘大数据’‘握个手’。”[3]但图书馆向来是新技术利用的重镇,大数据技术也不会例外。大数据对图书馆的当今服务和未来发展将会产生现实的作用和深远的影响。下文就从相关文献中分析、研究大数据对图书馆的影响,即图书馆如何在现有环境中利用大数据,学习大数据思维,利用其先进技术,在现今实际工作中加以利用。
2大数据对图书馆的挑战与机遇
2.1 大数据对图书馆的挑战
从宏观上整体把握大数据对图书馆的影响以及图书馆的应对,桂林理工大学图书馆以张兴旺为主的几位研究者连续发表了几篇文章,如《图书馆大数据体系构建的学术环境和战略思考》《图书馆需要怎样的“大数据”》和《大数据生态系统在图书馆中的应用》。特别是第一篇文章,重点结合图书馆所处的学科背景、研究背景和管理背景,分析了大数据对图书馆的影响,探讨了图书馆的应对措施。提出“大数据并非对图书馆传统信息服务模式、信息技术的彻底终结,而是在已有信息服务模式、信息技术、人文情怀基础上的完善与补充。”“始终确立用户是中心、数据是根本、图书馆是枢纽的大数据研究理念”。[4]《图书馆需要怎样的“大数据”》分析了大数据带给图书馆的3种挑战:“数据量增长所带来的存储能力及计算能力的挑战;由传统常规分析向广度、深度分析所带来的挑战;基础设施挑战”。[5]韩翠峰指出大数据带给图书馆的影响与挑战有:“复杂数据的处理将成为大数据时代图书馆的发展旋律。迅猛增长的复杂海量数据将对图书馆的数据存储能力提出挑战。传统的信息服务将面临以复杂数据为对象、以深度挖掘为要求的高标准挑战。”[6]
2.2 大数据带给图书馆的机遇
挑战与机遇并存,大数据在给图书馆带来挑战和压力的同时,也为图书馆带来了机遇。“大数据来自于数据量的自然累积和增长,是海量存储、数据仓库与数据挖掘、数字图书馆、云计算、物联网和社会性网络等技术发展的自然延伸。”[7]
大数据与图书馆有不解之缘。图书馆以知识和信息的保存、开发和利用为天职。大数据是日益增长的、海量的、多种类型和结构的数据。“数据是指收集、测度到并保存起来可管理、可利用的信息。”在当代,自动控制设备、物联网等机器所采集的电信号是最基础的数据,文字、图像和视频是最常见的数据。[8]数据的内涵和外延与知识、信息紧密联系,数据是图书馆信息资源的重要组成部分,数据经过加工提炼可转化为知识。
图书馆拥有大数据。在图书馆领域,大数据是存在的,是数字图书馆中海量数据的发展,主要包括图书馆的文献信息资源和社交网络时代出现的大量非结构化数据。前者是图书馆拥有的大量资源,包括数据库资源、电子书资源、纸质图书转换的数字资源,以及各种音频、视频资源等。后者是伴随着社交网络、移动图书馆、物联网等兴起,读者利用图书馆产生的各种信息,如个人信息、位置信息、浏览信息等信息所形成的非结构化数据。[9]大数据将成为图书馆的核心资产。
服务是图书馆的核心价值,大数据将为图书馆服务带来深刻的影响和创造性的变化,为图书馆创新服务提供资源和技术支持。图书馆服务将建立在对海量、复杂数据的搜集、组织、整理、分析和挖掘的基础之上,数据的深层分析与价值挖掘将成为主要业务。大数据时代,图书馆应该发挥信息处理与服务的优势,充分利用机遇,创新服务内容,拓展服务范围,利用先进的技术工具和手段,探索大数据分析及相关服务,提高图书馆服务的知识化、智能化程度,提高图书馆的核心竞争力。[10]
3图书馆应用大数据的实践
3.1 学习大数据思维,提高数据素养
思维是创新的源泉。大数据既是一种技术,更是一种思维。学习并内化大数据思维,培养数据意识,提高数据素养,是图书馆员迎接大数据时代的思想和素质基础。大数据思维,即大数据技术的哲学基础或内在逻辑,有学者从大数据的特征出发,认为其具有规律性、无偏性、关联性和开放性4个特征。对现阶段条件下,实际利用大数据或类大数据具有指导意义。图书馆员学习大数据,关键是借助大数据思维创新服务理念和服务模式,扩大服务范围,挖掘服务深度,提高服务质量。[11]
数据素养是一种能力,能够理解本行业、本专业的数据问题和意义,能够与数据专家对话,使数据产生价值,提升竞争力,提高管理决策的有效性和及时性。图书馆员应通过学习、培训、实践和交流等多种途径,在意识、知识和技能上做好准备,提高数据素养。例如,理解数据的价值和负面影响,把握数据的出处、采集和处理,善于利用数据解决问题等。[12]
在具体工作和服务中,要有意进行大数据资源建设,创新用户服务,学习利用新技术。信息资源建设是图书馆服务的根本,大数据资源将成为图书馆的核心资源。图书馆应重视利用大数据资源进行开发、升级传统服务,拓展新型服务,从资源服务、数据服务向知识服务、智慧服务转变。
3.2 大数据资源建设
资源建设是图书馆服务的基础。大数据资源建设主要有文献信息资源建设和数据资源建设,核心是大量、多类数据的拥有、融合、挖掘与利用。文献信息资源包括传统文献资源、数字资源和网络资源。数据资源是新兴资源,是目前图书馆还未完整收集、亟待建设的大量数据,如用户信息行为数据,是大数据资源建设的主体和难点。数据资源建设和文献信息资源建设互有包含,相互促进。[10]
图书馆数据资源可能是已存在于图书馆数据库中的书目信息、电子图书等结构化数据,也可能是用户在图书馆的借阅行为、阅读习惯等非结构化数据。目前可以着手也是应该进行的工作是收集、存储相关数据,如用户信息行为数据。图书馆在数据资源的建设中需特别重视非结构化数据的收集与丰富,以满足用户个性化、多样化的知识需求,如美国国会图书馆的“美利坚记忆”;国家图书馆的数字图书馆加强非结构化数据存储量。[13]。图书馆在进行数据资源建设时,一方面是储存、累积大量、多类型的数据,为大数据做数字准备;另一方面是借助数据分析手段和研究方法,挖掘、识别、组织与分析数据背后的隐含信息,发现用户需求变化特点,寻找用户隐性诉求,预测图书馆的资源建设和服务趋势,指导信息资源建设和信息服务。
文献信息资源建设是图书馆传统、基础业务。在大数据思维和技术背景下,数据资源建设为文献信息资源建设提供参考,促进和提高文献信息资源建设。如为本馆的采编部门和数据库采购部门提供资源评价意见。通过收集、分析读者借阅历史、访问记录等数据,评估读者对各种资源的使用情况,预测读者关注的热点,可有效评估图书馆文献资源建设质量,满足读者需求。
虽然现阶段数据资源建设还不是真正意义上的大数据,但可以用大数据思维建设数据资源,一方面为未来图书馆拥有真正的大数据做数据储备,另一方面利用数据进行分析,完善文献信息资源建设,从一个个具体的工作环节入手,运用大数据思维,使用相关技术,逐步逼近。如吴志荣在《文献发现:大数据时代的重要命题》中认为可以把文献信息视为一种类大数据,推动对其的采集、组织、分析、决策等处理技术的进步,是大数据处理的重要组成部分,提出并阐述文献发现的理论及其现实意义,构建文献发现的方法体系,并以学术文献为例对文献发现作进一步的阐发。[14]《大数据环境中获取电子文献有效因子模型设计与实验》一文中设计了针对大数据环境下获取电子文献有效因子的研究模型,并在小范围内基于分布式采集模式进行数据收集,完成数据挖掘。[15]《基于大数据的高校图书馆推荐系统仿真研究》和《图书馆联机目录OPAC的注意力危机及其重构策略——基于供需不对称视角的分析》等文章更有技术针对性,从具体的技术角度和数据处理进行实证研究。
3.3 大数据创新服务
3.3.1 数据服务
面对日益增多的各种形式的结构化、半结构化数据,图书馆必须对其进行管理、存储、采集、挖掘、分析,探索大数据分析及相关服务。目前,图书馆开展的大数据服务业务,主要是数据分析。一是图书馆自身建设所需的数据分析,一般以图书馆的现有数据为对象进行分析,如读者的借阅历史、兴趣爱好等,是一种对现有资源的分析与挖掘;二是读者或客户所需的数据分析,类似于当今图书馆的信息情报参考、竞争情报分析,但也有着很大的区别,如分析对象、分析手段、分析目的不同等。
现阶段的数据服务,主要集中在高校图书馆,主要是科学数据服务,有几篇文章具体介绍了科学数据服务的实践和相关问题研究。如《科学数据服务:图书馆服务的新领域》介绍了北美高校图书馆的科学数据服务现状,以情报咨询类服务为主,包括科学数据服务培训、数据管理计划、数据查找与引用等。重点讨论了图书馆未来提供科学数据服务的主要内容,如科学数据的开发服务、存储服务、分析服务、发现服务等,最后对图书馆提供科学数据服务的切入点进行了分析,指出以科学数据咨询服务为切入点,拓展服务的范围与领域。[16]《科研项目不同阶段的科学数据监管方法》指出高校图书馆应按照科研项目不同的阶段采取相应的科学数据监管方法、科学数据收集方法及公开方式。图书馆员应深入科研过程,为科研人员提供个性化的数据监管服务。[17]
图书馆的科学数据服务与实践,虽然还处于起步阶段,但已是图书馆服务的一个重要趋势。我国图书馆界开始进行有关探索,如中科院国家科学图书馆提出并开展的科学数据与科技文献跨界集成服务、数据融合技术的研究和开发等。
3.3.2 知识服务
图书馆利用信息资源优势向用户提供知识服务成为时代发展和自身生存之需要。图书馆知识服务是基于馆内信息资源与馆外信息生态中的各类显性和隐性的知识资源,在“以用户问题为导向”的原则下为用户进行收集知识、过滤知识、分类知识、提炼与知识分析等的处理过程,即面向用户的问题提供知识性的解决方案。[18]大数据知识服务是为适应信息服务业智慧化、协作化、绿色化、先觉化和泛在化的发展趋势而衍生的一种基于网络,用以解决结构化、半结构化及非结构化数据多维度处理的信息服务新模式,是嵌入式协作化知识服务模式的一种新发展,是现代信息服务理念的具体体现。[19]
大数据时代的到来及大量相关技术的广泛应用,将使得海量、复杂、多结构数据的即时获取、精确分析、深度挖掘成为现实,为知识服务带来诸多服务增长点。有学者研究了大数据知识服务的具体形式,如知识咨询、知识发现服务等。王天泥在《知识咨询:大数据时代图书馆的知识服务增长点》中指出知识咨询是大数据时代图书馆咨询服务的新模式,知识咨询相比较参考咨询,更在意是否能提供解决用户问题的知识,更注重用户的专业化、知识化、个性化需求,提供解决用户实际问题的知识,以及与用户协同合作创造的知识服务和面向用户的知识管理等。[13]李佳在《基于知识发现的图书馆个性化知识服务研究》中以知识发现为视角,对图书馆的个性化知识服务的系统内容形式进行了设计与研究,认为图书馆的个性化知识服务内容主要有个性化知识检索服务、个性化知识导航服务、个性化知识定制服务与个性化知识咨询服务。[20]孙卓在《基于大数据构建图书馆知识服务引擎研究》中分析了大数据的知识优势,从数据资源、数据分析技术、数据价值性等角度阐述了图书馆基于大数据构建知识服务引擎的可行性,构建了涵盖知识来源与过滤层、知识存储层、知识表示与标引层、知识处理与挖掘层、知识检索与反馈层的知识服务引擎体系,以应对图书馆与用户的“知识服务观”的需求。[18]
3.3.3 智慧服务
由资源服务向知识服务、智慧服务发展是图书馆服务模式发展的必然趋势。大数据为图书馆智慧服务提供了资源与技术支持。“如果说工业革命的核心是能源,那么计算机和网络的诞生则开启了信息革命,而大数据是信息革命的继续,将信息从知识的载体发展到智慧的源泉,成为社会财富的新来源。”[8]图书馆可在过去和现在的大量数据中找出关联、发现规律、验证假设,预测未来服务的趋势和需求,实现智慧服务。
在现阶段,图书馆进行智慧服务,首先要利用大数据资源和技术提高图书馆服务的智能化程度。如对海量信息数据的智能抓取、关键词抽取等。利用大数据资源,如大量图片、视频、文本等信息,特别是读者的使用信息、社交信息等大量非结构、半结构化数据等,为图书馆的智能化决策提供分析参考。[10]同时,加强图书馆管理和服务的互联性,广泛互联的网络服务将成为未来图书馆服务增长的源头,这种网络服务具有泛在、协同、智能性。物联网、云计算和大数据技术为图书馆智慧服务创造了广阔的空间和技术。“物联网的本质就是信息技术支持下跨时空的物物相联,云计算的本质则是大数据环境下泛在便捷的网络访问和个性化服务。”除了书与人的互联要素外,可以将图书馆、网络、数据库、物体以及广大读者统一在智能的网格中,成为联为一体的互动要素。[21]
陈臣在《基于大数据的图书馆个性化智慧服务体系构建》一文中具体研究了基于大数据的读者个性化阅读风险与需求,最后构建了基于大数据的图书馆个性化智慧服务体系。认为图书馆可利用大数据技术对读者需求和服务模式进行预测,并通过建立图书馆界之间的资源共享和协同服务,来消除时间、地点、阅读方式与阅读内容对读者的束缚,保证读者可随时随地进行个性化推送式智慧阅读服务。[22]
智慧服务离不开智慧图书馆的建设。祝森生在《大数据时代关于智慧图书馆的几个研究问题探讨》中探讨了图书馆开展智慧服务的几个问题,即如何实现智慧图书馆的数据互联问题、高效管理问题、便利服务问题等,为现有条件下开展智慧服务提供了借鉴。实践中,北大图书馆已在智慧图书馆的建设中,加入了数据分析与数据挖掘等大数据元素在图书馆的应用,如读者查询问题,不仅能查询原始信息,还能把检索到的信息组织成综述或报告呈现给用户,并按用户需要的格式导出。[23]
大数据带给图书馆最重要的挑战和机遇是让图书馆员的工作再一次从管理载体回归到管理知识本身,图书馆应从信息时代的文献服务、信息服务走向大数据时代的知识服务、智慧服务。图书馆应在积极建设大数据资源的基础上,借助大数据技术,对大规模的海量数据进行数据分析和数据挖掘,深入知识内容,从中提炼出有价值的知识,精确分析,深度挖掘,嵌入用户的管理决策、教学科研、科技创新等社会实践过程中,提供以智力、知识、工具的应用为特征的知识服务,适应用户信息活动趋于个性化、动态化和智慧化的需要,实现智慧服务。
4结语
大数据伴随着云计算、移动互联网、物联网等信息技术的成熟而迅速发展,大数据技术将会给图书馆带来深远的影响和创造性的变化,是图书情报领域无法回避的未来技术发展形态,也为图书馆实现服务模式的转变和创新提供了新的思路和解决方案。目前,尽管大数据技术的研究还处于起步阶段,还面临着许多问题,但是,正如范并思教授所言:信息技术发展所带来的机会总是稍纵即逝的,如果我们只是观望,那么我们将永远只能抓住信息技术应用领域的尾巴。[24]我们应该迎接挑战,抓住机会,学习、研究大数据思维和技术,在实际工作和服务中加以应用,利用大数据创新图书馆服务,提升图书馆的核心竞争力,以期在未来实现图书馆服务的跨越。
参考文献:
[1] 陆静.我国图书馆界大数据研究评述与展望[J].图书馆杂志,2014,(1):20-25.
[2] 程莲娟.美国推进大数据的应用实践及其有益借鉴——基于图书馆视角的分析[J].情报资料工作,2013,(5):110-112.
[3] 陈超.图书馆如何迎接大数据时代?[J].图书馆杂志,2014,(1):4-7.
[4] 张兴旺.图书馆大数据体系构建的学术环境和战略思考[J].情报资料工作,2013,(2):12-17.
[5] 樊伟红,李晨晖,张兴旺等.图书馆需要怎样的“大数据”[J].图书馆杂志,2012,(11):63-68,77.
[6] 韩翠峰.大数据带给图书馆的影响与挑战[J].图书与情报,2012,(5):37-40.
[7] 张文彦,武瑞原,于洁.大数据时代的图书馆初探[J].图书与情报,2012,(6):15-21.
[8] 缪其浩.大数据时代:趋势和对策[J].科学,2013,(7):25-27.
[9] 姜山,王刚.大数据对图书馆的启示[J].图书馆工作与研究,2013,(4):52-54,79.
[10] 韩翠峰.大数据时代图书馆的服务创新与发展[J].图书馆,2013,(1):121-122.
[11] 和婷.大数据思维对图书馆信息服务工作的启示[J].图书馆建设,2014,(1):64-68.
[12] 缪其浩.了解大数据,具备起码的数据素养[J].世界科学,2013,(2):14.
[13] 王天泥.知识咨询:大数据时代图书馆的知识服务增长点[J].图书与情报,2013,(2):74-77.
[14] 吴志荣.文献发现:大数据时代的重要命题[J].上海师范大学学报(哲学社会科学版),2013,(4):21-27.
[15] 陈俊,张伟云,赵捷.大数据环境中获取电子文献有效因子模型设计与实验[J].情报资料工作,2013,(6):56-59.
[16] 陈建新.科学数据服务:图书馆服务的新领域[J].图书与情报,2013,(4):93-95.
[17] 沈婷婷,卢志国.科研项目不同阶段的科学数据监管方法[J].图书馆建设,2013,(3):49-51.
[18] 孙卓.基于大数据构建图书馆知识服务引擎研究[J].图书馆学研究,2013,(18):48-51.
[19] 李晨晖,崔建明,陈超泉.大数据知识服务平台构建关键技术研究[J].情报资料工作,2013,(2):29-34.
[20] 李佳.基于知识发现的图书馆个性化知识服务研究[J].图书与情报,2013,(5):100-102.
[21] 王世伟.再论智慧图书馆[J].图书馆杂志,2012,(11):2-7.
[22] 陈臣.基于大数据的图书馆个性化智慧服务体系构建[J].情报资料工作,2013,(6):75-79.
[23] 祝森生.大数据时代关于智慧图书馆的几个研究问题探讨[J].图书与情报,2013,(5):126-128.
[24] 郭自宽,张兴旺,麦范金.大数据生态系统在图书馆中的应用[J].情报资料工作,2013,(2):23-28.
(责任编辑:朱爱瑜)