APP下载

大数据时代高校图书馆数字资源服务创新策略

2016-04-11孙永生

山东图书馆学刊 2016年5期
关键词:馆员数字图书馆

孙永生 赵 青



大数据时代高校图书馆数字资源服务创新策略

孙永生 赵 青

(青岛职业技术学院图书馆,山东青岛 266555)

大数据时代,高校图书馆应转变传统图书馆服务理念,研究适应大数据环境下图书馆服务创新策略,提高服务质量。通过对大数据的概念和特点的阐述,针对大数据环境下图书馆服务存在的问题,提出大数据时代高校图书馆七方面服务创新策略。

大数据 高校图书馆 数字资源 服务创新

近几年,随着云计算、物联网、社交网络等信息技术的发展,全球数据量快速的增长,带来了一个新的科技进步时代,即大数据时代。大数据时代的到来,高校图书馆应顺应时代的发展,抓住大数据为图书馆带来的发展机遇,改善图书馆服务模式,由被动服务转变为主动服务,提高图书馆服务质量,提供知识增值服务,增强用户对图书馆的存在感和依赖感,促进图书馆更好的发展。

1 大数据的概念和特点

大数据时代是近几年的事,大数据的概念还没有一个权威的概述。在2011年麦肯锡全球研究报告《大数据:创新、竞争和生产力的下一个前沿》给出大数据是指大小超出了传统数据库软件工具的抓取、存储、管理和分析能力的数据群。在2011年IBM提出大数据的4V基本特征,即大量化(Volume)、多样化(Variety)、快速化(Velocity)和价值性(Velocity)。大量化:数据量的存储单位已经由GB或TB跃升到PB、EB甚至到了ZB级别,截止到2010年,全球信息总量超过1.2ZB,2011年超过1.8ZB,若以目前的递增的速度增长,预计到2020年,全球的数据总量将超过35ZB;多样化:原来的传统的数据是结构化数据,而现在的数据类型包括结构化数据、半结构化数据和非结构化数据;快速化:数据实时生成,同时按照用户需求提供实时的数据分析;价值性:大数据的价值往往是低密度的,单条的数据并无太多价值,但海量的数据内容进行综合和分析,会带来巨大价值的信息。随着大数据技术不断进步和多个领域对深层次信息获得和使用,全世界的全部数据的共享将成为可能。因此,图书馆应主动采集、整理、分析、组织各种各样类型的大数据,快速挖掘获得过去不可能获取到的各类有价值的信息是当务之急。

2 大数据时代高校图书馆数字资源服务存在的问题

2.1 数字资源聚合不完善

目前高校图书馆数字资源主要有图书、期刊、报纸、论文、专利、标准、科技报告等加工和特色资源库形成的数字资源(称为自有资源);购买服务的数据库资源(比如:中国知网、万方数据服务知识平台、维普期刊数据平台、超星数字图书馆、中国高等教育文献保证系统(CALIS)等)(购买服务资源);用户通过图书馆网站互交平台、互联网搜索和社交网络等留下的行为痕迹资源(用户兴趣资源)。自有资源的特色资源库收集的信息不全,信息分类标准不统一;数据库的数字资源相互通用性和关联性不高,各自数据库之间的数字资源重复资源较多,数字资源聚合基于信息链接的表层链接,忽视数字资源的深度关联和同伴之间合作交流;用户兴趣资源聚合不高,用户行为信息零散真假难辨,缺乏同用户之间及时主动的交流。数字资源的聚合并不只是单纯的把各种来自不同数据库的数字资源聚集到一个统一的网络环境中,更重要的是要实现数字资源的整体聚合,是通过运用各种网络技术和集成方法把物理上、逻辑上独立的、异构的、分布式的数字资源透明地、无缝地聚合在一起,并建立统一的检索机制,实现数字资源的跨库检索和集中管理,为用户提供个性化的一站式服务。

2.2 数字资源服务用户满意度不高

目前高校图书馆的服务还基本局限于用户提出需求,图书馆给用户提供需求信息的被动服务模式,而根据用户的行为信息分析,提供给用户信息的主动服务模式还深入的不够,造成高校图书馆数字资源利用率不高,提供给用户需要的信息资源不够全面和不够精准,总是没有达到用户需求的理想效果。图书馆提供给用户的信息,要么不加分析的相关信息量太大但并不全,要么偏离用户的心理需求,这种没有分析用户的心理需求和没有将各种信息加工成知识而提供给用户的信息资源,久而久之用户对图书馆诚信感会越来越低,而转向外部网络搜索获得相关网络资源,这些网络资源即使也存在与用户心理需求的差距,但会对用户产生自我满足感,并节省用户的时间。因此挖掘用户的习惯和喜好,从凌乱纷繁的数据背后找到更符合用户兴趣和习惯的信息,并对信息进行针对性地调整和优化,才能提高用户对信息服务的满意度。

2.3 数字资源服务不够及时

高校图书馆的数字资源服务还停留在参考咨询服务层面,通过图书馆的网站参考咨询栏目可以了解用户的需求,还有随着校园无线网络的普及,利用智能手机终端可以与用户进行有效的沟通,及时性看似可以快速实现,但由于咨询馆员的责任心、知识水平或用户阐述需求信息缺失等,特别是用户对于学科知识的信息需求,咨询馆员更显得力不从心,难以实现用户需求资源的及时提供。培养一批具备数据搜集整理和管理能力、计划制定和执行能力、学习与跟踪新技术的能力、创新能力、更深更广的专业知识能力、对所服务学科内容的理解和评估能力、人际沟通能力等高技能和高素质的学科馆员。采用信息技术工具,图书馆快速提供给用户个性化、知识化的服务资源才能成为可能。然而,事实上我国各高校图书馆的基本定位和人员配置方面很难从整体上满足学科馆员队伍的素质要求,数据挖掘技术工具还没达到商业使用的程度,造成服务的不及时性。

3 大数据时代高校图书馆服务创新策略

3.1 大数据时代对用户兴趣信息数据的采集及分析

大数据时代,高校图书馆用户兴趣信息资源来自于各种信息系统生成的多源数据,如:用户基本信息、电子邮件、访问日志、流通历史数据、信息咨询记录、社交网络、即时信息、视频、图片和语音等,数据类型有结构化、半结构化和非结构化数据,这些数据从不同视角反映人物、事件或活动的相关信息,把这些数据融合汇聚在一起进行相关分析,可以更全面地揭示事物联系,挖掘新的模式与关系。因此,高校图书馆在大数据时代,除了存储和分析用户数据记录中的个人身份、借阅记录等结构化数据之外,还需要大量的存储和分析用户行为信息,比如:用户在线咨询、浏览网页记录、搜索方式和行为痕迹(如:Facebook、BBS、QQ、微博、微信等行为信息)等半结构化和非结构化数据。这些数据便组成了图书馆信息服务的大数据,这些多源数据的形成,反映出用户对信息的需求,图书馆应协同利用多源信息,并使不同形式的信息相互补充,以获得对同一事物或目标更客观更本质的认识,分析来自不同网络的用户信息数据,发现数据的共性,并利用数据挖掘技术对用户数据进行分析处理以获得潜在的用户行为特征,并利用相关分析来进行捕捉现在和预测未来,为用户信息需求导向建设数字资源集成。图书馆还应主动吸纳用户的建议,通过研究用户的关注领域、使用偏好等方式缩短用户认知与服务间的差距,开发基于用户需求、优质有效的外延服务,以提高数字资源的效用性与满意度。图书馆需经过长期的用户行为信息及时跟踪并加以分析,提高图书馆信息服务人员对用户心理需求的把握,增强用户对获得信息的满足感。用户兴趣信息是图书馆信息服务的宝贵资源,需要深度分析挖掘,有机组织,提供给用户的数字资源才能准确和高效。

3.2 大数据时代要注重数字资源的聚合

大数据时代,用户对信息需求质量要求越来越高,希望能通过数字资源的聚合能够帮助他们快速的解决实际问题和引导他们对复杂问题的解决。我们必须改变传统的思维方式,努力将高校图书馆内外的资源建立语义关联,把全社会的数字资源融入数字图书馆资源的组织架构,并对数字资源进行聚合。数字资源聚合是为满足用户更全的信息资源范围内的需求寻找,通过跨库检索,对异构数据的检索等将分布的资源有机的整合到一起,并对资源检索结果进行聚合,形成对有关领域需求更深层次的理解和认识。比如关系型数据库的应用,数据库知识发现(Knowledge discovery in databases,KDD)是从数据集中识别出有效的、新颖的、潜在有用的,以及最终形成可以理解的知识资源。知识发现的过程要伴随用户对数据结果的反馈,不断选择的挖掘数据的质量和数量、数据类型的转换和采用数据挖掘技术的有效性进行调整,提高用户需求信息质量。目前常用的大数据处理技术有 Hadoop技术、Map Reduce、NO-SQL、云计算、关系型数据库等,这些技术都是随着大数据时代的来临所产生的。图书馆在处理大量信息的时候就可以采用这些技术,为图书馆信息服务做技术支撑。综上分析,聚合实际上是一个融合、整合、数据挖掘、并以知识发现为目的更大的一个过程。从其发现知识的目的来看,资源深度聚合是发现创新过程,也是知识的形成过程,通过聚合可以发现领域知识分布、知识交叉、知识发展演变和知识最新动态等,并可以给用户提供优质的数据资源。

3.3 大数据时代信息增值需要资源发现系统

图书馆的信息服务的终极目标是知识增值,知识发现并应用于实践,创造了价值,就实现了知识增值。知识发现是通过资源发现系统向用户提供所有功能和服务,引导用户通过一个资源发现其它有价值的和新的相关需求资源,以全球知识库代替分散的本地资源库,以中心知识库为核心的数据模块,支持数据复用、数据套录以及建立数据之间的层级递归和关联关系,从而支持多层面的导航服务和发现服务。资源发现是高校图书馆为之努力的目标,是提升图书馆价值,提高图书馆用户满意度的有效办法,是一种具有图书馆学科特质和适合图书馆工作者智能特点的服务,是一种资源组织方式的创新。资源发现系统因其能简单、便捷、高效地发现和获取所有类型的资源,得到了很多用户的青睐。自从2009年Serials Solution公司的Summon资源发现系统问世以来,逐步有Primo、Worldcat Local与Encore资源发现系统被开发,并已经应用在图书馆的资源检索、信息组织和知识服务中。2011年5月开始,北京大学图书馆开始引进资源发现系统 Summon-未名学术搜索,随后西安交通大学图书馆、浙江大学图书馆、东南大学图书馆、北京师范大学图书馆、中国科学院文献情报中心等19家单位也先后引进了Summon-未名学术搜索。清华大学图书馆、上海交通大学图书馆、中科院高能所图书馆、中国社科院图书馆引进了Primo 系统。随着高校图书馆进行系统升级与系统配套,适时推出以发现服务为核心的学科化服务和知识服务,已经成为图书馆系统发展的核心功能。但资源发现系统在图书馆的应用时间较短,还要注重对系统学习和分析。如:出现系统全文链接失败,有可能是本馆资源配置问题,也有可能是内容提供商方面的问题( 检索问题、数据缺失和元数据不规范等) ,也可能是发现系统自身的问题,图书馆信息服务人员要对用户使用过程中出现的这些问题要有足够的判断,及时的帮助用户解决系统出现的问题,并主动与信息内容提供商、发现系统提供商以及图书馆部门之间的沟通,赢得相互间的支持。发现系统的依赖资源存在的局限或基于用户行为信息的分析和挖掘构成的用户兴趣信息的偏差,也会导致高校图书馆的资源发现服务可能并不满足于用户需求的速度和效果。因此应建立图书馆服务与用户的信任关系,及时准确对用户兴趣信息和研究领域进行分析与需求挖掘,使发现服务系统发挥实效。资源发现系统不仅是一个学术搜索引擎,也是一个知识发现平台,随着资源发现系统向智能化、语义化、关联化、可视化方向发展,图书馆员自身的数据分析和资源运用能力的提高,图书馆信息服务进入精准知识增值服务阶段。

3.4 大数据时代要突出个性化服务

大数据时代,图书馆应本着主动、及时、精准和增值的服务理念,把更准确、更及时的信息传递给用户,提高用户的满意度。高校图书馆就要采用大数据技术,捕捉读者的动态操作行为,自动监控读者行为的变化情况并进行分析,自动调用结构复杂、形式多变的大数据变成有价值的信息,实现图书馆的主动式个性化信息服务。主动式个性化信息服务是图书馆主动的满足用户的信息需求,以用户为中心来提供信息服务,主动式服务有个性定制服务和主动预测服务,个性定制服务是由用户提出需求,图书馆按着用户的需求采用大数据挖掘技术获得信息进行主动服务;主动预测服务是将数据挖掘技术应用在对用户个人行为信息和信息轨迹的分析上面,对用户个人行为信息进行长期的跟踪采集、加工、存储、分析、聚类等处理,挖掘用户感兴趣的信息,根据用户感兴趣的信息对用户需求进行大胆的预测,主动为用户挖掘匹配的信息提供个性化服务,实现数据找人。高校图书馆可以结合学校的重点学科、教研方向、课题项目、教学名师和学科专家建立特色数据库、专业学科库和名师专家信息数据库等特色资源馆藏,并及时将全社会产生有价值的新信息,通过大数据挖掘技术进行数据采集、预处理、分析和挖掘形成新的信息资源,补充到特色资源库资源中,为用户提供最新有效的信息。互联网发展和移动智能手机用户的增加使得图书馆与用户之间的交流越来越便捷,目前高校图书馆与用户可以通过QQ 、微信、在线咨询等进行实时互动;可以通过网路留言、微博、邮箱等方式进行互动;也可以对用户的进行问卷调查等。图书馆与用户通过交流不但可以获得所需信息,同时图书馆还可以根据用户的信息行为分析出用户的需求,在服务过程中经过用户需求的反馈不断对提供给用户的信息进行完善。利用大数据处理技术,挖掘用户行为信息和用户需求信息构建用户兴趣信息库和用户需求信息库,通过社交网络交流平台与用户进行有效沟通,通过与出版商和数字资源提供商的有效合作开放数字资源,才能实现给用户提供所需要的深层次信息,真正实现个性化信息服务。

3.5 大数据时代信息服务应加强智能化的应用

大数据时代,数据量和数据维度均很大,数据形式广泛,如数字、文本、图像、声音等,而大数据往往可能蕴含着丰富的规律和知识,运用智能化技术(如数据挖掘、语义、关联)进行自动分析处理复杂的信息,从数据中获取隐含的东西,这些隐含东西反映了人文或自然活动和事件的本质特征,这些特征表现可能与某些事物相关一些规律或知识有关,从而延伸了事物表面所展现的规律或知识,这种隐含知识往往更有价值。从国内已经应用智能化技术的高校图书馆来看,智能化技术的运用在很大程度上减少信息服务人员劳动强度,能实现从大量信息中发现潜在的信息,能感知学习瞬息万变的各种网络信息,能存储感知到的外部信息及由思维产生的知识,能利用已有的知识对信息进行分析、计算、比较、判断、联想、决策等,这些处理功能在大数据中通过信息人员是难以完成的,因此,大数据时代信息服务离不开智能化技术。智能化技术主要通过计算机自动化处理信息并获得潜在数据,而这些数据并非是隐含规律或知识,更多的是表象数据,而有些专业用户更需要专业知识,还需要应用者或专家归纳加工成其专业知识呈现给用户。

3.6 大数据时代应强化专业资源配置馆员和专业馆员的服务能力

随着图书馆智能化水平的提高,各种自动化技术的应用,给用户提供信息质量越来越高,但对有些专业知识用户(比如:专业理论研究和实践科研项目团队等)智能化提供的结果,并不能令用户满意。对于这些特定的用户,图书馆专业资源配置馆员可以融入项目团队,掌握项目团队的需求,及时的把用户的需求反馈给专业馆员团队。专业馆员团队的构成可以分三个层次,高级层是专业领域的领军人物、专业作者、专业协会、专业联合会专家成员组成高级专业馆员,通过用户与高级专业馆员之间基于图书馆信息服务系统进行移动性、及时性、互动性的语音或视频交流,获得从文献资源中很难获得的专家潜在知识,解决极少对理论性、前沿性、探索性、创新性等需求较强的隐含知识,服务于高端需求的知识信息用户;中级层是高校专业馆员共享馆员,也是通过互联网交流平台解决本校专业馆员没有完美解答的少数用户需求;基本层是本校专业馆员,使用的频度最高,绝大多数用户专业需求疑问可以在此层得到解决。用户的需求首先利用智能化技术挖掘表象需求信息,提供给用户,用户对提供的信息不满意,用户可以申请图书馆配合重组该服务,用户可以与本校专业馆员进行多次的反馈交流,利用智能化技术多次的挖掘表象信息和本校专业馆员对信息的分析组织形成新的规律和知识,如果用户仍然对信息不满意,专业资源配置馆员可以帮助联系高校专业馆员和高级专业馆员,实现用户与其沟通,直至用户满意为止。这三种专业馆员团队借助于互联网交流平台专门的交流通道实现与用户的有效沟通和交流,知识信息的相互传递,使用户能够在专业馆员的引领下发现新知识、创造新知识和运用新知识,实现用户对知识的有效需求。

3.7 注重数字资源网络安全,防止用户和重要资源流失

大数据时代,图书馆主要通过对用户各种行为信息的采集和分析,获取用户的个体特征。通过大数据平台的数据聚合,集成高价值属性的大数据资源,在采集、分析、聚合和存储过程中,黑客可以通过破解图书馆数字资源安全防范措施,获取用户隐私数据和较高价值的数字资源。图书馆如果泄露用户大量的隐私信息,图书馆与用户之间信任感和忠诚度就会降低,图书馆的用户就会减少,危机图书馆的存在。因此,图书馆在有效采集、整合、分析与挖掘用户数据的同时,需加强用户数据的安全管理与保密工作,加强数据的安全管理和监控。如:允许用户查看、审查、纠正和删除与自身相关的隐私数据,采取用户标示匿名化、隐私数据加密、数据分片措施等。构建安全管理大数据平台,尽量使用一些技术成熟、兼容性强和可扩展的数据包捕捉与分析工具,快速实现数据的完全采集、数据集快速定位、科学分析和准确决策等。保证文献数据流在流动和存储的过程中各个信息节点安全,减少文献数据流不被非法访问和过度分析的机会,加强图书馆内部系统环境的安全监控和管理,防止黑客借助系统内部的安全漏洞来提高攻击的成功率和有效性,大数据安全存储主要应做好核心数据的加密、数据分离存储、数据备份等。数据备份是图书馆数据恢复的重要措施,图书馆可将读者隐私数据、服务数据、系统日志数据和系统配置信息等数据,通过冗余备份的方式分别存储于两个以上的不同存储节点上,并设置相应的管理策略确保主数据库数据不可用时,可通过数据的自动恢复找回需求数据,并实时对存储系统进行维护监控,删除重复数据、存储有用的数据等。

4 结语

大数据时代,社会各行各业的创新发展都依赖从大数据中获取有价值的信息,高校图书馆是高校的信息集聚中心,随之全球数据资源的逐渐开放共享、智能化技术的应用、专业馆员资源的共享,图书馆给各类用户提供满意的信息需求的条件会越来越成熟。只要我们具备大数据的思维,不断探索利用信息技术有效聚合多源数据(包括:用户兴趣资源聚合、本地数据库资源聚合、互联网资源聚合等),及时解决信息技术应用过程中出现的问题,创新服务方式,开放专业馆员共享,是完全能够满足用户需求的。数据的多样性、数据的动态演变、数据聚合,会给图书馆发展带来活力;大数据技术、分析方法、信息安全的创新,会提高图书馆用户的忠诚度;智能化、专业馆员素质的提高,会拓展专业领域用户对图书馆的追求。总之,在大数据时代,通过对大数据图书馆服务不断创新,未来高校图书馆是信息馆藏数字化、信息传递网络化、信息共享自由化的泛在图书馆,呈现给用户的是可视化的易于理解的用户需求资源。

〔1〕郭晓科.大数据[M].北京:清华大学出版社,2013:5-6

〔2〕吴昱.大数据精准挖掘[M].北京:化学工业出版社,2015:6

〔3〕范爱红,Deborah J.Schmidle.学科服务发展趋势与学科馆员新角色:康奈尔范例研究[J].图书情报工作,2012,56(5):15-20

〔4〕李广建,化柏林.大数据分析与情报分析关系辨析[J].中国图书馆学报,2014(3):14-22

〔5〕张卫东,王毅.基于用户满意度的数字资源影响要素研究[J].情报理论与实践,2013,36(12):83-88

〔6〕于曦,高洁.基于用户需求的高校图书馆嵌入式学科服务策略研究[J].情报理论与实践,2014,37(5):73-76,82

〔7〕苏新宁.大数据时代数字图书馆面临的机遇和挑战[J].中国图书馆学报,2015(11),41(220):4-12

〔8〕史忠植.知识发现[M].北京:清华大学出版社,2011:3-5

〔9〕卢章平,袁润,王正兴.发现服务:大学与研究机构图书馆的趋势[J].中国图书馆学报,2014,40(3):20-26

〔10〕周义刚,聂华,廖三三.北京大学资源发现服务推广探析-以未名学术搜索为例[J].图书情报工作,2014(20):67-72

〔11〕郑丽君.资源发现服务:图书馆服务与研究的新视角[J].图书与情报,2013(3):132-134

〔12〕高琳.大数据思维与图书馆知识资源发现[J].图书与情报,2015(1):122-124

〔13〕夏秀双.大数据环境下高校图书馆个性化信息服务研究[D].山东:曲阜师范大学,2015

〔14〕李广建,杨林.大数据视角下的情报研究与情报研究技术[J].图书与情报,2012(6),1-7

〔15〕陈臣.大数据环境下数字图书馆安全威胁与对策研究[J].图书馆工作与研究,2014(11):34-38

〔16〕鲍劼,李苏丰.大数据环境下图书馆信息安全问题与对策分析[J].科技情报开发与经济,2014,24(22):34-38

〔17〕陈臣.一种基于新型存储的数字图书馆分布式大数据存储架构[J].现代情报,2015,35(1):100-103

Innovation Strategies of Digital Resources Service for University Libraries in the Era of Big Data

Sun Yongsheng Zhao Qing

In the era of big data, university libraries should change the concept of traditional library service and study the innovation strategies of library service to improve their service quality. In order to solve the problems existing in the library services under the big data environment, the paper puts forward seven service innovation strategies for university libraries in the era of big data by introducing the concept and characteristics of big data.

Big data; University library; Digital resources; Service innovation

G258.6

A

孙永生(1965-),男,硕士研究生,副研究馆员,已发表论文10余篇;赵青(1968-),女,硕士研究生,馆员。

猜你喜欢

馆员数字图书馆
青海省人民政府关于转聘谢承华、斗尕馆员为荣誉馆员的决定
图书馆
答数字
青海省人民政府关于转聘谢佐等3位馆员为荣誉馆员的决定 青政〔2017〕32号
数字看G20
去图书馆
成双成对
浅谈图书馆青年馆员职业生涯规划
论图书馆馆员领导及其角色
数字变变变