大数据时代图书馆的应对措施
2014-02-12李鹏
李 鹏
(山东大学洪家楼校区图书馆,山东 济南 250100)
当前,互联网、传感网、物联网、云计算等信息技术迅猛发展,数据以指数级增长,人类进入了大数据时代。所谓大数据,指数据海量膨胀并扩大到难以用一般技术进行分析处理的数据集合[1]。大数据广泛存在于互联网、移动网络、社交网络、云计算、传感网等,它具有体量巨大、类型繁多、价值密度低、更新速度快等特点,而从这些繁杂多样的数据中快速获得有价值信息的能力,即为大数据技术[2]。维克托在《大数据时代》一书中认为,世界的本质是数据的,它通过数据计量的形式改变了人们理解世界的方式,是人们获得新的认识、创造新的价值的源泉。大数据开启了一次重大的时代转型,通过对大数据的获取及利用,人类得以深入地探索现实世界的规律[3]。大数据作为一种新的生产要素,对其挖掘及利用已广泛影响到各个学术领域及行业。
在大数据时代的信息环境下,信息以泛在化、智能化、移动化、虚拟化的形式发展,作为信息服务机构的图书馆也应随之适应及改变。自大数据概念提出以来,相关图书馆与大数据的讨论蓬勃兴起,但纵观这些研究,多是对技术方法及工具进行论述,从技术解析的角度讨论如何在图书馆中运用大数据技术,如数据体系的构建、知识模型的概念及特征等。笔者拟从管理与服务的角度来说明在大数据环境下图书馆工作的应对及改变。
1 大数据与图书馆
1.1 图书馆具备大数据的特征
大数据最主要的特征为体量庞大,图书馆自从建立之初即具有文献信息储存的职能,在数据收集及保存上也一直处于信息服务的领先地位。在传统馆藏累积的基础上,图书馆还有包括电子图书、电子期刊、数据库、音视频资源、网络资源在内的海量数字资源,同时随着移动网络、云计算、传感网、语义网、社交网络等新技术的发展,也扩大了图书馆数据收集领域,使数据量呈指数级上升。在一定程度上信息技术的发展使图书馆具备了大数据的特征,已突破了传统图书馆的发展局限。
1.2 促使图书馆服务与管理理念的变化
在大数据时代,因为数据的控制与处理更加容易及快速,人们对知识信息的获取将更多来自于数据相互关系的梳理与精确分析之上。当传统的专家直觉判断被精确的数据分析所代替,同时专业数据公司在信息产业中的份额扩大,这将迫使图书馆调整其服务与管理上的传统理念,以适应信息环境的变化。
大数据环境下,图书馆的发展趋势是通过严谨的数据管理、富有洞见的数据分析,为用户提供智能、泛在、协同的智慧服务。图书馆应创新服务模式,改变传统的平面信息服务观念,将结构化数据、半结构化数据、非结构化数据纳入信息考察范畴,从宏观、立体的角度分析梳理,为用户提供高质量信息资源,并持续不断地跟踪用户,向其推送所需信息,以此来提升信息服务能力。同时,在行政管理上图书馆也应发生改变,大数据技术在图书馆内广泛应用,必将形成新的分工与合作,催生新的工作职责及服务部门,一些传统的工作内容将发生改变或被摒弃,如同图书馆联机编目使大部分图书馆出现了编目业务外包一样,大数据技术也将会对图书馆的工作产生重大影响。
大数据技术引领信息服务向纵深发展,图书馆应及时做出反应,接受挑战,在变化中求创新,在创新中求发展,关注相关技术和应用,不断完善部门建设及服务职能,采取对应措施,提升图书馆管理与服务水平。
2 大数据时代图书馆的应对措施
2.1 引导用户重视大数据技术带来的价值,促进新技术应用
每一次重大的技术革命都给图书馆的信息服务带来了深远影响,但相比于理论的探讨,在实践应用上,图书馆对于新技术的反应并不积极[4],这就需要图书馆引导用户重视新技术带来的价值,激发他们利用新技术获得便捷信息服务的热情。大数据环境下,图书馆有机会在更广域更深层次收集及使用全面完整的数据,并通过多维度、深层次的智能分析,给用户提供敏捷化、专业化甚至是前瞻性的嵌入服务。而大数据技术所带来的信息获取内容及形式的变革,需要图书馆进行广泛的宣传及引导,使用户及时接受新理念新思维,并形成对新服务的期待,进而有力地促进大数据技术在图书馆中的应用。
2.2 加强数据科学的人力资源建设,适应信息服务高速发展
大数据的获取、组织、分析及决策利用都离不开馆员的广泛参与,在缺乏数据技能支撑的前提下谈论图书馆的数据服务将如观赏镜中花般虚幻。美国研究图书馆协会也提出,研究数据管理将是下一代图书馆员的能力之一[5]。培养馆员的数据科学素养、专业技能,引进数据挖掘、数据分析、数据管理等方面的人才,是大数据技术在图书馆应用得以实现的基本条件。
首先应培养馆员的大数据思维,即对冗杂的数据能够从宏观的角度实现跨学科的知识跳跃,领先一步发现新机遇新知识;其次是加强对大数据分析工具的熟练运用,大数据技术突出优势是提供决策服务,馆员应能利用分析工具在海量数据中实现知识的横向扩展及数据多维度、深层次分析,提取有效信息,为用户提供智能化决策服务;再次,图书馆应引进数据科学家,通过这些集计算机、统计分析、商业智能和信息管理等优势于一身的新型人才[6],来保证图书馆信息服务的持续创新,同时带动馆员的成长;最后,建立馆员评估机制,信息技术的高速发展也促使图书馆工作内容及职责的不断变革与创新,要求馆员的业务素养与时俱进,评估机制的建立及推行,将对馆员的专业技能、服务质量进行标准化、规范化管理,有助于图书馆大数据技术人才、服务人才的培养。
2.3 创新服务模式,提高信息服务竞争力
大数据技术的应用,信息提供途径的多样化,专业数据公司的出现,这些都使得信息服务再次分工,促使图书馆的信息服务内容发生变化,如文献采集范围扩大、采集方式发生变革等。
2.3.1 大数据信息的采集及科学管理
2.3.1.1 通过多方途径,进行大数据的采集及共享
信息服务的提供是在数据存储及整合的基础上进行的,数据的采集是图书馆基本工作职能之一。随着信息技术的发展,大量的原生数字资源每时每刻都在产生,每个用户、每台终端都在产生信息。据IDC(国际数据公司)统计,2011年全球所产生的数据总量是1.8ZB(1021)。各类数字资源呈爆炸式增长,尤其是非结构化数据(图片、声音、视频、地理位置信息等)已经成为信息资源的主体,目前非结构化数据已占数据总量的80%以上[7]。面对海量的数据信息,图书馆不能也无需收集所有的数据,但应加强对这些文献数据以外的数字资源的采集处理。
大数据时代,图书馆的数据信息采集范围除了传统的纸质文本、数字资源外,还要扩大到对传感网、社交网络、移动互联网等用户与资源交互信息的收集;应重视对本地数据的收集,通过多方协作,与政府部门、院系、研究机构、国际数据信息管理组织建立密切联系,共享科学研究型、民生服务型、经济社会型等形式的数据资源;同时专业数据公司的出现,也使图书馆通过有针对性地购买数据,降低了开发成本,提高了资源利用效率。
2.3.1.2 建立数据管理部门,加强对大数据的科学管理
大数据内容庞杂,类型多样,只有通过有效的组织管理,才能提供高质量的信息服务,对大数据的管理应是有序的、动态的、可持续发展的。因此,图书馆应建立数据管理部门,制定统一的数据管理标准,以便于形成长效机制,对数据进行科学管理及利用,规范其选择、储存、组织及开发流程。
数据的选择要求根据馆藏发展规划,依据用户需求及数据的价值,由具有图情专业背景的人员承担[6],数据的储存可以通过关系型数据库、SQL、云存储等技术将数据关联整合,形成数据网,但需要注意的是数据是动态的,有其生命周期,在有效期内要及时进行信息整合、分析,提供给用户,同时也要对过期信息数据及时剔除,以节省存储空间。数据的组织及开发是通过大数据分析工具对数据进行集成、关联、计算,提供知识智能服务、信息可视化服务、个性化学科服务等。
2.3.1.3 最后,加强数据安全管理
在大数据环境下,通过对用户数据的采集、储存及深度分析,很容易了解用户的行为及喜好、科研信息乃至商业机密,甚而能通过一些关联数据进一步预测事物未来的发展趋势。因此在对数据进行共享及利用的同时,要注意隐私及安全的考量,尊重与保护他人的知识产权,对于保密及不适宜公开的数据要按照级别提供目次管理。尤其是图书馆在采集用户馆藏信息利用数据时,一定要树立良好的职业形象,完善安全机制,解除用户对个人隐私的顾虑,使数据的采集及利用在合理合法中进行。
2.3.2 新型知识服务引擎——一站式检索服务的建立
大数据环境下,数据信息海量出现,但许多数据仅仅是简单聚集在一起,并没有形成知识源供读者使用。2011年麦肯锡全球研究所发布了《大数据:创新、竞争和提高生产率的下一个新领域》调查报告[8],指出虽然全球数据量在不断增长,但仍有87.5%的数据未得到真正利用。这就造成了信息出现与利用的不对等,一方面有大量的数据可以提供信息服务,一方面用户却沉溺在信息海洋中,难以快速有效地寻找到所需信息。
作为信息查询、检索机构的图书馆,其检索服务应适应信息环境的变化,帮助用户从庞杂的数据中进行宏观把握,快速、简单地找到所有关联信息以辅助决策。这就要求图书馆在数据检索上应改变数据来源库单一的形式,而向整合搜索、移动搜索、智能搜索和个性化搜索发展,在搜索手段的设计及实践中,应以用户需求为中心,在符合用户查询习惯的同时,对图书馆资源进行整合,包括馆藏信息、电子资源、网络资源等,通过对这些数据源的定位和连接,实现数据的采集、传输和汇聚,形成中心知识库[5],建立新型知识服务引擎——一站式数据检索。目前在一些高校已经开展了这种搜索服务,例如北京大学图书馆的“未名学术搜索”、山东大学图书馆的“读秀”“超星发现”等,其“一站式检索框”可以检索到图书馆馆藏的所有图书、期刊、多媒体音视频文件、学位论文、会议论文、电子书、电子期刊论文、订购的数据库资源、网络报纸、网页信息、社交网站资源等,并能通过链接直接获取全文或得到如何获取全文的最佳和最便捷的信息途径。
2.3.3 以用户需求为导向,提供个性化、前瞻性的嵌入服务
以用户为中心是图书馆基本的工作理念,但此种服务多为被动形式,即用户提出需求,图书馆据此来提供服务。在大数据时代,数据核心是预测,是在海量数据的基础上,利用产生数据判断自身算法和参数选择的有效性,并实时进行调整,有效地对事物进行预测判断[3]。图书馆可以通过对用户借阅历史、查询书目日志、电子资源检索日志、本地科研数据的发现、跟踪及收集等,融入大数据深度分析及智能辅助决策,精确区分目标用户群,构建出其未来所需的信息内容,并进行主动联系、推介,提供个性化的嵌入式智能服务。这种服务类似于美国的零售商“塔吉特”对于顾客怀孕的预测,其根据顾客消费记录,找到相关联的数据信息,准确预测预产期,在孕期的每个阶段给客户寄送相应优惠券,提高其商业经济利益。图书馆也可以通过大数据的这种可量化的特性,提供科研跟踪服务、精准服务、知识关联服务、前瞻性知识服务等,改进用户体验,提高服务质量,来培养用户对图书馆信息服务的忠诚度。
2.4 多元化营销,提高图书馆在信息服务中的作用及影响
当前,人们接触的信息量庞大且途径多样,更新速度快,图书馆要想有效把握用户的兴趣点及需求,以达到信息服务精确推送及提供的目的,必须适应信息环境的变化,将大数据技术带入宣传推广服务中来,实行多元化营销,提升和扩大图书馆在信息服务中的作用及影响。
2.4.1 明确目标用户群
利用数据分析其查询信息的行为,来明确定位用户所需信息服务及潜在心理需求,对宣传创意进行实时优化,确定信息加工推介内容,使其合理匹配用户需求。
2.4.2 重视媒体宣传功能
大数据的应用拓展了媒体对于用户了解的广度、深度及关联度,融合了媒体与用户的关系,媒体的价值在于不仅能为用户提供所需信息内容,还能过滤无用信息,为筛选出的目标用户量身打造相应的信息咨询和展现方式,让用户在所有信息服务形式的接触点上选择最符合自己意愿的方式进行沟通。
2.4.3 关注互联网及移动网的数字营销
掌握用户网络行为入口的大数据,挖掘和洞察用户信息搜索、浏览等网络交互行为,寻找与其信息共鸣点,都将有利于数字营销的有效推行,达到信息品牌传播和效果转化的目的。
2.4.4 关注和融入社交网站、互动媒体
当前社交网站及互动媒体蓬勃发展,截至2011年12月,腾讯即时通信服务活跃账户数达到7.210亿,“QQ空间”活跃账户数达到5.521亿[9],微博、微信等社交互动媒体也成为普通民众信息生活中的重要组成部分,图书馆应积极加入此类社交网络与媒体,扩大图书馆的受众范围,通过即时交互信息,迅速了解用户需求,推送相应信息服务,提升图书馆信息服务在个人文化生活中的作用及影响。
3 结语
大数据时代的到来,为图书馆及用户都展开了美好的愿景。图书馆可以根据数据分析实时掌握科研前沿的实时动态,为学科服务的推送提供精确有效的决策支持,可以为用户提供更加及时有效的个性化服务;而用户则可用简单、省时的方式,便捷地获取有决策效应的信息服务。图书馆为保障在大数据时代的信息服务中心地位,应积极加强大数据技术应用,培养人才队伍适应未来信息服务的需要,保障信息提供的价值贡献,通过创新服务,科学管理,提高信息服务竞争力。
[1]什么是大数据[EB/OL].http://www.guokr.com/question/457 983/,2014-04-09.
[2]百度百科:大数据.http://baike.baidu.com/view/6954399.htm,2014-04-06.
[3]维克多·迈尔·舍恩伯格,肯尼思·库克耶著,周涛译.大数据时代[M].杭州:浙江人民出版社,2012.
[4]http://www.oclc.org/content/dam/oclc/reports/2010perceptions/2010perceptions_all.pdf.
[5]朱静薇,李红艳.大数据时代下图书馆的挑战及其应对策略[J].现代情报,2013(3):9-13.
[6]钟辉新.大数据时代信息服务的发展走向及高校图书馆应对措施[A].风雨50载 薪火永相传——广东图书馆学会2013年学术年会暨学会成立五十周年纪念系列活动获奖论文集[C].2013.
[7]赵继海.大数据时代图书馆面临的挑战机遇及对策[EB/OL].[2014-04-15].http://www.doc88.com/p-7939929481049.html.
[8]麦肯锡.大数据:创新、竞争和提高生产率的下一个新领域.pdfhttp://ishare.iask.sina.com.cn/f/24165120.html,2014-04-17.
[9]7.21亿:腾讯QQ活跃用户数[EB/OL].[2014-04-15].http://www.ebrun.com/20120314/42361.shtml.