APP下载

美国高校图书馆大数据服务实践研究及启示

2016-07-26吴晓静

河南图书馆学刊 2016年7期
关键词:高校图书馆大数据

吴晓静

关键词:大数据;高校图书馆;服务转型

摘要:文章根据大数据背景下,美国高校图书馆尝试服务转型,并以雪城大学、斯坦福大学为例,雪城大学应用大数据技术收集社交媒体信息,预测2016年总统大选;斯坦福大学参与社会互联网信息与电子邮件保存、整合与管理的实践,体现了在大数据时代美国高校图书馆服务的转型新趋势,为国内高校图书馆的服务创新及转型发展提供了经验。

中图分类号:G250.74文献标识码:A文章编号:1003-1588(2016)07-0122-03

随着信息技术的快速发展,现实物质世界不断被数据化,当物质世界完成数据化的构建及解读,人类即迈入智能时代[1]。大数据时代催生了新的知识需求模式及管理模式,对图书馆行业产生了深刻影响。一方面,图书馆界加快了基于互联网、大数据技术的融合转型,开始运用互联网思维变革、创新服务,在合作、支持、外向发展的思维指导下,图书馆员开始日益关注如何更加有效地与研究人员开展合作,如何满足教师及社会大众的多元需求。另一方面,图书馆开始充分依托大数据技术,推动数字资源整合,提供深度服务。其服务模式包括:①通过馆藏资料的数字化和网络化加大馆藏资源的揭示力度,提供一站式服务,通过异构数字资源的融合、聚类和重组使资源从数据层的揭示与展现转向信息层、知识层的深度服务。②加强用户数据分析,实现个性服务。如:通过大数据分析精准预测单个用户信息需求模式及行为模式,推送服务。③参与互联网信息的采集、保存和服务。如:整理社交媒体信息,帮助社区理解主要的数据和信息资源,并利用数据构建智能社区[2]。近日,美国图书馆协会主席萨莉·菲尔德曼在接受《高等教育纪事报》采访时以雪城大学图书馆的STACK(堆栈)项目等为例,展示了美国大学图书馆在大数据利用方面的示范作用[3]。对国外大数据创新服务实践经验的研究能够为国内图书馆的服务转型提供参考和借鉴。

1 美国高校图书馆大数据服务实证研究

1.1 雪城大学图书馆STACK项目

大数据产业链与数据的生命周期密切相关,数据从产生、整合、处理、智能分析,最后与创新服务的结合应用,构成了大数据完整的产业链,而完整的大数据技术堆栈则相当于涵盖数据生命周期的大数据平台。通常的数据堆栈包括:①作为堆栈底层和基础的数据层。②发生数据准备、数据处理、数据转换和数据整合的整合层。③存储数据、对数据进行可视化、分析数据的分析层。④使用数据(包括历史数据、外部数据和实时数据)、业务规则和机器学习来进行预测及获取大数据价值的预测及规范分析层。从底部数据存储、操作、转换、基本分析发展到高级分析的预测,是大数据技术应用发展的必然[4]。在数据堆栈技术的应用上,美国雪城大学iSchool走在了图书馆界的前列。

STACK项目是雪城大学iSchool新开设BITS Lab(Behavior,Information,Technology and Society行为、信息、技术、社会实验室)的第一个项目。作为雪城大学iSchool跨学科数字政治项目的分支,STACK项目具体运作如下:①开发STACK软件与Twitter、Facebook数据流、搜索工具的应用程序接口。②围绕36位竞选州长,展开大数据采集,这些信息包括在Twitter中被推送、加标签、关注、谈论的相关信息,在Facebook中被发布、喜欢、分享、追随的频次以及在Instragram、YouTube上的相关照片、视频等。③以Python格式语言将这些非结构化、半结构化数据存储在MongoDB NoSQL数据库中。④分析选民对各候选人的谈论及态度,各候选人的选举策略及选举圈内的信息传递、转移模式等。在开始运行的数周内,STACK项目就已经收集了超过70万条推特信息及大量脸书评论信息,每周项目组均会就大数据调研结果编写基本的定性分析报告,预测大选发展趋势及可能出现的新信息、新选情。在大选结束后,项目组还将围绕数据基础管理、大规模数据集处理、情感分析总结出一套协调化、多管齐下的大数据分析方案[5-6]。

1.2 斯坦福大学图书馆ePADD项目

ePADD项目是斯坦福大学图书馆联合伊利诺伊大学香槟分校、哈佛大学、加利福尼亚大学图书馆及纽约城市图书馆委员会,通过合作开发支持电子邮件档案检索、采集、处理、评估、传递的开源软件,参与互联网信息的整合与管理,促进统一性国家数字平台的形成,这也是IMLS国家数字平台项目二阶段的子项目之一。2014年,斯坦福大学图书馆正式启动ePADD项目,一阶段的任务包括:针对资助者、档案工作者及研究人员所面临的电子邮件访问、管理等日常问题开发ePADD工具,利用自然语言处理、自动元数据处理及其他批处理技术,形成基于工作流的电子邮件档案管理,提升电子邮件中隐藏性文化遗产资源的能见度及可获取性。二阶段的任务包括:①发展ePADD评估、处理、搜索、传递关键功能模块,形成支持电子邮件存取的生态处理与工作流程系统,促进跨馆藏、跨机构的电子邮件发现与检索及对公众的可见性。②创建培育融合ePADD用户、开发者及充满活力的持久型社区,促进在ePADD使用基础上,整个社区的广泛参与与充分合作[7]。ePADD项目是斯坦福大学图书馆以外向发展思维为指导,在充分合作基础上,参与互联网档案管理、挖掘电子邮件大数据价值的有益尝试。

2 美国高校图书馆基于大数据的服务转型启示

2.1 关注社区,以数据技术为驱动,助力图书馆转型

信息技术迅速发展的大数据环境,无论是在资源建设、空间设计,还是在服务模式上,美国高校图书馆都在经历着转型,关注社区及以数据技术和资源为驱动,是其转型期的重要表现之一。

2.1.1 关注社区。图书馆关注重点正经历由资源向人和社区的转变,如何将服务有效嵌入用户的工作、学习和科研实践中及如何促进用户对内容创建、制造等创新活动的参与,逐渐成为高校图书馆研究的重点。

2.1.2 以数据技术和资源为驱动。图书馆的服务不再围绕资源和技术展开,而是以技术和资源为手段,通过发挥技术和资源的最大化效应,满足用户需求,辅助用户参与学习、创造活动,推动社区的学习和科研进程。资源数字化、服务网络化及管理知识化将是大数据时代图书馆的主要特点及转型升级的方向和目标,国内高校图书馆以大数据技术和大数据资源为驱动的服务转型应做好如下规划:①加快馆藏资源的数字化、网络化进程,利用元数据、数据关联技术打通数据,实施基于业务流程、揭示信息服务和发现并支持流程管理及数据统一管理的平台架构,建立统一、开源的数据仓储平台,推动数字资源的开放存取与反复、活化使用。②将大数据分析技术应用至用户需求分析、图书馆空间设计、服务设计的多个领域。③积极参与互联网信息大数据的保存、管理、分析及应用,在实现自身对社区参与、融合的同时,推动社会全面信息资源生态管理系统的构建。

2.2 外向发展,参与网络数据管理,挖掘大数据价值

在大数据技术的创新利用方面,高校图书馆应在科学规划、明确功能性定位的基础上,善于引势、借势和造势,为图书馆外向型发展拓展更大空间,同时创新体制、统筹协调,逐步实现从底部数据存储、操作、转换、基本分析发展到高级分析,以及预测技术应用路径等方面提升大数据服务的整体效能,充分挖掘大数据价值。需要强调的是,无论是对馆藏使用数据的分析,还是参与社交媒体、网络实时数据的分析,图书馆应把握以下原则:①坚持长期的数据积累。从长期的趋势分析、挖掘中发现新的价值和元素。②联系的观点。以用户信息需求分析为例,其影响因素不仅包括用户年龄层次、文化背景、学科背景等显性因素,还应包含其他一些实时性、特殊性的隐性因素,如用户从事科研项目所需要的交叉学科知识或用户从事其他特定活动所需要的新信息,这些都需要图书馆员潜心挖掘。③跨学科合作。信息、技术、用户行为三种因素相互影响、交叉作用的复杂性必须以跨学科的知识与视角为支撑。④注重数据分析结果的转化和应用,即数据分析结果源于实践,最为重要的是能够利用其指导实践,决策服务,最终形成行之有效的解决方案。

2.3 关注教学,以素养提升为目标,促进个性化学习

2015年,新媒体联盟地平线报告指出高等教育的发展趋势及挑战中,与图书馆大数据服务相关的内容包括:提升师生的数字素养,开展复杂思维教学及个性化学习。数字素养是大数据环境下对信息素养概念的延续和扩展,其包括数据敏感性、数据分析处理能力、利用数据开展决策能力及对数据的批判性判断等多个范畴;个性化学习是指在测量、收集、分析和报告关于学习者及其学习情景的数据基础上,针对个体学生特定的学习经验、需要、兴趣、愿望或文化背景设计教育项目、教学方法及学习支持策略等;复杂思维教学主要涉及的内容包括利用数据解决问题的能力、利用可视化工具呈现内容的能力、演讲与沟通能力、计算思维、设计思维、批判性思维、工程思维和系统思维等[8]。由此可见,数字素养与个性化学习及复杂思维教学密不可分。

2.4 融入社区,以数据服务为切入点,推进社区智能化

社区是图书馆资源和服务的扩展,是图书馆寻求多元合作的伙伴、创新服务模式和服务内容、提升投资回报率的核心平台。高校图书馆应秉承开放、包容的态度,以数据服务为切入点,加快推进社区的智能化进程。首先,智能化社区建立在社区的数据化描述基础上,物质、行为、需求等各类要素的数据化描述将促进社会生产力的迅速提升;图书馆应向社区大力宣传数据的重要性,帮助人们树立数据意识,培育数据素养,懂得如何利用数据创新价值。其次,智能化社区提倡数字化资源的共建共享,任何人都可能提供数据,个人的“人生数据流”交汇集合形成蕴含巨大价值的“社区数据流”“世界数据流”。图书馆应在推动用户的学习、内容创建及制造活动中,强化对用户知识创新、创造过程及成果的数据化描述,将图书馆机构知识库扩展为社区机构知识库,形成开放统一的社区知识平台。最后,社区数据价值的产生依赖于数据的充分流通、深度关联及有效管理。图书馆应积极推动社区数据的开放存取,协助建立数据关联及数据新秩序,实施有效的知识化管理,促进数据的多向传播及反复利用,充分挖掘、释放数据价值[9]。

3 结语

大数据背景下国内高校图书馆在充分关注学术社区教学、科研需求的基础上,以数据技术为驱动,以数据素养提升为目标,充分挖掘学习大数据、研究大数据价值,在为高校创建个性化学习环境的同时,参与网络数据管理,助力图书馆外向发展,推动公民社区建设的智能化。

参考文献:

[1] 信息化时代或将过去智能化数据化构建趋于零的世界[EB/OL].[2015-09-07].http://tech.ifeng.com/internet/detail_2013_05/18/25450299_0.shtml.

[2] 李雪.数字图书馆迎大数据时代:将整合资源提供深度服务[EB/OL].[2015-09-07].http://culture.people.com.cn/n/2014/1105/c172318-25981395.html.

[3] 孙梦曦.大数据促美国大学图书馆转型[EB/OL].[2015-09-06].http://sscp.cssn.cn/xkpd/xszx/gn/201511/t20151130_2718282.html.

[4] 2014年是“大数据堆栈”年吗?[EB/OL].[2015-09-06].http://www.bithink.cn/info/html/78/n-6078.html.

[5] CampaignDataCollection and Analysis is First Project in iSchools New BITS Lab[EB/OL].[2015-12-06].http://news.syr.edu/campaign-data-collection-and-analysis-is-first-project-in-ischools-new-bits-lab-39419/.

[6] Syracuse iSchool Social Media Tool Used to Track Elections[EB/OL].[2015-12-06]. http://lj.libraryjournal.com/2015/11/digital-resources/syracuse-ischool-social-media-tool-used-to-track-elections/.

[7] Stanford University Libraries-Email:Process,Appraise,Discover,Deliver-ePADD Phase[EB/OL].[2015-12-25].https://www.imls.gov/sites/default/files/proposal_narritive_lg-70-15-0242_leland_stanford_junior_university.pdf.

[8] 新媒体联盟地平线报告:2015高等教育版[EB/OL].[2016-02-25].http://www.edu.cn/xxh/spkt/xcsl/201511/t20151126_1342445.shtml.

[9] 吴建中.让图书馆促进城市生命体的新陈代谢[EB/OL].[2015-12-30].http://www.libnet.sh.cn/sla/list2.aspx?dbID=15212.

(编校:马怀云)

猜你喜欢

高校图书馆大数据
高校图书馆阅读推广案例分析
微信公众平台在高校图书馆信息服务中的应用研究
高校图书馆阅读推广活动研究
试论高校图书馆在网络环境冲击下的人文建设
大数据环境下基于移动客户端的传统媒体转型思路
高校图书馆阅读推广实践探讨
高校图书馆电子资源的宣传与推广
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索