APP下载

OCLC大数据及其应用与实践

2018-11-29汪丹

新世纪图书馆 2018年8期
关键词:大数据

汪丹

摘 要 大数据的研究和探讨方兴未艾,各个领域都探讨各自的大数据及其应用。在书目数据库方面,OCLC的WorldCat书目数据库包含2万多家图书馆的书目数据,是书目领域的大数据。无论是体量、速度、还是质量上,研究者经由大数据的统计或者网络关系等方式呈现事件发展态势,说明和辅助决策。而这一观点和应用正在通过大数据更深层次的利用,从业务流程化和合作共建共享的角度重新审视大数据应用,并以此深刻的影响到我们的工作方式和思维方式。

关键词 OCLC 大数据 电子资源管理

分类号 G250.7

DOI 10.16810/j.cnki.1672-514X.2018.08.002

0 引言

随着信息技术的迅猛发展,大数据正日益对社会的各个方面产生重要影响,中央的一系列讲话和文件[1-2]中也充分体现了大数据对于新时代的重要性。作为国家的发展战略之一,各领域都在推动大数据的相关应用,如互联网行业的网络社交与购物[3]、电信行业基于位置数据和消费数据的实时营销信息推送[4]、金融行业的投资、信贷、支付、保险[5]及制造业的企业流程优化等等。当前,对大数据的定义有很多,一般认为,大数据(Big data) 是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产[6]。维克托·迈尔·舍恩伯格和肯尼斯·克耶在其编写的《大数据时代》[7]中提出:“大数据”具有4V特点,即Volume(数据量大)、Velocity(输入和处理速度快)、Variety(数据多样性)、Value(价值密度低),大数据的这四个特点得到了学者们的普遍认可。IBM商业价值研究院在白皮书《分析:大数据在现实世界中的应用》[8]中提出大数据需要考虑的一个重要维度:Veracity(精确性),凸显了应对与管理某些类型数据中固有的不确定性的重要性。因此,通常情况下大数据具有以上五个(5V) 特性。

1 大数据对图书馆的意义

就图书馆而言,其数据尽管量大,但是单纯从数量级上,还是无法与其他行业相比较。例如,腾讯数据中心的存储量据其报道[9],已经超过1000个PB,相当于15 000个世界上最大的图书馆(美国国会图书馆) 的存储量。据国际数据公司IDC研究报告《Extractin Value from Chaos》[10],2010年,人类生产的数据量是1.4ZB(引注:1 ZB=1024 PB),2011年增长到1.8 ZB, 到2012年达到2.9 ZB。如果数据按照目前的60%速度增长,这就意味着全球数据量大约每两年翻一番;预计到2020年,全球将拥有35 ZB的数据,数据增长近30倍。尽管数量级别上有所差异,但从图书馆研究方向来看,在国内图书馆的研究、管理和分析活动中,大数据已然成为继Web2.0、数字图书馆和云计算之后的热门词汇和研究应用方向。

图书馆的大数据主要源于图书馆业务活动,图书馆业务活动可以简单归纳为资源建设和资源利用。具体而言,圖书馆的业务涉及采访、网络建设、纸本资源服务、数字化资源服务、参考咨询服务等。

目前,图书馆在数据应用研究中,主要通过对借阅数据使用统计数据分析方法[11]或社会网络分析方法[12]来获知用户借书行为,了解借阅需求,分析读者平均借阅情况,亦或从中挖掘新的知识结构探讨个性化借阅推荐系统;通过Web日志方式[13]获知数据库的用户浏览情况和统计数字,分析获知网络用户关注重点,实现数据库的定量评价;通过数据库商同意使用SUSHI协议,定期自动收割符合COUNTER标准的用户使用数据,高效地采集和分析数据库商提供的使用数据。上述用户使用数据的研究和分析已经较为成熟,且初见成效,已经成为图书馆的一项重要工作。

书目数据是图书馆通过编目工作将一次文献进行整理后形成以目录、索引、文摘为代表的二次文献,是图书馆利用专业知识提供给用户的一个重要知识产品,对于用户查找和定位所需资源,起到重要的指引作用。由于书目数据采用统一标准的著录格式,对馆藏文献进行整理、编目可以形成较为稳定的结构化数据,便于通过常用的SQL工具进行分析[14]。对于书目数据的数字化分析,可以反映出图书馆馆藏的级别、馆藏分布、服务对象和服务倾向。

除了上述稳定的结构化数据,图书馆还有非结构化数据,如采访、编目、数字化资源建设等业务产生的工作状态数据、业务交流产生的数据、图书馆与读者及资源供应方的互动信息和用户的信息行为、用户利用手持设备来获取图书馆服务的行为等,从目前来看,非结构化数据比结构化数据增长的更快。图书馆各类非结构化数据的急速增量和对数据管理和掌控能力之间的矛盾日益明显,图书馆已经不再是馆藏资源数量的单纯比较和空间环境的改造,而是各类信息管理、数据完善和数据综合处理能力是否能有效通过大数据技术解决和提高图书馆服务能力的问题。为了应对这一难题,图书馆学情报学希望借由云系统的存储,来解决管理和技术上出现的问题。如果能够将图书馆采购图书资料数据到数据利用,再到用户产生的数据反馈收集起来,利用云端系统进行增容,同时对各项数据进行分析和挖掘,则会为图书馆业务发展和服务质量带来质的改变。

2 OCLC的WorldCat大数据

2.1 WorldCat具有数据量大且种类繁多的特点

WorldCat包含三个主要的组成元素:书目数据库

(Bibliographic catalog)、知识库(Knowledge base)、注册信息(Registry for library information)。

从书目数据库来看,WorldCat(OCLC联机联合

目录)是一个独一无二的数据库,是唯一一个全球图书馆联合目录,是全世界最大的网络数字图书馆,包含了OCLC的2万多所会员图书馆的馆藏信息。截至2018年5月,WorldCat数据库有4.2亿多条独一无二的书目记录、26.5多亿条馆藏记录,其主题广泛,覆盖了自公元前4,800年至今的资料,基本上反映了世界范围内的图书馆所拥有的文献资源,主要类型有图书、期刊与杂志、报纸、地图、乐谱、手稿本和网络资源等。

从知识库角度来看,OCLC与内容合作商合作通过WorldCat知识库将图书馆用户链接到他们所在图书馆提供的电子内容,使得内容更容易查找、共享、管理和使用。OCLC是一个非盈利的合作组织,能广泛地与内容合作伙伴进行记录合作。截至2018年5月,知识库提供来自6758个内容合作伙伴的40 380 013条记录,涉及20 396个内容集(Collections)。随着越来越多的内容提供商加入,WorldCat知识库将成为另一个独特的大数据。

2.2 WorldCat具有速度快的特点

OCLC产品和服务有8万多家使用馆,其中有2万多家馆是会员馆。这些会员馆在OCLC的WorldCat上展示各自的馆藏资源,进行编目活动或者馆际互借服务,让WorldCat成为一个每秒更新的大数据集。在线编目活动大概每秒有一条新的书目记录输入到WorldCat数据库;每3秒就会有一家成员馆填写完一项国际馆际互借申请单(如图1所示)。

图1 WorldCat统计数字

OCLC作为DDC的提供方,不仅拥有大数据,同样也需要大数据。从2018年初开始,DDC23纸质版已经停止发行。目前采用DDC网络版,由WebDewey提供检索服务。相比于4年更新一版的纸本,网络版在完整度和更新速度上更贴近用户的需求。同时,网络版的WebDewey更需要大数据为基础的归纳统计和描述性统计,用以支持DDC分类中需要的描述、作品分类、推论、趋势话题、学科结构等。

2.3 WorldCat具有高質量的数据

高质量的数据源自OCLC对于数据质量的严格控制。高质量的书目和数据是图书馆资源发现和共享的基础,因此,无论是批处理数据、新增原编数据、合并重复数据或者是修正错误数据,OCLC都由专家来过滤检测。全球图书馆上传的数据并入WorldCat前,首先要进行数据清理,而后与WorldCat主数据进行比对合并。经过OCLC处理后,通常数据质量会更高、更标准。OCLC的WorldCat质量控制组的多数专家具有MLS学位(Master of Library and Information Science,图书馆和信息科学硕士学位)。质量控制组就通过人工手动,系统自动或者数据监测系统等方法增强了105 215 955条记录。

2.4 WorldCat具有新的数据处理与管理模式

2010年3月25日,OCLC发布了研究报告《研究图书馆,风险和系统变革》(Research Libraries, Risks and Systemic Change)[15],对研究型图书馆当前面临的风险进行了总结。研究表明,30%的风险与图书馆自身价值的定位有关。图书馆快速地跟上技术的变化和用户的需求,改变传统业务运作方式,将会有助于图书馆自身的定位和快速发展。早在2009年,OCLC宣布在WorldCat基础上,应用云计算技术开发数字图书馆。2010年,OCLC以WorldCat为核心,推出基于云计算技术的网络级管理服务WMS(WorldShare Management Service),推出六大核心模块:元数据管理(Metadata)、采购管理(Acquisitions)、许可证管理(Liceses)、流通管理(Circulation)、馆际互借(InterLibrary Loan)、数据分析(Analytics)。这六大模块重构并统一了图书馆管理的各个工作流程,将其串联起来成为一个完整的图书馆系统解决方案,集成在一个开放的云平台上,帮助图书馆实现各种资源的集中式管理。

可以预见,当许多图书馆使用WorldCat管理服务以及电子资源管理服务后,其所产生的越来愈多的业务流数据,在通过数据聚合、数据挖掘技术处理后就可以作为对图书馆业务发展分析参考的依据,那么WorldCat不仅能从体量上,速度上跟踪图书馆的藏书质量,还会从实际使用角度成为图书馆使用大数据的好帮手。

3 电子资源管理服务

2002年10月,美国数字图书馆联盟(Digital Library Federation, DLF)和国家信息标准化组织(National Information Standards Organization, NISO)联合工作组推出电子资源管理项目(Electronic Resources Management Initiative, ERMI)[16]。2013年,OCLC发布研究白皮书[17]《Meeting the E-resources Challenge》(电子资源管理的挑战),指出到2020年,80%的图书馆预算将用在电子资源上,而同时94%的图书馆依然用表格进行电子资源管理。OCLC的角色就是发展服务以支持电子资源管理,并代表成员发起合作。

随着图书馆的馆藏中电子资源日益增多,用户的访问和使用习惯也在变化。但是,图书馆管理系统并非一开始就以电子资源为管理目标,最初的图书馆管理系统是以纸本图书和借阅做为管理目标,随着技术和数字内容的增加,在原有系统中增添了很多功能,但支持物理馆藏工作流程的图书馆管理系统并没有从电子资源的角度重新设计。对此,图书馆系统提供商开发了一种新的集成化产品,图书馆界称之为“下一代图书馆系统”[18]“图书馆云服务平台”[19],在云端平台上构建的新服务实现了纸本资源管理和电子资源管理的功能。知名的“下一代图书馆系统”包括OCLC研发的WorldShare Management Services,Innovative公司研发的Sierra、Ex Libris公司研发的Alma、ProQuest公司研发的Intota,以及开源计划Kuali OLE。国内图书馆也在利用开源的OLE尝试开发电子资源管理系统。

如果说OCLC的WMS是将纸本文献和数字馆藏统一管理,那么OCLC的E-services则是专门对数字馆藏,或者说电子资源进行统一管理,它具有WMS的大部分功能。在电子资源比重越来越大的今天,电子资源管理应该被视为图书馆的核心功能。电子资源管理必须流线型化,并以工作流为中心,增强互操作性,以消除增添模块的成本支出,及避免与其他工作流之间的混乱。

3.1 电子资源管理的功能模块

OCLC E-services由一系列可互操作的功能模块组成,包括WorldShare License Manager、WorldShare Metadata Services、 WorldShare Acquisitions、WorldCat Discovery Services,并配合Ezproxy远程代理访问软件,WorldCat.org,既可单独使用,也可以联合使用。每个功能模块有其自身的工作过程,模块之间因为一些数据关系相互关联,共享数据,完成数据的同步和管理。电子资源管理的核心是知识库,如上文所述,WorldCat知识库可将图书馆用户链接到他们所在图书馆提供的电子内容,使得更容易查找、共享、管理和使用。

3.2 电子资源管理工作流

OCLC的E-services最大的特点是工作流程与电子

资源生命周期相一致,即从查找电子资源(Select)、采购(Acquire)、诠释(Describe)、发现(Discovery)、获取和访问(Access)到续订(Renew)这一电子资源采购管理流程。

图书馆假如要购买一本电子书,并添加其到自己的馆藏中,那么传统方法是什么呢?第一步,采购人员要到电子书商的网站上查看是否有此书的元数据可以提供,要知道如若采购,用户是否可以快速获取这个电子资源,以及用什么方式给用户提供与内容相关的电子书,花费多少?当前,需求驱动采购已经成为一种流行的服务方式。WorldCat知识库就支持这种DDA模式,不用过多考虑采购哪些相关的资料,只需要选择一个DDA的集合,就可以有包含同样主题的一系列题名列表供用户选择。在E-services中,只要决定采购一项数字资源,所产生的数据将会被其他功能模块共用,更快地让用户获取使用,而无需从电子商网站下载Marc数据,无需手工编目。OCLC与出版商密切合作,将他们的资源级Marc数据导入WorldCat知识库,系统会自动推送给图书馆高质量的电子书商元数据。

在采购电子资源时,图书馆的纸本资源采购设计的管理系统模组与电子资源的订单管理系统可能不统一,但是,图书馆又存在保持财务采购预算更新的需求,因而图书馆员需要随时核对和更新几个系统的资料和数据。如果电子资源是连续出版物,那么续订管理将变得更为复杂。而在E-services服务中,依托WorldShare Acquisitions功能模块,可以支持纸本和电子资源的采购,全球的大型供应商数据在此集中展示,图书馆可以定位供应商,或者选择与某一馆使用相同的供应商,通过合作管理供应商数据。图书馆员从此无需从供应商那里一一询问并在Excel中填入相关的地址信息,联络人信息等。WorldShare License Manager模块为采购流程贡献了许可管理的功能,里面可以存放用于多个供应商的服务条款,图书馆可以集中存储所有与之相关的授权文件。一旦订单发出,或者使用DDA模式时,图书馆的馆藏信息将会标注在知识库中,馆员无需在各个不同系统中跳转填写资料,馆藏信息会自动更新,如元数据发送启动和预算扣除等自动处理,这种流线化的工作方式将节省更多的时间。

在诠释电子资源时,图书馆会发现,电子资源订单的发出并不意味终端用户可以立刻使用这本电子书,图书馆员需要手动编目电子书的标题,或者从电子书商的网站上下载元数据。同时,Linking data和电子书的书目数据存放在不同的系统中,图书馆员需要将Linking data放到Linkresolver,实现全文解析。为了保持题名和馆藏可用,图书馆员需要更新自己的表格,而授权信息(例如条款和签字合同)也是在电脑中单独存放的。如果使用E-services,圖书馆员无需花费大量时间更新馆藏,利用知识库,所有的馆藏信息将会自动更新。由于每个月都有新的数据库元数据加入OCLC知识库,具有多个来源和记录的OCLC中央索引库保持不间断的更新。在云端环境下,每个加入其中的图书馆都享受着来自云端数据更新的红利。图书馆员在电子资源数据的更新维护上可以实现一定程度的“袖手旁观”。

在发现电子资源部分,图书馆员希望电子书元数据能够快速的导入,这样就可以通知员工和用户有新的电子书可以使用,而无需在传统编目系统中编写题名并输入发现系统的环境中。E-services服务包含发现系统(WorldShare Discovery Services),图书馆可以由此一站式发现图书馆的纸本资源(如果有上传馆藏)、其他2万所图书馆的书目数据、以及图书馆本身的电子资源。发现系统可以与图书馆现有的传输解决方案相整合。目前可以发现的资源条数是18亿条。OCLC与其他知名搜索门户网站合作,例如Google等,使用链接数据的方式,将图书馆的馆藏与用户开始检索的地方相关联,指引用户回到图书馆。例如,当用户在维基百科中检索一本图书或期刊,那么将会发现下面有WorldCat的链接,而后通过WorldCat把用户引向图书馆。

在获取和访问部分,当学生或者研究者在校园网外访问图书馆电子书时,对于代理文件的设置尤为重要。如果内容提供商电子资源网址URL有变化但没有及时通知图书馆,那么全文链接失效,就会导致图书馆员要花费很多的时间找出链接失效原因——是网络原因,发现系统问题,链接解析器问题,还是远程代理服务软件问题?这种情况会让图书馆员产生焦虑,学生和使用者的满意度也会受到影响。在E-services中,依托云端的优势,一旦一条全文链接被某人发现失效,则这个链接将会被修复,所有使用者均将获益。与获取相关的授权问题,也会经由WorldShare License Manager将所有访问信息集中存储,可以更容易地管理来自同一接口或界面的全文权限、全文访问和解析。Ezproxy远程代理访问是可选项,允许IP范围外的资源访问。由于此项为hosting功能,因此缺少IT技术能力的图书馆也可以放心使用,无需花费资源在设定软件、数据库和更新上。为了便于Ezproxy设定,也可以选择使用License Manager针对已经选择的馆藏来产生设置文档,帮助更快速有效地进行远程代理设置。

续订(Renew) 位于电子资源管理工作流的末端。如果图书馆员想通过使用统计来了解电子书刊是否仍然被用户所需要,则要到电子书商的网站上手工检索使用统计,然后输入到Excel表格中。有时也不能仅仅考虑Linkresolver的统计数字,因为使用资源的学生或者研究者能够直接从电子商网站上获取资料,这部分的统计也要考虑在内。有的电子资源用户使用非常频繁,图书馆就会保持这部分订购。如果使用量少,就替换成其他电子资源,那么电子资源管理流程将返回到查找资源阶段(Select)。通常情况下,统计数据是续订决策的重要参考条件,电子资源的使用程度等量化指标至关重要。此外,E-services中License Manager的预算统计则有助于图书馆优化预算结构。E-services从知识库中自动收割这些出版商的统计数字,无需手工进行统计操作,就对使用量、预算等进行数据汇总、统计成图、编译报告,随需随用。一旦图书馆决定取消续订,所有的图书馆馆藏信息都会从知识库中移除。

3.3 代表性用户及其使用体验

OCLC的E-services来自于WMS中针对电子资源管理的一个部分,其不仅仅是创新产品和服务,更是一种工艺创新、管理创新,是将图书馆电子资源的碎片化工作集成在一起,成为一种流程化的管理模式,从图书馆资源管理战略和图书馆用户需求的角度出发,以提高图书馆电子资源使用率和用户满意度为目标的变革。换言之,OCLC电子资源管理是一种基于图书馆电子资源业务流程进行的管理、控制模式,在合作共享数据基础上,代表着一种对新的图书馆电子资源组织工作模式的追求。

2016年3月15日, 德国明斯特应用技术大学(Münster University of Applied Sciences) 与OCLC签订协议[20],使用OCLC的WorldShare Management Services (WMS)服务,这也是德国首个使用OCLC WMS服务的学术机构。明斯特应用技术大学的图书馆馆长Dr. Klotz-Berendes如是说,现有的图书馆管理系统面对电子资源管理时,通常花费巨大且费时费力。E-services围绕电子资源管理,提供了一个未来工业流程式的设计,重点在于其高效的运行流程可以整合外部供应商现有和未来的服务,例如集团采购,这种在获取和许可领域使用协作共享信息的方式,是OCLC产品受欢迎的主因。

美国西部知名的文理学院卡莱门学院(The Claremont Colleges)[21]图书馆信息资源采购主管Margaret Hogarth对于使用E-services也發出赞叹,他如是说,有时候,学院购买了一些资源,但是只有题名列表,没有ISSN号,没有ISBN号,没有OCLC序列号。如果只是几个,那么可以手工添加,如果上千种,那么在OCLC辅助工具协助的情况下就能很好地查找到相关资源,当MARC数据到达时,他还可以将其分享给联盟成员,减少了其他人的查找时间。Margaret认为选择WMS最大的动因在于WMS让一个平台上管理信息进行共享成为可能。很多图书馆都在添加资源进来,知识库在不断的增长,这有助于WMS参与到社区之中并保持持续的更新。

4 结语

卡内基梅隆大学海因兹学院院长Ramayya Krishnan[22]提到,大数据具有催生社会变革的能量。但释放这种能量,需要严谨的数据治理、富有洞见的数据分析和激发管理创新的环境。图书馆仍处在早期聚集各种新信息和数据的阶段。事实上,如果能够成功地驾驭这些难点,图书馆的大数据可能会在教育、权威和文化方面做出重要的影响。

OCLC研究部Constance Malpas在2017年年会上的报告《Libraries and the Big Data Revolution》(图书馆与大数据革命)[23]阐释了图书馆大数据驱动着创新与突破的意义。大学研究者通过WorldCat大数据发现经济发展和学科知识形成的模式;OCLC研究部应用大数据方法来提升WorldCat数据质量,分析聚合数据集,并利用语义网应用进行创新;OCLC产品部门关注合作,利用全球数据网络将图书馆与未来相连接。

OCLC电子资源管理服务的实质不是仅仅将图书馆数据移到一个新的管理平台,而是完善了数据质量,增加了服务内容,亦与其他数据相关连,从而扩大馆藏资源的可测量程度和比对程度。从体量上、更新速度上、质量上以及创新应用上来看,WorldCat是图书馆书目领域的大数据,而如何抽取、使用、分析从而辅助决策,从业务流程化和合作共建共享的角度利用大数据,需要全球图书馆共同的努力和实践。

参考文献:

国务院关于印发促进大数据发展行动纲要的通知[EB/OL]. [2018-07-09].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.

国务院办公厅印发国家信息化发展战略纲要[EB/OL].

[2018-07-09].http://www.gov.cn/zhengce/2016-07/27/

content_5095336.htm .

易观.2017中国社交电商大数据白皮书[EB/OL].[2018-

07-03].http://www.199it.com/archives/609316.html.

网络大数据.解读:大数据在电信行业的五大应用

[EB/OL].[2018-07-03].http://www.raincent.com/content-10-3105-1.html.

USEIT知识库.爱分析:2018中国金融大数据行业报告[EB/OL].[2018-07-03].http://www.useit.com.cn/thread-

18800-1-1.html.

大数据[EB/OL].[2018-07-03].https://baike.baidu.com/

item/%E5%A4%A7%E6%95%B0%E6%8D%AE/1356941?fr=aladdin.

维克托·迈尔-舍恩伯格,肯尼恩·库克耶.大数据时代[M].周涛,等,译.杭州:浙江人民出版社, 2013.

中国大数据产业观察. IBM商业价值研究院分析:大数

据在现实世界中的应用[EB/OL].[2018-07-03].http://www.

cbdio.com/BigData/2014-11/20/content_1914760_all.htm.

腾讯数据存储量相当于1.5万个最大图书馆[EB/OL].

[2018-07-04].http://app.myzaker.com/news/article.php?v=1.0&pk;=57454bbb9490cb8a3a000011.

GANTZ J,REINSEL D. Extracting value from chaos

[EB/OL].[2018-07-04].https://wenku.baidu.com/view/5cedb204bd64783e09122b79.html.

聂江城,杨军花,王刚.高校图书馆图书借阅量化统计

分析:以南开大学图书馆为例[J].图书馆工作与研究,

2010(10):61-65.

燕飞,张铭,孙韬,等.基于网络特征的用户图书借阅行为分析:以北京大学图书馆为例[J]. 情报学报, 2011,30(8):875-882.

李国洪,任小伟,王大元. 研究型大学图书馆数据库资

源利用统计分析:以四川大学CNKI为例[J].现代情报,

2009,29(6):136-139.

郝志刚.大数据、云计算与图书馆[J].新世纪图书馆, 2014(6):36-39.

MICHALKO J, MALPAS C, ARCOLIO A. Research

libraries, risk and systemic change[EB/OL].[2018-07-03].https://www.oclc.org/content/dam/research/publications/library/2010/2010-03.pdf.

陈大庆. 电子资源管理系统的发展及未来思考[J].大

学图书馆学报, 2014,32(03):74-79.

BURKEG. Meeting the E-resources challenge[R].OCLC report,2013.

朱本军,聂华.下一代图书馆系统与服务研究[M].北京:

北京大学出版社, 2012.

王文清,陈凌. CALIS数字图书馆云服务平台模型[J]. 大学图书馆学报, 2009, 27(4):13-18.

OCLC News. Munster University of Applied Sciences

is first in Germany to select OCLC WorldShare Management Services[EB/OL].[2018-07-03].https://

www.oclc.org/en/news/releases/2016/201601oberhaching.html.

OCLC News. The Claremont Colleges: expand your catalog and share with the library community at the same time[EB/OL].[2018-07-10].https://www.oclc.org/en/member-stories/claremont-cataloging.html.

大數据[EB/OL]. [2018-07-10].http://wiki.mbalib.com/

wiki/0.

MALPAS C. Libraries and the big data revolution[EB/OL].[2018-07-08].https://www.oclc.org/content/dam/oclc/events/2017/EMEARC2017/EMEARC-2017-Plenary-Session-2-Libraries-and-the-Big-Data-Revolution-Constance-Malpas.pdf. OCLC Report.

猜你喜欢

大数据
基于在线教育的大数据研究
“互联网+”农产品物流业的大数据策略研究
大数据时代新闻的新变化探究
浅谈大数据在出版业的应用
“互联网+”对传统图书出版的影响和推动作用
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索