知识供给侧改革下图书馆大数据建设研究
2017-11-16胡蕴灿
胡蕴灿
[摘 要] 图书馆作为连接知识产品生产和知识产品消费的中介环节之一是供给侧改革中知识供给改革涉及的重要行业。大数据时代的来临,图书馆服务范畴也延伸到对数据的发现、利用、分析、整合,并为读者提供数据服务。在信息时代,技术只是图书馆提供服务的一种手段和平台,未来图书馆服务核心是数据以及对数据的处理。
[关键词] 大数据;图书馆;知识供给;供给侧改革
[中图分类号] G202 [文献标识码] A [文章编号] 1671-0037(2017)7-80-3
Research on Library Big Data Construction in the Context of Knowledge Supply Side Reform
Hu Yuncan
(Henan Academy of Social Sciences, Zhengzhou Henan 450003)
Abstract: As one of the intermediary links between knowledge product production and knowledge product consumption, library is an important industry involved in the knowledge supply reform of supply side reform. With the advent of the era of big data, the scope of library services extends to the discovery, utilization, analysis and integration of data and the provision of data services to readers. In the information age, technology is only a means and platform for library services, and the core of future library services is data and data processing.
Key words: big data; library; knowledge supply; supply side reform
1 研究背景
供给经济学是20世纪70年代诞生于美国的一个经济学流派,以强调供给在经济中的作用而得名。在我国,经过30多年的改革开放,取得了突出的经济成果的同时,供需双方因为结构性不平衡、不协调的矛盾也日益突出。党中央为此提出了“在适度扩大总需求的同时,着力加强供给侧结构性改革,着力提高供给体系质量和效率”(习近平)我国未来长时期经济建设的指导。
而作为图书馆工作人员,笔者将关注点集中在了与本行业息息相关的知识供给侧改革。所谓知识供给是指通过一定的方式,将知识信息从生产环节传递到消费环节的活动,是通过各种传媒和专门机构等多种途径来实现的。其中图书馆是连接知识产品生产和知识产品消费的中介环节之一[1]。作为经济供给侧的重要组成,知识供给面对的最大挑战就是大数据作为信息时代的知识载体已经登上了舞台并扮演着越来越重要的角色。图书馆行业一直对以大数据为代表的新一波信息化技术保持着高度的关注,并提出了类似智慧图书馆等规划设想。在此基础上,本文认为图书馆行业可以从资源建设角度尝试对大数据的实践,着手建立以数据为主要信息知识存储介质的区域知识中心。
2 大数据对知识供给的影响
互联网形成的信息化传播渠道、云计算提供的数据收集和运算能力、大数据为主要形式的新型信息载体。互联网、云计算已经发展多年,得到广泛应用,对人们的生活产生了深刻的影响。而大数据还处在发展的初期,在数据采集、用户隐私方面存在着法律和社会认知的种种障碍,但即便如此,大数据近年来的发展也体现了这项技术强大的生命力。
2.1 大数据的特点及发展
大数据对比之前数据类型最大的特点是多维度、活性化和系统化。多维度体现了更贴近真实世界的数据描述。活性化体现了大数据是一个动态的数据化生态。系统化则是和内容产生的环境紧密联系。每一个大数据系统都像是互联网初期的局域网,自成体系生态独立。大数据的特点不在于数量级的大小,而在于通过多角度对多个数据进行交叉比对还原事物的本来面貌,因此,在时间上和范围上进行全覆盖,是大数据发展的方向。进入互联网时代,随着各种传感器的发展,人类对各种数据的收集有了质的飞跃,以前没有意义的单一数据在建立了合适的参照系之后,可以提供完整的逻辑链条,使得在互联网这个虚拟空间通过数据流模拟物质世界成为可能。2011年5月,全球著名的麦肯锡咨询公司发布了《大数据:创新、竞争和生产力的下一个前沿领域》的报告,首次明确“大数据”的概念,并指出大数据已经渗透到当今社会的各个领域,成为一项重要的社会资源,大数据时代已经到来[2]。3著名的Howie DiBlasi I. T。的“Did you know?”中指出:“估计现在一年全世界所产生的新信息量大约有4 000万万亿((4X1019)字节,超过了人类过去五千年信息的总和。”可见世界范围的信息化变革使得几乎每个行业都面临着大数据问题,大数据达到了无处不在的程度[3]。图书馆作为人类社会信息沉淀和存储的中心,势必随着人类社会知识和信息存储介质的变迁,而改变自身的主要存储介质,圖书馆经历了从纸质文本到电子,未来必将走入数据化的发展过程。
2.2 大数据与数字化的区别
大数据相对于数字化最大的区别就在于打破了元数据的壁垒。传统图书馆的馆藏资源建设基本以自有图书、期刊、报纸和电子文献组成。进入21世纪,随着数字图书馆概念的推广,各图书馆也努力创建了自己的数字资源。然而,现有的数字资源仍然只是传统文献收集模式和信息单元在载体上的简单变化,甚至时效性还通常滞后于纸质媒体。数字化图书馆模式也只是传统图书馆模式的改扩建工程,是传统的服务模式和服务空间的简单升级或扩展服务。信息使用者仍然孤立的使用和读取本地化资源,信息服务模式仍然高度依赖传统的出版发行体系。可以说现在的数字化文献只是传统文献内容载体的延伸,而大数据完全是另外一种信息类型。以谷歌的 Books Ngram Viewer项目为例,谷歌books起初只是一个通过和各个图书馆合作将16世纪以来的所有图书进行数字化的普通项目。而当这个项目的积累达到了8116746册书,涵盖了人类历史上所有出版图书的6%,并进行了OCR识别、通过一系列算法将图书中拆分成了一个个最小的短语和单词,质变发生了。通过这些单词和短语建设的语料库来查询过去500年词频变化的项目就是Books Ngram Viewer。在建立了时间和词频这两个纬度之后,在传统媒介中不能表达完整意义的单词、短语成了一个个信息点,最终信息的结果来源也不再具体是某一本或者几本书,而是这个1500年到2008年出版图书虚拟空间的整体。这个项目也不再是信息到读者的一个中介,而是一个自己产出知识的生产者。这就是数字化到大数据的完美蜕变。endprint
2.3 大数据对用户知识需求的影响
随着移动互联网的普及,人类的学习、阅读习惯发生了巨大的改变。2010年前后各种数据的统计上,全球电子书的销售量就已全面超过了传统纸质书籍。市场研究公司Statista公布了一组统计数据,数据显示的是2016年各国用户平均每天使用智能手机的时间,很多国家的用户每天停留在智能手机上的时间都超过了1小时,中国用户更是超过了3小时。从电子书到移动终端,互联网的信息流越来越呈现与传统信息不同的特点。电子化信息的篇章越来越短小,图片、动画等音视频元素占比越来越大。同时社交媒体的快速发展形成的交互信息文化,使得很多内容已经无法呈现在传统媒介上。碎片化的移动阅读习惯使得人们越来越倾向于直达结果忽视过程的信息获取方式,这与大数据引领的人工智能算法不谋而合。以前大家津津乐道的网站、终端、app都被统一归为前端,只有信息流承载的内容才是最终的目的。这一切信息流的背后都是大数据的支撑,互联网的交互性使每个人都同时成为信息的受众者和发布者。在大数据的信息空间,知识供给不再泾渭分明的分为供给和需求,用户同时具有需求和供给双重角色。信息流的平台也不仅仅是一个简单的中介,通过对这些交互信息的整理和分析,各类公开的大数据资源正赋予人们以另一种方式了解世界的手段。
3 应对知识供给变化,图书馆大数据发展建议
图书馆的职能在互联网普及之后一直面临着巨大的竞争。书目查询被搜索引擎“边缘化”、图书馆期刊馆藏被电子期刊数据库“取代”,参考咨询服务受到网络百科类和咨询类服务的“挑战”等等[4]。同时科学领域也越来越重视数据在研究中的重要作用,把数据作为最终研究成果的观点越来越得到学术界的认同。2010年4月,美国Ithaka研究所发布《图书馆调查2010》显示大学教职工对图书馆作为信息门的认同逐步下降,对图书馆作为存储或保存机构的认同基本维持不变,对图书馆作为“采购者”的认同逐步增加。这种状况,当然是对图书馆作为机构知识资源采集者的一种肯定,但是,如果图书馆仅仅作为一个“采购者”,这将严重限制图书馆的地位和作用。面对图书馆行业在知识供给上的日益邊缘化,本文认为应该着力做好以下几点:图书馆做好大数据发展应对知识供给变化
3.1 建立大数据思维,培养数据馆员
目前图书馆行业最大的问题是缺乏对数据信息的深层次认知和敏感度,这在很大程度上影响到图书馆相关政策和程序的制定,也阻碍了专业人员的能力发展。正如美国图书馆协会在《2015年国家图书馆报告》中阐述的“大数据时代对图书馆提出更高要求,海量数据的发展亟需图书馆员提升数据素养水平,发展信息化处理技能”。任何事业的发展离不开人才的储备,着力培养从业人员的大数据思维方法和业务水平,重点培养业务骨干的大数据知识素养是快速提升图书馆行业大数据应用水平的有力途径。大数据的成功案例告诉我们,大数据是一种和业务紧密联系的技术应用;同时大数据也是一种需要实时反馈反复修正的动态系统。需要业务流中的每一个人深入参与其中,需要一线的业务人员对数据采集的及时矫正。因此,只有储备足够的相关人才,才有可能建设出实用好用的大数据项目。
3.2 完善办公自动化,加大数据采集力度
大数据领域有这样一句话“就算你忽略你拥有的数据,但你却绝不可能分析你没有的数据。”随着半导体工业的迅猛发展,现如今存储成本直线下降,建设本地存储或者云存储已经变得十分廉价。同时,数据库技术的发展使得采用非结构化或是半结构化的数据结构可以让用户先把原始数据存储起来,等到需要建立分析模型的时候,再投入资金进行结构化的处理。所以,图书馆应该努力建立集中的大数据存储平台,同时应该加大采集力度,将全图书馆的业务流、信息流全部数据化并收集、存储起来,在建立图书馆大数据平台的同时彻底实现信息化自动化全覆盖平台。大数据对于图书馆内部管理可以提供很大的帮助,如果说管理信息化是管理工作的一次飞跃,那么管理数据化将是管理工作的又一次飞跃。
3.3 积极参与政府大数据规划,打造公共大数据中心
大数据最具有想象力的发展方向是将不同的行业的数据整合起来,提供全方位立体的数据绘图,从更加系统全面的角度了解并重塑研究对象。然而,在很多情况下,数据拥有者之间存在着复杂的竞争和合作关系,这使得他们在共享数据上存在巨大的难度[5]。要解决这个难题,就需要出现中立的第三方机构,建立相对公开的数据平台,协调所有参与者之间的关系、制定数据共享及应用的规则,拓展大数据的用武之地,使得大数据发挥出其最大的潜力。在现有的市场环境下,这个机构只有政府能够担任。在可以预见的未来,政府一定会发展成为最大的公共大数据拥有者和提供方。在拥有了庞大的自有数据之后,承担着对公共用户提供大数据服务义务的政府服务部门面临的最大问题就是如何将数据物尽其用。而自有大数据资源不足,又和政府关系密切并且承担着面向公众服务的图书馆是政府大数据和终端用户的最好桥梁。因此,只有提前布局,加强图书馆行业在政府大数据政策上的发言权,才能在未来智慧城市等政府大数据工程中占有一席之地。
3.4 加强数据分析算法,兼顾效率与安全
数据隐私的保护与数据获取方式的合法性是大数据发展首先要解决的问题。然而,目前中国乃至全世界对于用户数据隐私应当如何保护、商业规则应当如何制定、触犯用户的隐私权应当如何惩治、法律规范应当如何制定等等一系列管理问题都大大滞后于大数据的发展速度[6]。因此,图书馆行业在进行大数据建设的时候,应该更深入的研究大数据的采集和分析模型的建立关系,可以效仿Google Books Ngrams的方式,通过建立合理优秀的算法结构,达到结果透明、原始数据匿名的合理效果,在保证数据安全、用户隐私的基础上,最大化地利用已有数据资源。
4 结语
党的十八届五中全会提出“实施国家大数据战略,推进数据资源开放共享”。表明我国已经进入大数据时代,大数据正在成为经济社会发展的新动力。随着大数据时代的来临,图书馆服务范畴也延伸到对数据的发现、利用、分析、整合,并为读者提供数据服务。技术只是图书馆提供服务的一种手段和平台,未来图书馆服务核心是数据以及对数据的处理[7]。图书馆重要的社会定位在于知识的存储和人类社会集中的学习空间,这一职能并不随着纸质文本的衰落而改变。图书馆适应信息化社会发展的方式就是不断调整自己的定位,而适应信息载体的变迁,更主动的融入大数据是现阶段最好的选择。
参考文献:
[1] 王丽新.现代图书馆知识供给管理模式与理念更新[J].江南大学学报(人文社会科学版),2002(6):71-74.
[2] 张锐.大数据时代图书馆服务模式多元化探析[J].图书情报导刊,2016(5):81-83.
[3] 张国杰.大数据视角下图书馆服务发展走向及策略研究[J].图书馆工作与研究,2014(6):8-12.
[4] 张晓林.颠覆数字图书馆的大趋势[J].中国图书馆学报,2011(5):4-12.
[5] 周锦昌.限制大数据[J].21世纪商业评论,2013(15):32-33.
[6] 孙召利,董桂枝,吴艳,谭彪,王洪波,李平.大数据在民航领域应用的初步研究[J].空运商务,2014(2):11-16.
[7] 吴建中.从未来看现在——图书馆发展的下一个十年[J].图书馆建设,2016(1):4-9.endprint