知识咨询:大数据时代图书馆的知识服务增长点
2013-11-15王天泥
王天泥
(辽宁省图书馆 辽宁沈阳 110015)
信息社会的快速发展与大量智能终端的广泛应用,使得数据的产生、来源、类型变得简单而丰富,越来越多的非结构化数据、半结构化数据呈爆发式增长趋势,且其组成结构、类型格式、存在形态等都愈加复杂,整个社会发展进入到了一个大数据时代。大数据时代,数据将成为社会资源的一部分被加以重视,基于数据的处理、分析、挖掘等服务都将被信息服务机构所应用和开展,这对承载着知识存储、组织、开发与传播重任的图书馆及以文献信息分析为基础的图书馆咨询服务工作造成了强烈冲击。基于以上考虑,笔者从图书馆咨询服务发展的角度,论述了大数据为图书馆知识咨询带来的机遇,重点对大数据时代图书馆知识咨询的两大发展驱动因素即数据资源与人才建设进行了分析,以引起业界学者对相关问题的共同关注与探讨。
1 知识咨询是大数据时代图书馆咨询服务的新模式
1.1 知识咨询服务:有别于传统咨询服务的创新型服务
知识咨询与参考咨询及信息咨询相比,在诸多方面均存在着差异:首先,从定义来看,知识咨询是针对用户在工作、学习、生活中的知识选择、吸收、利用需求,以图书馆员的图书馆学、情报学、信息学等专业知识为基础,利用先进的技术对相关信息进行提取、组织、优化,融入用户知识获取的全过程,为用户决策与创新提供丰富的知识、有效的答案;参考咨询是图书馆员根据用户需求而进行的文献搜集、检索、揭示、传递并提供知识产品的过程;信息咨询则是向用户提供有关数据、资料的服务过程。其次,从服务的专业化、知识化水平来看,参考咨询和信息咨询都只限于所能提供的数据或信息,而知识咨询更在意是否能提供解决用户问题的知识。再次,从服务类型来看,知识咨询服务的提供方式可以是参考咨询、信息咨询的服务提供方式,如将结构化(或标准化)文献信息、数据、线索提供给用户,或将进行了一定数据分析加工的知识产品提供给用户。但知识咨询服务更注重用户的专业化、知识化、个性化需求,提供解决用户实际问题的知识,以及与用户协同合作创造的知识服务和面向用户的知识管理等。
1.2 知识咨询服务:大数据时代图书馆知识服务的主要方式与手段
大数据时代,信息资源的竞争力已不再是其所占的数量、范围等因素,而是在于基于信息资源服务的信息化、知识化和信息数据的分析与组织程度,以及基于知识的创新力竞争,产品和服务的最大价值判断标准是其隐藏的信息与知识含量多少,提高产品的信息化、知识化,以寻求隐藏在事物表象背后的本质成为了市场竞争的主要手段。图书馆界已敏锐地看到了社会的发展及服务的转变需求,由原来的资源依赖型、劳动密集型服务向知识服务、信息服务转变。21世纪初,国内外图书馆界在知识服务方面就进行了积极探索,到目前已形成了较为完整的图书馆知识服务体系,产生了大量个性化、专业化、团队化的创新服务途径与模式,其中,基于内容分析,与知识服务完美融合的知识咨询服务,必将成为图书馆在大数据时代的咨询服务模式。
2 大数据为图书馆知识咨询带来了发展机遇
大数据时代的到来,意味着我们进入到了一个以密集型数据的相关挖掘、分析、处理来推动社会创新发展的时代,基于大数据分析等数据处理业务的盛行与成熟,也将为图书馆知识咨询服务带来新的发展机遇。
2.1 大数据为知识咨询服务带来了更加丰富的数据资源
大数据时代的到来,意味着大量的非结构化数据、半结构化数据应用将进入人们的视野,据IDC的《数字宇宙》研究报告称,2011年全球被创建和复制的数据总量为1.8ZB,预测到2020年,全球将拥有35ZB的数据量。另一则统计数据显示,世界结构化数据增长率大约是32%,而非结构化数据增长率则是63%,至2012年,非结构化数据占互联网整个数据量的比例已达到75%以上。这些数据无不说明大量的社交数据、信息行为数据等结构化数据、非结构化数据、半结构化数据将被记录、存储、分析与利用,不管是数据的类型、还是数据的数量都将得到极大的丰富。
2.2 大数据为知识咨询服务带来了更为专业的数据分析技术
信息时代大量信息数据的产生,使得方差分析、判别分析等数据分析理论得到了极大的应用与发展,同时被图书情报服务机构将其与信息技术如仿真模型、神经网络分析、Web挖掘等有机结合运用到了机构网站链接、学科优势分析、影响力评估、可视化图谱、科技发展态势监测、国家竞争力分析等领域,但具体分析这些技术和理论,会发现它们都是基于大量、有序的结构化数据,并不能从真实发生、而又未被记录的数据中发现、挖掘更深、更多的隐含信息,进而得到更能揭示事物发展本质以及发展规律的知识。大数据时代的到来则为这一难题提供了解决方案,通过高速捕捉、发现和分析,从大容量、多类型的数据中获取价值的大数据技术架构将为数据分析业务带来更多的变化与支撑,如目前广泛关注和应用的分布式系统基础架构Hadoop、非关系型数据库技术NoSQL等大数据技术。
2.3 大数据为知识咨询服务带来了新的解决问题思维方式
不管是传统的信息咨询、参考咨询还是知识咨询,一般的服务思维都是出现问题—逻辑分析—找出因果关系—提出解决方案,使用户的问题得以成功解决,可称之为逆向思维模式。但根据大数据战略,基于大数据的知识咨询流程是:收集数据—量化分析—找出相互关系—提出优化方案,使用户的问题解决方案从成功跃至卓越,可称之为正向思维模式。这种解决问题思维方式的变化将为图书馆的知识咨询服务带来发展机遇,也可引入其他服务。IBM与美国孟菲斯警察局合作的“利用数据历史减少犯罪”项目就是一个很好的例证。该项目通过大量的数据进行软件分析,发现强奸案和户外付费电话之间存在着较强的关联关系,因此,警方决定将付费电话转移至室内,这使得强奸案的发案率降低了30%。
2.4 大数据为知识咨询服务提供了广阔的合作视野
知识咨询服务与传统的信息咨询、参考咨询最大的区别就是知识咨询以用户需求为本,寻求解决用户疑问的知识服务。这种服务一方面需以专业的知识组织、知识发现等素养去完成,另一方面也需大量的相关信息、数据去支撑,而这些信息、数据的组成很可能是某一专业领域的,也可能是跨专业领域、多专业领域的;既可能是一个信息机构所拥有的,也可能是多个信息机构共同拥有的。这种特征在当前信息时代非常突出,而在大数据时代将更加显现,这就为图书馆带来了一个巨大的发展机会。因为从微观上看,图书馆的数据资源随着这种特征的突显而更具优势;从宏观上看,数据的更加开放、多学科的数据分析联系更为紧密,将为图书馆与专业性服务机构的多领域、高层次合作注入全新动力。
3 数据资源与人才建设:图书馆知识咨询发展的两大驱动因素
IBM日前发布的基于全球95个国家、26个行业的1144名业务人员和IT专业人士广泛调研形成的 《分析:大数据在现实世界中的应用》白皮书认为实践大数据的五大驱动因素中,数据资源将会是大数据时代发展各个相关业务的主要驱动因素之一。同时,“2012年IDC亚太区大数据高峰论坛”及其与会者的最新调研成果《中国大数据技术与服务市场2012-2016年预测与分析》认为“大数据相关人才的欠缺将成为影响大数据市场发展的一个重要因素”。笔者在此也认为,尽管大数据时代图书馆知识服务的发展驱动因素有很多,但数据资源和人才建设将是最主要和最重要的两大驱动因素。
3.1 数据资源建设
大数据时代的到来,使得数据成为了企业、机构乃至政府所重视的资源。2012年1月,瑞士达沃斯论坛发布的《大数据,大影响》报告形象地将数据称为社会的“金矿”和“黄金”,此外,一些IT业发达的国家如美国、印度等近来出现了一批以数据的获取、聚合、加工为盈利手段的企业,由此可看出大数据的资源价值。图书馆知识咨询服务中的数据分析、数据处理和数据挖掘等大数据技术的实现也需要大量的大数据资源支持,而这些数据可能是已存在于图书馆数据库中的书目信息、电子图书等结构化数据,也可能是用户在图书馆的借阅行为、阅读习惯等非结构化数据,更可能是在其他社会场所如商业中心、社会服务中心、娱乐中心和工作空间等的信息行为数据。有权威机构2011年发布的统计数据显示,全球数据总量每两年就会增长一倍,预计到2020年人类拥有的数据总量将会达到惊人的35万亿GB。新增数据中,90%以上属于传统技术难以处理的非结构化数据,如音视频、图片、网页等。因此,图书馆应认清数据在知识服务特别是知识咨询中的重要性,提高数据收集意识,并通过对现存数据进行分析、加工、重组,把大量随机的、分散的、无序的信息转换为规律的、集中的、有序的数据,以为将来的知识咨询等服务提供坚实的数据保障。
鉴于目前图书馆的数据资源类型较为单一,特别是隐藏着巨大价值的非结构化数据收集几乎属于空白,笔者认为,图书馆在数据资源的建设中,需特别重视非结构化数据的收集与丰富,以满足用户个性化、多样化的知识需求。如美国国会图书馆的“美利坚记忆”,收集整理了照片、手稿、海报、乐谱、地图等记载美国历史文化特色的馆藏资源。又如馆内布局与藏书流通率的关系等,表面上看起来毫不相关的两件事,通过大数据分析,却能量化并预测用户的借阅行为。因此,只有将非结构化数据与结构化数据加以综合收集、分析,知识咨询服务才更能得到用户的认同,并创造出真正的价值。令人欣喜的是,国家图书馆正在进行一期维修改造,建成之后的数字图书馆的非结构化数据存储量将达到800TB左右,这说明我国图书馆界已认识到大数据带给图书馆的价值与机遇,并已开始了数据的收集与丰富工作。
3.2 人才培养
大数据时代的到来使得大数据技术与服务市场得到空前发展,也使得社会对掌握数学、统计学、数据分析、商业分析和自然语言处理等多学科知识背景的数据工作者需求越来越旺盛。IDC认为中国大数据技术与服务市场将会从2011年的7760万美元快速增长到2016年的6.16亿美元,同时麦肯锡 (McKinsey)也认为到2018年,美国需要14~19万名具有“深度分析”经验的工作者,以及150万名更加精通数据的经理人。而多种数据显示这类工作人员非常稀缺,如著名的国际研究暨顾问机构Gartner就认为只有1/3的新的工作岗位能雇佣到熟悉大数据技能的IT专业人员。图书馆若想从信息时代的参考咨询、信息咨询走向大数据时代的知识咨询,并将其嵌入到用户的管理决策、教学科研、科技创新等社会行为的全过程之中,提供以智力、知识、工具的应用为特征的深度知识服务,则需要咨询馆员的知识结构、技能素养等与这类IT巨头眼中的数据工作者、数据科学家相差无几。因为在大数据时代,图书馆知识咨询馆员既要掌握学科服务、嵌入式服务等咨询服务工作必备的信息检索、信息分析、信息组织及相关平台与工具使用等基本素养,还要掌握大数据环境下的数据挖掘、数据组织等大数据知识与技能。
英特尔中国研究院首席工程师吴甘沙也认为大数据最为关键的部分就是数据分析和挖掘数据价值,这就需要对数学、统计学、机器学习等多方面知识的综合掌控。因此可以看出,大数据时代图书馆知识咨询馆员除需具备传统咨询馆员的基本素养外,还需具备的首要素养就是能对数据做出预测性的、有价值的分析。这是因为从计算机学界的理解来看,大数据的核心技术是机器学习和知识图谱,介于基础设施和应用之间。例如大数据应用的代表谷歌公司的开发方向即为机器学习以及由搜索团队负责的知识图谱。也正是由于大数据具有这样的业务特点,所以企业最需要两种人才:一类是综合型人才,另一类是技术专家。但对图书馆来说更需要第一类人才,因为图书馆知识咨询馆员既要了解所服务的用户学科背景,还要了解图书馆的相关服务知识,更要了解大数据技术的各个层面,以综合的视角制定切实可行的方案。
在人才培养途径上,目前一些互联网公司已经意识到了大数据人才紧缺的问题,建立了专门的数据科学家团队,但对图书馆来说,与专业的数据处理公司、高校合作,通过人才委托培养等方式,使用成熟的产品和技术是更为现实的选择。另外,一些高校与企业联合开展的大数据教育模式,也为图书馆的大数据人才培养途径提供了捷径与借鉴。如北京航空航天大学计算机学院、软件学院与百度、淘宝、腾讯等企业合作,联合创办了国内首个大数据专业工程硕士培养项目。美国的密歇根州立大学、伊利诺伊州立大学、北卡罗来纳州立大学和亚利桑那州立大学等也开设了大数据的相关课程和研究方向。如亚利桑那州立大学已经围绕元数据、数字格式和数据迁移等主题开设了数字馆藏课;伊利诺伊州立大学香槟分校则开设了一个数据监护方向的硕士学历教育项目。
4 结语
大数据时代的到来及大量相关技术的广泛应用,将使得海量、复杂、多结构数据的即时获取、精确分析、深度挖掘成为现实,为图书馆等信息服务机构的服务手段、服务理念、服务思维、服务基础、服务载体、服务管理等带来支持与改变,也将为正在国内外图书馆界兴起的知识服务带来诸多服务增长点,其中基于大数据分析支持的知识咨询就是主要的增长点之一。但如同Web2.0、云计算等技术一样,任何技术都是一把双刃剑,大数据在为图书馆带来全新的技术、方法、平台、理念来帮助和促使人们通过数据整合、数据分析、数据挖掘来揭示出数据的内在价值,并且实现数据的价值增值的同时,也给图书馆带来了诸多的其他问题。如大数据的应用在推动服务向以数据为中心的密集型、创新型服务转化的过程中,用户个人隐私却无处遁形了。2013年央视3.15晚会曝光的网络广告商通过Cookies偷窥用户隐私的行为,其实也就是一种大数据的隐私泄露事件。包括图书馆在内的社会服务机构,若想在大数据时代有所发展,解决诸如此类的相关问题也就显得非常必要和紧迫。
[1]夏侯炳.参考咨询新论[M].南昌:江西人民出版社,2004.
[2]刘泳洁,盛小平.面向用户需求的图书馆知识咨询研究[J].图书情报工作,2011(9):61-65.
[3]大数据成为信息科技关注新热点[EB/OL].[2013-02-24].http://www.scs.moa.gov.cn/dongtai/201212/t2012120 4_3095088.htm.
[4]霍娜.非结构化数据来袭[N].中国计算机报,2011-07-11(A24).
[5]大数据带给企业竞争战略的支撑[EB/OL].[2013-02-24].http://www.keweisoft.com/qygl/25255.html/.
[6]Welcome to Apache?Hadoop?[EB/OL].[2013-02-24].http://hadoop.apache.org/.
[7]NoSQL[EB/OL].[2013-02-24].http://nosql-database.org/.
[8]IBM CEO罗睿兰:技术改变未来企业的3种方式[EB/OL].[2013-03-09].http://tech.sina.com.cn/it/2013-03-09/10198128899.shtml.
[9]分析:大数据在现实世界中的应用-创新型企业如何从不确定的数据中获取价值 [R/OL].[2013-02-19].http://www -935.ibm.com/services/cn/bcs/iibv/function/bao/use_of_big_data.html.
[10]潘永花等.中国大数据技术与服务市场2012-2016年预测与分析 [R/OL].[2013-02-19].http://www.idc.com.cn/prodserv/detail.jsp?id=NTAx.
[11]杨颖.大数据时代 何处掘金[N].经济日报,2013-01-08(06).
[12]许玉坤.数字图书馆的信息组织与信息服务技术研究[D].河北秦皇岛:燕山大学,20006.
[13]打造大数据时代的数字图书馆[EB/OL].[2013-03-09].http://www.cio360.net/show-93-82061-1.html.
[14]大数据热 高端人才缺[EB/OL].[2013-02-06].http://yjs.cena.com.cn/a/2013-02-05/136003061381607.shtml.
[15]全国首个“大数据技术与应用”软件工程硕士项目启动 [EB/OL].[2013-02-06].http://scse.buaa.edu.cn/Webxx/Cms_qt/article.jsp?id=22008,44947.
[16]Dig In[EB/OL].[2013-02-06]..http://oligin.ariaona.edu.
[17]Lenter for Infornatics Reseorcher in Science and Scholarslup(CIRSS).DCEP [EB/OL].[2013-02-06].http://cirss./is.il/inois.edlul CollMeta/dcep.html.
[18]央视315晚会曝光Cookies成用户隐私公敌[EB/OL].[2013-02-06].http://www.guigu.org/news/shujubaogao/2013031618522.html.