Google族,图书馆的无情冲击?
2010-03-22张晓雁
●张晓雁,徐 波
(1.北京大学 医学图书馆,北京 100083;2.CALIS技术中心,北京 100083)
1 前言
随着互联网的飞速发展和普及,搜索引擎时代已经不知不觉地降临在我们身边。越来越多的人相信通过搜索引擎能从网上获得任何你想要的信息,Google族应运而生。事实上,Google只是当前发展如火如荼的搜索引擎大军的代表之一,诸如百度、雅虎、微软这些搜索引擎势力一样不容小看。
在中国,2006年搜索引擎用户达到1.26亿人,比2005年增长了29%,比2002年时翻了3.3倍。预计到2010年时搜索引擎用户数将突破2.5亿。2007年初,北京大学在全校范围内作了一个调查,数据显示:北大图书馆在最近一年的人流量相对于上世纪90年代中期已经减少了11.3%左右,其主要原因是,许多在北大读书的年轻人已习惯于使用各类搜索引擎查询信息,成为一个彻底的Google族。[1]
中国如此,西方国家的图书馆也大同小异。在美国“Google教派”的人数也占大多数,超过了去图书馆的人。在2004年美国图书馆协会的年会上,一群图书馆员的T恤上印着“图书馆——没有垃圾的Google”的字样,无不显示出图书馆与Google之间势不两立的架势。[1]
确实,在今日,Google类搜索引擎已经成为中国乃至世界最主要的网上信息来源,下至初中生,上至高校教员,都成了“Google教派”的忠实信徒。Google等搜索引擎的迅速发展使图书馆面临边缘化威胁,以Google族为代表的搜索引擎用户势力大增,已构成对图书馆的强力冲击。Google类搜索引擎究竟怎样影响着图书馆业务,对图书馆带来哪些无情冲击?面对挑战,作为一名图书馆人,我们应当以怎样的心态面对,采取哪些措施应对?本文将对这些问题进行逐一探讨,以期对图书馆同仁有所启发。
2 Google类搜索引擎对图书馆的挑战
2.1 改变用户信息消费习惯
Google类搜索引擎逐渐改变了用户的信息消费习惯,影响着图书馆发展。据OCLC《对图书馆与信息资源的认知:给OCLC成员的报告》,[2]在对6个国家3300人的调查中发现,全球范围内的用户使用图书馆的次数减少,越来越多地享受以网络为基础的信息源和内容源。用户查找信息资料越来越多地通过搜索引擎自行操作,在调查者中有84%的用户使用搜索引擎进行信息检索,只有1%的人是从图书馆网页上进行信息搜索。这也使图书馆对用户引导式的服务日渐萎缩,反之用户自助服务方式日益兴起。同时,用户认为,使用搜索引擎所搜集的资料与图书馆所提供的资料在可信度上是一样的,他们对自己在网上找到的信息质量总的来说表示满意,甚至对搜索引擎的评价高于图书馆员。
事实上,在用户主导和个性化服务的网络时代,用户对通过搜索引擎查询和获取信息已经形成一种“路径依赖”。图书馆只是当前满足用户信息需求的多种途径中可供选择的一种,对很多人来说甚至不是主要的途径。方便的搜索手段和新兴的点对点(P2P)、社会化网络技术增强了用户的“自信”,使他们更倾向于DIY的自助服务,而不是像过去那样求助于图书馆员,在今天通过搜索引擎来查找所需资料已成为用户的一种习惯。
2.2 前所未有的检索便捷性
Google类搜索引擎服务质量高,有着良好的用户体验,前所未有的检索便捷性与易用性受到研究人员的青睐;与此同时,繁杂的图书馆检索遭到冷落。目前,Google公司推出的“Google Scholar”搜索服务主要是收集各学科领域内的连续出版物、预订本、论文和专题报告等内容;“Google Print”服务主要是用于提供与出版商的链接。2004年12月Google公司又推出“Google Library”,将一些大型图书馆的馆藏进行数字化后纳入到其检索引擎中,方便读者通过互联网使用。透过这3个项目,我们发现其中的任何一个都继承了Google一贯的页面风格,向来以简洁著称的检索界面和检索方式能够让检索者使用起来更为方便快捷。
与之相反,图书馆中的各类型资源过于分散,不同数据库的形式各异的复杂检索语法,常常让读者望而生畏。同时,使用不同数据库需要下载不同阅读器、不同客户端,也让读者经常感叹使用Google Scholar检索信息比使用图书馆电子资源方便得多。
另外,数字图书馆中经常会出现因并发用户数过多而不能访问电子资源的问题,而与之形成鲜明对比的是Google面对每天数亿次的检索请求,很少有让人难以忍受的延迟。
在传统的图书馆服务中,研究人员是到图书馆这个具体的物理“建筑”中,通过与图书馆员的交流获取各种学术信息,数字图书馆试图通过网络“模拟”这个过程;而Google类搜索引擎不同,它就在研究人员的“指尖”下,随时听候“差遣”,这也是Google类搜索引擎今天能够大行其道,广为流行的原因之一。
2.3“问答社区”PK“数字参考咨询服务”
近年来,不少搜索引擎公司对其传统的搜索服务进行拓展,推出了一种互动知识问答服务——“问答社区”,即由网站提供一个互动平台,用户可随时咨询问题或查询问题的答案。由用户或网站聘任的知识专家对其他用户提出的问题进行回复,或对其问题答案进行补充、评价。目前,比较著名的“问答社区”有Google公司的Google Answers、Yahoo公司的Yahoo!Answers、百度公司的百度知道。
问答社区与图书馆开展的参考咨询服务存在诸多相似之处,可以说是一种新型的参考咨询模式。这一咨询模式问世以来,受到了网民的极力追捧,短短数年间,一跃成为咨询服务领域的一颗明星。问答社区模式发展之迅速、访问量之巨大,让图书馆参考咨询服务望尘莫及。据统计,2005年6月百度公司推出的百度知道,目前已解决问题18829754条;[3]2005年12月问世的Yahoo!Answers的问答库则有近200713条记录。[4]与之形成鲜明对比的是,美国大学图书馆平均每个月接收26-35个咨询问题,公共图书馆平均每周仅有516个。[5]面对这样严峻的数字落差,我们不禁要问:难道在这场提供咨询服务的PK中,图书馆真的会败下阵来吗?
2.4 Google类搜索引擎自身优势
Google类搜索引擎还具备一些图书馆无法拥有的自身优势。以Google为例,首先Google最大的优势就在于其丰富的资源、绝对的信息量。除了海量的网页数据外,Google还扫描索引了牛津、哈佛、斯坦福和密歇根等大学以及多个公共图书馆的数百万册图书,并能实现全文检索功能,众多的数据库厂商也都向Google提供元数据或者Open URL数据接口。除此之外,Google还通过Library Link直接链接了大量的图书馆书目等各类资源。从搜索获取的绝对信息量上,以“Information Commons(信息共享空间)”为例,在Google中输入“Information Commons”关键词,就能立即获得1740万条结果。而用同样的中文关键词在Library And Information Science Abstracts(图书馆与信息科学文摘库)和中国期刊全文数据库中检索,前者获得46条结果,后者获得585条记录。筛选后发现上述记录大多在Google中也可以查到。
其次,Google搜索至今仍全部免费,其内容时效性强,对使用者没有任何限制。而要获取图书馆的电子数据库资源和其他信息内容则要求用户经过一定的审查程序,具备某种资格才能获取,而且部分数据库还需要用户自付国际流量费。
再次,Google是目前全球最大最受欢迎的搜索引擎公司,有着强大的资金、人才技术支持,而且利用网络媒体广泛宣传。无论在媒体的宣传中,还是在广大网民的心目中,Google在技术和企业形象上都几乎是完美的,透着耀眼的光环,这些似乎都是图书馆所无法比拟的。
3 挑战背后的清醒认识——图书馆的魅力所在
面对Google类搜索引擎带给图书馆的种种冲击,图书馆人不应恐慌焦急,良好的心态、清楚的认识对我们应对挑战是十分重要的。我们需要明白,尽管在资金、人才、服务质量等很多方面图书馆都无法与Google类搜索引擎比拼,但图书馆散发出的独特魅力,独有优势似乎也让搜索引擎们望尘莫及。
首先,图书馆与搜索引擎有着本质的不同,即图书馆是一项公共事业,它的公益性、学术性、权威性使它在信息的可靠性、有序性和相关度方面有着明显的优势,从而能够为真正实现学术环境的公平、平等、自由与共享奠定坚实基础。而Google终究是一家以盈利为目的的商业机构,每一项服务的推出都必定要让公司达到某种目的、赢得一定利润。尽管现在其很多服务处于免费阶段,但随着它的资源和服务的日益完善,最终实现信息世界垄断地位时,全面收费将可能推行。同时,商业化的盈利性质让Google前方遭遇红灯,各种版权诉讼、利益纷争、搜索排序不公正的投诉扑面而来,让Google头疼不已。例如,用“Martin Luther King”(马丁·路德·金) 的关键字在Google中查询到的第一个搜索结果,竟然是一个白人至上主义者组织的网站。在很多人只看首页排名搜索结果的今天,这一带有商业化赞助链接标志的搜索结果排名只会歪曲马丁·路德·金。[6]
其次,事实上对于需要查找的不同类型信息问题,搜索引擎与图书馆各有所长。例如,对于一些简单的、流行通俗类型的问题,Google等搜索引擎确实擅长,但由于它不太重视复杂问题的搜索结果,加之缺乏可控制的词表和分类体系,检索结果分散各处,且不精确。所以如果用户要对一些复杂问题作深度研究,Google是无法满足其研究需要的,用户仍须借助图书馆的各类资源来检索得到研究所需资料。同时,对于传统的、有价值的、权威的图书和期刊,重要的不是能否查到,而是如何获取。Google等搜索引擎作为巨大的索引库很多时候只能帮助用户查到,而文献本身要么还没有数字化,要么存储在图书馆利用IP控制的全文数据库中。
再次,图书馆提供的多是有针对性的信息服务,例如目前高校图书馆都是根据自己学校的特点订购相应的数据库、开发建设各类特色资源、为用户提供个性化的信息服务。而Google提供的却是面向全球用户的通用搜索服务,与其提供的千人一面的检索结果相比,图书馆利用自身直接面对特定用户的优势,根据用户的类型、专业提供个性化信息检索的形式似乎更具人性化。同时,图书馆这种点对点的服务和交流是机器无法取代的。这就好比我们习惯了ATM取款机,但很多人还是愿意到银行的柜台上使用金融服务。
最后,Google类搜索引擎自身存在一些问题。最明显的就是搜索引擎的检索质量远非宣传的那样准确、智能,常常随便一个搜索请求就有几万条搜索结果,有用的信息往往夹杂在大量的无关信息之中。仅仅网页资源就尚且如此,如果揉合进更多类型的电子图书馆资源,这种“信息稀释”效应会更加严重。造成这种搜索结果准确率低下的一个重要原因就是目前网页都采用的是全文检索技术进行索引,根本没有像图书馆那种对资源进行完善的元数据索引编目;在执行检索时图书馆的各类资源可以通过主题、作者等多个字段及其组合进行各种检索,而搜索引擎却只能提供全文检索,其检索效果也就可想而知了,至于Page Rank等技术也只能是稍稍提高检索准确率而已。
Google类搜索引擎的另一个问题是目前的搜索引擎技术体系已经很难再容纳急剧增长的网络信息。由于整个网络是一个大规模动态的分布式系统,网页更新和增加非常频繁,而一般的搜索引擎都是设置一个或多个大的数据中心,在此执行全部的网页下载和索引工作,这就造成集中式体系结构的搜索引擎很难跟踪网络每一处的变化,根本无法保证覆盖率和更新率的要求。目前,几乎所有的搜索引擎的数据平均更新周期都达到一个月以上,而没有一个搜索引擎可以索引超过互联网全部网页的一半。就连Google的首席执行官埃里克·施密特(Eric Schmidt)都不得不承认,以Google的技术为全球所有信息建立搜索索引还需要300 年的时间。[7]
4 图书馆的对策
尽管Google类搜索引擎存在不足,图书馆有着他人无法比拟的优势,但是图书馆目前仍处在弱势地位。对于搜索引擎带给图书馆的冲击,我们绝不能够坐视不理,听之任之,采取相应措施提早应对挑战,是图书馆人的当务之急。
4.1 整合资源
前面已经提到,图书馆拥有的资源多是分散、异构的,标准不统一。用户对资源不了解,对系统不熟悉,需要反复认证、频繁登录和退出,影响了资源的使用效率。尽管很多图书馆都开展了相应的数据库用户培训活动,但笔者认为,正如Rick Anderson所言,在网络时代,“如果用户必须经过训练才能使用我们所提供的服务,那说明我们应该修正改进我们的服务。”[8]图书馆需要通过整合将分散的资源和服务实现统一平台检索、一次用户认证、不同系统间的无缝链接,从而形成完整的服务体系,为用户在自助服务中得到满意结果创造条件。
事实上,当前国内各大图书馆都在努力进行数字资源整合与统一检索的实践。以北京大学图书馆为例,该馆在进行数字资源整合,构建完整的读者服务体系方面取得了诸多成果。2007年1月,北京大学图书馆新版主页暨北京大学数字图书馆门户正式运行。该门户以一站式的、集成化的网络服务为特色,整合了一系列图书馆业务软件,如Sirsi图书馆管理系统、电子资源统一检索系统、统一认证系统、资源调度系统、馆际互借系统、虚拟参考咨询系统等。通过这种整合,实现了统一认证单点登录、知识导航、资源统一检索、一站式全文获取等功能,从而帮助读者更快速地查找学术资源、更便捷地利用图书馆。
4.2 开发精品
当前,数字图书馆的发展可谓日新月异。图书馆结合自身需求,利用技术支持,开发了一系列产品,这些产品符合用户需求,是搜索引擎公司无法比拟的。例如CALIS组织建设的“重点学科导航库”。该库是CALIS“十五”重点建设项目之一,由“211工程”立项,高校图书馆共建。“重点学科导航库”目的是建立一个集中服务的全球网络资源导航数据库,收集整理有关重点学科的网络资源,为高校师生提供重要学术网站的导航和免费学术资源的导航,让他们能够以较快的速度了解本领域科技前沿研究动向和国际发展趋势。CALIS“十五”导航库项目由54家高校图书馆联合建设,目前导航资源覆盖77个一级学科,包含记录14万多条。导航库的每条记录都是面向学术研究的、专门标引的高质量网络信息资源,目的是向读者提供可靠的、值得信赖的因特网资源。这一由专业图书馆员建设的项目无论在资源类型的划分、资源内容的选择,还是资源的专业标引上都更符合用户的需求,是高校数字图书馆建设成果中的精品。今后,图书馆人应当开发更多的精品,才能在与搜索引擎的较量中立于不败之地。
4.3 提供权威服务
图书馆的品牌在于提供权威信息,同时通过自身信息分析、评价能力,对原始信息进行过滤,去伪存真,去粗取精,提供权威的服务。Stephen Abram认为,Google只能回答 When、Who、Where之类的问题,而图书馆员可以回答更深入的问题,如How、Why等。事实上,生活中重要的问题往往都是那些以How、Why开头的问题,Google在解答此类问题时做的不足。[9]
同样对于问答社区,尽管问题解答的数量远远高于图书馆,但是解答的质量和针对性都还不能保证。图书馆应当充分利用这一优势,在“权威”二字上下工夫,通过自己的专家咨询、学科馆员等服务,利用图书馆间的合作虚拟参考咨询系统,为用户提供高效、权威的信息服务。
在“Google时代”,图书馆需要适应变化,真正做到以用户为核心,开发精品产品,提供权威服务,吸引更多用户来使用图书馆,让图书馆成为网络时代的“信息提供者、信息咨询者和社区中心”。在这一过程中,图书馆员也需要不断提高自身水平。正如北加州圣马特奥市州立图书馆的经理Sarah Houghton Jan所言:“1959年的图书管理员理念已经过时了。你会发现,这些人已经成为网络搜索方面的专家,他们熟练地使用网络工具,高水平的信息专家已经替代了那种只会在接待服务台给图书盖戳的人。”[5]事实上,现今图书馆需要的正是这些“高水平的信息专家”。
4.4 构建图书馆联盟
Google的最大优势在于其庞大的信息资源量,这是任何一个图书馆都无法与之相提并论的,但是如果各个图书馆能够联合起来,互通有无,构建不同层次、不同规模的图书馆联盟,那么图书馆就完全可以取得资源数量方面的优势。
目前,图书馆联盟的建设已经引起了国内外图书馆界的极大关注。据估计,全球图书馆联盟的数量在500个以上。美国国家数字图书馆联盟(NDLF)、数字化保存合作联盟(DPC),加拿大图书馆联盟“书目中心”(The Bibliocentre),瑞典“瑞典大学和研究图书馆联盟”,以及我国的中国高等教育文献保障系统(CALIS)、国家科技图书文献中心(NSTL) 等均是图书馆联盟的典范。
图书馆联盟的构建一方面可以在资源上与Google类搜索引擎抗衡,更重要的是在图书馆的集团采购、开放借阅权、扩大馆际互借服务、联合目录、虚拟参考咨询服务等方面能够实现合作与共享,使原本分散独立的各种资源成为联盟中所有图书馆可以共享的行业资源,实现知识信息服务的行业整体保障。这对我们应对搜索引擎的挑战无疑是十分重要的。例如,近年来在国内兴起的合作数字参考咨询服务,众多图书馆员联合作答,能够更专业、全面地解决用户需求。由广东省立中山图书馆牵头,联合福建、广西、天津、山东等12个省市的30个公共图书馆建立的“联合参考咨询网”(www.ucdrs.net),积极利用计算机和互联网为全国读者服务。至今共解答各类咨询22万余例,免费远程传递文献100多万篇,为数万不曾谋面的读者提供了及时的信息服务,其中使用最频繁的一位读者咨询超过了900次。[10]图书馆间的这种合作联盟也让只能相互追赶竞争的搜索引擎公司望尘莫及。
4.5 加强与搜索引擎合作
Google类搜索引擎提供简单易用的免费服务,在瞬间返回相关搜索结果,因此在短短几年中,迅速成为全球网民查询信息的首选工具。图书馆应当尊重用户的选择,但同时我们也可以利用Google类搜索引擎扩大图书馆宣传面,与他们进行合作。“如果我们想生存下去,就必须将自己的信息放置在用户正在查找问题答案的地方,这样用户才会遇到它。如今,这意味着如果通过yahoo、Google之类的搜索引擎能够发现你的图书馆信息,那么你的服务肯定将优越于Google的用户体验。”[11]
近年来,一些图书馆已经开始了与Google类搜索引擎的合作,美国纽约公共图书馆率先将其馆藏提供给Google。OCLC也将自己的World Cat的数据陆续加入到Google、Yahoo的工具栏中。在我国,2006年5月北京大学图书馆率先与百度合作,将图书编目数据授权给百度,使网民可通过百度检索北大图书馆的馆藏书目,从而提高北大图书馆馆藏书目的浏览量,提升北大图书馆为读者服务的能力。[12]两个月后,国内最大的专业图书馆——中国科学院国家科学图书馆也与百度签署合作协议,将自己的馆藏书目提供给百度,正如中国科学院国家科学图书馆张晓林馆长所言,“我们将通过与各类信息服务机构的合作,扩展服务空间、创新服务手段、提升对科研人员的服务能力。我们希望能不断和包括百度在内的信息服务商寻求进行更高层次的战略合作。”[13]
5 结语
Google是图书馆的竞争对手,也是图书馆的合作伙伴。这种竞争合作的关系,将在今后很长一段时间内继续存在。在“第三届上海国际图书馆论坛”上,国际图联管理委员会当选主席卢克斯(Claudia Lux)博士认为,在全球化的进程中,图书馆必须承担三大职责:“首先,图书馆能不能管理不同语言的信息。其次,图书馆能不能让读者完全获得自己想要的信息。最后,图书馆能否继续作为开放世界的一个窗口向所有人提供服务……面对百度、Google等搜索引擎,图书馆必须提供给读者更多更全面的信息渠道。”[14]当有朝一日卢克斯博士的论述成为现实,相信再面对Google类搜索引擎,图书馆人将会更加从容与坦然。
[1]西安晚报. 明天还有图书馆吗?[N/OL].[2007-08-01].http://www.einit.com/user1/12/archives/2005/2157.html.
[2] Perceptions of Libraries and Information Resources(2005)[EB/OL].[2007-08-01].http://www.oclc.org/reports/2005perceptions.htm.
[3] 百度知道 [EB/OL].[2007-08-02].http://zhidao.baidu.com.
[4] YAHOO!ANSWERS[EB/OL].[2007-08-02].http://answers.yahoo.com.
[5]毛娟.数字参考咨询服务模式的比较研究[D].武汉:武汉大学,2006.
[6] 最可靠的搜索工具可能是图书馆员[EB/OL].[2007-08-03].http://www.qiantu.org/liblog/?p=42.
[7]Google称为全球所有信息建立索引尚需300年[EB/OL].[2007-08-11].http://tech.sina.com.cn/i/2005-10-09/0702734700.shtml.
[8] Web 2.0將把圖書館帶往那裏?[EB/OL].[2007-08-10].http://libraryviews.blogsome.com/2006/07/08/368/.
[9]親自聆聽 Stephen Abram談Web/Library2.0[EB/OL].[2007-08-01].http://libraryviews.blogsome.com/2006/04/09/303/.
[10]网上咨询,“中图”领跑全国 [EB/OL].[2007-08-04].http://www.ycwb.com/gb/content/2006-05/14/content_1124_357.htm.
[11] Waiting for Your Cat to Bark-Competing with Google anditsIlk,Part3 [EB/OL].[2007-08-10].http://www.imakenews.com/sirsi/e_article000678631.cfm?x=b8ncld1,b57cKgw2.
[12]百度与北大图书馆合作 网民可搜数字图书[EB/OL].[2007-08-01].http://tech.sina.com.cn/i/2006-05-23/1428951592.shtml.
[13]百度与中国科学院国家科学图书馆达成战略合作[EB/OL].[2007-08-13].http://www.tzjiulong.com/search_news/200676164309.htm.
[14]图书馆要比搜索引擎更全面[EB/OL].[2007-08-03].http://news.sohu.com/20060818/n2448728-37.shtml.