APP下载

更全 更新 更细*
——读《数字信息资源的检索与利用》(第二版)

2014-02-12顾烨青吴信岚

图书馆论坛 2014年7期
关键词:数字信息信息检索检索

顾烨青,吴信岚

更全 更新 更细*
——读《数字信息资源的检索与利用》(第二版)

顾烨青,吴信岚

《数字信息资源的检索与利用》(第二版)继承了第一版涵盖信息资源与信息检索工具极为丰富的突出特点,是一部超越信息检索教材、融资源检索和资源建设及评估于一体的指南性工具书。文章对该书的新增亮点以及若干不足进行了评述,并认为不要过于依赖检索而忽视了读书思考。

数字信息资源的检索与利用 信息资源 信息检索 教材 书评

北京大学图书馆肖珑主编的《数字信息资源的检索与利用》(以下简称“《数字资源》”)是一部特点鲜明的信息检索精品教材。2003年出版的《数字资源》(第一版)[1](以下简称“《首版》”)获教育部第四届中国高校人文社会科学研究优秀成果三等奖,是迄今该奖项中唯一获奖的应用性信息检索类教材,代表了我国该领域内教材的最高水平。十年后,继承原有特色,又融入前沿、全面拓新的《数字资源》第二版[2](以下简称“《第二版》”)修订问世。通读完《第二版》,笔者既再次感受到该书独特的魅力,又爱之愈深,责之愈切,结合自身检索的体会,苛刻地列举《第二版》的不足,以期修订三版时以更高的水准展现在我们面前,嘉惠学界。

1 突出特点与价值

《数字资源》最大的特点在于涵盖的信息资源与信息检索工具极其丰富,同类教材中难有匹敌者。《首版》时即已经涉及数据库两百多个、全文电子期刊近两万种、电子报纸五百多种、电子图书十几万种,“国内外最著名的网上中英文学术数字资源基本被其一网打尽。其涵盖范围的广度、讨论问题的深度,和信息量的巨大,堪称国内之最”[3]。《第二版》继承了这一特点,涵盖了超百家数据库商、出版商及学术团体与机构的四百余个数据库,比《首版》近乎翻了一倍。同行们再次肯定了这一特点,“资料丰富,可谓工具书的大全”[4],认为《第二版》比《首版》具有更加丰富翔实的内容[5]。

《数字资源》展现的众多重要数字资源并不止于简单的名称列举,不乏一些深入分析和对同类资源的比较评价,这是很多只重视培养用户信息检索能力而忽视培养信息评价意识的信息检索教材所欠缺的。基于此,《数字资源》同时可作为图书馆资源采访部门的案头参考。这是一部超越了检索教材,集资源检索和资源建设及评估于一体的指南性工具书,可大大拓展一大批本馆资源不如北京大学图书馆等综合性大馆丰富的图书馆采访、咨询、文检课教学同行们的视野,对学科馆员开展学科资源推送服务也大有裨益。《数字资源》的这一鲜明特色,无疑源于主编肖珑副馆长长期主管资源建设并负责CALIS数字资源引进与评估所形成的资源先行观。

2 新增亮点

《第二版》较之《首版》,在删除了一些已经不提供服务的数据库资源和基本不再使用的大型检索工具印刷版的同时,增加了很多新兴的数字资源品种及服务新模式。《第二版》修订前言和已有书评[4-5]已经提及的增加了诸如特种文献资源、多媒体学术资源、RSS、数字资源整合服务、开放存储资源(OA)、文献管理软件等内容,本文不再赘述。这里,笔者推介几处《第二版》其他的新增亮点。

《第二版》新增了很多高价值、较珍罕及无以替代的重要资源。长期以来,我国大陆很多文科学者利用海外文献的意识不足,影响了研究深度和广度。其中的一个重要原因是他们不清楚有哪些可利用的域外资源,相当多图书馆也未采购这类资源。《第二版》专门介绍了一些西方的档案类数据库和中国主题的史料数据库,涉及Gale公司的解密档案参考系统(DDRS)、ProQuest的解密后美国国家安全档案(DNSA)、美国早期印刷品(EAI)、《海外收藏的中国近代史珍稀史料文献库》《英国外交部档案,中国:1949-1980》《中国:文化与社会——华生中国收藏》等,这些都是研究中国近代史、世界近代史的一手材料。由于其中很多数据库可以进行基于全文的字词检索,这将快速实现以往依靠人力难以达到的某些研究目的。此外,《第二版》在介绍CASHL资源时提及的大型西文特藏,也多为一手原始档案资料,如《传教团文档》《英国情报机构西藏文档》,学术价值极高。

相较于文献类全文数据库,事实与数值类数据库直接面向用户的问题,以特定的、精准的事实或数字回答用户的需求,针对性与专业性极强,是无以替代的一种数据库类型。特别是随着社会经济的不断发展,在商业经济与金融领域的实践与研究中,对商情数值与事实的需求猛增,《第二版》在《首版》只有中国资讯行数据库这一种资源的基础上,又介绍了七种英文和五种中文商业经济类事实和数值型数据库,并分别选择若干类似的数据库进行了较详细的功能与特点比较分析。这不仅在培训读者选择利用合适的数据库时提供了指导,更为图书馆资源采访提供了很有价值的评估参考。

《首版》后的十年是电子图书与电子报纸飞速发展的十年,《第二版》与时俱进,对此进行了全面的改写。电子图书方面,不仅从载体类型划分上重新分为封装型、基于PC的网络型、离线(移动阅读终端)型,划分更科学,也更符合当前的发展情况。具体内容方面,《第二版》也对中西文电子图书(集成)服务系统的介绍在《首版》基础上进行了大幅扩写,特别增加了对几种西文电子图书集成服务系统的比较分析。此外,还专设一节介绍中文典籍数据库,不仅扩写了《首版》中的文渊阁四库全书电子版等三种数字资源,又新增介绍龙语瀚堂典籍数据库等五种古文献资料源,极大地方便了中国古代文史领域的学者利用。电子报纸部分,《第二版》新增列举的众多西文报纸网站与全文数据库最让人称道。国内学者可能只知道去一些大报(如《纽约时报》《泰晤士报》)的网站查找相关信息,但往往只能免费浏览最近几天的新闻,并不知晓可以去一些专门的报纸全文数据库或大型全文集成数据库中查找。《第二版》专设一小节“代表性西文报纸”,不仅列举了《华盛顿邮报》等独立性报纸的网络版,还介绍了世界各国报纸全文库、PressDisplay报纸数据库、全球报纸精选数据库、美国历史报纸数据库等专门的报纸全文数据库和EBSCO、ProQuest、LexisNexis等全文数据库中的报纸数据库,给研究者提供了指引。

此外,虽然《第二版》在前言中指出“考虑到这几年用户的检索水平在不断提高、而检索系统也在快速变化,减少了检索细节的指导和介绍”,但在全书中还是对一些重要的检索技巧或不太被用户甚至很多同行所知晓、易忽略的数据库功能予以了细致的介绍。如在介绍A&HCI时提及的“暗引”(P77),就极少见诸其他检索教材,即便是在WOS的help文档中也不易快速找到。《第二版》介绍的SCI扩展版、光盘版和印刷版的区别,EI Compendex核心出版物(核心数据与非核心数据)及其中国期刊等细节也能解答很多读者甚至部分同行的困惑。

3 不足与修订期许

金无足赤,《数字资源》也有一些不足,令人遗憾。《首版》的书评[3]中就曾建议每章增加练习题,《第二版》没有改观,以致又见书评[4]再次提及。笔者不揣浅陋,再谈几点,愿与编者切磋,供再版参考。

其一,尽管《第二版》涵盖的数字资源已经非常多,但仍有一些在《第二版》截稿前已经问世的重要资源没有介绍。例如,期刊与学位论文方面就遗漏了订购单位的读者可免费使用的自助型外文文献一站式检索与传递系统——超星-百链云学术搜索(http://www.blyun.com),涉及我国台湾期刊论文与学位论文的商业数据库(以华艺数位股份有限公司为代表)和部分获得授权可以免费下载的台湾硕博士论文资讯网(现名台湾博硕士论文知识加值系统,http://ndltd. ncl.edu.tw或http://etds.ncl.edu.tw)。中国古籍与近代文献方面,《第二版》遗漏的重要资源有北京爱如生公司开发的“中国方志库”“中国谱牒库”“中国类书库”,以及“近代手绘画报系列数据库”之《点石斋画报》与《图画日报》(2011年10月推出),《申报》数据库(2011年6月发售),青苹果数据中心的《申报》电子版(2010年完成),我国台湾的汉籍电子文献数据库(瀚典全文检索系统)等。年鉴和百科全书属于通篇阅读性差,但检索性极强的工具书,而其数据库形态则通过相关条目知识单元的标引与关联,进一步提升了检索和情报功能。可惜《第二版》未能列举年鉴和中文百科全书的数字化资源,如中国知网中的中国年鉴网络出版总库、中国经济与社会发展统计数据库(原中国统计年鉴数据库),以及中国大百科全书数据库等。对若干可免费利用的文科类西文档案与史料研究性资源,《第二版》也疏于介绍,如互联网档案馆(https://archive.org)和HathiTrust数字图书馆(http://www.hathitrust.org)。《第二版》介绍了汤森路透的Incites这一最新科研评估产品,却没有介绍该公司前一款更成熟、在中国市场也已经投放多年的科研绩效评估产品ESI (Essential Science Indicators)。此外,还有一些重要数据库,《第二版》已经提及名称,但没有展开介绍,如Elsevier旗下的Scopus是全球规模最大的文摘和索引数据库(含引文数据),全书仅在P225和P230两处提及名称。也有一些重要的分析软件在介绍使用方法时过于简单,如第十一章中运用SPSS分析课题“数字图书馆十年发展趋势与热点分析”时的示例,少了对某些操作细节的截图与更详细的流程描述,这往往是初学者最困惑的。《数字资源》再版时还可考虑增加介绍近来运用较多的美国华裔陈超美教授开发的免费引文分析软件Citespace,配合实例演示基于科学知识图谱的学科分析方法。当然,笔者所列遗漏资源很可能其中一些并非编者没有注意到,而是出于资源的稳定性、规模、知名度以及知识产权等方面的考虑,为了确保教材的严谨性而有意被“忽略”了。这种类型的资源是否应该在教材中推介可能存在争议,笔者在本文列举,一则意在至少可供编者及同行密切关注这些资源的发展,条件成熟时或可在新版教材中收录;二则希望读者能对信息源与检索工具拥有足够广阔的视野,熟知各种数据库的基本信息、功用与特色。现实中手头可以不具备检索使用某种信息资源的权限,但必须知道哪个信息资源可以解决自己的需求,以便定位他处可利用的信息源。诸如上述提到的《申报》数据库,可能由于价格问题,很多单位未必购买,但如果及时编入教材,并伴随着课堂教学,至少就将这一线索告诉给了读者乃至同行,有需求者可以通过其他途径去利用该资源(如青苹果的产品还对个人开放研究试用),这样作为工具书的指南与引导作用就突显了出来。此外,这类资源由于计划庞大,往往分系列逐年推出,图书馆资源采访人员和检索课教学人员需紧密跟踪,还需有意识地将相关类似产品进行横向比较。再以《申报》全文数据库为例,在《第二版》截稿后,青苹果推出了2.0广告版,增加了广告检索功能,用户不但能按日期和版面查阅当时的广告,而且还可以根据内容和关键词进行广告检索[6],这是当时爱如生公司推出的《申报》全文数据库所不具备的(目前爱如生的A型《申报数据库》已有广告录文)。《数字资源》三版时,如果加上这两家产品的比较,参考价值就更大了。

其二,《第二版》对收录的部分资源的特色服务,缺乏贴心提醒。如汤森路透旗下的WOS、EndnoteWeb、JCR、ESI、Incites等均开通有漫游使用功能,读者只需在所在机构IP段范围内注册并登录过一次,即可在公网漫游使用三个月。超星的读秀与百链每年也在寒暑假期间推出漫游服务。也有一些数据库出于版权考虑,对读者利用会做出一些限制,读者如果不知晓,或影响自身的使用效果或给自己带来不必要的麻烦,检索类教材也应及时予以提醒。如超星图书现已加密处理,不仅其虚拟打印功能每月有页数限制,已经下载到本地的图书也有有效期,过期后必须重新下载,其注册离线多机阅读功能也颇繁杂,这些《第二版》都未涉及。国外诸如ACS等数据库对过量下载非常敏感,国内机构经常遭被封惩处,《第二版》也缺乏必要的警示提醒。

其三,《第二版》仍有对相关资源的介绍存在滞后、叙述不周,与实际不符之处。如第220页中“PDF文件由于全部是扫描制作的,……但它是一个图像文件,字节数大,占据空间大,……没有超文本链接(如内容与参考文献之间就无法链接)。……由于文字、图像、期刊标志扫描在一起,较难复制文字”,这完全照搬了《首版》中的文字,十年前的情况大致如此,但今非昔比,PDF格式的文件很多已经不是纯扫描,而是可文字复制版本转换而来,占据空间也不一定大,许多外文数据库更单独提供带参考文献链接的PDF版本下载,《第二版》修订时未能仔细核对。还有第378页对国际专利分类表IPC版次的叙述:“每五年修订一次,目前使用的IPC为第八版,2005年修订”,这个表述欠周全。第八版以后虽然未有第九版,但仍不断修订,且每年都修,2006年开始分基础版和高级版,高级版IPC在分类号后标修订的年月,2007-2008年高级版每年修订了两次,2009年后只保留高级版的分类表,称为完整的IPC(full IPC),且每年修订一次。第315页介绍CADAL电子图书时提到网站允许下载,这在CADAL刚上线后的一段时间内的确如此,但很快就技术加密,只能在线浏览了。此外还有最不应该出现的错别字,第290页阐述的液晶屏阅读器优点“支持背光,在没有外界关系的情况下可以方便地阅读”,联系上文介绍类纸屏阅读器的缺点“无背光,必须依赖外界光线”,可知“关系”当为“光线”。

第四,不甚完备的书后索引。《首版》书末所附的“数字资源名称索引”和“数字资源分类索引”是该书突出的优点之一,这在当时非常少见。经过学术界、编辑出版界多年来的呼吁,在深知索引功效的图书情报界,学术专著与工具类著作附有书后索引的情况已经渐多。这种形势下,对于参考价值大的工具性著作,我们对索引的质量也当提出更高的要求。《第二版》仍只索引了书中的数字资源名称是不够的,其涉及的其他有意义的关键词,如检索术语、重要机构、人名等都应该索引。仅比《首版》晚一年出版的同类信息检索教材《情报检索与计算机信息检索》(杨桂荣等,华中科技大学出版社)就在书后附有基于全书内容的“关键词索引”(包括书中18个检索实例)和“工具书索引”。同样经过近十年打磨,修订二版的《信息检索(多媒体)教程(第二版)》(沈固朝等,高等教育出版社,2009年12月版)在新增的书后索引中也不仅局限于信息源与检索工具,还包括其他关键词。这些都早于《第二版》面世,提供了范例,可惜《第二版》未抓住修订之机,将索引编制再迈一个新台阶,反而在原有水平上还有一定遗漏。如《首版》索引中有“台湾期刊文献资讯网”,《第二版》在相对应的章节继续介绍了演变后的“台湾期刊论文索引系统”,但索引却没有。《第二版》中还有很多正文中多次提到的资源(系统平台)没有在索引反映,如第225、230页两处提及的Scopus,第255、262、263页等多处出现的Scitation平台。还有一些仅提到过一次,但比较有特色、有价值的数字资源,在索引中也没有,读者就不容易发现,如第323页的“世界坦克装甲车辆手册数据库”“美国政府手册”等。

4 遐思:小心误入数字信息检索的检索歧途

在信息数字化发展的背景下,原来的工具书指南、文献检索类教材纷纷被数字、网络、信息检索类教材所取代,这是适应时代发展的需要,无可厚非。但是作为传授读者检索技能,培养其信息素养的图情专业者,必须对当前的资源形态有清醒的认识,并不是所有记录有知识的载体都已经成为数字信息,都进入了数据库,可以一检而得。这种认识也必须在名为类似数字信息检索的教材和课堂讲授中予以强调。特别在文史学科,很多史料文献都还没有数据库,无法全文检索,传统模式下的手检仍不可抛弃。即便是已经进入数据库的,也可能存在文字录入或扫描识别差错,不可盲目依赖。笔者在使用爱如生版《申报》全文库时就多次发现文字差错,若完全依赖其全文检索功能则很可能造成漏检。

此外,应避免学生患上“搜索依赖症”,什么都靠搜索,这易变得思维简单化,丧失应有的自我学习能力与必要的记忆储备,“谷歌在把我们变傻”绝非危言耸听。检索不能代替系统性的读书(包括电子书等新媒体阅读),检索关键词的提出,实际考验的是个人的学识积累。两版《数字资源》在最后一章中的学位论文开题写作中都有一则关于杜威的知识论研究的例子。诚如编者所言,对于这种社会科学的课题,如果仅仅以“杜威and(知识论or认识论)”或“杜威and(知识or认识)”这种关键词组配来检索,则相关结果会很少,应该从历史和思想史出发进行研究,更多地去阅读原著和其他一些相关研究专著(调整检索策略,改为检索阅读杜威及其研究者的专著)。尤其对文科研究,必须经历多读书的阶段,大脑中编织起自己的“知识地图”后,有了融会贯通的悟性,才能形成敏锐的“问题意识”,从而多角度地提出合适、准确而全面的“关键词”。另外,通读浏览式的博览群书还可以避免由于个人喜好或思维定式影响下的个人主观式检索形成的狭隘知识视野,也能增加“信息偶遇”的机会。如果没有必要的知识积累和感悟,就会失去全局观,虽然有可能依靠高超的检索技能获得许多稀见材料而出了些成果,那也是琐碎和缺乏深度的,只见树木不见森林,这种科研行为是功利而不可取的。笔者最后希望《数字资源》再版时能更细心地提醒读者勿惟检索至上而忽视了平日点滴的阅读学习。

更全、更新、更细,不仅是笔者对《第二版》较《首版》的赞誉,更是我们对《数字资源》第三版的期许,希望以后每次修订都能琢瑕磨瑜,没有最好,只有更好!

[1]肖珑.数字信息资源的检索与利用[M].北京:北京大学出版社,2003.

[2]肖珑.数字信息资源的检索与利用[M].第2版.北京:北京大学出版社,2013.

[3]董小英.移天缩地,咫尺万里——评《数字信息资源的检索与利用》[J].大学图书馆学报,2004(3):88-89.

[4]高春玲.从海量数字信息中发现知识的钥匙——评《数字信息资源的检索与利用(第二版)》[J].图书情报工作,2013(13):145-146.

[5]林佳.十年磨一剑,利器更今锐——评《数字信息资源的检索与利用》(第二版)[J].大学图书馆学报,2014(2):125-127.

[6]青苹果数据中心.《申报》数据库.[DB/OL](2003-02-05) [2014-01-16].http://www.egreenapple.com/ contents/59/1330.html.

More Comprehensive,More New,More Detailed——Recommendation and Revised Expectations on The Retrieval and Applications of Digital Information Resources(second edition)

GUYe-qing,WUXin-lan

The Retrieval and Applications of Digital Information Resources(second edition) inherited the first edition's prominent characteristics that covered the rich information resources and Information retrieval tools.It is a reference book which transcend information retrieval textbook and integrated resources retrieval and resource construction with evaluation.This paper reviews the new bright spots and the shortages of the book,then thinks that not to be too dependent on retrieval while ignoring the reading and thinking.

The Retrieval and Applications of Digital Information Resources(second edition);Information resources;Information retrieval;Textbook;Book review

格式 顾烨青,吴信岚.更全 更新 更细——读《数字信息资源的检索与利用》(第二版)[J].图书馆论坛,2014(7):62-66,112.

顾烨青,男,江南大学图书馆馆员;吴信岚,女,江南大学图书馆副研究员,副馆长。

2014-01-13

*本文系2014年度中央高校基本科研业务费专项资金项目(项目编号:JUSRP6140)研究成果之一

猜你喜欢

数字信息信息检索检索
浅析公共数字信息资源的建设开发与利用策略
高职院校图书馆开设信息检索课的必要性探讨
基于BIM的企业数字信息归档与利用模式研究
北京尚水数字信息产品介绍
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
数字有形状吗?数字信息精确性和品牌标识形状的匹配效应*
网络环境下数字图书馆信息检索发展
专利检索中“语义”的表现
基于神经网络的个性化信息检索模型研究