互联网+信息检索路径优化研究
2021-08-09胡菊芳阿童木曹丽
胡菊芳 阿童木 曹丽
摘要:互联网环境下,读者信息检索具有信息来源广泛、检索路径多样和获取要求及时等特点。以图书馆文献传递申请处理为例,目前网络信息检索中常见的问题有:信息来源广泛,难辨真伪;信息检索路径多样,缺少一站式检索工具;信息检索系统兼容性差,影响查全率和查准率。解决这些问题,应巧用搜索引擎,优化信息检索路径;选择优质联合目录,提高馆藏定位查准率;制定检索策略,提高文献信息检索查全率;选择适当的网络文献信息服务平台,提高获取文献的便利性和时效性。
关键词:信息检索;文献传递;互联网;路径优化
中图分类号:G252.7文献标识码:A文章编号:2095-6916(2021)11-0157-04
如何迅速从海量信息中找到符合需要的信息,是信息检索工作亟待解决的问题。选择优异性能的检索工具,利用科学、便捷的检索方法,从各种类型的数据库中或者搜索引擎中寻找所需文献[1],是网络环境下信息检索需要研究探索的课题。
关于网络环境下信息检索的研究,国内从上个世纪末就已经有相关成果。我们用“互联网+信息检索”作为关键词分别在中国期刊网、万方数据资源系统、维普资讯全文库中检索,共查到118篇文献,其中有8篇发表在CSSCI收录的期刊里。分析这些成果,主要研究了搜索引擎、专业数据库、专业网站、网络公开获取文献的路径,对于如何恰当选择检索工具改进检索路径的研究较少提及。
本文根据个人工作经验和实践观察,分析网络环境下信息检索存在的主要问题,通过文献传递申请的原文检索的案例分析,提出了如何优化信息检索的路径。
一、网络信息检索的特点
互联网环境下,读者信息检索具有信息来源广泛、检索路径多样和获取要求及时等特点。读者检索的信息有的来自搜索引擎,有来自读者看到的其他文献的参考文献,有来自读者从互联网上泛泛浏览的信息,有来自各种学术网站登载的文献,有来自师友提供的信息。从高校图书馆读者服务的实践来看,读者需要图书馆提供的文献类型有期刊论文、会议论文、学位论文、图书、科技报告、标准、专利,甚至一些机构的调查报告、行业的统计数据等,但期刊文献和会议文献约占80%以上。可以看出,人们对网络信息的获取时效也出现了很高的要求,因此选择恰当的网络信息检索路径至关重要。
二、网络信息检索中常见的问题
由于网络信息来源广、数量大,检索信息的路径多种多样,读者及时获得需要的信息常常遇到一些困难。
(一)信息来源广泛,难辨真伪
通常,人们获取的网络文献信息主要来自参考文献、公共网络、各种类型的二次文献检索工具等。然而,由于部分参考文献著录不规范,常常导致参考文献信息的真实性和准确性难以判断;而且,公共网络获得的文献信息良莠不齐,获取路径常常不透明;部分二次文献检索工具常常没有及时在线更新,导致检索信息不对称。由此,经常出现读者无法从文献传递源找到原文的情况。
(二)信息检索路径多样,缺少一站式检索工具
目前,国内缺乏能够全面、准确揭示各文献机构收藏文献的大型联合目录和高质量跨库检索在线联接方式,给文献检索带来了不便。网络信息检索通常利用全国期刊联合目录、国内高校书刊联合目录、NSTL(国家科技图书文献中心)、E得文献获取平台、超星百链云图书馆、中国国家图书馆馆藏联合目录、上海图书馆馆藏联合目录等。为了找到一篇文献的收藏机构,读者常常需要登录多个联合目录网址,费时费力,加上有些联合目录缺乏及时更新,给文献的馆藏定位形成误导,导致读者不能方便地获取原文[2]。
(三)信息检索系统兼容性差,影响查全率和查准率
网络信息检索离不开检索系统,每一个检索系统都会有一定的兼容性,有的对浏览器有要求,有的检索系统不能识别一些字符,在检索时如果没有进行相应的规避,都会对检索结果造成不利影响。
三、信息检索路径优化策略建议
基于我们多年从事信息检索服务的经验和实践观察,提出了一些信息检索路径优化策略,帮助广大读者提高检索工作绩效。
(一)巧用搜索引擎,优化信息检索路径
目前,网络信息检索比较常用的检索工具有谷歌(Google)、雅虎、百度等搜索引擎。由于谷歌汇集了大量的中外学术资源,可以检索到文献所在的学术网站、科研单位的机构知识库,甚至检索到文献的PDF原文,以及具有通过近义词等相关检索、深度检索和“按照相关度排序”的功能。目前,运用Google学术搜索进行专业信息检索,在学术界已有所讨论,比如首都医科大学图书馆李永杰老师的《利用Google学术搜索获取生物医学外文文献》,天津中医药大学图书馆思金华老师的《Google学术搜索与PubMed在医学原文传递工作中的应用》,都讨论了如何利用Google学术搜索获取免费原文。但利用谷歌搜索引擎检索文献,没有详细的讨论。因此,我们主要利用工作中的案例,讨论如何利用谷歌相关检索和深度检索的功能核实、完善读者提供的文献信息[3]。
案例1文献名:Biol Reprod;文章题名:Expression of interferon receptorsubunits,IFNAR 1 and IFNAR 2,in theovine uterus;出版年代:2002。
这篇文献的来源是缩写形式,文献信息不完整,在检索时,首先利用文献名Biol Reprod作为检索词,通过Google搜索引擎检索到刊名全称“Biology of Reproduction”,并利用文献名Biology of Reproduction通过Google搜索引擎检索到该刊的官方网站,利用文章名在网站上检索到该文章所在卷期为Vol.67,No.3,由于該期刊属于公开获取,可直接下载原文。
案例2献名:Advanced Technology for Applications;文章题名:Pulsed Laser Radars with High-Modulation-Frequency in industrial applications;出版时间:1992年;文献类型:期刊。
我们先利用文章题名作为关键词,通过Google搜索引擎,查到引用该文章的文献,通过参考文献补全文献信息,发现该文献不是期刊文献,而是会议文献。文献信息截图如下:
再利用Laser Radar.VII:Advanced Technology for Applications, SPIE作为检索词,继续通过Google搜索引擎进行检索,发现该会议论文集已出版,ISBN号是9780819407795。
(二)选择优质联合目录,提高馆藏定位查准率
我们在为读者检索期刊论文时,通常首先利用“全国期刊联合目录”,因为该联合目录收录了国内400余家大型公共图书馆、中国科学院系统图书馆、中国社会科学院系统图书馆及各大部委的情報所、科研系统的图书馆、重点高校的图书馆和军队卫生系统的图书馆等的馆藏期刊文献[4]。该数据库不仅文献揭示范围广,而且文献著录详细。其次利用“CALIS高校书刊联合目录”,该数据库揭示了全国高校图书馆的馆藏期刊和图书文献,馆藏定位比较准确,更新相对及时[5]。利用这两个数据库基本能检索到所需文献在国内的文献机构收藏情况。对于以论文集出版的会议文献,选择中国国家图书馆馆藏联合目录[6]进行检索,该馆收集了大量的会议论文集。没有检索到国内文献机构有收藏的文献,可以利用OCLC Firstsearch[7]数据库检索文献在海外文献机构的收藏情况。
案例3文献题名:Transaction of the Metallurgical Society of AIME;文章题名:Intergranular energy of iron and some iron alloys;著者:Van Vlack,Lawrence H;卷期号:191;出版年:1951。
根据现有的文献信息,利用“全国期刊联合目录集成服务系统”检索,没有找到收藏馆。但发现一条线索,该刊在出版发行的过程中,期刊名称和ISSN号都发生了变更。详情如下表:
从上表看出,该文章出版年代的期刊题名为“Transactions of the American Institute of Mining and Metallurgical Engineers”,利用该题名作为检索词再次检索“全国期刊联合目录集成服务系统”,检索到北京大学图书馆等有该文献的收藏。
(三)制定检索策略,提高文献信息检索查全率
网络信息检索离不开检索系统,每一个检索系统都有自己的特点,对检索字段和检索词都有一定的要求。
首先,选择合适的检索字段。检索系统的文献各字段通常是由人工标引,标引的过程中难免会出现失误,因此,在检索期刊文献和会议文献的时候,如果选择字段比较长的期刊名称和会议名称有时难以检索到准确结果,而ISSN号是期刊的唯一识别号,字段简短,符号单一,容易匹配,因此可以选择ISSN号作为检索字段;会议文献如果以论文集的形式出版,可以利用已出版论文集的ISBN号作为检索字段进行检索,检索效果通常更为理想。
其次,去掉检索词里的特殊字符,方便系统识别。有些数据库对一些特殊字符不兼容。因此,在检索时应去掉各种标点符号以及其他特殊字符,以便被数据库识别,从而查找到文献。
(四)选择适当的网络文献信息服务平台,提高获取文献的便利性和时效性
便利性[8]是指文献检索的便利程度和原文获取的便利程度,时效性是指原文获取的时间长短。
目前,国内比较大型的文献传递系统有CASHL(中国高校人文社会科学文献中心)[9]、NSTL(国家科技图书文献系统)[10]、超星公司的百链搜索平台[11]、外文期刊网[12]、E得文献获取平台[13]、BALIS文献传递平台[14]等。由于各系统可获取的文献范围不同,文献传递方式各异,因此,需要根据文献的类型选择适当的服务平台。
1.人文社科类文献的快捷获取路径——CASHL(中国高校人文社会科学文献中心)。CASHL(中国高校人文社会科学文献中心)收集了大量国内人文社科强校的外文期刊,截至2014年底,已收录人文社科类外文纸本期刊2万余种、电子期刊2千多种,可以通过期刊名、文章题名、ISSN号、作者等字段检索,在该系统检索到的文献,90%以上可以获取原文。只要读者点击“文献传递”,服务馆就能收到文献请求,通常三个工作日内收到原文。
2.科技类期刊、会议文献的快捷获取路径——NSTL(国家科技图书文献系统)。NSTL是根据国务院领导的批示,于2000年6月12日组建的一个虚拟的科技文献信息服务机构,成员单位包括中国科学院文献情报中心、工程技术图书馆(中国科学技术信息研究所、机械工业信息研究院、冶金工业信息标准研究院、中国化工信息中心)、中国农业科学院图书馆、中国医学科学院图书馆。通过该系统可在线检索、获取中外文期刊文献8000万余篇,会议文献700万余篇。通常检索到的文献,提交文献传递申请后一天内收到原文。
3.普通文献的快速获取路径——读秀知识库。该平台由超星公司制作,是由海量全文数据及资料基本信息组成的超大型数据库,为用户提供深入到图书章节和内容的全文检索,部分文献的原文试读,以及高效查找、获取各种类型学术文献资料的一站式检索,可提供周到的参考咨询服务,是一个真正意义上的学术搜索引擎及文献资料服务平台。由于该平台文献申请无需注册用户,读者在申请时只要输入e-mail地址即可,操作简单;文献一经申请,就有多个文献传递员响应,服务快速;通常4~8小时内获取原文,大大提高了原文获取的时效性,目前国内很多高校图书馆购买了该平台,高校读者可以通过该平台快速、免费获取学术资源。
4.外文期刊文献的快捷获取路径——外文期刊网。外文期刊网是中国高等教育文献保障系统的子项目,该系统收录近10万余种高校收藏的纸本期刊和电子期刊信息,文章篇名信息每周更新。该平台可以通过文章名、作者、刊名、ISSN号等检索字段直接检索文献,检索到的文献如果本地有馆藏,可以直接下载原文;若没有馆藏,可以申请文献传递,原文由CALIS(中国高等教育文献保障系统)提供,具体办法是读者先系统注册用户,再提交文献传递申请,由本校图书馆文献传递员将申请转发至文献收藏馆,服务馆将原文发至读者邮箱。
5.国内外图书馆馆藏资源的综合获取路径——E得文献获取平台。通过E得文献平台可检索获取国内2千多家高校图书馆的馆藏印本和电子资源,以及中国国家图书馆、上海图书馆的馆藏资源,还可以获取我国香港地区的大学图书馆馆藏文献、部分韩文文献、美国哈佛大学图书馆的馆藏文献,委托部分申请待查国外大型图书馆的馆藏文献。该平台以可获取文献的范围广而著称。因此,在通过CASHL、NSTL、读秀知识库不能获取的文献皆可以通过该平台获取,该平台隶属于CALIS(中国高等教育文献保障系统)。目前,国内绝大部分高校图书馆都是该平台的用户,高校读者可以通过该系统获取文献。
6.北京地区高校图书馆文献资源保障体系——BALIS文献传递平台。BALIS文献传递平台自2007年建成,一直秉承读者第一、用户至上的宗旨,免费为北京地区的90多家高校师生获取北京地区高校图书馆的馆藏资源、以及中国国家图书馆、上海图书馆、首都图书馆、国家科技图书文献系统(NSTL)的文献,该平台还能代为获取北京地区以外的国内外大型文献机构的学术资源。
四、结语
网络环境下的信息检索具有信息来源广泛、检索路径多样、用户原文获得时间要求及时的特点。本文提出了优化信息检索路径,提供了基于信息内容的知识型服务[15]的若干对策建议,包括提高文献传递工作人员信息检索素养,改进网络信息检索技能,掌握常用检索工具特点,知晓各类文献机构的馆藏特色,快速进行馆藏定位,选择合适的文献共享服务平台等,以保证原文的快捷获取,提高信息检索的查全率、查准率和时效性,从而提高读者满意度。这些优化路径局限于中国人民大学图书馆的服务实践,未来将开展更广泛的调查,验证其对不同场景的实用性。
参考文献:
[1] 于新国.大数据环境与图书馆文献数据建设及服务[J].文献信息论坛,2013(2).
[2] 黄静.变革中的文献传递服务:案例剖析与路向管窥[J].图书情报工作,2013(7).
[3] 思金华,等.Google学术搜索与PubMed在医学原文传递工作中的应用[J].科技传播,2010(15).
[4] 全国期刊联合目录集成服务系统[EB/OL].2019-05-01.http://union.csdl.ac.cn/.
[5] CALIS高校书刊联合目录[EB/OL].2019-05-01.http://opac.calis.edu.cn/opac/simpleSearch.do.
[6] 中国国家图书馆馆藏联合目录[EB/OL].2019-05-01.http://www.nlc.gov.cn/.
[7] OCLC FirstSearch[EB/OL].2019-05-01.http://firstsearch.oclc.org.
[8] 何美珍.原文传递业务流程中的用户满意度分析[J].图书情报工作,2005(8).
[9] 中国高校人文社会科学文献中心[EB/OL].2020-12-01.http://www.cashl.edu.cn/portal/homepage.html.
[10] 國家科技图书文献中心[EB/OL].2020-12-01.http://www.nstl.gov.cn/.
[11] 独秀知识库[EB/OL].2020-12-01.http://www.duxiu.com/.
[12] 外文期刊网[EB/OL].2020-12-01.http://ccc.calis.edu.cn/index.php.
[13] E得文献获取平台[EB/OL].2020-12-01.http://www.yide.calis.edu.cn/.
[14] BALIS北京地区高校图书馆文献资源保障体系[EB/OL].2020-12-01.http://www.balis.edu.cn/.
[15] 马铭,王芩.BALIS原文传递服务的现状、问题及对策[J].图书情报工作,2010(S2).
通讯作者:胡菊芳(1970—),女,汉族,安徽庐江人,中国人民大学图书馆副研究馆员,研究方向为图书情报学。
作者简介:阿童木(1969—),女,蒙古族,内蒙古赤峰人,中国人民大学图书馆馆员,研究方向为图书情报学。
曹丽(1963—),女,汉族,内蒙古赤峰人,中国人民大学图书馆副研究馆员,研究方向为图书情报学。
(责任编辑:朱希良)