APP下载

两个中文会议全文数据库的比较分析

2012-08-31倪宁兵孙汝杰郭宏伟

图书馆理论与实践 2012年12期
关键词:学术会议全文检索

●倪宁兵,孙汝杰,郭宏伟

会议文献(Con ference Literature),是指在专业学术会议文献上交流或发表的论文、报告及其他有关资料。它能反映出一门学科、一个专业的研究水平和最新成果,而且许多重大发现住往首先在学术会议上公诸于众,所以会议文献是了解世界各国科技发展水平和动向的重要信息源。[1]为更好地利用会议文献,现在世界各国都研发了各种会议文献检索工具或建立会议文献数据库,如国内CNKI的中国重要会议全文数据库、万方的中国学术会议论文全文数据库、中国学术会议在线;国外的《科技会议录索引》(ISTP)、《ISIP roceedings》等等。其中中国重要会议论文全文数据库和中国学术会议论文全文数据库是两大具有一定影响的中文会议全文数据库。笔者以上海应用学院图书馆所购镜像站应用实践为例,对这两个会议全文数据库进行了比较分析,明晰其特点,疏理其脉络,以便于用户更好地了解和更有效地利用这两个数据库,也有助于图书馆资源的配置和优化。

1 收录情况比较

《中国重要会议论文全文数据库》(以下简称《CNKI》)重点收录1999年以来(部分重点会议文献回溯至1953年)中国科协系统及国家二级以上的学会、协会,高校、科研院所,政府机关举办的重要会议以及在国内召开的国际会议上发表的文献。《中国学术会议论文全文数据库》(以下简称《万方》)是国内最具权威性的学术会议论文全文数据库,收录了1998年至今的国家一级学会在国内组织召开的全国性学术会议,是目前国内收录会议数量最多、学科覆盖最广的数据库,[1]是掌握国内学术会议动态必不可少的权威资源。

两大数据库各自论文收录数量、收录年限、采集的资料来源、更新周期、浏览方式、学科范围等信息(见表 1)。

表1 《CNKI》与《万方》收录情况比较

从表1中可以看到《万方》收录的会议论文数量比《CNKI》收录的会议论文数量多一些。但《万方》收录数量中某些论文只有文摘,不能进行全文下载,虽然这部分占全库的比例极小;而《CNKI》收录的会议论文都可以全文下载。总的来说,这两大数据库收录范围都比较广,数据范围覆盖自然科学、工程技术、农林、医学等所有领域,无论从收录年限还是文献数量来看,显示这两个都具有一定影响且较权威性的学术会议论文全文数据库。

2 用户界面比较

检索界面是否友好,会影响到数据库吸引力和读者使用的深度。《CNKI》秉承了其CNKI知识库的统一格式和界面布局,[2]界面内容多,功能丰富,安排合理紧凑提供了“文献检索”“会议导航”“论文集导航”“主办单位导航”等不同的导航服务,满足用户的个性化需求,用户根据输入控制条件和检索控制条件的选择可以完成自主检索。

《万方》界面直观友好,简洁明了,但安排比较松散。数据库界面上提供了“普通检索”“高级检索”“学术会议分类检索”“会议主办单位”等服务。两者都有在线帮助或操作指南,都有专门关于会议数据库使用方法的详细说明。

3 检索功能比较

检索功能是指检索系统在用户界面上提供给用户的基本功能,它与系统的检索技术是紧密结合的。[3]笔者对两个数据库的分类导航、检索入口、检索方式、限制检索等方面进行了比较。

3.1 分类导航

表2 分类导航比较

在按行业学科分类导航和按主办单位分类导航方面,《CNKI》与《万方》基本类似,但也各有特色。在行业学科分类导航的类目设置上《CNKI》有10个大类,大类下再分 168个专题(小类),且有会议导航和论文集导航两种不同途径,不同类目设置适应了不同读者需求。《万方》有 20个大类,点击学科类目后显示会议名称,继续点击浏览论文全文,还可以通过会议年份进行交叉选择,最后确定所需要的会议论文。按主办单位分类导航两者基本类似,《CNKI》由8个类目组成,而《万方》设为 12个类目,显得更全面。

3.2 检索入口

表3 检索入口比较

对数据库来说检索入口非常重要,会议论文更是如此。两者都有题名、作者、正文、摘要、出版者等检索入口,但《CNKI》还有主编、出版单位、会议地点、ISSN、ISBN等入口,其检索入口比较丰富,有利于读者更多的选择。

3.3 检索方式

表4 检索方式比较

两者都有普通检索、高级检索、专业检索等方式,而《CNKI》还有科研基金检索、句子检索、来源会议检索等。《万方》则有经典检索。其中专业检索适合于对检索知识有较好掌握的读者,能提高查全率和查准率。相比而言,《CNKI》检索方式多样,个性化服务特出。

3.4 限制检索

表5 限制检索比较

限制检索能使检索结果更接近读者需求,提高检索的检准率。[4]两者都有逻辑组配和导航限制,而《CNKI》还有年限、会议级别、语种类型等限制方式,《万方》有无全文等限制功能。相比较而言,《CNKI》限制检索功能更丰富和强大。

4 输出结果比较

检索结果输出功能是评价数据库系统人机接口的非常重要的指标,也是用户比较关注的。两个数据库检索结果输出与处理比较,如表6所示。

表6 检索结果输出与处理比较

4.1 输出功能

从输出功能来看,两个数据库均具有显示、下载、存盘等多种输出功能,没有显著的区别。两个数据库都以不同的形式显示不同的超连接。

4.2 结果排序

在检索结果排序方面,两者都可以按相关度和时间排序,但在时间排序方面,《CNKI》按照年份可以升或降排序,而《万方》只能降序。在每页显示记录条数方面,《CNKI》每页能显示10条、20条、50条三种记录,而《万方》也有10条、20条、30条三种选择,两者都可以根据需要很方便地调整。

4.3 输出格式

《CNKI》采用两种格式,一种是CAJ格式,需要用CAJ全文阅览器阅读,网站上提供下载;另一种为国际通用的PDF格式,能够满足信息交换。《万方》只采用PDF格式,简单方便。

从总体上来说,在输出结果方面,《CNKI》的显示形式更人性化,具体条目显示内容更多,相关查询链接更丰富,但《万方》在某个方面也有一定的特色,显示形式较个性化。

图《CNKI》与《万方》收录论文篇数(2006-2011年)

5 实题检索比较

为了比较两个数据库在文献检索时的查全情况和数据更新情况,笔者检索了两库的论文收录情况(2006-2011年),并在关键词、论文作者和论文作者三个字段中任意选取了几个检索词进行检索,并使用不同检索策略,检索结果如图及表7所示。

表7 检索实例比较

从上图显示,《CNKI》与《万方》在2006-2010收录的论文数量相差不多,《万方》稍微多一点。根据表7我们可以看出,在选取的若干个检索词中,《CNKI》与《万方》检索的结果不同,《CNKI》有 6个检索词的检出结果高于《万方》,而《万方》有7个检索词的检出结果高于《CNKI》,这与两库的收藏重点各有不同有关,但总体上《万方》略多一些,查全率更高些,这似乎与前面论文收录总量的对比相一致。另外《万方》中没有“作者单位”这一检索字段,因此无法检索。表明《万方》的检索字段没有《CNKI》丰富,有待于今后作一些改进。

6 小结

通过上述对两大中文全文数据库的比较,可以看出两库各具特色,各有所长。

(1)两大数据库收录会议论文的年限相差不多,收录的学科范围也大致相同,基本覆盖了自然科学和人文社会的各个领域。《万方》的会议论文收录数量略高于《CNKI》,但《CNKI》其论文回溯年限比《万方》长。在收录文献的特色上,《CNKI》和《万方》都偏重于理工科方面,尤其《万方》更加明显。

(2)《CNKI》检索结果中显示被引频次、下载频次等显示文献的引用情况,从侧面揭示文献的被参考情况,便于追溯知识源头,掌握其发展脉络。同时还有中英文扩展检索,正文等文献网络图,提供了匹配度选择(精确与模糊两种方式)、词频限制功能等特色,而《万方》没有提供以上这些选择。《万方》检索结果有经典论文优先(是指被引用次数比较多,或者文章发表在档次比较高的杂志上的、有价值的文献排在前面)、相关度优先与最新论文优先三种排序,优先排序是检索结果页面提供的特色功能。另外《万方》检索结果中显示论文的相关博文,可点击查看,这是《万方》的特色之一,是非常新颖和实用的。

(3)更新速度还有待提高。从更新程度来说,《CNKI》比《万方》的更新周期要短。《CNKI》采用每日更新,而《万方》不能达到每日更新,有时要1个月才更新。但两者和一些国外数据库在更新时效方面相比都显得慢,希望能进一步提高。因为文献更新的及时性是影响用户选择的一个重要因素,更新周期太长,不利于用户检索到最新的信息。

(4)鉴于两个数据库收藏数量与内容不同,收藏重点也不相同,当然两库之间的文章有交叉重复现象,但两库还可实现资源交叉互补。如果经费允许,可以同时购买,或者对自己所需的文理工学科分别从两家购入,实现优势互补,为用户检索会议文献提供更多地方便。

[1]邓富民.文献检索与论文写作[M].北京:经济管理出版社,2010(8):149-155.

[2]刘萍,孙汝杰.两个博硕士学位论文数据库之比较 [J].图书情报工作,2005(11):110-112.

[3]王群.中国两大博硕士论文全文数据库比较研究[J].情报科学,2006(1):65-68.

[4]李志明.我国两大年鉴全文数据库比较研究[J].图书馆学研究,2009(1):66-69.

猜你喜欢

学术会议全文检索
第八届全全科学社会学学术会议通知
瑞典专利数据库的检索技巧
关于召开第18届24省(市、自治区)4市铸造学术会议的(第一轮)通知
青年再造
发现“西方中医”
反腐
来信
专利检索中“语义”的表现
第十七届全国疲劳与断裂学术会议征文通知
国际标准检索