CNKI作者发文检索功能及问题实例分析
2014-04-03刘立冬
〔摘 要〕CNKI系列数据库提供多途径的索引导航方式来全面提升服务功能和效果。针对同一个作者进行“作者发文情况”的检索可以有多种途径去实现,同时,选择的检索途径不同,登录方式和检索结果会有相应差异。以作者姓名为检索字段,以作者的发文情况为检索目的,通过具体的检索实例,为用户提供检索方法和技巧的示范,并在示范过程中,为用户使用作者发文检索功能提供有效地检索建议。另外,对于在作者发文检索使用过程中出现的一些问题,提出针对数据库的改进建议。
〔关键词〕CNKI;作者发文;检索功能;检索效果
DOI:10.3969/j.issn.1008-0821.2014.02.030
〔中图分类号〕G250.74;G252.7 〔文献标识码〕A 〔文章编号〕1008-0821(2014)02-0151-03
为更好地服务用户,CNKI系列数据库不断整合系统,优化性能,以支持用户全面发现信息为目标,通过提供多途径的索引导航方式来全面提升服务功能和效果。现有数据库系统在大力提升专业检索人员的检索效能基础上,也给很多已经习惯旧版系统或者刚接触CNKI的用户增加了使用难度。笔者常年从事图书馆参考咨询工作,日常使用CNKI系列数据库进行相关任务检索的频度较高。在对新版数据库系统进行检索使用的过程中,笔者发现基于同一个作者进行“作者发文情况”的检索可以有多种途径去实现;同时,选择的检索途径不同,登录方式和检索结果会有相应差异;另外,笔者还发现作者单位名称的前后变化等原因是造成检索结果错、漏的一个很重要原因。作者发文检索是通过作者姓名、单位等信息,查找作者发表的全部文献及被引下载情况的检索过程[1]。作者姓名和单位字段是用户检索作者发文情况的必要检索项,在这里我们只讨论作者姓名为汉字方式,作者单位为一个而非多个,发文顺序为第一作者或者惟一作者的情况。为了能较客观、全面的体现案例效果,排除查询控制条件不确切等因素,本文将以笔者本人为检索对象,通过在CNKI数据库中对笔者的期刊发文情况进行单库检索,来为用户提供检索方法和技巧的示范;通过对笔者发文检索结果和实际发文情况的比对,来为用户使用作者发文检索功能提供有效的检索建议;同时,根据检索结果中出现的问题提出针对数据库的改进建议。
1 登录方式及结果CNKI数据库提供了强大的检索功能,具有多种检索入口,从而提高了文献的检全率和检准率,节约了检索时间,提高了检索效率[2]。在CNKI中国期刊全文数据库中,能够实现作者发文情况的检索,一般有3种途径:快速检索、高级检索和引文检索。以下将以检索笔者“姓名=刘立冬(第一作者)”所发表的学术论文情况为任务进行相关检索举例。
1.1 快速检索提供了类似搜索引擎的检索方式,用户只需在CNKI首页上点击“期刊”,限定检索范围为期刊数据库,然后在检索区前,点击下拉箭头,选中“作者”项,输入所要检索的作者姓名,点击“检索”按钮,就可以检索到库中所有同名作者的期刊发文题录信息。快速检索为用户提供了最大范围的选择空间,但是因为同名因素的干扰,使得检索结果过于宽泛,但凡数据库中相同名字的作者发文信息都将作为命中目标被检出。为了提高查准率,用户还需要进行二次检索[3]。在已获取的检索结果范围内再用“单位”为检索词,通过点击“结果中检索”按钮进行二次逼近检索,这样就可检索出特定单位的指定作者在期刊数据库中的详细发文信息。例如,在作者字段中输入姓名“刘立冬”,点击检索,找到73条检索结果。通过结果比较分析,这些姓名为“刘立冬”的作者,并不是同一个人。为了精确检出笔者本人的论文发表情况,此时就需要在检索区,检索项选择“单位”,在检索框中输入笔者的工作单位检索词“湖北文理学院”,点击“结果中检索”,进行二次检索,最终找到4条结果。概览4条结果的发表时间发现,查询结果只显示了2012年和2013年2个年份。由于笔者所属的工作单位湖北文理学院是在2011年底进行的更名,之前名称为“襄樊学院”,为了查全发文情况,因此还需查找更名之前的论文发文信息。此时就需要在二次检索过程中,在“单位”项后,再次输入更名前的单位名称检索词“襄樊学院”,点击“结果中检索”,最终获得9条结果。综合前后2次以“单位”为检索项的检索结果,剔除第二作者为刘立冬的1条记录,最终,得出了自入职以来,以笔者为第一作者的全部发文情况。最终检索结果12条与笔者的实际公开发文情况吻合,检索目的达到。
2014年2月第34卷第2期现?代?情?报Journal of Modern InformationFeb.,2014Vol.34 No.22014年2月第34卷第2期CNKI作者发文检索功能及问题实例分析Feb.,2014Vol.34 No.21.2 高级检索在CNKI首页,检索区后有上、下2个并列的检索选项,点击下方的“高级检索”选项按钮,直接转入文献数据库的高级检索界面,在此界面找到“作者发文检索”选项,将光标轻轻移至此检索项,对应显示出“通过作者姓名、单位等信息,查找作者发表的全部文献及被引下载情况”字样,点击选中进入“作者发文检索”界面。此界面提供了“作者姓名”、“第一作者姓名”、“作者单位”3个检索项,以及相应的精确、模糊匹配方式。检索时,根据检索需求在相应检索字段后面的检索框中输入检索词,并逐一调整精确或模糊匹配方式,若不指定匹配方式,数据库将以默认方式进行匹配,然后点击“检索”按钮,即可得到检索结果。例如,由于检索任务是查询以笔者为第一作者的发文情况,因此,只需直接在“第一作者姓名”检索项输入姓名“刘立冬”,“作者单位”检索项输入检索词“湖北文理学院”,找到4条结果;然后,重新在“作者单位”检索项输入检索词“襄樊学院”,进行二次补充检索,找到8条结果。本次检索为默认匹配方式,检索结果共计12条。调整匹配方式,在“第一作者姓名”检索项输入姓名“刘立冬”,保持“精确”匹配,在“作者单位”检索项逐次输入检索词“湖北文理学院”,“襄樊学院”,调整匹配方式为“精确”,分别找到1条和0条结果。通过对比快速检索的文献题录信息结果发现,指定“作者单位”为精确匹配方式没有检出机构为“湖北文理学院图书馆”、“襄樊学院图书馆”的论文。由于在源文献中作者发文单位被具体标注到了学院二级单位,很明显如果在数据库检索中仅仅只输入一级学院名称,那么系统将因数据不吻合而无法辨识。因此,在使用高级检索中的“作者发文检索”时,要想达到较为理想的查全检索效果,需尽量采用模糊匹配方式进行检索操作。endprint
1.3 引文检索在CNKI首页,从检索区下方的蓝色选项区域找到“引文”选项,点击“引文”,打开中国引文数据库,在数据库左侧“数据统计”板块,点击“作者统计”检索项,进入“作者统计”的“发文量”界面。发文量统计作者每年的发文情况,并用柱状图显示出来。此界面提供了“作者姓名”、“第一作者”、“作者单位”、“曾经工作单位一”、“单位匹配方式”、“资源范围”等7个检索选项。用户可根据实际检索需求,对每个字段分别进行检索,或者进行组合检索[4]。例如,检索以“刘立冬”为第一作者的全部发文情况。只需直接在“第一作者姓名”检索项输入姓名“刘立冬”;“作者单位”检索项输入检索词“湖北文理学院”,然后把更名前的“襄樊学院”作为“曾经工作单位一”字段的检索词,将在“快速检索”和“高级检索”中需要二次检索的“作者单位”合并操作;“单位匹配方式”默认“精确”;“资源范围”项保持默认在全部期刊范围,点击“统计”,得到总发文量仅为1。其他检索字段及检索词不变,调整“单位匹配方式”为“模糊”,“统计”得到总发文量为12。实证表明,调整“作者单位”和“曾经工作单位一”检索词的先后次序,检索结果不变;单位匹配方式点击下拉箭头选择为“模糊”,检索结果更为理想。通过使用引文数据库的作者发文量检索功能去检索某一特定作者的发文情况,因系统提供的检索条件多,所以检索速度较快,查准率高。
2 CNKI检索的功能缺陷在利用CNKI数据库进行作者发文情况的检索时,使用完全相同的检索词在不同时段进行检索得出的检索结果会不尽相同,除此之外,另有以下不足之处:
2.1 对于检索到的干扰记录项无法实现勾选删除在利用CNKI数据库进行作者发文检索时,需要对诸如非第一作者或年限不符等的非目标文献信息,进行结果内再排除,但是数据库没有提供选中删除记录功能。数据库在结果界面提供了很简便的点击勾选功能,每条记录前都有一个小方框,只需在选中的目标题录前的小方框内打钩,就可以进行文献题录输出等相关操作,也提供了“清除”按钮,用来清除选中勾选的功能,但是却没有提供删除选中记录的功能。
2.2 引文数据库检出的结果以柱状图显示,题录信息不直观 引文数据库中检索出的结果,以柱状方式显示,横坐标代表时间,纵坐标代表文献量。通过柱状图很容易看清文献作者发表论文的年份,以及发文量趋势等信息,但是无法第一时间获知被检索对象的具体文献题录信息。在柱状方式下,如果需要获知具体发文信息,还需逐年点击,依次汇总,使用起来费事又易出错。
2.3 作者单位署名不一致,漏检率高此处的不一致体现在两个方面,一方面为单位名称前后不一致。高校的合并更名,数据库里作者信息没有得到关联,致使文章作者单位署名出现不一致现象[5]。举例中,笔者的工作单位现名称为湖北文理学院,改名之前叫作襄樊学院,笔者发表论文署名工作单位时,既有襄樊学院又有湖北文理学院;另一个方面体现在同一单位标注程度不一致,笔者在发表论文署名时,在单位名称一项既有标注为襄樊学院,也有襄樊学院图书馆;既有湖北文理学院,又有湖北文理学院图书馆。当用户仅仅只输入单位名称其中之一作为检索词时,极易造成非技术性漏检。
3 CNKI作者发文检索的改进对策
3.1 在检索结果界面增加一个“删除”按钮为便于在结果界面进行结果内删除操作,系统可在数据库结果记录界面添加一个“删除”按钮。这个“删除”按钮可与题录上方的“清除”、“导出/参考文献”“分析阅读”等按钮并列设置,既不影响美观,又方便操作。
3.2 发文量统计结果界面增加显示方式自选按钮现有的发文量柱状图显示方式,对于年份和发文数量的变化一目了然,但是这样一目了然只是文献计量学意义上的数据统计结果显示,若要获知具体文献题录信息则需进一步操作。系统可在发文量统计显示界面设置“柱状图显示”、“题录显示”自选显示方式按钮,这样用户就可以根据自己的实际需求点选最合适、简便的结果显示方式。
3.3 自动关联新旧单位名称,提供合并检索功能CNKI以强大的检索功能被众多知识管理者选用。为进一步提升检索功能,更应主动收集整理相关更名公告信息,然后按照公告创设关联同一机构的新旧名称功能。当检索者进入数据库快速检索界面,在“单位”检索项输入新旧名称中的任何一种时,系统均可自动识别关联新旧名称到现有单位名称,只需一个名称输入,就能将同一单位不同署名的目标文献全部关联识别检出,在减少检索步骤的同时提高检索查全效果。
3.4 系统提供作者发文单位扩展高级检索中“作者发文检索”界面现有的作者发文单位检索词输入随意性很大,用户为查全一个作者的全部发文情况,因作者单位变更,单位名称前后变化等原因需要大费周章。系统可根据源文献仓储中提供的作者发文单位并辅以主要研究方向等进行自动聚类,提取出某一作者在库内文献中标注的全部发文单位。当用户输入作者名称时,系统会自动匹配出相关机构名称辅助用户进行选择。考虑到系统聚类的不完整性和名称动态更新的需求,还可增加一项机构追加功能[6],由作者自行追加上传聚类备选列表之外的机构名称,经后台审验通过后纳入扩展。
4 结 语从应用实践来看,用户在进行作者发文检索时,可资利用的检索途经较多。有时通过一种检索方法就能解决全部的查询需求,但有时在查询控制条件不确切的情况下,就需要尝试使用多种检索方法,同时还需注意检索方式的配合使用[7]。在检索过程中,针对单位名称字段多用模糊匹配方式,检索效果更为理想。利用引文检索的发文量检索,因为检索条件多,所以检索速度快,查准率高。影响作者发文检索的原因除了数据库系统本身存在的不稳定性外,最重要的原因就是目前现有的作者单位检索字段输入随意性大,作者单位名称前后变化在数据库中缺乏应有的合并关联。
参考文献
[1]宋乐平.中文数据库作者字段检索功能实证研究[J].情报杂志,2010,(1)177-181.
[2]吴宇红.CNKI及其应用[J].晋图学刊,2005,(4):78-79.
[3]蔡莉静,陈曹维.现代图书馆信息服务[M].北京:海洋出版社,2006:94.
[4]周毅华.网络信息资源检索与利用[M].南京:南京大学出版社,2011:242-245.
[5]张方.CNKI数据库实践与思考[J].农业图书情报学刊,2012,(2):146-147.
[6]于澄洁.Ei Compendex数据库作者机构检索技巧[J].图书馆杂志,2010,(12):29-30.
[7]王凌.国内三种常用中文数据库检索功能的比较研究[J].现代情报,2010,(7):129-131.
(本文责任编辑:孙国雷)endprint