APP下载

查收查引SCIE引用批量检索实践探索

2019-11-04黄少飞

河南图书馆学刊 2019年9期

黄少飞

关键词:查收查引;SCIE引用;批量检索;定制报告;Excel

摘 要:文献的收录与引用情况在一定程度上彰显了该文献的学术影响力,也是对其作者进行评价的重要依据之一,因此,快速精准地检索出批量文献的收录与引用情况对后续学术评价工作的快速推进有着重要的意义。作者通过研究人工检索步骤、流程、注意事项以及特殊情况与客户要求等问题,应用Excel数据处理的功能,编写出相应的处理程序,从而实现了自动、批量、精准的SCIE引用檢索工作。案例应用结果表明,该方法能够快速完成SCIE引用的批量检索,获得总引用次数和他引次数,并能根据客户要求打印定制报告。

中图分类号:G250文献标识码:A文章编号:1003-1588(2019)09-0102-04

图书馆查收查引服务主要包含两部分内容,一是文献的收录和引用查证,二是期刊的影响因子和分区查证,其中文献的收录和引用查证工作量最大,而文献的引用又有总引和他引的区别,通常采用手工逐篇检索总引用,再逐个排除被引文献的作者的方式,检索数据和整理客户所需要的查收查引报告。逐篇检索引用的工作通常都是检索人员的重复性机械劳动,特别是在工作量较大时,检索人员的工作压力也很大,这必然要求检索人员挖掘检索技巧以提高检索效率。文献的被引频次代表的是文献的学术影响力,引用查证强调了检索的准确性,故查收查引服务是一项既要追求效率,又要追求质量的服务工作,如何高质高效地做好这项工作已成为一线查收检索人员迫切需要关注的问题。

1 研究现状

在追求高效地开展查收查引服务方面,目前已有部分机构和图书馆同行做了许多探索,如:中国科学院开发了查收查引报告自动生成系统[1],北京大学与中国高等教育文献保障体系组织(CALIS)联合开发了查收查引系统[2],山东大学图书馆也开发了查收查引系统[3]等。查收查引系统极大地提高了检索效率,避免了检索者大量的重复劳动。同时,一线检索馆员也摸索出一些利用计算机软件辅助检索的措施,提高了自身的检索效率,如:樊亚芳等人提出了利用Excel的筛选功能和End Note Web、NoteExpress等软件进行辅助检索[4-6],这种利用工具辅助检索的方式不需要经费投入,在一定程度上减少了检索人员的重复劳动;蒋君、张玢等人设计了一个基于VBA函数的中文医学引文查收查引工具[7],该工具能实现去重、统一一些中文文献的引文格式和统计引用次数等功能,适合一线检索人员使用。笔者也在从事查收查引服务工作时找到了一种可以批量处理SCIE引用检索的方法,能根据客户要求打印定制报告,缓解一线检索人员的工作压力。

2 思路与方法

鉴于日常检索服务中SCIE引用检索较多,且SCIE数据库中的文献方便导出、格式清楚,笔者选择对SCIE引用做批量检索方法的探索。本文将以实际案例为例,一步步阐释如何使用该方法进行多篇文献的SCIE引用批量检索,并在最后以一定的格式自动输出报告,其流程如图1所示。

第一步:通过批量检索SCIE收录,导出所有数据,创建总被引文献清单。检索人员通过“作者+年份时间段”的检索方式在SCIE数据库基本检索功能中进行粗略检索,此时的检索结果数大于等于委托人提交的文献清单上的数量,然后对照清单挑选本次所需检索的文献,在符合要求的文献前面的方格中打钩,再点击页面中的“导出”按钮,选择“其他文件格式”,记录内容选择“全记录”,文件格式选择“制表符分隔(Win,UTF-8)”,最后点击“导出”按钮,此时导出的是一个txt格式的文本文档。检索人员需要另外新建一个Excel工作表,点击工作表中的“数据”,选择“自文本”,导入前面的文本文档,即可获得被收录文献的详细记录,包括所有文献的作者、标题、刊名、出版年卷期、DOI和入藏号等信息。

值得注意的是,批量检索收录时常会存在漏检现象,陈伟认为漏检的文章可以通过“篇名专业词+作者姓+合作者姓”这种检索策略补齐被收录论文列表[8]。在第一步操作中补全总被引文献清单非常重要,因为后续的引用检索数据均要依据此工作表中的文献信息,所以在第一步中需要完善委托人文献清单以保证收录数据的质量。检索人员通过对比核实,找到漏检文献,再按照上述方法将检索结果合并到一个工作表中。

第二步:通过总被引文献工作表中的入藏号(WOS号)进行批量检索,创建引文报告,导出多篇被引文献的总施引文献数据并创建总施引文献清单。检索人员复制总被引用文献工作表中入藏号,在数据库高级检索功能中用入藏号编辑检索式“UT=( )”进行多篇批量检索,下面的数据库只选择“SCIE”,点击“检索”后在网页下方的检索结果中会显示一个数字,表示检索出多少条记录,点击此数字,网页将转至文献被收录的页面,在此页面点击“创建引文报告”,在弹出的新网页中点击“施引文献”下方的数字,就会显示所有被引文献的总施引文献记录;在网页左边选项“Web of Science 索引”中只选择SCIE数据库,点击“精炼”后,页面将显示来自SCIE数据库的总施引文献记录,再次点击“打印”即可导出总施引文献记录与引用的参考文献,最后按照第一步的方法,在上面的Excel文件中创建一个新的工作表,导入数据后获得所有总施引文献的详细信息,也就是总施引文献清单。

由于总施引文献清单中有一列CR信息,即文献的参考文献记录,而每一条参考文献都有DOI号,DOI号是数字对象的唯一标识符,具有唯一性,故保证了引用查证的准确性。另外,总被引文献清单工作表中被引文献也有一列DOI号,其特性也给引用检索提供了可能性与准确性。

第三步:检索人员通过Excel“视图”选项中的“宏”编写3个函数,分别快速显示每篇被引文献的总引用次数、排除委托人自己文章的他引次数和排除文献所有合作者文章的他引次数,此操作中的关键技术在于模拟传统手工查找方式比对两个文献清单中的DOI号是否一致及两个文献清单中的作者姓名是否出现,然后创建SCIE总引和他引统计表,快速显示每篇被引文献对应的总引次数和两种他引次数。

第四步:由相关人员根据客户要求,编写相应程序,按一定的格式自动输出报告。

3 方法实践

笔者以苏友峰委托检索的被SCIE收录的10篇文献为例演示检索过程。本次检索委托人是苏友峰,检索要求是SCIE他引次数,检索时间是2019年06月08日,委托人根据合同以Word文件形式提供自己的文献清单。

第一步:通过输入“作者(Su,Youfeng)+年份时间段(2012—2015)”在SCIE数據库的基本检索功能中进行粗略检索,再对照苏友峰提供的文献清单挑选本次所需检索的文献,在符合要求的文献前的方格中打钩,按图2—4所示的操作导出txt格式的文本文档,再把此文档导入Excel工作表,获得文献清单对应的总被引文献清单。

第二步:复制总被引文献清单中的WOS号,如图5所示,在数据库高级检索中编辑检索式“UT=

(WOS:000367284600013ORWOS:000360501800007

OR WOS:000356746500026OR WOS:00035116680

0003OR WOS:000344376300014OR WOS:0003356

28300005OR WOS:000326553300020OR WOS:000

319307100002OR WOS:000318542200015OR WOS:000312510000019)”,进行多篇批量检索,下面的数据库只选择“SCIE”,时间跨度可以选择“所有年份”,点击“检索”后在网页下方的检索结果中点击数字“10”,转至图6所示的文献被收录的页面,在此页面点击“创建引文报告”,在弹出的新网页中点击施引文献的数字“369”,如图7所示。新出现的页面显示10篇被引文献的施引文献共245条,这是因为时间显示的记录与福州大学图书馆购买的数据库相关,即此页面只会显示出本馆已经购买的数据库中的施引文献记录。当前页面左列下方的“Web of  Science索引”中只选择SCIE数据库,如图8所示,点击“精炼”后,页面显示来自SCIE数据库的总施引文献记录243条,最后点击“打印”即可导出总施引文献记录与引用的参考文献,另可按照第一步的方法在上面的Excel文件中创建一个新的工作表,导入数据后即可获得所有施引文献的详细信息。

第三步:通过Excel中“宏”选项编写3个函数,分别快速显示每篇被引文献的总引用次数、排除委托人自己文章的他引次数和排除文献所有合作者文章的他引次数,操作如图9—12所示。

第四步:根据所出报告格式,利用SCIE总引、他引统计表中的结果进行调整,把需要输出的内容从两个文献清单中取出,自动输出报告,如图13所示。

日常查收查引SCIE引用检索的报告处理一般有两种方式:第一种情况是委托人只需要看到引用次数,检索人员只需复制SCIE总引、他引统计表中的数字即可完成,在复制数字时需要特别注意表格中的“原文行号”列要与两种他引数据一一对应,以免弄错。第二种情况是委托人需要看到自己的文献具体被哪些文献引用,检索人员按“思路与方法”中的第四步进行操作即可完成。

4 结论

本研究得出以下三条结论:一是本文所示方法集合了人工检索和软件辅助检索的优势,提高了查收查引SCIE引用检索服务的效率和准确度,检索员不用再像以前一样逐篇检索被引文献的SCIE引用次数,也不用像以前一样逐个排除不符合条件的作者,且被引文献篇数越多节约时间就越多。笔者建议被引文献在10篇以上的采用此办法进行操作,可以提高工作效率,但如果被引文献只有1篇或2篇,还是采用逐篇检索更加快捷。二是本文所示方法更适合一线查收查引检索人员,因为此方法方便快捷,无须安装程序,通过简单的函数公式编写即可完成SCIE引用批量检索,不需要进行专业培训,也不需要具备较多的编程方面的知识,函数公式编写一次后可以重复使用,更能满足查收查引岗位的需求。三是本文所示检索思路也可以扩展到其他数据库的引用检索实践中,如Web of Science平台中的数据记录完整,其中的SSCI、CPCI-S、ESCI等数据库也可以运用此检索思路。

5 结语

笔者应用EXCEL数据处理的功能,模拟人工检索流程编写出相应的处理程序,从而实现了自动、批量、精准的SCIE引用检索。此检索方法的研究虽是在SCI数据库导出数据的基础上进行的,但其流程与方法也可以推广到其他数据库,只是导出的数据格式有所不同,因此要在后续的工作中实现其对所有数据库的适用,从而建立起一套高效、全面的检索系统。

参考文献:

[1] 王学勤,郝丹,郑菲,等.“查收查引报告自动生成系统”应用实践研究[J].图书情报工作,2014(16):131-137.

[2] 马芳珍,李峰,季梵,等.对CALIS查收查引系统的测试和应用效果评价[J].大学图书馆学报,2016(2):97-102.

[3] 师晓青,尉江星.基于JPS的在线查收、查引和查新检索系统的设计与实现:以山东大学(威海)为例[J].现代情报,2014(3):131-134,138.

[4] 樊亚芳,陈锴.利用Excel和EndNote Web提高论文查收查引工作效率[J].图书馆杂志,2013(1):32-34,60.

[5] 樊亚芳.利用文献管理软件提高论文查收查引工作效率的实践与应用[J].高校图书馆工作,2017(2):63-66.

[6] 张雪娟,樊亚芳.NoteExpress在论文查收查引工作中的应用[J].情报探索,2017(6):45-49.

[7] 蒋君,张玢,梅梅,等.论文查收查引工具设计与应用[J].医学信息学杂志,2018(6):61-72.

[8] 陈伟,苏婉莹,周琴.基于批量处理构建查收查引报告工作流程[J].现代情报,2018(4):130-134.

(编校:崔 萌)