APP下载

国内有关Google Scholar研究进展*

2012-10-23

图书馆学刊 2012年4期
关键词:搜索引擎检索学术

张 颖

(广东石油化工学院图书馆,广东 茂名 525000)

Google Scholar(GS)搜索是谷歌公司于2004年11月推出的直接面向科研需求、免费的网络学术资源搜索服务工具。其搜索范围涵盖了所有学术领域的高质量学术研究资料。其资料来源包括世界范围内的学术著作出版商、专业性社团、各大学及其他学术组织发表的文章、论文、图书、预印本、摘要和技术报告等学术文献。GS一经推出就受到了广泛关注,并成为学者们查找专业文献资料的首选工具,同时也成为图书馆界研究和探讨的热门话题。作者基于国内对GS搜索引擎的相关研究及应用进展,进行统计分析,为以后的研究工作提供更好的参考。

1 数据获取和采集

1.1 以中国知网中国期刊全文数据库为数据来源,统计了2005年1月至2011年11月间发表有关GS研究的文章。

1.2 采集方法:以“Google学术”为关键词,时间选择2005至今,采用模糊检索,对检索结果进行整理,剔除与主题不相符的文章,得到与主题相符的论文共67篇,见表1。

表1 2005~2011年间国内发表GS论文的数量

1.3 从表1可以看出,国内对GS的相关研究始于2005年,这一年共有3篇论文发表,占7年间发表论文总量的5%,此时的研究还处于萌芽阶段。2006年共有7篇论文发表,占总量的11%,这主要与Google公司在2006年隆重推出GS中文版有关,使得GS在国内的影响进一步增强,普及率显著提高。2007年相关的研究成果达到了最高峰14篇,占总量的21%。之后的两年中相关研究属于基本持平阶段,均为13篇,占总量的19%。到了2010年,相关的研究成果有所下降,为9篇,占总量的13%,2011年的论文统计至11月,为8篇,占总量的12%,这两年间的相关研究与前几年相比在内容上有一定突破。

2 期刊发表论文的情况分布

利用中国期刊全文数据库中的期刊导航所设置的核心期刊导航功能,筛查发表的67篇论文,被图书情报类及其他类期刊收录的情况见表2。

表2 67篇GS论文在两类期刊上的收录情况

由表2可知,有关GS的论文绝大多数都发表在图书情报类期刊上,载文量达到79%,其中核心期刊为39%,一般期刊为40%,由此可见,图书情报界对学术搜索引擎的关注程度比较高。其他类期刊载文量达到21%,这说明GS同时也引起其他领域一定程度的关注,特别是计算机技术界。

3 国内有关GS的研究文献内容分析

依据论文研究的侧重点,将7年间有关GS的研究内容分为8个类别,见表3。在此,重点对表3中的前4类进行分析。

3.1 GS的功能、特征及应用

由于Google Scholar搜索在2006年1月推出中文版,使国内业界开始广泛关注。在7年间,介绍其功能、特征、应用等方面的研究文章达到18篇,占26.9%。肖强从GS的资料来源、检索策略、检索结果显示等特征方面分析其优劣势,探讨了GS最新的发展趋势。指出GS在资料来源上主要以免费的网络学术资源,出版商或服务商的付费电子资源及与图书馆建立链接,获得他们的图书馆资源链接和查询等方面的资料为主要来源。在搜索技术上与普通的Google搜索技术相同,利用专利网页级别技术Page Pank(tm)检查整个网络链接结构,来确认网页的重要性,以确定哪些网页与正在执行的特定搜索相关,并将最相关、最可靠的搜索结果放在首位。在检索策略上主要看相关文献在其他文献中的被引用情况。此外,它还将全文、作者、出版物也纳入算法中,以保证检索结果的相关性、有效性,提高查准率。检索结果的信息中包含文献的题名、著作、摘要、出版年月、被引频次、网页搜索等。其中,文献题名隐含超级链接,可以链接到文献的摘要或全文。被引用次数给出了引用该文章的引证文献,利用这个链接可以查看引用该文献的所有来源文献,从中获得更多文献引用和连续被引用的情况。夏训明介绍了GS的概况、使用方法及用途,并进行了简要的评价。强调中国学者应早日了解并充分利用这一重要工具,为学术工作及研究服务[2]。

表3 7年间有关GS的研究统计

由于GS具有广泛搜索学术文献的简便检索方法,提供了丰富的文献信息资源,被各界人士积极推广,从而得到了进一步普及和传播,使更多用户了解了GS所具有的学术价值,让它逐步成为学者、研究人员和学生查找专业文献的首选检索工具。

3.2 GS与Web及其他引文数据库的比较

3.2.1 GS也是一个大型的引文数据库,具有自成体系的引文链接系统,可以起到与SCI相同的作用。因此,围绕引文分析的相关研究有11篇,占16.4%。董文鸳、陶慧卿选择Web of science作为与GS进行引文分析比较的研究工具,以信息科学领域的权威期刊《美国信息科学和技术学会杂志》为文献源,进行实证研究和分析。希望回答下列问题:①Web of science与GS在统计论文被引频次上存在多大差距?②以Web of science为代表的传统引文数据库存在哪些不足?③GS能不能作为引文分析工具和作为引文分析工具存在哪些问题?

3.2.2 ①Web of science对来源期刊选择严格,数据都要经过有效加工、整理,其准确度、权威性、规范化程度比较高,对期刊的收录较为完整、全面。但是,在如今的网络学术交流环境下,使其在检索范围上受到一定的限制。而GS能够统计一篇文献在不同语言数据库中的引用情况,还能反映学术期刊、书籍、预印本库、机构库、各类非联机出版物等多种类型引文情况,使得引文检索范围大大拓展,但是不够权威、稳定和规范。②以Web of science为代表的引文数据库是根据布拉福德定律及相关的评价指标选择收录了部分高质量的期刊[3],使其在准确度、权威性、规范化程度上都比较高。因此,在学术研究领域有很高的价值,是非常重要的引文分析工具。但对于普通文献而言,这种方法不能完全反映文章的被引用情况,文献之间的引证还存在较多的遗漏,这也是通过Web of science检索的文章被引频次普遍低于GS的原因之一。③由于GS在反映引用文献情况的覆盖率上远高于传统引文数据库,这也是它的优势所在。但是,GS想要成为真正意义上的学术引文分析工具,还存在不小的差距。首先,Google学术搜索对数据的更新和管理不如传统引文数据库,Web of science数据库每周更新,其中,SCIE数据库更是每周更新19000条新记录、423000条引文信息。相比而言,GS对源文献和引文信息的更新要慢很多[4]。不仅如此,GS还没有公开其收录了哪些出版商的文献资源。其次,各学科间在开放获取运动中发展不平衡,取得的成绩主要来自自然科学领域,如物理学、计算机科学、医学等学科。相比之下,社会科学开放获取还处在初级阶段。另外,开放获取信息资源的质量和知识产权问题还存在着诸多的争议。这些都影响GS成为一个权威的学术研究评价工具。实际应用中,可以考虑将Web of science及其他传统引文数据库与GS相结合,以保障引文分析的客观、准确、权威。

3.3 Google学术搜索与其他学术搜索引擎的比较

3.3.1 GS与其他学术搜索引擎的相关研究也是这一阶段讨论的重点,其中有15篇文章发表。包含这一主题的研究占总论文的22.3%。主要对其检索能力进行评价,具有代表性的是常唯的《综合性学术搜索引擎研究》,通过选择GS、scirus、BASE、Athenus这4种当前国外典型的免费综合性学术搜索引擎进行研究,分析了各自的特色。从资源覆盖范围、检索功能和检索效果进行比较,提出了当前这类学术搜索引擎存在的主要问题、资源的学术质量、检索结果的归并与去重问题、相关性排序问题等[5]。

Scirus是EIsevier公司于2001年研发的一个免费学术搜索引擎,它借助于EIsevier的资源优势,并整合了其他的学术资源,故此在生存时间、覆盖资源范围、使用的便捷性方面有着与其他同类搜索引擎不能比拟的优势。BASE是德国比勒菲尔德大学图书馆开发的一个多学科的学术搜索引擎利用挪威公司的FAST搜索和传递技术,对全球的异构学术资源的集成检索提供服务,其最大的特色是可以进行精化检索。Athenus主要是为科学家和工程师开发的搜索引擎,用于检索网络上的科学与工程方面的信息资源,它向用户提供互联网上某一学科最新、最受关注的资源集合。

3.3.2 陈鹤阳的《中文学术搜索引擎的比较研究》通过对GS、CNKI知识搜索、读秀学术搜索、百度国学、雅虎奇摩学术搜索引擎进行功能性比较分析,指出各自的特点和适用范围。从检索内容上看,使用GS查找文献资料比较方便、内容广泛,它可以搜索到全球范围内的科研信息,百度国学适用于查找国学历史方面的检索,并且提供免费的在线阅读服务,学术论文、期刊文献、博硕论文、工具书等适合用CNKI、独秀检索,会得到较为全面的文献资料,其检索结果可以和图书馆各种资源库对接,直接获取图书馆内与其相关的纸质图书书目信息,但是在获得全文时,只限定IP范围内的用户。雅虎奇摩是唯一支持繁体中文检索的学术搜索引擎。

3.3.3 从检索形式上看,GS、CNKI、读秀都支持高级检索,GS还可以根据作者、出版单位、出版日期对检索范围进行限定,CNKI和独秀则限定得更加细致、全面,百度国学和雅虎奇摩没有提供相关的检索功能。所以,有必要根据用户对文献需求的侧重点,选择更适合的学术搜索引擎。而学术搜索引擎应当通过信息过滤确保正确、可信度高的信息,提高信息资源的学术价值,解决检索结果的归并与去重问题,以达到检索结果的准确性。

3.4 Google学术搜索与参考咨询、文献传递、科技查新

图书馆需要丰富、可信度高的文献资源,为用户提供信息服务。GS具有广泛搜索学术文献的简便方法及丰富的文献信息资源,同时它过滤掉普通搜索引擎中大量无用的信息,弥补了图书馆在收藏、购买文献资源上的不足,提高了查找文献的效率。

3.4.1 GS积极推动与图书馆合作,以实现学术资源的充分利用。于2005年5月正式推出了图书馆链接服务,Google学术采纳了OpenURL协议,当图书馆拥有了基于OpenURL协议链接服务器的时候,用户就可以将GS设定为链接源资源。当搜索结果显示是图书馆所购买的资源时,可以看到图书馆的链接标识,点击这个链接标识就可以引领读者查看拥有权限的本馆购买的相关资源,这项服务是免费的[6]。而GS的图书馆链接计划,是用户通过链接软件,实现从引文到全文的链接功能。当GS结果显示为图书馆资源的一部分时,可以看到GS检索结果后的链接标识,链接到本馆购买的全文资源上,解决了GS“合适版本”的问题。

3.4.2 文献传递服务是图书馆参考咨询服务工作的一项重要内容。将文献传递服务加入到GS“Library Link”计划,在检索结果中形成文献传递服务的链接,用于推广图书馆文献信息服务,提升图书馆文献资源的可见度和利用率,彰显图书馆服务形象具有重要意义。

3.4.3 科技查新是图书馆参考咨询服务的重要组成部分,其目的是为了求证所查找的研究项目在国内外有无相同或类似的研究,对所查新的科技项目进行综合对比分析,对查新项目的新颖性给出结论[7]。GS是一个大型免费网络检索数据库,提供的基本检索界面有一个检索框,高级检索界面则有多个检索框。用基本检索界面进行查新时,可以直接录入检索词,获得与检索词相关的文献,有部分文章可以直接获得原文下载。要想精确获取某一篇文章,可以在检索框内录入文章篇名,但是有可能出现文章标题相同的情况。而高级检索界面可进行字段限定,提供了包括关键词、作者、出版物名称、出版日期及结果显示。按作者、出版物名称、出版日期等字段检索可以缩小检索范围,更有针对性地检索所需要的相关文献。GS高级检索界面还有4个检索框,用于查找文献的匹配方式“包含全部的词语”(AND)、“包含确切的词语”、“包含至少一个字词”(逻辑或、OR)、“不包含字词”(NOT)。对检索词出现位置进行限定与词组检索,排除无关的文献,达到精确检索的目的。利用它进行查新检索时,比传统的专业检索数据库得到的信息资源内容更丰富、形式更加多样,在查找专业文献和获取原文方面都具有独特的优势。尽管检索结果中会偶尔出现少量无关信息和查全率低的情况,但是GS依然是一个免费、自由、简便、巨大的学术资源整合数据库。

4 结语

GS具有资源来源广泛、学科覆盖面广、专业性强,检索方法简便、功能强大和共享性的优点。它另一大亮点是提供了引文链接服务,为科研引文分析提供了一条新的途径。近年来,用户被搜索引擎的海量信息和易用性所吸引,把GS作为查找资料的首选。在对哥伦比亚大学的调查中表明:教师、学生开始青睐网络信息,90%的被调查者认为网络信息有助于科研。OCLC 2003年度报告证实,许多学生开始利用网络信息开展学习和研究[8]。

目前,GS搜索引擎在国内的相关研究主要围绕着检索功能、检索能力、引文功能、对图书馆的影响、对策等方面。在这些方面尽管也取得了一定的研究成果,但是在研究的深度和广度上还不够,特别是如何借助GS的技术优势提升图书馆的服务水平方面涉及较少。可喜的是已有研究者利用GS辅助来分析、评价期刊的学术影响力。针对GS存在的问题,如在资源的学术可信度问题及资源的更新滞后、海量资源的归并与去重问题和网络资源的不稳定性等,及如何正确指导用户应用好这一重要工具等相关研究还比较少。因此,如何从深度和广度上利用好GS搜索引擎,提升图书馆的各项服务,是我们今后应该重点关注和研究的内容。

[1] 肖强.Google Scholar搜索引擎特征研究[J].图书馆学研究,2008(6):39-41,45.

[2] 夏训明.Google Scholar的利用与评价[J].图书馆建设,2006(5):97-99.

[3] 董文鸳.数字时代的引文分析——基于被引频次分析的实证研究[J].大学图书馆学报,2007(2):36-39.

[4] 陶慧卿,潘卫,庄奇.从引文分析的角度比较GoogleScholar与Web of science的优势与不足 [J].图书馆杂志,2008(12):29-35.

[5] 常唯.综合性学术搜索引擎研究[J].大学图书馆学报,2007(2):73-78.

[6] 孙博阳.Google学术搜索工具及其在我馆的应用[J].大学图书馆学报,2007(2):79-82.

[7] 夏旭,等.试论科研项目的查新评价[J].情报理论与实践,2011(5):63-65.

[8] 夏旭.基于Google学术搜索的引文检索研究[J].情报理论与实践,2006(6):697-701.

猜你喜欢

搜索引擎检索学术
如何理解“Curator”:一个由翻译引发的学术思考
2019年第4-6期便捷检索目录
对学术造假重拳出击
专利检索中“语义”的表现
网络搜索引擎亟待规范
基于Nutch的医疗搜索引擎的研究与开发
广告主与搜索引擎的双向博弈分析
学术
国际标准检索
国际标准检索