APP下载

数字图书馆检索工具的若干研究

2014-04-16任玉珍

中国科技纵横 2014年3期
关键词:搜索引擎资源库检索

任玉珍

(烟台大学图书馆,山东烟台 264005)

数字图书馆检索工具的若干研究

任玉珍

(烟台大学图书馆,山东烟台 264005)

随着信息化时代的发展,数字图书馆的建立与发展是大势所趋,信息的发展带来的网络信息的繁荣。随着社会的发展,传统的人工标引方法已经不适用了。因此,必须要改变传统的引擎技术,并采用相关的技术对信息资源进行分类,从而能够有效改善数字图书馆发展。

数字图书馆 检索工具 搜索引擎

数字图书馆一词主要是从Digital Library中翻译过来的。二十一世纪进入了高科技经济时代,随着社会的发展,计算机、信息以及网络技术也得到不断的发展,信息高速公路和信息技术革命,进一步促进图书馆向自动化和数字化方向发展。如何利用数字图书馆自身资源,向用户提供更加安全、优质的服务,是本文主要探讨的问题。下文对数字图书馆的特征进行分析。

1 数字图书馆的特征

一般来讲,数字图书馆主要是数字信息库的体现,它主要具有以下几个特征:

1.1 信息资源的数字化

信息资源数字化是数字图书馆的基本特征。这与传统的图书馆有着非常重要的区别。数字图书馆信息储存的形式主要通过纸质文献转换成数字化文献,从而能有效改变现实的储存空间,更加有利于人们的阅读。

1.2 信息传递的网络化

网络的不断发展,为数字图书馆之间的联系奠定了坚实的基础,有利于打破纸质文献的局限性。通过数字图书馆,人们可以对图书进行跨库搜索,在短时间内有效实现了信息传递之间的距离。此外,它具有非常丰富的数字化资源,包括全文数据库、网络信息资源库、OPAC书刊目录库、多媒体数据库等。这些数据库都能够有效提高检索的效率和质量。

1.3 信息共享化

由于数字和网络化的不断发展,能够有效实现地域之间的联系,文件之间的共享。任何人都可以通过对图书馆进行资源的共享和利用。

1.4 信息知识化

数字图书馆能将图书、期刊、数据库、网页等载体上的信息进行链接,并以动态的形式提供相应的服务。与传统的图书馆相比,数字图书馆不仅能对图书进行准确的查询,还能够与相关的知识内容进行链接,方便读者知识的搜索。随着信息化知识的不断发展,信息提供变得更加丰富。

根据上述的几点描述,表明我国目前数字图书馆已经得到了一定的发展,数字图书馆的资源内容已经非常丰富了。在目前社会当中,很多公立图书馆,其媒体信息和资源库方面的建立有着非常明显的进步。然而,在发展的过程中,数字图书馆也不可避免地出现着各种问题,下文进行详细的分析。

2 国内数字图书馆的发展现状

目前尽管数字图书馆不断发展,但数字图书馆并没有被赋予一个完整的定义。其形式也表现出多种情况,其中包括数字资源系统、网上书店等。随着社会的发展,我国的数字化图书馆得到了不断的发展,不断丰富了网络信息资源和学术资源,为用户的检索提供了方便。

然而,这样丰富的资源,却往往缺乏了对信息的管理和组织。

第一,信息过多。由于用户寻求的信息过多,在大量的信息当中,用户经常会在信息当中迷失方向。

第二,信息的类型多种多样。除了文本信息之外,数字图书馆信息还具有音频、视频等方面的信息,这些信息的管理需要管理人员具备一定的专业水平。

第三,信息更新速度较快。由于信息更新的速度较快,并具有较强的实时性,因此,必须抛弃原有的人工标引工作。

3 数字图书馆工具建设设想

图书馆检索工具是在网络信息资源以及数字图书馆信息资源利用和检索的基础上,通过构建完整的检索平台,将各种信息进行检索。建设数字图书馆,首先需要对网络信息资源进行全面搜集,并进行有效利用。本文主要针对如何在数字图书馆建设的过程中利用相关工具,对网络信息资源进行分类和标引。

3.1 搜索引擎原理

搜索引擎是人们使用到最重要的应用之一,在如此繁多的因特网信息中,人们能利用搜索引擎找到自己所需要的信息,因此该原理受到了人们的喜爱。然而,目前搜索引擎最大的缺点就在于引擎并没有经过人工干预,因此搜索得出的信息质量往往不高。为此,应该将引擎与人工检索相结合,从而更好地对信息资源进行组织。

举个例子,目前雅虎在信息检索方面具有较为丰富的经验。其主要的分类是采用人工标引的方式进行,从而能有效提高信息检索的精确度,为用户提供更多更好的服务。图书馆工作人员在长期的工作过程中,积累了丰富的图书资源分类经验,从而为信息资源的分类作出了重要的贡献。但是目前仅靠这样的人工标引方式是不正确的,必须要结合信息检索工具。

3.2 图书馆检索工具分析

除了上述的搜索引擎之外,图书馆检索工具还应该包括图书馆独立的检索平台。图书馆检索工具是一种基于网络资源和素质的信息资源库,为用户提供不同类型的检索系统。下文进行详细的分析。

3.2.1 网络收集功能

图书馆独立的检索工具,能够有效利用外界的搜索引擎将信息进行收集和过滤。这种过滤方式主要将人工编制的目录进行储存,并收入网络信息资源库。其主要功能包括:

第一,跨图书馆进行检索。用户可以在检索的过程中选定多个资源库。在择资源数据库的时候,将以往的检索方式运用到不同资源库的信息检索当中。

第二,支持全文检索。全文检索是一种新兴的检索方法,进行搜集时,遇到任意一个网站的时候,检索工具可以将网络信息进行标引,并储存到信息资源库上。用户可以通过搜索相应的关键字,从而找出匹配的结果。

第三,提供多种途径进行检索。用户可以进行自然语言、关键词等方面的检索,检索工具还能够将具有检索意义的词语进行保存,为用户提供更加方便准确的检索结果。

第四,多媒体检索。在提供检索的相关资源上,对文本信息进行服务检索,检索的对象可以有图像、声频或视频。

第五,目录分类结构。该结构有利于非专业用户进行检索。举个例子,某高校图书馆的分类项目非常广泛,除了具有网络资源之外,还会在高校图书馆的收藏中进行资源的数字化服务。

3.2.2 结果显示功能

除了具有网络收集功能之外,检索工具还具有结果显示功能,其主要体现在于,数字图书馆可以按照时间先后进行排序,用户也可以对相关排序进行选择。当检索的关键词符合越多,其在文章中出现的次数也就越多,则表明了该内容与客户检索的内容相符程度越高。

3.2.3 结果显示格式统一

数字图书馆系统必须使用统一的检索局面,对检索的结果进行分类和分层次分析。当用户搜索之后,显示的结果要对符合的题录或关键词、甚至将摘要信息进行标记。用户在浏览题录后,再进一步选择是否需要下载全文。

3.2.4 超文本链接

在显示结果当中,要对全文的一些主题词提供相应的超链接,让用户能通过这些超链接进行更多知识的了解。其中包括以下两个方面。

第一,搜索和链接。当用户输入相关网址之后,若没有限制的话,则会出现成千上万个网址,这样的搜索是非常麻烦的,非常浪费时间。因此,检索工具应该要进行过滤,对不必要的网址进行过滤,从而将检索的结果精简化。在工作的过程中,工作人员可以对原始网址的源文件进行读入,若发现具有符合要求的格式,则进一步检查网页的元数据是否已经存入数据库当中。并在有需要的数据库当中加入新的网址或元素。然后,工作人员要将其中一个网址去除,并对网页中的元数据和链接进行搜索。整个过程周而复始,直到能将地址队列中的网址都搜索完毕,在搜索完毕之后,通过人工进行选定,将有效的数据规定在一定的范围之内,从而建立超链接。

第二,索引和检查。因特网的任何网页都符合检索的内容和范围之内,应用检索技术对相关关键词进行分析和记录,工作人员将检索的记录进行检查,并确定检索的记录是否符合标准,并将其添加到资源库当中。此外,在检索的过程中,还应该对检索工具进行标记,从而显示出检索的结果。

4 结语

本文通过对网络搜索引擎技术,对建立数字图书馆检索工具提出几点设想和建议。除了检索工具要进一步发展之外,还应该建立信息丰富的资源库,从而使图书馆的结构模型不断构建和完善,以此作为支撑,在开发数字图书馆工具的过程中,工作人员必须要注重结构的兼容性、公共性等。此外,图书馆检索工具还应该不断更新发展,从而与外界的搜索引擎和其他程序开发商的程序相结合,在坚持搜索原则的同时,必须要加强检索信息的描述和交流。

[1]沈素梅.数字图书馆检索工具探析[J].内蒙古图书馆工作,2009.06.02.

[2]全涛.数字图书馆检索工具初探[J].科技创新导报,2008.06.18.

[3]段其宪,时永梅.网络检索工具的比较研究[J].情报科学,2008.03.06.

[4]王小兰.浅析数字图书馆检索工具及其功能[J].江西图书馆学刊,2007.32.01.

[5]刘迎红.浅析数字图书馆的特点与功能[J].现代企业教育,2006.03.09.

任玉珍(1964.06.19),女,汉族,山东省烟台人,本科,馆员,主要研究方向(或工作方向):图书馆管理、图书情报。

猜你喜欢

搜索引擎资源库检索
贵州●石斛种质资源库
2019年第4-6期便捷检索目录
高中历史信息化教育资源库应用探索
福建基础教育教学资源库建设研究——以福建基础教育网资源库为例
专利检索中“语义”的表现
网络搜索引擎亟待规范
Nutch搜索引擎在网络舆情管控中的应用
基于Nutch的医疗搜索引擎的研究与开发
广告主与搜索引擎的双向博弈分析
国际标准检索