数字图书馆网络信息资源建设研究

2021-02-18郭周

科学与生活 2021年30期

关键词：网页数字图书馆

郭周

摘要：本文立足于数字图书馆特点的基础上，将书目资源的数字化和信息来源的过滤，以及图书馆网站的设计进行了集中分析，并对基于智能数据处理的数字图书馆网络资源建设方法进行了详细的探讨与研究。

关键词：数字化图书馆、网络信息资源建设

1. 基于数字图书馆网络信息资源的建设机制

1.1制定数字图书馆信息资源的发展政策

数字图书馆的馆藏机构进行收集、整理、分类、编目、标注的网络信息资源，应当按照馆藏信息资源库进行开发和利用。在此过程中需要制定一个标准化的发展政策，并用于收录传统的文献信息资源。目前国内的大多数图书馆还没有制定出发展网络信息资源馆藏的政策，因此，为了更加系统有效地收集、整理、编目、标注网络信息资源，数字图书馆的信息资源建设显得尤为重要。

1.2数字图书馆信息资源内容质量评价

数字图书馆由可识别的元数据资源组成，并且对相关资源提供了不同属性的描述。元数据定义了数字图书馆资源信息的结构和数字对象的结构，然后再由数字图书馆的数据处理系统组合成资源库。这其中不仅包括了元数据格式、元数据标准、元数据系统、元数据应用上下文、元数据记录系统等，还覆盖了元数据的语义规则和元数据扩展机制。在元数据标准的基础上，SCS的基础可以与扩展机制相适应。根据扩展机制，数字图书馆的信息资源内容可以采用元数据应用方案：中文名稱、标识符（唯一的元素标识符）、定义（元素概念的描述）、选择性（要使用或可选的元素的描述）、数据类型、最大频率范围（元素值的范围），注释（附加元素描述、输入格式建议等）。

1.3数字图书馆信息资源的运行环境

Web服务是近年来发展起来的新一代Web技术。它是W3C创建和组建的，从而实现程序之间平台之间的通信。Web服务平台是一个标准的类型系统。将这些标准协议XL、UDI、WSDL、soap、HTTP等都基于XML。跨平台格式和编程语言是基于XML的web服务的基本属性，使得在不同平台上运行的应用程序能够交换和传输信息，并提供更多的交互空间。对于外部用户，web服务是对象组件，设计者可以优化设计，该系统模块化、可重用。每个业务逻辑都被开发成独立的web服务。同时，web服务采用基于XML的基于HTP标准协议的soap协议，web服务体系结构是一种面向服务的体系结构，即面向服务的体系结构（service-orientedarchitecture）。

2. 电子信息资源组织与网络导航

2.1书目资源和馆藏资源的电子化

在构建电子信息工具时，必须注意信息的采集、处理和分析，包括传统采集的数字化。计算机化和网络化进程的主要任务是收集广泛的数据和建立数据库。企业管理数据、咨询用户档案等信息数字化可以减少存储空间，方便使用者进行远程查阅，使文字阅读更方便。

信息资源成为网络资源，以改善和优化信息的组织方式，提高获取和传播信息的速度。定期出版物、缩微胶片材料、文件、电影和其他媒体出版物。外部媒体包括外部电子图书馆、资源，摘要、全文信息、书目服务的数字信息、电子杂志和电子报纸。信息数字化的过程必须标准化。标准化是相互传输和接收在线数据、理解、合作和共享共同知识的基础和前提。

2.2数字图书馆网络资源的主页设计

充分利用计算机技术，将图书馆主页作为用户与图书馆交流的场所和文献信息资源利用的窗口。在主页上，要重点关注数字资源、网络综合信息资源、专业分类信息资源和特定学科的文献信息资源，发挥信息导航作用。图书馆网页需要将图书馆局域网接入互联网，通过互联网共享各图书馆的资源，利用互联网上丰富的动物信息资源，为读者提供各种信息导航服务。学科导航数据库的网页设计应强调学术艺术性和界面友好性。学科导航系统的设计水平直接影响着导航系统的整体利用率和功能。因此，主题导航页面的设计应满足以下基本要求。

（1）易用性：主题导航系统的网页需要详细说明收费问题、原始请求方式、用户对资源的访问等

（2）分类法：由于与主题相关的资源较多，因此需要对所有信息源进行科学分类，使读者能够顺利找到所需资源。

（3）易用要求：尽量使用通用技术制作主题导航页面，不要使用占用大空间的图片来改变配置和型号。另外，要采用新技术、新设计来加强网页功能，注重技术更新。

（4）智能网页：网页需要一些功能索引、目录和搜索系统（搜索引擎）来帮助用户快速找到所需网页中的信息，智能化网页作为一个发展方向应该发挥更大的作用。

（5）网页子框架的显示：网页制作的每一页不宜过大，而过大的网页必须用超文本技术向网页添加超文本链接，这会对下载速度造成严重的负面影响。同时，也不要把最好的页面在首页制作得很大。

3.智能信息处理

3.1专题资源建设的总体结构

基于智能数据处理的数字图书馆资源开发由三个部分组成：资源收集、资源管理和资源管理，智能数据处理和信息存储。系统资源来自自动网络资源检索模块收集的数据和其他资源转换的数据，此类资源也应分类并自动汇总。经过处理的信息，包括元数据和对象数据，以一定的策略维护系统的资源数据库，并提供个性化的信息服务，如根据资源分类等信息进行资源延迟和用户获取。

3.2网络资源的自动搜集

网络资源的自动搜集可以使用互联网搜索引擎从互联网上收集信息。在这一过程中，系统管理员必须为每个主题资源定义搜索范围、输入和搜索规则，并为每个链接定义搜索规则和筛选规则。然后，从一组URL开始，程序自动跟踪URL中的超链接，并开始在web上搜索宽度、深度或启发式方向。互联网在这一过程中，首先需要从网站上抓取网页，然后利用索引程序对网站进行采集，并从网站上获取相关信息，并建立相关的索引数据库。在此基础上，还需要对排序数据库索引进行搜索。当用户输入关键字时，搜索系统程序将搜索网站索引数据库中的关键字，以匹配所有相关的网站关键字，并将内容摘要发送给需要的用户。

3.3信息过滤

收集到的信息可以使用多种信息过滤机制进行过滤，如关键字（或其逻辑组合）、内容相关过滤、源代码过滤等。过滤后的信息原则上是具有实际内容的有价值信息，必须对其进行进一步处理，这其中主要包括分类、汇编摘要等信息资源。同时，还需要根据文本的内容，自动文本分类应能将文本分配给一个或多个现有类别，分类的方法是根据每个文章样本所获得的信息，总结和分析学习分类的规律。

4.结束语

以数字图书馆为例，它在信息资源、信息更新频率、信息内容范围等方面具有极大的优势，可以直接或间接的向使用者、信息服务对象提供数字化阅读服务。数字图书馆信息资源的研究方向是实现动态、灵活的信息环境，获取信息的过程，并且集成和连接大规模分布式信息网络，实现基于各种关键信息的协作，使读者共享可能的应用领域和环境知识。

参考文献：

[1]刘晓波.网络数字环境下高校图书馆信息资源建设探析[J].信息与电脑（理论版），2020，32（20）：249-250.

[2]张赟. 互联网时代公共图书馆的服务创新研究[A]. 上海图书馆（上海科学技术情报研究所）.图书馆新时代：坚守、转型、颠覆——第十届上海国际图书馆论坛论文集[C].上海图书馆（上海科学技术情报研究所）：上海图书馆（上海科学技术情报研究所），2020：4.

[3]冯畅.数字图书馆信息资源建设中的网络知识产权保护及对策研究[J].农业图书情报学刊，2016，28（11）：67-69.