面向深度学习的数字图书馆网络知识发现服务模式研究
2020-07-10闫娟
闫 娟
(临汾市尧都区图书馆,山西 临汾 041000)
1 深度学习技术的概念和特点
1.1 深度学习技术
“深度学习技术”的概念于2006 年被首次提出,主要是指通过人类思维的方式为解决特征提取问题提供途径,已成为机器学习的重要分支领域。深度学习技术通过借鉴大脑神经网络构建相应的学习模型,依托计算机技术处理更加复杂的异构数据,并通过逐层建模的方式获取相应的特征信息,实现信息获取、信息计算的智能化。 该技术的优势是能够实现对复杂数据的抽象概括,解决了文本处理、特征提取、信息匹配等诸多问题。
1.2 深度学习技术的特点
深度学习技术主要依托多层感知器模拟大脑的思维模式,处理文本、图片、视频等多种类型的信息,具有自动筛选、自动处理、自动描述无标记数据的特点[1]。 大数据时代背景下,网络世界中包含着海量信息资源,而传统的机器学习方式只能获取既有的数据。 将深度学习技术应用到信息数据筛选过程中,能保证所获取的数据更符合用户需求,数据计算更加准确。 深度学习技术主要模拟人脑的神经连接结构,在数据和数据之间能够形成多个层,每一层代表不同的数据运算。 在不同层级中的数据活动主要依靠计算机进行智能化处理,不需要人工参与。 整个系统通过自主学习能够获取相应的数据特征,描述不同数据的分布状态,并对无标记数据添加标签,应用非线性的方式开展逐层抽取计算,最大限度地挖掘深层次数据的价值。
2 深度学习技术在数字图书馆知识发现中的作用
2.1 提高数字化资源的整合效率
网络世界中大多数有价值的信息数据主要以孤立的形式存在,很容易形成数据孤岛[2],在很大程度上影响了数字图书馆的知识发现难度,增加用户获取相应知识的成本。 通过将信息技术运用到数字图书馆知识发现领域,可以利用深度挖掘技术,根据不同层次提取相应的特征信息,挖掘不同层次网络资源之间的联系性,从而将挖掘得到的各种散载信息进行有效串联,并按照统一化的语义关系进行描述,为提高资源整合度和资源利用效率提供帮助。通过应用深度学习技术,不仅能够显著提升数字图书馆信息检索、信息整合的工作效率,而且能够使各项数字资源被用户更好地利用,降低知识发现成本。
2.2 提高知识辨析认知层次
深度学习技术主要是模拟人类大脑的思维模式,能够对网络世界中的各种信息资源进行高效整合和深度挖掘整理,并实现信息的快速传输,改变了传统图书馆的知识发现服务模式。 通过对特定的资源进行特征性的描述,将各个资源之间的联系性进行有机统一,能够将网络世界中的各种单一数据转变成一个完善的知识服务体系,能够为不同用户提供不同的信息,满足他们的诉求,同时还能结合不同用户的实际需求,构建有针对性的网络知识体系。深度学习技术的进一步应用拥有了更加强大的自主学习能力,通过利用网络世界的各种应用和语言设计,实现对网络世界中各种有价值的信息进行精确描述、高效转化和高速传递,促进各种数字化资源的高效融合[3]。 应用深度学习技术能够最大限度地提升数字化图书馆的知识发现服务范围和服务层次,优化用户的信息利用途径和方式。 此外,应用深度学习技术还能通过不断搜集、整理不同用户群体的信息获取方式和信息需求,模拟出不同的用户需求结构,为他们提供更有针对性的信息服务,使图书馆的馆藏资源得到高效利用,实现数字图书馆与用户需求的最佳匹配。
2.3 拓展数字化图书馆数字资源服务功能
将深度学习技术应用到网络知识发现服务中,能够从海量的网络信息资源中以自动获取的方式,克服信息资源非线性化的缺点,提升数字化图书馆网络信息资源的整合能力和效率,促进有价值信息资源的相互联系,实现对网络资源的高效利用,方便用户利用统一的数字检索接口查找自己想要的文献资源,使图书馆的传统信息资源和网络信息资源整合成为一个有机整体,便于用户获取信息。 在数据资源处理过程中,利用深度学习技术能够实现对海量网络资源的统一化处理,并将处理后的数据信息储存到相应的数据表格中,转换为符合数字图书馆信息资源输出要求的元数据,实现对网络信息数据的挖掘和汇总,为今后的网络知识发现服务、知识开发奠定基础[4]。 由此可以看出,深度学习技术的应用能够进一步加强网络世界中各种数字化资源的联系,提升资源的整合效率,同时也能拓展数字化图书馆的服务功能。 基于深度学习技术的网络资源预处理流程如图1 所示。
3 面向深度学习的数字图书馆网络知识发现服务模式
3.1 知识聚合与发现
大数据时代,网络中拥有海量的数字资源,为了能够为用户提供多样化的网络信息资源,更为了方便用户利用数字图书馆的各种检索工具获取自己想要的信息资源,图书馆在构建数字化图书馆的过程中,要对网络中的各项数据资源进行有效的汇总和整理,制订科学的分类标准,并结合用户的阅读需求和信息利用需求实现知识的有效组合,使图书馆的网络知识发现服务更加全面,服务更有针对性和专业性。 在网络信息资源开发整合过程中,图书馆会借助自组织映射机制、深度神经网络结构,根据上述两种模式设置不同种类的训练集,实现对网络中各种资源的初步分门别类[5];构建内聚中心,将各个门类当中的信息按照一定的原则串联起来,并结合相应的计算方法,对整个中心当中的数据进行统一化处理,获得相应的权值,分析不同种类、不同知识之间的内在联系和逻辑关系,将不同知识进行有效串联;利用模糊均值自主映射方式,获得经过系统处理且能够识别的知识单元,形成知识点拓扑图谱[6]。
图1 基于深度学习技术的网络资源预处理流程
3.2 知识呈现与评价
图书馆在开展网络知识发现服务过程中,要引导用户利用现代化的检索技术手段和检索设备,实现数字化资源的高效检索和可视化操作。 图书馆需要在系统中嵌入多种知识发现软件,从多个方面向用户呈现知识发现的全过程。 在实际应用过程中,整个知识发现过程主要依据映射原理,对网络中的信息资源进行有效整合、筛选,形成清晰化的图表,用户可以在可视化操作界面上挪动鼠标、点击连接,获得相应的知识。 另外,图书馆还可以借助多种载体将整个知识发现服务过程记录下来,并以调查报告、调研报告、示范方案等多种形式向用户呈现出来,保证他们在知识获取过程中更有立体感。 在开展网络知识发现服务过程中,做好服务评价工作是保证数字化图书馆网络信息资源有效获取与融合的前提,这项工作应由专业人员和用户共同参与完成[7]。 图书馆应邀请相关领域的技术人员和专家及用户群体对知识发现过程进行全方位评价,并结合用户需求对整个系统进行调整。
3.3 构建知识网络
图书馆利用深度学习技术开展网络知识发现服务的最终目的,是解决知识管理过程中存在的工作效率低下、知识发现不深入、知识之间联系不紧密等问题,不断提高用户对服务的满意率。 通过应用深度学习技术开展网络知识发现服务,能够实现对数字化资源语义关联和深度的有效聚合,解决传统知识发现服务存在的多种弊端,消除因跨领域、跨学科所导致的鸿沟,形成一套更加完善的知识服务体系[8]。 该体系所形成的服务内容、服务方法和服务技术能够提升数字化图书馆网络知识发现服务的范围,为知识高效检索、针对性推送、科学评价提供支撑,有利于扩大数字化资源的共享范围。 深度学习技术在数字化图书馆网络知识发现服务过程中的应用能够实现不同领域、不同层次的知识有效链接,构建完善的语义地图,帮助用户更好地发掘信息和利用信息,实现信息资源利用的可视化操作,提高图书馆资源的利用率。