APP下载

基于知识图谱的数字档案服务模式探究

2023-10-18周程戴贵奇周卓畅方锦云王兰芳

兰台内外 2023年26期
关键词:服务模式知识图谱

周程 戴贵奇 周卓畅 方锦云 王兰芳

摘 要:我国数字化政务档案馆建设进程不断提升,各级档案馆、机关单位和企业都在大力开发数字化政务档案资源,如对红色档案的分析挖掘。开发数字化政务档案资源不能局限于传统档案简单电子化,而应同时注意挖掘档案所包含的知识内容及各档案间的知识关联。本文结合实际工作经验,通过文献分析数字档案服务缺陷,汇总当前档案服务工作存在的诸多不足之处,进一步完善数字化政务档案知识图谱框架流程,形成以流程图的形式展示,将多种类型的数字档案文本转化成计算机可以理解的数据,提高计算机智能化识别水平,达到整合资源,开发档案的内在价值,以服务于当前的政务工作,提高档案服务的整体地位。

关键词:知识图谱;数字化政务档案;服务模式

一、知识图谱概述

1.知识图谱概述

知识图谱是指用图论、逻辑学等理论方法,将大量的实体、概念和关系表示为有向图或无向图,并对其开展结构化的建模和管理,从而形成一种可被计算机理解和处理的知识表示形式。知识图谱的发展可以追溯到20世纪70年代,直到谷歌在2012年推出知识图谱,才引发了业界的广泛重视和探索。目前,知识图谱已成为人工智能、自然语言处理以及智能推荐等领域中的热点技术,并被广泛应用于搜索引擎、社交网络和智能客服等场景中。在发展现状方面,目前知识图谱的主要挑战包括:

(1)知识获取困难、数据源不稳定、信息质量和准确性难以保证。

(2)知识融合复杂,不同领域的知识之间存在误差、不完备和不一致性。

(3)知识表示不全,某些复杂的概念和关系难以被简单的图结构所表达。未来,随着技术的不断进步,知识图谱的发展将趋向更加全面和深入,应用场景也将逐渐扩大。同时,知识图谱的开放性和共享性将成为重要的发展方向,不同领域的知识资源将得到更广泛的利用和传播。

2.知识图谱与数字化政务档案服务的关系

数字化政务档案服务是一种将纸质档案数字化、管理和存储的服务,旨在提高档案的可访问性、可持续性和安全性,而知识图谱则是一种将各种知识信息结构化、分类和联通的方法,将数字化政务档案服务和知识图谱相结合,可以实现更加高效、精确和个性化的档案管理和利用。具体来说,通过将数字化政务档案中的各种信息分类、标注和关联,可以建立起一个包含丰富元数据和复杂关系的知识图谱,从而方便用户精准检索、智能推荐和知识发现。例如,数字化所在地区的红色文献和历史纪录片的所有素材,建立出数字化政务档案后,再标注和关联其中的人物、事件、时间和地点等元素,最终形成一个红色历史知识图谱。用户可以通过输入某个人物或事件的名称,快速查找相关素材的同时,还可以通过图谱展示了解不同时期、不同地点的历史背景和发展情况。因此,数字化政务档案服务与知识图谱的结合,可以为用户提供更加智能化、便捷化的档案管理和利用方式,从而实现知识的更好传承和应用。

3.知识图谱在数字化政务档案服务中应用的意义

知识图谱在数字化政务档案服务中的应用具有极大的意义和价值,可以提高档案信息的管理效率、可访问性和可持续性,也为用户提供更加便捷的服务体验和更好的知识管理方式。首先,提高档案信息的精准性和准确性。通过标注和关联数字化政务档案中的元素,可以建立一个知识图谱,提升档案信息的精准度和准确性。用户在检索和利用档案时,可以通过知识图谱获取更加准确的信息,并快速找到所需资料。其次,改善信息的可访问性和可持续性。知识图谱帮助数字化政务档案服务构建了一个结构化的档案体系,在其中添加了元数据和關系,从而使得不同类型的档案信息能够被轻松检索、组合和关联。这不仅提高档案的可访问性,也增加档案信息的可持续性。再次,实现档案信息的智能推荐和知识发现。知识图谱对档案信息语义化和结构化处理,使之形成一个复杂的知识网络。在此基础上,可以实现档案信息的智能推荐和知识发现,帮助用户更好地发掘档案信息的价值。最后,增加数字化政务档案服务的附加价值。知识图谱的引入可以增加数字化政务档案服务的附加价值,提高用户对服务的认可度和信任度,也为服务提供商带来更多商业机会和收益。

二、基于知识图谱的数字化政务档案服务框架构建

1.知识抽取层

清洗、过滤和归一化处理数字化政务档案中的各种信息,使其更加符合知识图谱的建模需求。识别数字化政务档案中的各种实体,包括人物、地点、时间等。基于自然语言处理技术和机器学习算法,将这些实体识别出来,并存储到知识图谱中。基于自然语言处理技术和规则匹配方法,从数字化政务档案中抽取出各种事件及其相关信息。例如,对于历史档案而言,可以从中抽取出历史事件的时间、地点、人物和原因等信息,并存储到知识图谱中。通过自然语言处理技术和知识表示方法,抽取数字化政务档案中的实体和事件之间的关系,并建立相应的关系模型。例如,将某个人物与某个事件关联,以及该人物在事件中所扮演的角色等信息。在将数字化政务档案信息整合到知识图谱中后,需要交互优化知识图谱,包括优化图谱的展示、查询、推荐等方面,使用户可以更加方便地利用数字化政务档案信息。这一层的主要作用是将数字化政务档案中的各种信息进行语义化和结构化处理,从而为知识图谱的建立提供有力支撑。同时,该层还可以实现知识的精准检索和智能推荐,提高数字化政务档案服务的价值和竞争力。

2.图谱构建层

该层通过采集、整理、清洗和标注数字化政务档案中的数据,为后续的知识图谱构建提供可靠的数据基础。基于自然语言处理和机器学习技术,识别和分类数字化政务档案中的实体,并提取实体之间的语义关系,形成初始的知识图谱结构。然后,通过知识融合和推理,整合和扩展不同来源的知识,生成更加完善的知识图谱,提升图谱的质量和价值。编码和表示知识图谱中的实体、属性和关系,并基于图数据库等技术实现知识图谱的存储和管理。通过持续的数据更新和知识维护机制,保证知识图谱中的信息是最新、准确和完整的。通过以上步骤可以构建一个高质量、大规模、可扩展的数字化政务档案知识图谱,为上层应用提供需要的数据和基础。同时,该层还可以通过不断优化和改进知识图谱的构建方法和工具,提高知识图谱的效率和准确性,增强数字化政务档案服务的智能化和个性化程度。

3.图谱更新层

从各种渠道和方式收集数字化政务档案的更新数据,包括新增、修改和删除等。筛选、去重、纠错和标准化等处理采集到的数据,以保证数据的质量和准确性。将处理后的数据转换成可识别和处理的格式,如RDF、OWL、JSON-LD等,并融合和整合已有数据。通过规则引擎、本体推理和机器学习等技术,对已有数据进行推理和更新,以获取更加丰富和精确的知识信息,使用自然语言处理、图像识别和语音识别等技术,补充和完善数字化政务档案中暂未收录的信息。审查和核实更新后的数据,以保证更新数据的真实性和可靠性。将更新后的数据保存到相应的数据存储系统中,以备下一次的更新和使用。

4.图谱应用层

利用图谱的语义能力和关联性,提供精准和智能化的数字化政务档案检索服务,使用户可以轻松找到所需的信息,并根据用户的需求和偏好,借助图谱的推理和分析能力,为用户推荐相关的数字化政务档案内容和知识点,提高用户的信息获取效率和质量。通过采用图谱的关联分析和可视化分析等技术,深入挖掘和分析数字化政务档案中的信息,为用户提供更加全面和准确的信息支持。该层主要作用是将数字化政务档案中的知识信息转化为可供用户使用的智能化服务,为用户提供更加个性化、精准和高效的数字化政务档案服务体验。

三、基于知识图谱的数字化政务档案服务模式应用

1.数字化政务档案动态更新

利用知识图谱开展数字化政务档案动态更新,可以帮助机构对数字化政务档案快速、准确地更新和维护,并能够提升数字化政务档案的实用性和可靠性。在数字化政务档案信息更新过程中使用自然语言处理和机器学习技术,实体识别和关系抽取数字化政务档案,不断更新知识图谱中的实体和关系,保持数字化政务档案的实时性和精度。基于知识图谱中的知识,通过逻辑推理和知识融合,发现数字化政务档案中不同实体之间的新关联关系,扩大知识图谱的覆盖面和深度。对于不同来源的数字化政务档案,通过数据集成和清洗,将其整合到知识图谱中,更新和完善已有的知识库。同时,通过数据清洗,消除数字化政务档案中的噪音和冗余信息,保证知识图谱的准确性和一致性。标注和验证知识图谱中的实体、属性和关系,发现知识图谱中可能存在的错误或不完整的信息,及时修正和更新。基于动态更新的知识图谱,通过智能推荐和搜索,为用户提供个性化的数字化政务档案服务,满足不同用户的需求。利用知识图谱手段开展数字化政务档案的动态更新,可以提升数字化政务档案管理的水平和效率,为数字化政务档案服务提供更加智能化和个性化的解决方案。

2.用户个性化推荐

借助知识图谱实施用户个性化数字化政务档案、红色档案信息推荐,可以根据用户的需求和兴趣,为其推荐相关的数字化政务档案和红色档案信息。首先,是用户画像。通过收集用户的个人信息、浏览历史、搜索记录等数据,对用户进行画像,分析用户的兴趣和需求,为其定制个性化的推荐方案。其次,是知识图谱建模。收集红色档案和政务档案的相关数据,包括文本、图片以及视频等信息,将其存储到知识库中,并根据这些信息建立起有机连接的知识图谱。再次,是相似度计算,基于用户的偏好和历史行为,通过相似度计算,找出与用户兴趣相关的数字化政务档案和红色档案信息。通过分析用户的历史浏览记录、搜索关键词以及行为习惯等信息,采用推荐算法为用户推荐相关的红色档案和政务档案。然后,整合设计好的个性化推荐算法与红色档案和政务档案的知识图谱,实现个性化推荐功能。用户可依据自身需要、兴趣和偏好来选择感兴趣的档案资料。例如,基于物品的协同过滤算法、基于用户的协同过滤算法、矩阵分解算法等,为用户推荐相关的数字化政务档案和红色档案信息。向相关机构、企业和个人推广应用该推荐系统,提高红色档案和政务档案的宣传效果和影响力,并为用户提供更加便捷的查询、浏览和获取服务。最后,实时更新。根据用户的反馈和行为,不断更新知识图谱和推荐算法,提高个性化推荐的准确性和效果,并根据用户反馈以及其他评估指标,不断调整和优化个性化推荐算法和知识图谱,提高推荐的准确度和用户体验。

3.数字化政务档案智能检索

利用知识图谱开展数字化政务档案智能检索,可以通过构建和应用知识图谱,将数字化政务档案中的实体、属性和关系进行编码和表示,从而实现更加智能化和精准的检索过程。在数字化政务档案中识别出实体,并将其链接到知识图谱中的对应实体,建立实体之间的关联性,从而提高检索的准确度。从数字化政务档案中抽取出实体的属性信息,并链接其与知识图谱中的属性,实现属性的归类和分类,进而提高检索的精准度。语义表示数字化政务档案中的查询语句,通过匹配知识图谱中的实体、属性和关系,实现语义级别的匹配和推理,从而提高检索的智能化水平。通过基于知识图谱的搜索引擎优化,从多个角度优化检索结果的排序和呈现方式,提高搜索结果的可读性和可用性。然后,根据用户的反馈和行为,持续改善和完善知识图谱,优化检索算法和策略,提高数字化政务档案智能检索的效率和准确度。通过以上方法,基于知识图谱的数字化政务档案智能检索,可以实现更加智能化、精准和高效的检索服务,为用户提供方便、快捷、实用的数字化政务档案检索体验。

4.数字化政务档案资源共享

普宁市拥有丰富的红色革命文化资源,但这些资源目前存在着信息孤岛、分散管理、利用不充分等问题。借助知识图谱实施数字化政务档案、红色档案资源共享,可以有效提升服务效能,满足用户的多元化需求。通过整合不同渠道和来源的数字化政务档案、红色档案资源,利用知识图谱技术开展资源匹配与挖掘,实现资源的优化配置和利用。在知识图谱中建立数字化政务档案和红色档案资源之间的关系,形成完整的资源网络,为资源共享提供支持,进一步将数字化政务档案、红色档案资源根据不同的分类标准和属性归类和分类,利用知识图谱技术开展资源聚合和推荐,实现资源的高效使用,制定普宁市紅色革命文化资源共享标准,确保共享资源的统一性和规范性,提高资源利用效率和质量。通过基于知识图谱的信息共享与交流平台,实现数字化政务档案、红色档案资源的共享与交流,为用户提供便捷、全面的资源服务。在资源共享过程中,还需要确保数据质量与安全,加强对数字化政务档案、红色档案资源的数据质量和安全控制,建立规范的资源管理体系,保障数字化政务档案、红色档案资源共享的安全与可靠。

四、结语

为了更好地解决当前数字化政务档案服务所面临的问题,提出了基于红色档案和政务档案的知识图谱的数字化档案服务模式。这种模式充分运用符合当代互联网技术发展潮流的新型智慧技术,通过创建知识图谱架构,结合爱国主义教育基地逐步开展青少年爱国主义教育,不断推进档案服务发展以及档案业务与新兴技术的结合。

参考文献:

[1]舒忠梅.数字人文背景下的档案知识图谱构建研究[J].山西档案,2020(2):53-60.

[2]王文强.基于数字档案馆的企业档案智慧服务模式探析[J].机电兵船档案,2019(4):76-78.

[3]熊回香,严舞月.基于知识图谱的数字档案服务模式探究[J].知识管理论坛,2021(4):204-212.

[4]刘 峤,李 杨,段 宏,刘 瑶,秦志光.知识图谱构建技术综述[J].计算机研究与发展,2016,53(3):582-600.

基金项目:基于本体的馆藏红色档案及政务档案知识图谱构建的实证研究(项目编号:YDK-289-2022)。

作者简介:周程(1979—),男,汉族,湖南衡山人,本科,高级工程师,研究方向:软件工程、档案学。

猜你喜欢

服务模式知识图谱
国内图书馆嵌入式服务研究主题分析
国内外政府信息公开研究的脉络、流派与趋势
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
加强图书馆数字化服务 让阅读引领未来
基于知识图谱的智慧教育研究热点与趋势分析
基于云计算的数字图书馆建设与服务模式研究
文化馆总分馆制服务模式的实施探索
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展