APP下载

基于知识图谱的档案知识服务模式思考

2022-11-01中国机械工程学会赵范心

办公室业务 2022年13期
关键词:图谱检索利用

文/中国机械工程学会 赵范心

学会的档案信息化建设是学会档案管理工作迈向科学化、规范化,实现现代化的手段,大大减轻了档案管理的负担,提高了档案管理人员的工作效率。实现了检索自动化,信息利用网络化,还应实现知识服务的有效化。

中国机械工程学会于1936年成立,是由机械工程科技工作者组成的科技团体,主要开展学术活动、智库建设、科学普及等工作,覆盖了机械工程主要专业领域。学会每年形成大量的知识资料,目前已经基于“互联网+”技术对学会历史资源和知识资料进行了数字化处理。随之而来的,这些海量信息数据对档案管理工作也提出了新的要求。而知识图谱技术就是针对某一领域或某一事件追溯其知识脉络,恰好可以满足档案资料记录及其关联性的展示需求。因此,为了更好地为会员和科技工作者服务,社团组织应建立一个全新的以知识脉络为主线的档案管理模式,将相互关联的散落数据或信息重新组合,形成新的知识体系。知识图谱应用于档案管理工作之中,其构建是一个系统工程,需要数据化、信息化和网络化等技术的支持。本文探索信息化时代,基于知识图谱的档案管理工作的开展。

一、学会档案管理信息化建设的现状

中国机械工程学会领导层对档案工作一直高度重视。近年来,学会一方面加大对档案信息化建设的资金投入力度,强化技术引领;另一方面,重视专业人才的技能培训及其综合素养、服务意识的提升,多措并举使得学会档案工作的信息化水平得到提升。

目前,中国机械工程学会的档案管理已经全面实现了数字化,构建了文档一体化管理系统,并通过数字图书馆形式在特定范围内提供知识服务,有效提高了档案管理的有效性、便捷性、安全性及服务水平。

(一)构建文档一体化管理系统,促进档案信息化建设。学会构建了文档一体化管理系统,实现了从文件生成到档案管理的全过程控制和科学管理。文档一体化管理将文件管理、档案管理有机地联系在一起,按照统一的规范和标准实施全部控制和有效管理,实现无缝衔接,避免了人力、物力资源的浪费,提高了工作效率和工作质量。

文档一体化属于一种综合管理模式,涵盖了文档生成、归档、管理、信息运用等多项基础功能,使文件直接转换为档案,不存在文件信息的丢失和遗漏,使文档之间更加具有完整性、系统性和准确性,实现了文件生成、管理和利用一体化。文档一体化系统可以贯穿于电子文件管理的全过程,可为档案信息化建设和实现知识服务奠定坚实的技术基础。

(二)建设数字图书馆,初步实现档案资源的信息共享。网络技术的快速发展,推动了学会数字图书馆的建设。数字图书馆可以视为一个完整的数字档案信息化系统,将期刊(学会刊群)、图书、音视频等资料,通过资源入库、编目、分类、标引等处理,为会员提供数字资源的分类导航、检索、在线浏览(播放)等服务,为会议组织者及出版人员提供管理数字资源的工具。

数字图书馆是一个集成管理系统,覆盖了信息的收集、创建、确认、存档、管理、利用等文档生产的全过程。数字图书馆制定了系统的档案信息管理制度,旨在实现信息采集、存档标准化,确保信息的完整性和统一性;检索、查询规范化,提高信息利用的准确性;信息传递、利用保障化,确保文件的稳定性,同时,通过制度管理和技术保障来实现档案信息的保密性和安全性。数字图书馆建成的最终目的,是通过建立完整的目录数据库和内容信息数据库,利用网络为广大会员和读者提供知识服务,实现档案资源信息共享。

(三)建立档案信息安全机制。信息技术的应用与普及,为档案信息化建设创造了有利条件,但相应地也带来了一些安全问题。科学规划档案信息化管理工作,需坚持制度先行,规范管理。学会通过科学设定档案数字化管理标准、完善档案监管机制,有效提高电子档案的安全性和可靠性。

电子档案通常以计算机为载体,通过网络进行传播,具有可操作性、流动性、不稳定性以及可分离性的特点,因此,学会在注重开发利用电子档案的同时,也重视电子档案的安全性以及对知识产权的保护。首先,对于传输的重要档案文件,进行物理隔离并进行异地备份,避免因载体磁化或病毒造成档案信息资源丢失或损毁。其次,对使用者或利用者设定权限,采用身份验证、密码、指纹等技术,来提高电子档案的安全性与可靠性。最后,学会还配置专人定期对日常办公的网络进行排查,防止病毒和黑客的袭击。

二、学会档案信息服务存在的不足

学会的档案资源虽然已经实现信息化管理,但这种直线型、碎片式检索方式,已经不能满足当前科技工作者的高端知识服务需求。

(一)提供的信息资源知识含量有限。通过大数据系统检索只能搜索到某一个点,查询出的信息结果相对独立,要查找更多的相关信息需要进行多次检索,信息资源零散、孤立,不能从大数据中将全部隐性知识挖掘出来,更不能将其关联起来,无法满足会员和科技工作者多层次、个性化的服务需求。

(二)提供的信息资源为静止形态。信息检索只能查到指定要求,不能检索到与之相关联的信息。随着时间的变化,信息资源不断扩展,但自动更新信息内容之间的关联关系,无法实现从量变到质变的知识服务需求,这种知识服务已经不能满足学会的发展需求。

(三)提供的信息资源彼此关联性不强。目前的档案管理系统和技术手段只是将分散的档案数据进行集中统一的整合,不能展示出档案资源的属性信息,也无法挖掘档案资源之间的语义关联和联系,利用者无法快捷、精准地获取真正所需的信息。

(四)档案管理的内容形式和属性在不断变化。学会档案管理工作既包括对历史档案资料的管理,也包括对学会多年来智力成果的管理。中国机械工程学会成立于1936年,迄今已有86年的历史。中国机械工程学会围绕我国机械工业发展历史和学会发展历史展开了大量的研究工作。积累了丰富的历史档案资料,形成了一系列历史资料的研究成果。另外,学会作为科技社团,每年举办上百场学术活动,而编辑出版是学术活动的载体,是学会工作的重要组成部分。多年来,组织行业专家、学者编写了《学会动态》《机械史》《机械工程手册》《智能制造系列丛书》《绿色制造丛书》《中国机械工程技术路线图》系列《中国材料工程大典》《中国机械设计大典》等数百种大型工具书和科技图书等,记载了学会86年来的发展历史、行业的发展史以及行业展望等,也是学会宝贵的智力成果。学会档案管理一方面要记录历史资料,另一方面要加强对档案的利用,起到宣传学会,服务大众的目的。由于现阶段档案管理的内容形式和属性均发生了变化,对档案管理工作也提出了更高的要求。

三、基于知识图谱的档案建设方案

虽然学会档案信息化工作取得了一定成绩,但仍要与时俱进,提高管理水平,顺应信息化技术的快速发展如异地阅读、互联网移动阅读、精准利用等需求。特别是当前学会各种学术会议、编辑出版工作产生的智力成果越来越丰富,必须对这些档案资源进行深层次的挖掘,实现“档案”到“知识”的转化。利用新技术——知识图谱,对档案信息资源进行重新组合,通过对实体的抽取、实体之间关联关系的抽取,形成系统化、有序化的知识组织,实现档案资源知识关联,实现档案资源更广的集成、共享与利用,实现档案价值引领的作用,满足用户的价值体验。

(一)知识图谱可以有效提升档案信息化共享。档案信息化平台的特点是数据量大、内容丰富,能以快捷、方便、精准的方式(手段)获取信息和知识,可满足人们利用档案资源信息的需求。运用信息化技术挖掘、分析海量数据并将相关联的数据重新组织成一个新的网络数据群,利用聚类树图来展示某一领域研究的知识脉络——知识图谱,将其应用到智慧档案馆建设中,不仅能实现知识的有效连接,还能有效加强档案信息和档案利用者之间的关联,将档案信息与利用者需求信息进行有效整合,实现获取档案资源信息最大化。档案管理的最终目的就是提供知识服务,通过网络平台将静态的档案资源转化为动态,不受时间空间的限制,可多人检索重复利用,以实现档案资源信息共享,降低成本,提供服务价值。

(二)知识图谱可以有效提升档案资料的利用效率。“互联网+”在档案采集、分类、整理以及保证档案信息的准确性、完整性和有效性等方面体现出了明显优势,档案信息整理、归档及档案管理实现一体化,查询、检索实现自动化,先进的网络载体推动了档案资源共享、信息服务。但是,碎片化的信息已经不能满足人们的需求,人们渴望了解与事物有联络的整个知识脉络。知识图谱是通过挖掘、分析将散落的知识信息重新组合,用可视化技术描述知识发展进程及它们之间的相互联系,最终全面展现某一领域各要素的关联关系、研究现状、发展进程的一种研究方法。

知识图谱应用于档案管理工作之中,可以有效地将碎片化的档案资料整合起来,形成完整的知识脉络。多年来,学会积累了海量信息数据,同时对档案管理工作提出了新的要求。档案管理工作以此为契机,建立了一套全新的基于知识图谱的档案管理模式,将相关联散落的数据信息重新组合,形成一个新的知识体系。比如,学会形成的历史档案资料,以及学会编辑出版的图书系列,如《中国材料工程大典》《中国机械设计大典》《机械史》等都可以利用知识图谱的方法进行管理。将资料和图书中的大量数字信息、图片信息等资源,从采集、存储、发布、检索等从多个角度着手进行分布式管理,采取统一的高层协议科学分配数字对象资源,将不同系统平台与应用软件中涉及的异构数字档案信息相结合,以此构成一个完整的数字资源库。

知识图谱可以改善检索结果,为搜索提供结构化结果,从而提升学会档案的利用效率。利用知识图谱展示学会档案资源的关联脉络,能够获得更多相关的公共资源,实现智慧搜索与智能交互。

知识图谱能帮助学会的电子档案实现标准化利用,将各种类型的记载用统一的规范进行录入和整理,形成有分类的档案数据源的同时,还可以进行关系抽取,促进相关资料的关联研究。档案使用者可以自然语言提问的形式提出信息查询需求,问题输入后会先进行解析,分析使用者的真实意图,然后根据理解到的意图从各种档案数据资源中进行查询和检索,然后对查询和检索的结果做一个排序筛选,从而进行最终结果的输出,这就需要依托大量高质量的数据和知识,还需要强大的自然语言处理系统。

四、结语

“互联网+”的快速发展有力地推动了档案信息化建设,为档案信息资源的开发、利用开辟了广阔天空。档案信息化平台的建设,实现了档案信息资源共享,通过深度融合、整理、开发与利用形成新的知识网络,提升了档案的知识内容及服务水平。

随着档案管理服务的要求不断提升,先进技术在档案管理中的作用越来越显著,比如知识图谱等技术的应用大大提高了档案的使用效率。因此,档案管理工作要适应新需求,通过使用新技术手段来不断完善档案馆的建设,让使用者可通过安全、可靠、便捷的互联网来进行档案利用。

猜你喜欢

图谱检索利用
“植物界大熊猫”完整基因组图谱首次发布
精武门的武术图谱与徐悲鸿
CNKI检索模式结合关键词选取在检索中的应用探讨
通过实际案例谈如何利用外文库检索提高检索效率
瑞典专利数据库的检索技巧
画与理
图表
英国知识产权局商标数据库信息检索
利用“隐性”圆,巧解一类题
废物巧利用