试论人工智能技术在档案管理信息化中的应用
2021-08-09高华
高华
摘要:《中国人工智能行业市场前瞻与投资战略规划分析报告》表明,预计2021年我国人工智能市场规模将高达千亿元,2023年该市规模将达到2000亿元。然而,我国档案管理行业依然处于起步阶段,各地信息化建设程度差异较大,面对人工智能的崛起,档案管理该如何适应?对此,文章重点论述了人工智能技术在档案管理信息化中的运用,以此来强化档案管理能力。
关键词:人工智能技术;档案管理;信息化
随着大数据、脑神经科学、互联网等技术的日益成熟,人工智能技术随着在各行各业运用。习近平在高质量发展的科技创新工作中提出,人工智能是科技革命与产业变革的主要助推力,悄然间改变着我们的生活与工作,促使我们迎来了人机协同、跨界融合、共创分享的智能时代。新形势下,作为智能政务、智能社会构建的关键点,档案工作同人工智能技术相融合是必然趋势。在这一形势下,档案工作应积极应对人工智能技术所带来的机遇与挑战,积极迎合,深入融合,以此来真正提高档案管理效率及服务水平。
一、人工智能技术概述
人工智能技术属于新兴研究领域,是借助计算机技术及智能控制技术,通过模拟、延伸及智能拓展,形成对信息的感知、获取与识别能力,从而获得优异的计算能力。2017年,李克强总理反复强调“想方设法研发人工智能技术,促使其更上一层楼。”同年7月,国院务印发了《新一代人工智能发展规划》,进一步对人工智能的发展制定了战略目标。不仅如此,即便是世界范围内的优秀互联网企业,其在人工智能发展领域上也保持了惊人的一致,包括谷歌、微软、脸谱、百度及英特尔等著名企业。现阶段,我国在人工智能领域发展迅猛,已然进入人工智能研究领域第一梯队,这对于我国行业的发展极为有利。
随着现代网络信息技术的发展,我国在该领域取得了喜人成果,针对于前沿科技领域的开发,将实现对国外技术的弯道超车。特别是人工智能领域的发展,必然对各个领域带来全新的变革,数字出版行业属于重要的文化领域,与我国文化自信战略紧密契合,人工智能技术的应用将产生强大推动效能。除此以外,人工智能的应用还包括医疗、教育、金融、安防及国防等领域,据相关统计数据显示,仅2016年全球在人工智能领域的研发投资就高达50亿美元,相较于2012年增长了近十倍,依据当前的发展格局和趋势,预计到2020年年底,该领域的投资规划将突破1000亿美元大关,年投资增速将超20%,其中我国在人工智能领域的投资也将达到100亿规模,增长幅度更达到50%以上。未来,随着人工智能技术的优化与完善,其发展的重点将以大数据智能、群体智能、跨媒体智能、人机混合为主。可以预见,借助各类现代科技的优势,将使人工智能得到深度发展,形成体系化的应用格局,并在社会行业的实践推动下,达到技术的迭代、融合与创新目标,推动社会向高智能化挺进。
二、人工智能技术在档案管理信息化中的重要价值
对于档案管理信息化工作,人工智能技术的运用可提高其效率与质量,深入开发其使用价值,对传统管理方式进行了变革与优化。随着该技术的广泛推广运用,极大的简化了一些机械性流程,包括信息录入、信息整理以及信息分类归档等,显著提升了档案信息的准确性,防止因为人工录入而导致部分档案信息的真实性无法得到保证,以及由于人为疏忽而让部分数据信息丢失。档案管理工作人力投入越来越少,只需投入信息化人才便可。档案工作的主要内容就是收集档案,并根据类别将其整理汇总后存档保存。传统管理模式下,档案管理需其他部门的配合,而应用人工智能技术,则将数据收集、分类、排列和存储步骤简化了,但效率却更高了。另外,用户也能够更方便的查询、调阅档案。在信息社保终端上,用户只需输入关键词,并将所需档案信息很快查找到,具有较强的智能性特征,且信息数据的传输速度非常快,进而迅速满足了用户查询档案的需求。
三、人工智能技术在档案管理信息化中的具体运用
现阶段,档案行业正处于信息化、数字化时代,信息化系统已普遍运用于档案管理过程中,其已成为数字化档案收集、整理以及利用的一项基础条件,在部门立卷之时,档案便可以进行数字化收集又或是再档案整理阶段数字化,并能够高效获取所需信息。但历史档案的数字化以及以物联网为基础的管理系统和库房自动化系统的对接还是将严峻的挑战带给了档案馆。不论是在线办理、移动办理,还是终端办理和一站式办理均对信息系统的更新换代提出了非常高的要求。就现阶段档案信息化的实际情况来说,人工智能技术还有非常大的应用空间,在人工智能时代,档案管理的智能度更高,便利性更大,进而可更大的挖掘、利用档案的价值。
(一)档案资源智能收集
在信息检索工作中,人工智能技术的运用能够快速、准确地从大规模原始信息中将用户需求的信息获取。例如通过Agent方式的运用,按照与先设定的收集规则智能、自主地從信息源进行档案的获取收集。因各个Agent有不同功能,且规则不一致,加之需达到的目标也有差异,所以要以具体的数据源为对象,进行不同规则类型的Agent定义。例如,用于某种具有特定格式文件收集的Agent、用于网页数据收集的A—gent。收集元素数据时,可进行格式化处理,则是基本格式与简单排序。如把文字档案转换为文本格式,并基于时间进行合理排序,简化后续工作,提高获取信息的效率。
(二)档案资源分类挖掘
档案收集后,便进入了分类及挖掘环节,而分类应以档案介质的不同为根据合理进行人工智能技术的选择。例如,在文本档案中主要采取的技术隶属于自然语言处理领域,即命名实体识别技术,能够自动识别存在于文本中且具备特定意义的专有名词、地名及人名等。随后,围绕文本展开基本标注,标注的内容主要包含时间戳、部门、保管等级等用于分类或管理的信息。将这些关键词提取并标注后,以属性的不同为根据并在机器学习中的聚类等方法的运用下展开分类,倘若具有充足的数据量,神经网络技术也相当适用。对于档案中的图片,可采取人工智能图像识别技术,如深度学习技术,可高效率识别图中物体,对其进行迅速分类。有关档案信息挖掘方面,则是以档案内容智能检索、档案价值智能鉴定为主。分类中,档案经人工智能技术处理后,获得了有序的数字化信息,方便了后续的档案信息挖掘。具体挖掘中,多以数据挖掘领域人工智能技术为主。在智能检索档案内容方面,通过信息检索、知识图谱等领域中人工智能技术的应用,全文索引档案内容,挖掘档案信息并构建彼此间的关联性,这样一来就能查找全文同时完成有关联性信息的自动获取,最终智能化运用档案信息。而在智能鉴定档案价值方面,则是在分类过程中获取相关信息,并以此为依据对其保管期限、保密登记进行预设,智能化鉴定其价值。