我国人工智能在档案领域的应用研究综述
2021-08-13张文馨张笑星田议方
张文馨 张笑星 田议方
摘 要:信息时代亟待在档案领域引入更高效、系统、先进的人工智能技术。从历史发展、现状分析、趋向预测角度对人工智能在档案领域应用研究的文献进行了分析与总结,将对档案智能化的研究归纳为应用前奏、正式提出、深入发展三个时期展开综述,发现现有研究具有发展速度加快、由理论研究向实践研究发展等特征,最后从学术研究与实践角度对人工智能在档案领域应用研究提出建议。
关键词:人工智能;档案管理;档案智能化;智能管理
1956年,以麦卡赛、明斯基等为首的科学家在机器模拟智能问题的探讨中首次提出了“人工智能”这一术语。至今人工智能已取得长足发展,成为一门炙手可热的交叉性和前沿性科学,被广泛应用于多个学科领域。随着信息时代的发展,海量知识、数据、信息产生,档案管理的难度加大,且由于档案管理工作具有较高的重复性,引入更加高效、系统和先进的技术来推进档案管理工作迫在眉睫,而人工智能的应用就为破解这一问题提供了绝佳选择。国内已在人工智能助推档案管理方面做出了诸多努力,如在2019年8月的中国知识管理论坛上,中国人民大学信息资源管理学院与科大讯飞共同签署战略合作协议并建立“人工智能与数据管理联合实验室”,将共同推动人工智能技术在档案、数据管理等方面的创新应用[1 ]。本文主要针对国内关于人工智能在档案领域应用的研究成果进行较为系统的评述,旨在对已有的研究成果进行系统梳理并提出展望性意见,为后续研究者提供参考,便于未来学者们深入研究。
1 关键词共现分析
考察主题高频关键词共现情况,最高频的词语是“人工智能”“档案管理”,较为直接地反映了研究主题,但也体现出研究方向的延伸性不强。“应用”“应用与发展”“数字档案馆”“智慧档案馆”“数字档案资源”等较高频词语反映出了档案领域引入人工智能技术的目的;“人事档案”“企业档案管理”“城建档案管理”“档案编研工作”等词语反映了研究方向。总体而言,这些高频关键词反映出国内较为关注人工智能与档案资源建设及档案管理工作的结合,但缺乏深入性、延展性,也并未反映出策略和技术层面的信息,未来研究还需深入细化、实践化。
截至目前,国内学者对人工智能应用于档案管理与利用方面的研究已取得了一定成果,同时对在人工智能背景下的中外档案管理创新的对比也总结了一定经验。近两年,深度学习、计算档案学将人工智能在档案领域的研究进一步深化,即由表面的研究关注到具体的机器算法,研究更加深入。与其他学科领域比较起来,国内关于人工智能在档案领域的应用研究还较为薄弱,且大多停留在理论研究方面,具体设计和实证研究涉及较少,對学术关注者的辐射程度也不高。
2 研究分析
2.1 应用前奏(1994~2016年)
该阶段文献数量总体较少,发展较缓慢。学者们开始对人工智能在档案领域中的应用进行初期探索与实践。
20世纪90年代,朱久兰[2 ]在档案检索方面运用知识库系统,以计算机程序代替人的思维与推理过程,极大提高了检索质量。马旭超[3 ]指出专家系统、自然语言等可以提高检索效率、促进检索智能化。
随着信息化浪潮的推进、物联网技术的成熟,杨玉梅等[4 ]所设计的基于RFID物联网的档案管理自动化系统,实现了档案管理全过程的自动化、智能化。陈勇[5 ]认为物联网作为档案管理的新发展平台,可以极大提升档案管理水平,但尚未得到充分应用。
本阶段学者们对相关应用进行了初步探讨与实践,尽管仅将检索环节作为初期实践研究的核心,但仍是档案现代化的巨大进步;将物联网技术与档案管理结合,虽未得到推广应用,但也为后期研究及应用提供了指导。
2.2 正式提出(2016~2019年)
该阶段随着智能人工软件AlphaGo的出现、智慧社会的到来及管理转型的需要,文献数量剧增,发展较快。学者们一方面关注应用理论探索和场景构架以展望未来,一方面关注新技术应用现状以期深化指导工作。
2.2.1 理论探索和场景构架。迄今为止对于人工智能应用于档案管理的最新理论主要是对其必要性、重要性的深入探讨及宏观指导。肖辛格[6 ]指出,将深度学习与信息管理工作相结合会进一步提高文件信息管理的自动化水平,档案领域应顺此时势。随后,胡国强[7 ]等提出要利用人工智能优化管理环节,最终达到提高服务水平的目的。
同样从环节的角度,山石平[8 ]进一步提出人工智能技术在数字档案馆中的应用领域主要集中在数字档案的收集、整理、存储和应用环节中。沙洲[9 ]指出人工智能的相关应用包括网络档案信息资源智能收集、智能分类与检索、智能鉴定和智能利用服务等。刘珂[10 ]在前者的基础上将智能化档案提供利用服务细化为档案咨询的智能服务、档案文献的智能解读。以上研究将档案智能化场景不断细化扩充,推进了档案管理智能化、科学化、知识化。
但同时,陈汇[11 ]指出在人工智能赋能档案管理成效显著时也该看到网络安全和风险与之并存。如何在这场技术革新中把握机遇、迎接挑战,成为现阶段亟待解决的问题。
此后,韩洁等[12 ]指出人工智能背景下档案鉴定理论、分类方法和保管方法尚未形成新的理论成果,理论研究仍处于初始阶段,表明了我国当前相关理论存在聚焦宏观,研究深度不足的问题。
2.2.2 应用现状。自研究以来,人工智能逐渐与各行业档案实践相结合,如:企业档案,杨强等[13 ]介绍了江苏核电企业利用人工智能、云计算等先进技术来实现文档管理标准化、高效化和智能化的成功案例;医院档案,谢梦怡[14 ]利用机器视觉多视角采集医院档案信息加以模式匹配,实现信息海量精准识别,可极大提升效率;人事档案,张鸿艳等[15 ]提出将档案信息和数据进行数字化处理,提高了档案整理的工作效率。以上研究表明,我国各行业档案领域对人工智能高度关注、积极运用,并获得了初步成效。
但与此同时,发展不充分、现实应用不足等问题也逐渐暴露。张军君[16 ]指出专利初级阶段核心技术与档案管理工作结合不够紧密的现状。杨建梁等[17 ]提出现阶段机器学习在档案领域的应用以实验性研究为主,没有真正利用核心技术解决重难点问题。韩洁等[12 ]认为我国档案管理工作中人工智能技术的利用层次不高、利用机构和部门较少,已有的也是力量薄弱、认识有限。以上研究表明,人工智能在我国档案领域研究和应用的二十年间,虽然内涵得到了丰富和发展,但仍处于初级阶段,特别是机器学习、自然语言分析等技术在档案领域中的研究和应用还有待进一步深化。此外,从科研层面来看,研究深度相对不足,需加大力度深入研究[20 ]。
该阶段学者们对相关应用理论进行了探讨,为档案数字化工作提供了宏观指导,也对其未来进行了展望,但在具体工作流程中的创新较少,研究深度有待进一步深入。此外,尽管在人工智能应用中取得了初步成效,但总体来看还需进一步深化指导档案数字化工作。
2.3 深入发展(2019至今)
该阶段文献数量总体较多,发展较快。学者们开始对人工智能在档案领域中的应用进行更为深入的探讨。
近年来,人工智能的发展取得了极大突破,特别是在大量数据的推动下,深度学习日益成熟,应用广泛。如:照片档案中,赵学敏[18 ]等运用深度学习方法以图搜图,为照片档案的管理利用和资源开发提供了理论支持和实践思路;视频档案中,易黎[19 ]提出了全域深度学习的新闻档案信息抽提方法,可同时提取视频中的语音信息、视频信息和文字信息并加以整合。
此外,计算档案学的蓬勃发展也体现了人工智能的深入发展。随着信息与数字技术的发展,档案领域引发了数字革命,由此计算机与档案领域融合的计算档案学内涵不断丰富,意义不断凸显,亟待从理论建构延伸至实践内涵的明确[20 ]。周文泓等[21 ]指出在实践层面,计算技术对于档案管理的应用已有长足发展;在科研层面,不同技术与档案管理的不同环节相结合,进一步促进了档案真实性等自身内涵的认同。
当前阶段,学者们进一步将人工智能在档案领域应用的研究深化,由表及里,为档案数字化工作指明了方向。但由于新兴概念的理论与实践仍在探索中,其具体内涵的建构仍需进一步探索。
3 档案智能化研究分析
3.1 特征分析
3.1.1 依托于良好环境,发展速度加快。
3.1.2 由理论研究向实践研究发展。
3.1.3 研究具有广泛性和发展性。从研究主题来看,对人工智能在档案领域应用的研究在以理论研究为重点的同时,对于技术手段的实践研究也逐渐增多,推动了档案學与档案工作实践的发展。
3.1.4 由表面研究向深入研究发展。伴随深度学习、计算档案学的出现,由表面研究关注到具体的机器算法,研究更加深入。
3.2 问题分析
3.2.1 研究深度不足。目前人工智能赋能背景下档案管理理论研究仍处于初始阶段,缺乏对相关理论研究的创新。且对于人工智能在档案领域的理论研究主要聚焦宏观层面,对人工智能技术具体如何应用于档案工作的各流程之中的探讨却较为宏观和稀少。新兴的深度学习、计算档案学虽然建立了初步的框架,仍需进一步建构其具体内涵。
3.2.2 与档案管理工作结合较弱。当前人工智能核心技术与档案管理工作的结合不够紧密。虽然部分学者提出了人工智能技术应用于档案工作的具体路径,但仍停留在档案资源整理、搜索等宏观层面;部分学者虽提出了运用新兴技术处理档案工作中的难题,但仍未被推广应用至解决档案管理实践中的重点和难点问题。
3.2.3 合作机制尚待建立。在实际应用过程中,档案管理机构与部门的两极化问题明显。真正利用人工智能技术的档案管理机构和部门较少,主要集中在少数技术发达、有充足资金支持研究的档案管理机构和部门,且尚未建立起多主体参与研究机制,会阻碍交流与资金的投入,难以支撑更多机构研究的深入发展。
3.2.4 经验总结与借鉴不足。从理论创新来看,国外学者进行了理论研究,如Gregory Rolan等人分析了人工智能在文件保管领域的应用及障碍;从实践创新来看,国外档案管理领域已开展了多个档案管理项目,如澳大利亚新南威尔士州档案馆利用人工智能技术对州政府非结构化数据集进行分类[22 ];从人员角色转变来看,国外档案管理人员直接参与人工智能的应用。我国学术界对国外相关研究的经验总结较少,未能提供先进的理论与技术借鉴。
4 档案领域应用人工智能的对策
4.1 学术研究角度
4.1.1 加强档案管理理论研究。现有的档案学理论已不适应新的环境,亟需发展适合新环境的档案管理理论。学者们应提升研究深度,探索关于档案智能化的新理论,进一步深入计算机档案学、深度学习的研究,指导档案工作发展;还应关注对人工智能技术应用于档案领域的实践研究,将理论落到实践,注重对应用策略的深度挖掘。
4.1.2 提升与档案管理工作结合的紧密度。未来学者们应注重利用人工智能技术解决档案管理工作中的重点和难点问题,并将研究方案及时提供给档案管理部门,加快推广应用;并关注国外学者对实际工作应用的探索,使人工智能技术与档案工作的实践紧密结合。
4.2 实践角度
4.2.1 建立档案部门的合作制度。将少数技术发达、有充足资金支持研究的档案管理机构及部门与多数发展水平较低的档案管理机构和部门联合起来,通过举办论坛、召开年度会议、进行人才交流等形式,将探索人工智能技术应用的各档案机构部门链接成合作伙伴关系,促进档案管理经验交流和研究分享。
4.2.2 构建多主体协同参与制度。我国应改善单轨制管理布局,构建以档案机构为主,档案工作者、研究机构、企业、高校、社会力量等多元主体协同参与模式,发挥各主体的人才、领导、资金、技术优势,实现对档案资源的有效开发和利用;同时,各主体应借助档案部门这一平台,将实践中的研究成果尽快推广应用到档案管理工作中;还可通过国际论坛等形式定期交流经验。
4.2.3 加强档案工作者专业素质培养。档案工作者应通过改变角色定位、升级职业技能来拓宽档案职业边界,主动适应管理智能化、档案数据化的新要求[13 ],一方面要充分发挥档案工作者的能动性,关注用户的具体需求;另一方面应加强专业技术培养,根据知识经验对人工智能应用工作中的失误和漏洞做出灵活判断。
4.2.4 加快技术的研发与更新。国内部分企业已将新技术、新产品与实际应用场景相融合,档案机构应积极借鉴智慧档案企业的先进技术,将科研机构及企业的技术开发优势与实践相结合。同时档案管理机构也应关注档案学者们的先进研究,对学者们提出的可行性设想,及时在档案管理实践中试操作,成效明显的方案进行进一步推广。
4.2.5 加大研究资金的投入。智能仓储管理机器人、智能密集架、RFID标签等应用大多具有高成本的特点,人工智能的具体应用也具有高额的维护费用[23 ]。因此,国家层面应对研究档案智能化的机构加大资金投入;档案机构应主动拓宽资金来源渠道,例如引进盟友与投资者、吸引社会力量关注、成立档案智能化基金会等,积极寻求吸引资金的方式与渠道。
科研项目:西北大学大学生创新创业训练计划项目(项目编号—2021176)。
参考文献:
[1]王文静.高校联手企业力推人工智能应用档案管理研究[EB/OL].2019-09-04.
[2]朱久蘭.档案信息智能检索[J].档案学通讯,1994(04):57-58+39.
[3]马旭超.人工智能及其在档案检索中的应用[J].黑龙江档案,1996(6).
[4]杨玉梅,黎仁国.基于RFID物联网的档案管理系统研究与设计[J].档案学研究,2012(04):62—64.
[5]陈勇.物联网在档案管理中的应用研究[J].档案学研究,2015(05):102—105.
[6]肖辛格.基于深度学习的电子文件自动分类技术——以电子图像文件为例[J].情报探索,2019(06):78—82.
[7]胡国强,杨彦荣,李高峰.基于信息链角度分析人工智能在档案馆的应用前景[J].北京档案,2019(02):34—36.
[8]山石平.数字档案馆建设中的人工智能应用研究[J].兰台世界,2019(S2):74—75.
[9]沙洲.人工智能在档案工作中的应用研究[J].档案与建设,2018(02):36—39.
[10]刘珂.人工智能在档案管理中的应用探析[J].兰台世界,2019(02):19-23+12.
[11]陈汇.关于人工智能赋能档案管理的几点思考[J].档案天地,2019(07):55—56.
[12]韩洁,史江.人工智能赋能背景下中外档案管理创新比较与启示[J].档案与建设,2020(02):40—44.
[13]杨强,陈超,查凤华.核电企业基于“大云物移智”的文档管理创新[J].电力大数据,2018,21(09):36—41.
[14]谢梦怡.基于机器视觉的医院档案信息智能搜索[J].西安工程大学学报,2019,33(05):575—580.
[15]张鸿艳,王中秋.人事档案管理中人工智能技术整合应用探寻[J].兰台内外,2019(29):33—34.
[16]张军君.人工智能在档案管理工作中的应用进展研究[J].江苏科技信息,2019,36(07):34—36.
[17]杨建梁,刘越男.机器学习在档案管理中的应用:进展与挑战[J].档案学通讯,2019(06):48—56.
[18]赵学敏,田生湖,张潇璐.基于深度学习的以图搜图技术在照片档案管理中的应用研究[J].档案学研究,2020(04):64—68.
[19]易黎.基于深度学习的新闻档案信息管理方法[J].中国档案,2020(12):66—67.
[20]国家档案局.国家档案局举办区块链技术视频专题讲座[EB/OL].2020-08-12.
[21]周文泓,贺谭涛,吴琼,黄小宇.计算档案学的多元实践内涵解析与展望——基于NARA专题性实践的案例研究[J].档案与建设,2020(10):8—13.
[22]Rolan G,Humphries G,Jeffrey L,et al.More human than human? Artificial intelligence in the archive[J].Archives and Manuscripts,2019(2):179—203.
[23]孙大东,张欢笑.现阶段档案库房智能管理机器人不可行分析——兼与王啸峰商榷[J].档案与建设,2019(06):50-53+56.
作者简介:张文馨(2000— ),西北大学公共管理学院档案学专业学生;张文星(2000— ),西北大学公共管理学院档案学专业学生;田议方(2000— ),西北大学公共管理学院档案学专业学生。