人工智能视域下隐性知识挖掘技术在档案修复工作中的应用路径研究
2024-04-25国敏梁磊吴晓红荆涛
国敏 梁磊 吴晓红 荆涛
摘要:人工智能技术在档案修复工作中的应用成为当前研究热点之一。这不仅能提高档案修复工作效率、缩短修复人员培养周期、明晰修复工作模式管理界限、释放修复人员工作压力,同时能为档案修复工作智能化提供基础研究思路。论文利用知识管理思想,结合档案修复工作特点构建SECI模型,聚焦隐性知识显性化过程,并进一步加入人工智能管理思想,利用CBR技术规划档案智能化修复方案生成路径模型,通过大数据、云计算等学习手段制订修复方案,以改善档案修复工作效率低下的现状。
关键词:档案修复 隐性知识挖掘 知识管理 人工智能
近年来,档案保护与修复工作逐渐受到重视。国家档案局通过实行多项措施落实国家重点档案保护工作,推进国家重点档案保护技术研究,充分发挥技术创新对档案事业发展的支撑作用。然而档案修复管理模式尚停留在传统人工阶段,难以满足海量档案亟待修复的需要,档案修复部门迫切需要对传统修复工作模式进行更新和再造。档案修复技艺中蕴含大量隐性知识,将知识管理思想引入档案修复工作中,可以将隐性知识显性化,从而便于对修复技艺进行标记,再结合当下新兴的人工智能技术,创新智能化档案修复模型,帮助修复专家缩短修复判定时间,提升修复效率。
一、传统档案修复工作问题分析
当前档案修复工作主要以个人“作坊式”模式开展,这种工作模式依赖于个人经验、智慧和技术水平,存在工作效率较为低下、修复人员培养周期较长、管理界限模糊等问题。
(一)档案修复工作效率较为低下
当下的档案修复工作主要采用单人独立操作方式,工作内容综合性强、专业性强,但效率低。这是因为在修复过程中,修复人员制订的修复方案往往各具特色、操作的实施标准不统一、修复人员的技艺水平参差不齐。在这种情况下,修复工作难以量化形成标准,使得档案修复工作难以采用共同协作的方式来完成。知识管理模式的思想将重新定义修复工作的流程,从智能化方案的制订,到明确修复流程、责任分工、操作方法以及完成水平的指标等,都将大幅度有效提升档案修复工作的效率、优化完成效果。
(二)档案修复人员培养周期较长
由于档案修复工作涉及学科众多、修复技艺性质特殊,修复人员的培养通常是师徒制,这种言传身教的教授过程中蕴含着大量难以表述的经验、技能和诀窍。成为一名档案修复师需要日积月累的實践操作,不断摸索、学习各种修复手法和技艺。而在未来,结合知识管理的方法可以将档案修复工作中大量的隐性知识显性化,缩减修复人员的学习成本,加入系统化的显性知识传授过程,加快档案修复人员的培养速度,缩短档案修复人员培养周期。
(三)档案修复工作模式管理界限模糊
在档案修复工作中,因工作人员认知水平和技艺水平差异等,导致修复工作存在修复目标不明确、修复手段不统一、修复过程难划分、修复成果不标准等种种问题。[1]这些问题不仅限制了工作效率,而且使修复工作难以被监督和管理。在信息化时代,应将知识管理与系统管理相结合,建造智能化档案修复信息管理系统,从时间、人员、工作内容等多个维度精细划分修复权责,进一步提升修复效率和监管效率。
二、基于SECI模型的档案修复工作模式
档案修复工作中包含大量隐性知识和显性知识,导致工作标准化程度低的主要痛点在于隐性知识难以表述。将档案修复工作中的隐性知识通过SECI模型进行转化和挖掘,有利于细化修复标准,为建立智能化档案修复模型提供数据支撑。[2]这里的SECI模型是由野中郁次郎和竹内弘高提出的,具体是指隐性知识和显性知识通过社会化(Socializa? tion)、外显化(Externalization)、结合化(Combina? tion)和内隐化(Internalization)四种转化模式实现螺旋式转化,完成知识的传播与创新。
(一)档案修复工作中的显性知识和隐性知识内涵
显性知识是指可以通过语言、文字、编码等明确表达的知识。在档案修复工作中,显性知识主要是通过修复方案报告、修复过程记录、修复成果照片以及专家审核意见等以文字、图片、表格、多媒体等形式记录下来的知识。这些记录使知识变得清晰明了,易于传递和共享,便于档案修复人员进行学习和分析。
隐性知识是指在行动中所蕴含的未被表达的知识。在档案修复工作中,隐性知识主要是指修复的技术、经验判断、操作手法等由个人经验、感悟所得到的知识。这些知识存在于个人头脑中,依托特定的情景存在,难以被清晰地表达。修复工作的特性决定了隐性知识在档案修复工作中占大多数,它们潜移默化地影响着修复行为,决定修复个体的价值取向,对修复任务与目标有着直接或间接的制约效果。
(二)档案修复工作中隐性知识和显性知识的转化
野中郁次郎和竹内弘高提出了知识创造的SECI模型,认为在企业创新活动的过程中隐性知识和显性知识二者之间互相作用、互相转化,知识转化的过程实际上就是知识创造的过程。[3]隐性知识和显性知识通过社会化、外显化、结合化和内隐化四种转化模式实现螺旋式转化。
笔者将SECI模型引入档案修复工作中,旨在利用SECI模型通过不同转化阶段的管理方式以及实现方法,来探讨隐性知识挖掘路径。
社会化是指存在于档案修复人员之间的交流和师徒之间传授的隐性档案修复知识转化为隐性知识的过程。这一过程为隐性知识从单独的个人独有到社会化共有的过程。观察档案修复整个流程,修复人员通过参与实践、交流讨论、专家小组等方法进行知识共享与交流,使修复知识在组织内部转化。师徒制是隐性知识交流的重要方式,在师父带徒弟进行修复工作时,徒弟通过对师父操作的观察、模仿进行知识学习,传承隐性知识。
外显化是指可利用先进的知识工具和信息技术进行知识挖掘,构建档案修复经验知识库,呈现出隐性知识转化为显性知识的过程。具体到档案修复流程中,人们会将档案破损状况、修复方案的制订、具体修复操作的实施记录下来,通过知识地图、数据挖掘等技术整理加工,构建出档案修复知识管理库,或者建立知识管理系统。修复人员将知识进行概念化命名,并且将自己的修复经验总结并共享在系统中,逐渐形成显性知识库。
结合化是指通过搭建体系化平台和显性知识库加强知识的规范化管理,将混乱无序的显性知识转化为组合的、系统的显性知识。在这一理论的指导下,将大量的修復数据进行规范化的处理,形成具有预判、前瞻性的修复情报。这一理论也可以规范化处理显性知识,提高知识显性化的质量与效率。
内隐化是指可以催化知识存量为知识增量、提高修复技艺和鉴别水平,将显性知识转化为更高阶隐性知识的过程。可以通过开展修复培训班、修复知识交流沙龙,将整理后的显性知识传播给更多的人,这些人吸收后进行新一轮隐性知识转化,使得档案修复的知识层层拔高。
(三)档案修复工作中的隐性知识挖掘
档案修复知识多为经验类的隐性知识,将这些知识进行显性化构建档案修复知识库,可以让修复知识被更好地记录并传播。构建档案修复知识库的关键是将隐性知识显性化。档案修复工作中的隐性知识挖掘模式如图1所示。
隐性知识包括技能方面和认知方面两部分内容:技能方面的隐性知识包括修复工作中非正式的、难以表达的技能、技巧、经验和诀窍,[4]可以通过数字化整理归纳,形成档案修复工作日志、档案修复操作规范、修复工作报告等易于传播的显性化知识,这些知识涉及档案修复中破损部位、破损状况、修复方案、修复材料等各类数据;认知方面的隐性知识包括对修复方法的洞察力、感悟、判断以及组织文化等,[5]可以通过开展修复行业学术会议、撰写档案修复相关论文、组织内外部的修复专家座谈交流进行知识分享。这些隐性知识通过知识分享、知识挖掘等方式形成文字、符号、图片、视频等各种易存储的显性知识库,便于同行业人员、组织之间进行交流。该知识库不仅可以供档案修复人员学习,还可以促进人们通过知识获取形成新的隐性知识,而这些新的隐性知识通过再实践会进一步完成知识再创造,孵化出更高阶的隐性知识,进行新一轮知识循环。
三、基于CBR技术的档案智能修复模型
通过隐性知识挖掘将档案修复工作中的隐性知识显性化,有利于对修复知识进行进一步研究和利用。在人工智能技术视域下,对显性修复知识进行编码并构建修复推理模型,便于让计算机学习并模仿人类修复思维,实现修复方案的智能化生成。在上述研究的基础上结合国家重点档案抢救保护信息化管理平台项目,笔者对档案修复隐性知识显性化展开了系统研究,探索并总结出档案修复知识构建的模型和实践路径。
基于案例的推理(Case-Based Reasoning,CBR)是一种人工智能推理技术,即根据经验知识进行推理判断。计算机模仿人类如何记住信息,并通过回忆过去的知识来解决类似问题。[6]为了验证CBR技术在隐性知识挖掘方面的有效性和可行性,我们重构了基于CBR技术的修复方案智能化生成模型以进行档案修复技术中隐性知识的挖掘,即选取专家型人才修复案例,通过实例研究,运用模型来进行知识挖掘,从而证实该模型可以检索并提取文献修复技术中隐性知识规则的可行性。
首先,将待修复档案的破损问题要素表示并编码(见图2),常见的破损状况有脱浆、起毛、脆化等,以P1、P2、P3……将其编码。在不同破损状况下,档案的破损程度也不尽相同。根据修复工作实际情况和具体的工作环节,酌情对破损程度进行赋值,将破损程度划分为1到5级(极轻微、轻微、中等、严重、极严重)。一卷待修复档案可能同时具有多种破损状况,实际操作时可将多种破损状况及破损程度进行组合表示,如轻微脆化且中等虫洞可表示为(P3-1,P5-3),依此类推。
其次,构建修复方案编码库,常见的修复方法有托裱、补(包括补洞、补边)、揭书页等,以X1、X2、X3的命名方式将其编码。
再次,将破损问题编码库与修复方案编码库进行对应,归纳不同程度破损状况下会选择的修复方案。利用德尔菲法邀请修复专家对破损问题与修复方案的对应关系进行加权打分,经过多轮收集专家意见,得到趋于一致的权重系数,再根据破损档案状况,利用层次分析法自动生成修复方案模型。
最后,导入待修复档案的破损数据,测试修复方案智能化生成模型。若通过该路径生成的修复方案与专家人工拟定的修复方案一致,则说明该模型是可行的。
利用该模型分析一定数量的案例后,形成档案修复案例库。新的待修复档案可先通过案例库的预处理进行分类:将待修复档案与破损问题编码库结合分析,再进入档案修复预案例库进行整理挖掘。基于CBR技术的修复方案智能化生成模型如图3所示。
在此体系下,计算机智能生成修复方案成为档案修复的主要途径,专家只需对少量计算机难以识别、破损情况特殊的档案制订修复方案。这样,在源头处理和诊断分类环节节约了修复专家的时间与精力,提升了档案修复工作的效率。
四、结语
在科技飞速发展的今天,档案部门应注重将科技创新与传统档案修复方式相结合,引入知识管理思想,挖掘修复知识中的隐性知识,优化档案修复工作模式,减少人工干预,规范工作程序。这不仅可以提高档案修复工作效率、缩短修复人员培养周期、明晰修复工作模式管理界限、释放修复人员工作压力,同时能为档案修复工作智能化提供基础研究思路,助力档案修复工作提质增效,推动档案修复进入智能化新时代!
注释及参考文献:
[1]寇芳莹.馆藏文物保护修复档案建设研究[J].北京档案,2022(1):32-34.
[2]闻心洁,沈艳红.档案视阈内隐性知识的传递[J].山西档案,2016(3):31-33.
[3]竹内弘高,野中郁次郎.知识创造的螺旋:知识管理理论与案例研究[M].李萌,译.北京:产权出版社,2005.
[4]许卫红,王阿陶.古籍修复工作中的知识管理[J].大学图书馆学报,2010,28(2):45-49.
[5]张小晖.企业创新团队知识学习机理与模式研究[D].武汉:武汉理工大学,2012.
[6]刘洪泉.基于CBR技术的古籍修复中的隐性知识挖掘研究[D].沈阳:沈阳师范大学,2014.
作者单位:1.中铁十五局集团城市建设工程有限公司 2.北京联合大学应用文理学院 3.北京市档案馆华北地区国家重点档案保护中心