档案资源整合机制研究
2023-01-17刘红
刘 红
(信阳师范学院 档案馆,河南 信阳 464000)
一、引言
档案资源作为国家及人民群众各方面情况的真实记录[1],兼具文化性、价值性和社会性,并积累与沉淀了巨量的文化元素。2016年,在庆祝中国共产党成立95周年大会上,习近平总书记强调指出:“文化自信是更基础、更广泛、更深厚的自信。”[1]这为档案资源整合研究指明了新方向。为了让档案信息中所蕴藏的文化元素得到充分的发挥,并与当前我国文化自信建设相呼应,必须在更高的层次上进行统筹规划。对多元档案资源进行科学合理的整合,使其符合时代的要求,并融入当前和谐社会建设中,是新时代赋予档案人的新使命,因此进行档案资源整合研究意义重大。
通过文献检索发现,国内数字档案资源整合与服务的研究议题于2001年开始受到关注,张东华指出应根据网络环境下档案信息服务的特点,研究档案信息资源整合的方法与步骤[2]。国内外文献显示,在过去的20多年中,科研人员针对档案资源整合等问题做过大量的研究。比如,Katsianis指出重新配置3D挖掘档案,并以希腊考古项目为例探究档案的技术转变和数据混合[3]。Cui阐释了高校档案信息管理的内涵以及如何创新整合资源模式为高等教育服务[4]。王丽丽从大数据时代企业资源的特点即数据性、知识性、信息性几个方面展开研究,论述企业档案资源整合的必要性[5]。宋辉宇提出把高校档案整合成一个资源共同体,实现专题化、集成化,以此来满足社会的各种需求[6]。陈艳杰指出档案资源整合具有重要的意义[7]。胡忠全指出只有档案资源的有效整合,才能确保后续档案管理工作的顺利进行[8]。张勇进指出政务信息系统整合有助于解决互联互通和业务协同的问题[9]。南洋指出云计算环境下进行高校档案信息资源整合,可有效降低信息技术给高校档案管理带来的风险[10]。赵彦昌指出充分运用大数据挖掘技术推进档案资源整合非常关键[11]。肖芃指出构建区域性大档案格局,使档案工作更好地服务于经济社会建设各个方面[12]。
目前学者及档案管理人员针对档案资源整合做了大量的研究,但是大部分从某一行业领域阐述了档案资源整合的必要性,或者提出了该领域内档案资源整合的困难与挑战,或者对该领域档案资源整合的未来发展提出建议,但档案资源整合的普适性特征并不明显。一方面,从不同的服务系统来看,据孤岛;另一方面,不同的机构站在各自的角度对数据进行理解和定义就产生了逻辑上的数据孤岛。简而言之,档案资源整合问题仍是现阶段迫切需要我们重点加以研究和解决的问题。
二、档案资源整合的意义和存在的问题
(一)档案资源整合的意义
2021年,中共中央办公厅、国务院办公厅印发《“十四五”全国档案事业发展规划》,明确指出档案作为重要信息资源,要加大档案资源开放力度,深入推进档案利用体系建设,这充分体现了党和国家对档案事业的高度重视[13]。随着科学技术的进步,档案资源作为一种原始记录,档案具备的高度真实、完整、广泛等独特性质决定了档案资源的整合与其他行业资源整合有着本质区别。档案文化资源整合具备一定的理论意义和实践基础,因此决定了档案文化资源整合更具系统性和精准性。近年来,伴随档案价值的日益凸显,档案文化资源整合工作逐渐提上日程。国际上已有众多档案资源整合项目成功运行,如英国的档案馆和收藏在线项目等,这些项目可以为我们档案资源整合提供借鉴[14]。
通过档案资源间的数据交换,形成一个更高效的档案资源系统,多方位推进档案事业高质量发展,因此档案资源整合具有一定的现实意义。从理论上看,运用大数据技术,促进相关联档案数据的分析,拓宽档案信息资源整合的研究范围。从现实意义上看,依托大数据技术进行档案资源的融合与深度挖掘,将档案数据转化为服务能力,增强用户体验感,推进文化产业高质量发展,具有十分重要的实践价值。
(二)档案资源整合存在的问题
实施档案资源整合,既符合档案管理自身的发展规律,又能满足公众日益增长的现实需求。近年来,档案资源的开发和整合工作逐渐在多层面得到认可和支持,推动了档案资源整合工作发展。然而,由于信息技术、人员管理、数据安全等因素,档案资源整合过程中仍存在一些难题。
一是档案数据安全存在隐患。档案资源涉及的领域比较广泛,从老照片到古建筑,从企业文件到企业发展史,从政府公文到民众生活,档案利用涉及生活的方方面面。在档案资源整合过程中档案信息的采集范围也逐渐扩大,由局部采集扩展到全面采集。然而,多源档案材料来源繁杂,参与主体较多,涉及部门众多,管理主体跨越多个领域,整合难度较大。随着数字化的推进,档案资源也面临着转型,逐渐由实体档案转变为实体档案和数字化档案并行的模式。就以河南省高校为例,郑州大学和郑州轻工业大学档案馆信息化程度很高,已经实现了网上预约、办理、远程服务的高效化和科学化,这与其有效的档案资源整合密不可分。但是,在档案资源整合过程中由于网络黑客攻击、人员素质参差不齐、数据泄露等各种不可控因素的存在,档案数据安全依然存在隐患。2020年国家安全机关排查发现某航空公司信息系统“遭到网络攻击,多台重要服务器和网络设备被植入特种木马程序,部分乘客出行记录等数据被窃取”[15]。大数据技术和网络通信技术为档案数据的高效收集和数据无障碍传递奠定了坚实的技术基础,互操作技术和跨库检索技术为档案资源整合、挖掘、分类和智能化检索提供了技术保障,然而技术应用带来的虚假数据、算法黑客、木马程序等,依然冲击着档案数据安全,需引起高度重视。
二是专业人才能力与需求不匹配。2021年颁布实施的新《档案法》,对档案的利用做出了明确规定:鼓励档案资源面向公众开放,要求档案馆通过多种途径发挥档案文化宣传教育功能,厚植爱国主义情怀。在大数据技术推动下,档案资源的价值逐渐凸显,不仅能化解社会矛盾,而且能维护广大人民群众利益。档案资源量的增加以及数字化时代用户需求的转变,即用户需突破时空地域限制,随时调阅部分档案信息,使得档案资源的服务内涵由单一性向多元性转变。档案工作的人才需求也在发生转变,由传统的档案管理员向复合型人才和创新型人才转变。例如,从河南省高校档案馆的设置情况来分析,在河南省内本科院校中,郑州大学、河南大学、河南工业大学、河南农业大学、信阳师范学院、河南牧业经济学院等学校的机构完整、设施完善,还有部分院校档案馆不独立(与本校图书馆或校长办公室联合办公),设备落后,档案人员兼职,档案资源整合意识淡薄,这说明高校档案在发展过程中人才专业能力无法很好满足现阶段的实际需求。新时期的档案资源整合与传统的档案资源整合有着显著的区别,档案工作人员除了需具备专业的档案管理知识、精通档案行业法律法规及相关行业的业务知识,还需具备信息化处理能力和面向知识型服务的技巧。如何顺应时代潮流,培养与档案资源整合定位相匹配的专业人才是亟须解决的关键点。
三是多源异构档案数据间不兼容。档案资源总量呈现上升趋势。截至2021年末,全国共有档案馆4 233个,已开放各类档案18 931万卷(件)[16],比2020年的17 659万卷(件)增加了1 272万卷(件)。此外,在大数据环境下,数字化档案资源总量也趋于增长模式。实体档案和数字档案的规模日益扩大,呈现多源性、多元性、分散性、异构性等特点,不利于档案资源的开发与利用。随着档案信息化建设的推进,档案资源总量逐渐增加,加强档案资源的开发和整合,优先实现“1加1大于2”的整合优化效果显得非常关键。然而,信息化时代,用户获取档案资源时不仅仅关注档案知识的广泛性、真实性及安全性,而且还关注档案信息获取的速度和档案信息使用的便捷性。如今档案的数据类型从单一来源转向多源异构,档案资源类型多样,除文书类档案外,档案资源还包括图纸、照片、录音、录像等形式。从线下的实体档案演变为在线数字档案和线下实体档案并存的运行模式,从馆藏为主演变为存储、运用、服务并存的运行模式,多元异构档案数据处于广泛征集阶段,档案数据间存在物理上和逻辑上的信息孤岛,而异构资源内容丰富,价值含量高,如何系统、全面融合异构档案数据,挖掘档案深层次价值是当前又一难点。
三、档案资源整合的实践路径
档案资源整合是一项涉及多主体、多层面的系统工程,为实现档案资源的有效配置,激发价值最大化,深入推动档案资源整合,可以从维护数据安全、优化人才队伍、细化资源整合制度、完善联动机制几个方面展开。
(一)加强安全防范,维护系统性数据安全
目前档案资源整合主要有两种形式:一种是外包项目的形式,直接与数字化公司签订整合协议,档案工作人员作为项目监督者,数字化公司负责技术和内容的整合;另一种是档案机构组建专门团队全权负责档案资源整合。不管哪种形式整合,档案数字化整合过程中因其载体类型多样、来源广泛、数量巨大等特点可能会面临病毒攻击、黑客入侵、档案自身易被篡改等风险。因此,有计划有步骤地推进依法治档,解决档案数字凭证的可取性问题显得尤为重要。首先,定性研究需明晰安全体制、安全模式、实现机制、建设体系和维护路径间的关系,建立完整的档案数据安全监管框架,筑牢档案数据安全维护网,严惩档案信息泄露、丢失等现象。其次,需扩展运用比较研究法。对比分析不同国家、不同领域维护档案数据安全的方法,总结经验和教训,完善研究方法,充实研究成果。再次,在档案资源整合过程中的档案数据具有易破坏性、易修改性、存储分散性等特点,要构建电子档案数字取证模型,完善数字取证的方案,提高数字凭证的可信度。
(二)优化人才队伍,聚焦工作目标
档案资源整合离不开专业人才队伍和其相关知识、技术、良好服务的支撑。因此,打造一支专业数据型人才队伍,凝聚跨学科交叉的力量变得十分必要。首先,可以对现有的档案工作人员通过考核机制进行选拔,选拔出一批学习能力强、服务意识强的档案工作人员,并对其开展大数据、信息化等相关知识的集中培训,使其能尽快适应档案资源整合的工作。其次,根据目标需求,完善硬件配置、软件配置与网络安全配置,并对专业人才实行集中管理、层内自主的工作模式。再次,跨行业、跨部门选拔高质量人才,设计具有良好可扩展性的数据库底层架构。根据任务需求与个人兴趣爱好,划分不同的攻关小组,针对具体问题开发不同的数据库系统功能板块。最后,加强与政府部门、档案系统各部门间的合作,充分调研用户需求,建立纳入用户评价的体系,发挥“需求导向”的档案资源的整合模式,促进档案文化自信体系健康发展。
(三)了解异构特征,细化资源整合制度
档案资源整合是一个持续的过程,由于档案数据类型不统一,在整合过程中存在异构档案数据,增加了整合的难度。档案资源整合的不同阶段要及时追踪异构档案数据具备的特征和表现形式,不断细化资源整合制度,做到档案资源整合的整个阶段有据可依、有据可查。明确档案资源整合的内容,根据实际成效和反馈建议,制定并不断完善整合制度,解决整合过程中资源共享难的问题,集成一站式的资源整合共享平台。融入新型技术,开发公共服务平台,解决异构档案数据引起的查档困难,实现档案资源获取机会平等和高效,提高公众好感度。
(四)完善联动机制,拓展资源整合广度
档案资源主要集中在政府机构、档案馆、图书馆、博物馆、社会团体等档案产生主体。档案资源负责部门需要明确整合的年度计划和目标任务,进行详细安排部署;涉及的整合部门不能只局限于本馆,而是要有大局意识,从宏观视角出发,根据各自馆藏的特色,积极配合资源整合,彼此间联动,拓展资源整合的广度,形成良好的氛围。同时也要完善资源整合的对接平台,及时化解资源整合过程中的问题。在信息化时代,运用先进的科学技术促进语义识别技术智能化,促进资源整合过程中元数据转换和档案数据关联。通过统一的元数据把档案资源转化为标准形式,通过资源映射和关联,实现不同语义但主题一致的档案信息关联,加强档案信息的提取和挖掘,进一步促进档案资源整合。
四、档案资源整合模型构建
(一)档案资源整合模型构建思路
档案资源整合模型的构建是一项庞大的工程。在构建模型前期,需要制定出资源整合模型的构建流程,如图1所示。只有对来源不一的档案资源需要认真梳理,统一档案资源的存储类型,更新整合技术,完善整合方法,才有可能构建出智能化、一体化、便捷化的档案资源信息共享库。
从宏观上看,档案资源整合模型是一个动态的模型,分为资源和评估两大层。资源层可以分为整合、管理、服务、反馈4个方面,收集档案资源、统一资源模式、管理层审核、服务用户群体、根据服务成效及时反馈、加入动态链接,丰富档案资源库。在评估层,通过对资源层中档案资源整合的外部特征和语义特征进行综合性评估,实现资源间整合的关联性和资源整合方法最优化。
从微观上看,在档案资源整合过程中需规范元数据模式,不同来源的档案资源在统一元数据模式下,关联网络图更加清晰明了。通过整合梳理了档案资源间的关联性,挖掘了档案资源间的深层次价值,有利于大档案的形成。
图1 档案资源整合框架图
(二)档案资源整合模型层级划分
整合层。整合层是资源整合的前言,对服务质量有着重要的影响力。各档案机构需完成数据的采集、识别、转换、存储工作。不同部门的档案在原始资料形成过程中采用不同的数据管理系统和不同的存储方式,由简单的文件数据逐渐演变为网络数据库,并逐步形成异构数据系统。档案资源的特点是数据来源不统一,导致元数据的存储和表现形式不一致。档案资源的整合层提供了元数据标准规范的数据模式,在整合过程中需要系统自动检索档案信息,然后挖掘元数据,统一元数据的存储模式,用大数据技术对异构的档案资源进行元数据转换,解决格式不兼容、类型不统一的问题,实现多源档案数据的关联,节省数据存储空间,提高档案资源的利用率。整合层主要是对“多源、多元”的数据结构和数据类型通过整合元数据的存储方式,使档案资源间的数据发生关联,格式统一,确保档案资源整合的质量。
管理层。管理层是档案资源整合的核心,在档案资源整合过程中的数据加工和人员指令下达需要管理层决策。档案资源在整合层对类型和文件格式不一致的元数据进行相互间转换,实现了元数据的一致性存储。管理层需要加大档案资源挖掘开发的力度,通过抽取元数据的特征,进行语义识别,形成一个以图表、数据、事实等为知识单元的资料库。通过主题树、知识图谱、知识关联矩阵等不同的整合方式标识各种资源间的关系。通过分类、重组、关联等方式进一步挖掘出关联档案资源,使档案资源的隐形关系逐渐显性化。同时,管理层下达指令对关联档案资源进行整理编研,增加档案资源标识的深度和广度,为智能化检索提供数据支撑。管理层还涉及人员管理和整合制度的制定,其中人员管理包括人员工作安排、人员权限设置、人员安全管理等。通过加强人员管理,规范档案资源整合流程,进行数据安全备份,防止数据流失,提高整合效率。
服务层。档案资源整合的最终目的是方便用户使用,为用户提供一站式智慧化检索服务平台。通过平台的检索,用户可以快速、全面、智能地获取所需档案信息。档案资源整合的服务层包含了一站式检索、用户使用导航、用户数据统计、个性化推送等面向大众的服务功能。一站式检索,即用户输入关键词,在档案资源整合库中的数据根据关键词进行及时匹配,关联数据按关联程度紧密性进行顺序排列,实现输入式、语音式、视频式、图像式等不同表现形式的智能化检索。用户使用导航,即在数据库系统中设置了按时间、地点、专题、使用场景等导航方式,档案资源系统集合不同馆藏的资源,融合可视化设计,设置多维度导航功能将档案资源更直观地呈现给客户。用户数据统计,即用户使用档案资源的形式不局限于视频、文字、表格等功能,可以针对用户使用档案资源的情况进行数据统计,综合运用条形图、汇总图、折线图等各种更加直观的表达形式,方便用户对各种主题和资源使用情况的精准掌握,有利于挖掘关联档案信息,系统掌握知识。个性化推送服务,即在档案资源整合过程中,根据用户的现实需求,为档案用户开展个性化服务,在此过程中用户的数据收集和特征抽取是关键。可以分类别进行,根据用户对档案资源的查阅量和浏览量将档案用户群体分为必然用户和偶然用户。必然用户是经常使用档案信息,对档案资源需求量大,不仅是档案的接受者,而且是档案的传播者。资源整合的核心在于针对这类用户进行静态行为特征、动态用户轨迹和行为习惯的主题整合,锁定必然用户的持续关注度。偶然用户指不经常使用档案信息,只是偶尔查阅一下档案信息的不固定群体,可以针对此类偶然用户进行特色档案资源的整合,吸引其他档案用户的关注,有利于开拓新的档案用户群体。
反馈层。档案资源整合的目的是挖掘档案价值,提高资源利用率。因此在档案资源整合过程中需要不断反馈,以完善数字档案资源的数据连续性和多元主体协同创新为指导目标,以用户的满意度和档案资源的实际利用率为指导方向。监管和投诉是档案资源整合信息反馈的有效渠道。资源面向用户群体进行服务时,管理者运用信息技术手段,对档案资源整合的问题进行实时监管,确保档案资源整合的真实性、完整性、稳定性。在上述基础上,对服务的反馈进行层次预警。预警分为三个层次,依次递增,预警的部分呈现出精准性、全面性。而处于反馈层次的档案资源在接受预警后以指示状态呈现给管理者,指示具备及时性、精准性,确保管理者能对照服务过程中发现的问题,及时查找原因,通过采取一系列改革措施,精准找到相应的对策,进行完善整改,提高服务的质量,如图2所示。
图2 档案资源整合与服务反馈机制
(三)档案资源整合模型评估体系
评估体系是提升整合效率、增强用户良好体验感的关键,通过访谈和问卷调查的形式,构建了档案资源整合的评估指标体系。这个指标体系包含整合层、管理层、服务层、反馈层4个一级指标。整合层这个一级指标下面又包含了档案资源多样性、软硬件设施、资金支持3个二级指标。管理层这个一级指标下面又细分了资源存储管理、网络信息化管理、存储安全管理3个二级指标。服务层这个一级指标下面包含了档案服务对象、档案服务机制、资源共享程度3个二级指标。反馈层这个一级指标下面包含了监管机制、投诉机制、用户满意度3个二级指标。接下来对这些二级指标又进一步细分,一共细分成24个三级指标,如图3所示。动态评估主要是对档案资源整合的情况从4个层次进行综合性的评价,在反馈层给出的指示基础上,依据用户具备的高效性、精准性、真实性的特征,经过评估层的检测,明确在资源整合过程中不健全部分,实时把评估结果反馈给管理层。由于数据信息量大,经过评估层的缓解,管理层能精准、简洁、直观地掌握需要整改部分,提高资源整合效率,促进资源利用率的提升。
图3 档案资源整合模型评估指标体系
五、总结
从目前来看,档案资源整合与其他类型的文化资源整合存在本质上的区别,但其对于社会发展的重要性不容小觑。档案资源的整合能有效拓展服务领域,便于缓解档案馆藏和利用的矛盾,推动社会主义和谐社会的发展。本文在对档案资源整合的现状进行分析之后,发现在整合过程中依然存在一些问题,特此提出了整合的实践路径,搭建了整合的基本框架,建立了档案资源整合的模型,把整合过程分为整合层、管理层、服务层、反馈层,随后确立了档案资源整合模型评估指标体系。通过完善档案资源整合模式推动资源的深度融合,促进档案事业和档案文化高质量发展。