探究电子档案元数据管理方案策略
2021-08-13金彩平
摘 要:电子档案元数据管理方法与水平直接影响着保存电子档案的真实性。为充分发挥出元数据的优势,本文对电子档案元数据管理方案进行深入分析,在明确管理系统技术架构、功能模块、数据库以及元数据管理设计的基础上,对元数据管理方案展开对比与评价,希望为电子档案元数据管理方案的实施提供科学参考与借鉴。
关键词:电子档案;元数据;数据库;管理方案
前言
电子档案具有十分重要的保存價值,是指实体档案数字化过程中产生的一类文件,具有体积小、容量大、检索便捷等特点。在实际应用过程中,元数据管理成为电子档案有效保存应重点解决的问题。在大数据、云计算、互联网等技术快速发展的背景下,有必要应用成本效益、工作效能、可操作性优良的元数据管理方案,以此实现电子档案管理系统的优化。
1 电子档案元数据管理系统设计
1.1 元数据管理原则
元数据的功能定位与模型描述是整合电子档案资源、创建档案利用服务的关键,在从整体角度分析电子档案元数据这一核心系统时,首先,尊重档案、尊重客观、尊重元数据与整体间的有机联系,以此保证元数据与档案内容信息间的关系,可通过可视化、可理解的形式展现出来。其次,注重电子档案不同生命阶段中内容信息的著录,坚持前端控制与全过程管理原则,实现档案数字化管理系统有效运行。最后,注重元数据扩展性、互操作性、标准化功能的运用,使得元数据与电子档案内容信息间构建起有效的逻辑关系,从而实现信息共享与数据交换。
1.2 系统技术架构
电子档案元数据管理系统是以JAVA为开发语言、MYSQL为后台数据库系统、XML为系统配置技术,在JE22平台上创建起来的,严格按照文档一体化理念进行设计,各功能模块、业务层独立且协同工作,具有较强的互操作性与扩展性。前台展现层、系统业务层、系统服务层、数据访问层、数据存储层构成了电子档案元数据管理技术架构,强大的用户展示、档案数字化业务管理、系统开发服务、数据存储与转移功能,极大地提高了元数据的利用效率。系统技术架构如下图所示[1 ]。
1.3 电子文件元数据管理设计
1.3.1 元数据生成。元数据生成主要是对元数据的值域以及潜在选项进行设置,最终形成确定的元数据内容。为避免转换元数据格式时出现错误,采用统一软件处理生产到汇交阶段产生的元数据,并将确定元数据的内容保存到数据库中。在移交文档时应注意数据集名称、形成时间、数据格式、专题类别的注释,以此保证界限使工作能够顺利开展。
1.3.2 元数据捕获。捕获元数据需要按照国家与行业相应的标准进行,利用装置自动采集与数据源对应的信息数据。首先,利用人工著录、系统自动生成选择数据库中电子档案元数据值域,然后导入相应的元数据,以此完成生产、汇交数据业务。其次,由于部分电子档案元数据隐藏在运作环境中或是系统运行环境之外,一般采用人工著录结合计算机的方式捕获元数据,然后由系统自动标识出元数据的捕获时间与地点,计算机自动捕获方式的加入,极大地减小了人为误差,保证了元数据与电子档案内容信息的真实性与凭证性。最后,为进一步提高电子方案元数据的价值与质量,需要检查元数据内容、逻辑等其他方面的内容,充分发挥出质量控制的作用。
1.3.3 元数据封装。电子档案元数据封装是实现系统与档案功能模块数据交换、信息共享的关键。因此,将元数据封装在电子档案管理系统中才能实现数据交流功能。首先,按照档案卷宗级、文件级、全宗级对元数据进行封装,完整的数据封装包可作为系统交换数据的基础单元。其次,保证每一数据封装包中含有一个基于XML结构的本级数据文件,并将若干个电子档案元数据与一个基于XML结构的元数据文件封装在一起,多个文件封装包便形成了基于XML结构的案卷级数据文件,以此类推可获得全宗级数据文件。最后,按照《DAT/48-2009基于XML的电子文件封装规范》进行电子文档元数据封装操作,要求元数据封装包应根据电子签名、版本信息、格式描述等进行统一打包处理,以此保证技术架构在发生变化时,电子文档仍可实现数据交流与文件共享。各级数据封装包如下图所示。
1.3.4 元数据维护。维护元数据的目的是持续电子档案与元数据间的链接,避免因保管方法、档案迁移影响电子档案间关联的稳定性与文件的完整性。一般情况下,元数据维护采用文本方式切入、嵌入元数据规范,同时结合属性描述、编码处理、加密处理等方式对文件进行封装[2 ]。我国电子档案安全保障策略具体指:封装格式属于电子文档的利用、交换与保存以及其他相关形式,与硬件、软件间不存在联系。表明文档一体化需要将数据融进抽象性行为中,以此形成有机统一体。封装后的元数据与电子档案的信息、结构、内容在逻辑层面上具有一定关联,有利于保证元数据要素的有效性。
1.4 功能模块设计
1.4.1 参数设置模块。参数设置模块功能的实现,应以档案管理员、系统管理原用于参数管理权限为前提,从而参加到电子档案元数据的领导、案卷、全宗、清理、刷新、缓存等功能的实现过程中。参数设置具体流程为:选择参数设置模块后,选择添加或删除参数,以此实现各功能。
1.4.2 归档收集与管理模块。归档收集主要是利用数字化扫描的方式收集实体档案,可分为文档上传、OA在线或离线导入、公文导入等多种实体文档上传方式。其中,文档上传是文档目录数据以及全文数据进行压缩处理;OA在线或离线导入则是在电子档案元数据管理系统运行与离线的环境中,由网络向指定对象传送电子文件;公文导入主要是在文档上传完成后进行,根据文档的导入日期、档案与数据类型等信息完成导入,实现电子档案元数据的自动分类。完成归档收集工作之后,需要对电子文档进行归档价值判断、电子公文自动归档、数据维护与案卷调整等维护工作,及时剔除无价值的归档文件,以此保证电子档案元数据管理成本效益与工作效能。
1.4.3 档案查询与管理模块。“查询”作为电子档案元数据管理系统的重要功能,对提高核心档案业务数字化具有重要意义。档案管理人员在登录账号来到用户界面后,在指定位置处输入文件编号、题名等信息便可自动搜索到相应的文件与项目。在此过程中,指令会传输到后台数据库层面,由数据库判断与查询信息相符的文件,然后向档案管理人员显示包括文件责任者、日期、发文字号等信息的全文目录。若为秘密文档,则需要用户输入文件密级。针对档案查询的管理功能,具体分为专题分类与专题组织两大部分,以此实现档案管理人员新建文件名或专题档案、删除专题名或專题档案、取消发布专题等业务。
1.4.4 档案销毁与利用模块。档案销毁与利用一般在接收移交电子档案之后进行。接收移交电子档案采用脱离系统保管的方式进行档案数据的备份,为后期制备多套档案数据奠定坚实基础。销毁、利用电子档案元数据,主要依据为:一,服务器空间。二,国家档案法相关规定。三,机构的人力、物力、财力等条件与资源。销毁后的电子档案元数据将不会在管理系统中查询到,档案管理人员可根据需求选择批量销毁或是单件销毁。档案的利用要求管理人员获得审批后,才能查阅到秘密级电子档案元数据,秘密级权限到达审批时间点后便会自动结束,一般为24小时,以此全面保证系统的安全性,并有利于充分发挥电子档案元数据的利用价值[3 ]。
1.5 数据库设计
数据库作为电子档案元数据管理系统的重要支撑,在后台运行中扮演着不可替代的角色。设计数据库需要遵循层次分明、布局合理、结构规范、数据独立、数据安全等原则,从而实现数字化管理系统高效、合理运营。在数据库中,电子档案元数据以及电子档案内容信息会按照来源、档号、电子签名、形式特征、电子属性、数字化属性等进行合理划分,并且元数据包含了各类信息数据的业务状态、行为、实践、依据与描述等,为数据库描述、判断元数据与电子档案内容信息提供有力的支撑。因此,只有进一步规范数据库设计,才能保证电子档案元数据管理方案策略获得有效凭证,实现后续电子档案维护与利用有效性、真实性的提升。
2 电子档案元数据管理方案对比
2.1 四种管理方法分析与对比
电子档案元数据管理方法包括内封装、半封装、不封装与特定封装四种类型,四种管理方法的分析与对比结果如下所示:
第一,内封装。VEO、Mets、Bueketsl等都属于内封装,通过“绑定”电子档案内容信息与元数据而形成一个完整体,可将档案内容信息转换为64编码后,与元数据一同封装在XML结构中,或是将元数据直接封装到不做编码处理的档案内容信息中。在计算机系统中,文本、影像、图形等电子档案在理论上均可以二进制储存,内容信息经过编码处理后封装在XML结构中,但在执行效率上、工作效能等方面存在一定不足,还可能存在超时问题。将元数据封装在档案内容信息特定位置处的方法,其真实性与凭证性有待进一步校验,并且许多常见的格式在嵌入数据过程中无法实现,需要对管理技术与开发工具进行更深层次的研究。
第二,半封装。运用此种方法时,电子档案内容信息无需编码处理与单独存储,直接将电子档案信息写在元数据封装包的存储位置处,也就是将元数据看作单独使用的XML结构。由于XML结构拥有单独保存元数据封装包的路径,提出了电子档案内容信息与元数据间的逻辑关系,需结合系统开发实际需求进行合理选择。
第三,不封装。不封装与半封装具有一定相似性,所管理的电子档案元数据以结构形式存在数据库中,且与内容信息间无需进行封装处理,对电子档案保存格式进行管理,便可增强二者间的逻辑关联性。但是电子档案长期保存的时间,以及电子档案内容信息与元数据间的真实性、凭证性,有待进一步验证[4 ]。
第四,特定封装。此种电子档案元数据管理方案需要验证元数据与档案内容信息的身份,以此保证电子档案存储的凭证价值。经过加密处理后的电子档案元数据会以形态化的数据存储在数据库中,而电子档案内容信息不用进行编码处理,直接以非结构化形式独立存在数据库中,二者通过封装字符产生有效关联,在一定程度上实现了直接封装电子档案元数据与内容信息的目标,并且真实性与凭证性可通过验证。
2.2 实施管理方案的策略
2.2.1 可行性评价。数字化档案管理经过数十年的发展,各部门已经拥有电子档案元数据管理方案的成熟做法与经验。按照国家现行规范标准与工作文件,在设备转型、存储格式、图像处理、质量检查等工作上给出了明确的技术标准。因此,实施电子档案元数据管理的机构应从人力资源、技术设备、硬件条件等方面全面考虑数字化业务运营的效率与质量,并作出科学合理的规划与准备,切勿将电子档案元数据管理看作单纯的数据存储工作。此外,企业与机构还应考虑到时代发展的需求,对实施数字化档案管理业务进行全面的可行性与必要性评估,以此降低系统升级与转型带来的风险与压力,充分发挥出电子档案元数据管理方案策略的优势与作用。
2.2.2 工作效能评价。在选择电子档案元数据管理方案时,一方面,保证元数据形态统一化。在将纸质档案转换成电子档案过程中,为避免部分实体文档在业务系统之外流转,与数字化文档形成混合系统,应对电子档案元数据管理与储存流程进行全面评估,以此保证系统运营效率。另一方面,注重电子档案元数据管理的规范性。在独家规范标准允许的前提下,可销毁部分无用的实体文档以减少存储元数据的空间与后期维护成本[5 ]。
2.2.3 成本效益评价。通过对比分析内封装、半封装、不封装与特定封装四种电子档案元数据管理方案,发现内封装档案存在工作效能较低的问题,半封装与不封装管理方法下元数据与电子档案内容信息的真实性与凭证性有待验证,并且三种管理方案做耗费的成本较高。特定封装作为一种安全有效管理方案,不仅扩展能力强,而且元数据使用效率高,在系统开发过程中的复用性也较强,极大地降低了电子档案内容信息与元数据身份验证、技术架构变化产生的风险。在数字化业务进程加快的背景下,相关机构与成员需要对管理方案的成本与效益进行全面的量化评价,从而实现元数据管理方案策略科学化水平提升的目标。
3 结论
综上所述,元数据管理作为电子档案工作中的基础性工作,对加强档案数字化、信息化具有重要意义。因此,档案工作者应在工作中主动创新,明确内封装、半封装、不封装、特定封装元数据管理方案策略的优势与劣势,并合理运用电子档案信息系统,以此加强档案内部信息间的关联性,为后续电子档案管理与应用奠定坚实基础。
参考文献:
[1]展霄鹏,王慧,康晨炜.浅谈电子文件、元数据、四性检验与电子档案的关系[J].兰台内外,2020(18):27—28.
[2]李飞荣.基于文档一体化管理的电子公文档案管理系统设计与实现[D].湖南大学,2018.
[3]张洋.数据转型背景下的档案业务过程数字化策略研究[J].山西档案,2020(02):131—137.
[4]顾嘉.浅析“互联网+”企业智慧档案网络平台的构建[J].黑龙江档案,2019(02):45.
[5]崔杰,田伟,任天琪.新时代档案元数据核心集构建的创新研究[J].档案天地,2018(12):29—31.
作者简介:金彩平(1981-),大学学历,浙江省嘉善县城市建设档案馆馆员,主要从事城建档的收集、审核、整理以及数字化工作。