基于元数据的电子文件管理
2014-11-11张其林
张其林
[摘 要]电子环境下,因为电子文件极易被不留痕迹地删减,人们通常借助元数据来保证电子文件信息的原始性。元数据可以动态及时地获取流转情况,可以反映电子文件的原始状态。在电子文件管理系统中,元数据在电子文件管理工作环节进行有效全程控制,成为实施电子文件管理的技术保障和管理系统的关键。
[关键词]元数据;电子文件;文件管理系统
经济全球化、社会信息化趋势下,计算机和网络技术的发展使电子文件的数量和种类飞速增加,社会的不断进步使人对档案信息的价值也愈加重视,对其利用的要求也在不断提高。电子环境下,人们通常借助元数据来保证电子文件信息的原始性,因为电子文件极易被不留痕迹地删减。元数据可以记录下电子文件的流转情况,包括自设计,经由形成、传递,直至维护的全过程,因此要想对电子文件进行安全而有效的控制,保证其原始真实性与凭证性,必须掌握元数据信息,来对组织、检索文件信息。
一、电子文件管理中应用元数据的必要性
目前在很多专业领域,特别是在与设计与创建信息系统以及保管和利用信息资源有关的领域中,元数据已经成为一个常见的重要术语,扮演着数据管理的重要角色。关于元数据的定义目前并未统一,因为元数据的实质是“定义和描述其他数据的数据”,所描述的数据内涵与外延、内容与目的等存在不同,但概括地讲是记录信息对象的内容、背景与结构特征的,全面、系统和有序的数据集。因为元数据能够如实记录文件的特征、动态及时地获取流转情况,因此将元数据运用于电子文件的管理工作中具有重要意义。具体而言:
1.引入元数据利于维护电子文件信息的真实性与凭证性。由于元数据有自身表达信息的基本方法与规则用来记录文件的内容、背景信息和结构化数据,采用标准化的的语言规范进行编码式描述,并且能够动态跟踪文件信息变化,不会因为原电子文件的变动而失效,不再不过分依赖载体和数据环境,能够较少地受到环境和系统因素影响。元数据还能关联纸质拷贝件,记录文件变动,提供数据转换信息,保证可靠证据性。
2.利用元数据来组织和管理电子文件,挖掘资源信息,可以降低管理的风险。元数据中除却对单份电子文件本身,还包括对与文件信息对象相关的管理信息,诸如搜索与定位,以及电子签名、文件转换方式、保管条件、数据使用范围等背景及技术状况方面信息,以及与其他资源的版本链接、数据来源等的关系,有效改善电子文件管理模式,更大程度上避免人为因素和意外风险,步入科学规范化轨道。
3.经由元数据可以提高电子文件的检索与利用率。元数据对原始文件特征的描述与定位,便于创建用户通过计算机来准确定位文件信息,了解文件内容,便捷地获取所需信息。而且利用元数据系统,可以为不同形态的数字资源提供规范的检索工具和更多检索入口,用户使用多样化、智能化的检索途径,可以节约时间,提高效率。元数据是经过提炼和加工的数据集合,信息冗余度降低,可以提高信息资源的利用率。
4.采用元数据能便于电子文件的分布式管理,为多元化的数字信息资源提供整合的工具。元数据是描述性数据,又富有结构化特征,用户根据元数据建立的文件信息的关联数据目录,可以共享信息数据,便于对文件的存取以及管理。元数据还支持用户决策,利于电子文件信息资源的开发和优化。
二、元数据在电子文件管理系统中的应用
元数据是实施电子文件管理的技术保障,通过对元数据在文件管理各阶段的工作情况进行解释,来了解在这一过程中的元数据应用状况及所发挥的作用。
(一)电子文件设计阶段
元数据集自电子文件或者文件集合创建之时便自动生成,并始终伴随文件的运转而进行修补、优化,元数据系统便在文件管理系统中记录系统的操作过程,因此文件管理系统在设计伊始,必须考虑元数据模型的设计,将电子文件不同阶段的各种管理要求体现在系统设计中,并进行系统分析。对元数据模型进行设计时,一般由档案工作人员从专业角度规划、设计元数据的工作模式与原理,提出要求,然后由技术人员进行研发、实现。元数据的大部分操作工作一般通过系统的自动完成,但是系统的遗漏内容则由系统管理员和文件的使用人员等进行完善。
(二)电子文件形成阶段
此处所言电子文件的形成,是指进入到文件管理的运转系统,而非传统意义上的制作与生成。文件档案管理机构目前所保存和管理的电子文件绝大多数来源于相异的桌面应用系统,这些电子文件被创建和制作后,经由作者导入到文件的运转系统时,经过格式转换等标准化处理的文件会自动生成相对应的数据元记录表,元数据随即开始即时、动态地获取、捕捉、登录电子文件的有关信息,最后有作者适时作补充。至此进入管理系统中的电子文件形成,元数据与电子文件的内容信息构成对应的映射关系,作为标准预设与文件管理系统初级阶段的元数据,作为持续的动态过程存在。不同文件类型的元数据元素在格式、编码等方面会有所差异,所以元数据的标准液应该有所不同,但是大部分的元数据元素区别不大,所以工作模式也相似。
(三)电子文件运行阶段
电子文件是在电子环境产生的,作为依据而形成和使用的文字记录。电子文件的运行,即是对其操作和运转的过程。电子文件在被传送到某用户伊始,直到操作完毕被保存至文件库的整个运行过程,系统会自动记录下文件的传输路径、身份验证消息等,以及用户对文件的存入导出的操作过程,元数据随着文件内容的不断补充而得到完善。另一方面,通常情况下,用户不能对文件内容作直接改动,对元数据的补修便是对文件的操作。
(四)电子文件的维护阶段
1.在电子文件的鉴定与归档环节
电子文件的鉴定工作需要元数据来提供重要依据。电子文件鉴定既包括内容的鉴定也包括技术的鉴定,主要判断以被存入文件库中的电子文件是否具有保存价值,并作相应处置,风险性很高,需要很高的智力和专业的技术支持。因为文件个体存在差异、文件间关系错综复杂,必须需要专业技术人员和管理人员的参与,不可能只是自动通过系统预设的程序完全完成鉴定。但是借助人工的识别与鉴定时所需信息主要还是源于元数据。
确认具有长久保存价值的电子文件被整理、保存到档案保管系统的档案库后,元数据也会随之一同被移入。档案的保管系统对电子文件和元数据进行一系列验证、检查、定位保存的过程,元数据本身也在不断即时地对文件的处理、操作信息进行存取和补充,始终处于动态的建构过程。元数据记录的这些信息,都会协助对文件的归档工作。
2.在电子文件整理与保管阶段
为使电子文件管理系统更加安全、条理、秩序化地运转,必须对系统所保存的文件进行整理,并成为管理系统的核心。运转系统中,电子文件被频繁地输送、利用,而元数据在此阶段是系统操作的直接对象。系统通过对元数据相关元素内的继续补充、提取与重组,来完成文件的组织加工。由于文件运转系统中电子文件的保管意义非常重大,在存取和利用过程中,稍出差错便可能造成文档的破坏或丢失,给当前及日后利用带来不可挽回的损失。为了维护电子文件的可读性和安全性,保持文件的有序形态,延长其使用寿命,对于信息系统中的电子文件,可以采取多种技术手段和措施对文件实施信息保护。电子文件元数据会跟踪记录文件保管的过程及结果、系统操作的轨迹,能够为信息保护适时提供可供装载的技术空间和记录平台。
3.在电子文件检索和利用阶段
电子文件管理系统最终目标即是为用户提供信息资源的利用,将元数据引入文件的检索和利用过程,将会提高信息的检索效率,优化资源的利用率。检索过程中,元数据会智能化分析所作用户检索记录信息,了解用户检索需求,将检索结果与信息反馈给用户。另外,电子文件元数据在用户管理工作环节,会设置与用户权限相对应的被访权限、存取要求和规则,防止非法入侵等导致的信息外泄,对电子文件信息实施严格保护。未来的用户将更多地通过网络来检索利用电子文件,然后由于目前各地区各领域中电子文件组织方式可能存在差异,无法很好地实现信息共享。而元数据标准的出现,将可以使用户通过一个查询界面就能查到所有相关的文件信息,如EAD(简称档案编码记录)便是一种具有这样功能的元数据标准,用以表达文档检索工具逻辑以及各部分之间联系,目的在于使检索工具中的描述信息变成计算机能够处理的结构化标准信息。
4.脱机电子文件的管理
电子文件不可能一直保存在电子信息管理系统中,如果这样系统数据库将会超负荷工作,工作效率将会受到严重影响。所以,有价值的电子文件将定期被脱机保存,就目前的条件而言,我们将非现行的、同时又具有保存价值的电子文件导出信息管理系统,保存在磁带、磁盘和光盘中,甚至转换成缩微胶片。对于这些脱机保存的电子文件,系统要想掌握原文件的目前情况与信息,管理文件,只能通过保存在系统中的元数据才能建立与原文件的关联,因为元数据便是沟通二者的渠道。
参考文献:
[1]刘越男.对电子文件管理元数据的再认识[J]档案学通讯2005年第2期
[2]黄萃.基于元数据的电子文件全程管理[J]档案管理2003年第4期