电子档案的著录探究
2015-08-15陈杨
陈 杨
(大庆市让胡路区怡园社区工作站 黑龙江 大庆 163000)
一、概念
电子档案管理系统中的信息记录系统,是电子档案原始性、真实性、完整性和系统性的保障系统,也是便于日后电子档案利用的切实保证。而该系统的建立是依靠电子档案的著录来完成的。同时,档案检索系统的建立也是通过对电子档案的著录来实现的。传统上,人们一般认为,著录纯粹是为建立档案检索系统服务的,对电子档案进行著录的工作则并不仅仅是为了建立检索系统,这就是电子档案著录与传统档案著录的有着差别的地方。如在传统档案著录中对档案著录是这样定义的:档案著录是在编制档案目录时,对档案内容和形式特征进行分析、选择和记录的过程。档案著录是获取、核对、分析和组织信息的过程,该信息能用于识别档案、管理档案、确定档案存址和说明档案,并能够解释档案的背景环境以及产生档案的文件系统。
二、电子档案著录的类型
电子档案的著录根据电子档案产生的系统不同,分为前控著录与后控著录。所谓前控著录与后控著录,其主要的区别点是著录的起始阶段不同,前控著录是起始于电子文件创建阶段,而后控著录则是起始于归档的电子文件经整理之后的编目阶段。电子档案的著录为什么会形成这两种类型的著录呢,这主要是与电子档案所产生的计算机信息系统不同有关。而电子文件是随着计算机的产生而产生,随着计算机的发展而发展。在经历了半个世纪的发展历程中,对大型机和PC 机中数据库系统和文字处理系统所产生的电子档案的著录早已存在,但是这种著录都是在电子文件归档并经整理之后进行的,也就是说是一种后控著录。应该说,直到目前为止,电子档案的著录仍然是后控著录占据着主导地位。
三、电子档案著录的规则
电子档案著录的规则,是电子档案著录中不可缺少的,其根本目的是规范电子档案目录信息的内容、形式和结构,从而使电子档案的目录数据能够交换,电子档案的信息资源能够共享,并使电子档案的目录数据能独立于计算机的硬件和软件,从而建立起高质量的、数据标准化的检索系统。电子档案的著录规则从级别上可以划分为三个层次:即电子档案的数据结构著录规则、电子档案的数据内容著录规则和电子档案的数据值著录规则。
(一)电子档案著录的数据结构规则
所谓的电子档案著录的数据结构规则,就是专门对电子档案的著录事项分成哪几类作出规定,并确定每一类中要著录哪些著录事项。例如,数据结构规则可以将文件责任者分为团体责任者和个人责任者著录项,可以规定文件的起讫日期著录项及文件类型著录等项。
(二)电子档案著录的数据内容规则
所谓的电子档案著录的数据内容规则,就是为在数据结构规则中具体著录某一著录项的数据时提供著录规则,如规定著录顺序、著录方式和著录的表达形式。
(三)电子档案著录的数据值规则
所谓的电子档案著录的数据值规则,就是对由数据结构规则规定的著录项中所使用的术语词汇进行控制。在著录中所使用的主题词表、分类法和名称规范文档就是能使术语词汇达到规范化,从而使电子档案的著录结果有助于检索效率的提高的工具。在电子档案中所使用的名称规范文档有助于使对同一个对象所使用的一系列的不同名称中确定一个规范名称,并以此规范名称作为电子档案检索系统的检索点,而其他未被选作规范名称的词,则通过参照参见至规范名称。
四、电子档案著录的实施
电子档案著录的实施,就是具体地对电子档案进行著录。如上所述,由于电子档案著录规则有三个层次,所以在具体对电子档案实施著录时,也就有相应的三个具体的方面。
(一)电子档案的数据内容著录规则的实施
对电子档案的完整的著录有赖于电子档案著录规则的完善。但是,就目前而言,在我国电子档案著录规则尚未形成一个完整的体系。目前,我国著录电子档案所能依据的内容著录规则就是《档案著录规则》(DA/T18-1999)。但是,我们知道,电子档案的类别很多,从用途来看,有数据文件、程序文件、数据库文件、机读索引、字处理文件、电子表格、电子邮件和电子报文等;从记录形式来看,有文本文件、图象文件、图形文件、影像文件、声音文件和多媒体文件等。根据我国目前实施的《档案著录规则》(DA/T18-1999),对电子档案进行著录有很大的局限性,主要是不能完整地反映电子档案的构成特征。
如果电子档案是存储在磁带上的电子文件,按目前这一著录格式进行著录,那么对于磁带盘的种类、磁带道数、信频带密度、使用字符编码、逻辑记录长度、物理与逻辑记录长磁制、生成文件的操作系统等特征信息也无法表达。
目前档案著录规则不适合于电子档案著录的根本原因,从著录格式的著录项目设置上看,首先,在表达电子档案结构上,著录项太少,因为电子档案除了要著录结构的“载体类型、数量及单位、规格”这些特征信息外,还要著录字符、字节、文本类型、文件的页面格式、文件的逻辑格式”等,如果是程序文件档案的话,还要著录“版本、编程语言”等;其次,这一著录规则缺少对产生电子档案信息系统的著录要求,以至于产生电子档案的“应用软件、操作系统、文件名(亦数据集名)及硬件环境”等方面的系统信息无法著录,很显然,目前这种著录项目的设置,不利于电子档案的著录,因为“电子文件是适合于数字电子计算机操作、传递和处理的文件”,不著录系统信息,电子档案又怎能适合电子计算机操作、传递和处理呢。
(二)电子档案数据结构著录规则的实施
电子档案的数据结构著录规则在宏观层面上,即对构成档案著录单位(在我国档案著录中通常也称著录对象,即被实际著录的一份文件或一个案卷等)的目录数据的总体组织与安排,这种组织与安排构成一条电子档案目录记录的总体框架,从而形成档案目录数据著录的框架格式;在微观层面上,即对构成档案著录单位的目录数据的具体编码,这种具体编码构成一条目录记录的各数据项(或称数据元)在逻辑上的有序排列,从而形成档案目录数据的可被具体显示、操作、检索的执行格式。
[1]王萍,赵丹阳,王志才.电子档案著录新理念[J].档案学研究,2008(06).
[2]应海燕,乐淑芳.《档案著录规则》适用性初探[J].兰台世界,2006(170.