数字档案馆结构研究
2010-05-31宋玉涛张先俊
宋玉涛 张先俊
(河南省电力勘测设计院,河南 郑州 450007)
数字档案馆是档案行业的新兴事物,是国家档案事业信息化建设的重要历史发展阶段。中国电力规划设计协会《电力勘测设计行业档案工作发展三年(2006~2008)规划》要求:加大档案信息化建设投入,实现档案管理方法和管理内容上的转变,在电子档案管理软件应用技术上取得进展,使电子档案管理在转换为勘测设计能力上有明显体现;尽可能建立本单位的数字化档案馆。
近年来国家在深圳、青岛两个档案馆试点建设数字档案馆,并将成功经验向各行业各地方推广。那么什么是数字档案馆?在总结成功经验的基础上,目前大家比较认可的定义是:以网络为支撑,以数据库为核心,以档案专业的管理软件为工具,通过建设“三个平台”——网络支持平台、业务管理平台、信息服务平台,实现数据传输网络化、业务管理自动化、信息服务在线化。
1 数字档案馆的基本结构
进行数字档案馆建设,首先必须要搞懂它的基本结构,否则就会无从下手。其实,在数字档案馆这么一句简单的定义中已经揭示了它的基本结构:即网络支持平台、业务管理平台、信息服务平台。这3个平台既相对独立,又紧密相连。每一个平台针对的对象不同,解决的问题不同。
数字档案馆3个平台的组成结构可以参照OSI(开放系统互联参考模型)来理解。OSI是国际标准化组织于1978年定义的一个描述网络层次结构的标准模型,通过OSI保证了各种类型网络的兼容性,互操作性。OSI说明了信息在网络中是如何传输的,以及各层在网络中的功能和它们的框架概念。3个平台作为档案工作来理解可以与传统档案管理模式相对应,作为计算机网络来理解可以与OSI的7个层相对应,见下图:
与OSI模型功能相似,在数字档案馆3个平台中,当前层平台的下一层平台都为当前层提供服务。3个平台的结构为传统档案工作向数字档案馆过渡提供了理想的结构模型。
2 数字档案馆各层平台功能
2.1 网络支持平台
从档案传统管理模式来看,网络支持平台对应的是档案信息的存储利用模式。传统档案工作在这个平台上主要考虑档案的库房容量,档案案卷上如何标识,档案信息如何组织起来对外提供利用等。库房管理和档案案卷组织存放形式是传统档案工作的基础,没有这个基础档案管理无从谈起。
在数字档案馆的概念中,网络支持平台是处于最底层的一个平台,是所有服务的基础。这一层平台主要完成数字档案馆的硬件布置与连接。如:网络配置、服务器设置、客户端要求、实体文件和各种条目信息的组织形式、存储容量分析等。主要对应OSI 模型中的下面4层。即:物理层、数据链路层、网络层和传输层。这一层平台面向档案业务管理平台,向档案业务管理平台提供服务,对数字档案的有效存储和安全传递负责。
网络支持平台中重点考虑的一个方面是海量数据存储。海量数据是数字档案馆的一个鲜明特点,它既是数字档案馆对外提供利用的基础,也是加工和处理的对象。一般来说数字档案馆可以成为一个单位最大的数字信息库之一,存储量以“T”计。在硬件配置时应考虑大容量硬盘或磁盘阵列,在做异地备份时可以考虑光盘。
另一个考虑的重点是保存信息的多样性。随着信息技术的发展,我们产生的电子信息日益呈现出多媒体化,这种趋势将来会越来越明显。如我们平时经常遇到的工程图纸信息(扫描图tif、工程CAD图纸)、文书档案信息(原文及批文tif、word、htm)、电子图书(CEB)、电子期刊(CAJ、PDF)、电子版规程规范(PDF),图片信息(JPEG、BMP、GIF)等。为用户保存和提供多媒体信息是网络支持平台应完成的功能,千兆甚至万兆以太网和高速交换机为大容量信息传递提供了硬件基础。
2.2 业务管理平台
对应于业务管理平台,传统档案管理模式可以划分为的6个工作环节,即:收集、整理、保管、鉴定、统计、提供利用。这6个环节体现了档案的日常工作,规范了档案信息的流向,保证了进出档案库的信息都是完整、准确、有效的。在数字档案馆设计中应考虑实现这6个环节的功能,以便和传统纸质档案的管理相兼容。
从计算机网络角度看,这一层平台是数字档案馆非常重要的一层,起着承上启下的重要作用。这一层主要对应于OSI模型中的会话层和表示层。在OSI模型中,会话层主要功能是为会话实体间建立连接,表示层主要功能是为通信提供一种公共语言。这两层的功能映射到业务管理平台中主要通过数据库和档案编号体系来完成,而数据库的管理在整个数字档案馆中起着核心的作用。档案管理人员通过数据库完成对数字档案信息的各种相关操作,同时接收信息服务平台发送过来的服务请求。所有数字信息经过档案编号体系编码后进入数字档案馆进行有序保管,完成一个归档过程。检索出来的信息通过这一层分类排序提供给信息服务平台,完成一个服务过程。档案6个工作环节通过数据库和档案编号体系相互作用共同完成数字档案馆的系统操作及日常维护。
在业务管理平台,数字档案馆可以和工作流程中的上一级进行对接和连通,使档案工作得以延伸,从根本上解决数字档案归档率低的难题。以设计行业CAD图纸归档为例,通过和出版岗位的绘图仪连通,构筑同一个数字化管理平台,实现在出版CAD图纸的同时完成归档,可以使CAD图纸归档率达到95%以上。
在许多数字档案馆系统设计中都把业务管理平台设计成C/S形式,系统的日常管理通过档案工作岗位的计算机来完成。这样做有利于数字档案馆的管理工作相对独立,提高了系统的安全性和保密性,提高工作效率。
业务管理平台完成的重点任务是系统管理、人员注册、数据库日常维护、权限设置和安全控制。从安全角度讲,该层对整个系统的安全和有效负责。用户对系统的操作都要通过该层来识别其权限属性,判定该请求能否进入下一层平台。系统的日志记录也在这一平台完成。
2.3 信息服务平台
在传统档案管理模式中,信息服务平台对应于档案服务形式。档案部门根据用户的需求选择不同的服务方式,提供给用户不同的档案产品。比如用户可以用查卡片的方式检索档案,也可以利用计算机检索,还可以咨询档案管理人员。不同的服务方式带来了不同的操作,但结果应当是相同的。
从计算机网络角度来看,该层平台对应于OSI模型中的应用层。与应用层功能相似,信息服务平台是数字档案馆3个平台中的最高层平台,也是最靠近用户的一层平台。它不同于其他层平台之处在于它不为任何一个平台提供服务,它只为数字档案馆以外的用户提供服务,用户通过信息服务平台完成对系统的操作。该层的任务是研究用户的需求,如何为用户提供方便、准确、舒适的服务。
信息服务平台对用户负责,该层不关心数字档案信息在哪里存放,它的组织形式是什么,它是如何传递等具体问题。该层对用户提出的需求进行分析并启动业务管理平台的数据库系统对馆藏数据进行检索,检索后的结果由业务管理平台排序后提供给用户。该层提供给了用户模糊检索、跨库检索、全文检索等多种检索工具,并可以为用户提供浏览下载等多种功能。
信息服务平台最强大的功能在检索上。模糊检索、跨库检索、全文检索等多种检索方式的采用会大大提高数字档案的查全率和查准率。跨库检索和全文检索是数字档案馆的突出特点的体现,在数字档案的环境下,档案利用者不会感觉到信息存在于各个不同的数据库中,而只是根据需要查询索取自己所需要的信息,不管信息是被标引或是没有被标引,系统都会自动提供所有相关信息,真正达到相当高的查全率。数字档案馆模糊了库与库之间的界线,对外界只提供一个统一的界面,极大地方便了利用人员查阅和使用档案。
信息服务平台提供能浏览多种媒体格式的浏览器,在一个界面环境下完成多媒体信息的浏览或下载,方便了用户对档案全文信息的检索和利用。
该层平台一般设计为B/S结构。在通常的设计中,采用数字档案馆网站来链接各个数字资源库,网站上有浏览器插件、各种检索工具插件等。这种设计的目的是方便用户登录数字档案馆,降低用户端计算机的要求。
3 数字档案馆信息处理模式和发展历程
在3层平台结构中,用户对数字档案馆提出的需求是一层一层向下传递,在完成相关操作后信息又一层一层向上传递,最后提供给用户。比如用户要完成一个检索,首先经过信息服务平台接收处理并识别是什么需求,分析后传递给业务管理平台。在业务管理平台启动数据库的检索,通过对网络支持平台中实体文件的检索,完成需要信息的查询,然后向上传递回业务管理平台进行排序或分类,最后提供给信息服务平台,完成一次操作。用户最终看到了检索结果,见图1。
图1 最终检索结果
数字档案馆结构的形成经历了一个发展历程,它的发展和整个档案管理软件的发展相一致。在早期单机版的计算机辅助管理档案阶段,只能部分实现“业务管理平台”这一层的功能。这一阶段的特点是以单个的计算机为基础,以对档案卷册的目录级管理为重点,具有简单的查询、打印、排序等功能,没有网络支持平台和为用户服务的平台。随着网络本身的发展以及网络数据库的出现,具有“网络支持平台”部分功能的第二代档案管理软件开始出现,但还不能保存管理档案的全文。电子档案的出现使得档案管理软件跨入第三代。第三代档案管理软件以网络为基础,以档案的全文管理为重点,具有网络查询、浏览、下载全文等功能,初步具备了3个平台的结构。第四代档案管理软件以档案整体的数字化为基础,以档案管理中的归全率、完整率为突破口,从电子文件的收集阶段开始介入进行管理,实现了档案工作的延伸和拓展,达到了确保档案电子版全文的归全率和完整率的目的。这些功能的完成需要3个平台互相作用,缺一不可。
表1 档案管理软件发展历史
从数字档案馆的整体结构来说,数字档案馆的建设是一个系统工程,并非一朝一夕就能完成,它对一个单位的网络、计算机、档案管理、电子档案管理甚至相关部门都提出了较高的要求。对系统需求进行分析时宜从最高层入手,最底层结束。进行建设时宜从最底层入手,最高层结束。3层平台的结构为我们研究数字档案馆提供了很好的模型,也为建设数字档案馆提供了理想的参照