互联网环境下数字档案馆建设趋势
2018-01-04吴燕
吴燕
[摘 要]本文通过对旧有文件的数字、电子化和信息化信息系统存在的不足之处进行分析,提出引入互联网环境下的数字对象单一标识技术,应用于旧有文件的数字、电子化和信息化信息系统建设。该技术既可以极大地提高旧有文件的数字、电子化和信息化信息系统的应用效率,又可以进一步扩大馆藏数据的应用范围,还可以降低管理、软件、硬件的成本投入,大幅度减少用户访问馆藏旧有文件的时间、浏览时间,进而提升馆藏档案的利用率。
[关键词]互联网;数字档案馆;标识技术
doi:10.3969/j.issn.1673 - 0194.2017.24.116
[中图分类号]G270.7 [文献标识码]A [文章编号]1673-0194(2017)24-0-02
0 引 言
互联网技术环境下的旧有文件的数字、电子化和信息化是互联网技术环境下的形式创新,指的是电子信息条件下的档案管理的新方式。所有文献的数字、电子化和对其进行管理的电子信息系统的研发与升级换代,已经给传统的档案馆管理带来了强烈的冲击,还将对旧有档案馆管理格局的发展造成影响。计算机和互联网技术的普及,也加快了档案管理部门不断提升信息化、数字、电子化步伐。
1 館藏旧有文件的数字、电子化和管理信息系统的定义
目前,互联网环境下的各类馆藏旧有文献的数字、电子化和与其对应的管理系统,是一个依靠计算机技术、互联网技术、电子存储技术等一系列前沿科技,使其能够进行信息接收、文献管理和旧有档案的数字化处理,并提供互联网环境和文献物理存储两方面高效利用、服务的管理信息系统。
有序的信息空间和开放的信息环境是旧有文件的数字、电子化和信息化信息系统的重要特征之一。它说明旧有文件的数字、电子化和信息化信息系统,不是封闭的档案馆信息互联网技术,而是包含在OA系统、CAD和MIS等更为广阔的大系统中的组成部分;是由网状分布式、档案资源构成的具有各类服务功能的跨管理层级、跨地理分布的管理信息系统。
2 旧有档案文件的数字、电子化和信息化系统的劣势
现有关于人类的各类信息记录的技术,使各类型载体所需要储存的内容迅速增加。而现有可用于信息长期和永久存储的技术,远没有得到相应的快速发展,存储各类信息的物理载体的使用期反而下降了很多。
数字档案存储、管理的安全问题。互联网技术有其存取速度快捷的优点。因为互联网技术本身的无中心特点,也有其安全性差和不甚可靠的缺点。其一,互联网技术本身的隐患。由众多计算机组成的网络环境,其技术系统本身就是开放的。其广域性、信息的共享性、通信网络的共享性等特点,都为窃取、盗用、非法操作、篡改及恶意破坏提供了可能。其二,由于互联网技术本身就与计算技术有着不可或缺的关系,所以,计算机具有的一些漏洞,如计算机病毒、黑客攻击等,都会造成档案内容的被篡改和遗失。其三,受人工影响的几率很大。人为的或小概率事故等,都会导致不可估量的结果。
3 “数字对象”定义的引入
“数字对象”就是互联网和计算机技术兴起后,对档案领域的各类文档的一种新提法。数字对象模型对不同内容、不同形式的信息的表示具有普适性,它为信息系统的构造提供了一个通用的工具,运用这个数字、电子化的信息基础,完全可以建立一个包括各类文献格式、可以对复杂档案进行整理、按照各类用户的实际需求,形成高水平服务且可以满足外部环境变化的数字文件档案系统。其他的表现格式,如,OCLC使用“Document-Like Object(DLO)”、W3C的“Document Object Model”、威伦斯基体系的“Digital Object”、FEDORA项目作为专有名词使用的“Digital Object”、加州伯克利分校旧有文件的数字、电子化和信息化信息系统项目提出的“Multivalent Document”等。这些对电子信息的描述都是引用和借用了计算机相关理论中“对象”的定义方法,来表示档案领域文本数字、电子化,但其应用目的、文本文献的组成结构、档案管理的管理过程等方面各有不同而已。
“馆藏旧有文件数字、电子化”作为互联网环境下文献、档案信息化实现的最小单元,它不仅仅是最小的信息单位,还可以成为互联网环境下旧有文件的数字、电子化和信息化的重要组成部分,更是最底层的基本访问操作,还是旧有文件的数字、电子化和信息化信息系统各种复杂结构的组成单元。馆藏旧有文件对象数字、电子化后,这个被数字、电子化的馆藏对象,能够表示各种不同含义与格式的信息,因为数字、电子化过程是对馆藏各类文献的一个高度统一的逻辑抽象表达。这种高度统一,确保了文献在格式和基本操作系统上的单一,这一过程将给互联网环境下的馆藏管理带来馆藏访问的快速和馆藏利用上的简洁。馆藏旧有文件的数字、电子化,就是为馆藏旧有文件建立一个数学模型,这个模型是可以被计算机程序进行处理的模型,这个对象的数学模型的形成过程,是一个从案例到高度抽象的逻辑抽象过程的全过程,正好是高度抽象的逻辑顺序的逆过程,即馆藏对象的案例的形成和实际运行的完成顺序。
4 馆藏旧有文件数字、电子化对象的单一标识方法
随着互联网技术和计算机技术的快速发展,互联网环境下的信息资源的数量级数也快速的变化着。由于互联网技术环境自身就没有一个统一的管理,同一信息资源被多次、重复拷贝和使用的事情皆有发生。这造成了互联网技术空间的低效率使用,其更严重的是,极大地妨碍了互联网环境下用户对信息资源的有效利用。
为了顺应互联网技术和计算机技术的巨大、快速的环境变化,国内外的科技从业者,经过研究,提出了用数字对象单一标识符技术(Digital Object Identifier),来描述、诠释互联网环境中的馆藏旧有文件的数字、电子化对象,进而将表现格式和物理存储位置不同但信息本质属性相同(所描述的内容相同)的数字对象描述出来,以方便人们加以利用。Handle System就是最早提出的应用范围最广的全互联网范围的数字对象单一标识符系统,作为第一个完整的数字对象单一标识符系统,其对数字对象描述、诠释和解析、管理、利用以及开放式数字信息环境的构建都产生了深远影响。
1998年,国际数字对象标识符基金会(International DOI Foundation,IDF)在德国的法兰克福成立,是专门负责数字对象标识符运作的国际性专业机构。因其是一个非盈利性的国际组织,因而任何组织和用户都可以在其网页上下载其提供的DOI手册以供使用,包括DOI技术手册、系统组成架构、算法的使用方法、运行管理方式等。IDF发出的数字单一的对象标识符超过2 000多万个。
4.1 DOI系统的特点
DOI单一标识符管理系统的功能在于,给被描述的对象分配全互联网范围内的不变且单一的标识符,其标识符是由一串数字组成的,不但要体现其价值,更包含对标识符的处理算法系统正确的描述、逻辑元数据尽可能正确的描述,以及所有者自己阐述的合适编码组合等。DOI单一标识符系统一般有4部分:编码、描述、处理算法和要求。
DOI的特点有以下几方面。第一,单一特性。一个数字对象只对应一个专用编码。第二,不变性。即使被标识的对象被逻辑移动、物理上重新组合或者被修改,其单一性不被破坏。第三,能与别的来源的数据进行逻辑互操作。第四,延展性。DOI系统可增加新的被描述对象的新特征和服务。第五,跨平台性。同一被描述对象,可以多种输出格式进行单一管理(与平台无关)。第六,对应用和服务两个方面的操作,系统可以分开进行。第七,逻辑上的元数据、应用操作和服务过程及其内容的动态更新。
4.2 DOI算法(Resolution)
DOI系统算法,即由互联网技术和组成互联网的各个计算机(网络服务器),在接收到DOI编码后,通过计算机服务器内预先储存的处理算法,将DOI转变成该对象在该服务器的逻辑值空间内的有效地址。由于所有数字出版文献的对象识别资料都集中在注册中心的大型数据库中进行管理,如果数字对象的存放地址发生变化,只要伴随DOI的元数据随之更新,用户即可通过其固定的DOI码方便地找到该数字对象。通常一种数字出版品可能有多种版本及格式,但只对应一个DOI码,用户查找时可通过处理算法器自动或手动选择想要的资料。目前,DOI的处理算法功能是采用CNRI(The Corporation for National Research Initiatives)开发的Handle System技术。Handle System是一个通用的分布式名称服务系统,它包括一套开放的系统协议,惟一标识符名称空间以及协议的参考实现模型。目前,Handle System的相关标准已被互联网工程任务组(The Internet Engineering Task Force,IETF)接收为RFC文档。
5 结 语
当前,互联网技术飞速发展、计算机技术日新月异,所以,旧有文件的数字、电子化和信息化信息系统势在必行。互联网技术环境下的旧有文件的数字、电子化和信息化信息系统的存储内容(文字、图片、视频等信息)都是符合数字对象的定义的。互联网环境数字对象唯一标识技术(DOI)不仅可以给旧有文件的数字、电子化和信息化信息系统带来不可估量的效率,更可以解决旧有文件的数字、电子化和信息化信息系统的诸多不足。
主要参考文献
[1]李敏.企业旧有文件的数字、电子化和信息化信息系统建设[J].机电兵船档案,2008(3).
[2]张孺.数字档案馆的优势与劣势分析[J].兰台世界,2014(z2).
[3]S Payette ,C Lagoze . Flexible and Extensible Digital Object and Repository Architecture (FEDORA)[C]// European Conference on Research and Advanced Technology for Digital Libraries,1998.
[4]于順安.石油勘探开发信息化必须依靠物联网与虚拟现实技术的完美结合[J].天然气勘探与开发,2014(3).