新时代档案元数据核心集构建的创新研究
2018-02-26崔杰田伟任天琪
崔杰 田伟 任天琪
习近平总书记曾经在北京大学考察时说,创新是引领发展的第一动力,是国家综合国力和核心竞争力的最关键因素。重大科技创新成果是国之重器、国之利器,必须牢牢掌握在自己手上,必须依靠自力更生、自主创新。伴随着中国特色社會主义进入新时代,我国档案事业发展也进入了新征程。作为新时代档案工作者,我们要不断进行创新研究,提出具有中国特色社会主义思想的档案理论,以有效指导我国档案工作实践。
电子档案时代的到来,使档案整理踏入了信息时代,档案元数据核心集的构建,已成为档案整理实践的核心技术。近年来,国内外陆续出台了各自的档案元数据标准,这些标准很难与图书情报等其他文献元数据标准区分开,导致档案学界对元数据的研究开始泛化,所以构建我国档案领域专有的元数据核心集势在必行。《‘魂系历史主义的档案元数据核心集的构建研究》这一项目(以下简称为项目),完全依据我国档案学者提出的“同构性”档案本质理论(档案历史联系与历史的同构性),即以“历史”为本原、以“档案历史联系”特征为理论依据、以“同构性”档案本质理论思想为内核来构建档案元数据核心集,实现了在档案实践中创建出“全宗群整理” 技术体系并实际地形成“全宗群”档案物质形态的研究目的,自成体系,自主创新,在档案学理论、档案整理实践、档案整理技术上均取得了一定的创新性研究成果。
一、档案学理论上的创新
项目站在档案整理计算机化实践的基础上,在理论上的研究成果具有一定的学术性。主要创新表现在如下几个方面:
(一)完全依照“元数据是数据的数据”这一最原始的概念,将“档案元数据”定义为“档案数据的数据”。它在强调:“档案元数据”一定是“档案”的“数据的数据”,而不应是“文件”的“数据的数据”。而这一理性的认识就完成了对“档案元数据”和“文件元数据”之间的区别,以此确认“档案元数据核心集”只能将“档案”的元数据,而不能将“文件”的元数据作为档案整理计算机化的对象。它超越了“文件元数据”这一长期普遍使用的宽泛术语(概念)的弊端,为档案元数据的研究打下了牢固的认识基础。
(二)用“档案元数据核心集是档案历史联系数据的数据集合”这一定义表明,“档案元数据核心集”是以“档案历史联系”为基础而集合起来的数据。它以此强调:并不是任意一个档案元数据,而只有关于“档案历史联系”的“数据的数据”才能构成“档案元数据核心集”。这就用“档案历史联系”,从众多的“档案元数据”中,将“档案元数据核心集”收敛为了“档案历史联系数据的数据集合”。
(三)而正是因为将“档案元数据核心集”收敛为“档案历史联系数据的数据集合”,所以它才能在中国传统档案学的“必须最大限度地保持档案历史联系”的档案整理原则的基础上,进一步创新性地提出档案元数据核心集“整理档案历史联系”的根本功能以及“必须最大限度保持档案历史联系与历史同构性”的构建原则。
(四)依据“同构性”档案本质观点定义了全宗群和全宗群整理,即“全宗群”是与历史具有同构性内在关系的档案物质形态;“全宗群整理”是形成“全宗群”的档案整理,从而奠定了档案元数据核心集构建的理论基础。
(五)以“档案历史联系与历史的同构性”思想为内核的档案元数据核心集的构建,使档案元数据核心集以“本质的内容”和“简约的形式”出现,即它只对历史联系要素(来源、事由和年代)的本体特征及要素之间的关系进行结构化的详尽描述,从元数据的维度论证了“同构性”档案本质观点的正确性。
(六)“档案元数据核心集”具有“档案历史联系整理”和“档案历史联系检索”的双重功能:“档案历史联系整理”是构建档案元数据核心集最根本的功能,即在档案实践中构建出“全宗群整理” 技术体系和形成“全宗群”档案物质形态,而“档案历史联系检索”则完善了档案历史联系的著录,为档案读者构造了一个能从“历史”多维度全方位查找档案的标准和强大的搜索引擎。
(七)项目提出了包含档案物质形态、档案整理实践、档案学理论的档案广义综合进化理论:即将“案卷、全宗和全宗群”、“案卷整理、全宗整理和全宗群整理”及“案卷理论、全宗理论和全宗群理论”理解为档案的进化和连续体的认识,在继承的基础上整合了当代档案学理论研究的成果,为中国档案学理论产生新的档案学说奠定了坚实基础。
二、档案整理实践上的创新
项目在档案整理实践上的创新表现在:用以“档案元数据核心集”为标志的档案整理技术体系,继“案卷”和“全宗”之后,在档案整理实践中实际地形成了“全宗群”,使“全宗群”成为了一种在档案实践中真实存在的、能与“案卷”和“全宗”共存的档案物质形态。主要创新表现在如下几个方面:
(一)至今档案界仍处于将“全宗”作为最高档案物质形态的“全宗时代”,虽然中国档案界在上世纪五十年代,早已发现了“全宗群”这一比“全宗”更高级档案物质形态的客观存在。但由于档案界始终未能构建起一个档案整理的技术体系,因此在档案整理实践中未能实际地形成“全宗群”,所以“全宗群”的存在就无法得到档案实践的证明,因此中国档案界试图用“全宗群”来打破“全宗时代”的强烈意识就只能沦落为一种空想。而以“档案元数据核心集”为内核的档案整理技术体系在档案实践中实际地形成了“全宗群”。由于在“档案元数据核心集”的档案整理技术体系下,“全宗群”是由各种不同的“全宗”(主体全宗、客体全宗和年代全宗)及其内在关系所构成的,所以“全宗群”不但包含“全宗”,比“全宗”具有更大的体量,且比“全宗”具有更为复杂的结构。而“全宗群”的这些特征,就决定了“全宗群”必然是一种比“全宗”更高层次的档案物质形态。由此,档案就具有了由“案卷”、“全宗”和“全宗群”所构成的三种档案物质形态和层次结构,并完成了从“全宗”向“全宗群”的档案物质形态的进化。
(二)当“档案元数据核心集”的档案整理技术体系,实际地形成了“全宗群”之后,当代档案界在面对已成为现实和常态的“全宗群”的时候,就不得不承认:“全宗”并不是档案最高级的档案物质形态;就会看到:档案并不会再静止于“全宗”,而“全宗”还必须继续向“全宗群”这一更高级的档案物质形态进化;就会充分地意识到:“全宗群”已能取代“全宗”来开启一个以“全宗群”为物质基础和标志物的“全宗群时代”,而百余年的“全宗时代”将自然地成为了一去不复返的历史。
(三)站在“唯物主义”的立场上,形成“全宗群”这一更高层次的档案物质形态,就从“物质性”的这一根本上,奠定了当代档案界全面突破“全宗时代”、“全宗档案整理实践”和“全宗理论”的基础。而不会有哪种经验、技术和理论的创新,能与创造出新的和更高级的档案物质形态比肩,都不会比创造出新的和更高级的档案物质形态更具有突破性。因此可以肯定地说,“全宗群”的实际形成是这一研究项目最大的创新之处,这也是新时代中国档案界所获得的一项具有创新性的研究成果。
三、档案整理技术上的创新
项目是一项应用性的研究项目,它在档案整理技术上的创新表现在:它采用计算机的“元数据技术”,构建起了一个传统档案整理实践所没有的“档案元数据核心集”的技术体系,以此满足了新时代档案实践对“档案整理计算机化”和形成“全宗群”的迫切需求。主要创新表现在如下几个方面:
(一)突破了只能形成“全宗”的传统整理技术体系,使在档案整理实践中形成了比“全宗”更高级的档案物质形态——“全宗群”;开创了一个比“全宗整理”更高级的档案整理技术体系——“全宗群整理”。以“档案元数据核心集”为标志的“全宗群整理”层次的形成,填补了“全宗群整理”层次与技术的空白,使档案整理形成了由“案卷整理”、“全宗整理”和“全宗群整理”的完整层次,将档案整理从传统的“档案物质实体整理”,提升到了“档案历史联系信息整理”的更高技术层次,从而引发了档案整理实践的再次变革和进化。
(二)科学地选择了计算机的“元数据技术”和“数据挖掘”功能,完成了档案整理的核心实践——“档案历史联系”(即档案内在关系)的整理,它突破了中国档案界试图用《中国档案分类法》与计算机检索技术配合,及西方档案界试图用“文件元数据”来实现档案整理计算机化的技术路线方法,使档案整理计算机化实现了根本性的突破。
(三)“档案元数据核心集”的档案整理技术体系使计算机技术真正地深入到了档案实践的核心——档案整理,彻底地结束了传统的档案手工整理,使档案整理真正地跨入到了计算机技术的时代,它将成为新时代档案整理实践的主流技术体系。
四、结束语
创新具有创造性和新意,因此会产生一定的价值。我们在档案元数据核心集项目的研究过程中,在档案学理论、档案整理实践和档案整理技术三个方面均获得了一定的创新性成果,因此项目产生了良好的应用价值和社会价值。其中项目的应用价值则在于:它标志着中国档案界已率先掌握了利用计算机元数据来整理档案的技术体系,使档案工作者可以率先用新的档案整理技术体系(全宗群整理技术体系)来形成新的档案物质形态(全宗群),为档案整理實践开辟了一条新的路径,推动了档案整理计算机技术的发展。同时项目的社会价值则表现在:从“档案物质”和“档案整理技术”上,奠基了打破“全宗时代”的实践基础,这就意味着中国档案界已完全能凭借自己的档案整理创新技术,和所形成的比“全宗”更高层次的档案物质形态——“全宗群”,来结束西方所创建的、已有百余年历史的“全宗时代”。而这一具有中国自主知识产权的研究成果,不但使中国档案界在档案整理计算机化的技术上,真正地走到了世界前列,而且也从实践经验和技术层次上,夯实了中国档案学理论未来发展的基础,从某种意义上将使中国不再仅仅是档案事业的大国,而且成为了档案整理技术和档案学理论的强国。
创新是我国档案工作不断进步的灵魂,也是我国档案事业永葆生机的源泉。在实践基础上的理论创新是档案工作发展和变革的先导,通过理论创新推动实践创新和技术创新,不断在档案实践中探索前进,这正是新时代档案工作者需要长期坚持的创新之道。
注:本文系教育部人文社会科学研究项目《‘魂系历史主义的档案元数据核心集的构建研究》(项目批准号:15YJC870007)的阶段性研究成果
(作者单位:天津外国语大学、天津工业大学、天津城建大学)