电子文件立卷问题思考*
2018-08-20王大青
王大青
摘 要:从计算机辅助档案管理开始,就出现了取消立卷的声音。然而,从档案整理理论和实践发展情况看,立卷以其独特的优势,依然占据着主流地位。在电子文件时代,案卷应被赋予新的生命和意义。文章从电子案卷的概念出发,分析了电子文件立卷的需求、立卷的原则、立卷的标准和程序,是对电子文件整理工作理论和实践的再认识,对电子文件的科学管理具有一定借鉴意义。
关键词:电子文件;立卷;电子案卷
Abstract: There has been a point of view of abolishing archival file, from the beginning of managing archives with the computer assistant. However, archival file still takes up dominating status in the practice and theory research because of its advantages. In the era of electronic records, the archival file should be endowed with new senses. This paper sets out from the concept of electronic volume. Then, it analyzes the requirements, principles, standards and processes of composing archival file for electronic records. It is the theoretic and practical cognizance for the electronic records organization under the new circumstance. It will be useful for the scientific management of electronic records.
Key Words: Electronic Records; Composing Archival File; Electronic Volume
案卷是文件保管的基本单位,立卷是纸质文件管理的重要环节,也是文件成为档案的一个重要标志。立卷是实践“遵循文件形成规律,保持文件之间的联系,便于保管和利用”这一档案整理原则的组织形式和具体措施[1]。伴随着计算机辅助立卷的发展,出现了弱化甚至取消立卷的声音。例如,有的单位或行业系统依据文件形成时间直接放盒归档;国家行业标准DA/T22-2000《归档文件整理规则》,也没有明确提及立卷这一工作环节。在2015年发布的修订版中,提出了立卷整理与以件为单位整理的并行做法。但是,从世界范围来看,在档案管理实践和理论研究主流中,基本沿袭和强调了纸质档案文件的立卷工作,认为“案卷作为档案的典型微观存在形态,具有不容置疑的理论依据和不可或缺的实践意义”[2]。所谓取消或弱化立卷,其否定的并非案卷形态本身,而是要简化档案整理工作[3]。那么,从保管和利用角度看,电子案卷存在的意义究竟有多大?继续保持还是取消立卷?电子案卷的形态是什么?如何科学地立卷?经过这些年的电子文件管理实践,尤其是机器深度学习、人工智能大力发展的当下,十分有必要对电子文件立卷工作进行理论梳理和总结、创新。
0 电子案卷
“案卷是由互有联系的若干文件组合而成的档案保管单位。”[4]电子案卷究竟是物理概念还是逻辑概念?对于这一问题,不必拘泥于纸质文件管理模式的机械对照,“在电子文件时代,不仅全宗形态将出现异化,案卷也将继续存在并率先出现异化”[5],即应该在电子文件物理归档和逻辑归档的具体实践中对电子案卷概念作出创新发展,针对电子文件管理需求,将其作为一个管理和利用单元来看待,可以是物理的,也可以是逻辑的形态。
由此,可将电子案卷定义为:在档案全宗类目之内,为便于文件保管和利用而设置的电子文件集合。电子案卷是具有密切关联的若干文件的组合体,是“档案的保管单位,通常也是统计档案数量和进行检索的基本单位之一”[6]。
显然,在电子文件管理中,从物理视角看,案卷存在形态发生了变化,不再是触手可及的卷、册、盒,而对应的是存储介质(当前主要是光学或磁性存储介质)中的某一区间,这一区间可以是物理上連续的,也可以是间断的、由计算机操作系统或应用系统整合起来的“连续”空间。当前,其表现形式主要为文件夹;从逻辑视角看,电子案卷表现为一组标识,即通过分类标引、用一组相同标识将具有共同来源、关联性较强的电子文件集中起来,组成逻辑案卷。电子案卷逻辑形态与物理形态可以是一致的,即同一案卷的电子文件存储于同一存储介质的同一文件夹之下;在某些情形下,电子案卷逻辑形态与物理形态是不一致的,电子文件组成“虚拟案卷”,而这些文件实体可暂时分布于不同的存储介质乃至不同系统、不同地域,在云计算平台上的表现尤为突出。
1 电子文件立卷的需求分析
有人认为,“电子文件可取消立卷,因为计算机可以将电子文件任意组合成各种‘案卷”。实际上,当前的主流档案信息管理系统是按照给定的检索式进行匹配查询的,机器不能准确理解检索词以及数据库中档案信息的语义,在小数据量时检索结果的分类积聚是可以保证准确率的,而在大数据量时,往往会出现同一历史活动中形成的、联系紧密的文件分散排列乃至不能被同一个检索式全部查询到的现象。在这种情形下,设定电子案卷,不仅可以确保反映历史面貌的全面性,还可以方便保管利用。
1.1 保持电子文件之间历史联系的需求。不可否认,在电子文件时代,更加依赖背景信息来保障电子文件的真实性、完整性和可用性,而案卷实际上就是提供档案背景信息的一种形态。同一活动中所产生的电子文件,相互之间具有自然的历史联系。某一事件,某一会议,某一项目,某一案件等,这些主题活动所产生的文件,如若分散保管、不设置统一的逻辑标识符,则会弱化其应有联系,对于不熟悉该活动的人来说,就会从一定程度上影响历史面貌再现的全面性和准确性。
目前,通过检索式查询所得到的结果展现的是文件之间的人工联系,而非文件形成之时的自然联系,这两种联系并非完全对等,因为人工联系是通过关键词的匹配检索展现的。许多文件之间存在的是隐性联系,即文中关键词、主题词等并不能直接反映文件之间的密切相关性,再加上文件标引和著录的主观性、不规范性、计算机对自然语义理解的机械性,容易出现文件之间自然联系反映不全面、不准确的现象,从而导致社会活动、历史面貌呈现障碍。如何保持这种自然联系呢?“立卷就是使文件之间的历史联系在微观层次上得到保持的有效手段。”[7]对于不同类型、不同记录方式的电子文件,电子案卷更具生命力。例如,关于某一案件或建设项目的文字、照片、声音和视频,克服了物理形态的差异性,可以集合于同一案卷之下,实现信息和实体的统一组合,更为高效、系统而完整地展现其历史联系。
1.2 科学保管电子文件逻辑与物理形态的需求。与纸质文件相比,电子文件分卷管理的成本大大降低,省去了卷盒印制、填写和文件装订装盒等程序,不再轻易受案卷容量约束而强制分开关联性较强的文件;由软件系统进行统一立卷,克服了“因人而异”的分类“任意性”。同时,其分卷的优势却有所增加。电子案卷是电子文件保管物理和逻辑结构体系的重要构件,是实体分类的基本单位,是信息分类的基础,可以恰如其分地“划分”电子文件物理存放空间和控制信息集聚数量。
传统文书档案是以“全宗-类别-案卷-文件”的层级结构进行保管的。在档案管理实践中,全宗内部一般以年度作为分类的一级类目,如果从年度直接跨度到单份电子文件,文件较多时则会显得杂乱无序,不便于人工干预和异常情形下的电子文件管理,这与大数据环境下电子文件管理实践以及档案管理理念是不相适应的。在年度类目之下设置电子案卷,则增加了电子文件实体与信息管理的可控性,具有信息量和专指性适度的优势,便于人工识读、信息存取和数据迁移,便于新发现或捕获电子文件的增量管理,从总体上提升电子文件管理效益。比如,在一项职能活动中,不仅仅会产生文字图表类文件,还可能会形成数码照片等电子政务平台外文件,此时就需要人工干预以建立对应关系,采取立卷模式后,则可方便地实现相关文件的集聚和关联。
1.3 高效开发档案资源的利用需求。通常,用户不具备档案所反映职能活动的完整知识,尤其是历史久远的活动,在数据量大、没有档案专业人员指导和档案信息共享的情境下,很容易造成文件漏检和误检等现象的发生。在检索结果的排序上,没有立卷却联系紧密的电子文件很可能会被其他无关却符合检索式匹配要求的档案文件分隔开,极大地影响检索方便性和查询效率。将具有历史联系的文件放置在同一案卷,便于用户检索和发现目标电子文件,全面了解相关职能活动或事件的来龙去脉,衡量一份文件在工作查考、科研、编史修志和文化服务等方面的综合价值。同时,在案卷题名、主题词等著录完整的前提下,还增加了检索层次,为族性检索提供方便,有利于用户从案卷中发现相关文件的检索信息,从而充实、丰富特定主题的内容信息。在大数据环境下,电子文件的立卷,也为数据自动分析和数据挖掘提供了分类和积聚的可靠途径,奠定了数据智能化处理基础。
此外,在“双套制”保管时代,“要建立电子文件之间的关联和它们与本单位产生的非电子文件之间的联系,就必须对电子文件进行立卷”[8],以此高效地维持电子文件与纸质文件之间的对应关系,还有利于简化纸质文件的整理。
综上所述,在“人工智能”迅猛发展的时期,计算机在数据感知、语音和图像识别、数据分析以及知识挖掘等方面,都取得了很大进展,但是,这其中的许多成果是建立在统计学基础之上的,而对自然语言语义的综合理解、判断与处置依然是计算机面临的挑战,计算机在实现电子文件任意标准的自动分类组合、语义检索等方面依然存在着差距,而这正是电子文件智能化管理和利用所需要的,即电子文件的管理和利用还脱离不了人工干预,在今后较长一段时间内尚不能达到“随意”组合、完全智能化管理的理想状态。也就是说,电子文件立卷依然有其自身与环境的强烈需求。
2 电子文件立卷的原则
2.1 保持电子文件之间历史联系的原则。文件之间的历史联系包括背景联系和内容联系。背景联系包括文件形成者、职能活动、形成时间和形式联系等;内容联系一般指文件主题、事由之间的联系。这个原则要求:将形成时具有天然联系的电子文件组成一个案卷。考虑到现代社会分工协作日益紧密的现实,不能将这个原则简单地理解为“来源于共同的组织机构、部门或个人的电子文件”,不能囿于立档单位之限而分割联系紧密的电子文件,應将电子文件产生的源泉——社会职能活动作为立卷的核心原则。正如特里·库克指出的那样“电子时代,档案来源概念需要重新定义,它不能仅仅局限于文件的形成机关,还应包含形成目标、形成活动和职能范围等”[9],要从电子文件形成者和职能活动两个视角考察电子文件之间的有机联系,选择适宜于计算机智能操作并能够最大限度地维护历史联系的模式立卷。
保持电子文件之间历史联系,实际上也是电子文件高效保管和利用的重要基础。
2.2 有利于电子文件保管和利用的原则。电子文件立卷的原则,其中很重要的一点就是将电子文件前端控制和全程管理思想贯穿其中。当前,在电子文件接收、检查、迁移、维护、鉴定和管理等诸多环节中,需要适度的人工干预。因此,电子文件立卷时,不仅要考虑计算机自动管理的效益,还要考虑到人工干预的方便性、效率。一个电子案卷之下,文件数量应保持适宜。如若文件太多,则会影响数据迁移、再鉴定、检查和维护效率。在移交电子文件,尤其是离线存储时,应注意保持电子案卷逻辑与物理形态的一致性,即将同一案卷电子文件置于同一文件夹中。“双套制”情形下,保持与纸质文件案卷的对应关系,即互相备注定位标识符。
从利用视角看,主要表现在电子文件检索效率的控制上,考虑不同层次、不同类型用户的需求,便于用户使用最简检索式,准确、完整地查询到所需的全部电子文件,这实际上也是从另一个角度对保持电子文件之间历史联系所提出的要求。同一职能活动中所产生的有保存价值文件,在从宽原则之下可以继续区分保管期限,虽然这种做法可能会在短期内影响电子文件的利用效率,但相比而言,不同保管期限电子文件合库后,其对检索效率的影响,远远没有电子文件永久保存效益重要。
3 电子文件立卷的标准
无论是纸质文件还是电子文件的立卷,其实质就是依据一定标准划分文件、组合成单元。电子文件的立卷,主要是依据电子文件的内容和背景特征上的某一或某几个共同点开展的,将联系紧密的电子文件组合在一起,形成电子案卷。
3.1 职能活动标准。电子文件立卷的核心标准就是共同的职能活动。在立档单位之内,相对于各级组织机构或部门来说,职能更具稳定性;对于跨部门、跨立档单位的协作,以职能活动为立卷标准更具优势。對于电子文件管理系统或具备电子文件管理功能的业务系统来说,这个标准具有较好的自动操作性。同时,根据职能活动立卷,可将档案管理的“专家思想”、法规标准集成至电子文件管理系统或业务系统,由机关业务部门工作人员根据自身所熟悉的职能活动进行简单选择操作,继而实现电子文件自动捕获、立卷。通常,一个年度或一个阶段(可以跨年度)内,一项相对独立的职能活动所形成的一组电子文件,即可组成一个电子案卷。
3.2 文件形成者标准。对于文件形成者来说,现有的著录标准和检索系统,可以高效、准确地实现具有共同责任者的电子文件聚合。因而,一般不将文件形成者作为电子文件的独立立卷标准。当然,文件形成者亦可作为电子文件立卷的辅助标准使用。
3.3 其他标准。从文件形成时间角度看,电子文件通常是在年度类目之下实施立卷。对于跨年度的大型活动或项目,不应拘泥于时间的限制,可依据职能活动标准灵活立卷。在一个电子案卷内,时间可作为文件排序标准。
从存储介质容量角度看,在当前的管理规定中,要求用离线载体档案级光盘保存,并存储3份以上[10]。对于文字图表档案来说,当前光盘的容量通常不会影响到电子案卷的划分,而对于视频、多媒体等档案来说,光盘容量可以成为电子案卷划分的辅助考量因素。
4 电子文件立卷的程序
正如电子文件元数据通常由计算机应用系统捕获和生成一样,电子案卷也应由计算机应用系统自动、实时组建,以适应电子文件前端控制需求。对于文书部门来说,电子文件形成之初,根据一定规则,进行档号标引即为逻辑立卷;电子文件实施在线移交、脱机保存或移交档案馆时,需要归入存储介质的相应文件夹,即为物理立卷。无论是逻辑立卷还是物理立卷,均是在制定电子文件分类方案的基础上,按照对电子文件实施初步鉴定和自动处置、建立电子案卷、文件归卷、审查电子案卷等程序开展的。
4.1制定电子文件分类方案。在对业务职能活动分析和分类的基础上,分析历年文件产生情况,并对电子文件发展趋势进行预测,制定电子文件分类方案。对于文件较多的类目,可以根据“职能-活动-事务”的层级结构,细分至适宜程度,统一设置简洁、可读性好的类目标识。而后,用本体语言(OWL)或资源描述框架RDF描述电子文件分类方案,将电子文件分类方案植入电子文件管理系统,由电子文件管理系统进行应用。
4.2 电子案卷的建立与文件归卷。电子案卷的设置与分类方案相互对应,通常在文件分类方案的最低层级设置案卷[11]。
根据职能活动实际情况,由业务工作人员根据其岗位职能进行控制选择[12],在电子文件形成之时,电子文件管理系统根据电子文件分类方案所确定的归档范围实施文件和元数据捕获,按照保管期限表进行初步鉴定和处置,并根据需要持续地捕获或生成元数据。捕获文件后,软件系统适时创建相应文件夹,文件夹以类目标识符即案卷档号命名,自动将形成的电子文件(含元数据)归至对应位置。亦可根据电子文件分类方案,按照“全宗-类别-职能-活动-事务”的层级,人工建立树形结构的文件夹,将电子文件及其元数据归入相应类目。在电子案卷内,要确保每一份文件被赋予唯一标识符即档号,简化卷内文件的排序,将以往的排序标准“事由结合时间、重要程度”变为“职能活动结合时间”。由计算机对电子文件实施智能化的前端管控后,可将节约出来的人力用于后期的深度标引著录。
案卷题名可以视情由系统根据立档单位名称、类目(如年度)和职能活动名称等要素自动生成。卷内文件目录和卷内文件备考表,可以由机器根据预先定义的结构自动呈现,并建立卷内文件目录与文件之间的超链接关系。
4.3 电子案卷的审查。电子案卷自动组建后,为确保立卷和鉴定的准确性,根据条件的动态变化和电子文件保管期限规定,需要对电子案卷实施审查。一是对捕获的电子文件和纳入销毁范围的电子文件进行处置操作确认、审计,查看有无处置不当的电子文件;二是针对特定时间或事件等触发条件,查看电子文件保管期限有无变化,并进行相应处置。
参考文献:
[1]刘国能.卷论——卷、立卷、文书处理部门立卷[J].档案学研究,2010(4):9-12.
[2]伍振华,关小川,郭鹏.案卷是档案的典型微观存在形态——档案整理理论框架重构初探[J].档案学通讯,2007(6):25-31.
[3]沈蕾,果有森.论归档文件整理工作的简化[J].档案学通讯, 2016(6):39-42.
[4]国家质量监督局,国家标准化管理委员会. GB/T 9705-2008《文书档案案卷格式》[S].2008.
[5]何嘉荪,楸峰.保存电子文件背景信息的重要手段——再论全宗、案卷形态的异化[J].档案学通讯, 2001(5):43-47.
[6]陈兆祦,和宝荣.档案管理学基础[M].北京:中国人民大学出版社,1986:133.
[7]崔杰.电子文件立卷研究[J].档案与建设, 2005(6):9-10.
[8]黄世喆,奚春玲.论电子文件立卷的必要性[J].档案管理, 2000(5):17-18.
[9]特里·库克.1898年荷兰手册出版以来档案理论与实践的相互影响[A].国家档案局,中央档案馆.第十三届国际档案大会文件报告集[C].北京:中国档案出版社,1997,143-176.
[10]国家档案局. DA/T 38-2008电子文件归档光盘技术要求和应用规范[S]. 2008.
[11]国家质量监督检验检疫总局,国家标准化管理委员会. GB/T29194-2012电子文件管理系统通用功能要求[S]. 2012.
[12]何嘉荪.论来源原则在办公自动化系统中的应用[J].浙江大学学报, 2002(5):110-116.