民国档案著录与数字化工作实践探析
2018-01-24南京市城市建设档案馆
赵 静/南京市城市建设档案馆
近年来,民国档案的重要价值逐步为公众所认可,社会各界对民国档案的利用需求也日益增长。在这样的背景下,民国档案保管的重要性日益凸显。笔者所在的南京市城市建设档案馆收藏了大量民国档案,其中手绘图纸所占比例较高,这给日常保管带来了很大难度。首先是限于民国时期保管条件,部分图纸破损严重,不宜采用手风琴式折叠保管的方式进行保管;平铺保存能将对图纸的破坏程度减小到最小,但不利于查考利用。其次是工程图纸尤其是蓝图保管状态堪忧,蓝图多是利用重氮盐和偶联剂等感光材料进行晒制、通过碱性物质显影产生线条效果的,因此保管条件好坏对图纸质量的影响较大;加之图纸形成初期管理者缺乏保护意识,很多图纸线条褪色严重、对比度降低,致使识别困难。最后是底图保管存在不少问题,虽然制作底图时使用碳素墨水在硫酸纸上作图,笔迹材料耐久性好、黑色线条与透明的纸张载体对比度明显,但硫酸纸老化问题日趋明显,表现为韧性降低、纸张发脆,即使轻拿轻放也很容易发生纸张断裂问题,若不进行修复且频繁使用,会加剧破损现象,对档案造成不可逆的破坏。为最大程度地保护民国档案实体、延长其物理寿命,南京市城建档案馆对馆藏民国档案著录和数字化工作进行了积极探索。
1 民国档案著录工作探析
一要具备一定的汉语言和英语基础,并熟悉相关专业术语。民国档案在整理著录时,必须要熟悉档案原文。民国档案原文具有繁体字使用频繁、所使用的白话文与如今的规范表述存在一定差异等特点,因此如果没有一定的汉语言基础,将很难理解档案原文。此外民国建筑师多有出国留学的背景,很多施工设计图纸图签栏里的信息和各项标注均用英文表达,有时甚至使用英语简写,如建筑图纸中经常出现“R.C”这一表达方式,如果没有一定的英语基础,可能就不知道这是“Reinforced Concrete(钢筋混凝土)”的简写,那么在档案著录时,自然无法准确表达文件题名、揭示档案信息。
二要寻求其他专业人员的支持,主动进行合作。对施工设计图纸著录不仅涉及英文知识,还涉及大量建筑学知识。如果工作人员仅具有一定的英语基础但不懂建筑学方面的知识,很难完成著录工作。如,概括文件题名是档案文件级著录的基本要求,若无法准确提炼和概括文件题名,既影响著录质量也难以保证后期的查全率和查准率。面对“Reinforcement of Inner Dome”这样的文件题名,如果直译就会翻译成“增强内部圆顶(图)”,这样的翻译显然不尽如人意;但是如果要结合图纸内容进行意译的话,工作人员看读不懂图纸、对专业知识也知之甚少,意译便无从谈起。为此,市城建档案馆要求工作人员参阅相关专业书籍、尽可能地扩大自己的知识面,对文件题名进行先期翻译工作;同时考虑到“术业有专攻”,主动加强与相关专业机构的合作,聘请专业人员给予专业支持,如请他们结合图纸内容对先期翻译提出修正意见,保证著录工作的质量。
三要制定著录工作制度并统一著录标准。市城建档案馆参照国家档案局颁布的《民国档案目录中心数据采集标准 民国档案著录细则》《民国档案目录中心数据采集标准 民国档案分类标引细则》并结合本馆工作实际,制定了相应的著录与标引工作制度,将档案著录分为工程级、案卷级、文件级三个层级,每个层级设置固定的著录项。其中工程级以工程名称、地点、五方责任单位为基本项,辅以开竣工时间、设计号等信息;案卷级主要反映案卷内状况,主要包括题名、案卷类型、密级等基本信息;文件级则以单份文件为单位,包含责任者、密级、载体形式、保管期限等信息。由于每个著录项都可作为信息化系统中的检索入口,因此面对众多著录信息必须统一著录标准,如有些民国档案因为破损等原因,在未进行相关处理前不适合开放,著录时需严格按照要求对密级进行选择。
2 民国档案数字化工作探析
第一,要对档案实体抢救实行“最小干预”政策,谨慎裱糊。在进行数字化之前,档案修复工作不可避免。目前,档案数字化工作的基本方式为扫描仪扫描,但是无论是平板扫描还是高速扫描,对档案本身的物理状况都有相应要求,载体材料的硬度、厚度和完整性决定了其可以采用的数字化方式。在民国档案抢救工作中,很长一段时间对档案实体都采取了以裱糊为主的抢救修复方法,大量民国档案得到抢救,但是也发现了许多问题。首先裱糊过程中不可避免地需要使用浆糊,浆糊中含有水分和淀粉,档案原件在裱糊或者过水后,文字和印章等发生洇染褪色,不如裱糊前清晰,有的甚至模糊不清。其次对于是否需要裱糊没有明确的划分依据,往往将裱糊作为万能的手段,一些不需要裱糊的档案也进行了裱糊,档案原件或多或少经过水的浸害;之后为加速浆糊固化,将裱糊过的档案置于阳光下曝晒,会对档案原件造成一定程度的破坏。再次裱糊后有时不能做到尺寸与原件完全统一,这是为追求页面整齐的视觉效果对档案原件进行尺寸修正所造成的,这样的做法违背了档案修旧如旧的原则。所以对档案实体抢救要实行“最小干预”政策,谨慎裱糊。
第二,采用多种数字化手段并行的方式,提高数字化水平。利用扫描仪扫描可以解决大部分民国档案的数字化问题,然而扫描并非万能,一些特殊情况需要特殊对待。目前,图纸扫描仪可以接受的最大宽幅多为A0尺寸,但是一些民国档案如地形图、规划图等并非标准的图纸规格,有些图纸宽幅远大于A0尺寸且侧边还装有不可拆卸的木质卷轴,无法通过扫描仪进行数字化。这时,利用全画幅相机进行挂拍再进行后期处理将其转为数字形式,不失为一种较好的方式。此外,有些档案由于裱糊技术欠缺造成纸张过厚、浆糊不均等问题,这些档案同样不宜用扫描仪扫描,可以采用全画幅相机进行挂拍。有些档案由于自身载体材料稍有破损,但还没到需要裱糊的地步,因为保管不善纸张褶皱不平,直接进行扫描极易发生卡纸甚至死机现象,这时可以使用档案原件加套透明膜的方式进行扫描,这种方式能有效避免档案翘边和原件部分缺失的问题,也不会影响扫描质量。
第三,统一数字化标准,简化设备安装程序。在开展数字化工作前必须对各种电子档案格式进行统一要求,如,文本文件通用格式为XML、DOC、TXT、RTF;表格文件通用格式为XLS、ET;图像文件通用格式为JPEG、TIFF;图形文件通用格式为DWG、PDF;影像文件通用格式为MPEG、AVI;声音文件通用格式为WAV、MP3。这样能避免后期因格式不符合而进行返工对档案原件造成二次伤害。扫描后应对扫描件进行必要裁边、纠偏、去污等处理;对于褪色严重的工程蓝图,对原件直接进行修复效果不甚理想,但是通过电脑后期处理,提高对比度及亮度,能有效提升图纸的可阅读性、大大增加档案利用价值。除存储格式外,数字化过程中电子档案色彩模式及分辨率也必须按照既定的规定设置。扫描色彩模式一般可采用“彩色”“灰度”“黑白二值”三种,蓝图或页面为黑白两色的,并且字迹清晰、不带插图的,可采用“黑白二值”模式进行扫描;页面为黑白两色但字迹清晰度差或页面为多色文字、带有插图的,可采用“灰度”模式进行扫描;页面中有红头、印章及其他重要有色标记的或插有黑白照片、彩色照片、彩色插图的,可视需要采用“彩色”模式进行扫描。在分辨率的设置上,要求图像完整清晰、在放大至200%时仍可以清晰再现原文、不产生锯齿状线条,一般图纸不低于200dp、文字不低于150dpi;对于一些线条勾勒精美、原图细节复杂的图纸,分辨率可适当提高至600dpi,便于后期对数字化件进行抠图及细部放大等复杂处理,完成深层次的信息挖掘。