对重要档案及资料全文扫描的几点认识
2017-07-19王艳莉
王艳莉
摘 要:扫描仪的基本原理是通过传动装置驱动扫描组件,将各类文档、照片、图片等档案资料经过一系列的光或电的转换,最终形成计算机能识别的数字信号,再由控制扫描仪操作的扫描软件读出这些数据,并重新组成数字化的图像文件,供计算机存储、显示、修改、完善,达到满足人们各种形式的需要。
关键词:重要资料;档案;扫描
随着计算机的发展与普及,其外设产品在档案界的应用也越来越广泛,利用计算机进行电子档案处理日益受到重视。然而,键盘和鼠标只能简单地录入一些文字和表格,打印机也只解决了输出问题,对于大量的档案资料和图纸进行处理,则需要借助计算机的另一个重要的外部设备即扫描仪来完成。扫描仪是一种光机电一体化的电脑外设产品,它是将各种形式的图像信息输入到计算机中的一个重要工具,是继鼠标和键盘之后的新一代计算机输入设备,也是功能很强的一种输入设备。扫描仪的基本原理是通过传动装置驱动扫描组件(简称CCD),将各类文档、照片、图片等档案资料经过一系列的光/电转换,最终形成计算机能识别的数字信号,再由控制扫描仪操作的扫描软件读出这些数据,并重新组成数字化的图像文件,供计算机存储、显示、修改、完善,以满足人们各种形式的需要。
在长期档案利用过程中,一部分档案反映学院建院初期成长和发展历史的档案,在校史编纂等活动中仍然发挥着重要作用。为了今后利用方便,应进行全文扫描处理,将扫描后的文档挂接到现在的数据库中提供利用。如果在对其进行扫描和著录过程,有以下几个问题值得注意:
1 加强认识
1.1 确保扫描文件的原始性
档案作为最原始的记录,具有不可再生性,它具有特定的内在表现形式和外在表现形式,这一点是区分档案与图书资料的本质属性,比如我们利用图书,最主要的是利用它的参考价值,其它的则不重要,而利用档案,不但注重它内容的真实性,还注重其外在的表现形式,如档案的纸张、色泽、字体等等。在这方面,扫描技术明显优于缩微、复印技术,只要有这方面的意识,在扫描时,使用一定的技术手段,就能够较多地反映原件的特点,增强其逼真性。针对早期案卷纸张破损严重、字迹模糊等情况,以及一部分比较重要的档案,一般采用了彩色扫描和详细的色彩调整方法,使扫描信息与原件具有了很大的相似性,虽然多占用了些空间,但为档案利用者提供了较多的直观效果好、逼真性强的扫描信息,使利用者在浏览过程中,明显感觉是在看档案信息,而不是其它信息。
1.2 确保扫描文件的齐全完整性
档案室保存的永久(长期)档案和重要文献、资料,都是经过档案工作者是经过认真鉴定、整理后形成的,具有一定的完整性和系统性,内在联系紧密。作为与档案一一對应的档案扫描信息,我们务必做到保证其齐全完整性,这是保证档案发挥作用的前提。如果仅考虑文件的重要程度而认为割裂案卷之间的有机联系。势必造成文件内容的残缺不全,丧失或降低了它的利用价值。因此应将档案的完整性意识贯穿于档案扫描工作的始终。
2 技术保障
2.1 选择正确的扫描方式
扫描方式是指在数字化图像过程中采用的位深度或色深度,典型的扫描方式是位图或线条图,灰度和RGB彩色。某些扫描仪还允许用8位彩色进行扫描,这种方式对于多媒体等使用的图像是很有用的。
2.2 设置正确的分辨率
档案扫描分辨率的设置是一项重要工作,如果分辨率设置过低,那么最终输出的图像就会很粗糙,图像不清晰。但是分辨率过高,就会浪费硬盘空间、处理能力和输出费用,而且象素点过多,同样影响图像质量。
分辨率是用来衡量扫描仪对图像细节的表现能力的参数,通常用每英寸扫描图像上所含的像素点的个数表示,记做的dpi(dotperinch)分辨率可谓是整个扫描过程中最重要的参数,分辨率越高图像就越清晰。值得注意的是,档案扫描人员在使用扫描仪时千万不要陷入片面追求分辨率的误区,扫描仪的分辨率并不是越大就越能清晰的保存档案信息。首先,扫描仪有其最高的分辨率,如果用超过其光学分辨率的精度进行扫描,输出效果并不会达到最佳,反而使扫描成像体积庞大,浪费存储空间。其次,应该针对不同的扫描对象进行分辨率的选择。
文书档案:建议采用300dpi,因为这个分辨率既能够达到与原稿同样的清晰程度。如果需要放大图像,可采用插值分辨率如600dpi。如果扫描目的仅为在屏幕上观看,采用100–200dpi即可。
照片档案:一般来说,采用300dpi扫描,能将照片放大2--3倍,采用600dpi扫描,可将照片放大5--8倍。原则上如果用1440dpi的打印机输出1:1的照片,扫描时采用100--150dpi即可,为使输出效果更好通常采用300dpi。对普通5寸照片而言,原则上采用150--200dpi即可用于打印输出,若用于网页,可72--150dpi。但实际扫描时,为确保输出效果,往往至少采用300dpi。
3 规范著录
对档案进行扫描加工主要目的是使其记录的信息得到更加广泛的应用,使其长久的发挥价值,实现档案信息的资源共享。因此,对扫描文件的著录格式必须规范化。由于早期形成的档案,其中卷内文件目录大多是手工抄写完成的,有些著录项目不够规范,比如案卷提名或文件编号被简化,信息填写不全等情况大量存在。即便如此,通过手工检索查询,也可以找到原文。只是效率较低,花费的时间较长。而电子著录最大的优势在于查找方便、快捷。但是其前提是著录项目必须严格按照电子著录标准格式进行、依照原文进行完整著录,否则会有漏检情况发生,难以体现数字化带来的便捷优势,会严重影响利用效果
3.1 扫描文件著录必须以原件为对象。原有案卷的卷内目录按手工管理方法进行整理,有的项目或条目是简化著录的。这种卷内目录不能适应现代计算机检索和电子文件管理的要求。所以,对扫描文件著录不能以原案卷中的卷内目录为对象著录,而必须以原件为对象,从而提高著录的质量,确保今后检索的查准率和查全率。
3.2 原著录项题名不规范的,必须完善题名。如题名仅仅为“通知”二字,必须对原文进行阅读分析概括出主题,进一步完善题名,如“XXX 通知”或“关于 xxx 的通知”,这样才能准确地检索到扫描文件。
3.3 按照学院文书档案分类编号标准,结合扫描文件的特点制定扫描文件著录格式或标准,确保扫描文件与各著录项目一一对应。
3.4扫描文件著录前应进行预整理。预整理工作,主要是按已确定的电子著录标准,对著录的文件编号、责任者与案卷题名进行规范。如发现原案卷整理有问题的,卷内文件顺序明显错误、装订漏页等,可在预整理中予以纠正;比如,院长办公会议记录长期记录在一个笔记本上,没有目录,没有页号,在预整理时要逐一添加进去,否则无从查起。需要注意的是,预整理人员必须严格按照既定标准执行,以达到规范扫描文件电子著录要求。进行预整理,可以对档案著录项检索效能的提高起到积极的作用。
3.5 著录项的检查校对。著录时,录入人员也有可能发生输入错误。因此,对著录项的检查与校对工作尤为重要。这是确保扫描文件利用质量的前提条件。
3.6 重视著录项在扫描各阶段中的作用。档案扫描前,扫描单位必须要有全盘的工作流程方案或计划,充分考虑各阶段如电子扫描阶段、图像挂接阶段等与著录的联系。避免重扫或漏扫现象发生。
档案信息的扫描,其工作质量,取决于对“档案”这个字眼的理解和认识,档案意识强,技术标准就高,扫描质量就好;对这项工作认识不够,就难免会在工作中出现一些失误。这是一项工作量大的系统工程,需要多人配合才能完成,任何一个环节出现问题,都可能对整个工作产生不利的影响,这就要求我们要时刻保持强烈的档案意识,不断认真学习,努力提高实际操作技术水平,以档案工作者的务实精神和使命感,精益求精,为利用者提供一套系统、完整、可信度高、便于使用的档案扫描信息精品。