基于数字存档技术中缩微品解像力研究
2016-06-12宁三香国家图书馆
宁三香(国家图书馆)
基于数字存档技术中缩微品解像力研究
宁三香(国家图书馆)
摘要:通过数字存档技术和传统缩微技术在解像力方面的不同,探讨数字存档技术解像力方面的可行性。最终确认数字存档技术整个系统的解像力判断标准。本项目致力于测试数字存档拍摄解像力,同时,在此基础上,研究数字存档原件解像力的测试方法,检测数字存档的系统解像力是否能够达到标准要求,通过试验,最终提出纸本原件扫描环节的最低分辨率,为各馆数字存档技术提供参考依据。
关键词:数字存档技术;解像力;质量因数;ISO;2号测试图
1 数字存档技术概况
1.1数字存档技术概念
数字存档技术是利用数字存档机将数字影像转换至缩微胶片上的技术,即把原生性或者再生性的数字影像转换至缩微胶片上,以便于数字信息的长期保存。该技术是缩微技术和数字技术发展到一定阶段的产物,将缩微胶片长期保存的优势与数字信息方便利用的优势结合在一起,是确保数字信息安全保存的最有效的措施之一。它将有保存价值的数字图像转换到缩微胶片上,便于文献的长期保存,是缩微技术新的生命力。
1.2数字存档技术产生背景
文献缩微工作在20世纪八九十年代曾一度辉煌,在我国文献长期保存领域受到极高的重视。21世纪初,数字技术的广泛兴起,使文献缩微工作一度低迷。近年来,随着缩微文献数字化技术和数字资源缩微品存档技术的应用和普及,文献缩微工作再一次得到了国内外图书馆界的认可和重视。数字技术在数字文献长期保存中出现各种缺陷,导致数字资源丢失。珍贵数字资源的丢失是国家无法恢复的,我们以对历史负责的态度,针对珍贵数字资源进行文献的长期保存保护,提出了数字存档技术,将珍贵数字资源转换到缩微胶片上进行长期保存。这项技术已在国内外得到认可和较大规模使用。这项技术从本世纪初开始在国内推广使用,目前,在我国的使用领域主要在图书馆、档案馆、公检法系统、航空航天集团、船舶制造、兵工技术、核工业、医疗机构、金融机构、城市建筑等领域使用数转模技术。
数字存档技术在国内也在不断完善,影响和制约此项技术发展的重点在于理论的研究及探索。数字存档技术中,最重要的是缩微胶片的质量问题,缩微胶片的质量是数字存档技术的关键。其中,影响缩微胶片质量的重要参数分别是密度、解像力、色彩还原等。本文将详细介绍数字存档技术中解像力的研究,以此为出发点,论证解像力这项技术的可行性及相关的参照标准。
2 缩微胶片解像力分析
2.1解像力概念及测定方法
解像力又称鉴别率、分辨率、分辨力,是指缩微摄影系统(摄制、冲洗)对被拍摄原件细部的极限分辨,它是描述缩微品影像质量的重要参数之一。解像力读数的高低直接影响被拍摄原件缩微影像的清晰度;解像力的读数值越高,说明质量因数高,字迹越清楚,对长期保存和使用越有利。
解像力是光学摄影系统或元件对两个紧邻实体(通常是线条)分辨能力的测量值。以每毫米线对数(lp/mm)或每英寸线对数(lp/in)来表示。它的值通常以1毫米范围内尚能分辨出宽度相同的黑白线对数来表示,单位表示法为线/毫米(指黑线条或白线条数)或线对/毫米(黑白线的对数)。解像力值采用一幅含有大小不同的黑白线条组的解像力标板来测定。按照GB/T6161-2008《缩微摄影技术2号测试图的特征及其在缩微摄影技术中的应用》中规定,测定解像力采用的是ISO2号测试图(见图1)。ISO2号测试图由若干个ISO2号测试图图像构成的测试图,各图样的标示数字按照R20优先数系排列,表示该图样每毫米所含的线对数。[1]
图1 ISO2号解像力测试图
参照国家标准GB/T6161-1994(缩微摄影技术2号测试图的特征及其在缩微摄影技术中的应用),2号测试图样由两组相互垂直的五条平行线和标示数码组成。测试图样所标示的数码表示该组图样的空间频率,即每毫米所含的线对(线条与间隔)数,如,测试图样的标示数码为2.0,表示该线宽为0.25毫米,一个线条和一个线间隔组成的线对宽为0.50毫米,则该图样的空间频率为每毫米2个线对,即2线对/毫米。在测试时用显微镜检查测试图样时,如果某个测试图样上两个方向的线条都能分辨清楚,该图样则认为是可以分辨的。一次读取可分辨的最小图样的空间频率。
2.2影响缩微胶片解像力的因素
影响缩微胶片解像力因素有多种,包含缩微生片质量、原件(原图像)质量、机器设备、冲洗加工问题等。目前,缩微拍摄已经进行了三十余年,胶片生片质量及冲洗、曝光控制方面已经非常完善,所以可以设定在一般情况下,不受影响,而影响数转模解像力的是原件质量和机器设备质量。
2.3传统缩微拍摄解像力分析
传统缩微拍摄利用摄影设备对原始纸质文献进行拍摄,它的解像力测定是根据拍摄文献前的技术标板进行。传统拍摄的缩微胶片的解像力以GB/T6161-2008中所规定的方法测量。技术标板内含有5个2号测试图,分别代表5个部分的解像力,以中央解像力为最高解像力。
传统缩微胶片的解像力标准则依据GB/T19292 -1998《缩微摄影技术第一代银明胶型缩微品的质量要求》[2]为准(见表1)。
表1 第一代缩微品清晰度与解像力的要求
传统缩微胶片的解像力能清晰地反映胶片对文献的表现能力,同时也反应缩微胶片对原始文献的解像力,测量此解像力标板也就可以得出正文被拍摄文献的解像力。技术标板测定的解像力可以直接代表胶片对所有纸本文献的解像力。
2.4数字存档技术解像力分析
对于数字存档技术所生成胶片的解像力确定方法在GB/T19474.1-2004中有所规定,该标准中所使用的测试标板为计算机原生标板,即数字标板,所检测的是数字存档拍摄系统解像力,可以直接检测缩微胶片对原生数字图像的解像力。目前数字存档技术中,涉及到两种文献的存档,一种是原生性数字资源,一种是再生性数字资源。针对不同的资源类型,解像力最终确定方式不同。
(1)原生性数字资源转换缩微胶片解像力。在国外原生性数字资源被称为“Born Digital”,即除了数字形式再没有其他载体形式的信息资源。国外的定义特别强调“数字形式”是原生数字资源的唯一形式,这既包括了原生数字资源的数字原创,也包括了其在存续期间的数字形式唯一。而在国内,李宝强、孙建军从数字资源产生的技术手段出发,把原生数字资源定义为:直接由文字处理软件、CAD、数字摄像设备等数字信息系统产生的数字资源。这里可以定义为:除去数字形式再没有其他载体形式的信息资源。它直接由文字处理软件、CAD、图像处理软件、数字摄像设备等数字信息系统产生的图像。如,由计算机直接生成的word、excel等文档和用绘图软件绘制的图像,如indesign、coredraw、photoshop等矢量及图像文件。
原生性数字资源,标板的解像力可以直接代表胶片对原件的解像力,它的测试方式和传统缩微的测试方式均一致,是整个拍摄系统的解像力,所得出的解像力值也应能代表整个被拍摄文本的解像力。
目前,数字资源转换到缩微胶片上所采用的解像力测试标板根据机器设备不同,所采用的标板也不同(见图2),是GB/T19474.1-2004中《缩微摄影技术图形COM记录仪的质量控制第1部分:测试画面的特征》中所规定的图形COM记录仪产生的缩微品的图像质量的测试画面的特征。适用于能够在黑白胶片上记录字符和图形的图形COM记录仪。[3]
图2 用于检测解像力、可读性和密度的测试画面样本
图3所示是目前检验机器设备厂家自身设计的测试机器设备所采用的技术标板测试样式。
(2)再生性数字资源转换缩微胶片解像力。再生性数字资源是针对原生性数字资源进行解释的,是有其他载体形式的资源,原始文献非数字资源,而是经过后期加工处理得到的数字资源,如:用扫描仪将纸本文献扫描成电子版本的图像。
图3 OP500数字存档机所采用的技术标板
对于再生性数字资源来讲,最终胶片的解像力不能直接用数字标板来表示对被摄文献的解像力,再生性数字资源需要一个转换中介。如原生纸本文献需要经过扫描来得到数字资源,在扫描的过程中,我们也需要研究是否有解像力的损失。目前,国家图书馆对珍贵的纸本文献进行扫描成数字图像后,进行数转模,转换到缩微胶片上,这就需要研究整个系统的解像力。即从纸本文献—扫描设备—数转模设备—最终胶片整个系统进行研究。在此情况下,数字标板并不能代表整个系统的解像力,因为它未涉及纸本原件数字化扫描阶段的质量检测,即其检测范围只包含了数字影像转换缩微影像的过程,而不包含纸本原件转换数字影像的过程。
再生性数字资源进行数转模时,数字存档整个系统的解像力可分为两方面,一方面是数字存档拍摄系统解像力,是指拍摄系统再现被拍摄数字影像细部的能力;另一方面是数字存档全流程系统解像力,是指包括纸本文献扫描在内的整个数字存档系统再现纸本原件细部的能力。本项目致力于测试再生性数字存档拍摄解像力,同时还要在此基础上,研究数字存档原件解像力的测试方法,检测数字存档的系统解像力是否能够达到标准要求,并提出纸本原件扫描环节的最低分辨率。项目关注的是纸本原件通过扫描后再应用数字存档技术所生成的缩微影像是否符合技术要求,是数字存档的整个过程。在此情况下,我们将数字存档全流程划分为两个部分来研究,分别是纸本扫描解像力和数字存档拍摄系统解像力来分析。
在纸本扫描方面,数字化扫描设备的技术原理决定了其对固定频率线条的捕获能力不强,扫描获得的二号测试图读数并不能代表扫描精度表现,其原因是扫描设备CCD上的光敏元件与胶片乳剂内的光敏晶粒相类似,只不过光敏晶粒中心的位置,在所关注范围内是随机排列的,而CCD光敏元件则是均匀地分布在预定的栅格处,只能在这些位置上取样。对于固定频率的线条,每一行像元无法完全对准测试图上的每一个线条,这导致了像元在接受数据时捕获到的是部分黑线和部分白线,这就需要根据阈值来判断所捕获的既包括黑线又包括白线的影像接收为黑色还是白色。然而,不管接受为哪种颜色,另一种颜色信息都将被忽略掉,这就导致了细节的损失。固定频率的线条在接受过程中,CCD上的每一个像元都会由于上述原因在捕获影像时损失细节,致使扫描设备无法正常反映固定频率的线条图。[4]
通过上述原理分析,我们需要确定纸本扫描图像的分辨率及标准才能确定是存档系统中再生性数字资源的加工标准,最终确保胶片解像力能达到标准。
在数字存档拍摄系统中,关于数字资源的分辨率标准,国外相关机构已经有相应研究,在ISO/PDTR 18160(Document management—Digital preservation—Analog recordingtosilver-gelatinmicrofilm)技术报告通过分析指出数字图像的分辨率在200dpi即可获得较高的胶片质量。[5]
根据美国信息图像和管理协会ANSI/AIIM TR26-2000(ANSI/AIIM TR26-2000 Resolution as it Relates to Photographic and Electronic imaging)给出了数字存档扫描精度要求推算方法。推算公式为:P=QI/h,其中P是二号测试图分辨率的图样,QI是质量因数,h是文字高度。将文字高度及QI=8(根据2号测试图标板设计思路,QI=8时能够获得极好的质量)代入上述公式,在换算解像力时,分辨率提高50%,即可得出数字影像分辨率的标准。[6]
在GB/T16573-1996附录C中也提出了确定缩微摄影系统影像质量水平的方法即质量因数。提出质量因数是使用2号分辨率测试图的影像将摄影系统的分辨率与被拍摄文献中有意义的最小字符尺寸联系起来确定的。[7]通过测量最小字符的高度,可将测试图中的图案与预期的字符影像清晰度联系起来,对文献进行拷贝的分辨率要求取决于字符的尺寸、缩率和所要求的复制质量。在大多数的实际应用中,质量因数可以由以下公式确定:QI=可分辨的最小图案*小写字母e的高度。这个公式中,可分辨的图案是指缩微影像中可分辨的2号测试图的最高线组数,小写字母e的高度即与原件中或由缩微影像复制出的文件中的小写字母e的高度。字符细部清晰可辨的优质拷贝,其QI值为8或者以上,若QI值为5,其拷贝上的图案及细部即使不清晰,阅读也无困难,如果QI值为3其拷贝阅读起来较为困难。推荐QI值为3.6,为产生临界影像质量的最低值。
上述均是以英文字符为基础的。而中文字符在文字结构上比英文字符更为复杂,解像力的要求也比英文字符的要求更高。所以,中文字符的数转模扫描分辨率标准必然高于上述标准要求。
中文字符根据GB/T16573-2008《缩微摄影技术在16MM和35MM银明胶型缩微胶片上拍摄文献的操作程序》附录B中和GB/T 30536-2014《文献成像应用对原始文件制作的建议》中都有涉及:对于英文来讲:扫描宜使用小写字母“e”的最小高度为1.4MM的字符级,缩微拍摄宜使用小写字母“e”的最小高度为1.8MM的字符级。使用更小的字符可能会产生问题。附录B和附录C中也均谈到字符的光学等级和质量因数。[8]
质量因数的概念能够为新文件选择字符字体或为缩微拍摄及扫描文献选择缩率提供帮助。质量因数是基于2号测试图,与摄影机/胶片/冲洗系统的解像里有关,和将要缩微拍摄的文本中有意义字符的最小尺寸相关。
2号测试图是一系列从1lp/mm到18lp/mm图样,通过测量字符高度,这些图样与字符影像的易读性相关联。复制文本需要的解像力取决于字符的尺寸、缩率和所需要复制的质量。从使用角度出发,质量因数可定义为:QI=PR*H。其中PR为图像解像力,H为小写“e”的高度。
这里提到的均为英文字符,而中文字符和英文字符存在较大差异,由于中文的笔画比英文多,在GB/T16573-2008中,质量因数宜采用18(清晰辨认)、11(阅读无困难)、7(阅读困难且难辨)。QI因数宜采18为优秀级别。结合中文文字的复杂程度以及待转换文献的文字高度,在此以古籍善本文献数转模为例,清朝早期文献的文字高度一般在6~7mm左右,根据公式推导,其解像力在2.8以上均可以得到较好的图像解像力,结合后期的图像分辨率对应解像力分析可以得出图像的分辨率。
3 实验设计
3.1实验步骤
为了验证上述的理论分析,根据目前实际工作设计了《原生与扫描2号测试图标板扫描及拍摄试验》,通过此实验通过测试不同分辨率的2号测试图在相同照度和曝光时间下,对解像力影响的试验数据收集及分析,了解原始图像的分辨率对整个数字存档系统的解像力的影响。该实验设备器材采用:扫描仪、德国OP500数字存档机、FP505冲洗机、UOP UB200i生物显微镜、佳能600D相机、倒片台。消耗品采用:35mm柯达1461缩微胶片,柯达定影、显影药液。
在试验过程中,首先用高速高精度扫描仪以不同精度对2号测试图进行扫描,精度分别采用100dpi、150dpi、200dpi、300dpi、400dpi、600dpi扫描6张有2号测试图的技术标板(见图2)。然后用数字存档机在相同照度和曝光时间下进行拍摄。在拍摄过程中要注意各组试验样片中间要有白片,要保证各拍在一卷内,这样排除了冲洗机温度导致的解像力误差。最终用冲洗机进行冲洗,得出试片。然后利用64倍显微镜和UOP UB200i生物显微镜来观察每拍技术标板的解像力(测量最高解像力,即中间一张2号测试图解像力),最终将结果通过照相机进行拍摄。得出的实验图像及数据如下。
3.2实验数据
黑白图像原始大小:648.08*454.66MM,缩率为1:15。
灰度图像原始大小:631.11*446.91MM,缩率为1:15。
将黑白和灰度图像按照上述实验步骤进行拍摄,最终将数据进行整理分析得出表2和表3。
表2 原始图像分辨率与胶片解像力关系试验数据表(黑白扫描)lp/mm
表3 原始图像分辨率与胶片解像力关系试验数据表(灰度扫描)lp/mm
3.3实验结果分析
通过上述数据分析可以得出以下结论。
(1)在纸本扫描的过程中,扫描含有5块2号测试图标板时会损失一些细节,在数字存档后期拍摄的过程中,解像力基本不变,即2号测试图缩微影像的读数与数字影像读数基本保持一致。
(2)当数字图像像素大于数字存档设备所能容纳的最高分辨力时,胶片解像力将无法再还原电子图像解像力,解像力不再随着分辨率的增大而增大。如上述600dpi扫描完的图像像素大小为:14908*10557,已经超过数字存档机本身的屏幕最大像素数11520*7200,则胶片解像力将不再随着电子图像解像力增加而增加。导致电子图像解像力和胶片解像力不一致。当像素数超过数字存档设备最大像素数时,需要分幅拍摄,否则将直接影响最终的解像力。
(3)为准确测得再生性数字资源生成的缩微胶片的最终解像力,需要在前期纸本文献前期扫描时增加解像力标板,为后期的解像力测定提供依据。
(4)在对已经完成的数字扫描图像进行数字存档时,前期未增加扫描标板,可以根据上章节的质量因数公式,结合上述实验数据,推导出符合数字存档的数字图像的分辨率。根据文字高度和中文字符质量因数要求,对应扫描分辨率,在分辨率达到200以上,则胶片的解像力则可以达到优秀的级别。即200以上分辨率扫描图像均可以满足数字存档的本身需要。
(5)通过上述实验,验证了原生性数字资源的解像力即数字存档设备系统的解像力,再生性数字资源解像力即也对之前的理论分析进行了验证。
解像力是研究数字存档技术的关键核心技术之一,了解缩微胶片解像力的标准,探讨数字存档技术对文献的细节清晰度的还原能力,将直接影响今后缩微工作的发展方向。确认数字存档技术的解像力将直接实现利用扫描设备将纸质文献数字化,再利用数字存档机将数字文献转换成缩微胶片一整套完整的新的加工流程。完整掌握此技术解像力的影响因素将有利于数字存档技术的理论完善,这对创新缩微工作机制,丰富文献缩微抢救方式,带动全国图书馆缩微工作的开展都具有至关重要的示范意义。
[参考文献]
[1]GB/T6161-2008.缩微摄影技术2号测试图的特征及其在缩微摄影技术中的应用[S].北京:中国标准出版社,2008.
[2]GB/19292-1998.缩微摄影技术第一代银明胶型缩微品的质量要求[S].北京:中国标准出版社,1998.
[3]GB/T19474.1-2004.缩微摄影技术图形COM记录仪的质量控制第1部分:测试画面的特征[S].北京:中国标准出版社,2004.
[4]王浩,等.古旧文献数字信息转换缩微胶片技术探究——以馆藏方志家谱数转模项目为例[C].哈尔滨:2013年海峡两岸档案暨缩微学术交流会论文集,2013.
[5]ISO/PDTR 18160.Document management—Digital preservation—Analog recording tosilver-gelatin microfilm[S].2014.
[6]Association for Information and Imagc Management International.ANSI/AIIM TR26-2000 Resolution as it Relates to Photographic and Electronic imaging[S].2000: 19-20.
[7]GB/T16573-1996.缩微摄影技术在16MM和35MM银明胶型缩微胶片上拍摄文献的操作程序[S].北京:中国标准出版社,1996.
[8]GB/T16573-2008.缩微摄影技术在16MM和35MM银明胶型缩微胶片上拍摄文献的操作程序[S].北京:中国标准出版社,2008.
Study on Resolution of Microfilm Based on Digital Archive Technology
Ning San-xiang
Abstract:Considering a long-term preservation of literature,this article points out an overview of digital archive technology.By analyzing the difference between digital archive technology and traditional micrographics,it discusses the feasibility of the digital archive technology solutions and confirms judgment standard of the whole system.This article aims to test the resolution of digital archive technology,and carries out a test method for the resolution.In the end,it ensures the lowest resolution for original copy scanning whichis a reference for other libraries while applying digital archive technology.
Keywords:Digital Archiving Technology;Resolution;Quality Factor;ISO2 Test Chart;
中图分类号:G255.72
文献标志码:A
文章编号:1005-8214(2016)04-0095-05
[基金项目]本文系文化部科技创新项目“缩微文献长期保存保护研究”(项目编号:5-2011),2015年度国家文化科技提升计划项目“中文字符数转模技术研究”(项目编号:2015-05)的研究成果。
[作者简介]宁三香(1982-),女,硕士研究生,国家图书馆缩微文献部馆员,研究方向:数字存档技术。
[收稿日期]2015-10-08[责任编辑]菊秋芳