APP下载

信息资源数字化生产质量的影响因素分析

2011-04-13申雪克

河南图书馆学刊 2011年4期
关键词:数字图像色调文档

申雪克

(南阳理工学院图书馆,河南 南阳 473061)

笔者基于对信息资源数字化生产项目的考察与分析,得出影响数字图像质量的生产因素主要有扫描分辨率、位元深度、文件格式、图像压缩、图像增强处理和数字化生产操作的人员等。

1 分辨率

分辨率是一种识别空间细节的能力,是决定数字图像质量的最重要因素之一。数字图像采样时所使用的空间频率(采样频率)常常是分辨率的一个重要指标。因此,dpi(每英寸取样的点数)和ppi(每英寸取样的像素数)常常用来表示数字图像的分辨率。通常情况下,增加采样频率有助于提高分辨率。但是,无论是多高的分辨率,图像放大到一定程度后,仍可看到构成图像的单个像素。

对于数字化扫描设备来说,扫描分辨率表示扫描仪在既定文档中捕获像素的模式与数量,它决定了从原始文献中所采集信息的精细程度,扫描分辨率越高,所获得的图像越精细。扫描阶段,应尽可能多地捕获原始文献信息,以便在后面的转换处理、打印输出过程中即使丢失部分信息,仍然可以保持一定的图像信息总量,保证数字图像的相应品质。

但是,提高分辨率有一个“度”的问题,当超过这个“度”时,分辨率的增加无助于数字图像质量的提高,只能导致文件体积的增大,增加生产成本。关键问题在于寻找到抓取原始文献所有有价值信息所需的分辨率。

事实上,不存在一个“完美无缺”的分辨率用来扫描所有类型的信息资源。因此,扫描分辨率的设置没有统一的尺度,主要取决于被扫描的文献原稿、扫描需求以及图像处理要求等。一般认为,最佳扫描分辨率应该界定为,在输出的数字图像中,能够保证最小字符或最有意义的信息清晰可读。但这在实际工作中常常难以确定。首先,就最小字符而言,对于印刷文本,最小的字符常常是上标、脚注等,但手稿的最小字符就难以确定,影响手稿字迹清晰可读的因素很多,如墨色浓淡、字迹大小等等。其次,最有意义的信息的确定取决于数字图像的用途与用户的主观判断。比如,对于照片、图片和地图等文献,最有意义的信息就很难确定,一幅图片上哪个信息更为重要,是随使用目的(欣赏、作为证据、还是用于资料)以及用户需求(普通用户、研究人员、鉴赏家等)而变化的。

扫描分辨率的确定还得考虑输出的图像文件是否需要光学识别。分辨率设置不当,低版本的OCR可能根本无法识别文字材料。对于不同的扫描模式,OCR的识别能力与要求也不同。尽管目前OCR软件一般都具有识别彩色稿件的功能,但从效果看,黑白扫描模式的识别率较高。对于大多数黑白扫描的印刷型文本,300dpi是可以进行OCR识别的最低值,若被扫描的文献字体太小,分辨率就需增加,特别小的字体要增加到600dpi才可较好地进行OCR识别。反之,被扫描的字体大,分辨率可考虑减少。对于灰色模式的扫描,OCR对扫描分辨率的要求不宜低于200dpi。尽管今天的OCR技术还存在诸多不尽人意的地方,但光学字符识别代表了数字扫描与图像处理同时进行的发展趋势。

另外,在黑白扫描模式中,还有一个“阈值”的设定问题。不同的“阈值”点(0~256 之间,0 表示“黑”,256表示“白”)将决定捕捉到的灰度值是被转换成黑像素还是白像素。所以,同一台扫描仪以同样的分辨率进行扫描,“阈值”的设定不同,扫描效果可能很不一样。

2 位元深度

位元深度是指定义每个像素所用的位数。位元深度值越大,能够表现的色调数量就越多。位元深度直接影响数字图像的形态。数字图像的形态有黑白(或称双调)、灰色或彩色三种。

2.1 黑白图像

每个像素由一个位构成,而一个位可以表示两种色调(一般是“黑”与“白”),如用 0表示黑,则 1表示白,反之亦然。

2.2 灰色图像

由多个位(一般是2~8个位或更多位)的信息所表现的像素所构成。比如,在一幅2位图像中,有四种可能的组合:00、01、10、11。如果用“00”表示黑,“11”表示白,那么“01”便是深灰,“10”便是浅灰。位元深度为2,能够表现的色调数量为22,即4。如果位元深度是8,则每个像素能够有28(256)种不同的色调。

2.3 彩色图像

通常由8~24或更多的位来表现的图像。就24位元深度的图像(一般称RGB)而言,位元常分为三组:8位红、8位绿、8位蓝。这些位组合起来表现相应的颜色。一幅24位的图像,可以提供1670多万(224)色调值。越来越多的扫描仪以每个频道10或10以上的位元深度来捕获图像,但常常输出是8位,以补偿扫描仪中的“噪波”,输出更接近人的视觉图像。

3 文件格式

文件格式中包括了文件信息和文件头信息,这些信息给出对文件进行读写和解释的方法。不同的文件格式在分辨率、位元深度、彩色功能以及对压缩的支持和元数据的析出方法等方面会有所不同。

数字主文档采用的文件格式应该支持所需的分辨率、位元深度、颜色信息和元数据。例如,如果采用的数字主文档的文件格式不支持8位以上位元深度的图像,那么扫描为全彩色图像就失去了意义。另外,数字主文档的文件格式应该是开放的、广泛支持的和跨平台兼容的,因为这样的文档格式有利于数据交换,且生命周期长。目前绝大多数数字化项目采用TIFF格式来保存数字化主文档,并使用其他格式来保存数字主文档的各类副本。

4 图像压缩

数字化生产产生的数字图像一般都比较大,不利于计算机处理和网络传输,为此,数字化项目常常需要采用一定的技术对其进行压缩。所有压缩技术都是基于一些复杂算法,将未压缩的数字图像中的二进制代码串缩减为一种数学缩略形式。

压缩技术有标准和专用之分。一般来讲,使用一种得到广泛支持的标准压缩技术比使用专用压缩技术更有利,虽然后者有时可能会提供更有效的压缩或更好的质量,但从数字资源长期保存和应用的角度,标准压缩技术更可靠,效率更高。

从压缩前后文件中信息量的损失角度,压缩技术又分为无损压缩(如ITU-T.6)和有损压缩(或称失真压缩)(如JPEG)两类。无损压缩利用数据的统计冗余进行压缩,数据“解压缩”后,完全恢复到原来状态,与原文件比特对比特地一致,不会导致任何失真,但压缩率受到数据统计冗余度的限制。GIF、TIFF和PNG格式都支持无损压缩。

有损压缩利用了人类视觉对图像中的某些频率成分不敏感的特性,对一些最不重要的信息进行了平均化处理或者舍弃。所以,有损压缩可以认为是“视觉无损”(在视觉效果上察觉不到损伤)。有损压缩中,压缩程度的不同对图像的质量效果影响不同,一些新兴的压缩方法允许从一个图像生成多种分辨率的图像,从而使得图像交付和呈现给最终用户时,具有一定的灵活性。

在信息资源数字化项目实施过程中,无损压缩常用于印刷文本的黑白扫描,有损压缩则用于色调图像(尤其是连续色调图像)的扫描。因为后者仅仅靠简化信息并不能明显地节省图像所占的空间。目前,越来越多的数字化项目将其生产的数字主文档采取不压缩或无损压缩方式存储,而各种副本则采用有损压缩方式保存并向用户提供各种服务。

虽然有损压缩被认为“视觉无损”,但对数字图像质量的影响是明显的,尤其是压缩比率高的时候。另外,有损压缩会导致图像质量的“世袭”性降低(即,基于有损压缩图像进行再次有损压缩操作时,产生的新图像质量会更低),这也是数字主文档不采用有损压缩存储的原因之一。

5 图像增强处理

图像增强处理可以提高扫描后的图像质量。这类处理一般包括去除网纹、去除斑点、纠正偏斜、锐化、使用定制滤波器以及位元深度调整等。所用的处理工具是图像扫描加工软件或图像编辑软件。

但是,图像增强处理的使用引起了人们对图像真实性和真实度的关注。所以,越来越多的数字化项目不赞成对数字化主文档图像进行增强处理,增强处理仅局限在由数字主文档派生的各种副本上使用。

6 操作人员

扫描操作人员的技能与工作状态会对数字图像的质量产生影响。比如,在黑白扫描模式中,阈值的设定会对图像质量产生影响,而该项操作是由操作人员通过判断来实施的,如果设定得当,可以最大限度地减少线条失落或线条粘连现象,否则会导致图像质量的降低。再如,当使用数码相机对三维实物型信息资源进行数字化拍照时,照明是影响数字图像质量的一个重要因素,摄影师的技能则是实施照明效果的关键。

[1] Cornell University Library.Attributes for Common Compression Techniques. [2011-01-19].http://www.library.cornell.edu/preservation/tutorial/presentation/table7-3.html.

[2] CornellUniversityLibrary.CommonImageFileFormats.[2010-12-09]..http://www.library.cornell.edu/preservation/tutorial/presentation/table7-1.html.

[3] Cornell University Library.THE CASE FOR CREATING A RICH DIGITAL MASTER.[2010-10-06].http://www.library.cornell.edu/pres ervation/tutorial/conversion/ conversion-03.html.

猜你喜欢

数字图像色调文档
浅谈Matlab与Word文档的应用接口
有人一声不吭向你扔了个文档
湖光水色调
色调会说话
分离色调与色调曲线
ARGUS-100 艺术品鉴证数字图像比对系统
基于RI码计算的Word复制文档鉴别
In Spring!春之色调
基于块效应测度的JPEG数字图像盲取证
Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat