国内数转模相关技术标准比较分析
2016-09-29李进
李进
国内数转模相关技术标准比较分析
李进
(国家图书馆,北京100081)
对国内缩微摄影技术、文件管理应用、档案行业等领域中关于数转模技术的相关标准进行分析对比,观察各标准在测试画面研究、设计和制作中所采用的视角、思路和方法,总结其在测试画面、解像力、字符识别、密度等关键技术参数上的设定,以及各标准关于数转模转换原则及实际操作上的规定,为设计制作符合中文字符数转模的标准规范和操作流程提供借鉴。
数转模;技术标准;测试画面
计算机输出胶片,在国内各技术标准中统称“COM”。最早的COM系统1958年产生于美国,距今已近60年历史,最早用于原子能、汽车、飞机等工业,之后陆续在法人账本、进货单、申请书、收据的保存上得以使用。当时对COM的主要观点是:COM作为将计算机处理过的大量数据直接印到缩微胶片上的高密度输出制品,与电磁记录相比,其检索性能不够好,但具有保存性强、只需单幅放大还原就直接可读、系统维持费用低等优点。在当时,由COM形成的缩微胶片已开始同由纸、电磁记录和拍摄产生的胶片并存,但各自的保存年限和凭证年限各有不同。
近年来,随着数字技术的快速发展和广泛应用,数字资源的长期保存问题愈发受到关注。数转模技术可以将文献数字资源转换到缩微胶片上进行异质备份和长期保存,从而有效地弥补数字资源因软硬件及网络等因素造成的长期保存难题。这一技术在国外图书馆及档案界得到高度的认可,并被广泛应用于珍贵数字资源的长期保存工作中。在这一趋势引导下,计算机输出胶片(COM)的技术原理、操作对象、实现手段以及核心概念也相应发生一些变化。正如GB/T 30540-2014所描述的那样:“ISO6196(GB/T 6159)关于COM术语的正式定义并没有将近年来该技术的重要发展考虑进去”。因此,GB/T 30540-2014将COM描述为“电子文件以缩微品形式的构建和记录”。笔者认为,凡是以计算机为媒介,实现数字资源转换成缩微胶片的技术都可纳入COM技术范畴。
国际COM标准中,关于字符识别及线对表现能力基本以数字、英文字符作为基准,这与发源于象形文字的中文字符相比,其字符形状、笔画、交叉等多有不同。针对中文字符的典型特征,设计独特的测试画面,从而评估其对中文字符的线对表现能力,首先应从各技术标准的对比研究入手。
本文拟通过对国内缩微摄影技术、文件管理应用、档案行业等领域中关于数转模技术相关标准的分析对比,观察各标准在测试画面研究、设计和制作中所采用的视角、思路和方法,总结其在测试画面、解像力、字符识别、密度等关键技术参数上的设定,以及各标准关于数转模转换原则及实际操作上的规定,为设计制作符合中文字符数转模的标准规范和操作流程提供借鉴。
1 标准比较范围
为广泛对比国内各数转模相关标准,本文以《国家标准全文数据库》和《中国行业标准全文数据库》为主要检索库,以“缩微”作为“标准名称”项检索词,检索得到标准90条;分别以“COM”“计算机输出”等为“标准名称”项的检索词,检索得到有效标准5条,通过筛选,作为本文所重点阐述的标准共以下5项(8条)。
(1)GB/T 30540-2014,文件管理应用电子数据的存档计算机输出缩微品 (COM)/计算机输出激光光盘(COLD)
规定为长期确保电子数据的完整性、可存取性、可用性、可读性和可靠性而将其存档的技术,以便保护数据的证据价值。
(2-1)GB/T 17294.1-2008,缩微摄影技术字母数字计算机输出缩微品质量控制第1部分:测试幻灯片和测试数据的特征
规定用于测量字母数字计算机COM记录仪输出缩微品质量的测试幻灯片和测试数据的特征。
(2-2)GB/T 17294.2-2008,缩微摄影技术字母数字计算机输出缩微品质量控制第2部分:方法
规定利用格式幻灯片对字母数字计算机输出缩微品(COM)质量的测量方法,以及采用该方法所需使用的标准测试幻灯片的样式和测试数据的详细说明。
(3-1)GB/T 20494.1-2006,缩微摄影技术使用单一内显示系统生成影像的COM记录器的质量控制第1部分:软件测试标板的特性
提供用于评价使用COM记录器影像质量的软件测试表板特性规范。
(3-2)GB/T 20494.2-2006,缩微摄影技术使用单一内显示系统生成影像的COM记录器的质量控制第2部分:使用方法
规定GB/T 20494.1-2006所规定的软件测试标板的使用方法。
(4-1)GB/T 19474.1-2004,缩微摄影技术图形COM记录仪的质量控制第1部分:测试画面的特征
规定测试画面的特征,用于评价图形COM记录仪产生的缩微品的图像质量。适用于能够在黑白胶片上记录字符和图形的图形COM记录仪。
(4-2)GB/T 19474.2-2004,缩微摄影技术图形COM记录仪的质量控制第2部分:质量要求和控制
规定利用GB/T 19474.1-2004中制定的测试画面检测图形COM记录仪生成的缩微品的图像质量。适用于能够在黑白胶片上记录字符和图形的图形COM记录仪。
(5)DA/T 44-2009档案行业标准数字档案信息输出到缩微胶片上的技术规范
规定数字档案信息输出到16mm和35mm卷式黑白缩微胶片上的一般要求,适用于利用计算机等设备将A0或A0以下幅面纸质档案数字化后产生的数字图像制作成缩微品的过程。
2 关键术语
作为规范性的技术标准,本文重点类比的五项标准的术语基本都引用GB/T6159.1-2014、GB/ T6159.3-2014、GB/T6159.4-2014、GB/T6159.5-2014、GB/T6159.7-2014等缩微摄影技术标准规范中关于专业词汇的表述。但因这五项标准本身的适用对象和设计理念存在区别,其关键术语各有侧重。
2.1COM计算机输出缩微品
GB/T 30540-2014规定,COM方法为电子文件以缩微品形式的构建和记录。
2.2字母数字COM记录器
GB/T 6159.7-2000规定,字母数字COM记录器为只生成文字 (字母数字字符、标点及某些符号)的COM记录器。
2.3图形COM记录器
GB/T 6159.7-2000规定,图形COM记录器为既能生成文字,又能生成图形的COM记录器。
2.4测试画面
GB/T 19474.1-2004规定,测试画面为在COM记录仪中产生测试图像的数据文件。
2.5测试幻灯片
GB/T 1729.1-20084规定,测试幻灯片为用于测量COM系统输出质量的格式幻灯片。
2.6点
GB/T 20494.1-2006规定,点为COM记录系统在胶片上所能记录的最小单元。
2.7点跨距
GB/T 20494.1-2006指出,点跨距为胶片上连续两点中心到中心的距离。
2.8点重叠率
GB/T 20494.1-2006指出,点重叠率为点直径与点跨距之比。点重叠率通常是由COM记录系统制造厂商在1.3-1.5之间选定一个系数。
2.9证据副本
GB/T 30540-2014规定,证据副本为:为保持被复制文件的证据效用,以专门选择的技术手段来制作的复制品。
3 测试画面比较
如何通过有效可靠的方法,设计出能够呈现给用户清晰可读的信息并稳定测量数转模设备影像质量的测试画面,是各个标准首要解决的问题。本文所重点对比的标准大都涉及测试画面,虽规格各有不同,但包含的测试内容基本一致,最主要的是解像力、密度、字符识别、字符区分、缩率等部分。
如图1所示,GB/T 17294.1-2008规定用于测量字母数字计算机COM记录仪输出缩微品质量的测试幻灯片和测试数据的特征,包含密度测量区域、测试图区域、密度平衡区域、字符可读性测试区域、字符测试区域等部分。标准明确提到,生产厂家应为每张测试标板提供证明符合该标准要求的合格证书。此外,在测试画面的“字符组成区”额外制成一行外形相似的字符对于字符识别非常有用,比如:1和I,0OQ,B和8,Z72等。但是,由于本文所关注的中文字符与字母和数字存在较大区别,字母数字COM标准对于中文字符数转模并不完全适用。
图1 GB/T 17294.2-2008中关于测试图形的设计
图2 GB/T 20494.1-2006中关于测试图形的设计
GB/T 20494.2-2006规定使用单一内显示系统生成影像的COM的测试标板的特性和测量方法,图2是该标准所提供的测试图形设计。对于当前主流数转模设备而言,都是基于单一内显示系统而生成的影像,因此该标准对于中文字符数转模的研究有很大的借鉴意义。该标准所设计的测试标板包含测试图样、密度测量区、斜线、字符可读性区、替代字形区、测量比例尺和标题区等部分。该标准的整体设计思路基于“点”的概念。标准认为,点与点之间存在重叠,胶片上连续两个点中心到中心的距离为点跨距。点重叠率等于点直径与点跨距之比。点直径通常大于点跨距,从而使连续点的记录得以平滑,形成一条直线。对于厂家来讲,点重叠率应在1.3-1.5之间。点直径随缩率和解像力的变化而变化。如果原件规定的解像力为240DPI,那么全尺寸的点跨距为0.11mm,如果以48倍的缩率记录到缩微胶片上,那么胶片上的像素跨距为0.0022mm。
GB/T 19474.1-2004主要针对图形COM记录仪的质量控制,因此该标准设计了检测画面尺寸直线型和定位的测试画面,检测解像力、可读性和密度的测试画面、检测径向记录的测试画面、检测曲线的测试画面以及检测字符显示和字符旋转的测试画面等5个测试画面。由于各个测试画面检测的关键点不同,因此该标准并未将5个测试画面并在一起,而是分别给出画面样本。
图3 GB/T 19474.1-2004中用于检测解像力、可读性和密度的测试画面
图3是该标准关于检测解像力、可读性和密度的测试画面。本文认为,对于使用者而言,5个测试画面都应绘制且输出到缩微胶片上,才能完全评估图形COM的输出质量。
GB/T 30540-2014和DA/T 44-2009没有直接给出测试标板的设计样图,而是强调:制作缩微品的质量应符合以上 GB/T 17294-2008、GB/T 19474-2004和GB/T 20494-2006三个标准的规定。
4 字符可读性测试比较
字符的可读性体现在各个标准中解像力的测试上,宜选取无衬线字符作为测试图样,COM记录对于解像力的要求取决于被记录的字符的类型(字体和大小)以及所使用的缩率。
GB/T 17294-2008设计了五组完全相同的图样分布在测试标板的中心和靠近四角处,见图1。每个图样中包含E和H两种字符,大小相同的字符E和H成对排列,横向五对,纵向四排,高度(H)和宽度(L)逐步递增。该标准以质量值Q表示解像力:Q=P×H。其中,P为解像力符合要求的测试区域③中的最高图样标示数 (即可分辨的最小图样的空间频率数),H为从COM字符可读性测试区⑤测出的高度。当得出的质量值不小于8时,该标准认为得到了良好的效果;若质量值不小于5,亦无困难地阅读;但当值小于3时,阅读存在困难。最小值宜为3.6。
GB/T 20494-2006测试标板的各个角和中心一共六组解像力测试图,每个测试图由5组横竖对应的线条组成,线条宽度分别是1个点-5个点,线条长度为48个点,横线之间的距离为10个点,竖线之间的距离为27个点,见图2。标准指出应根据可分辨的最小的即最细的测试图案来确定解像力,观察时使用的显微镜的最低放大倍率应等于缩微影像所用的缩率。
GB/T 19474-2004解像力测试标板由若干五线组合构成图样,每个五线组合旁标有字母以用于标示,见图3。测试时,使用放大倍数是有效缩率倒数1-3倍的显微镜检测位于测试标板中心和四角的图样,依照GB/T 6161描述的方法,注明每个表搬出所能分辨的最小线条组合的字母。该标准认为,之所以使用字母而非数值来标识组合,是因为解像力是图像尺寸的函数,实际以每毫米线对数为单位的解像力可由COM厂商提供的数据表对比得知。
以上检测方法都有其独特的设计之处,但对于中文字符而言,字体的交叉是这些专为字母数字COM、图形COM而设计的测试画面所不能体现的,比如中文字符里的“矗”“数”等,因此,在专为中文字符数转模设备研发而设计的测试图画中,中文字符应突出表现出来。
5 密度测试比较
GB/T 17294-2008的测试标板中,密度测量区域包括两个圆,分别为25线每厘米的50%半色调网屏图和全黑图(密度值至少为2.0),此外还有四个密度平衡区域,分别是9个25线每厘米,10%-90%的半色调网屏图,每个半色调图独有衣阁完整的数字标识,一半为白,一般为黑,显示适当的百分比,见图1。普通银明胶型缩微胶片可允许的最小背景密度值为0.75,最小密度差为0.6。
GB/T 20494-2006的测试标板有三个密度区,分别是实心的(所有点都生成),空白的(所有点都不生成)以及生成线宽1个点,间距2个点的网线区域。检测时,负片检测空白点的(所有点都不生成)区域,网格区主要用于监测曝光和冲洗的一致性,见图2。普通银明胶型缩微胶片可允许的最小背景密度值为0.75,最小密度差为0.6,这与GB/T 17294基本一致。
GB/T 19474-2004可接受的密度范围相对宽松,最小背景密度值为1.0,最小密度差为0.9。
DA/T 44-2009指出密度值应符合 GB/T 19474-2004的规定。
6 转换原则及过程
相对于GB/T 17294-2008、GB/T 19474-2006 和GB/T 20494-2004三个标准,GB/T 30540-2014 和DA/T 44-2009的重点都在于对缩微品转换的具体方法提出要求,包括输出前的准备、胶片输出规范、胶片冲洗、缩微品的质量要求、存储环境、证据所用等。
DA/T 44-2009主要针对的是档案信息输出,规定其在标板数字图像的制作上,除测试画面标板外,还应包括凭证标板 (包括缩微品制作委托书、批准书、档案原件证明、输出说明等)、识别标板(档案权属单位、立档单位、输出单位、输出时间、输出人员、输出设备型号、输出缩率、操作系统、相关软件及其他需要识别的内容等)、著录标板(档案全宗名称、全宗号、目录号、年代、保管期限、类别等)。
为便于缩微品统一使用,DA/T 44-2009对胶片上影像的编排顺序参照传统缩微摄影技术标准,包括编排、缩率、分幅、合幅等。
在缩微品质量要求上,DA/T 44-2009对数转模缩微品所要去的项目与传统缩微摄影技术标准对缩微品质量要求的项目相同,以可读性、完整性、保存性和凭证性为原则。
GB/T 30540-2014特别强调数转模用来存档电子数据,以确保其真实性和满足长期存档需要的原则:(1)当需要保证电子数据完整性的时候,即使在非常短的时期内,也推荐使用计算机输出摄影技术(数转模);(2)对于需要存档3年以上的数据,建议使用计算机缩微摄影技术(数转模)。
GB/T 30540-2014也对COM记录的证据作用提出了要求,并在附录 B中引用 ISO18901、ISO18911、ISO18917、ISO10977、ISO12040中关于缩微品适合长期保存的处理条件与存储条件原则,包括冲洗处理条件、环境条件调整、存储设备与用具、存储室、照明条件、温度条件、相对湿度、防火防洪、监测条件等方面。
[1]牟薇,晓苏.缩微与信息处理技术的变迁[J].缩微技术,2002 (3):2-6.
[2]范韫.DA/T 44-2009《数字档案信息输出到缩微胶片上的技术规范》解读[J].数字与缩微影像,2016(1):22-25.
[3]中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会.文件管理应用电子数据的存档计算机输出缩微品(COM)/计算机输出激光光盘(COLD):GB/T 30540-2014[S].北京:中国标准出版社,2014.
[4]中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会.缩微摄影技术字母数字计算机输出缩微品质量控制:GB/T 17294-2008[S].北京:中国标准出版社,2008.
[5]中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会.缩微摄影技术使用单一内显示系统生成影像的COM记录器的质量控制:GB/T 20494-2006[S].北京:中国标准出版社,2006.
[6]中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会.缩微摄影技术图形COM记录仪的质量控制:GB/T 19474-2004[S].北京:中国标准出版社,2004.
Comparative Analysis on Domestic Technical standards of COM
LI Jin
(National Library of China,Beijing 100081,China)
This paper makes a comparative analysis on techrical standards of COM in the field of domestic micrographics,document management,archive industry,observes the angle,ideas and methods of the standard test frames,summarizes the set on the test frames,resolving power,character recognition,density and other key technical parameters,as well as the criteria for the COM conversion principles and actual operation,in order to provide a reference for design standards and operating procedures that comply with Chinese characters COM.
COM;technical standards;test frame
G255.72
G255.72
A
2095-5197(2016)04-0087-05
李进(1982-),男,馆员,硕士,研究方向:缩微摄影技术及图书馆经济管理。
2016-05-20(编发:王域铖)