APP下载

档案数字化图像信息的处理研究

2017-11-26个旧市城市建设档案馆许明

办公室业务 2017年21期
关键词:板式档案馆资料

文/个旧市城市建设档案馆 许明

档案数字化图像信息的处理研究

文/个旧市城市建设档案馆 许明

近几年,伴随社会网络化、数字化程度的进一步提升,人们获取信息与使用信息的途径与手段也得到了较大的发展,以往档案资料低效率与高成本存储和使用方法,已经明显无法适应当前的使用要求。借助计算机、互联网等数字技术实施馆藏纸质载体信息“存量信息化”,增加档案资料综合服务质量,已经变成档案领域的共识,还是档案部门进行信息档案馆创建的必经阶段。文章首先分析了通用的图片压缩和保存标准,接着讲述了档案数字化需要注意的问题,最后对档案信息化图像数字处理的相关内容进行了详细的分析,以供参考。

档案资料;数字化;图像信息;处理方式;研究

数字化图像处理是指借助电脑对图像信息展开加工,以符合人的视觉要求或是使用需要的行为。结合《纸质档案信息化技术规范》的规定,扫描获得的档案初始图像应实施倾斜度、明晰度以及失真度等层面的加工。例如,倾斜图像应进行纠正、旋转还原加工。模糊与不可见图像应实时增强加工,偏斜失真、几何失准、非线性失准的图像应实时复原处理等。为此,有同行提出了反对意见,理由在于图像处理转变了档案的原貌,脱离了档案的准确性需要。

一、通用的图像压缩和保存标准

图像压缩的机理是在确保较高的图像质量的基础上,用一种数学计算方式把图像的信息量减到最少。而有关图像压缩保存的方式有许多,当前档案管理方面通常使用如下几种格式:

(一)TIFF。该种格式的图像可以保存非常多的资料,最多各个像素点能够保存32bit,通常情况下,最常见的为24bit。最早设计TIFF的想法便是可以把扫描获得的图像在各种平台上实现高效果的打印,因此,TIFF格式较为适合当做高性能的存储原件图像的保存格式。TIFF格式能够融入RGB模式或是CMYK模式,所以,TIFF图像在呈现与打印上均可以保证很高的质量,特别是在设计与印刷方面,TIFF资料格式的使用范围非常广阔,质量也十分显著。TIFF可以用满足LZW算法的无损压缩模式保存彩色图像和256级灰度图像,还可以满足CCITT G4算法的无损压缩模式保存黑白图像。TIFF也能够以JPEG算法存储有损压缩图像,可是该种图像存储模式和JPEG没有明显差别,所以,使用范围狭窄。

(二)JPEG。JPEG属于当前网络使用中最频繁的图像格式之一,其还是当前使用最普遍的压缩保存格式,JPEG的图像压缩效率很高。JPEG也是一个较灵活的图像保存格式,可以通过不同的质量标准来对图像实施不同倍率的处理。JPEG采取的是一项有损压缩算法,如此在放大呈现时能够较明显看到,针对高性能的打印其质量也会存在区别。因此,JPEG不适宜作高质量才能出原图的保存格式,但由于其压缩倍率较高,所以比较适用于网络中,一般情况下,能够用JPEG对原件进行15—20倍的压缩,依旧可以获得非常好的视觉成效。

(三)JPEG2000。JPEG2000是JPEG的升级版,它的压缩率和JPEG相比明显高出30%左右,而且允许有损与无损压缩。JPEG2000格式存在一个非常关键的特征是,其可以达到渐进传递,是指先传送原图的轮廓,再逐步传送信息,进一步提升图像质量,使图像从模糊到清楚呈现。另外,JPEG2000还具备“感兴趣区域”的性能,能够制定图像中感兴趣位置的压缩质量,也能够选取指定的区域先压缩。JPEG2000的优点会明显高过JPEG,同时向下兼容,所以,能够代替以往的JPEG格式。JPEG2000格式不仅能够使用在传统的JPEG条件下,像扫描器、数码相机等,还能够使用在新兴领域,像互联网传递、无线通信等。

(四)PDF与OFD。PDF与OFD属于两类板式文本格式,其中,PDF是由国外的Adobe企业在1993年研发的一种板式资料格式,当前已成为世界标准格式。OFD是根据国内工业数字化部组织创建的电子文件保存,与交换格式作业组板式文件编制组建立的板式文件标准产生的板式文档格式。这两类文档格式并非专门的信息图像压缩和保存格式,其仅仅是把现有的图像资料合并组织成一个齐全的板式文件。使用板式文档管理信息图像:一是把一个档案信息组合成一个电脑文件,便于浏览和传递。二是信息图像格式的资料能够使用OCR技术产生双层PDF或是双层OFD,进行信息图像的文件检索。

二、档案数字化需要注意的问题

通过上述详细分析,现将档案数字化处理的技术参量以及后续处理提出以下建议:

1.需要使用很高的技术参数进行纸质档案信息化。页面上有红头、印章以及含有彩色图片、彩色插图的资料选择彩色模式来扫描,页面是黑白两色的资料要使用灰度模式来扫描,尽可能不采用黑白二值形式。

2.使用彩色模式处理时,它的分辨率通常建议选用600dpi。灰度形式扫描时,它的分辨率通常建议选用200dpi。独特条件下,如文字很小、集中、清晰度很差等,能够适当提升分辨率。

3.信息化成果中需要尽可能维持纸质资料原貌,不能不进行选择地展开去污以及裁边操作。

4.有条件企业,在进行档案数字化任务的时候,需要同步进行OCR辨别工作,方便进行全文检索、电脑辅助编目、编研研究以及信息开发等。

三、档案信息化图像信息处理

档案信息化完成后,要根据不同的使用模式,分保存层、使用层以及索引层这三个层次来进行信息图像处理,分别用来进行图像的保存和再生、网络使用与图像索引。

(一)保存层保存纸质档案信息化原始成果照片,以现行的通用软件来实现很高质量保存原图像信息,并可以用现存的硬拷贝装置来恢复原有的图像信息。该层的规范不仅要考虑到现有软硬件装置和存储装置的制约,还应当确保较高质量方面的再生质量。而且,该层次应不需要展开实时应用,如此便可以使用现存的设备来前处理与处理时就能够接受很长的处理时段。在图像格式上,因为信息化处理对原始图像资料已有非常大的耗损,所以在保存格式上一定要使用无损压缩的信息格式,而使用无损压缩的TIFF格式可以完整再生当前处理的信息化图像资料。

(二)使用层重点以网络传递和计算机使用为目的。思考当前的网络传递宽带和现有计算机的输入输出功能是界定该层次标准的重要依据。而且,该层次是一个中间的使用层,能够按照以后网络和计算机功能的发展而再次定义,以符合更高层次的使用要求。由于这个层次图像信息是由保存层的资源形成出来的,因此,其标准最大上限为保存层的标准。当前,网络上使用最普遍的保存格式为JPEG,所以,选择JPEG格式当做使用层图像保存格式。结合实践经验得知,当前在网络中传递的单一图像资料,其容量尽量不要大于1MB,要不然在网络中传递将面临时延偏长的情况。

(三)索引层是给网络浏览导航、介绍、索引库等使用而设的,该层的设置需要以最小科学的资源大小来符合索引的使用要求。该层的格式通过界定后比较固定,通常不会随着使用的改变而出现变化。索引层作为一般含义的拇指图,对资料不会有很高的质量需要,通常选用最大图像规格是200像素的JPEG格式保存索引层资料。

四、结束语

数字化成果很关键的一个部分为数字图像资料,相较于信息文本资料来说,图像资料的处理与保存非常复杂多样,结合当前的设施与技术状况,研究创建一套切实可行的操作流程与标准规范,针对信息资料数字化与资料质量的统一与提升,推动档案事业长远健康发展,针对以后档案馆之中和与其他企业的数据资料交换具备显著的意义。

[1]刘虎,孙娜,张学干.试析档案数字化过程中遇到的特殊情况及处理方法[J].山东档案,2014(03):49-51.

[2]胡红霞.论数字档案馆的建设——数字档案馆档案信息采集的研究[J]. 中国教育研究论丛,2015(00):25-27.

[3]程妍妍.国际图像电子文件元数据发展新趋势——NISO Z39.87技术元数据标准的分析与研究[J].浙江档案,2014(10):37-39.

[4]李昕阳.努力实践科学发展观 扎实推进高职毕业生就业档案信息资源利用[J].机电兵船档案,2016(06):55-57.

[5]刘宇,曹强.城建档案管理系统的设计与实现——以江苏某城建档案馆为例[J].山西档案,2012(05):58-61.

猜你喜欢

板式档案馆资料
Party Time
PAIRS & TWOS
JUST A THOUGHT
关于智慧档案馆与数字档案馆的关系探讨
KD399:便装式窗帘固定架
“有板有眼”最初形容什么
when与while档案馆
北京市第三届“档案馆日”活动预告
浅析京剧“皮黄腔”的板式
科隆档案馆突然坍塌