浅谈古籍数字化扫描工作需注意的问题
2016-02-07潘星耀
潘星耀
浅谈古籍数字化扫描工作需注意的问题
潘星耀
进入21世纪以来,古籍数字化的技术日趋成熟和完善,其中数字化扫描已成为解决古籍再生性保护的最有效手段。在进行数字化扫描时,需按照规范要求操作,认真甄选可扫描的古籍,妥善处理好透字、折书、还原修复、图像处理等问题,加强专业人员的业务培训。
古籍保护数字化扫描图像处理
DOI10.16810/j.cnki.1672-514X.2016.12.016
古籍作为珍贵的物质文化遗产,蕴含着中华民族精神、思维方式和想象力、创造力,不仅是中华文明绵延数千年、一脉相承的历史见证,也是整个人类文明的瑰宝[1]。然而,由于人为因素和自然因素的影响,部分古籍存有不同程度的损坏。要使这古老的灿烂文化得以延续,不仅有赖于对古籍的原生性保护,更有赖于对古籍使用的再生性保护[2]。笔者近年来从事古籍再生性保护中的数字化古籍善本扫描工作,对古籍数字化中的一些技术与操作略有一些了解,对一些相关问题颇有体会,不妨抛砖引玉,对古籍数字化扫描操作过程中需注意的问题进行初步探讨。
1 古籍数字化的兴起
古籍数字化是以保护和利用古籍为目的,利用扫描、拍照等技术手段,将古籍的文本信息转化为计算机识别的数字符号,进而揭示古籍文献中包含的信息资源的系统工作[3]。古籍使用的再生性保护工作自上个世纪90年代开始以来,经历了人工录入、缩微胶片、拍摄照片以及数字化扫描的不同阶段。进入21世纪以来,随着计算机和网络技术的迅猛发展,古籍数字化的技术日趋成熟和完善,数字化扫描无疑已成为解决古籍再生性保护的最有效手段,其中商业数据公司、图书馆系统和一些科研机构,近年来都进行了卓有成效的工作,取得了丰硕的数字化成果[3]。
2 古籍数字化扫描工作
古籍数字化扫描一般可分为拆卷处理、页面修正、扫描、装订还原、图像处理五个工序。原则上古籍一般不进行拆卷处理,若因为特殊情况需要拆卷,必须经过同意,并由专业人员进行。页面修整是对古籍页面的褶皱、折角、折痕进行平整处理,以防止在扫描工序中对古籍纸张造成二次伤害。装订还原是对拆卷处理的古籍按原样进行重新装订,要求检查仔细、装订美观、结实牢固、无遗漏并认真核对数量。扫描工作中的图像处理通常采用市面上常见的ACDSee、PhotoShop等软件,在机器工作正常的情况下,扫描一页书面仅需几秒钟时间,操作简单快捷。扫描完毕的图像文件需要进行纠偏、去影像黑边、影像拼接等处理,要求页面端正、图像版心位置一致、版心横向倾斜不超过1度,基本原则是最大程度保持原书的原始信息[2]。
笔者从事数字化扫描工作期间,图书馆用于扫描善本古籍的扫描仪共有三台,均为冷光源扫描仪,不仅有利于扫描影像的品质保证,也使得在扫描古籍时不会由于温度过高对善本产生不良影响。三台扫描仪均可以调节版面角度,其中有两台A3扫描仪,一台A2扫描仪,基本上解决了善本古籍版宽、尺寸不统一且扫描过程中善本不易移动所造成的扫描不完整的问题。
扫描过程中要使扫描仪与书页确实成垂直角度,并不可以过多移动,因为机器的移动必然会带动镜头的移动,而镜头的移动必定会影响扫描不平整的结果。因此扫描一本古籍页面时,只需在扫描仪上选择好位置并固定即可。从扫描图片的效果要求来说,扫描光源也需稳定且统一,这样才能保证扫描的图片色彩接近实物颜色并清晰度高。
扫描好的古籍图片经过图像处理后只需保存在电脑的硬盘中即可。为了防止停电、电脑感染病毒等突发情况,要在扫描后,将相关资料刻入光盘中加以保存,需要注意的是,要将光盘存放在低温和黑暗的地方,因为光盘的使用寿命只有约2—5年。
数字化扫描工作一般应由常设的固定工作人员完成。因为扫描不仅需要基本的电脑操作技能,还要对扫描的古籍图片进行最前沿的筛选,为日后的整理与再出版奠定基础。同时熟练、准确的操作对善本的保护也起到了非常重要的作用。
3 古籍数字化扫描工作中需注意的问题
古籍数字化扫描工作虽然偏重于再生性保护古籍中的信息,但也应以最大限度地延长古籍寿命为宗旨,兼顾古籍在美学和研究中的双重价值[4]。虽然许多古籍保护单位在利用高科技的手段对古籍纸质文献进行保护,然而数字化扫描对纸质文献原件具有损坏性不可忽视。因此,在古籍数据化扫描工作中,我们需要注意扫描中可能出现的问题,尽可能减轻对古籍原本的伤害。
(1)需要制订明确的技术规范并严格执行[2]。一般的古籍纸质文献,都是先进行原生性的修复,接着再进行数字化扫描。这样就造成了修复、还原的古籍又一次面临分拆和再一次进行修复还原的问题。这种重复劳动不仅费时费力,对古籍也是一种非常严重的损坏。因此,在古籍数字化扫描工作过程中,应最大限度地减少对古籍的折损,必须制定相关的扫描、图像处理、书目标引等操作规范、质量标准,尽可能降低同一件古籍扫描的次数,争取一次扫描成功,避免不必要的重复扫描。
(2)认真甄选需要数字化扫描的古籍。由于古籍体例多样,纸张状况质地不一,抄本、刻本均有,誊抄、手抄和成书于不同朝代,有的字迹纤细,有的字迹模糊,还有字迹粘连、交错、分离,表格、图文混排、点校标点等情况,而且具有卷轴装、册页装、包背装、线装等不同形制[2]。因此,要根据古籍的具体情况,有选择性地来决定哪些进行扫描,哪些通过其他途径进行数字化。
(3)谨慎、认真对待扫描过程中善本出现透字的情况。出现透字的情况,是每一个负责扫描的工作人员最不愿意遇见的。不是因为怕麻烦,而是方法使用不得当容易对善本造成损坏。有很多善本,正反两面透字严重,已经影响阅读与扫描。这种情况下一般的处理方法是在书页之间加“衬纸”,把两个半页隔开,从而杜绝透字。但是加“衬纸”的弊端是衬入的纸张很容易把书口划破,进一步损坏善本。不过对于破损不严重且纸张质量相对较好的善本,此方法还是可行并常用的。但是遇到破损严重且纸张松脆的古籍,有的时候就不得不选择拆书。
(4)一定要注意保护古籍实体不受损害,尽量避免拆书,以保持古籍的原貌[4]。拆书的情况在数字化扫描中比较常见,除了透字会需要拆书外,比较容易出现的就是古籍的书脊距离板框太近,有时甚至重合,在这种情况下,挤压厉害对古籍有伤害,不挤压又不行,甚至挤压了也不行,所以往往会用拆书来解决。主要还是为了获得好的扫描效果。但是这对古籍的损伤是巨大的,因此需尽量避免。
(5)及时还原、修复、保存好扫描后的古籍。如果扫描完成后古籍只是随意放置或是放在移动式密集书架里,那么古籍将变成一堆废纸,虽然是对其进行了数字化,可是原件等于是被彻底地丢弃了,那么又谈何保护呢?所以数字化扫描虽然重要,但是一定要与原生性保护相结合,只有这样才可以在省时、省力的情况下使古籍得到更好的保护。
(6)加大设备投入力度,解决图片清晰与存储之间的矛盾。由于扫描出的图片以TIF的格式保存,其图片过大。扫描一页书在电脑上的大小约为45M,一本善本拟有120页,那么一本善本的扫描后的大小约为4.7G,一套善本往往在10本以上,那么一套善本扫描后大约需要47G的内存,才可以在电脑中存放,由于图片过大往往造成电脑的存储空间不足。虽然现在可以更改为JPG的格式,图片大小刚好合适,可是清晰度又远不如之前的TIF格式了。这也是一个非常需要注意的问题。
(7)加强古籍数字化扫描人员的业务培训[3]。扫描仪的准确操作并不难掌握,但需要熟练掌握基本的软件操作知识。因此,需要对扫描人员进行相应的数字化加工的技能培训,如扫描、拍照、图像处理等,除此以外也要进行相关的古籍知识培训,以便提升扫描人员的业务能力和综合素质。
4 结语
数字化古籍是古籍保护中的一个非常重要的发展趋势,也是现在古籍保护正在不断研究、不断开拓创新的一个重要课题。在数字化古籍保护中数字化扫描占有很重要的地位,对于数字化扫描中需要注意的问题,我们切不可掉以轻心。这不仅关系到用先进技术向更多的人呈现古籍的原貌,更是以高科技的方式让古籍这一历史的瑰宝焕发青春,传承中国文化。
[1]周爱莲,王晶静,张毅.国家农业图书馆古籍保护的现状与思考[J].农业图书情报学刊,2015(1):10-15.
[2]任红辉.天一阁古籍数字化实践及思考[J].四川图书馆学报,2012(1):51-53.
[3]赵长波.浅谈古籍数字化操作中的问题及对策[J].图书馆学刊,2016(8):56-58.
[4]于美娜.论古籍普查数字化过程中的古籍保护问题[J].艺术品鉴,2016(8):333-334.
潘星耀南京图书馆馆员。江苏南京,210018。
The Problems Needing Attention in the Digitization of Ancient Books
Pan Xingyao
Since the beginning of twenty-first century,the digitization of ancient books has become more and more mature and perfect,and the digital scanning has become the most effective way to solve the recycling protection of ancient books. While doing digital scanning,it is necessary to accord to the specification requirements for operation,select ancient books that can be scanned carefully,properly handle the through words,folding,restoration,image processing,and strengthen the training of professional staff.
Ancient book protection.Digital scanning.Image processing.
G255.1
2015-09-22 编校:曹晓文)