古籍纸本资料的数字化智能修复探析
2018-02-22秦旭剑,秦旭萍
秦旭剑,秦旭萍
摘 要 作为文明的记载与留存,古籍纸本资料不仅具有重要的文献价值,更承载着历史与社会意义。当下,国外的古籍纸本资料已普遍实现了数字化保存管理与信息查阅,而国内该领域的相关工作则尚处于探索甚至起步阶段。由于材质易损、时间久远、保存不当等种种原因,我国大量的古籍纸本资料已岌岌可危,如何将这些资料无损提取并永久保存是当下亟须解决的问题。文章以古籍纸本资料的数字化无损采集和像素的零丢失输入为研究核心,尝试探索适合地方特色的古籍纸本资料数字智能修复之路,并为其提供生态化发展设想。
关键词 古籍纸本资料;数字化修复;无损采集;信息零丢失
中图分类号 J0-05 文献标识码 A 文章编号 2096-0360(2018)21-0050-03
作为文明的记载与留存,古籍纸本资料不仅具有重要的文献价值,更承载着历史与社会意义。然而,由于材质易损、时间久远、保存不当等种种原因,我国大量的古籍纸本资料已岌岌可危,如何将这些资料无损提取并永久保存已成为当下古文献保护领域亟须解决的问题。
传统的古籍纸本资料修复工作以使用原始材料,还原原始工艺和工序为基本原则,采取临摹、仿旧等一系列工艺手段,力图全方位地精准还原原始资料的文图内容、色调乃至风格神韵。在当代,由于部分材质缺失、精良技艺难以传承以及修复工艺需时良久等诸多原因,这种理想境界的纸本资料修复方式已退居幕后,取而代之的是现代数字化修复方式。数字化修复方式是借助数码相机、扫描仪等硬件设备和PS等软件程序对纸本资料进行“定格式”信息提取、修复,最终以电子图像形式实现纸本资料的原貌式输出。数字化智能修复在当下的古籍纸本资料保护与修复工程中是一个全新的课题,而如何借助数字化智能手段实现古籍纸本资料信息的无损提取和永久保存更是值得业界共同关注的迫切问题。
1 国内古籍纸本资料的数字化智能修复现状
现阶段,许多具有文献价值和历史意义的古籍纸本资料保存现状不容乐观。
目前,国内亟待保护的重点古籍资料共1 200万卷(件),其中,珍贵的地图档案部分遭受严重损坏的达30%。吉林省古籍资料部分保存单位存储了大量吉林省在晚清至建国后纸本资料,形式包含古籍图片、历史性地图、文献资料等,内容涉及工业、军事、历史等领域,其中不乏千余件精品资料。然而,尽管被保存在档案馆、图书馆等专门机构中,由于年代久远和承载材质脆化等客观因素影响,依然有部分资料受到了不同程度的腐蚀、掉色等损坏,有些资料甚至达到一碰就碎的损坏程度。据国内图书馆、博物馆和文献收藏单位的不完全统计,我国历史机构保存的纸本古籍的数量在2 700万册以上,在民间还有大量古籍,由于环境污染和人为原因,古籍酸化和脆化程度加快,丢弃和焚毁现象时有发生,加上保管条件和环境的限制,其保存现状更令人堪忧。国外的古籍数字化研究则比较早,知名的如“大英图书馆馆藏有2万册中文图书、400多片甲骨、4万多件敦煌遗稿,并设有国际敦煌项目(IDP)秘书处,3万多份敦煌手稿已经被数字化。”[1]
当下,国外的古籍纸本资料已普遍实现了数字化保存管理与信息查阅,而国内该领域的相关工作则尚处于探索甚至起步阶段。我国在该领域尚未进行数字化开发或仅仅有少数单位对其进行简单采集,而未能规范地修复,能够对古籍纸本资料进行数字化修复的软件产品也寥寥无几,能达到对历史痕迹完整再现的更是凤毛麟角。仅有的一些数字化修复设备、软件也局限于对个体的修改,不具有专业的对于资料照片等内容的智能化修复功能,也不能在材质的鉴别、工序的处理、保存状况的平复等方面提供预防性的数字化技术支持,更没有建立起系统的数字化存储展示与应用系统。“在一些商业资源开发过程中,也会以少数常用古籍为主,对于一些冷门古籍很少有人对其进行选用。”[2]加之资金短缺、技术单一、人才匮乏以及社会监管不力等因素,我国具有历史价值的纸本文物亟需数字化、電子化的拯救,古籍纸本资料的数字化修复工作仍然任重而道远。
2 古籍纸本资料的数字化修复路径
在进行古籍纸本资料修复工作时,笔者所在的研究组主要借助数字化设备技术支持和研究室实践机制2条路径开展具体工作。设备方面依托古籍文献除尘修复工作台和对艺术品进行优化植入及拷贝修复的先进设备,快捷优质地推进修复工作;工作室实践机制方面,项目组成立了专门的古籍修复研究室,为项目组成员分配了明确、具体的工作任务、工作周期,并制定了有效的工作成果检验与考核机制。上述路径双管齐下取得了显著成效,并在项目的具体实施过程中得出了以下修复技术经验。
第一,甄选优质古籍资料底本,规范资料修复等级。此阶段的首要工作是对古旧纸本资料做前期梳理,规范划分资料修复等级,对第一批需要修复的资料进行三级设定。在此基础上,整理与甄选适宜用于修复的古籍纸本资料。初步甄选应遵循下述三条标准:1)对于书籍、图片等古籍资料,优先选择纸本载体相对完好、整洁、清晰度较高的,以保证修复过程中信息提取的精确性;2)在甄选非孤本的古籍纸本资料时,应着重选择学界公认的最佳版本,或者具有一定收藏与考据价值的善本;3)要对收集到的古籍资料的文字、内容等进行校勘、考证,甚至辨伪,对于一些罕有的少数民族古籍资料,还要请该民族的权威专家予以指导把关,以确保后期修复工作的信息真实性。
第二,对整理好的古籍纸本资料进行模数转换及数据存储。这一过程是指利用电脑、扫描仪、数码相机等电子设备对古籍纸本资料的原件进行数字化信息采集,并将其转换为电子信息呈现形式。现有的古籍纸本资料数字转换主要借助图像扫描拍照、文字识别以及人工录入等几种手段实现。图像扫描与拍照形式是借助扫描仪、数码相机等电子数字设备对古籍纸本资料进行图像化信息提取与存储,是目前所有古籍资料数字化修复手段中最能精确展现古籍原貌的形式。图像扫描适用于修复纸质载体较为完好、无损的古籍资料,在具体操作过程中宜同时借助非接触式书稿台和大幅面扫描仪2种专业设备,并配合零紫外和零红外低亮度冷光源,以保护古籍纸本资料的完好性。图像拍照适宜对临时获取且不能长久留存的纸质资料进行快捷式图像抓取,这种方式较之图像扫描操作更为便利,但成像质量和精确度也较图像扫描方式差。因此,在操作中应尽量选择成像性能优异的单反数码相机。本项目组使用设备能够对资料实现4亿像素以上的信息提取,基本可实现原始数据的零丢失。文字识别方式主要用于对古籍纸本资料的文字进行整体识别与录入。在完成古籍资料的图像扫描与拍照工作后,可借助尚书7号等文字识别软件智能识别所选图像中的文字,并将其转换为文本格式保存。这种方式实现了图像与文本之间的快捷转换,但在处理繁难字、标点和特殊符号时却常常出现识别错误,需要投入大量时间进行后期校正。人工录入借助word、记事本等office软件,采用人工手动输入古籍纸本资料文字信息的形式,并将其保存为doc、txt等文档形式,是当下所有修复手段中对文字资料的准确度还原最高的一种,但其耗费的人力和时间也非常巨大。
第三,对采集到的数据进行模拟修复,并最终形成修复软件系统。该阶段工作重点是记录修复中的修补范围、修补方式反差数据、色阶调整等内容,对记录的数据进行分析,形成能够对一些共性修复问题实现ACTION能力的规范化修复模板。在此基础上,对修复的数据进行编辑管理,最终形成一套应用性较强、可投放于市场的修复软件系统,实现对古籍纸本资料的真是还原,再现资料历史原貌。
借助上述2条古籍资料修复路径和3种修复技术经验,可初步实现了对古籍纸本资料视像数据的数字化采集,建立了有效的古籍纸本资料损坏评估规范体系,在之后可深入研发运行于数字化媒体时代的古籍纸本资料的智能修复及数字化信息存储与交互展示系统。
3 我国古籍纸本资料的生态化发展策略
现阶段,我国对古籍纸本资料修复工作的探索虽然已经整理出基本思路、方法,取得了初步成效,但是仍然存在资金短缺、技术单一、人才匮乏以及社会监管不力等微观不利因素,也不能在材质的鉴别、工序的处理、保存状况的平复等方面提供预防性的数字化技术支持,更没有建立起系统的数字化存储展示与应用系统。因此,国内的古籍纸本资料修复工作者不仅需要继续开发这项工作的技术支持,更应该努力探索一套可行的生态化发展策略,可初步尝试从以下方面着手改进。
3.1 探索创新数字技术,修复并多元展示古籍纸本资料
目前,国内的古籍纸本资料修复工作主要借助OCR光学字符识别技术手段,即以数字化扫描和拍摄手段还原资料原貌。然而,这种方式过于单一,在具体实践过程中也呈现出操作不便、清晰度不够,以及对原始纸本资料有所损坏等诸多弊端。因此,在未来的修复工作中,从业者应该立足于数字技术的高速发展状况和古籍纸本资料的动态变化环境,不断探索适合不同时代、不同境况古籍修复需求的多维数字技术形式,努力使古籍纸本资料修复工作的成本、效率和质量达到最优效应。
此外,单一的技术方法也限制了修复成果的多元呈现。目前国内修复好的古籍纸本资料的唯一呈现形式是以数字图片形式还原出的纸本资料原貌。这种呈现形式虽然扩展了古籍纸本资料的接受范围,但对于普通受众而言却稍显枯燥缺乏直观吸引力。在未来的工作中,可以尝试借助音频、视频、动画等形式多元化展示修复好的数字古籍资料,更好地实现修复工作的现实意义并契合受众的多元求知和审美需求。
3.2 普及数字古籍资料数据库,建构可扩展性数据库资源
我国现有的古籍纸本资料的数据库建设还处于起步阶段,绝大多数修复好的纸本资料仅仅以数字化的纸本原貌形态被存储于资源库中,缺乏相应的具有资源保护和抗风险能力的数字化保护体系。此外,现有的古籍资料的数据库仍仅限于对原始资料的单纯还原,缺乏元数据关联建设,进而造成受众在阅读中产生疑问时无法即时获取有效释义及相关信息的缺憾。因此,未来的古籍纸本资料修复工作不仅要努力探索数字修复新技术、创新修复成果形式,更要强化古籍资料数字化保护意识和关联数据库建设意识:一方面积极学习、引进国外大型文献遗产数据库的风险预抗经验,建设适应国内不同地方情境的综合型数据库管理系统;另一方面,“积极探索与全文数据库、知识库、大数据库的合作模式,打造资源整合平台”[3]。学习诸如“中国古籍保护网” 建设海外中华古籍数据库和中国古籍善本书目导航等的优秀经验,增加相关数字资料、文献疑难注释以及辅助性查询工具(如字典、年表)等的跟随呈现,为讀者提供便利的立体阅读环境。
3.3 建立智能检索系统,强化数字古籍数据库的分析功能
伴随经济结构的变化和发展,“人们不断追求精神价值的意义,思维也更多地由理性转向感性,科技创新也推动了许多新体验的产生和发展”[4]。智能检索是古籍纸本资料数据库中的重要功能,在设置时应有针对性地结合文献各自特点开拓相应检索项目,并努力扩展被查阅信息的深度和广度。另外,还应适应移动智能时代的媒体发展特征,着重研究“人机之间的关系,信息的接受者与信息的传播者即移动应用UI的设计师之间的关系”“围绕智能手机移动端,分析读图时代的界面设计中的设计美学体现,以及智能手机界面发展的趋势。”[5]从而实现“经由姿势、触觉或语音等方式从用户界面传递给虚拟世界的输入系统,虚拟世界依据‘感知的信息进行反应,再次将新的内容反馈给用户”[6]。
4 结束语
在当下的起步和探索情形下,国内古籍纸本资料修复工作已经整理出“甄选底本,规范修复等级、模数转换及数据存储以及模拟修复并研发修复软件系统”的基本修复思路。但在具体操作和实践过程中仍然呈现出修复成本、效率和质量间的失衡和系统化数字古籍资料数据库建设的之后等弊病。因此,国内的古籍纸本资料修复工作者应在继续研发技术支持的基础上,努力普及可扩展性数字古籍资料数据库建设,强化数字古籍数据库的分析功能,建立智能检索系统,走数字化生态发展道路,从而使我国的古籍纸本资料甚至文献遗产不仅以数字修复的形式被保存,并能以多元化的立体呈现形态在数字时代焕发新的生命活力。
参考文献
[1]姚远,李莎,沈东婧.国内外古籍开放获取实践进展[J].知识管理论坛,2017(2):120-197.
[2]程姗.我国古籍数字化发展策略探析[J].文化创新比较研究,2018(22):60-61.
[3]赵文友,林世田.“中华古籍保护计划成果”——以“中华古籍资源库建设”为中心的古籍数字化工作[J].新世纪图书馆,2018(3):12-15.
[4]郎楠.体验经济环境下的服装品牌“新销售”[J].设计,2017(8):86-88.
[5]张雪铭,赵晓明.设计美学在移动应用UI界面设计中的体现[J].设计,2018(4):40-41.
[6]谭昕.从断层到融合:高沉浸度虚拟现实有效人机交互方法研究[J].装饰,2018(1):136-137.
作者简介:秦旭剑,教授,研究方向为数字媒体艺术教学及研究。
秦旭萍,副教授,研究方向为视觉设计。