中国古籍数字化:激活文明之种
2022-05-09刘丽
刘丽
古籍《周易》里有这样一段话:“刚柔交错”,“天文也,文明以止,人文也”。
文明说到底是对不断变化世界的一种记录和反思,时间不停地重塑着世界的样貌,大江东去,无数先贤逝去,无数辉煌消陨。幸得典籍,将人类的智慧累积。
文明以——“止”,一个强壮的文明之所以不会被时光的苍茫所消蚀,难道不正是因为“书籍”在一代代的精神传承中,制止了可能的遗忘吗?
甚至连这段对文化价值的感慨,都出自先贤在古籍《周易》的贲卦里留给我们的精神遗产。
这就是文化的魅力,这种认知激励了无数代的中国人,到今天仍然以“自强不息、厚德载物”的铿锵,继续着对中华文化未来的无限畅想。
作为文化传承者的我们,如何保存过去的古籍,是中华文明在新的时代继往开来的一个基础使命。
为了完成这一使命,政府制定了一系列政策,“十三五”的“中华古籍保护计划”及《“十四五”文化和旅游发展规划》提出,统筹推进古籍普查登记、保护修复、数字化建设、整理出版和宣传推广等工作。
我国的古籍保护,也经历了文物保护、内容保护、数字化三大阶段。
第一阶段:古籍的文物保护
首先,我们抢救的是书籍本身。完成古籍的普查登记,和进一步的古籍本身的保护。古籍的保存模式大部分与保存文物的技术雷同,建立一个恒温且密闭的环境,最大限度避免时间对这些珍贵书籍的侵蚀。
但这种模式为研究古籍制造了巨大的麻烦,一方面为了能够尽量避免已经脆弱乃至残破的古籍,出现进一步的损坏,我们必须尽量少地触碰它们。可要研究古籍里承载的文化,却必然需要对它们进行频繁的阅览。于是保存实物书籍与研究书籍中记载的文化,成了一个难以根本解决的矛盾。
第二阶段:古籍的内容保护
出于对解决这个矛盾的急切需求,上世纪80年代国家图书馆原馆长任继愈就向中央提出建议:“采用微摄影技术对珍贵的图书、档案、历史文献资料进行抢救。”从1985年开始,以全国图书馆文献微缩复制中心的成立为标志,古籍保护从书籍保护,进入到了书籍内容的保护阶段。
在这个阶段,我们主要采用的是“微缩摄影技术”,这个技术与我们日常用扫描仪去复印文献有许多雷同之处。但这种雷同只是原理上的,实际操作则要复杂得多。
为了保证在扫描过程中间不会出现对图书的二次损坏,从翻动书页,到调测曝光,工作人员必须保证这些操作是高度精准的。同时,也为了保证扫描的古籍尽量呈现原貌,扫描对色彩还原和精度需求都是我们日常的“摄影”或者“复印”所无法比拟的。
于是,基于“微缩技术”,我们将古籍中的“文化”从文物级别的书籍中“提取”了出来,把它重新打印在了膠片上,这样在恒温恒湿的库房里,它们甚至可以被保存至500年左右。
作为一种重要的文献保护技术,微缩摄影在中国的古籍保护里被大量应用。从2007年开始,中国古籍保护计划重点做了全国古籍普查、评选国家珍贵古籍名录和古籍重点保护单位两项工作。
目前,全国古籍普查完成270余万部另1.8万函,全国1000余家古籍收藏单位有超过2000万册古籍得到妥善保护。将这些海量的古籍通过修复其中的破损来尽量还原其承载的文化,随后再用微缩摄影技术来进行“文化提取”是一个极其浩瀚的工程。但令人欣慰的是,这一过程经过大量专家学者的共同努力,已经有了非常丰硕的阶段性成果。依托12家国家级古籍修复中心,古籍修复总量已经超过370万页,这实在算得上一个丰硕的成果。
但随着古籍保护与修复计划的稳步推进,也随着“微缩摄影技术”将大量古籍内容“以胶片的方式得到保存“,我们又面临着一个新的问题,那就是如何高效便捷地阅览、检索它们?
第三阶段的开始:古籍的图像数字化
新的问题带来了新的手段,古籍保护进入到了“数字化时代”。
所谓“数字化”说直白一点,就是将胶片里的图像传入电脑。这种变迁其实我们普通人已经在传统相机向数码相机转化的过程中有所体验。以前我们保留影像的方式是实物照片。可随着数码技术的发展,我们发现照片不用再洗印,而直接就可以在手机、电脑等数码设备上阅览。照片也不再以胶片的方式保存,而是保存硬盘这样的数字存储设备上了。
古籍保护的数字化,同理。古籍数字化后,检索与阅览的效用呈指数级的增加。借助网络、数字存储和更便捷的检索模式,古籍保护进入到了将保护的文化,更大范围地传播出去的阶段。
正是在这样的趋势下,《“十四五”文化和旅游发展规划》提出了“统筹推进古籍普查登记、保护修复、数字化建设、整理出版和宣传推广等工作”的方针。国家图书馆作为全国古籍收藏量最大的单位,响应了这样的方针。
2021年11月30日,国家图书馆发布公告,已通过“中华古籍资源库”累计发布各类古籍资源总量达10万部/件,包括馆藏善本古籍、普通古籍、甲骨、敦煌文献、碑帖拓片、西夏文献、赵城金藏、地方志、家谱、年画、老照片等,以及馆外、海外征集古籍资源。读者免登录即可访问阅览古籍资源。
这样的工程将我们的古籍最大限度地开放给了社会,过去只能是专家学者才能够接触的珍贵文献资料,现在可以准确、清晰、便捷地出现在大众面前。
第三阶段的深入:古籍内容的数字化
古籍保护的数字化在今天的成果是极其丰厚的,但数字化工程还远远谈不上完成。拿检索来说,数字化对图书的“图像式”保存并不能让检索行为深入到具体的文章内部。浩瀚的文献,仍然只能以传统的目录方式来搜索。
对图书内容的数字化,是书籍保护的下一个趋势。
想象一下,当你想要去了解“文质彬彬”的出处的时候,你只需要在检索窗口中输入这四个字,图书库就可以准确地为你匹配到相关的古籍,会是怎样的高效和便捷吧。
即便达如此的边界,也仍然不是数字化的终点,借助最新的AI和大数据分析技术,对图像内容的精确检索在未来亦成为了可能。某一个佛教形象到底出现在多少个敦煌壁画的微缩胶片里?这个对于过去来说,是一个极其繁琐的人工检索行为,在新的图像识别技术的加持下,也只需要查阅者把自己的需求输入搜索框就可以完成。
这样的未来,正在逼近我们的生活。
Google,Microsoft等国外的技术公司正在尝试将这些新的技术应用与他们的书籍数字化的进程里。我相信随着我国技术积累的不断发展,随着我们国力和科技研发的不停进步,我们未来保护古籍的数字化手段也会越来越多,越来越先进。