数据智能驱动下的《四库全书》保护与开发
——以文溯阁《四库全书》为例
2022-05-27崔溶芷
刘 婷,崔溶芷
(1.甘肃省图书馆,甘肃 兰州 730030;2.陇东学院,甘肃 庆阳 745000)
近年来,随着互联网的快速发展,人工智能的脚步离我们越来越近,小到智能耳机、移动支付,大到能够处理复杂数据的机器人,这些现实的案例都在不断向我们昭示:未来社会,一切实体都将走向虚拟化,并以数据的形式永久存在;这也意味着人类社会将逐渐迈入全新的“数字王国”。在此背景下,各个行业都要转变思维,提前预判,将数据的收集分析和智能化应用作为未来工作的重点。2014年4月24日,百度高级副总裁王劲在第四届“技术开放日”上正式宣布推出“大数据引擎”,数据智能(Data Intelligence)的概念由此产生,它是基于大数据引擎,通过大规模机器学习和深度学习等技术,对海量数据进行处理、分析和挖掘,提取数据中所包含的有价值的信息和知识,使数据具有“智能”,并通过建立模型寻求现有问题的解决方案以及实现预测[1]。在现实应用中,大数据技术为人工智能的实现提供了强大的数据支撑,人工智能技术又为数据的应用和存储提供了媒介,二者交汇融合,最终实现数据的“智能化”并用以解决现实问题。
当“数据智能”与中国优秀文化相遇,将会产生怎样的连锁反应?“数字敦煌”“中国记忆”的成功实施为我们揭开了答案。在“数字敦煌”这个案例中,敦煌研究院不仅利用数字化技术对洞窟信息进行精准采集,开辟了文物保护的新路径,而且还在科技助力下实现了敦煌文化的有效传承。云游敦煌小程序,敦煌动画剧角色配音,点亮莫高窟创意互动等一系列线上活动,使大众足不出户就能欣赏精美的壁画、彩塑,享受敦煌文化的魅力。国家图书馆开展的“中国记忆”数字化项目则是通过数据库建设、信息检索体系构建、虚拟现实和可视化展示等技术,将能反映中国记忆的文本、图片、音频、视频等信息进行加工、组织并转换为计算机可识别的形式,最终实现信息资源的检索和利用[2]。文化与技术的融合,将为文化遗产的保护、开发、传承带来全新的路径和方法。
《四库全书》是乾隆年间汇集国家力量编纂的一部大型丛书,编纂完成后,以馆阁体抄成七部,分储于全国不同的七个馆阁当中,然因战火和权力更迭,致使其不断损毁缺失,流传至今,仅剩文渊、文溯、文津三部和文澜半部。鉴于此本文将以文溯阁《四库全书》为例,分析该书入藏甘肃省图书馆半个多世纪以来的保护开发现状,重点探讨数据智能驱动下以《四库全书》为代表的文化遗产如何突破传统静态式存放保护模式的藩篱,以更加生动、丰富的形式向大众呈现,并实现文化价值的有效利用。
一、文溯阁《四库全书》保护开发的现状
(一)保护:人防与技防的紧密配合
文溯阁《四库全书》自1966年入藏甘肃省图书馆以来,受到了各级领导的关心和重视。甘肃省委、省政府投入大量资金改善书库环境;省、市、县公安部门也将此书列为重点保护对象;甘肃省图书馆更是派专人长期坚守在偏远的书库,精心保管。可以说,在20世纪这个特殊的历史背景下,“保护《四库全书》的绝对安全”俨然成为工作的主要内容,这一思路也符合书籍拨交至甘肃存藏的初衷。
进入21世纪,国民经济飞速发展,特别是互联网、信息化技术的迅猛发展,带动了整个社会的进步。2000年,《中共中央关于制定国民经济和社会发展第十个五年计划的建议》中第一次使用了“文化产业”的概念,提出推动文化产业发展的任务和要求[3]。2003年9月,中国文化部制定下发《关于支持和促进文化产业发展的若干意见》,进一步明确指出,文化产业和文化事业是社会主义文化建设的重要组成部分。随着文化政策的引导,作为社会教育的主要设施,图书馆、博物馆、文化馆都积极转变思路,在做好馆藏资源保护的同时开展了一系列创新性实践,以满足人民日益增长的精神文化需求。
新的时代,《四库全书》藏书馆树立起“保护为主、抢救第一、合理利用、传承发展”的指导方针,不断强化文物意识,健全管理制度,逐步实现智能化管理。在做好保护的同时,不断加强学术研究和文化挖掘工作。1999年5月,甘肃省人民政府决定在兰州立项修建文溯阁《四库全书》藏书楼,并将其列入甘肃省“十五”规划中。2000年12月,甘肃省人大常委会做出《关于进一步加强文溯阁<四库全书>保护工作的决定》,提出要借鉴国内外文化遗产保护方面的成功经验,特别是汉简和敦煌壁画的保护办法,对《四库全书》进行科学有效的保护,这是第一次将《四库全书》的保护提升到法律的高度[4]。2005年7月,文溯阁《四库全书》藏书馆正式落成,成为全国第一个《四库全书》保护管理的专业机构。
在书库环境上,采用“恒温、恒湿”条件,结束了人工控制温度、湿度的历史。为确保安全,新馆建成后,并未马上存放《四库全书》,而是先放置其他书籍,对书库环境进行严格监测,并与甘草店书库的数据进行比对,待条件符合后,才将《四库全书》整体搬迁。为做好防虫工作,还专门在浙江定制了一批樟木书箱来储存“国宝”。为营造新馆良好的历史文化氛围,先后定制河图洛书大型石雕、仿照沈阳故宫建造碑亭和石碑;在人防上,完善管控制度,配备多年从事《四库全书》保护和藏书馆建设的同志担任书库管护工作,并辅以一定保安人员做好安保;在技防上,通过微波、红外感应自动监控、报警系统联网和自动消防等现代科技手段来加强监管。还通过增加空气净化设备和投放干燥剂等措施确保书库温湿度和空气洁净程度达标。
(二)学术研究:四库学的兴起
为加强研究力量,甘肃省图书馆联合省内知名院校专家学者成立甘肃省“四库全书研究会”,并邀请海峡两岸著名学者参加全国“四库全书学术研讨会”;讨论内容涉及《四库全书》编纂的起因、背景、版本、校正、四库存目等诸多方面;并集结相关研究成果,相继出版《四库全书研究文集》《四库全书学术研讨会论文集》《<四库全书>建设及保护资料汇编》,编辑印刷文溯阁《四库全书》藏书馆宣传册等成果,同时还筹办《四库全书》研究会通讯,及时发布研究会工作动态和四库研究的最新进展。该研究会还对文渊、文津、文溯三阁《四库全书》书前提要进行比对,初步完成《金毓黻手定文溯阁四库全书提要》的扫描和校对工作。学会成立以来,吸收发表了许多富有学术价值的论文和专著,引发了四库学研究的热潮;为满足关心《四库全书》保护和建设的社会各界人士及学术交流、社会教育的需要,特别设计了“千古巨制——文溯阁《四库全书》展览”,该展览全面生动介绍了《四库全书》纂修缘起、收藏内容、庋藏与流传以及文溯阁《四库全书》的保藏,兼具学术性和趣味性,运用现代多媒体技术和纪录片的呈现,全方位展现了《四库全书》的文化魅力。新馆落成时,还专门设计制作开馆庆典纪念封一枚(含邮资),馆内藏有台湾影印本文渊阁《四库全书》全套,可供读者查阅研究。
2007年,甘肃省图书馆申请立项国家社会科学基金项目“《四库全书》研究资源全文数据库”,该数据库收录自1915年以来研究《四库全书》的相关论文、专著、图片、词条、图表、书目索引数千条,设置类目包括纂修概述、分类著录、书目提要、版本辑佚、文献研究、人物研究、庋藏利用、学术研究、影印出版、相关学科等,对四库学研究具有重要的意义。同时,馆内还配合首都师范大学进行《四库全书》申遗工作,在《四库全书》的文化宣传和交流方面进行了有益的尝试,如举办“走进《四库全书》系列宣传活动”“千古巨制”系列微展览等活动。
(三)文创产品开发:“文溯四库”品牌打造
2006年,文化部出台《关于推动文化文物单位文化创意产品开发的若干意见》,甘肃省文化厅联合五部门制定《关于推动文化文物单位文化创意产品开发的实施意见》(以下简称《意见》)。根据《意见》要求,在敦煌研究院、省博物馆、省图书馆、省文发集团、读者出版集团、兰州创意文化产业园等单位开展第一阶段试点工作[5]。在此背景下,甘肃省图书馆依托文溯阁《四库全书》等优质馆藏资源,选择经典、名著、名篇,以经典文化、主题文化、地域文化、线路文化、特色文化五大类别为重点,打造以“文溯四库”为重点的文创产品。同时加入“全国图书馆文化创意产品开发联盟”,借助“互联网+”思维和O2O平台商业模式和经营理念,联合各成员馆推进“全国图书馆文创开发一体化平台”建设。
目前已经投入市场的产品有:文溯阁《四库全书》主题书签,《影印文溯阁四库全书》四种,包括经部《易图说》、史部《长安图志》、子部《墨法集要》和集部《璇玑图诗读法》,汇为一函,由上海古籍出版社仿真影印出版。
二、数据智能驱动下的《四库全书》保护开发策略研究
随着数智技术的广泛应用,网络化、信息化与智能化带来的物联网、大数据、人工智能、3D技术等,正深刻影响着人们的传统思维方式;人类正在进入“媒介化生存”的时代。传媒文化、视觉文化与文化产业相互交织、混合,以相互推动的形态成为当下社会的主流文化。特别是在全球新冠肺炎疫情的影响下,人们对移动终端,如手机、i Pad等产生了更为强烈的依赖感。在此语境下,以《四库全书》为代表的文化遗产的保护开发也需要插上“数字”和“智能”的翅膀,从高冷的藏书楼走向大众视野,被更多的人“看见”和欣赏。基于此本文将从线上、线下全场景体验馆建设、文创产品开发、数据库建设、文本数字化、学术研究等多个维度探讨《四库全书》的保护与开发(见图1)。
图1 数据智能驱动下的《四库全书》保护开发流程图
(一)保护:通过影印和数字化延续古籍生命
2013年,甘肃省委、省政府把影印文溯阁《四库全书》列入《甘肃华夏文明传承区总体规划“十三板块”珍贵古籍文献的整理出版》的首项重大工程,中央财政下拨专项资金1200万元,作为文溯阁《四库全书》数字化与影印出版的先期资助经费。2017年1月,由甘肃省图书馆和读者出版集团联合,启动了影印工作,3月完成了数字化影印设备的招标工作。2018年,我馆组织人力对《四库全书》进行清点,清点结果与辽宁省图书馆1966年移交的情况相符,书籍保存完好。2021年甘肃省再度推进文溯阁《四库全书》的影印和数字化工程,这项影印出版工作将成为国内外文化界的重大工程,其出版实施,将会开启“四库学”研究的新征程,也在某种程度上实现了对纸本文献内容的永久保存,使得纸本文献的生命得到了延续。
(二)研究:从传统文本走向数据挖掘
在“数据智能”的驱动下,知识的组织和开发已经深入到学科的知识单元,人文学科的发展与技术的结合更加紧密。在数字化基础上,可在计算机的帮助下借助主题建模、文本挖掘、遥读分析等方法,以崭新的视野去解读《四库全书》,以完整了解其背后所蕴含的整个18世纪学术发展的脉络与趋势。要让技术发挥作用,首先要完成基础文献数据的采集工作。在数据挖掘技术(date mining)的指导下,在大量纷杂、无序、随机的文本集合或语料库中提取并整合事先未知但却具有潜在使用价值信息的模式[6]。引入大规模定量计算分析方法,构建可持续完善和丰富的数据集和分析工具,充分利用新的信息技术、中文信息处理技术及跨学科方法[7],实现对《四库全书》不同版本的比对研究,考察出文献的原始出处及后续演变情况,以全新视野审视古籍文献,开展立体式研究。
目前,鉴于《四库全书》数字化资源存在着资源分散、建置多元、数据多样的特点,古籍数字化资源整合工作势在必行!首先,要完善《四库全书》资源数据库建设,尽量做到应收尽收,门类齐全。除了常规的文献数据外,还要将与《四库全书》相关的图片、视频、音频、档案资料、相关事件、历史建筑、重要人物、研究进展等都列入资源数据库中,特别要加强有关《四库全书》口述史研究相关资料的采集和收录,将《四库全书》保护过程中的重要人物、事迹、经验等内容全部收集到数据库中,以达到共享、安全和长久地保存这些弥足珍贵的非物质文化遗产的目的;其次,建立《四库全书》文献知识统一检索服务平台,利用数字人文及相关技术把与《四库全书》相关的不同类型的数据资源进行全面整合,从而为用户提供一个相对集中的查询平台,且支持PC、手机等终端的访问检索。
(三)开发:利用VR、AR等虚拟空间技术
1.打造沉浸式四库文化体验馆。目前,千古巨制——文溯阁《四库全书》展是全国唯一有关《四库全书》介绍的综合性展览,但该展的内容几乎全部是文字和图片,缺乏生动性和交互性,更谈不上沉浸与想象。且考虑到对《四库全书》的保护,原件不宜展示。基于这样的现实,VR技术的出现为我们开辟了一条崭新的路径。VR技术具有多感知、可视化、三维建模、沉浸性、交互性、想象性等特点,是集成了多学科、多技术的一门综合技术,其三维建模功能可以在计算机中创建一个视、听、感、触等多重感知的虚拟世界[8],拓宽了“可视化”的应用路径,为公众提供了一个“时空穿梭机”,通过构建三维世界还原影像档案中记录的历史场景,使用户产生身临其境之感[9]。利用VR对《四库全书》进行三维信息资源建设,使观众不但可以真实体验翻阅“线装古籍”的快感,还可以走入历史,亲自体验编纂《四库全书》的流程,通过“共情”“共鸣”,来加深对整个编纂事件的了解。利用数字动画和虚拟现实技术构建“虚拟藏书阁”,以一种全新的数字化方式向人们生动展现天一阁和七座《四库全书》藏书阁的建筑样式,更加直观地感受“外二内三”这一巧妙的藏书设计。
场景化打造也是沉浸式体验的重要手段。2016年,百度开展了一场“AR复原朝阳门”活动,地铁乘客通过手机App对准地铁站张贴的巨幅朝阳门手绘图拍照,触发AR小程序后,元末明初朝阳门的各色生活场景和解说就会出现在手机屏幕上[10]。AR技术,用故事化、可视化的形式让更多人感受悠久历史和经典文化。四库文化体验馆应借鉴上述经验,选取修书过程中的代表性事件,如各地征书献书、馆阁体缮写、皇帝奖惩、建阁藏书等事件,利用AR技术进行场景再现,让观众获得更真实的沉浸式体验。由中科君胜(深圳)智能数据科技发展有限公司开发的中科智能书法台也是实现场景化再现的重要手段,对于体验“馆阁体抄写《四库全书》”大有裨益。它模拟传统书法的真实环境和本真体验——仿真毛笔在数字砚台中蘸墨后,可以在仿宣纸的电子屏幕上自由书写,并可以实时保存、优化字迹、加盖印章、智能打分、在线分享、现场打印[11]。
AR、VR技术的应用不仅为《四库全书》的保护开发提供了新的工具,而且更加深入地表达了文化内涵。它打破了知识获取中时间、空间的限制,使知识交流更具交互性与开放性。以技术之力为文化注入新的能量,推动文化遗产数字化保护进程,既可以保护文化遗产,又可借信息化的力量,扩大文化遗产传播途径,对于文化遗产的传承具有重要意义[12]。
2.发布“云游四库”线上展览。开发基于互联网虚拟空间技术,以移动终端和PC终端呈现的《四库全书》云端展览(简称“云游四库”)是一种对传统展示方式的延伸和拓展,它更符合现代人对文化产品的需求。“云游四库”首先要实现的是文本的可视化,这是一种通过文本资源分析,发现特定信息,并利用计算机技术将其以图形化方式呈现出来的方法[13];它主要从文本信息的可视化展示和可视化知识提取两方面来完成;可视化展示是将抽象的数据空间转换为直观的视觉空间,以便于人们通过强大的视觉处理能力发现隐藏在抽象数据空间中的模式、见解和知识[14]。这一方法将使《四库全书》的内容以更生动直观的方式展示给普通观众,让他们进一步了解《四库全书》背后的故事和历史事件,从而实现传统经典的文化普及。
“云游四库”相较于传统的线下展览更具开放性、灵活性、趣味性和互动性。首先,参观者可以足不出户、随时随地观展或分享,免去了因人数、空间、时间限制而产生的各种不愉快感;其次,“云游四库”展示方式多样,集声光电于一体,对历史场景还原度高,有身临其境之感。AR技术将虚拟数字信息叠加在现实环境之中,现实设备将这种虚实融合的场景,如人物、山川、河流、宫殿、庙宇等一一呈现,有效增强体验者对真实世界环境的感知。在这里,参观者可以感受到乾隆年间的社会文化风貌和编纂《四库全书》的历史背景;再次,“云游四库”的模块分类清晰,内容丰富翔实。GIS技术下可以支持地图的生成,让观者对历史人物的地理分布、足迹路线一目了然。展示在互联网上的高清图片可以放大,3D技术展示的作品可以360度无死角观看,作家、作品的介绍更加清晰立体。不仅如此,“云游四库”还具有很强的趣味性。在入口端设计上,采用多主题引导,初次参观者可随意选择,但想要进入下一入口,可以通过答题、互动等方式获得解锁密钥。这样的设计从易到难,激发了观众探索的欲望和参观的动力。法国作家福楼拜曾说,“越往前进,艺术越要科学化,同时科学越要艺术化。二者在塔基分手,回头又在塔尖结合”,这句话虽是论述科学与艺术的关系,但却从侧面启示我们,古籍开发工作既要埋头爬梳,也要借助科技力量唤醒深藏于文献背后的文化内涵,如此,才能更好延续古籍的生命;最后,开发专门的APP软件和公众号,利用大数据和AI,实时追踪消费者的需求变化和动态,对变化及时做出反应,力求以消费者需求为出发点,及时更新、优化软件功能;并将体验馆内的最新活动与服务实时推送,打通线上线下的服务营销双模式,形成线上线下的双向互动。
3.“四库物语”系列文创产品开发。伴随着移动互联网、大数据、云计算和物联网等新技术形态的深入应用,文创产业日益走向数字化、移动化、场景化、体验化和品牌化[15],改变了以往文创产品“同质化”的弊端。在技术赋能下,数据挖掘、模式识别等技术能为文创产品提供精准决策的数据和算法;物联网、3D打印技术则使产品更具个性化[16]。“让国宝活起来、潮起来”已然从愿景走向现实,并在诸多文创产品中得到体现。如以敦煌壁画为原型设计的“遇见飞天”皮肤,栩栩如生地出现在网游《王者荣耀》中,使数以万计的网友爱好者体验了“飞天”之美;法国卢浮宫利用3D打印技术使馆藏之宝飞入寻常百姓之家;腾讯与敦煌研究院联手推出的“敦煌诗巾”小程序本着“人人都是设计师”的理念,以DIY形式让用户亲自体验八种敦煌壁画主题元素在不同组合下的巧妙效果,并提供丝巾定制化服务。
《四库全书》系列文创产品(以下简称“四库物语”)的开发要紧紧围绕文献自身的特点,结合馆藏地点、编纂背景、人物故事、迁徙传承等内容展开,打造独具特色的IP特征。“四库物语”这一命名蕴含着灵动性,将厚重的《四库全书》比喻成一个具有生命力的知识精灵。它神秘、深邃,但又可爱、亲切,在古今穿梭中讲述着自己的前世今生。该系列文创产品在表现形式上,更加注重文化与科技的深度融合,使优秀的文化元素以网络化、数字化的形式向观众呈现。如可以将《四库全书》中的人物、景物、状物等进行3D打印,观众可以根据喜好选择定制,同时提取四库经典文化元素融入游戏、影视等场景设计,连通传统文化与现代观众的审美距离。
不仅如此,还要紧跟时代,将人工智能广泛应用于“四库物语”系列文创产品开发过程中,借鉴故宫博物院“见大臣”AI聊天机器人这一具有科技性和交互性的形式,开发“乾隆喊你来修书”AI机器人和同名微信小程序,设计生动活泼的LOGO,嵌入“我帮馆臣做校对”“看谁抄书最厉害”“挑战最博学馆臣”“抄书奖惩大PK”等游戏体验和角色扮演环节,寓教于乐,使观众真切感受到《四库全书》编纂、抄写的过程,并了解相关知识。在当今文旅融合,数据赋能的时代,媒体、视频、游戏和影视已然成为新文创生产体系的发展趋势。以《四库全书》的编纂、抄写、存藏、保护为背景,通过微剧情、小故事、短视频等传播手段,让大众了解中国文化的博大精深。如策划拍摄《<四库全书>是这样“修”成的》《<四库全书>的前世今生》这样的纪录片、动漫作品,以观众喜闻乐见的方式展示经典文化的魅力。
深入挖掘《四库全书》IP的文化内涵,推进文创产品的品牌化,重点在于衍生产品开发与多元场景延伸。具体而言,要将“文化+科技+实用”的理念融汇于产品设计、开发、营销的全流程,充分利用各种新技术来提升产品的知识性、趣味性和实用性,从而提升品牌的影响力。甘肃省图书馆要从馆藏特色入手,加强与第三方相关出版社、旅游景点、专业文创研发机构、互联网企业、知名设计师、商业营销平台的合作,共同开发“馆臣娃娃”“四库墨宝”“皇帝家的新装”“晓岚护眼产品”等能够满足不同消费人群的文创产品。
三、结语
作为《四库全书》的存藏单位,图书馆不仅要守护好这份珍贵的文化遗产,更要让它们在传承中得到充分开发和利用。斯宾格勒认为,技术是文化的一种内在形式的外部表现,它存在于传播主体对环境的积极适应和和使之发生变化并创造新环境的过程中[17]。在当下数据智能和文旅融合的大背景下,以《四库全书》为代表的文化遗产保护工作要打破传统静态式“以存代保”的思想藩篱,积极探索新的保护开发模式。一方面,要通过《四库全书》纸本数字化、复制影印、改善存藏环境等措施进一步做好保护工作;另一方面,要重点推进《四库全书》的学术研究和文化传播工作。首先,整合资源,将各种载体的信息进行数字化加工、数据化整合,建立统一的《四库全书》信息咨询检索平台;其次,完善《四库全书》资源数据库建设,在数字人文等相关技术的引领下借助主题建模、文本挖掘、遥读分析等方法对《四库全书》开展立体式研究;再次,深入挖掘文献资源内涵,借助大数据分析、人工智能、AR/VR、多媒体、云存储等先进技术,增强文化的体验性和趣味性,以沉浸式体验、云端微展、文创产品开发、微视频展播、小程序开发等大众喜闻乐见的传播方式传承好四库文化,讲好四库故事;最后,将以《四库全书》为代表的特色文化资源融入城市旅游活动当中,不断提升城市的旅游文化服务能力。在数据智能的驱动下,悠久的历史和文化被轻轻唤醒,并突破空间和地域局限,以新的视觉表达、新的展示方式、新的文旅融合模式重现在世人面前。