科技典籍数字化及融合开发的实践探索
2022-05-30马爱梅陈奕骁
马爱梅 陈奕骁
摘 要:本文从古籍文献数字化和科技典籍融合出版的现状入手,分析出版业在典籍资源数字化、科技典籍融合出版业务中存在的薄弱环节,结合笔者在融合开发科技典籍方面的思考与实践,提出选题策划、数据收集整理、数据模块构建、核心资源展示、专业模型优化、数据标引逻辑和衍生产品探索等方面的工作方法和工作经验。
关键词:科技典籍 文献整理 古籍数字化 出版融合
文化是民族的血脉,是人民的精神家园。习近平总书记指出,坚定文化自信是事关国运兴衰、事关文化安全、事关民族精神独立性的大问题。文化兴则国运兴,文化强则民族强。极为丰富的古籍遗存,是我国悠久历史和灿烂文明的见证。近十来年,国家高度重视古籍的整理和历史文献的挖掘,连续多年的国家出版基金项目、国家古籍出版资助项目、国家古籍数字化工程专项经费支持了大量优秀、稀有、珍贵、系统的古籍和历史文献的整理,出版了一大批传承优秀中华文化的经典著作,很好地践行了举旗帜、聚民心、育新人、兴文化、展形象的使命任务。
为了更好地传承中华优秀科技文明成果,让大量收藏在禁宫里的历史科技文档、记录在古籍里的珍贵文字资料永久保存下来,助力现代科技发展,服务于国民经济建设,我们展开了12年的古籍纸质图书出版的探索,整理了5300余万字的历史文献、古代舆图和典籍。随着整理工作的不断深入,项目团队深切地感觉到,仅仅是传统的古籍整理方式和纸质版出版模式,很难真正让历史上留下的海量珍贵成果高效、高质量地得到广泛传承与应用,古文献的保护与其应用之间的矛盾也必将长期影响文化的传承和历史信息的延续,要在保护好历史遗产的基础上提高古文献资源的利用水平和效率,有必要探索对典籍资源进行全方位数字化开发和融合出版实践。为此,结合水利科技文献特色,项目团队策划建设了中央文化产业发展专项资金资助项目《中国经典水利史料数据库》,策划了“十三五”国家重点图书音像电子出版规划项目《中国古代河渠图》《中国经典水利古地图》,策划了国家出版基金资助项目《中国经典水利史料》(U阅通及CD-ROM)等系列数字化产品,开发了《全河图说》古地图长卷、梵夹装,《河防一览》套盒装,《黄河发源入海图》等文创产品。
历史典籍承载着中华民族的思想、智慧和数千年的科技文化知识,科技典籍文献整理出版工作对中华民族来说有着特殊意义。然而从多年来公布的资助项目名单不难看出,古籍类资助项目中,大多以文史类项目为主,科技古籍和科技典籍文献项目占比很小。这一现象,一方面说明科技典籍的申报项目内容不够丰富,另一方面说明科技典籍类项目的质量不够突出。我国历史上的典籍卷帙浩繁,其中与天文、地理、农业、水利、营造、纺织、医学、武术、冶金、生物等自然科学和科学技术有关的专著、论著、奏章、图谱等数不胜数。在对多家科技出版社专业编辑的调研了解后发现,科技典籍整理类选题在相关项目的评审中没能脱颖而出的主要原因有六个:一是对科技古籍的整理和科技文献的调研工作做得不够,没有可支撑优质项目的丰富内容;二是对古籍数字化的认识不到位,过度关注保护,传承弘扬的技术手段和相关政策不到位;三是缺乏科技典籍相关专业编辑,对于此类选题的策划不够专业;四是科技典籍的整理工作耗时长、耗资大,短期经济效益不佳,得不到出版社领导重视;五是对国家的相关财政支持政策研究得不够,申报材料质量不高;六是对融合出版的实践和探索经验不足,数字化进程不够深入,典籍内容得不到高效的整合和系统的优化。
本文将结合工作实践,探讨科技典籍数字化及融合出版的工作方法和经验,以期与同行交流。
一、选题目标的确定是项目策划的基础
俗话说,谋定而后动。我国现存的水利典籍仅专著就有几千种,舆图、奏章、碑刻、拓片更是汗牛充栋,在科技史上占有非常重要的地位。要想在海量的资源基础上有个清晰完备且实用开放的成果,合理的选题目标定位很关键。经过反复调研与论证,我们将选题目标确定为:将中国古代经典水利文献和典籍用数字化手段进行整合挖掘,通过构建特色模块、优化专业模型、深度标引数据等专业处理技术,梳理析出核心资源,在实现资源共享、信息增值的同时,建成专业可靠、内容详尽的知识信息平台。
二、特色模块的构建是资源数字化的业务目标
为更好地体现选题目标定位,结合组织编纂国家重点图书项目的经验,并征求水利史、文献学、古籍整理、数字出版等方面专家的建议后,我们分析了资源特色和可扩展空间,將项目的核心资源设计为“三横N纵”的数据库体系,“三横”为谕旨奏章、古图、文献;“N纵”主要为相关功能产品。此类产品将围绕数据库体系做不断的延伸、分类聚合和资源再析出。比如,生成“古地图”系列产品、历史洪灾数据库等。谕旨奏章子库由水利史专家在经典典籍中分流域、分时序选取后,再对朝代、重要人物、大事件等重要信息进行人工标引;古地图子库为海量古文献中提取出来的图片,由专家整理论证、专业细分解析后形成,委托专业机构对价值较高的图片进行数字化处理;文献子库为水利史专家们校点、整理、审核后录入并排版形成的电子化文本,在文献全文数字化的基础上生成新的资源体系,对基础资源分流域加索引。
三、核心资源的创造性转化是融合开发的关键
经过十余年的努力,5300多万字的纸质出版物全部出版。随着纸质出版物的出版,扫描的大量原始图片、重新排校的经典内容、专业拼接的各类舆图等内容形成了高品质的系列核心资源。大量珍贵文献、技术专著、官藏档案在整理的过程中一一问世,也为各特色模块的进一步展示和系统化资源拓宽奠定了基础。
基于文献资源的内容和状况,我们将项目核心资源拓展的基本方案确定为:以《中国水利史典》纸质出版物的文字资源作为融合出版项目建设的文献主体资源,在此基础上再扩充有价值的志书和特色水利文献;在文献资源的基础上以不同的专业标引体系深度标引奏章、谕旨和图片等资源;在选录《中国水利史典》中专业图片资源基础上,广泛搜集选录其他与水利相关的历史及科技文献、国内外馆藏文献及资源、地方志中的经典水利图片等。这样构建一个互融互通、各具特色的融合出版产品体系:一大套纸质出版物+一个经典水利史料数据库+《中国古代河渠图》《中国经典水利古地图》两个电子出版物+黄河、长江等流域的专题数据资源+中国经典水利史料微信版数据库+系列衍生产品和专项产品。
四、特色资源的进一步优化是创新性融合的核心
根据选题设定的目标、特色模块和核心资源拓展思路,项目团队反复调研论证,将数据库的专业模型定义为“横向开放、纵向标准化”的结构。为更好地体现专业内容特色和现代技术优势,确定了一系列专业模型的优化方案。
1.深入整理体现传承价值的专业数据
我国的水利文献内容包括灌溉、河工、水运、防洪、赈灾、抗旱等许多方面,体裁也丰富多彩,有会要、图谱、方志、年表、谕旨、奏疏、辞源等。许多文献来源于各朝官修及典藏,是当时文化及科学史料遗存的最高水准,文献价值很高。如《漕运全书》,全面记载了清代的漕运制度,是研究清代社会、政治、经济制度的珍贵史料;《中国河工辞源》是研究河工水利名词源流和了解水利历史的重要工具书。还有大量几近散失的珍贵水利文献,如《顺直河道治本计划》等。项目建设过程中要着重选录此类文献,为优秀科技文化传承做贡献。
2.充分集聚体现专业特色的大数据
在研究分析数据及资源状况时发现,围绕每个水利事件,都会有很多奏章和谕旨,大量奏章和谕旨是以时间为序列串联起来的一系列完整事件,有的甚至包含着长时段、长系列的工程建设、防洪减灾论证与实践等,具有很强的专业特色和大数据集聚功能。为此,我们延聘水利史专家将奏章和谕旨单独从大量文献中提取出来,对奏章和谕旨进行专业标注,标出时间、重大事件和重要人物等,从而将海量未经处理的数据建立了联系,铺就了一条各朝代除水害、兴水利的重大事件时间轴。
3.广泛收录文献价值较高的专业图片数据
现存文献中的水利历史图片别具一格,有很强的艺术性和专业性。由于收藏手段以及转载难度所限,许多古地图沉没在大量文献中,没有得到很好的整理。如明代治河名臣潘季驯的《河防图说》是现存篇幅最大的一幅古代治黄工程图,采用传统绘图法,将东西流向的黄河与南北流向的运河画在一个画卷中,使人一目了然地了解两河河防的全部情况,具有很高的历史价值。又如清《水经注图》的《渭水局部图》以《大清一统舆地图》(胡林翼)为底图,城邑地名与水系径流采用古墨今朱、古今对照的表现形式,表现手法独树一帜。为广泛收录古代文献中的图片资源,我们决定结合主题特色进行多维度专题分类,从水利专业视角、历史视角、地理视角、绘制技术视角、文物视角、美术视角进行深层解析,对图片的历史事件、历史背景、描绘特点、时代意义等进行深入论证。
五、通过专业数据的提炼与聚合提升融合开发的价值
在水利专业领域内,对水利类古代文献和史料进行全方位的收集整理尚属首次,数字化转换、资源库建设、系列多介质产品开发更属于开创性探索。为实现资源内容多维化、数据应用便捷化和专业成果优质化,在建设系列数字化资源时主要突出了深度标引和数据聚合。
1.深入研究资源属性,分类标引形成文献模块
经过专家对资源的深入研究分析,我们将已出版和收录到的经典水利史料按所涉及的流域、体裁、典籍名称、朝代、作者、人物等进行专业分类,分为长江、黄河、运河等十部分。据陈东明、马爱梅、张小思撰写的《中国古代水利地图数据库的构建与优化》介绍,主要体裁包括谕旨、奏章、公文、传记、年表等类型。经过分层专业标引,形成了专业文献模块,内容涉及历代政府水政水策、水利专家治水方略、地方治水经验、重大水利事件详情、水利地形、历代水情水貌和水利工程描绘等。为更好地发挥资源的检索利用价值,我们除对所收录文献的书名、人名和朝代进行了定向索引标注外,还对资源细分了流域、热词推荐、全文本搜索、大事标引等多层次的检索路径。
2.搜集特色资源,深度标引形成古地图资源库
中国古代地图的产生发展历史源远流长,几乎与人类文明的发展同步。作为一种图形和符号语言,古图所承载的历史信息更深刻、直观、丰富,是后人探寻古代历史原貌的重要线索。在梳理过程中,发现大量制作精美、保存完整的地图图片。据马爱梅、陈东明撰写的《国家重大出版工程项目的创新实践与全流程管控》介绍,这类图片包含大量专业信息和珍贵历史记录的航海图、天文图、城市图、河渠图、自然灾害图等专题地图,蕴含着深厚的政治经济及历史文化背景,有着鲜明的管水治水特色,研究价值很高。于是我们从多渠道搜集特色资源:聘请古地图专家,将已有历史文献资源中的图片进行专业梳理;针对长江、黄河、运河及海塘等流域进行筛选、整理;利用各类资源,从古地图收藏机构和个人处购买大量图片。筛选出传承价值、学术价值高的图片做深度标引。按所涉及流域,分为长江、黄河、运河等区位;按绘图技法,分为山水画法、投影经纬法、网格法等;按版本特点,分为坊刻本、官刻本、彩绘本、墨绘本等;此外,按背景、技术特色、经济社会特征等深入标注类别和内涵。
六、构建多维衍生產品,更广泛地传承弘扬优秀文化
为充分挖掘利用好资源,在进行纸质出版、资源数字化、融合多介质呈现的基础上,广泛探索尝试开发系列衍生产品服务于社会,让古人的智慧和祖先的珍贵遗产发挥更大作用。
在文献全文数字化的基础上生成的资源产品——中国经典水利史料数据库受到了图书馆、相关高校老师及国内外研究人员的欢迎,被中华书局签约放入中华古籍数据库。广泛搜集选录经典图片构建的图片数据库也受到了业内研究人员的喜爱。
从古文献中搜集古图片段,经过数字化加工和专业标引,将无法全貌展示的珍贵舆图进行完整拼接,将已经不适宜纸质保存的地图进行数字化修复后,我们编纂推出了卷轴装《河防图说》《黄河发源入海图》长卷以及梵夹装和纸电融合套装的《河防一览》。该产品中的图书项目入选国家古籍出版资助项目,融合套装被评为“2018海峡两岸书籍设计邀请赛十大最美图书”。
对收录的历史文献资源进行横向分析和深入钻取,将文献中散存的谕旨奏章提取出来构建而成的谕旨奏章库为下一步兴水治水提供了很好的数据基础和文献资源。
我们探索对中国的世界级灌溉遗产项目进行融合出版策划,对古代河工技术、行水金鉴、法律法规、河工技术等经典文献进行更深入的开发和创新性融合出版探索,设计的系列衍生选题方案已经获得了国家古籍出版资助和国家出版基金资助,制作的卷轴、文创等产品深受专业读者喜爱。
为促进文化和科技深度融合,全面提升文化科技创新能力,更好满足人民精神文化生活新期待,科技部、中央宣传部等6部委制定了《关于促进文化和科技深度融合的指导意见》,2022年中共中央办公厅、国务院办公厅先后印发的《关于推进新时代古籍工作的意见》和《关于推进实施文化数字化国家战略的意见》,更是表明了新时代古籍工作、文化数字化的国家意志,展现了科技典籍数字化工作的美好未来。相信,随着改革的深入,文化与科技必将迎来更深层次的融合与创新。
(作者单位系中国水利水电出版社)