推进新时代古籍工作,加快创新智能化发展
2022-05-27黄水清,王晓光,夏翠娟等
推进新时代古籍工作
计算人文应成为新时代古籍整理与研究的重要学科方法
黄水清*
(南京农业大学信息管理学院,南京210033)
收稿日期:2022-05-01
*通信作者:黄水清(1964-),博士,教授,博士生导师,南京农业大学信息管理学院,研究方向为自然语言处理与文本挖掘、信息计量。E-mail:sqhuang@njau.edu.cn
党的十八大以来,以习近平同志为核心的党中央站在实现中华民族伟大复兴的战略高度,高度重视中华优秀传统文化的传承与弘扬。习近平总书记在多个场合发表过重要讲话,中央出台了《关于实施中华优秀传统文化传承发展工程的意见》等一系列重要文件,古籍保护、古籍名录、典籍出版等被作为重点任务。近日,中共中央办公厅、国务院办公厅印发《关于推进新时代古籍工作的意见》(以下简称《意见》),为新时代的古籍工作确定了指导思想,明确了主要目标,规定了重点任务,强化了保障体系。
1 新时代古籍整理与研究须贯彻创造性转化与创新性发展的方针
2013 年12 月,习近平总书记在主持十八届中央政治局第12 次集体学习时提出创造性转化、创新性发展[1],即“两创”,在不久后的2014 年2 月政治局第13次集体学习时再次重申[2],之后又在不同的场合多次强调。2017 年10 月,习近平总书记在十九报告中提出“推动中华优秀传统文化创造性转化、创新性发展”,“坚持创造性转化、创新性发展,不断铸就中华文化新辉煌”[3]。“两创”方针随后也写入了十九大通过的新党章。此后,“两创”方针还出现在十九届六中全会决议等重要文件中。在建党百年庆祝大会上,习近平总书记首次提出“坚持把马克思主义基本原理同中国具体实际相结合、同中华优秀传统文化相结合”。2021年11 月,“两个结合”的论断也写进了党的十九届六中全会审议通过的《中共中央关于党的百年奋斗重大成就和历史经验的决议》[4]。
《意见》秉承十九大报告和十九届六中全会决议的精神,“把马克思主义基本原理同中国具体实际相结合、同中华优秀传统文化相结合,深入推进中华优秀传统文化创造性转化、创新性发展”即“两创”方针和“两个结合”论断作为新时代古籍工作的指导思想。在此前提下,《意见》要求“加强古籍抢救保护、整理研究和出版利用,促进古籍事业发展”[5],并从完善古籍工作体系、提升古籍工作质量、加快古籍资源转化利用、强化古籍工作保障等方面全面部署了古籍工作的目标与任务,为新时代古籍工作提供了新理念指引、新技术指导及新成效要求。
马克思主义基本原理同中华优秀传统文化相结合,是推动中华优秀传统文化创造性转化、创新性发展的必然要求,中华优秀传统文化的研究必须融入马克思主义的立场、观点和方法,中华优秀传统文化的精神内核也将丰富马克思主义的创新发展[6]。站在马克思主义中国化的高度,贯彻“两创”方针,落实《意见》精神,开展古籍整理与研究,需要把古籍中“具有当代价值、世界意义的文化精髓提炼出来、展示出来”[5]。新时代古籍整理与研究,应以对接现实、服务当代为目标,针对古籍的内在蕴义和表现形式,按照时代要求、现实标准、当代思维开展研究工作,推动创造性转化、创新性发展。对于图书情报学科而言,尤应注重通过提取内容、淬炼旨要、升级表达、激发活力从内在蕴义和表现形式两方面体现创造性的特质,通过内容的补充与拓展、旨要的完善和提升从内在蕴义方面体现创新性的特质,以达到“守正创新,古为今用、推陈出新,服务当代、面向未来”[5]的目的。
《意见》还针对古籍整理与研究提出了具体工作要求[5],譬如,“推进基础古籍深度整理出版”“加强古籍保护和整理出版成果的整合利用,建设中国古籍版本目录知识系统,着力构建古籍知识服务体系”“积极开展古籍文本结构化、知识体系化、利用智能化的研究和实践,加速推动古籍整理利用转型升级”。在以上诸方面,计算人文均大有可为。
2 古籍资源的创造性转化与创新性发展目前尚有不足
中华文明绵延不断,其中一个重要的原因就是浩如烟海的古籍资源承载的中华文化、民族精神穿越时空流传至今。历史上各朝代都重视文献的整理与保存,“盛世修典”也成为中华传统。进入新世纪以来,在国家有关部门的大力支持下,古籍整理与研究取得长足进步。《全国古籍普查登记目录》累计出版509 家收藏单位的普查目录共计127 万条款目,“全国古籍普查登记基本数据库”累计发布744.7 万册(件)古籍的普查数据。《国学基本典籍丛刊》《中华再造善本》《中国古籍珍本丛刊》等一大批古籍影印出版。古籍资源的数字化工作也广泛开展,2016 年正式开通运行的国家图书馆“中华古籍资源库”已经累计发布古籍特藏资源10 万部(件),实现资源在线浏览,极大地满足了社会公众对古籍资源的利用需求。针对古籍资源的文本挖掘和关联分析等研究成果也时有产生。
但面对新形势与新要求,对照《意见》和“两创”方针,当前的古籍整理与研究还存在着一定的不足与差距。以下试举3 个方面的例子。
2.1 古籍资源标注质量尚待提高,不利于古籍知识的创造性转化
目前,各机构建立了数量庞大的古籍文献数据库,统筹实施国家古籍数字化工程,基本能够满足用户日常对古籍全文的浏览和查找需求。但这些数字化资源当前一般仅提供字符串匹配的检索机制,很少标注到知识单元,难以满足用户对古籍资源知识单元的获取需求。用户需了解目标主题的全部检索词以及古籍数据库的收录范围才能进行全面检索。比如,古代人名字号相同的有很多,存在“异名同指”“同名异指”等情况,仅靠字符串匹配无法达到对人名字号既检准又检全的目的,给古籍精准利用带来障碍。要实现古籍知识创造性转化的要求,首先要解决古籍文本结构化和体系化标注的问题。
2.2 古籍资源呈现方式尚有不足,不利于普及传播的创造性转化
现有的古籍数字资源库注重古籍文献数量的扩充,注重以古籍物理单元为对象进行著录与保存,提高了古籍利用与传播的效率。但受古籍物理单元的局限,同一主题的古籍资源往往被分散在多个文献单元中。例如,中国古代农业某一主题的知识可能散见于正史、地方志、农书及笔记小说等多个文献单元,在当前的数字环境下,难以跨越文献的物理单元向用户传播与某一主题相关的全部中国古代农业知识。普及与传播是古籍资源创造性转化的重要环节,《意见》用了完整的一段(第13 条)布置古籍的普及与传播工作[5],对此提出了更高的要求。新时代古籍整理与研究,应当突破文献物理单元的限制,在提取和淬炼古籍资源的内容、旨要的基础上,全面提升古籍的呈现方式,使原始文献化身千百,实现古籍“多渠道、多媒介、立体化”[5]普及与传播。
2.3 古籍资源利用深度尚待提高,不利于古籍内容创新性发展
开展古籍利用研究,“系统整理蕴含中华优秀传统文化核心思想理念、中华传统美德、中华人文精神的古籍文献”[5],需要结合现实需要,深入挖掘古籍的时代价值。将古籍中的内容结合现实需求进行时空维度重组、社会关系再现以及事件演化分析,需要借助知识库平台和自动化的计算手段。目前,古籍数字化资源平台较为常见,但结合词语、规则、模型的知识库平台较为缺乏。古籍知识库的缺位,降低了古籍资源深度利用的可能性,学者们将无法更好地实现古籍文献的内容拓展与旨要提升,不利于创新性发展。
3 计算人文可有力促进古籍资源的创造性转化与创新性发展
计算人文[7]以人文科学为旨归,以数据资源为基础,以量化分析为手段,以计算技术为工具,意在发现、解决或阐释、验证人文学科的问题。计算人文可应用于古籍整理与研究领域,在构建结构化与细粒度表达的古籍知识库的基础上,实现古籍知识内容的重组,提升古籍内在蕴义和表现形式的创造性转化能力。在计算人文的框架下,古籍资源的创造性转化与创新性发展能够形成从科研到科普再到文化自信和文化输出的新面貌。计算人文在以下3 个方面可率先应用于新时代古籍整理与研究。
3.1 大力构建古籍知识库,提升古籍内容创造性转化的深度与层次
运用文本智能处理技术,自动抽取古籍中蕴含的知识点,并基于这些知识点结合知识组织、自然语言处理、文本挖掘等方法构建层面立体、阶段延续、内容多样的古籍知识库。古籍知识库全面、立体、充分地揭示古籍中的知识,是计算人文对古籍传播与研究的贡献,是具有时代特征的中华文化和学术资源宝库,是大众接近、阅读以及学者查询、研究古籍中的历史文化知识的金钥匙。通过古籍知识库这一新的知识组织方式,让古籍中的文字“活起来”,从而提升古籍内容创造性转化的深度与层次。
古籍文本语义复杂,古籍知识库构建难度较大,需要综合应用计算人文所涉及的图书馆学、情报学、文献学、目录学、计算机科学、语言学等学科的研究方法,形成适合古汉语文本特点的知识库构建解决方案。近年来,南京农业大学人文与社会计算研究中心面向古籍的自然语言处理技术及知识表示理论与方法开展了系统深入的研究,开发了SIKU-BERT 典籍智能处理平台,可一站式实现古籍的自动分词、断句标点、词性标注、实体识别、检索、翻译等功能,在先秦典籍知识库构建中取得了较好的效果,极大地提升了古籍知识库构建的效率。
3.2 着力开发古籍知识关联与分析平台,拓展古籍资源创造性转化的模式与媒介
基于古籍知识库,在计算人文的理论框架下,既可以对古籍资源中的文本特征进行统计分析,也可以对古籍文本的隐含知识进行多层面挖掘及多维度呈现,有助于实现古籍内在蕴义与表现形式的创造性转化。为了充分调动人文学者借助计算人文方法开展古籍资源创造性转化研究的积极性,应在广泛调研人文学者研究需求的基础上,依托古籍知识库开发古籍数字资源知识服务平台,提供统一的数据管理、数据分析、可视化展示和专题化服务,降低数据分析及其他系统应用的技术门槛,使学者们更加专注于古籍内在蕴义和表现形式的创造性转化研究。
利用古籍知识服务平台的多种呈现形式,发挥多学科辐射效应,让古籍内容“用起来”,拓展古籍整理与研究的模式与媒介。例如,基于《汉学引得丛刊》构建的前四史知识库及分析平台,将前四史中蕴含的人物、时间、地点、事件等进行标注与关系抽取,打破了不同史书之间的物理分隔,构建了知识关联与知识分析平台,通过多维知识建模与可视化分析等手段,实现了编年体、纪传体、纪事本末体、志书体等多种体裁史书的知识重组与形式再造。
3.3 全面提升古籍活化利用效能,推动古籍呈现形式的创造性转型升级
充分运用计算人文理论与方法,发挥古籍知识库及其知识服务平台在人文计算、语义出版、文化普及中的优势,在“移动化、社交化、智能化”的互联网浪潮下,拓宽中华优秀传统文化研究的时空跨度与研究尺度,推动中华优秀传统文化的创造性转化。例如,清华大学美术学院向帆与数据工程师合作,依据中国历代人物传记资料库(CBDB)把相关的人物按照家庭关系连接起来,以艺术手段向世界展示中国古代人物家族树的生长与衍化,形象地揭示了历史上大型家族的内部特征,演绎出中国古代兴衰更迭的宏观历史场景。中华书局等出版社等利用自然语言处理和机器学习等技术,建设面向传统文化与古籍行业的数字服务平台,加速了古籍数字转化和出版的流程。未来,可进一步基于古籍知识库,重构原有的古籍内容组织形式,多角度、立体化促进中华优秀传统文化核心思想、传统美德及人文精神的普及与传播,进一步深入阐释中华文化的历史渊源、发展脉络、基本走向。
中国古代文献卷帙浩繁、时间跨度长、类别体系复杂,古籍资源的创造性转化和创新性发展需要长期的投入与坚持,需要充分运用新技术提升古籍内在蕴义的萃取和表现形式的转化。将计算人文应用于古籍整理与研究中,可为新时代古籍工作赋予更丰富的资源基础、更便捷的技术支持与更直观的推广形式。《意见》将古籍工作融入国家发展大局,开创了古籍整理与研究的新局面。在《意见》的引领下,借助计算人文方法,必将促进古籍整理与研究工作在广度、深度、精度与效度方面持续发展,从而推动中华文脉的赓续、民族精神的弘扬、国家软实力的增强,为建设社会主义文化强国服务。
参考文献:
[1]习近平在中共中央政治局第十二次集体学习时强调建设社会主义文化强国着力提高国家文化软实力 [EB/OL].(2013-12-31)[2022-05-02].http://www.xinhuanet.com//politics/2013-12/31/c_118788013.htm.
During the 12th collective study of the Political Bureau of the CPC Central Committee,Xi Jinping emphasized building a socialist cultural power and striving to improve the country's cultural soft power[EB/OL].(2013-12-31)[2022-05-02].http://www.xinhuanet.com//politics/2013-12/31/c_118788013.htm.
[2]习近平在中共中央政治局第十三次集体学习时强调把培育和弘扬社会主义核心价值观作为凝魂聚气强基固本的基础工程[EB/OL].(2014-02-25)[2022-05-02].http://www.ce.cn/xwzx/gnsz/szyw/201402/25/t20140225_2371661.shtml.
During the 13th collective study of the Political Bureau of the CPC Central Committee,Xi Jinping emphasized that cultivating and carrying forward the socialist core values should be regarded as a basic project to condense the soul and strengthen the foundation[EB/OL].(2014-02-25)[2022-05-02].http://www.ce.cn/xwzx/gnsz/szyw/201402/25/t20140225_2371661.shtml.
[3]习近平.决胜全面建成小康社会夺取新时代中国特色社会主义伟大胜利[M].北京:人民出版社,2017.
XI J P.Win a decisive victory in building a moderately prosperous society in all respects and win the great victory of socialism with Chinese characteristics in the new era[M].Beijing:People's Publishing House,2017.
[4]中共中央.中共中央关于党的百年奋斗重大成就和历史经验的决议[N].人民日报,2021-11-17(1).
The CPC Central Committee.Resolution of the CPC Central Committee on the major achievements and historical experience of the party's hundred year struggle[N].People's daily,2021-11-17(1).
[5]中共中央办公厅,国务院办公厅.关于推进新时代古籍工作的意见[N].新华社,2022-04-12(1).
The general offices of the Communist Party of China Central Committee,The State Council.Opinions on promoting the work of ancient books in the new era[N].Xinhua News Agency,2022-04-12(1).
[6]储峰.推进马克思主义基本原理同中华优秀传统文化相结合[N].解放军报,2021-08-20(7).
CHU F.Promote the combination of the basic principles of Marxism with the excellent traditional Chinese culture[N].PLA Daily,2021-08-20(7).
[7]黄水清,刘浏,王东波.计算人文的发展及展望[J].科技情报研究,2021,3(4):1-12.
HUANG S Q,LIU L,WANG D B.The development and outlook of computing humanities[J].Scientific information research,2021,3(4):1-12.
数智赋能时代的古籍工作展望
王晓光*
(武汉大学信息管理学院,武汉430064)
收稿日期:2022-04-27
*通信作者:王晓光(1978-),教授,博士生导师,武汉大学信息管理学院,研究方向为数字人文、知识组织、语义出版等。Email:wxguang@whu.edu.cn
古籍是中国传统文化最重要的物质性载体之一,承载着丰富的历史文化内涵,是实现中华民族伟大复兴的重要精神源泉。近日,中共中央办公厅、国务院办公厅联合印发了《关于推进新时代古籍工作的意见》(下称《意见》),对于古籍相关工作来说无疑是巨大鼓舞。这是自1981 年9 月中共中央发布《关于整理我国古籍的指示》,时隔41 年后的又一指导性文件,对新时代古籍工作做了全面部署,必将推动我国的古籍研究与实践工作进一步繁荣发展。
1 古籍整理与保护研究将进入加速期
20 世纪70 年代以来,古籍整理保护工作开始从光学影印阶段进入数字化转换阶段。数字技术和手段给古籍资源的典藏和共享利用提供了绝佳的媒介基础。过去几十年间,我国已经积累了海量的古籍数字资源,但从资源类型和服务质量来看,仍不尽如人意。大量含偏差的数据引起了语义整体性的忽视和破坏,数据的价值密度衰减,研究者对分析工具的认识不足,整理校勘、电子转录和数据分析任务仍然艰巨[1]。
近年来,随着图像OCR 识别、自然语言处理和机器学习技术的进步及其在古籍工作中的成功应用,古籍工作开始从数字化向智能化阶段迈进。针对这种新兴趋势,《意见》专门提出“建立健全国家古籍数字化工作指导协调机制,统筹实施国家古籍数字化工程……加强古籍数字化资源管理和开放共享。统筹古籍数字化版本资源建设与服务,推进古籍专业数据库开发与利用。积极开展古籍文本结构化、知识体系化、利用智能化的研究和实践,加速推动古籍整理利用转型升级”。这种规划不仅意味着古籍数字化工作开始从研究探索阶段向系统工程阶段迈进,整理的方法手段也将借助智能化技术和工具进入加速期。
目前,OCR、自然语言处理、数字出版、语义表示、关联数据、知识图谱等技术在古籍版面自动识别、文字转录、自动句读、文言文翻译、版本比对、结构化表示、关联分析、可视化阅读等古籍整理的各个阶段环节都并取得成功应用经验,相关系统平台已经进入实用阶段[2]。各种众包平台已经显著降低古籍整理的门槛,相信随着新型技术工具的研发与开放服务机制出台,古籍整理效率和共享服务质量将进一步加速和提升。
2 基于古籍数据资源的数字人文研究迎来机遇期
古籍与数字技术融合交汇,不仅改变了古籍表现形态,形成了古籍数据资源,在此基础上开展的古籍内容挖掘与再造研究,也将孕育新兴的数字人文研究范式和古籍知识服务体系。《意见》提出“建设中国古籍版本目录知识系统,着力构建古籍知识服务体系”,这不仅有助于推进日常图书馆部门的古籍典藏与保护工作,也有助于通过数智时代古籍工作的实践创新和理论方法创新,实现《意见》提出的“完善我国古籍整理研究和出版范式,构建古籍整理出版理论研究体系”的目标。在“推进古籍学科专业建设”一章,《意见》还指出,要“加强学科交叉融合,推动古籍学科与材料技术、信息技术、人工智能等领域学科融合发展”,这正与当下新文科建设与数字人文研究范式相呼应。
近些年来,借助新文科建设东风,基于古籍数字资源的数字人文研究探索日益兴起,并将典籍与古代文本研究带入了更广阔的研究场域。借助大规模文本挖掘、可视化分析、社会网络分析、语言指纹分析、GIS 时空分析等技术,古代文学研究、历史研究、考古研究的面貌正在悄然发生改变[3]。
2020 年以来,《中国社会科学》、人民日报、光明日报、中国社会科学报等知名媒体,连续发表《大数据技术与传统文献学的现代转型》《人文研究数字化:一场方兴未艾的变革》《数字人文打开文化新视野》《数字人文视域下的新文科建设》等文章,昭示着数字人文研究已在我国蔚然成风。面对数字人文跨学科研究需求,北京大学、清华大学、复旦大学、武汉大学、浙江大学、南京大学、中国人民大学等高校,纷纷加码文科实验室和交叉科学研究院建设。2021 年,教育部批准了首批哲学社会科学实验室,入选其中的武汉大学文化遗产智能计算实验室发挥多学科汇聚优势,确立了五大研究方向,其中之一就是古籍智能化整理、挖掘与再造研究。实验室与校内相关机构合作研发了多款数字人文工具平台,如“中国简帛文献综合数字平台”“长江文明数字人文平台”“碑刻信息智能增强提取系统”“家谱智能编撰系统”等。这些探索性数字人文研究项目正在积极拓展数智时代人文研究的场域,改变人文知识的生产和表示方式。相信在《意见》的指导引领下,随着古籍数字资源出版利用的加速,相关的数字人文研究将迎来腾飞机遇期。
3 古籍活化利用将推动文化产业进入高质量发展期
只有让古籍走出象牙塔、走向普通大众、融入百姓生活,才是中华优秀传统文化真正的传承和弘扬,才算真正实现了习近平总书记提出的“让书写在古籍里的文字活起来”的目标。对此,《意见》指出要“挖掘古籍时代价值、加强古籍保护和整理出版成果的整合利用”。事实上,近年来,《典籍里的中国》《穿越时空的古籍》等以古籍为主题的文化类电视节目成功破圈,成为了现象级传播产品。这些节目的成功,不仅说明了当下大众对精品文化电视节目渴求强烈,也说明传统文化是我国文化产业高质量发展的素材源泉。古籍中记载的众多历史文化故事、知名建筑、农耕民俗、地方人物、传统饮食等都具有重要的时代价值。
推动古籍在数智环境下的创造性转化和创新性发展,进而支撑文化产业高质量发展和文化强国战略已经成为高层共识。对此,《意见》提出要“将古籍工作融入国家发展大局,注重国家重大战略实施中的古籍保护传承和转化利用……对接国家文化大数据体系”。国家文化大数据体系建设是新时代文化建设的重大基础性工程,是激活传统文化资源作为数据生产要素在文化领域落地的有效途径[4]。为了与国家文化大数据体系对接,实现古籍资源在行业间和产业上下游之间顺畅流通,我们还需要将难于流动的纸质古籍转化为十分容易流动和再利用的智慧数据[5],从而为我国的文化产业供给端提供优质文化素材,创新文化产品形式,丰富高质量文化产品供给。
应当看到,囿于时空距离,普通百姓还难于理解古籍内容,仅仅实现古籍从物理形态到数字形态的转变,对于古籍知识发现、内涵挖掘和文化传承而言仍是不够的。为了便于大众理解,我们应该利用融合媒体,阐释古籍内涵、完善传承链条、创新呈现方式。但如何将古籍蕴含的历史文化知识高效率地转化为智慧数据,并借助数字游戏、手机出版、VR 虚拟现实、元宇宙等青少年喜闻乐见的形式进行传播是新机遇,同时也是新挑战。可以预见的方式包括:借助短视频开展古籍主题导读、以当代叙事结构进行古代小说改写、借助VR/AR 媒介技术进行遗址虚拟复原展示等,这些都是借助文化遗产智能计算实现古籍内容活化利用和文化记忆数智化再造的新途径和新方法[6],也是古籍工作助力于中华优秀文化对外宣传,讲好中国故事,增强国家文化软实力的重要任务。
总的来说,《关于推进新时代古籍工作的意见》的发布,给古籍典藏保护与整理研究、数字人文创新发展和文化产业提质升级3 个方面都带来了重大利好。在《意见》指引下,在文化遗产智能计算技术支撑下,古籍研究与实践工作必将走向更加繁荣的未来。
参考文献:
[1]刘石,李飞跃.大数据技术与传统文献学的现代转型[J].中国社会科学,2021(2):63-81,205-206.
LIU S,LI F Y.Modern transformation of big data technology and traditional philology[J].Social sciences in China,2021(2):63-81.
[2]苏祺,胡韧奋,诸雨辰,等.古籍数字化关键技术评述[J].数字人文研究,2021(3):83-88.
SU Q,HU R F,ZHU Y C,et al.Key technologies for digitization of ancient Chinese books[J].Digital humanities research,2021(3):83-88.
[3]赵薇.数字时代人文学研究的变革与超越——数字人文在中国[J].探索与争鸣,2021(6):191-206,232-233.
ZHAO W.Transformation and transcendence of humanistic research in the digital age -Digital humanities in China[J].Exploration and free views,2021(6):191-206,232-233.
[4]高书生.国家文化大数据建设:加速文化界“新基建”促进文化产业转型升级[J].清华金融评论,2020(10):29-30.
GAO S S.National cultural big data construction:accelerate the"new infrastructure" of cultural circles and promote the transformation and upgrading of cultural industry[J].Tsinghua financial review,2020(10):29-30.
[5]曾蕾,王晓光,范炜.图档博领域的智慧数据及其在数字人文研究中的角色[J].中国图书馆学报,2018,44(1):17-34.
ZENG L,WANG X G,FAN W.Smart data from libraries,archives and museums and its role in the digital humanity researches[J].Journal of library science in China,2018,44(1):17-34.
[6]王晓光,梁梦丽,侯西龙,等.文化遗产智能计算的肇始与趋势——欧洲时光机案例分析[J].中国图书馆学报,2022,48(1):62-76.
WANG X G,LIANG M L,HOU X L,et al.Intelligent computing of cultural heritage:A case study of European time machine project[J].Journal of library science in China,2022,48(1):62-76.
“数字藏品”与古籍的共享、传播和利用
夏翠娟*
(上海图书馆,上海 200031)
收稿日期:2022-05-01
*通信作者:夏翠娟(1979-),研究员,上海图书馆,研究方向为元数据、知识本体、关联数据、数字人文与文化记忆。Email:cjxia@libnet.sh.cn
1 背景
2022 年4 月,中共中央办公厅国务院办公厅印发《关于推进新时代古籍工作的意见》,对“加快古籍资源转化利用”提出了4 点意见:挖掘古籍时代价值、促进古籍有效利用、推进古籍数字化、做好古籍普及与传播。在推促古籍的数字化、有效利用及大众化传播时,尤其强调“加强古籍数据流通和协同管理,实现古籍数字化资源汇聚共享”,“鼓励古籍存藏机构向社会公众提供古籍资源服务,提高古籍资源开放共享水平”,“多渠道、多媒介、立体化做好古籍大众化传播”。古籍的跨机构共享、利用和传播一直是古籍工作的重点和难点,古籍工作者长期以来通过建立制度层面上的规范保障、探索借助技术的发展来降低共享的成本和门槛的方法,但在如何取得保藏和利用之间的平衡方面,仍然达不到理想的效果。“元宇宙”将包括区块链技术(Blockchain)在内的各项新技术和NFT(Non-Fungible Toke,非同质化代币)等新业务模式从其专门的应用领域带入了更广阔的应用空间,而“虚拟数字人”“数字藏品”等新型数字媒介的产业链初步成型,在文化领域的应用初露峥嵘,也为古籍的共享、利用和传播提供了新的契机。
“数字藏品”脱胎于NFT,NFT 是区块链上的一种数字资产,自带金融属性,可以用虚拟货币交易。在我国法律下,为了规避NFT 的金融风险和炒作泡沫,同时又鼓励区块链技术在文化传播领域的应用,推进数字版权问题的解决,通过限制流通,将NFT 的虚拟金融属性剥离,即为“数字藏品”。从技术层面来看,“数字藏品”指的是使用区块链技术、在联盟链上为特定作品生成唯一数字凭证、确认权益归属的数字作品、艺术品和商品。通过在联盟链中标记作品的所有者,并对后续的流转进行追溯,利用智能合约协议标准,在保护数字版权的基础上,实现真实可信的数字化发行、购买、收藏和使用。
博物馆率先进入了“数字藏品”应用的赛道,据不完全估算,迄今为止,国内有超过30 家博物馆发行了馆藏的“数字藏品”,中国国家博物馆、河南博物馆、湖南省博物馆、湖北省博物馆等多家知名博物馆均参与其中。而在今年支付宝的集五福活动中,24 家博物馆(院)首次使用数字技术共迎五福,借助鲸探发布源自“虎文物”“十二生肖文物”及“镇馆之宝”的3D“数字藏品”,诸如“越王勾践剑”“长信宫灯”“铜奔马”“圆明园虎首”等历史价值极高的馆藏文物均以“数字藏品”亮相。在图书馆界,包括中国国家图书馆、上海图书馆、北京大学图书馆在内的各大图书馆拥有大量的珍贵古籍资源,不仅具有文献属性,还有宝贵的文物价值,以及深厚的文化底蕴,如能借助“数字藏品”背后的技术和模式,将有助于为解决古籍的共享、传播和利用过程中长期存在的问题和困境提供新的思路。
学界已有学者开始思考图书馆、档案馆和博物馆(LAM)对元宇宙视野中的区块链技术和NFT 模式的采纳和负责任创新,分析将NFT 引入LAM 可能带来的利弊,在“负责任创新”的理论框架下,将“引入和应用NFT”视为一种创新活动,从技术、经济、伦理和社会等不同方面来考察这项创新活动可能引发的正面和负面效应[1]。中国国家图书馆已经开始尝试利用区块链技术助力数字资产管理,于2021 年联合全国7家公共图书馆统统推出了中国战“疫”记忆库版权与内容管理平台,实现了专题资源库的权利人管理、资源版权信息管理、版本数据查询统计等,并进一步提出基于联盟链的智慧图书馆数字资源资产化管理的全流程构想,设计数字资源资产化管理框架[2]。
2 古籍数字资源的资产化管理
当前的珍贵古籍数字资源大多由各大公藏机构(主要是图书馆,也包括博物馆和档案馆)保管维护、整理研究、并提供服务,虽然古籍本身大多已过了版权保护期,但作为可以提供数字服务的珍贵馆藏,不仅积累了大量馆员的研究整理成果,还蕴藏流淌着历代学人的文脉,具有无形的历史文化价值。在现有的版权机制和市场环境下,由于数字资源的易复制和易篡改性,这种无形的价值无法确权、无法认定、无法作为独立的数字资产存在,从而影响了古籍数字资源在更大范围内的共享和利用。“数字藏品”的模式为古籍数字资源的资产化管理提供了启示和参考。
“数字藏品”背后的区块链技术和智能合约协议机制,通过独有的版权追踪与所有权归属证明,可为古籍数字内容的构建、确权、共享和流通的全流程提供可信的解决方案,有望为古籍文献数字资源的资产化管理提供保障,从而降低保藏机构的信任成本;利用智能合约,可提高低质量复制和滥用的门槛,以更好地促进古籍数字资源的开放和共享。
所谓古籍数字资源的资产化管理,需要解决以下3个方面的问题。一是资源的权益归属标记,将古籍数字资源的唯一标识符上传至联盟链,映射独一无二的实体资源对象和可能存在的多种格式的数字资源对象,并以必要的元数据记录作为附加信息,元数据包含权益所有者的基本信息,如链上唯一标识符、名称、位置等,还应包含时间戳及哈希值、基于分布式数据存储、点对点传输、共识机制、非对称加密的数字签名、密钥等数字凭证信息,以保障资源的唯一性和防止流转过程中的非法篡改;二是流转过程数据存证,资源上链后,联盟链中的所有用户作为节点均可查询数字资源的所有权及相关元数据信息,获得数字资源对象的访问链接,对其进行阅览、标注、引用、摘录、收藏、分享、二次创作等操作,在联盟链中应可记录数字资源自上链后在流转过程中关键节点的时间戳、操作数据,流转路径,合法或非法的访问请求等;三是资源的流转利用规范,利用智能合约,规范古籍数字资源的查询阅览、拷贝复制、传输和再加工,将合理利用的规则写入智能合约的代码之中,流转操作一旦发生,即可自动与智能合约规则比对,条件满足则自动执行,无需第三方介入,能有效提高流转的效率;而一旦发生超出智能合约约定范围的操作请求,即自动地按照规则采取相应的阻断或校正措施。
3 作为“数字藏品”的古籍文创产品开发
基于珍贵馆藏资源开发富有创意和审美价值的文创产品,是GLAM 机构进行资源推广、服务创新、弘扬文化的一种常规选择。大英图书馆制作各种知名度较高的作家或作品相关的专题系列文创产品,配合展览推出;苏格兰国家图书馆以古籍中的插画为灵感开发文创产品;美国国会图书馆以历任总统档案为灵感设计印有经典精选口号的马克杯;加拿大图书馆除了以古籍中的插画和文本作为灵感外还利用书籍形象本身作为素材等[3]。中国国家图书馆以馆藏明代皇家《食物本草》图谱为灵感开发的手账本,作为母亲节礼品推广。上海图书馆近年来以珍贵古籍、手稿档案等馆藏资源中发掘具有文化和审美价值的元素,如古籍的精美装帧图案、名人藏印等,开发了一系列的文创产品。这些实物型的文创产品在古籍资源的大众化方面均起到了良好的馆藏资源宣传推广和文化教育传播的作用。近年来,随着文化领域数字化转型的推进,基于古籍数字资源开发数字文创产品成为国家战略。2021 年,文旅部等八部门印发《关于进一步推动文化文物单位文化创意产品开发的若干措施》,明确依托美术馆、博物馆、图书馆等文化文物单位馆藏文化资源,推动各类文化创意产品开发,确定文化文物单位文化创意产品开发试点单位名单(共154 家)[4]。在学界、图书馆界和博物馆界均对数字文创产品的开发策略、存在的问题和实现技术进行了研究,尤其强调版权问题的困境[5,6]。
相比于在区块链上发行的“数字藏品”,实物型的文创产品和数字文创的受众面较为有限、传播速度更是难以企及。目前某购物网站上的中国国家博物馆最受欢迎的文创产品的交易量为1 万+,故宫博物院的数字文创产品《胤禛美人图》移动app 上线两周的下载量是20 万+,而博物馆界与数藏平台合作开发的“数字藏品”一上线即被秒杀,河南博物馆的“考古盲盒”数字藏品销量轻易突破3 000 万。在表现形式方面,相比于传统的数字文创,“数字藏品”所依托的技术和手段不仅包含图影音等丰富的多媒体交互形式、VR/AR 支撑的沉浸式体验和游戏式的演绎方式。更重要的是,“数字藏品”提供了行之有效的数字版权解决方案,在其创作发行过程中,创作者可根据藏品的基本信息生成元数据和数字凭证ID,随后以私钥生成数字签名进行交易,以公钥进行发行授权,进而实现非对称加密机制。然后在链上形成共识、打包上链,“数字藏品”铸造完成。在交易流转过程中,原数字藏品拥有者将通过私钥进行所有权转移,在链上广播,完成区块打包,实现所有权更替。
在我国法律框架下,“数字藏品”也被视为元宇宙愿景中的一种面向数字版权领域的应用,对数字版权的构建、交易、追溯过程提供了可信的解决方案,其元数据中所记录的原始凭证、版本号、上链时间、权益所有者、流转过程等信息将永久保存在区块链上,降低了侵权行为的可能性。在艺术行业,通过保护数字艺术品的版权,“数字藏品”的传播方式不受时空限制,拓宽了交易渠道,不限于拍卖行,为传统的以拍卖行为中心的艺术品市场注入了新的活力。“数字藏品”显示出其有着广阔的应用前景,因而吸引了众多互联网头部企业入局,依托企业已有的区块链基础设施,蚂蚁集团的鲸探、腾讯的幻核、京东的灵稀等,已形成了较为成熟的“数字藏品”交易平台,另外百度、迅雷、芒果TV、视觉中国、网易等也紧随其后,从IP 包装、上链铸造、到发行售卖的全流程,已初步形成了覆盖整个生态的产业链,为作为“数字藏品”的古籍文创产品的制作发行做好了准备。由于基于古籍的二次创作仍然需要在整个“数字藏品”的生命周期中保护创作者的版权,“数字藏品”在数字艺术品领域的应用为基于古籍开发面向元宇宙的文创产品提供了参考范例。
4 古籍数字内容的链上循证
“数字藏品”上链铸造过程中,只需将其元数据上链,如有相应的实体资源对象,则建立“数字藏品”与实体资源对象的链接。但对于古籍来说,情况更为复杂,一方面存在与元数据相对应的实体资源对象和数字资源对象;另一方面,同一种古籍(在BIBFRAME 三层框架中对应于“作品Work”层)可能存在着不只一个版本(在BIBFRAME 三层框架中对应于“实例Instance”层),一种古籍的某一种版本也可能存在多个复本(在BIBFRAME 三层框架中对应于“单件Item”层)[7],而机构所藏的实体资源对象即对应着某种古籍的某一个版本的某一个复本,即“单件Item”层。
在解决了古籍数字资源的资产化管理问题后,为联盟链上的用户之间的资源共享解决了资源确权和流转利用规范的问题,接下来要面临的就是古籍数字资源的有效利用问题。古籍的应用场景除了助力传统文化的传播和弘扬,还有支持版本学、历史人文学科的研究。若要支持基于古籍数字资源的研究,仅仅将复本层面的元数据上链并在元数据和对应的实物资源对象、扫描图像资源对象、全文文本等不同媒体格式的数字资源对象之间建立映射,还是不够的。一方面要能保证数字资源对象的真实可靠性,区块链中的每个节点都参与数据的验证和维护,实现了去中心化的真实性维护机制,这已经在档案领域得到应用,例如英国国家档案馆在接收电子档案时,将其哈希值登记进区块链中,确保电子档案的真实性[8];另一方面还要能保证数字资源对象的可访问性和可获得性,这有赖于联盟链上的保藏机构在链上建立可扩展的去中心化的共识机制(如SFBT)。最后还要能跨越不同的联盟链保藏机构,在作品、实例、单件之间建立关联关系,将一种古籍的不同版本,同一版本的不同单件之间的关系在链上建立唯一标识、永久保存,支持防篡改、可追溯,才能更好地支持基于古籍资源的循证研究。
如果说存世古籍的实体资源对象、图像或文本型的数字资源对象,以及作品、实例、单件之间的关系是既有的客观世界的知识,那么由于大量古籍已经在历史的长程中散佚不可复见,历代官修、史志、藏书楼、私家古籍目录中前人留下的关于古籍的经眼鉴赏信息等主观知识则是另一种支持古籍循证研究的重要资源,作为存世古籍的有益补充,可为古籍循证研究提供更为全面的支撑,这部分资源如何上链与存世古籍建立数据映射,也是需要考虑的问题。同时,由于古籍再造工程的推进,一些珍贵古籍还会不断影印、再版,标点精校,一些新的版本鉴定、整理研究成果还会不断产生,这些新的知识资源也需预留上链入口,与既有知识整合,便于学者在研究的过程中形成证据链,以可持续性发展的方式支持面向循证实践的研究。
5 问题与展望
“数字藏品”作为NFT 在文化传播领域的应用,为构建元宇宙愿景提供了数字资产铸造和可信交易的模式,近期已经在影视、动漫、设计、游戏、艺术、文博等行业崭露头角,初步显示出其潜力。古籍作为人类文明传承和文化传播的载体和媒介,经过了时间的洗礼和历史的积淀,理应在即将到来的元宇宙中发挥更大的价值,为元宇宙世界提供具有深厚文化价值的内容,同时降低认知和使用门槛、以与时俱进、喜闻乐见的方式被更多人利用。“数字藏品”背后的区块链技术和业务模式为古籍数字资源的资产化管理提供技术标准、业务流程的基础设施,有望为解决古籍数字资源在联盟链上的共享共用提供了解决方案的参考;已经初步成型的“数字藏品”产业链为基于古籍的数字文创产品的开发、发行和流转提供了生态环境;区块链技术为实现多种类、全媒体、多来源、长时段的古籍数据链上循证提供了可能。
然而,对于图书馆、档案馆、博物馆等古籍保藏机构来说,采用区块链技术的门槛还有一定高度,成本也需降低到一定的程度,人才培养、经费投入还需跟上,更重要的是,一些行业应用标准的制订还有待业界深度参与,例如中国国家图书馆提出的智慧图书馆数字资产管理标准体系还需要在行业范围内进一步深化、细化、形成共识。类似古籍链上循证这样的深度应用场景有待进一步发掘,一些有条件的机构,可率先在实践层面加强探索,为整个行业探路,在这方面,中国国家图书馆已经开始了行动,中国战“疫”记忆库的实践已经看到了一定的可能性。在业界,“数字藏品”的应用难点不在于技术,而首先在于法律规范和制度监管。目前“数字藏品”的二次交易市场并未开放,限制了流动性,出现了瓶颈,将来如何开放二次交易的同时防止炒作、非法集资、传销等法律风险,还需要更进一步规范细化法律条文。近日,中国互联网金融协会、中国银行业协会、中国证券业协会联合呼吁会员单位共同发起一份名为《关于防范NFT 相关金融风险倡议》[9],提出坚决遏制NFT 金融化证券化倾向,从严防范非法金融活动风险,但并未涉及是否开放二次交易市场。其次,“数字藏品”对于创作者版权的永久确权机制,激发了创作者参与创作的热情,但目前“数字藏品”需依赖于数藏平台铸造、发行和交易,而数藏平台与IP 创作者的利益分配权还主要掌握在平台手中,定价机制不够明晰,也为市场监管带来了一定的问题,实际上,平台自身也未进入可持续的盈利阶段,是否能实现预期收益还有待观望。在市场还未发育成熟的情况下,作为“数字藏品”开发的文古籍创产品仍要以宣传推广和文化传播为主要诉求,也可借此机会激发第三方和个人用户参与创作的热情。
参考文献:
[1]陈苗,肖鹏.元宇宙时代图书馆、档案馆与博物馆(LAM)的技术采纳及其负责任创新:以NFT 为中心的思考[J].图书馆建设,2022(1):121-126.
CHEN M,XIAO P.Technology adoption and responsible innovation of libraries,archives and museums (LAM) in the meta-universe era:Centered on NFT[J].Library development,2022(1):121-126.
[2]魏大威,李志尧,刘晶晶,等.基于区块链技术的智慧图书馆数字资源管理研究[J].中国图书馆学报,2022,48(2):4-12.
WEI D W,LI Z Y,LIU J J,et al.Digital Resource management of smart library based on blockchain technology[J].Journal of library science in China,2022,48(2):4-12.
[3]张彦希.国外图书馆古籍文创推广经验及启示[J].文化创新比较研究,2021,5(27):145-148.
ZHANG Y X.Experience and enlightenment of cultural creation and promotion of ancient books in foreign libraries[J].Comparative study of cultural innovation,2021,5(27):145-148.
[4]关于印发《关于进一步推动文化文物单位文化创意产品开发的若干措施》的通知[EB/OL].[2021-08-17].http://www.gov.cn/zhengce/zhengceku/2021-08/31/content_5634552.htm.
Notice on printing and distributing several measures on further promoting the development of cultural and creative products of cultural and cultural relics units[EB/OL].[2021-08-17].http://www.gov.cn/zhengce/zhengceku/2021-08/31/content_5634552.htm.
[5]张婷.图书馆数字文创开发:现状、问题与对策[J].图书馆学研究,2020(7):27-33.
ZHANG T.Library digital cultural creation and development:Current situation,problems and countermeasures[J].Research on library science,2020(7):27-33.
[6]刘月蕊,贾诗敏.“互联网+”背景下博物馆数字文创多元创新研究[J].中国文艺家,2019(11):269-270.
LIU Y R,JIA S M.Digital innovation museum under the background of Internet Plus[J].Writers and artists of China,2019(11):269-270.
[7]夏翠娟,林海青,刘炜.面向循证实践的中文古籍数据模型研究与设计[J].中国图书馆学报,2017,43(6):16-34.
XIA C J,LIN H Q,LIU W.Designing a data model of Chinese ancient books for evidence-based practice[J].Journal of library science in China,2017,43(6):16-34.
[8]刘越男.区块链技术在文件档案管理中的应用初探[J].浙江档案,2018(5):7-11.
LIU Y N.Exploratory research on the application of blockchain technology in the field of records and archives management[J].Zhejiang archives,2018(5):7-11.
[9]北京日报.三协会共同倡议:防范NFT 相关金融风险[EB/OL].[2022-04-13].https://baijiahao.baidu.com/s?id=1729998646077805 265&wfr=spider&for=pc.
Beijing Daily.Three associations jointly proposed to prevent NFT related financial risks[EB/OL].[2022-04-13].https://baijiahao.baidu.com/s?id=1729998646077805265&wfr=spider&for=pc.
古籍资源的转化利用是新时代古籍工作新任务
欧阳剑1,2,3*
(1.上海外国语大学图书馆,上海 200083;2.上海外国语大学数字学术中心,上海 200083;3.中国国际舆情研究中心,上海200083)
收稿日期:2022-05-01
*通信作者:欧阳剑,研究员,上海外国语大学图书馆,研究方向为信息资源管理、数字人文、国际传播。Email:oyjjj@163.com
改革开放以来,党中央站在实现中华民族伟大复兴的战略高度,对传承和弘扬中华优秀传统文化作出一系列重大决策部署,促进了古籍事业的发展。从1981 年《关于整理我国古籍的指示》[1]到今天,40 多年来古籍工作在各方面取得的巨大成就,我国的古籍工作在古籍整理出版方面也成绩斐然,对古籍起到了很好的保护作用。如今,《关于推进新时代古籍工作的意见》(以下简称《意见》)针对新时代我国社会发展的新环境、古籍工作的新情况和新要求,描绘了新时代古籍工作的发展蓝图,为新时代古籍工作阐明了意义、指明了方向,古籍工作也融入了新的时代元素,对新时代古籍工作提出了许多针对性的意见,将对我国的古籍工作起到积极的作用。
1 新时代古籍资源转化利用新任务
《意见》反映出新时代古籍工作的新元素,在加强古籍保护工作的基础上提出了加快古籍资源转化利用的要求,《意见》明确提出了新时代要以社会主义核心价值观为引领,以“保护”“传承”与“传播”为核心,在整理古籍的同时深入挖掘和传播古籍的新时代价值,把中华优秀传统文化的精神标识和具有当代价值、世界意义的文化精髓提炼出来、展示出来,深入推进中华优秀传统文化创造性转化、创新性发展,中华优秀传统文化的重要地位以及古籍工作的重要意义,被推到了一个前所未有的高度。除了“盛世修典”,对各类典籍进行整理、出版外,新时代要提高思想认识,充分认识到新时代的古籍出版工作从单纯的文献整理或研究,上升到了文化自信和民族复兴的时代课题,做好古籍资源转化利用及大众化传播,对弘扬民族精神、增强国家文化软实力、建设社会主义文化强国具有重要意义。41 年前的《关于整理我国古籍的指示》吹响了我国改革开放时代古籍工作的号角,《意见》则扬起了新时代古籍工作新帆,新时代对传承和弘扬中华优秀传统文化提出了新的要求。
古籍是华夏民族悠久历史和灿烂文化的象征,是中华民族历史记忆、思想智慧和知识体系的重要载体,记载着中华民族优秀的传统思想观念文化,中国的软实力就植根于中华传统文化。新时代将古籍工作融入国家发展大局,注重国家重大战略实施中的古籍保护传承和转化利用,加快古籍资源转化利用,传播古籍承载的传统文化,让古籍散发新活力,成为新时代古籍工作的重要内涵。在《意见》的指导下深入挖掘古籍时代价值,围绕古籍蕴含的中华优秀文化及人文价值联合研究机构攻关,开展多学科、跨学科的综合性研究,利用新的数字技术系统整理蕴含中华优秀传统文化核心思想理念、中华传统美德、中华人文精神的文明观念等,提炼具有当代价值的文化精髓,挖掘阐释古籍中蕴含的中国文化基因及其当代作用和应用途径,加强通过数字化手段研究阐释和成果的宣传、普及与应用,深化中国文化基因研究阐释,支持古籍研究成果数字化展示与传播。
2 文本化、数据化是新时代古籍资源转化利用的基础
《意见》顺应数字化时代潮流,将古籍数字化工作放在特别突出的位置,加快我国古籍的数字化,已成为社会各界及古籍保护、整理和研究界的共同呼声。随着信息环境的不断发展,数字化成为新时代古籍传播载体的重要形态,也成为人们阅读和使用的主要方式,因此,《意见》明确提出有必要加快数字化建设进程,在传统数字化的基础上“开展古籍文本结构化、知识体系化”。从《四库全书》项目开始,学者对古籍文本化进行了有益的尝试,也取得了不少成果,但古籍的文字识别工作依然是古籍文本化的主要障碍,特别是版式复杂的手写体古籍文献的文字识别率还未得到明显的提高,以文本形式进行数字化的古籍数量少。近年来,新的信息技术开始应用于古籍文字识别中,借助人工智能、机器学习等新的信息技术提高了古籍汉字文本识别率,取得了比较好的效果,如北京书同文推出古籍手写汉字OCR 识别系统(点字成金)[2],非特定人规范手写汉字自动识别正确率95%以上。目前古籍的OCR 技术基本上是商业公司所开发,普通用户和研究者无法有效利用这些OCR 工具,普通用户和研究者难以快速地对古籍数据化,因此需要国家层面及公益社会力量进行投入研究OCR 工具,使得普通用户能够用得上、用得起这些OCR 工具。可喜的是目前不少社会力量开始了尝试,如龙泉寺的藏经办、阿里及字节跳动等探索利用人工智能技术古籍汉字OCR 识别系统,研发出基于深度学习的古籍识别引擎[3]。
《意见》也指出,“利用智能化的研究和实践,加速推动古籍整理利用转型升级”,新的数字技术已开始应用于古籍整理与利用中。离章析句是古籍文献处理最基本的一项任务,也是古籍数据化的重要基础,利用机器学习、人工智能等新型技术对古籍文本进行处理已成为新的解决途径,也取得了很好的效果。目前,我国已建立多个基于人工智能技术的古籍整理自动化和可视化平台[4],已尝试古文本的自动句读,同时还实现了对人名、地名、时代名、职官名、书名的自动识别,也达到较高的准确率[5],为古籍的快速数据化奠定了基础。新的数字技术在古籍修复整理领域的广泛应用,突破了传统人工整理的模式,充分利用新的数字技术加快古籍数字化整理、古籍文字识别、句读、实体识别和知识图谱的构建,加快数字化古籍资料的效率。利用人工智能技术辅助修复整理古籍,也让更多的研究者、爱好者以更高效、便利的方式获取古籍里蕴藏的丰富知识,适应新时代古籍建设的需求与发展。
3 知识化是新时代古籍资源转化利用的重要方式
中国古代知识用现代知识体系化是古籍知识层面的转化与利用的重要步骤,真正让躺在故纸堆里的古籍重新“活”起来,从而实现中国古典知识以及文化精神的知识化,适应新时代古籍知识化转型。
古籍内容的深度标引、知识发掘和文献信息关联是构建古籍知识服务体系的基础,与传统的古籍文献级整理不同,古籍内容的深度标引不但能反映“古籍文物属性与文献属性的关系”,而且是古籍知识发掘和文献信息关联的重要组成,通过清洗、转换及关联等一系列工作而构建完整、权威的古籍数据集,并对已有的古籍信息从多角度进行组织与重构,将零星的史料片段按一定规则重新组合、排列,对蕴含在古籍中的知识进行多元重组,将不同知识元之间建立关联,形成一个多维的古籍知识网络,最终实现古籍知识单元的细粒度化、知识组织的语义化、知识呈现的可视化,为中华优秀传统文化的核心思想理念、传统美德及文明观念知识的提取提供了条件。
典籍知识化是古籍资源转化利用的重要途径,早在2009 年,北京大学与国家图书馆开发了《中国历代典籍总目分析系统》[6],古籍文献目录知识服务系统最大限度地实现“辨章学术,考镜源流”。新信息技术给古籍资源转化利用带来了活力,广泛利用知识图谱、语义网、机器学习等人工智能技术在大量的文本信息中挖掘潜在的、有价值的知识。在古籍资源转化与利用中,利用关联数据技术可以将古籍文献中的人名、地名及时间等要素关联起来,实现古籍文献资源的整合,形成完整的知识网络,从而发现数据间的联系,实现知识的逻辑关联和基于语义的数据检索,挖掘隐性知识,笔者利用数字技术构建了《中国历代存世典籍知识图谱》[7],为古籍文献知识的转化与利用提供了新的理念与独特的创造性思维。
4 古籍资源平台化是新时代古籍资源有效利用及传播的重要途径
目前,古籍数字化的重复建设是一个比较大的问题,不但浪费了人力、财力,而且加工处理的数据良莠不济,共享性差,因此《意见》指出应“建立健全国家古籍数字化工作指导协调机制,统筹实施国家古籍数字化工程”,建设“国家古籍数字资源平台”,有利于永续性传承中华民族的文化基因,有利于保护古籍本身,也是促进古籍有效利用的重要方式与途径。统筹古籍基础设施构建不但避免重复的基础性建设工作,将零星的史料片段进行多元重组,使不同知识元之间建立关联,形成一个多维的知识网络,也能为用户带来更好的体验,帮助用户实现一站式检索及获取,而且为传统文化传承与人文研究奠定了基础,进而促进古籍传播及工具平台的开发,实现从“藏”到“用”的数字环境的转变。古籍基础设施建设是一个耗费巨大、耗时长的项目,需要人力及财力,更重要的是需要多单位、多部门、多学科的合作,可从国家整体规划层面出发,设立不同模块分别进行研究,着力构建古籍资源服务体系,解决古籍共享这个“老大难”问题。
数字时代,数字化媒介成为主要形式,以纸质媒介为物质基础的知识体系向以数字化智慧型媒介为认识论的知识体系的转变,每一种新媒介的产生都开创了人类感知和认识世界的新方式,带来了新的传播革命,改变了原有的传播内容及范式。新时代,数字化媒介也必将成为古籍所蕴含的中华优秀传统文化重要的传播渠道,以人工智能、VR 技术、虚拟现实等为代表的智能媒介是驱动古籍知识体系建设的关键性物质变量,这也是古籍“数字”含义的独特解读,古籍文本、图像、声音、影像等以数字形式被编码、存储和呈现,通过智能媒介对古籍所蕴含的时代精神进行阐释,从而达到古籍与人文精神及数字化衍生产品融合共生,朝着多渠道、多媒介、立体化的古籍大众化传播迈进,推动古籍的数字内容向虚拟现实内容移植[8],让古籍“活”起来。
我国古籍工作者应当积极响应国家对新时代古籍工作的指导思想,围绕古籍资源建设、价值挖掘、普及传播以及人才培养等方面开展创新研究,承担起古籍数字化发展中重难点问题的攻关任务,赋予新时代面貌,让古籍散发新活力。新时代,古籍保护、整理研究、编辑出版和数字化的古籍相关学科交叉融合,古籍学科与材料技术、信息技术、人工智能等领域学科融合,对古籍工作的人才队伍建设提出了更高的要求,如何形成多学科交叉的课程体系等,都是亟待解决的问题。
参考文献:
[1]中共中央下发《关于整理我国古籍的指示》[EB/OL].[2022-05-08].http://www.guji.cn/web/c_0000000300010004/d_8347.htm.
The Central Committee of the Communist Party of China issued the"Instructions on Sorting out China's Ancient Books"[EB/OL].[2022-05-08].http://www.guji.cn/web/c_0000000300010004/d_8347.htm.
[2]i-慧眼OCR[EB/OL].[2022-05-05].https://dzcj.unihan.com.cn.i-Huiyan OCR[EB/OL].[2022-05-05].https://dzcj.unihan.com.cn.
[3]科研实力最强寺庙:用AI 为古籍经书识别、断句、翻译[EB/OL].[2022-05-05].https://matpool.com/blog/6004ebe0505b8f0011af0899/.
Temple with the strongest scientific research strength:AI is used to identify,break sentences and translate ancient scriptures[EB/OL].[2022-05-05].https://matpool.com/blog/6004ebe0505b8f0011af0899/.
[4]苏祺,胡韧奋,诸雨辰,等.古籍数字化关键技术评述[J].数字人文研究,2021(3):83-88.
SU Q,HU R F,ZHU Y C,et al.Key technologies for digitization of ancient Chinese books[J].Digital humanities research,2021(3):83-88.
[5]韩业庭.当古籍修复遇上人工智能[N].光明日报,2022-04-11(09).
HAN Y T.When the restoration of ancient books meets artificial intelligence[N].Guangming daily,2022-04-11(09).
[6]“中国历代典籍总目分析系统”通过国家级技术鉴定[EB/OL].[2022-05-05].http://pkunews.pku.edu.cn/xwzh/2009-11/02/content_161068.htm.
The general catalogue analysis system of ancient Chinese books has passed the national technical appraisal[EB/OL].[2022-05-05].http://pkunews.pku.edu.cn/xwzh/2009-11/02/content_161068.htm.
[7]欧阳剑,梁珠芳,任树怀.大规模中国历代存世典籍知识图谱构建研究[J].图书情报工作,2021,65(05):126-135.
OUYANG J,LIANG Z F,REN S H.Research on the construction of knowledge graph of large-scale Chinese ancient books[J].Library and information service,2021,65(5):126-135.
[8]张宁,MIGUEL B N,李俊炀.“VR+文化”背景下的中华古籍阅读与传统文化传播新路径研究[J].图书馆建设,2019(6):128-134.
ZHANG N,MIGUEL B N,LI J Y.Study on new paths of Chinese ancient books reading and traditional culture spread in the context of "VR+culture"[J].Library development,2019(6):128-134.