基于智慧文旅案例的公共图书馆数字人文项目建设路径思考*
2024-04-05朱姝
朱 姝
(连云港市图书馆 江苏连云港 222005)
0 引言
智慧文旅比智慧旅游更重视文化内涵的挖掘,这与数字人文是计算机技术与人文研究相融合的特性相契合[1]。图书馆与数字人文是天然的“盟友”,而国内的数字人文应用探索案例多来自于高校图书馆、情报机构,以及上海图书馆等极少数公共图书馆,大多数图书馆的数字人文应用服务处于冷启动阶段。基于此,笔者通过调研分析数字人文技术在智慧文旅中的实践案例,梳理现有应用的起源、建设流程、智慧文旅特色应用功能,结合案例启示分析江苏地区公共图书馆开展相关建设的优势与困境,思考公共图书馆基于数字人文项目支持智慧文旅的发展路径。
1 案例调研与分析
在政府推动,互联网大厂助力,博物馆、图书馆、档案馆等公共文化机构的积极参与下,近些年出现了以各类应用程序为载体的智慧文旅融合案例。这些案例大致可分为以政府为主导的当地文化云平台,兼具城市文化服务和旅游推广功能;政企合作以“一部手机游云南”为代表的App或小程序;商业化运作程度较高的以“携程”“飞猪”“去哪儿”为代表的旅游类软件,侧重于“吃住行玩”等功能;互联网企业为主导,与文化机构联合开发的以“云游敦煌”为代表的应用,对景点文旅信息多维呈现。此外还有由上海图书馆单独开发的“从武康路出发”应用,对非景点的文化街区进行信息呈现。
1.1 对象的选择
本文以人文内容在智慧文旅中的揭示和应用为主题,上述分类中的前三者更侧重于智慧旅游研究主题,而“云游敦煌”和“从武康路出发”两个应用更多地集中于与之关联的文化信息,故选择这两者作为研究对象。通过对项目对比分析,本文梳理出项目的起源、建设流程、智慧文旅特色应用功能等内容,分析数字人文技术及成果如何支撑差异化智慧文旅产品,从而帮助用户获得对目的地的更多的情感认同,以期为公共图书馆相关项目建设提供启示。
1.2 起源
“数字敦煌”项目已经组织实施近30 年,2016 年数字敦煌资源库上线互联网,2017 年增加英文版,项目“数字敦煌”数字资产管理系统(DAMS),可对数字资产的成果进行再加工,形成敦煌石窟知识图谱等新的数字产品,为资源的深度研究和利用奠定基础。“云游敦煌”作为首个拥有丰富的敦煌石窟艺术欣赏体验的微信小程序,是“数字敦煌”项目新的智慧文旅应用产品[2]。此外,全球首个基于区块链的数字文化遗产开放共享平台——“数字敦煌·开放素材库”于2022 年底正式上线,为学者、文化爱好者以及艺术创意者打造一站式的敦煌文化共享平台。
武康路位于上海市徐汇区东北部,沿线排布着50 多处历史建筑和名人故居,2011 年获得文化部“中国历史文化名街”称号。武康路应用策划于2017—2018 年,2019年正式开发完成并发布[3]。该应用基于上海图书馆丰富的馆藏资源,结合移动视觉搜索和AR 等技术,对武康路的历史文化进行标识与导览,将图书馆的服务通过技术延伸到馆外的文旅空间和时间维度上[3]。上海图书馆自2014年开始探索图书馆数字人文项目建设方法与路径,它拥有大量的关联数据,在官网上设立数字人文专栏,包含:家谱知识服务平台、盛宣怀档案知识库、中文古籍联合目录及询证平台、上海文化总库、历史文献众包平台、数字人文开放数据平台等。武康路项目是上海文化总库的一个试点应用。
1.3 建设流程
虽然两者在资源主题内容、技术手段、输出方式上有所区别,但存在以下三点共通之处:一是拥有丰富的细颗粒度资源;二是具备可开展文本挖掘、关联数据、机器学习的数字人文基础设施;三是有便于用户零门槛使用的可视化展示方式。这一切需要经历夯实基础的资源数字化阶段、细化数据描述精度的数据化阶段、拓宽知识组织广度的知识化阶段、多层次展示知识的可视化阶段的建设流程。
1.3.1 数字化阶段
数字化阶段完成了资源从其他记录载体转换为以数字形式记录的载体。数字化既实现了资源的长久保存和有效保护,又便于对资源进行全面的研究利用。数字化的对象除了包括常规的文本,还涉及图像、声音、物品、空间等。“云游敦煌”是基于“数字敦煌”应用,而敦煌资源数字化自20 世纪80 年代开始启动,目前仍在继续,积累了石窟、壁画、彩塑、专家手稿、历史照片等原生或非原生数字资源,涉及文本、图像、音视频、二维数据与三维模型等数据类型,并以非结构化文本和视觉资源为主。“从武康路出发”是基于上海图书馆开放数据平台,尤其是文化总库资源,而上海文化总库整合了上海历史文化相关的各类资源构建的海派文化特色数字记忆。常用的数字化技术主要包括光学字符识别(OCR)、手写文本识别(HTR)、自动语音识别(ASR)及与专家学者参与的人工录入相结合的方式等。
1.3.2 数据化阶段
数字化的资源可以满足原文阅读和利用的需求,但是无法实现机器挖掘和计算,数据化是将数字形态文本转换为可由机器阅读分析的数据形态。通过对资源主题、人物、事件、地点等内部信息细化,并将其转化为RDF、XML等机器可理解的形式,便于对数据的统计、分析、计算。内部语义的描述需要领域专家参与设计,并根据项目需要不断调整。敦煌项目团队多年来不断探索,形成现在以文化遗产图像语义标注层次模型为基础,融合元数据描述、实体标注、信息组织、结构化叙事展示功能的通用性深度语义标注框架,完成壁画数字图像的细粒度化和语义化表示[4]。以“九色鹿”壁画为例,图像层对壁画保存地点、创作时间、创作者进行细颗粒描述标注,元素层对壁画形状、颜色进行细颗粒描述标注,标引层对鹿、九色鹿、人、溺人、调达、跪拜、感谢进行细颗粒描述标注,组织层以“溺人拜恩”情节为基础,组织展开树状层次结构[4]。对壁画内部对象的细粒度描述,是构建语义数据集和智慧数据的重要环节。
1.3.3 知识化阶段
数据化完成了独立资源的描述,但无法将相关数据关联起来,知识化则能在数据化的基础上,通过对知识的获取和知识之间的关联,构建完整的知识体系。知识本体是语义网环境下,知识组织的主要方法和技术之一,不仅能够形式化定义领域内的概念和概念间关系,还能描述关联的关系。敦煌项目团队在明确敦煌文化遗产知识的结构、概念、组成元素及其相互关系的基础上,参考元数据标准和国际通用本体模型,根据敦煌石窟文化遗产的特征进行扩展和自定义,构建了敦煌文化遗产领域本体模型,以此来深度描述和揭示敦煌石窟相关研究文献资源的语义特征、资源之间的语义关联。关联数据技术和知识图谱是实现知识间可被机器理解的关系的主要技术。知识化阶段以RDF 对数据进行编码,由于RDF 三元组采用唯一定位和标识符URI,因此关联数据技术可实现库内、库间不同来源、形式的数据获取,从而拓展知识关联的宽度。
1.3.4 可视化阶段
上述三个阶段实现了资源形态转换、数据细颗粒度描述与知识关联,在可视化阶段,知识呈现深度得到延伸,能直观地展示知识网络功能。利用主题图、GIS 等技术可以呈现人物时空运行轨迹、社会网络关系,利用 VR/AR 等技术手段再现历史场景与文化遗产原貌,为用户提供实时交互的感知与体验。在两个案例中,由于资源的细颗粒度描述和关联,在可视化阶段不仅实现了资源的多维度科普,还增加了诸多趣味互动功能。
1.4 智慧文旅特色应用功能
1.4.1 区域内智慧导览功能
作为智慧文旅产品,两者都具备导览功能。“云游敦煌”项目设置“进入石窟前,你需要了解哪些知识”“石窟文化特色体验”等游前导览服务,引导用户合理安排参与线下体验活动的时间及规划好游览线路,以便获得更好的文化体验。“从武康路出发”项目的“AR 探索”地图指南功能可实现选定一栋建筑即可激活路线导航功能,屏幕上的虚拟箭头叠加在路面实景之上,为游客提供步行导航[3]。
1.4.2 多维度科普功能
两者除了采用常规的时间、地点维度组织相关信息,还可根据自身资源特色,引导用户个性化探索感兴趣的信息。如:“云游敦煌”项目通过分维度探索的方式,开展交互模式下的历史科普。诸如:从“朝代”角度探索十余个朝代的石窟艺术、从“颜色”角度探索壁画的千年盛彩、从壁画、彩塑、石窟形制等“艺术形式”的角度探索等。“从武康路出发”项目同样也从武康路上的建筑简介、相关人物、历史事件、馆藏文献资料等多维度去对相关信息进行呈现。多维度的科普功能,便于直观呈现各类资源形式特点,为用户提供更加细致的内容揭示,有利于人文内容的进一步挖掘,增加了文旅体验的深度。
1.4.3 趣味互动功能
两者都比较注重用户的趣味互动体验感,使用口语化的网络语言拉近与用户的距离。在“数字敦煌”中,互动模块较多,如:进入小程序即可生成带有用户昵称的富含敦煌特色元素的个性化日历。在“敦煌动画剧”中可选择一个或者多个角色为其配音;在“壁画填色”中可选择颜色为菩萨手姿、少女飞天、九色鹿本生等造型线描着色;在“敦煌诗巾”中选择石窟的藻井、壁画装饰纹样元素将它们组合,最终成为DIY 的丝巾图样,并且一键下单,完成属于自己的定制。“从武康路出发”中用“AR 扫门牌”功能,获取历史建筑的简介、人物、事件、资料,不仅有对建筑风格和历史人物的介绍,更纵向链接了老房子的前世今生,并列出相关书目、图片和存档的音频资料,点击推荐书目,还能进入上海图书馆馆藏检索系统。特色互动功能增加了文旅体验的趣味性。
1.4.4 共同文化治理功能
在两个案例中,不仅有一手景观的沉浸式体验、专家的亲自解读,还有新媒体语境下的生动改编,集合社会、学界和业界的力量加入这场历史传统的保护中,这一切得益于数字人文的开放性与众包技术,营造了共同文化治理保护的氛围。在与敦煌的合作中,腾讯旗下的王者荣耀以隋唐时期的飞天形象为原型,推出“飞天”皮肤,力求还原敦煌壁画最本真的韵味,传递瑰丽的敦煌之美,不少玩家主动捐款,用于敦煌莫高窟第55 窟的数字化建设。2022 年底“数字敦煌·开放素材库”正式上线,为学者、文化爱好者以及艺术创意者打造一站式的敦煌文化共享平台。
2 公共图书馆开展数字人文项目建设的优势与困境
通过案例分析发现,数字人文技术实现了人文内容的数字化、编码结构化、表示语义化、组织网络化、关联智能化,改变了传统的线性叙事方式,更多地依托非线性叙事,既可编织宏观的文化或价值观网络,又可切入微观的叙事自我,在交互式可视化的数字叙事方式方面表现突出[5]。公共图书馆应该借数字人文之力,行主动创新之路,为智慧文旅建设提供高质量服务。
2.1 公共图书馆开展数字人文项目建设的优势
2.1.1 国家政策、专项资金支持
目前图书馆处于智慧化转型阶段,“十四五”智慧图书馆建设的主要任务是在全国智慧图书馆体系建设“1+3+N”的总体架构下构建出全网知识内容的集成仓储,其中文献精细化标引,形成知识内容的关联体系是知识资源库的重要组成部分。这与图书馆的数字人文项目建设方向是一致的。江苏省文旅厅根据文化和旅游部公共服务司、财务司《关于做好2021 年全国智慧图书馆体系建设项目、公共文化云建设项目实施工作的通知》 要求,联合全省公共图书馆共同推进江苏智慧图书馆体系建设,并给予专项资金支持。
2.1.2 数字图书馆建设积累大量数字化资源
公共图书馆先后在国家三大文化惠民工程(全国文化信息资源共享工程、公共电子阅览室建设计划、数字图书馆推广工程)的引领与培育下,积累了大量自建数据库,留下了大量的、遵循一定元数据标准规范的元数据记录,而这些数据多与地方的人文地理、风土人情、历史风貌有关,与旅游的关系密切,是开发数字人文产品的良好基础。
2.1.3 前期研究理论成果和应用案例不断丰富
经过 20 余年的发展,数字人文不断经历着他者与自我批判,当下仍须以筑牢自身合法性根基为务,从内在学理与外部体制两个层面着力攻坚克难[6]。出版机构、商业机构、社会机构、个人等非体制内主体深度参与项目建设,与高校、研究机构、图博档公共文化机构形成合力,应用案例不断丰富,集中于古籍文博、城市记忆、当代文化和现实关切问题等方面。
2.1.4 数字人文项目应用开始进入公众视野
数字人文技术起源于人文计算,从其诞生发展至今,更多的是辅助人文学者开展相关学科的研究,与公众生活存在一定的距离。随着全民文化素养的提高,公民文化消费需求有所提升,此外,有少量基于优秀数字人文项目的应用,诸如:北京记忆、“数字敦煌”的“云游敦煌”、上海文化资源总库的“从武康路出发”等数字人文项目逐步走入公众的视野,为数字人文带来了一定的宣传效果。
2.2 公共图书馆开展数字人文项目建设面临的困境
2.2.1 资源困境
图书馆早期数字化资源不是面向特定主题的,特色资源数据库建设存在着同一主题资源以不同形式分散在不同机构、缺乏细颗粒度标引等问题,无法直接开展数据化和数据分析等工作,需要进行数据化、知识化再次加工,制约着公共图书馆在数字人文建设和利用中发挥作用。
2.2.2 工具和技术困境
公共图书馆处于智慧化转型阶段,诸如自然语言处理、深度学习、可视化、虚拟现实等技术在图书馆尚未普及应用,而这些技术又是数字人文研究与应用所必须具备的。当下虽有许多人文项目实践成果,但无法快速复制推广,且通用型数字人文基础设施建设还停留在理论阶段[7],让大多数图书馆无法快速跨越数字人文项目建设技术鸿沟。
2.2.3 人才困境
我国数字人文起步较晚,公共图书馆缺乏相关人才,整体上对相关技术的学习和了解程度有限,在数字人文项目建设上主导权不强,在项目服务改进上需要被动依靠第三方技术支持,这势必会影响平台建设成果的价值发挥。且介于用户与第三方之间的图书馆,存在着“去机构化”风险。
2.2.4 可持续运营管理困境
通过文献梳理发现,一些数字人文项目是图书馆与课题组合作研究的产物,缺乏明确而长久的发展方向,且有效资金支持不稳定,以至于项目验收结束,其资源内容的更新也截止了。能否可持续运营管理,也是项目不得不面对的困境。
2.2.5 应用推广困境
数字人文类应用与传统数字资源有一些不同,它对社会公众而言是一个新兴事物,并且有其使用门槛。上海图书馆的数字人文项目建设与服务走在全国图书馆的前列。遗憾的是“从武康路出发”的分享空间信息更新停留在2018 年6 月23 日,网站没有设置访问量统计。戴梦菲等在《AR 技术在数字人文应用上的运用策略——以“从武康路出发”应用为例》[3]中提到,该应用在发布后期加入用户数统计功能,但用户人数有限。笔者在2023 年5 月尝试在应用市场及微信小程序中搜寻“从武康路出发”的相关应用,均未搜索到。而“云游敦煌”的项目,自2020 年2月20 日上线,不到10 日,其小程序总访问量已经超过500万,独立访问用户累计超过100 万人[8]。两者存在很大的反差,上海图书馆开发的武康路项目曝光度不足是不可忽视的影响因素。
3 公共图书馆开展数字人文项目建设支撑智慧文旅发展路径思考
3.1 夯实基础,构建特色主题智慧数据资源
富有地域特色的智慧数据资源是智慧文旅应用的基础。公共图书馆应从确定的主题出发,广泛收集相关数据资源,且数据资源不再局限于数字化的纸质文本,其他不同类型、不同材质、不同形式的文化遗产皆可以数字化、数据化。图书馆需要贯彻我国《“十四五”公共文化服务体系建设规划》中提到的要探索通过组建公共文化机构联盟等方式,在资源、管理、服务、活动等多方面实现共建共享[9],秉承大文化理念,协同博物馆、档案馆、美术馆等文化机构以及其他团体、民间组织等形成联盟,将与建设主题有关的藏品数字化信息依据相关标注进行语义化转换,形成智慧化数据资源,实现相关人文内容的融合共建。此外,在构建智慧化数据资源的过程中,需要注重资源揭示的深度,例如江苏地区某市级馆,在资源数据化的过程中仅仅对文献完成篇章段落结构的标引,并未做实体识别,相较“数字敦煌”中通过敦煌壁画层次性数字图像语义描述框架、叙事型图像语义标注模型等多元框架模型对壁画分层次多元深度标引,智慧化数据构建的深度不足。因而江苏地区公共图书馆应从广度和深度两个维度,构建特色主题智慧数据资源,为深度开发、管理人文内容,开展智慧文旅服务奠定基础。
3.2 整合相关标准,建设数字人文基础设施
数字人文技术可完成智慧数据资源整合、生成、发展的过程,因而需要整合数据库建设、质量控制、数据关联发布、数据治理等方面的相关标准与规范,并将其应用于数字人文项目建设过程中[10]。在《江苏省智慧图书馆体系建设方案》中,区域内各市级公共图书馆的基础条件各异,需要完成的重点建设内容有区别,但是各公共图书馆都需按照“盘活存量,带动增量”的发展思路,参与到江苏公共文化资源库群建设中,因而各馆的此项工作有极大的相似性。这就需要建立区域内数字人文管理中心,主导通用型数字人文基础设施的研发、建设、推广。通用型的智能化工具和实验平台应用可避免区域内各馆重复性工作,帮助公共图书馆利用对应工具包规范开展数据采集、存储、分析、可视化、数据发布及虚拟重构等基础性工作。此外,区域内数字人文中心还应关注GPT 类智能AI 技术,利用其强大的信息加工、整合观点视角和生成能力,从而为数字人文技术应用提供丰富的语料,支持数字人文项目跨越式发展。总之,标准化的通用数字人文基础设施将降低公共图书馆开展数字人文项目建设的门槛,提高建设效率,从而尽早为智慧文旅发展贡献图书馆力量。
3.3 协同多元主体,促进智慧文旅应用可持续发展
提供数字人文服务是数字人文项目建设的目标。基于用户深层次、多元化需求,文化机构与科研机构、科技企业多方合作建设数字人文项目。
规划开发多层次数字人文应用产品功能,满足不同用户需求。首先可以建立数字人文研究平台。上海图书馆于2016 年率先推出基于关联开放数据的数字人文服务,将馆藏家谱资源和接口开放出来,提供多维分面浏览,交互数据展示,读者可以利用家谱资源,同时参与资源开发利用[11]。其次是提供数字人文研究成果体验场景。此类应用以向公众传播特定领域知识为目的,信息呈现多元化且交互性强,关注受众感受。上海图书馆的“君从何处来”项目,对约7 万种家谱进行挖掘,并设计了三种展演模式:各朝代的迁徙动态图、迁徙大事件演示和双屏互动与数据筛选[6]。再次是服务文化数字化战略。数字人文在中国文化遗产和城市文化记忆两大主题上呈现出许多优秀的论文和项目成果,这与《关于推进实施国家文化数字化战略的意见》要求相一致。数字人文研究平台的建立可为智慧文旅应用开发梳理、挖掘多维度信息,便于用户进行游前规划及游后总结。场景体验功能主要可用于增强智慧文旅沉浸式体验,服务文化数字战略方面的功能可用于在智慧文旅应用中与全民共享中华文化全景式研究成果,开展公众普及教育。
以众包或者公众互动体验的形式吸引公众参与数字人文项目迭代式开发与推广,以此实现项目迭代式可持续发展。案例中“云游敦煌”应用是由敦煌研究院、人民日报新媒体、腾讯联合推出的微信小程序,自2020 年2 月20 日上线,不断更新应用功能,截至2023 年2 月,累计2亿人次参与线上互动[12],此外,该项目还获得了2022 年度中华文物全媒体传播精品(新媒体)推介项目。遗憾的是在两个案例中,均未看到项目应用反馈渠道,以致无法凝聚群体智慧。其实吸纳并处理有益于项目可持续发展的意见和建议,是优化项目功能,促进项目可持续发展的重要动力。
3.4 转变人才培养观念,以合作促培养
公共图书馆从业人员专业方向比较分散,日常其主要人力致力于开展文献流通、信息服务、各类阅读推广活动,几乎没有专业的数字人文馆员。鉴于当下无法独立建设高水平的数字人文馆员队伍,兼职和外聘是当前解决人才队伍问题的可行方式。可通过项目实践跟班学习、聘用兼职专家,以合作的方式促进图书馆从业人员数字人文素养和技能的提升。